《Computational and Structural Biotechnology Reports》:Real-time deep learning for multi-label retinal disease diagnosis with embedded system
編輯推薦:
為解決醫療資源有限地區眼部疾病診斷難題,研究人員利用樹莓派 4 開發視網膜疾病分類平臺,采用輕量級卷積神經網絡(CNN)結合雙正交小波變換。結果顯示模型準確率達 0.9806,該研究為臨床診斷提供新工具,意義重大。
在當今醫療領域,眼部疾病尤其是視網膜疾病的早期診斷至關重要。視網膜作為視覺信息傳遞至大腦的關鍵部位,許多可能致盲的疾病,像青光眼、白內障和糖尿病性視網膜病變(DR)等,都能通過眼底攝影被檢測出來。常規的視網膜眼底圖像檢查,能夠幫助醫生盡早發現這些疾病,進而及時進行干預治療,為患者的視力健康提供保障。
然而,現實情況卻不容樂觀。一方面,在全球范圍內,特別是在發展中國家以及農村和城郊地區,醫療資源極度匱乏。據世界衛生組織估計,到 2030 年,全球可能有超過 5 億人受糖尿病影響,而糖尿病是引發多種眼部疾病的重要風險因素。但這些地區的人們卻很難獲得足夠的醫療資源來滿足眼部護理需求,能夠接受適當眼部保健的比例不足 60%,農村地區更是低得可憐。另一方面,傳統的視網膜成像設備價格昂貴、體積龐大,操作復雜,這不僅限制了其在資源有限地區的廣泛應用,也使得大規模的眼部疾病篩查難以開展。即便近年來基于智能手機的視網膜成像系統有所發展,在一定程度上提高了設備的可及性,但這些系統大多缺乏先進的自動分析技術,難以確保診斷的準確性。
為了解決這些棘手的問題,研究人員開展了一項意義非凡的研究。他們利用樹莓派 4(Raspberry Pi 4)開發了一個用于多種視網膜疾病分類的平臺。該研究成果發表在《Computational and Structural Biotechnology Reports》上,為視網膜疾病的診斷開辟了新的道路。
在這項研究中,研究人員主要運用了以下關鍵技術方法:
- 輕量級卷積神經網絡(CNN)架構:設計了一個包含六個卷積層和兩個全連接層的 CNN 架構,用于特征提取和疾病分類。卷積層通過卷積操作提取圖像的關鍵特征,全連接層則基于這些特征進行疾病類別的判斷 。
- 雙正交小波變換:對源視網膜圖像進行灰度轉換后,利用雙正交小波變換進行特征提取。這種變換能夠將圖像分解為不同頻率成分,同時保留重要信息,為后續的分類提供豐富的特征集。
- 數據處理與訓練:從公共數據庫 ODIR 和 RFMiD 收集了 4303 張視網膜圖像,涵蓋健康、糖尿病性視網膜病變、青光眼和其他罕見疾病四類。將這些數據劃分為訓練集、驗證集和測試集,用于模型的訓練、超參數調整和性能評估。
- 模型優化與部署:對模型的超參數進行優化,并運用正則化技術提高模型性能。訓練好的模型被轉換為與樹莓派 4 兼容的 TensorFlow Lite 格式,以適應資源受限的設備環境。
研究人員圍繞多個方面展開研究,并取得了一系列令人矚目的成果:
- 模型性能評估指標:運用多種統計參數對模型進行評估,包括準確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1 分數和受試者工作特征曲線下面積(AUC)等。這些指標從不同角度反映了模型的性能,為全面評估模型提供了依據。
- 結果分析:通過對模型預測結果的分析,發現模型在不同疾病類別上都表現出了較高的準確率。在健康、青光眼、糖尿病性視網膜病變和其他疾病這四個類別中,模型分別正確預測了 316、305、322 和 323 個樣本。不過,健康和青光眼類別之間存在少量誤判情況,但整體上對模型性能影響較小。此外,模型對糖尿病性視網膜病變和其他疾病類別的預測表現尤為出色,精確率和召回率均達到 1.0,AUC 值也為 1.0,表明模型能夠準確區分這些疾病類別。
- 對比分析:將該模型與其他現有方法進行對比,結果顯示,雖然部分模型在某些指標上表現更優,但考慮到實際應用場景,該研究的模型在保證較高準確率(0.9806)的同時,更適合在嵌入式系統上運行,且執行時間僅為 0.53 秒,具有明顯的優勢。
在研究結論和討論部分,該研究成果展現出了重要意義。研究人員開發的基于樹莓派 4 的實時診斷系統,能夠自動識別四種不同類別的視網膜疾病。其分類算法基于輕量級 CNN 架構,運行快速高效,計算資源消耗低。與文獻中報道的幾種最先進的方法相比,該系統的整體性能更為優異。這一成果為眼科臨床診斷提供了強有力的支持,特別是在資源有限的城郊或農村地區,該系統可借助便攜式安卓手機進行控制和顯示,無需依賴外部電腦,就能自主完成疾病分類,有望成為眼科服務的理想輔助工具。不過,研究也存在一定的局限性,例如未深入分析不同圖像采集設備對模型性能的影響,且僅使用了傳統設備采集的圖像數據集。未來的研究可以朝著優化智能手機采集圖像的數據集、評估圖像質量對診斷準確性的影響等方向展開。