《Scientific Reports》:EEG-based neurodegenerative disease diagnosis: comparative analysis of conventional methods and deep learning models
編輯推薦:
隨著癡呆發病率在全球范圍內因生活方式等因素急劇上升,及時診斷變得至關重要。研究人員開展基于腦電圖(EEG)信號的癡呆診斷研究,對比傳統機器學習與深度學習模型。結果顯示深度學習模型(1D、2D CNNs)表現更優,但 Dataset 3 存在挑戰。該研究為癡呆早期診斷提供新方向。
在當今社會,生活方式的巨大改變、無處不在的壓力以及復雜的環境因素,如同隱藏在暗處的 “殺手”,悄然推動著全球癡呆發病率急劇攀升。據統計,全球已有超過 5500 萬人深受癡呆的困擾,每年新增病例近 1000 萬,預計到 2030 年這一數字將達到 7800 萬,2050 年更是可能飆升至 13900 萬 。其中,阿爾茨海默。ˋD)最為常見,占所有癡呆病例的 60 - 70%。癡呆不僅嚴重影響患者的認知能力、日常生活技能,還成為全球老年人致殘和依賴他人生活的重要原因之一,因此,及時且準確地診斷癡呆迫在眉睫。
腦電圖(EEG)作為一種非侵入性的檢測手段,能夠記錄大腦的電活動,在癡呆早期診斷方面展現出巨大潛力。為了探索如何更好地利用 EEG 信號進行癡呆診斷,來自印度 M. S. Ramaiah 應用科學大學、阿聯酋海灣醫學大學、印度馬尼帕爾高等教育學院、韓國嶺南大學的研究人員展開了深入研究,相關成果發表在《Scientific Reports》上。
研究人員采用了多種關鍵技術方法來開展此項研究。在數據處理方面,針對不同數據集,先進行預處理,如運用帶通濾波去除低頻漂移和高頻噪聲,通過獨立成分分析(ICA)去除眼動、肌肉活動等偽跡;對于采樣頻率不同的數據,使用線性插值法進行上采樣處理。在模型構建方面,分別構建傳統機器學習模型和深度學習模型。傳統模型從功率譜密度(PSD)提取特征,利用隨機森林(RF)分類器進行分類;深度學習模型則包括 1D 卷積神經網絡(1D CNN)直接處理預處理后的 EEG 信號,以及 2D 卷積神經網絡(2D CNN)對分解后的 EEG 信號生成的堆疊頻譜圖進行分類 。研究使用了三個不同的基準數據集,這些數據集涵蓋了認知正常(CN)、額顳葉癡呆(FTD)、輕度認知障礙(MCI)和阿爾茨海默。ˋD)等不同類別。
研究結果
- Case study A:基于傳統機器學習模型的診斷
通過 Welch 方法估計 PSD,從特定頻率帶(Delta:0.5 - 4Hz、Theta:4 - 8Hz、Alpha:8 - 13Hz、Beta:13 - 25Hz、Gamma:25 - 45Hz)提取統計特征(均值、中位數、標準差)。不同數據集在各頻率帶表現出不同特征,如 Dataset A 中,AD、FTD 和 CN 在低頻范圍(0 - 50Hz)功率較高;Dataset B 中,從正常到 MCI 再到 AD,PSD 呈現出認知能力下降的明顯趨勢;Dataset C 中,MCI 患者在低頻段功率更高且更不穩定 。訓練后的 RF 模型在不同數據集上表現各異,Dataset A 準確率為 83.88 - 84.77%,Dataset B 準確率為 90.15%,Dataset C 準確率為 77.3 - 77.6% 。SHAP 分析表明,不同數據集的關鍵特征不同,Dataset A 中 Delta 均值和 Theta 均值最為重要,Dataset B 中 Alpha 均值和 Alpha 中位數較為突出 。
- Case study B:基于 1D CNN 模型的診斷
將預處理后的 19 通道 EEG 數據直接輸入針對每個數據集定制的 1D CNN 模型。該模型在 Dataset A 上準確率達到 90.00%,Dataset B 上高達 98.74%,但在 Dataset C 上僅為 78.03% 。Dataset C 準確率較低,可能是因為信號復雜且數據預處理不夠完善,反映出模型在該數據集上存在過擬合和泛化能力差的問題 。
- Case study C:基于 2D CNN 模型的診斷
EEG 信號經 Morlet 小波變換生成頻譜圖,2D CNN 模型對其進行處理。不同數據集的頻譜圖在神經同步性、信號復雜性、功率分布、EEG 節律穩定性等方面存在差異,如 Dataset A 中 AD 患者頻譜同步性差,Dataset B 中 AD 患者信號復雜性低且功率分布偏向低頻帶 。2D CNN 模型在不同數據集上的表現也不同,Dataset A 準確率約為 91.10 - 91.92%,Dataset B 約為 86.25 - 87.61%,Dataset C 約為 66.00 - 66.20% 。通過混淆矩陣分析發現,不同類別之間存在特征重疊,導致部分樣本分類錯誤 。
- 統計分析結果:通過 ANOVA 和 Wilcoxon Signed - Rank Test 等統計檢驗發現,數據集之間存在顯著差異,但模型性能指標在某些檢驗中無顯著差異 。Tuckey’s HSD 檢驗表明不同模型之間存在顯著差異,說明數據集差異對模型性能有重要影響 。
研究結論與討論
研究表明,1D 和 2D CNN 模型在癡呆診斷方面優于傳統機器學習模型。1D CNN 能夠捕捉 EEG 信號的時間特征,發現與神經退行性疾病相關的早期標記;2D CNN 可以從頻譜圖中提取復雜的時空模式,輔助診斷癡呆 。然而,研究也存在一些局限性,如計算資源有限導致交叉驗證次數和訓練輪數較少,可能影響模型性能;數據集不平衡、噪聲處理不夠完善以及數據集的異質性等問題,都可能對模型的泛化能力產生影響 。未來研究可通過先進的偽跡去除方法、優化特征提取技術、改進模型泛化能力以及結合多模態數據等方式進一步提升癡呆診斷的準確性和可靠性 。該研究為基于 EEG 信號的癡呆早期診斷提供了重要參考,為后續研究指明了方向,有望推動癡呆診斷技術的發展,幫助更多患者實現早期診斷和干預。