基于CNN與Transformer融合模型的阿爾茨海默病早期進展階段智能檢測

《Scientific Reports》:Early detection of Alzheimer’s disease progression stages using hybrid of CNN and transformer encoder models

【字體: 時間:2025年05月15日 來源:Scientific Reports 3.8

編輯推薦:

  本研究針對阿爾茨海默病(AD)人工診斷誤差率高的問題,提出了一種結合ResNet101、GoogLeNet與Vision Transformer(ViT)的混合模型。通過自適應中值濾波(AMF)和拉普拉斯濾波增強MRI圖像特征,利用CNN提取局部深層特征,ViT捕捉全局關聯性,最終實現AD四階段分類準確率達98.7%,AUC達95.05%。該研究為AD早期精準診斷提供了創新性AI解決方案。

  

阿爾茨海默病(AD)作為進行性神經退行性疾病,全球患者數量預計2050年將翻倍。目前臨床診斷依賴MRI、PET等影像技術,但存在主觀性強、早期識別率低等問題。傳統CNN模型雖能提取局部特征,卻難以捕捉長程依賴關系;而純Transformer模型計算成本高且空間分辨率不足。如何整合兩種技術的優勢,成為提升AD診斷精度的關鍵挑戰。

沙特阿拉伯國王大學Hassan Almalki團隊在《Scientific Reports》發表研究,提出ResNet101-ViT和GoogLeNet-ViT混合架構。研究采用OASIS數據集的86,437張MRI圖像,通過AMF去噪和拉普拉斯濾波增強邊緣特征,改進CNN結構降低計算量,優化ViT的編碼器塊和注意力頭配置。關鍵技術創新包括:1) 雙模態圖像預處理;2) CNN特征圖分塊嵌入ViT;3) 正弦位置編碼保留空間關系;4) 六層Transformer編碼器與多頭注意力機制。

增強OASIS數據集
采用7×7自適應中值濾波動態去噪,結合拉普拉斯二階微分算子強化軟組織邊界,顯著提升海馬體萎縮等細微病理特征的可見性。

數據擴增策略
對輕度/中度癡呆類分別實施3倍和25倍旋轉翻轉擴增,平衡四類樣本量(非癡呆類9600張,極輕度類8784張),有效緩解類別偏差。

改進ResNet101架構
縮減卷積塊至5層(Conv5_x保留512×2048通道),全局平均池化輸出2048維特征向量,參數量優化至648萬,較原模型降低85.4%。

ViT模型優化
將2048維特征拆分為32個64維子圖,通過線性投影生成token。采用6編碼器塊(原12塊)配16注意力頭,注意力得分計算引入√dk縮放因子穩定訓練,MLP層擴展至256維中間層。

性能驗證
五折交叉驗證顯示,ResNet101-ViT在測試集(20%數據)達到:

  • 極輕度癡呆分類靈敏度99.2%
  • 特異性99.68%(健康人群識別)
  • Cohen's Kappa系數0.97
    顯著優于單一CNN或ViT模型(p<0.01)。

討論與意義
該研究首次實現CNN深度特征與ViT全局建模的有機融合:1) ResNet101殘差連接有效緩解梯度消失,保障了海馬體等微小結構的特征提取質量;2) ViT的multi-head attention機制成功建模腦區功能連接異常,對早期β-淀粉樣蛋白沉積的敏感度提升37.6%;3) 計算效率優化使推理速度提升2.3倍。相比現有技術(如Khan的FME-Residual-HSCMT模型94.52%準確率),本方法將AD進展階段識別誤差率降低至1.3%,為臨床前干預提供關鍵時間窗。未來可擴展至帕金森病等多模態神經影像分析領域。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线