基于雙向交叉注意力的Transformer模型在多模態年齡相關性黃斑變性分類中的應用

《Biomedical Signal Processing and Control》:A Transformer utilizing bidirectional cross-attention for multi-modal classification of Age-Related Macular Degeneration

【字體: 時間:2025年05月06日 來源:Biomedical Signal Processing and Control 4.9

編輯推薦:

  為解決年齡相關性黃斑變性(AMD)多模態診斷中局部感受野受限和跨模態特征融合不足的問題,研究人員提出了一種結合CNN與Transformer的雙向交叉注意力模型。該模型通過CNN提取局部特征,利用Transformer的全局建模能力實現CFP與OCT圖像的高效融合,最終在公開數據集上取得F1-score 0.897和準確率84.3%的優異表現,為AMD精準分型提供了新范式。

  

研究背景
年齡相關性黃斑變性(AMD)是全球50歲以上人群不可逆盲的首要病因,其晚期分為干性AMD(萎縮型)和濕性AMD(新生血管型),其中濕性AMD又包含需差異化治療的息肉樣脈絡膜血管病變(PCV)。臨床診斷依賴眼底彩照(CFP)和光學相干斷層掃描(OCT)的雙模態影像,但現有基于卷積神經網絡(CNN)的多模態方法因局部感受野限制,難以捕捉跨模態長程依賴。此外,配對多模態數據稀缺也制約模型性能。

研究機構與方法
湖南大學等機構的研究團隊在《Biomedical Signal Processing and Control》發表研究,提出集成CNN與Transformer的雙向交叉注意力模型。關鍵技術包括:1)CNN特征提取層獲取局部表征;2)雙向交叉注意力模塊實現CFP與OCT的跨模態交互;3)基于類激活圖(CAM)引導的GAN合成數據增強策略。實驗采用公開數據集(1094張CFP+1289張OCT),構建四分類任務(正常/干性AMD/PCV/濕性AMD)。

研究結果

  1. 模型架構設計:通過CNN-Transformer混合架構,在保留局部特征的同時利用自注意力與交叉注意力機制,顯著提升跨模態特征融合效率。
  2. 數據增強效果:CAM引導的合成圖像與松散配對策略使訓練數據多樣性提升,緩解了配對數據不足的瓶頸。
  3. 性能對比:測試集F1-score達0.897(較基線提升4.3%),準確率84.3%,尤其在PCV亞型識別中表現突出。

結論與意義
該研究首次將雙向交叉注意力機制引入AMD多模態診斷,通過全局建模能力突破傳統CNN的局部感知局限。提出的數據增強策略為醫學影像小樣本學習提供了新思路。臨床層面,模型對PCV的精準識別有助于指導抗VEGF藥物與光動力療法的差異化應用,推動AMD診療向個體化邁進。研究同時為其他多模態醫學圖像分析任務提供了可遷移的技術框架。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线