基于雙向交叉注意力的Transformer模型在多模態年齡相關性黃斑變性分類中的應用 - 生物通

今日動態返回首頁

登錄會員注冊生物通快訊免費訂閱

生物通首頁 > 今日動態 > 正文

基于雙向交叉注意力的Transformer模型在多模態年齡相關性黃斑變性分類中的應用

《Biomedical Signal Processing and Control》：A Transformer utilizing bidirectional cross-attention for multi-modal classification of Age-Related Macular Degeneration

【字體：大中小】 時間：2025年05月06日 來源：Biomedical Signal Processing and Control 4.9

編輯推薦：

　　為解決年齡相關性黃斑變性（AMD）多模態診斷中局部感受野受限和跨模態特征融合不足的問題，研究人員提出了一種結合CNN與Transformer的雙向交叉注意力模型。該模型通過CNN提取局部特征，利用Transformer的全局建模能力實現CFP與OCT圖像的高效融合，最終在公開數據集上取得F1-score 0.897和準確率84.3%的優異表現，為AMD精準分型提供了新范式。

　　

研究背景
年齡相關性黃斑變性（AMD）是全球50歲以上人群不可逆盲的首要病因，其晚期分為干性AMD（萎縮型）和濕性AMD（新生血管型），其中濕性AMD又包含需差異化治療的息肉樣脈絡膜血管病變（PCV）。臨床診斷依賴眼底彩照（CFP）和光學相干斷層掃描（OCT）的雙模態影像，但現有基于卷積神經網絡（CNN）的多模態方法因局部感受野限制，難以捕捉跨模態長程依賴。此外，配對多模態數據稀缺也制約模型性能。

研究機構與方法
湖南大學等機構的研究團隊在《Biomedical Signal Processing and Control》發表研究，提出集成CNN與Transformer的雙向交叉注意力模型。關鍵技術包括：1）CNN特征提取層獲取局部表征；2）雙向交叉注意力模塊實現CFP與OCT的跨模態交互；3）基于類激活圖（CAM）引導的GAN合成數據增強策略。實驗采用公開數據集（1094張CFP+1289張OCT），構建四分類任務（正常/干性AMD/PCV/濕性AMD）。

研究結果

模型架構設計：通過CNN-Transformer混合架構，在保留局部特征的同時利用自注意力與交叉注意力機制，顯著提升跨模態特征融合效率。
數據增強效果：CAM引導的合成圖像與松散配對策略使訓練數據多樣性提升，緩解了配對數據不足的瓶頸。
性能對比：測試集F1-score達0.897（較基線提升4.3%），準確率84.3%，尤其在PCV亞型識別中表現突出。

結論與意義
該研究首次將雙向交叉注意力機制引入AMD多模態診斷，通過全局建模能力突破傳統CNN的局部感知局限。提出的數據增強策略為醫學影像小樣本學習提供了新思路。臨床層面，模型對PCV的精準識別有助于指導抗VEGF藥物與光動力療法的差異化應用，推動AMD診療向個體化邁進。研究同時為其他多模態醫學圖像分析任務提供了可遷移的技術框架。

相關新聞

生物通微信公眾號

微信

新浪微博

搜索
國際
國內
人物
產業
熱點
科普

熱搜：年齡相關性黃斑變性（AMD）|多模態融合|雙向交叉注意力|Transformer|卷積神經網絡（CNN）|光學相干斷層掃描（OCT）|眼底彩照（CFP）|干性AMD|濕性AMD|息肉樣脈絡膜血管病變（PCV）|數據增強

急聘職位
高薪職位

知名企業招聘

熱點排行

新聞專題

今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

版權所有生物通

Copyright© eBiotrade.com, All Rights Reserved

聯系信箱：

粵ICP備09063491號

亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线