-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于雙向交叉注意力的Transformer模型在多模態年齡相關性黃斑變性分類中的應用
《Biomedical Signal Processing and Control》:A Transformer utilizing bidirectional cross-attention for multi-modal classification of Age-Related Macular Degeneration
【字體: 大 中 小 】 時間:2025年05月06日 來源:Biomedical Signal Processing and Control 4.9
編輯推薦:
為解決年齡相關性黃斑變性(AMD)多模態診斷中局部感受野受限和跨模態特征融合不足的問題,研究人員提出了一種結合CNN與Transformer的雙向交叉注意力模型。該模型通過CNN提取局部特征,利用Transformer的全局建模能力實現CFP與OCT圖像的高效融合,最終在公開數據集上取得F1-score 0.897和準確率84.3%的優異表現,為AMD精準分型提供了新范式。
研究背景
年齡相關性黃斑變性(AMD)是全球50歲以上人群不可逆盲的首要病因,其晚期分為干性AMD(萎縮型)和濕性AMD(新生血管型),其中濕性AMD又包含需差異化治療的息肉樣脈絡膜血管病變(PCV)。臨床診斷依賴眼底彩照(CFP)和光學相干斷層掃描(OCT)的雙模態影像,但現有基于卷積神經網絡(CNN)的多模態方法因局部感受野限制,難以捕捉跨模態長程依賴。此外,配對多模態數據稀缺也制約模型性能。
研究機構與方法
湖南大學等機構的研究團隊在《Biomedical Signal Processing and Control》發表研究,提出集成CNN與Transformer的雙向交叉注意力模型。關鍵技術包括:1)CNN特征提取層獲取局部表征;2)雙向交叉注意力模塊實現CFP與OCT的跨模態交互;3)基于類激活圖(CAM)引導的GAN合成數據增強策略。實驗采用公開數據集(1094張CFP+1289張OCT),構建四分類任務(正常/干性AMD/PCV/濕性AMD)。
研究結果
結論與意義
該研究首次將雙向交叉注意力機制引入AMD多模態診斷,通過全局建模能力突破傳統CNN的局部感知局限。提出的數據增強策略為醫學影像小樣本學習提供了新思路。臨床層面,模型對PCV的精準識別有助于指導抗VEGF藥物與光動力療法的差異化應用,推動AMD診療向個體化邁進。研究同時為其他多模態醫學圖像分析任務提供了可遷移的技術框架。
知名企業招聘