《Biomedical Signal Processing and Control》:AMFTCNet: A multi-level attention-based multi-scale fusion temporal convolutional network for decoding MI-EEG signals
編輯推薦:
為解決 MI-EEG 信號解碼中受多種因素干擾、解碼精度和泛化能力受限等問題,研究人員開展基于多尺度特征學習和特征融合的研究。結果顯示 AMFTCNet 模型在多個數據集表現優異,為相關研究提供新思路。
在科技飛速發展的當下,腦機接口(Brain-Computer Interface,BCI)技術宛如一顆璀璨的新星,吸引著無數科研人員的目光;谀X電圖(Electroencephalography,EEG)和運動想象(Motor Imagery,MI)的 BCI 技術,更是在神經康復、輔助通信、虛擬現實等諸多領域展現出巨大的潛力。想象一下,癱瘓患者借助這項技術,僅憑大腦的想象就能控制輪椅自由移動;在虛擬世界里,人們通過大腦信號與環境進行自然交互,那將是多么令人驚嘆的場景。
然而,MI-EEG 信號解碼卻面臨著重重挑戰。在信號采集過程中,面部肌肉運動、眨眼等生理信號以及環境電磁干擾,就像一群調皮的 “小怪獸”,不斷干擾著 MI-EEG 信號,導致解碼精度大打折扣。而且,不同參與者的大腦結構和功能存在差異,這些差異源于生理屬性、認知能力、神經適應性和訓練背景等多個方面,使得從復雜的 EEG 信號中準確識別大腦的真實意圖變得困難重重,也限制了 MI-EEG 信號的泛化能力,成為 BCI 技術廣泛應用道路上的 “攔路虎”。
為了攻克這些難題,來自國內的研究人員挺身而出,開展了一項極具意義的研究。他們提出了一種全新的 AMFTCNet 模型(A multi-level attention-based multi-scale fusion temporal convolutional network,基于多水平注意力的多尺度融合時間卷積網絡),旨在通過多尺度特征學習和不同尺度特征的動態融合,提高 MI-EEG 信號的解碼效果。研究成果發表在《Biomedical Signal Processing and Control》上,為該領域的發展帶來了新的曙光。
研究人員在開展此項研究時,運用了多種關鍵技術方法。他們首先利用卷積塊(Convolutional Blocks,CV)和多尺度分支結構(Multi-Scale Branch Structures,MSB)從原始 EEG 信號中提取多尺度特征表示。接著,通過并行注意力時間卷積塊(Parallel Attention Temporal Convolution Blocks,PAT)從單一尺度中提取高維特征。此外,還引入了一種新的注意力塊 —— 乘積和通道注意力塊(Product-Sum Channel Attention,PSCA),用于動態加權和組合不同尺度的高維特征。在實驗過程中,研究人員使用了 BCI Competition IV - 2a、BCI Competition IV - 2b 和 High Gamma 等多個數據集進行測試。
下面讓我們詳細了解一下研究結果。
在多尺度特征提取方面,研究人員借助 CV 和 MSB 結構,如同擁有了一雙 “火眼金睛”,能夠精準地從原始 EEG 信號中捕捉到不同尺度的特征。這些特征涵蓋了信號在時間和空間上的多種信息,為后續的分析提供了豐富的數據基礎。通過實驗發現,這種多尺度特征提取方式可以更全面地反映 MI-EEG 信號的特性,比單一尺度特征提取更具優勢。
對于單尺度高維特征提取,PAT 模塊發揮了重要作用。它將多頭自注意力(Multi-Head Self-Attention,MSA)和 TCN 相結合,能夠有效地從單尺度特征中篩選出關鍵信息,過濾掉冗余部分。就像是在一堆雜亂的信息中,快速找到最有價值的線索。實驗結果表明,PAT 模塊提取的高維時間特征具有更強的表征能力,能夠更好地反映 MI-EEG 信號的時間序列特性。
在特征融合環節,PSCA 模塊大放異彩。它打破了傳統特征融合方式的局限性,不再是簡單地合并特征,而是根據特征的重要性,動態地為不同尺度的高維特征分配權重。這就好比給不同的 “士兵” 分配不同的任務,讓每個 “士兵” 都能在戰場上發揮最大的作用。通過 PSCA 模塊的融合,模型能夠更有效地整合信號特征,顯著提升了解碼性能。
從模型性能評估來看,AMFTCNet 模型在多個數據集上都展現出了卓越的性能。在 BCI Competition IV - 2a 數據集上,其平均分類準確率達到了 87.77%,超越了 EEGNet、EEGNeX 和 TCNet_Fusion 等基于 CNN 的解碼模型;在 BCI Competition IV - 2b 數據集上,準確率為 88.26%;在 High Gamma 數據集上,準確率更是高達 95.62%。這些令人矚目的成績,充分證明了 AMFTCNet 模型的優越性。
綜上所述,研究人員通過提出 AMFTCNet 模型,成功地解決了 MI-EEG 信號解碼中的部分關鍵問題。該模型能夠更有效地利用訓練數據,以更高的靈敏度和精度捕捉 MI-EEG 信號中的關鍵特征。其多尺度特征學習和動態特征融合的策略,為后續研究如何有效融合多種類型的特征信息以及更高效地利用注意力機制提高解碼精度,提供了寶貴的思路和方法。這一研究成果不僅推動了 BCI 技術在醫學和非醫學領域的進一步發展,也為相關領域的研究開辟了新的方向,讓我們對未來腦機接口技術的廣泛應用充滿了期待。相信在不久的將來,隨著研究的不斷深入,腦機接口技術將為人類的健康和生活帶來更多意想不到的驚喜。