《Engineering Applications of Artificial Intelligence》:Deep learning-based real-time estimation of transcranial focused ultrasound acoustic field
編輯推薦:
為解決 tFUS 因顱骨不均勻性導致的超聲焦點強度、位置和形狀估計難題,研究人員開展基于深度學習的顱內聲場分布實時估計研究。結果顯示模型焦點估計精度高,推理時間僅 16 ms,為 tFUS 臨床應用提供新方向。
在醫學影像與精準治療領域,經顱聚焦超聲(transcranial focused ultrasound, tFUS)作為一種非侵入性腦刺激技術,憑借高空間特異性和深度穿透能力,在神經調控、藥物遞送及阿爾茨海默病、帕金森病等神經疾病治療中展現出廣闊前景。然而,顱骨的不均勻性會導致超聲波傳播時發生折射、反射、吸收和衰減,造成能量衰減、聚焦不良甚至形成額外焦點,使得精準估計超聲焦點的強度、位置和形狀成為巨大挑戰。傳統成像方法無法捕捉低強度聲焦,數值模擬雖能估算顱內壓力場,但計算成本高,難以滿足實時應用需求。在此背景下,探索一種高效、精準的 tFUS 聲場實時估計方法成為臨床轉化的關鍵瓶頸。
為突破這一困境,相關研究人員開展了基于深度學習的 tFUS 顱內聲場分布實時估計研究。該研究成果發表在《Engineering Applications of Artificial Intelligence》,為 tFUS 技術的臨床應用提供了創新性解決方案。
研究人員主要采用以下關鍵技術方法:首先利用數值正向模擬生成 13 個顱骨的訓練數據集;其次通過遷移學習從 3D 顱骨數據中提取特征,采用預訓練的 VGG-19 網絡編碼顱骨幾何特征;然后構建深度學習替代模型,包括預測聲場分布的聲學分布網絡(Acoustic Distribution Network, ADNet)和估計峰值壓力的峰值壓力網絡(Peak Pressure Network, PPNet);最后使用 5 個未參與建模的人類顱骨進行實驗驗證,通過測量焦點位置誤差(ΔFP)、豪斯多夫距離(HD)、骰子相似系數(DSC)和峰值壓力比誤差(ΔPPR)等指標評估模型性能。
研究結果
模型架構與特征提取
研究提出的深度學習模型包含兩個核心模塊:通過預訓練 VGG-19 網絡對顱骨 CT 數據進行特征提取,捕捉顱骨的幾何特征;ADNet 基于提取的特征預測顱內聲壓場的空間分布,PPNet 則專門估計焦點處的最大壓力值,二者結合提升整體預測精度。
實驗驗證與性能評估
通過對 3 個離體顱骨的直接場測量驗證模型性能:焦點位置誤差為 2.46 mm,峰值壓力比誤差 3.94%,顯示出高精度的焦點定位能力;在焦域預測方面,最大邊界誤差 5.90 mm,焦域一致性達 81%,表明模型能有效刻畫聲場分布形態;推理時間僅 16 ms,顯著快于傳統數值模擬,滿足實時應用需求。
與現有方法對比
相較于既往基于特定患者的 DNN 模型需大量顱骨 CT 數據且無法通用,該模型以顱骨 CT 數據和換能器位置為輸入,無需針對特定患者重新訓練,具有更廣的解剖通用性。實驗驗證顯示,其在焦點位置精度和焦域一致性方面優于現有方法,突破了傳統方法在準確性與效率平衡、解剖通用性及實驗驗證方面的局限。
研究結論與意義
本研究構建的深度學習替代模型,成功實現了 tFUS 顱內聲場的實時估計,解決了傳統數值模擬計算耗時的難題,同時通過雙模塊設計提升了焦點定位和壓力估計的精度。其核心創新點包括:適用于多種顱骨解剖結構的通用型深度學習模型、基于物理過程的聲場傳播特征刻畫、結合顱骨幾何與換能器位置的實時 3D 聲場預測,以及通過獨立模塊增強峰值壓力估計精度。該方法為 tFUS 在神經調控、腦腫瘤藥物遞送等臨床場景中的精準靶向提供了關鍵技術支撐,顯著提升了 tFUS 的臨床可行性,有望推動其在阿爾茨海默病、帕金森病等神經疾病治療中的廣泛應用。盡管研究基于有限樣本且未涉及活體實驗,但其在離體驗證中展現的高效性與準確性,為后續臨床轉化奠定了堅實基礎,標志著深度學習在醫學超聲領域的應用邁出重要一步。