Fate-tox:用于 E (3) 等變多器官毒性預測的片段注意力 Transformer 框架 —— 多視角深度學習助力藥物開發中的毒性評估

《Journal of Cheminformatics》:Fate-tox: fragment attention transformer for E(3)-equivariant multi-organ toxicity prediction

【字體: 時間:2025年05月15日 來源:Journal of Cheminformatics 7.1

編輯推薦:

  推薦 現有計算預測模型多聚焦單器官毒性,而藥物開發中多器官毒性預測至關重要卻具挑戰。研究人員開發 FATE-Tox 框架,結合多片段圖、2D/3D 分子表征及注意力 Transformer。其在多數據集上性能優于基線,且具可解釋性,為藥物安全評估提供新工具。

  

論文解讀


在藥物研發的漫長征程中,毒性評估始終是一道難以逾越的關卡,無數頗具潛力的化合物因毒性問題折戟于研發后期。當前,大多數計算模型僅聚焦于單一器官的毒性預測,然而人體是一個復雜的有機整體,各器官通過精密的生化和生理通路相互關聯。就像羅非昔布(rofecoxib),最初著眼于胃腸道安全性研發,卻因引發心血管風險而退市,這深刻體現了單器官毒性模型的局限性 —— 無法捕捉器官系統間的關聯及次級毒性效應,難以應對藥物全身毒性評估的需求。在此背景下,韓國首爾國立大學(Seoul National University)的研究團隊開展了一項極具意義的研究,相關成果發表在《Journal of Cheminformatics》上,為多器官毒性預測提供了全新的解決思路。

為攻克多器官毒性預測的難題,研究人員開發了 FATE-Tox(Fragment Attention Transformer for E (3)-Equivariant Toxicity Prediction)框架。該框架整合了結構建模與解釋能力,旨在實現對多器官毒性的全面、精準且可解釋的預測。

研究采用了多項關鍵技術方法。首先,運用三種碎片化方法(BRICS、Bemis-Murcko 支架、RDKit 官能團)將分子拆解為不同層次的子結構,構建片段級圖,以捕捉多樣的亞結構特征。其次,結合 2D 拓撲和 3D 空間信息的多視角分子表征,通過分子 Transformer 模塊和 E (3) 等變圖神經網絡(EGNN)處理,其中 E (3) 等變性確保模型在分子三維空間變換(平移、旋轉、反射)下預測結果的一致性。此外,采用多任務學習(MTL)結合梯度手術(PCGrad)方法,緩解任務間梯度沖突,提升模型性能。實驗數據來源于 MoleculeNet 和 TDC 等基準數據集,涵蓋多種器官毒性和全身毒性終點。

預測性能評估


在七個毒性基準數據集(如 BBBP、DILI、SIDER 等)上,FATE-Tox 的單任務學習(STL)和多任務學習(MTL)性能均顯著優于傳統機器學習模型(隨機森林 RF、支持向量機 SVM 等)和現有深度學習模型(MolCLR、GraphMVP 等)。例如,在 BBBP 任務中,FATE-Tox STL 的 AUROC 達 70.15%,MTL 進一步提升至 71.16%;在 DILI 任務中,MTL 的 AUROC 為 91.86%,展現出其在多器官毒性預測中的有效性。

碎片化方法的貢獻


不同碎片化方法在各數據集的權重差異顯著,反映了不同毒性機制的化學特征。BRICS 碎片化在 BBBP 任務中權重最高(0.4),因其能保留分子整體理化性質(如分子量、親脂性),這對血腦屏障穿透性預測至關重要;RDKit 官能團碎片化在致癌性(Carcinogens)和肝毒性(DILI)任務中權重較高(均為 0.4),因其可提取硝基、醌類等毒性官能團;Bemis-Murcko 支架在皮膚反應(Skin Rxn)任務中權重達 0.5,凸顯了核心分子骨架對皮膚毒性的影響。多種碎片化方法的整合顯著提升了模型的泛化能力。

模型可解釋性與嵌入空間分析


通過注意力可視化,FATE-Tox 能識別與文獻一致的 3D 毒性基團。以沙利度胺(thalidomide)對映體為例,其 2D 結構相同,但 3D 空間構型差異顯著,FATE-Tox 的多視角嵌入空間可有效區分 (R)- 和 (S)- 沙利度胺,而僅用 2D 表征的模型(如 MAT)則無法做到。多任務學習的嵌入空間通過 t-SNE 可視化和輪廓系數分析,顯示出更優的類間分離性,表明其能捕捉跨任務的通用特征和任務特異性模式。

案例研究


在血腦屏障穿透性案例中,FATE-Tox 通過注意力系數識別出抗組胺藥和 β 受體阻滯劑的關鍵亞結構。如苯海拉明(diphenhydramine)的疏水性苯環使其易穿透血腦屏障,而西替利嗪(cetirizine)的羧基和氯離子取代基增加極性,降低穿透能力。在致癌性案例中,蘇丹紅 I(Sudan I)的偶氮基(-N=N-R)和磺酸基團被高注意力系數標記,與已知致癌機制一致,驗證了模型的可解釋性。

結論與意義


FATE-Tox 通過雙分支架構整合原子級和片段級特征,結合 Transformer 和 E (3) 等變圖神經網絡,成功應對了多器官毒性預測的三大挑戰:亞結構變異性、分子表征能力和可解釋性。其在多任務學習中的優異表現及可解釋性,為科學家和臨床醫生提供了更透明、更具臨床意義的全身毒性評估工具,有望減少藥物研發后期因毒性導致的失敗,推動更安全、更高效的藥物開發進程。未來,若能進一步探索自適應碎片化策略和時間依賴性毒性模式,該框架有望在計算毒理學領域發揮更廣泛的作用。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线