-
生物通官微
陪你抓住生命科技
跳動的脈搏
基于圖編碼混合生存模型(GEMS)的NSCLC免疫治療響應預測亞型識別研究
《Nature Communications》:Identification of predictive subphenotypes for clinical outcomes using real world data and machine learning
【字體: 大 中 小 】 時間:2025年05月13日 來源:Nature Communications 14.7
編輯推薦:
針對非小細胞肺癌(aNSCLC)患者免疫治療響應異質性難題,Weishen Pan團隊開發了圖編碼混合生存模型(GEMS),通過整合電子健康記錄(EHR)數據和圖神經網絡(GNN),成功識別出3個具有顯著生存差異的預測亞型,為精準治療決策提供新思路。該成果發表于《Nature Communications》,c-index達0.665,顯著優于基線模型。
在腫瘤治療領域,非小細胞肺癌(NSCLC)的異質性始終是臨床面臨的重大挑戰。盡管免疫檢查點抑制劑(ICI)療法為晚期患者帶來希望,但個體響應差異顯著,傳統聚類方法難以保證組內生存一致性。這一困境呼喚能同時整合臨床特征與生存結局的新型分析方法。
針對這一需求,康奈爾大學Weishen Pan團隊聯合Regeneron Pharmaceuticals開發了圖編碼混合生存模型(Graph-Encoded Mixture Survival, GEMS)。該研究基于美國ConcertAI Patient360? NSCLC數據庫4666例接受一線ICI治療的患者數據,創新性地結合圖神經網絡與生存分析,首次實現了臨床特征與生存結局協同優化的亞型識別。相關成果發表于《Nature Communications》,為腫瘤精準治療提供了可解釋的決策工具。
研究采用三項核心技術:1)基于患者相似性構建拓撲圖網絡,利用圖注意力網絡(GAT)提取特征;2)開發混合生存預測模塊,通過聚類損失函數確保亞型內生存一致性;3)采用地理分區驗證策略,將美國中西部1441例患者作為獨立驗證集。通過SHAP值解析關鍵預測因子,并利用UMAP降維可視化表征空間。
研究結果部分:
《Overview of the framework》
GEMS框架包含GNN編碼器、聚類模塊和混合生存預測器三部分。輸入104維EHR特征(含 demographics、lab tests、metastases等),通過患者-近鄰圖(TOP5相似度加權)學習拓撲關系,最終輸出亞型分類及生存曲線。
《Study cohort》
隊列來自2015-2023年17265例NSCLC患者,經篩選后納入4666例(中位OS 314天),按美國人口調查局分區劃分為開發集(3225例)和驗證集(1441例),兩組基線特征平衡(p>0.05)。
《Quantitative performance》
在驗證集上,GEMS的c-index達0.665(95%CI:0.662-0.667),顯著優于梯度提升樹(GBDT)的0.652。其log-rank score 69.17也遠超神經生存聚類(NSC)方法的56.23,證明其生存區分優勢。
《Predictive subphenotypes》
識別出3個穩定亞型:亞型1(42%)女性居多(55.5%)、轉移灶<2個、ECOG-PS<2,中位OS最優(516天);亞型3(44%)男性為主(64.8%)、肝轉移率31.2%、ECOG-PS≥2,中位OS僅180天;亞型2(14%)則呈現獨特的中期生存拐點。
《Subphenotype reproducibility》
驗證集再現相同趨勢:亞型1(40.7%)保持最長OS(481天),亞型3(43.8%)仍表現最差(164天),關鍵特征如肝轉移、中性粒細胞-淋巴細胞比值(NLR)等效應量一致(p<0.001)。
《Discussion》
該研究突破性地將圖學習與生存分析結合,首次實現臨床特征驅動且生存結局可驗證的亞型劃分。發現ECOG-PS和轉移灶數量是核心預測因子,而亞型2特有的NLR>4.87提示炎癥微環境可能影響ICI響應。研究局限性包括EHR數據缺失、缺乏非ICI對照組等。
這項工作的臨床意義在于:1)為ICI治療前預后評估提供量化工具;2)揭示肝轉移與堿性磷酸酶(ALP)升高的特殊關聯;3)證實社區醫院數據可用于精準醫學研究。未來可通過整合基因組數據進一步揭示生物學機制,推動分層治療策略優化。
知名企業招聘