-
生物通官微
陪你抓住生命科技
跳動的脈搏
CellWalker2:基于層次化細胞類型關系的多組學發現新工具
《Cell Genomics》:CellWalker2: Multi-omic discovery using hierarchical cell type relationships
【字體: 大 中 小 】 時間:2025年05月23日 來源:Cell Genomics 11.1
編輯推薦:
這篇研究報道了CellWalker2這一基于圖擴散模型的創新工具,通過整合多模態單細胞數據(scRNA-seq/scATAC-seq)和層次化細胞類型關系,實現了跨物種、跨情境的細胞類型精準注釋與調控元件映射。其核心突破在于:1)建立統計顯著性評估體系(Z scores);2)支持多組學數據聯合建模;3)首次實現細胞類型層次樹的概率化比對。在PBMC、大腦發育等場景中,該工具在TF特異性鑒定、保守性分析等方向展現出超越Seurat、MARS等現有方法的性能。
CellWalker2的多組學整合框架
作為CellWalker的升級版,CellWalker2通過構建包含細胞、標簽和基因組注釋的異質圖模型,采用重啟隨機游走算法計算節點影響力矩陣。其創新性體現在三方面:1)將細胞類型層次關系編碼為圖結構;2)通過度保持置換生成零分布計算Z值;3)支持RNA-seq和ATAC-seq數據的靈活組合。在10x Genomics PBMC多組學數據測試中,該模型跨模態連接準確率顯著優于GLUE和SIMBA。
細胞注釋的性能突破
通過模擬數據集驗證,在存在批次效應和基因丟失(dropout)的中等難度場景下,CellWalker2的細胞類型標注準確率比Seurat提高15-20%。特別值得注意的是,當參考數據集中稀有細胞占比從32%降至3%時,Seurat會將細胞錯誤標注為高豐度類型,而CellWalker2仍保持>90%的準確率。這種穩定性源于其基于置換檢驗的Z值計算體系,能有效消除節點度數的干擾。
跨物種細胞類型比對
在哺乳動物運動皮層研究中,工具成功解析了人類與狨猴抑制性神經元的進化關系。例如人類Inh PVALB COL15A1(吊燈細胞)與狨猴Inh PVALB FAM194A顯示出強相關性(Z>75),而表達雙標記物PVALB/SST的狨猴細胞則同時映射到人類Pvalb和Sst亞類。這種多層次映射能力超越了Bakken等人構建的共識分類法,為跨物種細胞進化研究提供了新維度。
調控元件的細胞特異性解析
通過分析人腦發育期的19,151個預測調控元件(pREs),發現基底節特異性pREs在放射狀膠質細胞(RG)中的富集Z值達8.3(p<10-15),而皮質板特異性pREs優先映射到興奮性神經元。與常規DARs分析相比,該方法無需預先聚類即可直接關聯基因組區域與細胞類型,在CTCF等廣譜TF的細胞特異性結合位點鑒定中展現出獨特優勢。
轉錄因子調控網絡的構建
在PBMC體系中,CellWalker2不僅重現了已知的譜系決定因子(如B細胞的EBF1、CD8+ T細胞的TBX21),還發現THAP11等TF在多個T/NK細胞亞群中活躍。通過整合ReMap2022的ChIP-seq數據,證實約68%的預測TF-細胞類型關聯有實驗證據支持,顯著高于ArchR(52%)和Signac(45%)的檢出率。這種分層映射策略為解析復雜組織的基因調控網絡提供了新范式。
技術局限與發展方向
當前版本在百萬級細胞規模的計算效率有待提升,且依賴多組學數據作為橋梁。未來計劃通過近似算法加速置換檢驗,并引入單細胞TF結合譜(scATAC-seq+motif)來區分共定位的調控因子。這些改進將增強其在腫瘤異質性和發育軌跡重構等場景的應用潛力。
知名企業招聘