-
生物通官微
陪你抓住生命科技
跳動的脈搏
中東近完整基因組解析自合性與疾病變異發現:填補人群特異性參考空白
《Nature Genetics》:Near-complete Middle Eastern genomes refine autozygosity and enhance disease-causing and population-specific variant discovery
【字體: 大 中 小 】 時間:2025年05月06日 來源:Nature Genetics 31.8
編輯推薦:
本研究針對中東(ME)人群基因組代表性不足的問題,通過長讀長測序技術對6個神經發育障礙家系(n=18)進行近完整基因組組裝,揭示了42.2 Mb新序列、75個新HLA/KIR等位基因及顯著自合性(ROH)特征。研究采用組裝優先策略鑒定出23個致病變異,證明ME特異性參考基因組可顯著提升變異檢測精度,為中東人群遺傳病研究提供關鍵資源。
基因組學的"中東拼圖":長讀長測序如何破解遺傳病診斷困局
在人類基因組計劃完成二十余年后,全球基因組多樣性地圖仍存在顯著空白——中東(ME)人群的遺傳特征長期缺乏高質量參考數據。這個橫跨亞非歐大陸的群體不僅具有獨特的種群隔離和高近交率,其神經發育障礙發病率更是歐洲人群的2-3倍。傳統短讀長測序在復雜區域(如HLA基因簇)的"盲區",加上GRCh38參考基因組對ME人群的匹配度不足,導致約40%的中東患者無法獲得明確分子診斷。
為破解這一困局,Sidra Medicine聯合華盛頓大學的研究團隊在《Nature Genetics》發表突破性成果。研究者選取6個具有蘇丹、約旦、敘利亞、卡塔爾和阿富汗血統的神經發育障礙家系(n=18),采用PacBio HiFi長讀長測序(平均讀長19 kb,覆蓋度38×)結合Illumina短讀長數據,通過trio-Hifiasm流程完成目前最完整的中東二倍體基因組組裝。
關鍵技術包括:(1)基于家系的長讀長組裝策略,利用父母短讀長數據校正子代單倍型;(2)以CHM13-T2T為基準評估新序列;(3)免疫多態性基因(如HLA-DQB2)的等位基因注釋;(4)組裝優先變異檢測(PAV)與傳統讀長比對(DeepVariant)的并行分析;(5)針對27個ME樣本的參考基因組匹配度測試。
遺傳背景解析
祖先分析顯示蘇丹家系保留>99%非洲成分,而卡塔爾家系呈現顯著的半島阿拉伯(PAR)特征(63%)。約旦父親攜帶目前報道最長的純合片段(ROH),覆蓋6號染色體30%區域(52.9 Mb含794個基因),挑戰了傳統"致病性ROH"的閾值定義。
基因組新大陸
相比CHM13參考基因組,ME組裝揭示42.2 Mb新序列,其中13.8%影響已知基因。在高度重復的著絲粒區域發現10-40%的序列變異,而12.6%新序列位于內含子/UTR區。最引人注目的是鑒定出75個新HLA/KIR等位基因,包括11個存在CDS突變的獨特等位,為理解ME人群免疫特征提供分子基礎。
變異檢測革命
組裝優先策略比傳統方法多檢出50%的候選致病變異。在已排除診斷的卡塔爾家系中,發現KIF1A基因內含子234 bp缺失可能通過影響突觸小泡運輸導致小腦萎縮。值得注意的是,約50%的候選變異(如GABRG1基因2.2 kb缺失)僅能通過組裝方法檢出,凸顯參考基因組匹配度對變異檢測的關鍵影響。
臨床轉化價值
構建的ME參考基因組(MER1)使短讀長數據的未比對率降低22%,變異假陽性減少3.6倍。這一成果直接促成兩項臨床轉化:(1)修訂ACMG評分中7個VUS(如SOX5變異)的臨床意義;(2)為GABRG1基因與癲癇性腦病的關聯提供"限定性"到"明確性"證據升級的支持數據。
這項研究標志著群體基因組學進入"精準參考"時代。通過揭示ME人群特有的基因組結構、變異譜系和致病機制,不僅填補了人類遺傳多樣性地圖的關鍵缺口,更證明長讀長組裝在復雜疾病診斷中的不可替代性。隨著Qatar Genome Program等計劃的推進,未來ME特異性泛基因組將進一步提升罕見病診斷率,并為理解近交群體中"健康純合"現象提供新視角。研究揭示的基因組"暗物質"區域(如著絲粒新序列)及其與神經發育的潛在關聯,將成為后續功能基因組學研究的重點方向。
知名企業招聘