BoltzNet:開啟大腸桿菌轉錄因子 DNA 結合研究的新篇章

《Nature Communications》:Predictive biophysical neural network modeling of a compendium of in vivo transcription factor DNA binding profiles for Escherichia coli

【字體: 時間:2025年05月08日 來源:Nature Communications 14.7

編輯推薦:

  在大腸桿菌(Escherichia coli)研究中,多數轉錄因子(TFs)的 DNA 結合情況未被全面解析且缺乏定量預測模型。研究人員開展了大腸桿菌 TFs 的體內 DNA 結合圖譜繪制及建模研究,利用 ChIP-Seq 和 BoltzNet 神經網絡得出多種成果,為 TF-DNA 結合研究提供新范式。

  在生命科學的微觀世界里,大腸桿菌(Escherichia coli)作為生物學和生物技術領域的 “明星選手”,一直備受關注。它不僅是研究最為透徹的原核生物模型,更是合成生物學的重要基石。然而,即便對其了解眾多,仍存在不少謎團。就拿轉錄因子(Transcription Factors,TFs)來說,細菌通常編碼數百種 TFs,它們與 DNA 的結合對基因調控起著關鍵作用 。但在大腸桿菌約 300 種 TFs 中,大多數的結合親和力并未得到全面測繪,很多 TFs 甚至連一個已知的結合序列都沒有,更別提能用實驗驗證的生物物理模型來定量理解其結合行為了。而深入了解 TFs 與 DNA 的結合機制,對于解讀細胞功能和設計合成生物學電路至關重要。
為了攻克這些難題,來自波士頓大學(Boston University)等多個研究機構的研究人員展開了深入研究。他們的研究成果發表在《Nature Communications》上,為該領域帶來了新的曙光。

研究人員運用了多種關鍵技術方法。首先是染色質免疫沉淀測序(Chromatin Immunoprecipitation Sequencing,ChIP-Seq)技術,通過該技術對大腸桿菌 TFs 的體內 DNA 結合情況進行大規模測繪。同時,他們開發了一種新型卷積神經網絡(Convolutional Neural Network ,CNN)——BoltzNet,用于預測 TF 結合親和力和 ChIP-Seq 覆蓋度。

下面來看看具體的研究結果:

  • 大規模繪制 TF 結合位點:研究人員開發了標準化的 ChIP-Seq 實驗方案,對 318 個預測的大腸桿菌 TFs 進行研究,最終獲得了 139 個 TFs 的高可信度全球結合圖譜數據。這些結合區域在基因起始位點上游 150bp 和下游 50bp 處高度富集,且結合區域的數量在不同 TFs 之間差異巨大 。
  • BoltzNet 架構與訓練:BoltzNet 基于 TF-DNA 結合和 ChIP-Seq 的兩階段定量生物物理模型設計,由卷積層和全連接神經網絡組成。它通過對特定序列集的訓練,學習到了 TF-DNA 結合的熱力學模型以及從親和力到 ChIP-Seq 覆蓋度的映射關系12。
  • BoltzNet 準確模擬序列結合強度:以 PdhR 為例,BoltzNet 在所有實驗中都能準確預測富集情況,在基因組范圍內表現出高特異性,并且通過留一法交叉驗證展示了良好的泛化能力34。
  • BoltzNet 在全基因組范圍內具有可解釋性和可驗證性:BoltzNet 的準確性源于單個權重矩陣,該矩陣直接表示每個堿基對結合位點的相對貢獻,能夠在核苷酸分辨率下對結合位點進行精確預測56。
  • BoltzNet 模擬不同 ChIP 實驗的預期行為:BoltzNet 能夠學習不同 ChIP 實驗中由于蛋白質濃度等因素導致的覆蓋度變化,準確模擬不同實驗條件下的結合情況78。
  • TF 結合模型匯總:研究人員為 124 個 TFs 生成了 BoltzNet 模型,這些模型涵蓋了不同 TFs 的多種結合行為,包括結合位點的分布、AT 含量以及與不同 σ 因子的關聯等910。
  • 聚類結合位點和輔助堿基的作用:研究發現,許多序列包含多個預測的非重疊結合位點,聚類位點可增強結合親和力;同時,輔助堿基在決定結合強度方面也起著重要作用1112。
  • 新型結合位點的設計與驗證:通過設計新型結合位點并進行實驗驗證,證實了 BoltzNet 的預測能力以及輔助堿基的重要性1314。
  • BoltzNet 準確預測結合能:利用生物層干涉技術(Biolayer Interferometry,BLI)對蛋白質 - DNA 相互作用進行檢測,結果表明 BoltzNet 能夠準確預測不同結合位點強度和配置的相對結合能1516。
  • 富集差異反映生理相關的結合能差異:研究揭示了 ChIP-Seq 覆蓋度的變化與結合能差異之間的關系,表明弱結合位點在生理上具有重要意義1718。
  • 轉錄因子主要非特異性結合基因組:研究發現多數 TFs 與基因組存在大量非特異性結合,這對基因調控具有重要功能意義194。
  • BoltzNet 模型對超參數和輸入數據具有穩健性:研究表明 BoltzNet 模型對超參數和輸入數據的變化具有較好的穩定性,在不同條件下都能保持較高的準確性2021。
  • BoltzNet 性能優于現有工具:與其他六種工具對比,BoltzNet 在預測結合能和結合位點方面表現更優2223。

在研究結論和討論部分,研究人員通過繪制 139 種大腸桿菌 TFs 的體內 DNA 結合圖譜,并利用 BoltzNet 神經網絡進行分析,為轉錄因子 - DNA 結合研究提供了新的范式。BoltzNet 作為連接高通量基因組學和詳細生物物理學的橋梁,避免了黑箱神經網絡的過參數化和可解釋性問題 。同時,該研究強調了弱結合位點在理解 TF-DNA 相互作用特異性中的重要性,還對 TFs 在細胞內的定位問題提供了新的見解。不過,研究也存在一定局限性,如仍有 179 個 TFs 未能生成合格的 ChIP-Seq 實驗數據。但研究人員預計,未來對這些 TFs 的進一步研究將完善大腸桿菌 TF 結合能的全貌?傮w而言,這項研究成果為深入理解原核生物 TF-DNA 相互作用奠定了堅實基礎,也為后續相關研究開辟了新的方向。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线