基于集成機器學習和量子神經網絡的氨基酸序列無序區域分類:開啟蛋白質研究新征程

《Computational Biology and Chemistry》:Amino acid sequence-based IDR classification using ensemble machine learning and quantum neural networks

【字體: 時間:2025年05月07日 來源:Computational Biology and Chemistry 2.6

編輯推薦:

  在蛋白質研究中,傳統的 Uversky plot 等方法難以準確區分蛋白質的無序區域(IDRs)和有序區域。研究人員整合機器學習(ML)、深度神經網絡(DNN)和量子神經網絡(QNN)開展研究,構建的元模型分類準確率達 0.85,為蛋白質研究提供了新方法。

  在蛋白質的奇妙世界里,蛋白質的結構與功能一直是科學家們深入探索的核心領域。其中,準確預測和分類蛋白質中的內在無序區域(Intrinsically Disordered Regions,IDRs)至關重要。IDRs 在正常生理條件下缺乏穩定的三維結構,卻在信號傳導、調控和分子識別等眾多關鍵生物學過程中發揮著不可或缺的作用 。
然而,傳統的研究方法卻面臨著諸多困境。以廣泛使用的 Uversky plot 為例,它僅依賴于疏水性和凈電荷這兩個特征來識別內在無序蛋白質(Intrinsically Disordered Proteins,IDPs)。這種簡單的判斷方式,在面對復雜的蛋白質序列時,就顯得力不從心了,無法精準地對 IDRs 進行分類。后續雖然發展出了像 PONDR(利用神經網絡)和 DISOPRED(運用支持向量機)這樣更先進的方法,但它們在探究區分 IDRs 和有序區域的關鍵特征相互作用方面,依舊存在明顯的不足,也常常忽視特征之間的層級和并行交互關系。因此,開發更有效的方法來實現精準的 IDR 分類,成為了蛋白質研究領域亟待解決的重要問題。

為了突破這一困境,來自國外的研究人員踏上了探索之路。他們開展了一項極具創新性的研究,旨在通過整合機器學習(Machine Learning,ML)、深度神經網絡(Deep Neural Networks,DNN)和量子神經網絡(Quantum Neural Networks,QNN),提升 IDR 分類的準確性,并挖掘氨基酸序列中的關鍵特征相互作用。研究成果發表在《Computational Biology and Chemistry》上,為蛋白質科學的發展注入了新的活力。

研究人員在這項研究中運用了多種關鍵技術方法。首先,從 DisProt 數據庫獲取原始數據集,該數據集包含 7980 個蛋白質序列。為解決類別不平衡問題,對數據進行下采樣處理,最終得到 2296 個序列,并將其分為用于模型訓練和驗證的 1596 個序列,以及作為獨立測試集的 700 個序列 。然后,從氨基酸序列中提取生物物理特征,如電荷分布、疏水性和結構特性等,為后續的模型預測提供數據支持。最后,構建集成了 ML、DNN 和 QNN 的元模型,利用不同模型的優勢進行 IDR 分類。

研究人員通過一系列研究得出了許多重要結論。在數據集方面,經過處理后的數據為后續研究奠定了良好基礎。在模型構建與性能評估上,研究構建的元模型展現出了強大的能力,其分類準確率達到了 0.85,這一成績超越了單個分類器。深入探究發現,在 IDR 分類中,埋藏氨基酸(Buried amino acids)起著關鍵作用,同時,標度疏水性(Scaled hydrophobicity)與大的、埋藏的和帶電荷的氨基酸之間的相互作用也意義重大。ML 在其中主要負責捕捉獨立特征,DNN 專注于捕捉特征之間的相互作用,而 QNN 則用于模擬特征之間的高階依賴關系和非線性多變量關系。

這項研究成果具有重要意義。從方法學角度看,它創新性地將 QNN 應用于 IDR 分類,展示了 QNN 在生物信息學領域的巨大潛力,為后續研究開辟了新的方向。從研究深度上,對埋藏氨基酸以及特定氨基酸相互作用的發現,深化了人們對蛋白質無序區域特征的理解。整體而言,該研究為計算蛋白質科學的發展提供了堅實的理論和方法支持,有助于推動蛋白質功能在各種生物學背景下的研究,讓人們朝著更深入理解蛋白質奧秘的目標又邁進了一步。

相關新聞
生物通微信公眾號
微信
新浪微博
  • 急聘職位
  • 高薪職位

知名企業招聘

熱點排行

    今日動態 | 人才市場 | 新技術專欄 | 中國科學人 | 云展臺 | BioHot | 云講堂直播 | 會展中心 | 特價專欄 | 技術快訊 | 免費試用

    版權所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    聯系信箱:

    粵ICP備09063491號

    亚洲欧美自拍偷拍,亚洲人成77777,亚洲男女自偷自拍,亚洲成年在线