《Nature Protocols》:Integration of diverse bioactivity data into the Chemical Checker compound universe
編輯推薦:
針對生物活性描述符常局限于少數分子的問題,研究人員開發深度神經網絡,利用小分子相關實驗生物活性數據推斷缺失特征。本文呈現計算協議,可修改或生成生物活性空間與特征,擴展小分子注釋,具重要意義。
化學特征將小分子的物理化學和結構性質編碼為數值描述符,構成化學比較和搜索算法的基礎。生物活性數據的日益豐富使化合物表征納入生物效應(如誘導的基因表達變化),但生物活性描述符常限于少數充分研究的分子。為解決這一問題,研究團隊實現了一組深度神經網絡,能夠利用實驗確定的與小分子相關的生物活性數據,推斷任何感興趣化合物缺失的生物活性特征。不同于靜態化學描述符,這些生物活性特征隨新數據和處理策略動態演變。本文介紹一種計算協議,用于修改或生成新型生物活性空間和特征,描述利用 Chemical Checker(CC;
https://chemicalchecker.org/)中編目的現有知識,通過預定義數據管理流程整合多樣生物活性數據的主要步驟。研究通過四個具體示例說明協議功能,包括向現有生物活性空間中加入新化合物、在不改變基礎實驗數據的情況下改變數據預處理,以及從頭創建兩個新型生物活性空間(使用圖形處理單元計算在 9 小時內完成)?傮w而言,該協議為在用戶提供的數據上安裝、測試和運行 CC 數據整合方法提供指南,將有限數量小分子的注釋擴展至更大化學領域,并生成新型生物活性特征。