AI 深度學習+藥物研發,讓新藥不再遙不可及 | MedChemExpress
一般而言,一種藥物研發周期在 10 年以上,研發投入在數十億美金,并且呈現逐年上升的趨勢。近年來,深度學習 (Deep Learning, DL) 技術在語音識別、圖像識別等領域取得重大突破,迅速成為學術界和工業界的研究熱點。
深度學習是人工智能的一個分支,它是一種利用神經網絡進行學習的技術。深度學習技術在生物醫學領域已經取得重要進展,目前研究人員已經開發了一系列基于深度學習的疾病診斷、蛋白質設計、醫學圖像識別的應用策略。制藥工業界目前也開始重視深度學習技術,希望利用其加速藥物研發并降低成本。
此前的研究表明,深度學習技術在優化化學合成路線、預測藥物的藥代動力學性質、預測藥物的作用靶點以及生成新型分子等方面具有優勢。
圖 1. 虛擬篩選在藥物開發流程中的地位[1]。
? 虛擬篩選:化合物-靶蛋白的親和力
深度學習可以通過訓練大量的已知化合物-靶蛋白相互作用數據來學習化合物和靶蛋白之間的內在關系。這種訓練過程使得深度學習模型能夠自動提取和利用化合物和靶蛋白的特征,以及它們之間的相互作用模式。
Yelena Guttman 等人基于 DeepChem 框架,構建了一個 CYP3A4 抑制劑預測模型。先基于 lipinski 五原則對庫中化合物進行排除,再基于此模型對 FOODB 庫中 68,900 個化合物進行 CYP3A4 抑制活性預測,順利得到了兩種新的 CYP3A4 抑制劑。
圖 2. 基于 DeepChem 的 CYP3A4 抑制劑預測[2]。
在 KNIME 分析平臺 4.0.314 中創建了一個工作流來準備和分析虛擬篩選。
? 預測化合物的 ADMET 性質
自 Lipinski 類藥五原則提出以來,對先導化合物的 ADMET (吸收、分布、代謝、排泄和毒性) 性質進行早期預測也變得越來越重要。許多研究表明,通過對大量已知化合物的 ADMET 數據進行訓練和學習,自動識別和提取化合物特征與性質之間的關系,訓練好的深度學習模型可以用來預測新化合物的性質,從而加速藥物發現和開發的進程。
Liu 等人利用定向消息傳遞網絡 (directed message passing neural networks, D-MPNN,又稱 Chemprop) 對 FOODB 庫中化合物進行了 Nrf2 激動活性預測及毒性分析,順利得到了Nicotiflorin這一兼具 Nrf2 激動活性和安全性的藥物,并且在體內外實驗中得到了驗證[3]。
? 優化化學合成路線
近年來,人們已經看到人工智能 (AI) 開始為化學合成帶來革命性的變化。然而,由于缺乏合適的化學反應表示方式和反應數據的稀缺性,限制了人工智能在反應預測中的廣泛應用。深度學習可以通過對大量的化學合成數據進行訓練和學習,自動識別和提取合成路線的特征和模式,用來預測新的合成路線的效率和選擇性,從而加速新藥的開發和生產。
圖 4. 深度學習在預測化學反應合成路線上的應用[4]。
Schwaller 等人結合了深度學習網絡和符號人工智能來規劃化學合成路線。他們開發了一個名為“MoleculeNet”的框架,該框架能夠預測反應是否可能成功,并使用這些預測來規劃出從起始原料到目標分子的合成路徑[5]。
深度學習在虛擬篩選領域中的應用,主要是通過神經網絡來預測化合物的活性或性質,從而在虛擬環境中篩選出有潛力的候選藥物或材料。
以下是一些常見的深度學習算法在虛擬篩選中的應用:
卷積神經網絡 (CNN):CNN 特別適合處理圖像數據,如分子結構圖。通過識別和提取分子中的特征,如原子和化學鍵的類型和位置,CNN 可以預測分子的性質和活性。
循環神經網絡 (RNN):對于處理序列數據 (如化學分子序列) 的虛擬篩選任務,RNN 特別有用。RNN 可以捕捉分子序列中的長期依賴關系,從而更準確地預測分子的性質。
生成對抗網絡 (GAN):GAN 可以生成新的分子結構,這在進行虛擬篩選時非常有用。通過訓練 GAN,可以生成具有所需性質的分子,從而大大減少實驗的必要性。
圖神經網絡 (GNN):GNN 特別適合處理圖結構數據,如分子圖。GNN 可以捕捉分子中原子和化學鍵之間的關系,從而更準確地預測分子的性質。
Transformer:對于處理長序列數據的虛擬篩選任務,如多步化學反應預測,Transformer 是一個很好的選擇。Transformer 可以捕捉序列中的長期依賴關系,從而更準確地預測分子的性質。
今天,小 M 給大家介紹了深度學習在藥物研發領域的應用方向及常見算法,作為一種新興的技術,AI / 深度學習技術在新藥研發領域已初見成效,相信隨著科學的進步,AI 助力藥物篩選一定會在生物醫藥領域有著更加深遠的影響。
Virtual Screening 虛擬篩選 (Virtual Screening, VS) 是基于小分子數據庫開展的活性化合物篩選。利用小分子化合物與藥物靶標間的分子對接運算,虛擬篩選可快速從幾十至上百萬分子中,遴選出具有成藥性的活性化合物,大大降低實驗篩選化合物數量,縮短研究周期,降低藥物研發的成本。 |
MCE 50K Diversity Library MCE 50K Diversity Library 由 50,000 種類藥化合物組成。依據谷本相似性 (Tanimoto Coefficient) 及聚類算法 (Bemis-Murcko) 對上百萬化合物進行篩選以確保結構多樣性。本多樣性庫具備新穎性、類藥性,化合物結構類型多樣、化學空間豐富,庫中化合物可重復供應,是新藥研發的有力工具,可以廣泛地應用于高通量篩選 (HTS) 和高內涵篩選 (HCS)。 |
MegaUni 10M Virtual Diversity Library 運用生成式人工智能技術,依托強大的計算能力,基于高質量的 40,662 個分子砌塊,匹配合適的反應規則,選擇的化合物生成策略,去除合成難度高、類藥性低、PAINS 等不利化合物后,進一步分析化合物骨架,優選出類藥多樣性分子組成虛擬庫,適用于 AI 藥物篩選、大型虛擬篩選等。 |
MegaUni 50K Virtual Diversity Library Retatrutide 是胰高血糖素受體 (GCGR)、葡萄糖依賴性促胰島素多肽受體 (GIP 優選 50,000 個分子組成 MegaUni 50K Virtual Diversity Library。50,000 個分子具有 46,744 種 BMS 分子骨架,每種分子骨架僅包含 1-3 個化合物,化學空間多樣,結構新穎,適用于新型先導物發現等。 |
MCE 的所有產品僅用作科學研究或藥證申報,我們不為任何個人用途提供產品和服務。
參考文獻:
[1] Rifaioglu AS, et al. Recent applications of deep learning and machine intelligence on in silico drug discovery: methods, tools and databases. Brief Bioinform. 2019 Sep ;20(5):1878-1912.
[2] Guttman Y, Kerem Z. Dietary Inhibitors of CYP3A4 Are Revealed Using Virtual Screening by Using a New Deep-Learning Classifier. J Agric Food Chem. 2022 Mar ;70(8):2752-2761.
[3] Liu S, et al. Virtual Screening of Nrf2 Dietary-Derived Agonists and Safety by a New Deep-Learning Model and Verified In Vitro and In Vivo. J Agric Food Chem. 2023 May ;71(21):8038-8049.
[4] Li B, et al. A deep learning framework for accurate reaction prediction and its application on high-throughput experimentation data. J Cheminform. 2023 Aug;15(1):72.
[5] Segler MHS, et al. Planning chemical syntheses with deep neural networks and symbolic AI. Nature. 2018 Mar ;555(7698):604-610.
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。