新藥分子發(fā)現(xiàn)提速1200倍!MIT的最新AI模型是如何做到的?

以下文章來源于:藥明康德

在介紹今天的主角之前,想先問大家一個問題:宇宙中存在著數(shù)不清的分子,其中有多少具有潛在的類藥物特征,可用于藥物開發(fā)?


答案是:10^60,與之相比,銀河系中存在的恒星數(shù)量只有10^11顆。

如此龐大的潛在藥物分子數(shù)量使得研究人員們在開發(fā)新藥分子時需要更長的時間,因?yàn)樗h(yuǎn)遠(yuǎn)超出了現(xiàn)有藥物設(shè)計模型所能計算的范圍,這也一直是新藥研發(fā)中的痛點(diǎn)之一。那么,是否有方法可以改善這個現(xiàn)狀呢?

還真有!近期,在一篇即將發(fā)表在國際機(jī)器學(xué)習(xí)會議(ICML)雜志上的論文中提到,MIT的研究人員開發(fā)了一種被稱為“EquiBind”的幾何深度學(xué)習(xí)模型,可以極大程度提升發(fā)現(xiàn)潛在新藥分子的速度,從而降低藥物試驗(yàn)失敗的概率,并減少新藥研發(fā)的成本。

微信圖片_20220718170720.png


下面我們來看看EquiBind具體是如何做到的。

在藥物開發(fā)的最早期,研究人員首先要做的是針對目標(biāo)蛋白找到那些能夠恰當(dāng)?shù)嘏c其靶點(diǎn)區(qū)域結(jié)合或“對接”的潛在配體,這些配體可以通過阻止蛋白質(zhì)發(fā)揮功能而實(shí)現(xiàn)藥用作用。

目前,找到這些候選類藥分子的計算過程是這樣的:最先進(jìn)的計算模型依賴于大量候選采樣、結(jié)合評分、排序和微調(diào)等方法來找到配體和蛋白質(zhì)之間的最佳“匹配模式”。以一個形象的例子來說明,典型的配體與蛋白質(zhì)結(jié)合的方法就像“將一把鑰匙插入有許多鑰匙孔的鎖”,現(xiàn)有的典型計算模型需要將鑰匙插入每一個鎖孔并對其匹配度逐一進(jìn)行評分和排序,從而才能選出最佳模型,這將花費(fèi)大量的時間。

微信圖片_20220718170723.png

▲EquiBind想要解決的問題(圖片來源:參考資料[2])


而EquiBind內(nèi)置了能夠幫助模型學(xué)習(xí)分子的基本物理信息的幾何推理算法,在遇到此前沒有見過的新數(shù)據(jù)時能夠成功地進(jìn)行歸納,作出更好的預(yù)測。也就是說,EquiBind無需事先了解鎖有哪些鎖孔,在一個步驟中就可以直接預(yù)測到精確的鎖孔位置,這被稱為”盲對接”。正是這種方法使EquiBind在成功將配體與蛋白質(zhì)結(jié)合方面比現(xiàn)存最快的計算分子對接模型“QuickVina2-W”還要快1200倍。

那么EquiBind在實(shí)際應(yīng)用中的效果是否如研究者所描述的那般神奇呢?Relay Therapeutics的首席數(shù)據(jù)官Pat Walters先生對EquiBind產(chǎn)生了極大的興趣,并建議其團(tuán)隊(duì)用這一模型模擬一種已經(jīng)用于治療肺癌、白血病和胃腸道腫瘤的藥物與靶點(diǎn)蛋白的結(jié)合。結(jié)果是,當(dāng)大多數(shù)傳統(tǒng)的對接算法沒有成功預(yù)測出這一配體/蛋白的相互結(jié)合時,EquiBind卻做到了。

Walters先生表示:“EquiBind為對接問題(包括姿勢預(yù)測和結(jié)合位點(diǎn)識別提供了一種獨(dú)特的解決方案。這種借助數(shù)千種公開可用的晶體結(jié)構(gòu)信息的方法將通過全新的方式在計算分子對接模型領(lǐng)域開拓自己的一片天地。”

該論文主要作者麻省理工學(xué)院電氣工程和計算機(jī)科學(xué)系的研究生Hannes St?rk先生也表示,已從行業(yè)專業(yè)人士中收到了大量對EquiBind的反饋,將繼續(xù)改進(jìn)模型,更好地發(fā)揮該計算模型的實(shí)際應(yīng)用。


參考資料:

[1] Artificial intelligence model finds potential drug molecules a thousand times faster. Retrieved July 12, 2022,from https://news.mit.edu/2022/ai-model-finds-potentially-life-saving-drug-molecules-thousand-times-faster-0712

[2] St?rk et al., (2022). EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction. arXiv, https://doi.org/10.48550/arXiv.2202.05146