兩年前,將人工智能(AI)用于藥物研發(fā)的初創(chuàng)公司只有30家左右,而現(xiàn)在這個數(shù)目已經(jīng)飆升到了148家。這一統(tǒng)計雖然還不完全,但是它反映了AI在藥物研發(fā)中的迅猛發(fā)展。今年,美國著名的硅谷銀行(Silicon Vally Bank, SVB)第一次推出了對數(shù)字健康領(lǐng)域的投資統(tǒng)計,在今年上半年,對這一領(lǐng)域的投資已達到52.6億美元,超過了2017年全年的投資總數(shù),2019年全年投資總數(shù)有望超過100億美元!可以說,AI技術(shù)的成熟出現(xiàn)在醫(yī)藥產(chǎn)業(yè)發(fā)展的關(guān)鍵節(jié)點上,由于新藥物靶點和作用機制越來越少,醫(yī)藥公司需要更多的投入和精力才能產(chǎn)出和以前相當?shù)摹癴irst-in-class”藥物。克服這一障礙的方法包括提升研發(fā)效率,和深耕已有數(shù)據(jù)來發(fā)現(xiàn)新的洞見。AI在這兩個方面都可以大展身手。然而,業(yè)界資深人士也表示,在AI迅猛發(fā)展的同時,我們需要警醒AI的研究方向是否走偏了。對AI能力的過度炒作可能會為這一領(lǐng)域帶來“AI的冬天”。今天藥明康德內(nèi)容團隊將結(jié)合公開資料,探討AI在藥物研發(fā)中的潛力和局限。
圖片來源:Pixabay
給予足夠多的數(shù)據(jù),機器學(xué)習(xí)算法能夠從中發(fā)現(xiàn)規(guī)律,然后利用這些規(guī)律來作出預(yù)測或者對新的數(shù)據(jù)進行分類。它們在這方面的表現(xiàn)遠遠快于任何人類。當代的藥物研發(fā)團隊面對的挑戰(zhàn)是需要系統(tǒng)性地對海量數(shù)據(jù)進行分析,這些挑戰(zhàn)已經(jīng)不是可以單靠人腦來完成的工作。AI尤其擅長處理應(yīng)用復(fù)雜的規(guī)則對大量數(shù)據(jù)進行分析。麻省理工學(xué)院(MIT)計算機科學(xué)家,楊森(Janssen)公司的科學(xué)顧問Regina Barzilay博士表示:“例如,當我們在學(xué)習(xí)化學(xué)的時候,我們學(xué)習(xí)了很多規(guī)則并且理解了化學(xué)反應(yīng)的機制,然而有些時候,這些規(guī)則非常非常的復(fù)雜。如果我們能夠為計算機算法提供很多數(shù)據(jù),并且將需要解決的問題正確地呈現(xiàn)出來,它們有可能捕捉到人類無法捕捉到的規(guī)律。“以藥物毒性為例,在過去50年里,世界范圍內(nèi)有超過450款藥物在獲批上市之后因為毒副作用撤市,其中肝臟毒性是最常見的原因。例如在1993年上市的治療皮膚真菌感染的特比萘芬(terbinafine)在上市之后被發(fā)現(xiàn)可能導(dǎo)致肝臟毒性。截至2008年,已經(jīng)有3例因為肝功能衰竭而死亡的病例和70例其它肝臟毒性被證明是由于特比萘芬造成的。然而,藥物在肝臟中的代謝過程非常復(fù)雜,也非常難于預(yù)測。這是機器學(xué)習(xí)可能幫助解決的典型問題,而且我們已經(jīng)擁有了訓(xùn)練AI的數(shù)據(jù)。美國聯(lián)邦政府的Tox21項目,通過美國環(huán)保局(EPA)、國家衛(wèi)生研究院(NIH)和FDA的合作,構(gòu)建了一個包含大量分子和它們對人類關(guān)鍵性蛋白毒性的數(shù)據(jù)庫。這一數(shù)據(jù)庫可以被用來訓(xùn)練AI,發(fā)現(xiàn)化合物結(jié)構(gòu)、特征和功能與可能出現(xiàn)的毒副作用之間的關(guān)系。
名為Cloud Pharmaceuticals的生物技術(shù)公司已經(jīng)將這些數(shù)據(jù)整合到該公司的化合物篩選過程中。這家公司去年與大型藥企葛蘭素史克(GSK)達成一項研發(fā)合作協(xié)議。“使用這一數(shù)據(jù)集訓(xùn)練機器學(xué)習(xí)算法之后,當新分子出現(xiàn)時,AI能夠預(yù)測它是不是會具有毒性。”Cloud公司聯(lián)合創(chuàng)始人兼首席科學(xué)官Shahar Keinan博士說。
除了發(fā)現(xiàn)潛在毒性以外,機器學(xué)習(xí)算法還可以預(yù)測候選化合物在不同物理和化學(xué)環(huán)境下的反應(yīng),從而幫助藥物研發(fā)人員理解它們在人體不同組織中的行為。滑鐵盧大學(xué)(University of Waterloo)的物理化學(xué)家Scott Hopkins博士正在與輝瑞(Pfizer)公司合作,訓(xùn)練算法來評估候選分子吸收或者丟失水份的能力。“如果一個藥物分子非常迅速地吸收水份并且不會讓水份流失,這意味著這種藥物在水中很容易溶解,”Hopkins博士說:“它在胃中會很快溶解并且進入血液循環(huán)。”這一算法通過分析89種小分子候選藥物結(jié)構(gòu)與可溶性的關(guān)系,能夠準確預(yù)測出類似分子的關(guān)鍵性特征。這項研究已經(jīng)在Nature Communications上發(fā)表。
對藥物潛在毒性和生化特征的篩查雖然是藥物開發(fā)中不可缺少的步驟,但是對于AI研究人員來說,在藥物研發(fā)中的“圣杯”是從頭生成一個新治療性分子的結(jié)構(gòu)。藥明康德的合作伙伴Insilico Medicine公司,正在使用稱為“生成對抗網(wǎng)絡(luò)“(generative adversarial network, GAN)來開發(fā)全新的小分子化合物,治療癌癥、代謝性疾病和神經(jīng)退行性疾病等嚴重疾病。這一算法由兩個互相對抗的深度神經(jīng)網(wǎng)絡(luò)構(gòu)成。第一個深度神經(jīng)網(wǎng)絡(luò)的任務(wù)是根據(jù)一系列化合物應(yīng)該具有的功能和生化特征標準(例如溶解性、靶點,或者生物利用度),生成分子結(jié)構(gòu)。而另一個深度神經(jīng)網(wǎng)絡(luò)的作用是對第一個神經(jīng)網(wǎng)絡(luò)輸出的結(jié)構(gòu)進行“批評“。“它們之間在相互競爭,“Insilico公司首席執(zhí)行官Alexander Zhavoronkov博士說:”經(jīng)過無數(shù)次的迭代,它們能夠?qū)W會生成一些全新的結(jié)構(gòu)。“Insilico公司計劃針對多個孤兒藥靶點開發(fā)候選藥物分子。
雖然人工智能在藥物開發(fā)領(lǐng)域取得了很大的進步,但是它們還無法取代人類的作用。AI在藥物開發(fā)中的作用就像一個智能廚房。“你可以有智能微波爐、咖啡機和其它智能工具,但是它們都沒法為你做出一道晚餐,“Barzilay博士說:”你需要將這些工具整合在一起來做出一道晚餐,它們只能夠幫助你做的更快更好。“AI的表現(xiàn)受到輸入數(shù)據(jù)質(zhì)量的限制。在今年的藥明康德全球論壇上,業(yè)界的專家也表示,很多時候,用于訓(xùn)練機器學(xué)習(xí)算法的高質(zhì)量數(shù)據(jù)并不存在。而低質(zhì)量的數(shù)據(jù)可能導(dǎo)致算法從數(shù)據(jù)中獲取虛假的信號,導(dǎo)致了“垃圾進,垃圾出“的擴大化。 現(xiàn)今存在的公開數(shù)據(jù)往往由于格式、代表性等多種原因,無法成為高質(zhì)量的數(shù)據(jù)。對于有的AI藥物研發(fā)公司來說,解決這一難題的辦法是自己生成高質(zhì)量的數(shù)據(jù)。例如,insitro和Recursion公司都在根據(jù)解決特定問題的需求,生成自己的數(shù)據(jù)。而對于Gary Marcus博士來說,他的擔憂是對AI能力的過度炒作可能帶來與實際不符的期望值。而看看AI開發(fā)的歷史就可以看到,AI領(lǐng)域的開發(fā)已經(jīng)在1974-1980年,和1987-1994年,經(jīng)歷過了兩個發(fā)展的“冬天“。由于期望不能夠得到實現(xiàn),AI研究的政府和私人投資都大幅度減少。
▲Gary Marcus博士(圖片來源:Gary Marcus博士個人網(wǎng)站)
Gary Marcus博士是紐約大學(xué)心理學(xué)和神經(jīng)科學(xué)教授,也是機器學(xué)習(xí)初創(chuàng)公司Geometric Intelligence的創(chuàng)始人和首席執(zhí)行官。在他看來,深度學(xué)習(xí)(deep learning)是非常出色的算法工具,然而它相當于一種超級記憶。能夠把所有想知道的東西都記下來當然不是件壞事,但是當遇到不常見的情況時,它缺乏靈活性,表現(xiàn)并不算好。他擔心的是,我們過于依賴深度學(xué)習(xí)這一種人工智能的構(gòu)架。即便深度學(xué)習(xí)是一個完美的“錘子”,但是在醫(yī)藥領(lǐng)域需要解決的問題卻不全是“釘子”。試圖使用一種工具來解決所有問題是不恰當?shù)?,面對需要解決的問題的多樣性,我們也需要有更為靈活和細致入微的思考方式。基因泰克研發(fā)掌門人Michael Varney博士也在日前的訪談中表現(xiàn)出對人工智能過度炒作的憂慮。
雖然業(yè)界人士表示,使用人工智能在藥物研發(fā)方面的應(yīng)用存在著過度的炒作,但是他們?nèi)匀粚θ斯ぶ悄芸赡軒淼目赡苄苑浅Ed奮。無論是Marcus博士還是Varney博士,都在積極開發(fā)和使用人工智能工具,協(xié)助新藥研發(fā)的過程。“如果能夠?qū)⑺幬锇l(fā)現(xiàn)的效率提高5倍到10倍,從經(jīng)濟學(xué)角度上講,研究人員可以探索更具風險的研發(fā)項目,因為失敗的成本大大降低了。“華盛頓大學(xué)(Washington University)的S. Joshua Swamidass博士說。他帶領(lǐng)的團隊使用機器學(xué)習(xí),最終在2018年解開了特比萘芬導(dǎo)致肝臟毒性之謎。”想像一下,那樣我們可以有能力探索多少種難治疾病的創(chuàng)新療法!“
參考資料:
[1] Artificial Intelligence Shakes Up Drug Discovery. Retrieved August 24, 2019, from https://www.the-scientist.com/bio-business/artificial-intelligence-shakes-up-drug-discovery-65787
[2] AI startups are racing into drug development. Here’s 5 burning questions about which will survive. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/22/artificial-intelligence-drug-development-startups-growth/
[3] Machine learning brings cell imaging promises into focus. Retrieved August 24, 2019, from https://www.nature.com/articles/d41573-019-00144-2
[4] Bera et al., (2019). Artificial intelligence in digital pathology — new tools for diagnosis and precision oncology. Nature Reviews Clinical Oncology, https://doi.org/10.1038/s41571-019-0252-y
[5] Warning of an AI winter, a skeptic argues deep learning in medicine needs a reboot. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/21/ai-winter-deep-learning-oversold-in-medicine/