文章來源于微信公眾號 智藥邦(ID:PHAIMUS)
近年來,人工智能技術(shù)在各行各業(yè)的應(yīng)用逐漸受到關(guān)注,正在改變我們生活的每一個領(lǐng)域。那么,人工智能技術(shù)對藥物發(fā)現(xiàn)領(lǐng)域究竟有多大影響呢?前景如何?
為了盡可能完整的看待這一過程,我們做一些回顧。
早在2018年,科普作家Nic Flemming在Nature(IF=42.778)上發(fā)表過一篇評論文章《How artificialintelligence is changing drug discovery》,文章介紹了一些人工智能推動藥物發(fā)現(xiàn)的案例,并客觀評述了這種推動作用的價值和前景。
01 新藥開發(fā)技術(shù)的新視角
從新藥開發(fā)的成本說起。
輝瑞、賽諾菲、羅氏等制藥巨頭正在使用人工智能技術(shù)來促進藥物發(fā)現(xiàn)。
02 使用AI進行藥物發(fā)現(xiàn)的初創(chuàng)公司舉例
波士頓附近的生物技術(shù)公司Berg開發(fā)了一種模型,通過對比癌癥細(xì)胞和健康細(xì)胞的生物學(xué)數(shù)據(jù)的關(guān)鍵差異,來尋找潛在的靶點和藥物。
Berg的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Niven Narain說:“我們正在通過使用患者驅(qū)動的生物學(xué)數(shù)據(jù),來獲得更具預(yù)測性的假設(shè),而不是傳統(tǒng)的試錯法,從而顛覆了藥物發(fā)現(xiàn)范式” 。
倫敦初創(chuàng)公司BenevolentBio可以從研究論文、專利、臨床試驗和患者記錄等來源獲取數(shù)據(jù),形成基因、癥狀、疾病、蛋白質(zhì)、組織、物種和候選藥物關(guān)系的知識圖-基于云的生物體。并使用該系統(tǒng)發(fā)現(xiàn)了5個治療肌萎縮性側(cè)索硬化癥(ALS)的化合物,其中4個具有治療前景。
馬薩諸塞州的劍橋的無錫NextCODE公司使用AI對基因進行分類,幫助耶魯大學(xué)研究人員發(fā)現(xiàn)了FGF控制葡萄糖代謝的機制。
03 AI應(yīng)用于藥物發(fā)現(xiàn)的條件是否成熟
在過去的二十年中,計算機處理能力的持續(xù)快速增長,大數(shù)據(jù)集的可用性以及高級算法的發(fā)展推動了機器學(xué)習(xí)的重大改進。
目前,許多使用人工智能進行藥物發(fā)現(xiàn)的初創(chuàng)公司都使用機器學(xué)習(xí)來識別隱藏在大量數(shù)據(jù)中的模式。
04 關(guān)于未來需要做哪些準(zhǔn)備
發(fā)現(xiàn)藥物的技術(shù)不可能一直保持不變。
Narain說,博士學(xué)位和其他研究生課程的實施方式需要“發(fā)生根本性轉(zhuǎn)變”,Chittenden對此表示同意,而斯坦福大學(xué)的Russ Altman則認(rèn)為生物學(xué)的本科生需要拓展到統(tǒng)計學(xué)和計算思想,但是博士級別更需要專業(yè)的深度而不是廣度。
正在使用人工神經(jīng)網(wǎng)絡(luò)進行基于結(jié)構(gòu)的藥物設(shè)計的牛津大學(xué)的Anthony Bradley認(rèn)為,學(xué)會編碼至少在接下來的5-10年內(nèi)將是有用的,其他的工作計算機很大程度上都可以做到。
05 炒作or事實
人工智能和機器學(xué)習(xí)是否將會迎來一個更快、更便宜、更有效的藥物發(fā)現(xiàn)時代?
有些人持懷疑態(tài)度,他們認(rèn)為,計算機輔助藥物設(shè)計的計算機模擬技術(shù),并沒有阻止自1990年代中期以來制藥業(yè)R&D生產(chǎn)率的下降。
但大多數(shù)專家確實希望這些工具變得越來越重要。
目前一些關(guān)于人工智能將徹底改變藥物發(fā)現(xiàn)的預(yù)測,可能是夸大其詞了。批評者認(rèn)為,是有商業(yè)利益在起作用。并且到目前為止,還沒有獲批準(zhǔn)的基于AI開發(fā)的藥物。
Narain認(rèn)為,炒作不會持續(xù)太久,因為在未來五年左右的時間里,事實將在數(shù)據(jù)中顯現(xiàn)出來。如果到那時我們正在創(chuàng)造更好的藥物,并且更快、更便宜地生產(chǎn)它,那么人工智能將真正起飛。
以下是《How artificialintelligence is changing drug discovery》的全文翻譯,有興趣的小伙伴可以繼續(xù)閱讀。全文4800字左右,預(yù)計閱讀12分鐘。
人工智能正在如何改變藥物發(fā)現(xiàn)
Nic Fleming
機器學(xué)習(xí)和其他技術(shù)有望使藥物發(fā)現(xiàn)更快、更便宜、更有效。
Michele Marconi的插圖
一個巨大的數(shù)字籠罩在新藥發(fā)現(xiàn)科學(xué)家的心頭,那就是:開發(fā)一種新藥的價格估計為26億美元。實際上,很多錢都被浪費了,因為這個估計的價格包括了花費在十分之九的候選藥物上的費用,而這些候選藥物在I期和正式批準(zhǔn)之間的一些地方失敗了。這個領(lǐng)域很少有人懷疑做一些不同事情的必要性。
領(lǐng)先的生物制藥公司認(rèn)為解決方案即將到來。輝瑞公司正在使用IBM Watson這一機器學(xué)習(xí)的系統(tǒng)來增強其對免疫腫瘤藥物的搜索。賽諾菲已經(jīng)簽署協(xié)議,使用英國初創(chuàng)公司Exscientia的人工智能(AI)平臺來尋找代謝疾病的治療方法,羅氏子公司Genentech正在使用馬薩諸塞州劍橋市GNS Healthcare的AI系統(tǒng),以推動跨國的癌癥治療方法的尋找。大多數(shù)規(guī)模較大的生物制藥公司都有類似的合作或內(nèi)部計劃。
機器人來了-新型科學(xué)家
當(dāng)需要編寫人工智能(AI)的歷史時,執(zhí)行任務(wù)的算法很可能會把2007年6月12日標(biāo)記為值得關(guān)注的日子。那一天,一個名為亞當(dāng)(Adam)的機器人通過確定酵母基因的功能,結(jié)束了人類對科學(xué)知識發(fā)現(xiàn)的壟斷。通過搜索公共數(shù)據(jù)庫,對于催化釀酒酵母中反應(yīng)的關(guān)鍵酶,Adam產(chǎn)生了關(guān)于哪些基因編碼關(guān)鍵酶的假設(shè),并在實驗室中使用機器人技術(shù)對該預(yù)測進行了物理測試。之后,英國阿伯里斯特威斯大學(xué)和劍橋大學(xué)的研究人員獨立地檢驗了Adam關(guān)于19個基因功能的假設(shè)。其中9個是新的而且準(zhǔn)確的,只有1個是錯誤的。
“使用AI的機器人科學(xué)家可以測試更多的化合物,可以提高準(zhǔn)確性和可重復(fù)性,并且記錄保存全面、可搜索”。劍橋大學(xué)系統(tǒng)生物學(xué)家史蒂夫·奧利弗(SteveOliver)說。他是開發(fā)Adam的小組的成員。
1月,同一團隊宣布,Adam的更高級的機器人同事夏娃 (Eve),發(fā)現(xiàn)三氯生(牙膏中的一種常見成分)有潛在的治療耐藥性瘧疾寄生蟲的作用。研究人員開發(fā)了酵母菌株,其中生長必需的基因已被瘧原蟲或人類的等價基因替代。Eve隨后篩選了成千上萬種化合物,以發(fā)現(xiàn)那些能夠阻止或嚴(yán)重減慢依賴于瘧疾基因的菌株生長的化合物,而不是那些能夠阻止或嚴(yán)重減慢依賴于人類基因的菌株生長的化合物,以降低寄生蟲的危害,同時降低毒性風(fēng)險。早期結(jié)果被用來作為后期篩選候選藥物的參考。
這表明三氯生通過抑制DHFR酶來影響瘧疾寄生蟲的生長,DHFR酶也是抗瘧藥乙胺嘧啶的目標(biāo)。然而,對乙胺嘧啶的耐藥性很常見。研究人員表明,即使是在耐乙胺嘧啶的寄生蟲中,三氯生也可以作用于DHFR。
Nic Fleming
19世紀(jì)50年代的AI先鋒們討論了可以像人一樣感知、推理和思考的建筑機器-一種稱為“通用AI”的概念,這種概念很可能會在科幻小說的領(lǐng)域中保留一段時間。但是,在過去的二十年中,計算機處理能力的持續(xù)快速增長,大數(shù)據(jù)集的可用性以及高級算法的發(fā)展推動了機器學(xué)習(xí)的重大改進。這有助于實現(xiàn)專注于特定任務(wù)的“狹義AI”。其中包括借助一種被稱為自然語言處理的AI技術(shù),來提高分析、理解和生成文本和語音的能力,以及提高旨在模仿我們的大腦理解世界的人工神經(jīng)網(wǎng)絡(luò)的能力。這樣的技術(shù)已在諸如計算機視覺、語音分析和路線選擇的領(lǐng)域中被廣泛使用。這一進展也引發(fā)了一系列使用AI進行藥物發(fā)現(xiàn)的初創(chuàng)公司,其中許多公司都使用AI來識別隱藏在大量數(shù)據(jù)中的模式。
例如,馬薩諸塞州波士頓附近的生物技術(shù)公司Berg的研究人員開發(fā)了一種模型,該模型可以通過對1000多種癌癥細(xì)胞和健康人類細(xì)胞樣本進行測試來發(fā)現(xiàn)以前未知的癌癥機制。他們通過改變細(xì)胞所接觸的糖和氧氣的水平,來模擬患病的人類細(xì)胞,然后追蹤其脂質(zhì)、代謝產(chǎn)物、酶和蛋白質(zhì)的分布。該小組使用其AI平臺來生成和分析來自患者的大量生物學(xué)和結(jié)果數(shù)據(jù),以突出患病細(xì)胞與健康細(xì)胞之間的關(guān)鍵差異。
Berg方法的目的是根據(jù)疾病的精確的生物學(xué)原因,來找到潛在的治療方法。Berg的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Niven Narain說:“我們正在通過使用患者驅(qū)動的生物學(xué)數(shù)據(jù),來獲得更具預(yù)測性的假設(shè),而不是傳統(tǒng)的試錯法,從而顛覆了藥物發(fā)現(xiàn)范式” 。
使用這種方法,Narain的團隊發(fā)現(xiàn)了某些天然存在的分子在癌癥代謝中的重要性。這使該小組發(fā)現(xiàn)了一種新的癌癥藥物如何起作用,并指出了一些可能的治療用途。這個藥,BPM31510,目前正在涉及晚期胰腺癌患者身上進行II期臨床試驗。該公司還使用該AI系統(tǒng)來尋找針對其他疾?。òㄌ悄虿『团两鹕喜。┑乃幬锇袠?biāo)和療法。
倫敦的初創(chuàng)公司BenevolentBio有自己的AI平臺,可以從研究論文、專利、臨床試驗和患者記錄等來源獲取數(shù)據(jù)。這形成了基于云的生物體(例如基因、癥狀、疾病、蛋白質(zhì)、組織、物種和候選藥物)之間超過十億個已知和推斷關(guān)系的表示??梢韵袼阉饕嬉粯硬樵兯?,以生成“知識圖”。例如,醫(yī)學(xué)狀況以及與之相關(guān)的基因,或已證明會影響該基因的化合物。平臺處理的大多數(shù)數(shù)據(jù)都沒有注釋,因此它使用自然語言處理來識別實體并了解它們與其他事物的鏈接。BenevolentBio首席執(zhí)行官杰基·亨特(Jackie Hunter)說:“人工智能可以將所有這些數(shù)據(jù)放在上下文中,并為藥物發(fā)現(xiàn)科學(xué)家提供最重要的信息” 。
當(dāng)該公司要求該系統(tǒng)提出治療肌萎縮性側(cè)索硬化癥(ALS),也稱為運動神經(jīng)元疾?。∕ND)的新方法時,它指出了大約100種現(xiàn)有化合物具有這方面的潛力。從這些化合物中,BenevolentBio的科學(xué)家們選擇了5個,在英國謝菲爾德轉(zhuǎn)化神經(jīng)科學(xué)研究所的患者衍生的細(xì)胞中進行了測試。該研究于2017年12月在馬薩諸塞州波士頓舉行的ALS / MND國際研討會上進行了報道,其中4種化合物具有前途,其中一種可以延緩小鼠的神經(jīng)系統(tǒng)癥狀。
模式識別
盡管已經(jīng)有這些前景廣闊的應(yīng)用,但許多科學(xué)家仍未意識到AI的能力。加拿大多倫多一家初創(chuàng)公司BenchSci在2月發(fā)布的一項調(diào)查,該調(diào)查為科學(xué)家提供了一種機器學(xué)習(xí)工具來尋找抗體。該研究發(fā)現(xiàn),參與研究的330名藥物發(fā)現(xiàn)研究人員中,有41%不了解AI(請參閱go.nature.com/2xarpt3)。
該領(lǐng)域的領(lǐng)導(dǎo)者認(rèn)為研究人員應(yīng)該盡快掌握這些知識。
“人工智能將導(dǎo)致人們對人類生物學(xué)的全面了解,并為我們提供充分應(yīng)對人類疾病的手段”,馬薩諸塞州的劍橋的無錫NextCODE團隊的負(fù)責(zé)人Thomas Chittenden說。無錫NextCODE成立于2015年,此前中國的藥物發(fā)現(xiàn)公司W(wǎng)uXi AppTec收購了NextCODE Health,NextCode Health是從冰島公司CODE Genetics衍生而來的。他說:“我們開發(fā)藥物并在臨床試驗中進行評估的方式,一言以蔽之,都將歸結(jié)為非常復(fù)雜的模式識別” 。
2017年五月,一個包括紐黑文耶魯大學(xué)研究人員在內(nèi)的團隊,驗證了一個叫做成纖維細(xì)胞生長因子家族(FGFs)的蛋白家族在血管擴張中的角色(P. Yu et al. Nature 545,224–228; 2017)。這個過程在腫瘤生長和心血管疾病中非常重要。無錫NextCODE使用AI作為對基因進行分類的方法(這種方法根據(jù)基因的作用和其他屬性來分類)的一部分,以尋找RNA序列變異、表達(dá)水平、分子功能和基因定位之間的聯(lián)系。Chittenden的團隊使用這種方法發(fā)現(xiàn)FGF通過控制葡萄糖代謝發(fā)揮作用。
一些人認(rèn)為,AI查明以前未知的病因的潛力,將加速針對具有特定生物學(xué)特征的患者進行設(shè)計治療的趨勢。Hunter說:“個性化醫(yī)學(xué)已經(jīng)討論了很長時間,人工智能將啟用它”。
懷疑論者指出:這些觀點中一些更為熱情的主張,與1980年代初開始的計算機輔助藥物設(shè)計的興奮相呼應(yīng)。盡管這種計算機模擬技術(shù)在現(xiàn)代藥物研發(fā)(R&D)中很重要,但它們并沒有阻止自1990年代中期以來制藥業(yè)R&D生產(chǎn)率的下降。
正在移動的球門柱
無論發(fā)生什么,行業(yè)領(lǐng)導(dǎo)者都同意,發(fā)現(xiàn)藥物的工作和完成這些工作所需的技能不可能保持不變。有些人認(rèn)為需要更廣泛的培訓(xùn)。Narain說,博士學(xué)位和其他研究生課程的實施方式需要“發(fā)生根本性轉(zhuǎn)變”,這應(yīng)該擴展到醫(yī)學(xué)院和本科生的教學(xué)中。他補充說:“例如,僅專注于-并且比任何人都學(xué)得更多的-特定基因突變的學(xué)生時代已經(jīng)結(jié)束?!?Chittenden同意:“從現(xiàn)在起的十年內(nèi),博士學(xué)位的面貌將大相徑庭。學(xué)術(shù)課程將更廣泛。下一代首先需要對人類生物學(xué)的理解,但同時又需要計算機科學(xué)、計算統(tǒng)計學(xué)和統(tǒng)計機器學(xué)習(xí)” 。
另一些人則認(rèn)為,掌握基礎(chǔ)知識比將注意力從核心專業(yè)領(lǐng)域轉(zhuǎn)移出去更重要。加州斯坦福大學(xué)的生物醫(yī)學(xué)AI研究員Russ Altman說:“生物學(xué)的本科生需要朝著統(tǒng)計學(xué)和計算思想的基本能力邁進?!?“但是在博士級別,人們需要掌握深厚的技術(shù)技能。他們將獲得深度而不是廣度”。
2003年,奧特曼(Altman)與想深入研究這兩個學(xué)科的學(xué)生共同推出了生物醫(yī)學(xué)計算本科學(xué)位。今年3月,它在該機構(gòu)的生物工程系重新啟動。他說:“我認(rèn)為,在斯坦福大學(xué),我們正在盡早了解全球校園中將發(fā)生的事情” 。
關(guān)于AI將(即便是十年之后)如何影響甚至發(fā)現(xiàn)未來的療法所需的技能,幾乎沒有共識?!澳軌蚓幋a至少在接下來的5-10年內(nèi)將是有用的,但是我懷疑,除此之外,計算機將在很大程度上為我們做到這一點,”英國牛津大學(xué)的計算藥物化學(xué)家Anthony Bradley說。他說:“在實驗室中,我們可能需要一支訓(xùn)練有素的專業(yè)團隊,與自動化和AI專家一起對特定反應(yīng)區(qū)域的過程進行微調(diào)” ?!盎蛘摺保a充說,“可能是'濕’實驗室技能(進行實際化學(xué)或生物學(xué)實驗所需的技能)十年后就不再使用了”。
Bradley在牛津附近使用鉆石光源同步加速器來篩選化合物中與分子靶標(biāo)結(jié)合(即使這些分子只是微弱地結(jié)合在一起)的細(xì)小化學(xué)碎片,目的是提高它們的結(jié)合強度以產(chǎn)生新的療法。他是一個小組的成員,該小組正在使用人工神經(jīng)網(wǎng)絡(luò)(一種受我們大腦處理信息的方式啟發(fā)的訓(xùn)練算法),該研究是牛津蛋白質(zhì)信息學(xué)小組基于結(jié)構(gòu)的藥物設(shè)計項目的一部分。目的是利用關(guān)于小分子的結(jié)構(gòu)和化學(xué)活性的公開數(shù)據(jù)來訓(xùn)練他們的系統(tǒng),以識別將對蛋白質(zhì)藥物靶標(biāo)起作用的分子。
那些希望從事藥物發(fā)現(xiàn)工作的人可以做些什么來為迅速發(fā)展的環(huán)境做好準(zhǔn)備?采取措施使自己變得知情和靈活很重要,這一領(lǐng)域前沿的人士說。Bradley說:“我的培訓(xùn)為我奠定了基礎(chǔ),以便我大致了解該領(lǐng)域的位置,但是在一定程度上取決于學(xué)生自己來了解技術(shù)趨勢的發(fā)展方向。只有保持通用性,您才能充分利用可用工具的功能” 。他建議那些尋求進入藥物發(fā)現(xiàn)領(lǐng)域的人,可通過追蹤領(lǐng)先期刊以及以技術(shù)為重點的新聞來源和博客中的最新文章來跟蹤AI的發(fā)展。
Bradley說,自我驅(qū)動的學(xué)習(xí)尤為重要,因為大學(xué)能夠提供的技能(學(xué)生需要去準(zhǔn)備的、未來AI在研究中的角色相關(guān)的技能)是有限的。他說:“幾乎可以確定是,沒人能真正知道這些技能是什么”。
關(guān)于人工智能將徹底改變藥物發(fā)現(xiàn)的能力的一些更夸張的預(yù)測,可能被證明是夸大其詞了。批評者指出,有商業(yè)利益在起作用,并且到目前為止,還沒有批準(zhǔn)的AI開發(fā)的藥物。Narain認(rèn)為這項技術(shù)將推動重大進步,他同意提出夸大其詞的主張,但表示不久就可以揭露它們的實質(zhì)。他說:“炒作不會持續(xù)太久,因為在未來五年左右的時間里,事實將在數(shù)據(jù)中顯現(xiàn)出來?!?“如果到那時我們正在創(chuàng)造更好的藥物,并且更快、更便宜地生產(chǎn)它,那么人工智能將真正起飛” 。
原文全文鏈接
https://www.nature.com/articles/d41586-018-05267-x
參考文獻
1.Fleming, N.(2018). "How artificial intelligence is changing drugdiscovery."Nature 557(7707): S55-s57
(Chris編譯)
--------- End ------- --
聯(lián)系客服