據(jù)華為云公眾號(hào)消息,9月23日,華為全聯(lián)接2021隆重開(kāi)幕,華為高級(jí)副總裁、華為云CEO、消費(fèi)者云服務(wù)總裁張平安發(fā)表「深耕數(shù)字化,一切皆服務(wù)」主題演講,并重磅發(fā)布了華為云盤古藥物分子大模型。
華為高級(jí)副總裁,華為CEO,消費(fèi)者云服務(wù)總裁張平安
一、華為為什么切入AI藥物研發(fā)領(lǐng)域?
一款創(chuàng)新藥從研發(fā)到上市,平均成本超過(guò)10億美元、研發(fā)周期大于10年——這是醫(yī)藥界公認(rèn)的「雙10定律」。
高成本的研發(fā)投入的同時(shí),可能還會(huì)面臨高失敗率和低回報(bào)率。新藥研發(fā)的投資回報(bào)率從2010 年的10.1%下降至2018 年的1.9%,新上市藥物的平均銷售峰值從2010年的8.16億美元下降至2018年的4.07億美元。
(注:造成低回報(bào)率和高成本主要原因是,一款新藥的誕生便會(huì)無(wú)形提高未來(lái)新藥研發(fā)的門檻;患者用藥的決定權(quán)在醫(yī)生非患者,所以品牌忠誠(chéng)度低)
為了解決加速新藥研發(fā)進(jìn)程、平衡研發(fā)投入與成果產(chǎn)出之間的關(guān)系,多家AI算法公司紛紛入局AI新藥研發(fā),如谷歌、英偉達(dá)等。
7月23日谷歌旗下DeepMind團(tuán)隊(duì)發(fā)布由人工智能系統(tǒng)AlphaFold預(yù)測(cè)的蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)(AlphaFold Protein Structure Database),這一數(shù)據(jù)庫(kù)將免費(fèi)提供給全球的科研人員開(kāi)放使用。
其所公布的蛋白3D結(jié)構(gòu)數(shù)據(jù)庫(kù)包含了AlphaFold人工智能系統(tǒng)預(yù)測(cè)的約35萬(wàn)個(gè)蛋白結(jié)構(gòu),其中人類蛋白質(zhì)組方面,AI對(duì)98.5%的人類蛋白的結(jié)構(gòu)做出了預(yù)測(cè)。此前,科學(xué)家們歷經(jīng)數(shù)十年努力,解析的蛋白結(jié)構(gòu)只覆蓋了人類蛋白序列中17%的氨基酸。
研究人員指出,AlphaFold能夠?qū)θ祟惖鞍踪|(zhì)組中58%的氨基酸的結(jié)構(gòu)位置做出可信預(yù)測(cè),對(duì)36%的氨基酸的結(jié)構(gòu)預(yù)測(cè)達(dá)到很高置信度。
數(shù)據(jù)來(lái)源:nature,美國(guó)華裔教授專家網(wǎng)
二、華為云盤古藥物分子大模型,開(kāi)啟AI藥物研發(fā)新模式
當(dāng)被美國(guó)制裁之后,華為為了活下去,不斷從多維度切入多場(chǎng)景生態(tài)。AI新藥研發(fā)是華為云的生態(tài)布局之一,同時(shí)也在追趕谷歌最新的Alphafold。
華為云深度聯(lián)合中國(guó)科學(xué)院上海藥物研究所,共同訓(xùn)練了華為云盤古藥物分子大模型,賦能全流程的AI藥物設(shè)計(jì)。華為云EIHealth平臺(tái),盤古藥物分子大模型學(xué)習(xí)了17億個(gè)藥物分子的化學(xué)結(jié)構(gòu),其結(jié)構(gòu)新穎性為99.68%。
其中,「神農(nóng)項(xiàng)目」屬于免費(fèi)公開(kāi)的新冠藥物虛擬篩選數(shù)據(jù)庫(kù)(類似谷歌alphafold開(kāi)放人類蛋白質(zhì)預(yù)測(cè));
藥物虛擬篩選,是指計(jì)算機(jī)輔助藥物虛擬篩選是新藥早期研發(fā)的重要環(huán)節(jié),可根據(jù)靶點(diǎn)蛋白和小分子藥物的3D結(jié)構(gòu),從成千上百萬(wàn)的小分子庫(kù)中快速篩選出與蛋白結(jié)合最緊密的候選藥物。
在藥物生成方面,實(shí)現(xiàn)了對(duì)小分子化合物的獨(dú)特信息的深度表征、對(duì)靶點(diǎn)蛋白質(zhì)的計(jì)算與匹配,以及對(duì)新分子生化屬性的預(yù)測(cè),從而高效生成藥物新分子;在藥物優(yōu)化方面,實(shí)現(xiàn)了對(duì)篩選后的先導(dǎo)藥進(jìn)行定向優(yōu)化。
華為云盤古藥物分子大模型四大技術(shù)和創(chuàng)新能力:
1)提出了針對(duì)化合物表征學(xué)習(xí)的全新深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)。華為云盤古藥物分子大模型首次采用「圖-序列不對(duì)稱條件變分自編碼器」架構(gòu),可以自動(dòng)找出化合物關(guān)鍵的分子特征指紋,極大地提升了下游任務(wù)的準(zhǔn)確性。
2)進(jìn)行了超大規(guī)?;衔锉碚髂P陀?xùn)練。華為云盤古藥物分子大模型對(duì)市面上真實(shí)存在的17億個(gè)藥物分子的化學(xué)結(jié)構(gòu)進(jìn)行預(yù)訓(xùn)練,在化學(xué)無(wú)監(jiān)督學(xué)習(xí)模式下,實(shí)現(xiàn)結(jié)構(gòu)重構(gòu)率、合法性、唯一性等指標(biāo)全面優(yōu)于現(xiàn)有方法。
3)生成了擁有1億個(gè)新化合物的數(shù)據(jù)庫(kù)。華為云盤古藥物分子大模型的分子生成器生成了1億個(gè)創(chuàng)新的類藥物小分子篩選庫(kù),其結(jié)構(gòu)新穎性為99.68%
4)在20余項(xiàng)藥物發(fā)現(xiàn)任務(wù)上實(shí)現(xiàn)性能最優(yōu)(SOTA)。
根據(jù)華為一貫的作風(fēng),華為不造車,同樣華為也不制藥,但華為將和藥企和CXO企業(yè)合作:
1)2016年3月16日,上海藥明康德新藥開(kāi)發(fā)有限公司與華為公司與在深圳簽署精準(zhǔn)醫(yī)療云戰(zhàn)略合作協(xié)議。
2)華為云聯(lián)合西安交通大學(xué)第一附屬醫(yī)院,基于華為云盤古藥物分子大模型研發(fā)出全新的廣譜抗菌藥物,將先導(dǎo)藥的研發(fā)周期從數(shù)年縮短至一個(gè)月,大幅提升新藥研發(fā)效率。
結(jié)語(yǔ):從研發(fā)難度來(lái)說(shuō),谷歌的alphafold整體難度遠(yuǎn)大于華為云EIHealth平臺(tái),alphafold專注于人類蛋白質(zhì)的氨基酸,而華為云EIHealth是專注于小分子藥物研發(fā)。從競(jìng)爭(zhēng)角度來(lái)說(shuō),華為云與制藥企業(yè)并非競(jìng)爭(zhēng)關(guān)系,而是合作關(guān)系。華為有望將先導(dǎo)藥的研發(fā)周期從數(shù)年縮短至一個(gè)月,大幅提升新藥研發(fā)效率。
來(lái)源:富途牛牛
聯(lián)系客服