中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
BioNet: 基于深度圖卷積的大規(guī)模異質(zhì)生物信息網(wǎng)絡(luò)關(guān)系預(yù)測(cè)模型
今天給大家介紹一篇由國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院楊希助理研究員、吳誠(chéng)堃副研究員等人2021年11月發(fā)表在Briefings in Bioinformatics上的文章《BioNet: A Large-scale and Heterogeneous Biological Network Model for Interaction Prediction with Graph Convolution》。本文針對(duì)生物醫(yī)藥實(shí)體間相互作用的預(yù)測(cè)問(wèn)題,提出了基于深度圖卷積的大規(guī)模異質(zhì)生物信息網(wǎng)絡(luò)關(guān)系預(yù)測(cè)模型BioNet。

1

研究概述


了解疾病、藥物、基因、生物通路等實(shí)體間的相互作用關(guān)系是采用智能方法進(jìn)行藥物初步篩選的關(guān)鍵。對(duì)于相互作用關(guān)系的預(yù)測(cè)問(wèn)題,一種常用的方法是對(duì)涉及多種生物醫(yī)學(xué)實(shí)體的異構(gòu)網(wǎng)絡(luò)進(jìn)行系統(tǒng)性地分析。近年來(lái),圖神經(jīng)網(wǎng)絡(luò)成為關(guān)系預(yù)測(cè)領(lǐng)域的熱門(mén)研究方向。然而,生物相互作用網(wǎng)絡(luò)固有的異構(gòu)復(fù)雜性和海量的數(shù)據(jù)提出了巨大的挑戰(zhàn)。本文旨在開(kāi)發(fā)一個(gè)數(shù)據(jù)驅(qū)動(dòng)的模型,該模型能夠從交互網(wǎng)絡(luò)中學(xué)習(xí)潛在的信息并做出較為準(zhǔn)確的預(yù)測(cè)。

作者開(kāi)發(fā)了BioNet,通過(guò)整合與化合物、基因、生物通路和疾病相關(guān)的數(shù)據(jù)集,構(gòu)建了一個(gè)大規(guī)模的異質(zhì)生物相互作用網(wǎng)絡(luò),并基于編碼器-解碼器架構(gòu)提出了一種深度圖卷積網(wǎng)絡(luò)模型。該模型利用圖卷積編碼器從子圖中學(xué)習(xí)網(wǎng)絡(luò)中節(jié)點(diǎn)的嵌入表示,并采用張量分解解碼器計(jì)算化合物-基因相互作用的概率;同時(shí),為了解決大規(guī)模圖模型訓(xùn)練的效率問(wèn)題,開(kāi)發(fā)對(duì)應(yīng)的并行策略,有效加速了模型的計(jì)算過(guò)程并提升了模型的可擴(kuò)展性。最后,利用BioNet預(yù)測(cè)與中風(fēng)和癌癥相關(guān)的化合物-基因相互作用,并通過(guò)查找文獻(xiàn)和對(duì)比相關(guān)實(shí)驗(yàn)數(shù)據(jù)的方式證明了結(jié)果的可靠性。很有意思的是,課題組利用BioNet進(jìn)行了針對(duì)新冠關(guān)鍵靶標(biāo)的智能藥物推薦,得到的結(jié)果與基于分子動(dòng)力學(xué)模擬的方法得到的結(jié)果在較大程度上可以互相印證(課題組2021年基于天河新一代超級(jí)計(jì)算機(jī)完成的“基于自由能微擾-絕對(duì)結(jié)合自由能方法的大規(guī)模新冠藥物虛擬篩選”工作入圍了2021年度的戈登貝爾新冠特別獎(jiǎng))。這也啟發(fā)我們更多地去探索HPC和AI混合驅(qū)動(dòng)的藥物篩選方法,在保證篩選命中率的同時(shí),盡可能地利用已有知識(shí)和智能算法提升整體計(jì)算效能。

2

相關(guān)方法

(1)網(wǎng)絡(luò)構(gòu)建

利用大規(guī)模生物異構(gòu)網(wǎng)絡(luò)構(gòu)建了六個(gè)二元關(guān)系子圖(CC-graph、GG-graph、CP-graph、GP-graph、CD-graph、GD-graph)和一個(gè)多元關(guān)系子圖(CG-graph)。然后,將這些子圖重新整合為三個(gè)組合圖:① CGP 圖、② CGD 圖和 ③ CGPD 圖。

表1 集成的多類(lèi)型交互圖的統(tǒng)計(jì)和數(shù)據(jù)來(lái)源

圖1  每個(gè)網(wǎng)絡(luò)中包含關(guān)系類(lèi)型

(2)預(yù)測(cè)模型

圖2  BioNet 的整體架構(gòu):

網(wǎng)絡(luò)構(gòu)建→圖表示→圖卷積編碼器→目標(biāo)節(jié)點(diǎn)嵌入→張量分解解碼器→交互預(yù)測(cè)

(3)并行優(yōu)化

圖3  跨GPU 節(jié)點(diǎn)的訓(xùn)練數(shù)據(jù)分布方案

訓(xùn)練過(guò)程中的計(jì)算量主要由連接邊的數(shù)量決定。本文將訓(xùn)練負(fù)載拆分為多個(gè)批次,從而實(shí)現(xiàn)跨多個(gè)GPU的高效并行計(jì)算。每個(gè)GPU都維護(hù)一個(gè)BioNet模型的副本。在每次傳遞中,梯度融合(Gradient All-Reduce)與梯度計(jì)算(Gradient Computation)通過(guò)并行的方式對(duì)模型參數(shù)進(jìn)行更新。每個(gè)GPU上的模型結(jié)果是相同的,因?yàn)槊總€(gè)GPU都以相同的副本開(kāi)始,并且由于梯度融合操作,所有GPU上的權(quán)重更新都是相同的。BioNet支持識(shí)別多種相互作用類(lèi)型,每種相互作用類(lèi)型都有不同數(shù)量的訓(xùn)練樣本。在將訓(xùn)練負(fù)載分?jǐn)偟讲煌珿PU時(shí),需要確保:(1) 分配給每個(gè)GPU的整體工作負(fù)載需要大致平衡;(2) 分配給每個(gè)GPU的特定關(guān)系類(lèi)型的工作負(fù)載需要均勻分布。訓(xùn)練數(shù)據(jù)的分布方案如圖3所示。代表化合物和基因之間不同類(lèi)型的關(guān)系。

3

結(jié)果和討論

BioNet在CGP、CGD和CGPD三個(gè)數(shù)據(jù)集上的所有性能指標(biāo)(包AUROC、AUPRC和AP@20)的表現(xiàn)優(yōu)于其他方法。與基于GCN的模型相比,BioNet-CGP在AUROC上比GCN-Total提高了12.5%,在AUPRC上提高了17.1%,在AP@20上提高了31.5%。這說(shuō)明使用二元關(guān)系子圖進(jìn)行預(yù)訓(xùn)練可以為節(jié)點(diǎn)嵌入學(xué)習(xí)提供有價(jià)值的信息。在訓(xùn)練過(guò)程中,BioNet與CGINet相比更均勻地訓(xùn)練每種類(lèi)型的關(guān)系,從而解決了因每種類(lèi)型的CG對(duì)數(shù)量不平衡而導(dǎo)致的一些分類(lèi)錯(cuò)誤。

評(píng)估了BioNet使用不同數(shù)量V100 GPU的并行處理性能。圖4顯示了使用不同數(shù)量的GPU訓(xùn)練BioNet-CGP、BioNet-CGD和BioNet-CGPD所花費(fèi)的時(shí)間。隨著GPU 數(shù)量的增加,時(shí)間成本顯著降低。例如,當(dāng)使用相同大小的數(shù)據(jù)集(BioNet-CGP)時(shí),BioNet并行模型單個(gè)Epoch的計(jì)算時(shí)間減少了近7個(gè)小時(shí)。16個(gè)GPU計(jì)算時(shí)的并行效率為:

圖4 不同數(shù)量GPU下的時(shí)間開(kāi)銷(xiāo)

4

應(yīng)用示例

新型冠狀病毒的刺突蛋白位于病毒表面,通過(guò)與宿主細(xì)胞的ACE2受體結(jié)合侵入并感染宿主。課題組利用BioNet預(yù)測(cè)相關(guān)的相互作用。打分靠前的相關(guān)預(yù)測(cè)可整理如圖5所示。

圖5 面向新冠關(guān)鍵靶標(biāo)的智能藥物篩選部分結(jié)果

圖5中所列結(jié)果是采用BioNet預(yù)測(cè)得到的相關(guān)藥物。其中坎地沙坦酯(Candesartan cilexetil)、雙嘧達(dá)莫(Dipyridamole)、茚地那韋(Indinavir)等已通過(guò)基于分子動(dòng)力學(xué)模擬的的虛擬篩選方法和濕實(shí)驗(yàn)得到驗(yàn)證,確認(rèn)是針對(duì) SARS-CoV-2 主蛋白酶 (Mpro)的有效抑制劑。特別是,已有臨床實(shí)驗(yàn)證明,常用的抗血栓藥物雙嘧達(dá)莫證明是治療 COVID-19 重癥患者的有效輔助藥物。

參考資料

Xi Yang, Wei Wang, Jing-Lun Ma, Yan-Long Qiu, Kai Lu, Dong-Sheng Cao, Cheng-Kun Wu, BioNet: a large-scale and heterogeneous biological network model for interaction prediction with graph convolution, Briefings in Bioinformatics, Volume 23, Issue 1, January 2022, bbab491, 

https://doi.org/10.1093/bib/bbab491

代碼

https://github.com/yangxi1016/BioNet

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
【深度學(xué)習(xí)】Graph2SMILES——用于逆合成與反應(yīng)預(yù)測(cè)的圖序列模型
幾何圖神經(jīng)網(wǎng)絡(luò)在百度生物計(jì)算平臺(tái)的應(yīng)用
復(fù)雜性科學(xué)理論框架
根據(jù)基因表達(dá)數(shù)據(jù)預(yù)測(cè)藥物作用
接受膿毒癥的復(fù)雜性
Science: 人工智能AI 成功預(yù)測(cè)蛋白質(zhì)相互作用-AlphaFold (AF)和RoseTTAFold (RF)
更多類(lèi)似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服