通常來講,解決前沿復(fù)雜的科學(xué)問題好像都是科學(xué)家的事,如今,F(xiàn)oldit游戲用事實(shí)告訴我們,或許,這只是科學(xué)家的一廂情愿。只要科學(xué)家能夠把科學(xué)問題用合適的方式提供給大眾,那么,來自大眾的智慧往往能夠帶來驚喜。在2019年6月5日,Nature雜志發(fā)表了題為 ”De novo protein design by citizen scientists” 的文章,報(bào)道了民眾通過Foldit游戲,成功設(shè)計(jì)出了具有全新結(jié)構(gòu)的蛋白質(zhì)的成功案例。
——背景——
從頭蛋白設(shè)計(jì)的基礎(chǔ)是蛋白質(zhì)會(huì)折疊到自由能最低的狀態(tài),因此,設(shè)計(jì)全新的蛋白結(jié)構(gòu)就是尋找結(jié)構(gòu)位于最低能量狀態(tài)的氨基酸序列。這一問題通??梢苑譃閮刹剑旱谝唬谱饕粋€(gè)可設(shè)計(jì)的蛋白質(zhì)骨架,第二,根據(jù)骨架設(shè)計(jì)蛋白序列。蛋白設(shè)計(jì)的最大挑戰(zhàn)是,蛋白質(zhì)的構(gòu)象空間十分巨大,這會(huì)導(dǎo)致骨架的設(shè)計(jì)空間非常開放,即使有了骨架,我們也無法保證所設(shè)計(jì)的序列在該骨架結(jié)構(gòu)的時(shí)候是能量最低的。巨大的構(gòu)象空間使得最先進(jìn)的計(jì)算機(jī)也無能為力,而這正好為人類的創(chuàng)造性和直覺提供了充分的發(fā)揮空間。
——模型介紹——
為了發(fā)揮大眾的創(chuàng)造力,研究者將從頭蛋白設(shè)計(jì)程序整合到了蛋白折疊游戲Foldit當(dāng)中。Foldit是為了解決蛋白質(zhì)建模問題而設(shè)計(jì)的一款免費(fèi)在線計(jì)算游戲,游戲?yàn)橥婕姨峁┝藢?duì)于一個(gè)蛋白模型三維結(jié)構(gòu)的完全控制權(quán),玩家的目標(biāo)是構(gòu)建能量最低的蛋白結(jié)構(gòu)模型。
圖1:Foldit游戲界面。Foldit設(shè)計(jì)者為玩家設(shè)計(jì)了從頭設(shè)計(jì)穩(wěn)定折疊蛋白的挑戰(zhàn),玩家的目標(biāo)是用7天的時(shí)間,從一條完全展開的多聚異亮氨酸骨架出發(fā),將這個(gè)骨架折疊成為緊密的結(jié)構(gòu)并為所得的結(jié)構(gòu)設(shè)計(jì)具體的氨基酸序列。在此過程中,研究者根據(jù)設(shè)計(jì)結(jié)果不斷改進(jìn)Foldit的功能。最開始,玩家設(shè)計(jì)的高分結(jié)構(gòu)是高度擴(kuò)展的,缺乏溶劑不可及的核,并且包含了很多極性殘基。這些問題反映了使用絕對(duì)自由能作為蛋白結(jié)構(gòu)優(yōu)化條件的限制。為了改進(jìn)設(shè)計(jì)結(jié)果,作者引入了三條額外的設(shè)計(jì)規(guī)則:1)core exists 規(guī)則:要求設(shè)計(jì)結(jié)果中溶劑不可及殘基的比例不能低于某個(gè)最小值(例如:30%);2)殘基相互作用能規(guī)則:對(duì)不能提供足夠分子內(nèi)相互作用的大側(cè)鏈殘基進(jìn)行懲罰;3)二級(jí)結(jié)構(gòu)設(shè)計(jì)規(guī)則:禁止二級(jí)結(jié)構(gòu)中出現(xiàn)甘氨酸和丙氨酸。進(jìn)一步地,為了解決設(shè)計(jì)結(jié)果中缺乏β-sheet結(jié)構(gòu)的問題,又增加了:4)二級(jí)結(jié)構(gòu)規(guī)則:規(guī)定形成α螺旋的殘基數(shù)不能超過一半;5)ideal loops規(guī)則:限制玩家只使用19種規(guī)定的反轉(zhuǎn)結(jié)構(gòu)之一。同時(shí),加入了Ramachandran map,幫助玩家設(shè)計(jì)符合拉式圖的結(jié)構(gòu)。這些改進(jìn)顯著提高了玩家設(shè)計(jì)的蛋白的質(zhì)量。
——結(jié)果分析——
Foldit程序每隔2-5分鐘會(huì)記錄一次玩家當(dāng)前的最新模型,因此,從這些歷史記錄中,管理者能夠重現(xiàn)玩家設(shè)計(jì)蛋白的過程。與Rosetta自動(dòng)設(shè)計(jì)程序相比,游戲玩家通常采用更加多樣化和更加復(fù)雜的考察策略,并且頻繁的回溯到先前的結(jié)果上進(jìn)行重新設(shè)計(jì),這使得搜索樹是高度分叉的(圖2)。另外,游戲玩家相比于自動(dòng)設(shè)計(jì)程序,能夠更有效的跳出局部最優(yōu)狀態(tài)。
圖2:玩家的設(shè)計(jì)過程(c)與Rosetta程序的設(shè)計(jì)過程(d)比較。
總體上,玩家設(shè)計(jì)成功的56個(gè)結(jié)構(gòu)具有顯著的多樣性,包含了20中不同的protein folds, 其中還包含了一個(gè)全新的fold(圖3)。作者還對(duì)其中4個(gè)設(shè)計(jì)的蛋白進(jìn)行了高分辨率結(jié)構(gòu)解析,發(fā)現(xiàn)結(jié)果與設(shè)計(jì)的構(gòu)象吻合的很好。
圖3:設(shè)計(jì)結(jié)果中的全新的Protein fold。
——小結(jié)——
Foldit游戲幫助我們更好的理解專業(yè)科學(xué)和公眾科學(xué)之間的關(guān)系。想要讓公眾通過游戲提供有效的和創(chuàng)造性的科學(xué)貢獻(xiàn),游戲本身需要能夠準(zhǔn)確的表現(xiàn)出科學(xué)問題的全貌。而在Foldit中,由于Foldit無法提供給玩家足夠準(zhǔn)確和一般化的蛋白設(shè)計(jì)模型,例如準(zhǔn)確的打分函數(shù)等,從而限制了玩家穩(wěn)定的設(shè)計(jì)新的蛋白結(jié)構(gòu)。最后且最重要的一點(diǎn),大眾研究中反映出的問題能夠幫助科學(xué)家對(duì)模型進(jìn)行系統(tǒng)性的改進(jìn)。
參考文獻(xiàn):
1. Brian Koepnick, Jeff Flatten, Tamir Husain, et al. "De Novo Protein Design by Citizen Scientists." Nature (2019)
DOI:10.1038/s41586-019-1274-4
聯(lián)系客服