作者:孟凡康
帝國理工學(xué)院在讀博士,再創(chuàng)主編
再創(chuàng)的「聊文章」是一個新的小欄目,主要是和各位讀者一起快速地了解一篇文章,我們通常會在文章中展示個人的思考。
連續(xù)定向進化系統(tǒng)的突破點是什么?
連續(xù)定向進化系統(tǒng)分為哪些種類?各自的優(yōu)劣勢又有哪些?
進化是終極的生物工程師,但復(fù)雜的基因結(jié)構(gòu)正在讓生物的進化步伐變慢。
從生物單個基因的角度來看,進化的步伐在40億年后已經(jīng)變得非常緩慢。這不僅僅是一個經(jīng)驗性的觀察,而是生物系統(tǒng)中日益復(fù)雜所帶來的基本結(jié)果:隨著生命體變得越來越復(fù)雜,即使微小的變動也可能會在復(fù)雜體系中打破更多原有的結(jié)構(gòu)。因此,基因組的突變率必須保持在低水平。
但對一個蛋白質(zhì)工程師來說,這種結(jié)果會產(chǎn)生一個大麻煩:如果編碼蛋白質(zhì)的基因必須服從基因組的低突變速度限制,在細胞內(nèi)對任何特定基因的進化將無法快速推動,復(fù)雜蛋白質(zhì)功能的開發(fā)也將受到極大的限制。
近些年,連續(xù)定向進化系統(tǒng)成為一個迅速發(fā)展且受到持續(xù)關(guān)注的研究領(lǐng)域。簡單來說,其目的是設(shè)計和應(yīng)用遺傳系統(tǒng),在細胞內(nèi)選擇性地對目標(biāo)基因(Gene of Interest,以下簡稱GOI)進行高效進化。這種系統(tǒng)可以繞過基因組的低突變速度限制,推動GOI的快速連續(xù)進化。
生物本身就是一個自動化系統(tǒng),可以在「深度」以及「規(guī)模」上超越傳統(tǒng)定向進化系統(tǒng)。
不過,成熟的體外定向進化已經(jīng)使在實驗室時間尺度上進化GOI成為可能,為什么還需要細胞內(nèi)的連續(xù)進化系統(tǒng)?
在經(jīng)典的定向進化中,研究人員對一個或多個GOI進行體外突變建庫,然后將突變庫轉(zhuǎn)化到細胞中,并對所需功能進行篩選或選擇。這個過程可以被看作是手動繞過基因組突變速度限制的過程。然而,經(jīng)典的定向進化在很大程度上放棄了自然進化的兩個關(guān)鍵性的優(yōu)勢:「規(guī)模 」和 「深度」。
「規(guī)模 」與「深度」
第一,規(guī)模(進化數(shù)量受限)。突變、轉(zhuǎn)化和選擇的人為操作具有勞動密集型的特點,同時在技術(shù)上也通常具有挑戰(zhàn)性。因此,在一次嘗試中很難實現(xiàn)進化實驗的規(guī)?;?。規(guī)模太少很容易陷入局部最優(yōu)解的困境。
第二,深度(迭代次數(shù)不足)。因為突變、轉(zhuǎn)化和選擇的人工周期可能需要幾天到幾周,所以研究人員無法在適應(yīng)性景觀上進行長距離的摸索。但諸如探究復(fù)雜的選擇和適應(yīng)性之間的關(guān)系、實現(xiàn)復(fù)雜的蛋白質(zhì)進化結(jié)果(新的酶活性,或復(fù)雜的蛋白質(zhì)-蛋白質(zhì)或蛋白質(zhì)-核酸相互作用),都需要在適應(yīng)性景觀上進行長的突變路徑摸索。
然而,同時具有「規(guī)?!购汀干疃取沟倪^程在物種的自然進化中卻是大量存在。所以,建立能在體內(nèi)實現(xiàn)GOI定向突變的遺傳系統(tǒng)的關(guān)鍵動機是將「經(jīng)典的定向進化轉(zhuǎn)變?yōu)闉樽灾骱瓦B續(xù)的過程」,從而突破傳統(tǒng)進化無法達到的「規(guī)?!购汀干疃取?。
連續(xù)定向進化系統(tǒng)分為哪些種類?
到目前為止,連續(xù)定向進化系統(tǒng)一般通過三種框架來實現(xiàn):
直接突變框架: 具有突變能力的正交DNA復(fù)制系統(tǒng)。
病毒框架
在病毒框架中,GOI被編碼在病毒的基因組上,當(dāng)病毒在宿主細胞中復(fù)制時會被誘導(dǎo)產(chǎn)生突變。GOI的表型同時會與病毒復(fù)制的能力建立關(guān)聯(lián):所以當(dāng)病毒利用宿主不斷復(fù)制迭代時,具有優(yōu)勢的突變體會逐漸在群體中富集。這便是噬菌體輔助持續(xù)進化(PACE)系統(tǒng)背后的基本策略,它是病毒框架的最成熟的例子。
噬菌體輔助持續(xù)進化(PACE)系統(tǒng)
在PACE中,GOI被編碼在M13噬菌體基因組上,噬菌體通過大腸桿菌宿主細胞繁殖。大腸桿菌本身的DNA復(fù)制系統(tǒng)通過改造,能夠快速誘導(dǎo)噬菌體變異。盡管高突變率(在每堿基10^-5到10^-4個替換)對大腸桿菌是有害的甚至是致命的,但這對該系統(tǒng)來說不是問題,因為大腸桿菌在PACE系統(tǒng)中會不斷流入和流出含有噬菌體的培養(yǎng)池,只有噬菌體群體在PACE系統(tǒng)中是持續(xù)存在的。突變只會在噬菌體基因組和GOI中不斷積累(因為噬菌體基因組較小,在GOI之外的突變積累造成的問題不會很大,當(dāng)然這是一個隱患)。
pIII蛋白是噬菌體包裝和感染的必需基因。一般來說,pIII蛋白越多,噬菌體的后代就更多。在PACE中,M13噬菌體基因組缺少gIII基因,但gIII基因存在于大腸桿菌宿主中,其gIII基因的表達與GOI的表型相關(guān)聯(lián)。只有符合選擇表型的GOI突變體才會誘導(dǎo)gIII基因的表達。組裝完成的噬菌體會裂解宿主,侵染新的宿主。而不符合預(yù)期表型的GOI突變體會造成噬菌體無法正確組裝,從而無法裂解宿主,最終隨著宿主流出PACE的培養(yǎng)池。這樣一來,最終培養(yǎng)池中存在的噬菌體都將是符合選擇表型的GOI突變體。
總體來說,「病毒框架」的優(yōu)勢在于長時間的連續(xù)或半連續(xù)的推動GOI的進化迭代,從而實現(xiàn)理想的進化「深度」。同時這種進化系統(tǒng)在擴大「規(guī)?!股弦蚕鄬θ菀?。
當(dāng)然,「病毒框架」也存在諸多限制。首先,該系統(tǒng)受限于病毒的生理限制。病毒并不是自主繁殖的媒介,必須依賴于新宿主細胞的持續(xù)供應(yīng)。這就引入了對生物反應(yīng)器的要求。在PACE中,新宿主細胞的供應(yīng)速度需要精確的外部控制,以便噬菌體和宿主可以及時分離(噬菌體的分裂速度稍大于大腸桿菌的分裂速度),防止宿主本身的突變影響進化結(jié)果。
其次,表型的篩選目前只能與病毒繁殖相關(guān)聯(lián)。盡管我們可以通過基因線路設(shè)計將多樣的GOI功能與病毒繁殖關(guān)聯(lián)起來,但超越病毒生命周期尺度的功能、涉及復(fù)雜的宿主生理學(xué)的功能、或旨在改變宿主細胞(甚至是多細胞生物體)生理學(xué)的GOI功能都不能通過PACE等「病毒框架」進行直接選擇。
表觀框架
另一個可行的方案則是在細胞內(nèi)直接進行進化。但是細胞的突變率非常低,這種低突變率(通常為每堿基10^-9到10^-10個替換)不足以在單個GOI水平上快速實現(xiàn)突變的多樣化。為了滿足進化所需要的規(guī)模和深度,我們必須設(shè)計出在細胞內(nèi)有針對性的突變系統(tǒng)來加速GOI的進化。
一個簡單的策略是將DNA突變酶與具有位點特異性的DNA結(jié)合蛋白融合。比如我們可以將DNA脫氨酶與T7 RNA聚合酶進行融合—其中T7 RNA聚合酶的作用是帶著脫氨酶在GOI的DNA上滑動,脫氨酶在此過程中會誘導(dǎo)DNA突變。同樣的原理,低保真的DNA聚合酶與Cas9的融合也可以使靶向的序列附近的DNA發(fā)生突變。
具有序列靶向性的「表觀框架」
這些涉及DNA突變酶與DNA結(jié)合蛋白融合的系統(tǒng)可以歸類為「表觀框架」。大家可以發(fā)現(xiàn),「表觀框架」中突變過程是獨立于正常的DNA復(fù)制的:GOI仍然是可以通過細胞內(nèi)的固有DNA聚合過程實現(xiàn)復(fù)制,但是在此之外,額外的一個靶向系統(tǒng)會造成目標(biāo)基因的突變,并通過固有的DNA聚合過程積累突變。
但是「表觀框架」的限制也很明顯。一個問題是當(dāng)一個GOI成為突變的目標(biāo)時,負責(zé)招募突變機器的DNA結(jié)合序列可能會被突變機器或者宿主本身破壞掉,造成進化的速度隨著時間的推移而減緩。另一個問題是目前的「表觀框架」也有明顯的脫靶活性,導(dǎo)致宿主基因組的突變率升高,可能會造成宿主通過其他方式避開選擇壓力。
直接突變框架
在體內(nèi)實現(xiàn)GOI定向突變的另一個方法是「直接突變框架」—給細胞提供一個正交的DNA復(fù)制系統(tǒng),專門用于GOI的復(fù)制?!钢苯油蛔兛蚣堋怪械恼籇NA復(fù)制系統(tǒng)通常包括一個特殊的低保真DNA聚合酶,它只復(fù)制和突變編碼GOI的特殊載體(如質(zhì)粒),推動其在細胞內(nèi)快速進化。而宿主DNA聚合酶只將復(fù)制宿主基因組,不復(fù)制特殊的基因載體,實現(xiàn)正交性。
華盛頓大學(xué)的Lawrence Loeb等人通過建立針對ColE1質(zhì)粒易出錯的DNA聚合酶I,開展了建立正交復(fù)制系統(tǒng)的早期工作。然而,由于DNA聚合酶I對基因組DNA的復(fù)制也是必不可少的,因此沒有實現(xiàn)完全的正交性。另一個例子著名的例子則是OrthoRep系統(tǒng)。研究人員發(fā)現(xiàn)在某些酵母菌株中存在自主復(fù)制的細胞質(zhì)質(zhì)粒。Liu Chang等改造了這種特殊的細胞質(zhì)質(zhì)粒,開發(fā)了負責(zé)復(fù)制這種質(zhì)粒的DNA聚合酶的低保真版本,最終設(shè)計了OrthoRep系統(tǒng)。OrthoRep系統(tǒng)的質(zhì)粒只在細胞質(zhì)中復(fù)制(突變率為每堿基10^-5個替換),與細胞核中的復(fù)制過程完成正交(突變率為每堿基10^-10個替換)。
OrthoRep系統(tǒng)
OrthoRep系統(tǒng)并非沒有局限性。首先是其突變率相對較低,需要開發(fā)更高突變率的正交DNA聚合酶進一步加快GOI的進化速度。正交DNA聚合酶的也需要改善對DNA突變的偏好性。其次是正交質(zhì)粒上的基因線路設(shè)計需要優(yōu)化,提高可進化的GOI范圍和特性。還需要將任意所需的GOI功能與細胞適應(yīng)性結(jié)合起來,滿足選擇的需求。最后是OrthoRep系統(tǒng)的可移植性需要測試,目前OrthoRep系統(tǒng)只能在酵母系統(tǒng)中實現(xiàn),能否被移植到酵母以外的生物體中,還有待觀察。
連續(xù)定向進化系統(tǒng)的啟示是什么?
細胞內(nèi)連續(xù)定向進化系統(tǒng)核心價值是其推動進化實現(xiàn)「規(guī)模」和「深度」的能力,從而擺脫進化的局部最優(yōu)解困境,也能讓我們有能力去開發(fā)更復(fù)雜的生物大分子?!敢?guī)模」和「深度」上的突破也將帶來高質(zhì)量的進化數(shù)據(jù),與機器學(xué)習(xí)的結(jié)合將有可能產(chǎn)生更大的價值。兩者的結(jié)合可能會產(chǎn)生一個良性的循環(huán),最終進一步加生我們對于蛋白質(zhì)序列與功能關(guān)系的理解。
筆者在整理文章的時候也有一些個人的思考,寫在這里,期待與讀者一起討論,即「我們還是要回歸生物本身」。此處的「回歸生物本身」有兩個含義:
第一個含義是更復(fù)雜的定向進化需要回到宿主本身。首先,進化是一個黑箱,給與更多的可能(比如細胞內(nèi)的復(fù)雜網(wǎng)絡(luò))往往能創(chuàng)造出更復(fù)雜的結(jié)果。體外的體系復(fù)雜度難以匹敵細胞內(nèi)的復(fù)雜度。簡單來說,在體外進化中,現(xiàn)階段往往集中在單個分子的層面,但是利用定向進化很難篩選出有預(yù)期性能的基因線路,對振蕩器等動態(tài)線路的篩選則要復(fù)雜得多,更不用提復(fù)雜度更高的網(wǎng)絡(luò)結(jié)構(gòu)了。 其次是合成生物學(xué)應(yīng)用場景的問題,體外或者通用底盤的進化結(jié)果不代表在宿主中或者實際環(huán)境中應(yīng)用仍能展現(xiàn)出同樣的結(jié)果,在滿足應(yīng)用場景的宿主中直接進行定向進化是一個必然趨勢,這也是OrthoRep等系統(tǒng)面臨的移植性的難題。
第二個含義是現(xiàn)階段的生物設(shè)計仍需要從自然中尋找靈感。筆者認為,在工程生物學(xué)發(fā)展的現(xiàn)階段,由于對自然生命系統(tǒng)的理解受限,往往難以設(shè)計出超越自然范圍的生物設(shè)計。前些年與中科院某位院士一起討論課題,我給這位院士講解了「非天然氨基酸」系統(tǒng)(由Peter Schultz等推動)的設(shè)計。再介紹完設(shè)計之后,這位院士提到:為什么一定要「非天然氨基酸」這個詞呢?非天然意味著自然不存在,是完全人工設(shè)計的,但是很難說其他的生物沒有使用過這種所謂的「非天然氨基酸」。事實的確如此,一些古菌就在使用「非天然氨基酸」,而現(xiàn)有「非天然氨基酸」系統(tǒng)的設(shè)計其實是對古菌中直接借鑒或者后續(xù)優(yōu)化。其他諸多的「非天然系統(tǒng)」例如人工核苷酸、鏡像酶等也在最初均借鑒于天然系統(tǒng)。本文所提到的連續(xù)定向進化系統(tǒng)更是一種借鑒自然的生物設(shè)計的典型案例。現(xiàn)階段,自然的精妙的生物設(shè)計足以讓我們繼續(xù)去挖掘和模仿,大可不必有所謂的「超越自然」以及「以前從未出現(xiàn)類似設(shè)計」的宣稱。
\ END \
REFERENCE
Rix, G. & Liu, C. C. Systems for in vivo hypermutation: a quest for scale and depth in directed evolution. Curr Opin Chem Biol 64, 20–26 (2021).
聯(lián)系客服