中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
RNA好累:可……
近些年來(lái),某些之前被認(rèn)為不能編碼蛋白質(zhì)的RNA被證實(shí)具備編碼能力,其編碼產(chǎn)生的微肽的功能也不容小覷。究竟是哪些原因?qū)е逻@些編碼RNA被錯(cuò)誤歸類?哪些技術(shù)發(fā)現(xiàn)了“冒牌”非編碼RNA?重回人們視野的它們行使著何種生物學(xué)功能?本文綜合了最近幾項(xiàng)研究,講述研究者們?nèi)绾卧诜蔷幋aRNA的研究領(lǐng)地里淘金一般搜尋隱匿的編碼RNA。
編譯

李娟


細(xì)胞核內(nèi)的DNA轉(zhuǎn)錄生成各類RNA,其中mRNA(messenger RNA, 信使RNA)翻譯生成蛋白質(zhì),ncRNA(noncoding RNA,非編碼RNA)不具備編碼能力,不能被翻譯成蛋白質(zhì)。(圖片來(lái)源:網(wǎng)絡(luò))

2002年,德國(guó)科隆的研究人員發(fā)現(xiàn)了某一非編碼 RNA 實(shí)際上是能編碼的信使 RNA(mRNA)。這條 RNA679個(gè)核苷酸,因其長(zhǎng)度超過(guò)200個(gè)核苷酸,之前被列為長(zhǎng)非編碼RNA(lncRNA)。轉(zhuǎn)錄該 RNA 的基因是 early nodulin 40(ENOD40),它的兩個(gè)開放閱讀框(ORFs,Open Reading Frames)能夠分別編碼12和24個(gè)氨基酸的微肽。豆類植物樣本的研究證實(shí)了這些微肽在植物中確實(shí)存在,并且與蔗糖合成酶有互作關(guān)系。


mRNA(messenger RNA, 信使 RNA)翻譯成蛋白質(zhì)的過(guò)程簡(jiǎn)圖。如今已發(fā)現(xiàn)某些被列為非編碼 RNA 的序列內(nèi)也含有開放閱讀框,也具備編碼翻譯成蛋白質(zhì)的功能。(圖片來(lái)源:Cell)

五年后,日本的研究人員在果蠅中發(fā)現(xiàn)了另一個(gè)含 ORF、“冒充” lncRNA 的 mRNA。在這項(xiàng)研究中,研究人員通過(guò)抑制每個(gè) lncRNAs 的轉(zhuǎn)錄本表達(dá)來(lái)分析其在果蠅胚胎中的功能。其中只有一個(gè)表現(xiàn)出明顯的表型,缺失這種 lncRNA 的果蠅胚胎缺少特定的角質(zhì)層特征,這使得它們產(chǎn)生了如稻谷粒樣的光滑外觀,因而該 RNA 被命名為“polished rice”(pri)。pri 基因能編碼四種微肽,其中三種含11個(gè)氨基酸,一種含32個(gè)氨基酸,它們對(duì)激活發(fā)育相關(guān)的某一關(guān)鍵轉(zhuǎn)錄因子至關(guān)重要。

此后,又有一些 lncRNAs 加入到 mRNA 的隊(duì)伍中,它們的長(zhǎng)度短于300個(gè)核苷酸,且含有編碼微肽的較短開放閱讀框(short ORFs, sORFs)。數(shù)據(jù)庫(kù)里已有記錄的 lncRNAs 數(shù)目眾多,其中大部分的功能都未知,有很高的機(jī)率發(fā)現(xiàn)其他具備微肽編碼功能的 RNA。搜尋這些微小寶藏的工作已經(jīng)開始,但卻極富有挑戰(zhàn)性,畢竟它們之前被忽略了這么久也是有原因的。

被忽略的開放閱讀框

90年代末到21世紀(jì),隨著不同物種基因組測(cè)序的陸續(xù)完成及相關(guān)數(shù)據(jù)庫(kù)的完善,新基因及相關(guān) mRNA 的搜尋工作也隨之展開。研究人員用計(jì)算機(jī)輔助的快捷方法對(duì)數(shù)百萬(wàn)甚至上億的核苷酸進(jìn)行分析,以便明確基因和 mRNA 的序列特征,例如啟動(dòng)子區(qū)、外顯子/內(nèi)含子的剪接位點(diǎn)、開放閱讀框等。

位于起始密碼子和終止密碼子之間能最終編碼蛋白質(zhì)的基因序列即開放閱讀框。(圖片來(lái)源:BRYAN SATALINO)

ORF 可存在于幾乎任何 RNA 序列中,但許多并不編碼實(shí)際的蛋白質(zhì)。由于 ORF 編碼蛋白質(zhì)的機(jī)率隨其長(zhǎng)度增加而增加,因此之前大部分搜尋 ORF 的算法限于300個(gè)核苷酸以上,即至少翻譯100個(gè)氨基酸。這使研究人員能夠過(guò)濾掉那些隨機(jī)存在毫無(wú)意義的 ORF。然而,由于這些算法排除了長(zhǎng)度小于300個(gè)核苷酸的開放閱讀框,不可避免地遺漏了微肽編碼序列,它們作為“算法產(chǎn)生的垃圾”被篩除在外而慘遭遺忘。

除了算法規(guī)則和人為疏忽,還有其他技術(shù)原因?qū)е逻@種情況。比如,利用電泳分離不同大小的肽段往往意味著會(huì)丟失微肽。因?yàn)榕艿鞍踪|(zhì)凝膠電泳時(shí),微肽很容易從凝膠底部跑出去。蛋白質(zhì)質(zhì)譜技術(shù)對(duì)微肽的確定也存在問題,因?yàn)橘|(zhì)譜實(shí)驗(yàn)步驟中有一步是洗脫,只有較大的蛋白質(zhì)被保留了下來(lái)用做后續(xù)分析。

比起序列更長(zhǎng)的 ORF,小鼠、果蠅和魚等模式動(dòng)物器官中較短的 ORF在隨機(jī)突變的篩選中很難被發(fā)現(xiàn),意味著對(duì)它們功能的揭示也更困難。另外,許多重要蛋白質(zhì)是基于不同物種間的保守性來(lái)確定的,ORF 越短就越難被發(fā)現(xiàn),與其他物種基因組進(jìn)行比對(duì)、分析其是否保守也會(huì)越困難。

不過(guò),隨著對(duì)基因組中更多 lncRNAs 功能分析的進(jìn)行,編碼微肽的 IncRNA 不斷地被發(fā)現(xiàn)。例如,2014年2月,哈佛大學(xué)的研究人員在斑馬魚中發(fā)現(xiàn)了一個(gè) lncRNA,其編碼的微肽有58個(gè)氨基酸,它是斑馬魚胚胎早期發(fā)育相關(guān)的細(xì)胞移動(dòng)所必需的一類信號(hào)蛋白。另一項(xiàng)研究在小鼠胚胎心臟和骨骼肌里發(fā)現(xiàn)了多個(gè)候選目標(biāo),其中有一個(gè)序列高度保守的 IncRNAs,在其序列保守區(qū)既有起始密碼子又有終止密碼子,能編碼46個(gè)氨基酸。研究者稱之為 myoregulin,它是參與調(diào)控肌肉緊張度的一個(gè)重要的鈣泵調(diào)節(jié)器。

諸如此類多年來(lái)躲在雷達(dá)下的微肽就像金礦一樣存在著,等待我們積極地去挖掘。

尋找隱藏的小肽

研究者們開展了大量的 RNA 測(cè)序去識(shí)別 sORFs,并用質(zhì)譜尋找可能的肽段。但是這項(xiàng)技術(shù)每次只能分析少量的 sORFs。直到2009年,一種叫做核糖體圖譜分析(ribosome profiling)的新方法被開發(fā)出來(lái),結(jié)合核糖體相關(guān) RNA 的深度測(cè)序技術(shù),能夠快速地在全基因組水平對(duì)不同大小的開放閱讀框進(jìn)行大規(guī)模分析。

這項(xiàng)技術(shù)是由核糖體足跡分析(ribosome footprints)方法發(fā)展而來(lái),該方法是明確與蛋白質(zhì)翻譯機(jī)器相關(guān)的 RNA 的最直接的方法。在核糖體足跡分析中,研究人員首先將核糖體相關(guān) RNA 分離出來(lái),用核酸酶消化掉不被核糖體保護(hù)的 RNA,分離回收被核糖體保護(hù)的 RNA,然后對(duì)這部分 RNA 短片段測(cè)序并進(jìn)行后續(xù)分析。由于非編碼 RNA 有時(shí)也會(huì)與核糖體有關(guān)聯(lián),該方法仍需要質(zhì)譜技術(shù)驗(yàn)證所得 RNA 產(chǎn)生的蛋白質(zhì)在細(xì)胞中是否存在。

用于搜尋與蛋白質(zhì)翻譯有關(guān)的編碼 RNA 的核糖體足跡分析方法。(圖片來(lái)源:BRYAN SATALINO)

之前的核糖體足跡分析方法只能分析單個(gè)特定的轉(zhuǎn)錄翻譯信息,無(wú)法用于檢測(cè)細(xì)胞內(nèi)發(fā)生的所有事件。當(dāng)新一代測(cè)序技術(shù)出現(xiàn)之后,才得以一次性讀取成百上千的“足跡”,由核糖體足跡分析技術(shù)改進(jìn)成的核糖體圖譜分析技術(shù),能最大程度地獲得整個(gè)轉(zhuǎn)錄組的翻譯信息。

Ingolia 等人設(shè)計(jì)的核糖體圖譜分析技術(shù)的主要步驟。圖片來(lái)源:WIREs RNA

2011年,Ingolia 等人報(bào)道了小鼠胚胎干細(xì)胞基因組中,非編碼區(qū)轉(zhuǎn)錄出的大多數(shù) lncRNAs 實(shí)際上與核糖體有關(guān)聯(lián)。這篇論文是一個(gè)里程碑,它證明了編碼區(qū)以外也存在很多蛋白質(zhì)翻譯事件。

編碼微肽的 sORFs 相關(guān)轉(zhuǎn)錄組的確存在。除此之外,他們還發(fā)現(xiàn)細(xì)胞核內(nèi)某些有明確功能的 lncRNAs 也與核糖體有關(guān)聯(lián)。例如,端粒酶 RNA 作為經(jīng)典 lncRNA,其實(shí)是端粒 DNA 復(fù)制的模板;參與 RNA 剪接的小核 RNA,在核糖體圖譜分析中顯示出了高度的翻譯特性。需要注意的是,占用核糖體(ribosome occupancy)的 RNA 并不表示就一定真正的翻譯成蛋白質(zhì)。


單從核糖體占用來(lái)看,并不足以區(qū)分轉(zhuǎn)錄本為編碼 RNA 還是非編碼 RNA。(圖片來(lái)源:Cell)

與核糖體關(guān)聯(lián)的某些 RNA 可能僅僅參與翻譯調(diào)控,與核糖體也可能只是隨機(jī)互作,這種互作關(guān)系甚至?xí)a(chǎn)生微小的非功能肽,或因其不穩(wěn)定而被迅速降解。為了辨別核糖體圖譜分析得到的真正翻譯事件,核糖體釋放分?jǐn)?shù)(ribosome release score)作為度量標(biāo)準(zhǔn)被提出來(lái),該標(biāo)準(zhǔn)基于核糖體結(jié)合的 RNA 片段在全長(zhǎng) mRNA 分子上的分布狀態(tài)。當(dāng)核糖體沿著 ORF 翻譯至終止密碼子時(shí),核糖體與轉(zhuǎn)錄本的關(guān)系也隨之終止,它們會(huì)從 mRNA 上釋放下來(lái)。翻譯成蛋白質(zhì)的 RNA 編碼區(qū)相比下游非翻譯區(qū),應(yīng)顯示出更大比例的核糖體足跡片段,意味著終止密碼子之后的 RNA 片段與核糖體的關(guān)聯(lián)在核糖體圖譜中會(huì)有顯著下降,而對(duì)于經(jīng)典的非編碼 RNA 則不是這樣。


核糖體釋放分?jǐn)?shù)簡(jiǎn)圖。(圖片來(lái)源:Guttman lab)

核糖體釋放分?jǐn)?shù)評(píng)估了與核糖體結(jié)合的RNA片段沿整個(gè) RNA 分子的分布情況。真正編碼的 RNA 的 ORF 應(yīng)該比終止密碼子后的序列有更大比例的核糖體關(guān)聯(lián)區(qū)域。(圖片來(lái)源:BRYAN SATALINO)

使用了該標(biāo)準(zhǔn)的一項(xiàng)研究發(fā)現(xiàn),絕大多數(shù)基因間的 lncRNAs 確實(shí)是不編碼的,但有5%左右的 lncRNAs 的核糖體釋放分?jǐn)?shù)與編碼蛋白的轉(zhuǎn)錄本類似。對(duì)于數(shù)以萬(wàn)計(jì)的 lncRNAs 來(lái)說(shuō),5%是一個(gè)龐大的數(shù)字,暗示著可能會(huì)有數(shù)量龐大的微肽存在。

為了證實(shí) sORF 的翻譯事件并明確其產(chǎn)生的微肽,基于核糖體足跡圖譜、序列保守性、同義突變頻率及其他特征的研究,研究者們研發(fā)出了新的度量標(biāo)準(zhǔn)和算法(比如:Fragment Length Organization Similarity Score (FLOSS),Phylogenetic Conservation Score of a sORF (PhyloCSF))。2015年11月研究者們建立了名為 sORFs.org 的 sORF 數(shù)據(jù)庫(kù),用于積累和搜集有關(guān) sORFs 及其翻譯能力的數(shù)據(jù)。

現(xiàn)在,數(shù)據(jù)庫(kù)里有小鼠、果蠅和人類核糖體圖譜分析研究所確定的全部 sORFs,目前存有高達(dá)266342個(gè) sORFs,但各類篩選指標(biāo)能將這個(gè)龐大的列表進(jìn)一步縮小。經(jīng)過(guò)嚴(yán)格篩選,來(lái)自人類的數(shù)據(jù)列表已降至約400個(gè)強(qiáng)候選 sORFs。同時(shí),研究者們系統(tǒng)地開展了蛋白質(zhì)質(zhì)譜實(shí)驗(yàn),用以明確算法得到的微肽是否真的在細(xì)胞中存在。

一旦確定了某個(gè)新的微肽,就要用分子生物學(xué)實(shí)驗(yàn)探索其功能。這個(gè)過(guò)程進(jìn)展較慢。不過(guò)研究者們已經(jīng)明確了幾個(gè)新的微肽的功能。2016年1月,研究者報(bào)道了一個(gè) lncRNA 編碼的被稱作 dwarf open reading frame(DWORF)的微肽,它是含有34個(gè)氨基酸的肌肉特異性微肽,在小鼠心臟中大量表達(dá),能夠調(diào)節(jié)肌肉收縮,但在缺血人體心臟組織中的表達(dá)被抑制,提示可能與心臟衰竭有關(guān)。另一項(xiàng)新發(fā)現(xiàn)是一類感染人類巨細(xì)胞的病毒 lncRNA編碼的微肽,它能在以前感染過(guò)的患者中引起T細(xì)胞免疫應(yīng)答,提示這類微肽很可能具有免疫原性,也說(shuō)明了微肽在某些疾病發(fā)生過(guò)程中的重要性。

隨著研究人員對(duì)基因組小片段進(jìn)行更仔細(xì)地梳理,更多微肽的生物學(xué)功能將會(huì)被發(fā)現(xiàn)。如你所見,它們可能因短小的序列而被忽視,其 sORFs 也可能被埋在統(tǒng)計(jì)學(xué)噪聲里,而翻譯微肽的 RNA 也可能被錯(cuò)誤歸類,但這都并不妨礙它們扮演重要角色,行使著舉足輕重的基本生物學(xué)功能。

參考文獻(xiàn)

1. Ruth Williams, Noncoding RNAs Not So Noncoding.  http://www.the-scientist.com/?articles.view/articleNo/46150/title/Noncoding-RNAs-Not-So-Noncoding/

2. Ruth Williams, Finding Mislabeled Noncoding RNAs. http://www.the-scientist.com/?articles.view/articleNo/46203/title/Finding-Mislabeled-Noncoding-RNAs/

3. M. Guttman et al., Ribosome profiling provides evidence that large noncoding RNAs do not encode proteins. Cell, 154:240-51, 2013.

4. Audrey M. Michel and Pavel V. Baranov. Ribosome pro?ling: a Hi-Def monitor for protein synthesis at the genome-wide scale. WIREs RNA, 4:473–490, 2013.

5. E. N. Olson et al., A peptide encoded by a transcript annotated as long noncoding RNA enhances SERCA activity in muscle. Science, 351 (6270): 271, 2016.


本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
第一章 基因的結(jié)構(gòu)與功能 自測(cè)題
高考生物:200道基礎(chǔ)測(cè)試,掃清你的知識(shí)死角7
漫談mRNA疫苗(一):基本結(jié)構(gòu)
基因的表達(dá)上課
RNA的類型有哪些(7 種具有結(jié)構(gòu)和功能的 RNA)
非編碼RNA真的不編碼嗎?9張圖告訴你答案
更多類似文章 >>
生活服務(wù)
熱點(diǎn)新聞
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服