lncRNA芯片分析
1. 歸一化
lncRNA芯片采用的歸一化的方法為quantile normalization。
2. 差異LncRNA的篩選
lncRNA芯片中既有lncRNA的探針又有mRNA的探針,分別做差異基因的篩選,篩選方法同表達(dá)譜的篩選方法是一致的,參見(jiàn)表達(dá)譜的差異基因篩選。
3. 差異lncRNA的重注釋
lncRNA芯片注釋不完善,因此需要將篩選出來(lái)的lncRNA進(jìn)行重注釋。將差異lncRNA在基因組上位置上下游延伸,以尋找lncRNA附近的有功能的基因。
4. 差異lncRNA靶基因的預(yù)測(cè)
lncRNA可能通過(guò)調(diào)控相應(yīng)的mRNA發(fā)揮功能,因此有必要預(yù)測(cè)lncRNA的靶基因。我們提取差異lncRNA和mRNA的序列,首先用blast進(jìn)行初篩,之后用RNAplex進(jìn)行進(jìn)一步篩選,以預(yù)測(cè)lncRNA可能調(diào)控的mRNA。
5. 差異lncRNA與靶基因共表達(dá)網(wǎng)絡(luò)
預(yù)測(cè)出lncRNA的靶基因后,并可進(jìn)一步在mRNA的數(shù)據(jù)中探尋該mRNA是否發(fā)生表達(dá)量的變化。由此構(gòu)建差異lncRNA與靶基因相互作用網(wǎng)絡(luò)圖。
6. 差異lncRNA與差異mRNA的共表達(dá)分析
SBC Human lncRNA芯片能同時(shí)檢測(cè)出差異表達(dá)的lncRNA和mRNA。我們將差異lncRNA和差異mRNA在一組樣品中進(jìn)行共表達(dá)分析,可以發(fā)現(xiàn)與某個(gè)lncRNA具有相同表達(dá)模式的mRNA。 要求:每組數(shù)據(jù)3個(gè)或3個(gè)以上生物學(xué)重復(fù)
實(shí)驗(yàn)組:
對(duì)照組:
7. 差異lncRNA靶基因的GO analysis
對(duì)lncRNA的靶基因進(jìn)行GO Ontology的生物學(xué)的分類,根據(jù)Fisher's Exact Test,得到p-value,得到lncRNA靶基因?qū)?yīng)的顯著性功能,從而了解lncRNA的功能。
8. 差異lncRNA靶基因的pathway analysis
對(duì)lncRNA靶基因按照Pathway的主要公共數(shù)據(jù)庫(kù)KEGG和Biocarta來(lái)進(jìn)行分類,對(duì)Pathway中的基因進(jìn)行基于離散分布的顯著性分析,得到與實(shí)驗(yàn)?zāi)康挠酗@著聯(lián)系的Pathway 分類,由這些pathway對(duì)應(yīng)相應(yīng)的靶基因,從而獲得該分類即導(dǎo)致lncRNA差異的最重要Pathway。
9. 差異lncRNA的轉(zhuǎn)錄因子的預(yù)測(cè)
提取lncRNA TSS的上游2000bp,下游500bp,利用HMM的算法根據(jù)TRANSFAC8.1數(shù)據(jù)庫(kù)預(yù)測(cè)其轉(zhuǎn)錄因子。
10. lncRNA cis作用機(jī)制研究:對(duì)于感興趣的差異表達(dá)lncRNAs,搜索其上下游100K范圍內(nèi)的所有編碼基因,并與該lncRNAs 有顯著共表達(dá)的基因取交集。這些在基因組上臨近、且表達(dá)模式上共表達(dá)的基因很可能被該lncRNAs 所調(diào)控。
11. lncRNA trans作用機(jī)制研究:計(jì)算LncRNAs 共表達(dá)的編碼基因,集合與轉(zhuǎn)錄因子/染色質(zhì)調(diào)控復(fù)合物的靶基因集合的交集,利用超幾何分布計(jì)算該交集的富集程度,得到與lncRNAs 顯著相關(guān)的轉(zhuǎn)錄因子,從而識(shí)別可能與lncRNAs 聯(lián)合發(fā)揮調(diào)控作用的轉(zhuǎn)錄因子/染色質(zhì)調(diào)控因子。
[綜述]長(zhǎng)鏈非編碼RNA(lncRNA)
lncRNA
長(zhǎng)鏈非編碼RNA(long noncoding RNA,lncRNA)是一類不編碼蛋白的RNA 分子,長(zhǎng)度在200bp 以上,起初被認(rèn)為是RNA 聚合酶II 轉(zhuǎn)錄的副產(chǎn)物,不具有生物學(xué)功能;近期的研究表明lncRNA 具有保守的二級(jí)結(jié)構(gòu),可以與蛋白、DNA 和RNA 相互作用,參與多種生物學(xué)過(guò)程的調(diào)控,尤其在腫瘤當(dāng)中發(fā)揮了重要的調(diào)控角色,如染色質(zhì)修飾、轉(zhuǎn)錄激活和抑制、轉(zhuǎn)錄后調(diào)解以及作為miRNA 的誘導(dǎo)分子干擾基因的表達(dá)等。隨著高通量測(cè)序技術(shù)的發(fā)展,越來(lái)越多的lncRNA 被注釋,但是絕大多數(shù)的lncRNA 的功能仍然不清楚,因此lncRNA 的研究是一片非常廣闊的未知領(lǐng)域,具有極大的研究?jī)r(jià)值和意義。
lncRNA介紹
長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA)是一類轉(zhuǎn)錄本長(zhǎng)度超過(guò)200nt、不編碼蛋白的RNA。lncRNA起初被認(rèn)為是基因組轉(zhuǎn)錄的“噪音”,不具有生物學(xué)功能。然而,近年來(lái)的研究表明lncRNA能在表觀遺傳、轉(zhuǎn)錄及轉(zhuǎn)錄后水平上調(diào)控基因表達(dá),參與了X染色體沉默、基因組印記以及染色質(zhì)修飾、轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾、核內(nèi)運(yùn)輸?shù)榷喾N重要的調(diào)控過(guò)程,與人類疾病的發(fā)生、發(fā)展和防治都有著密切聯(lián)系。
為何細(xì)胞不惜耗費(fèi)能量對(duì)這些非編碼RNA的表達(dá)和定位進(jìn)行嚴(yán)格調(diào)控呢?這些RNA分析究竟有何功能?RNA測(cè)序技術(shù)的發(fā)展使人們得以初窺這一神秘分子,現(xiàn)在lncRNA的許多相關(guān)信息都可以再新數(shù)據(jù)庫(kù)中查到,例如Broad研究所、哈佛大學(xué)和麻省理工共同開(kāi)發(fā)的Human Body Map lincRNAs catalog。雖然近年來(lái)關(guān)于lncRNA的研究進(jìn)展迅猛,但是現(xiàn)在人們了解到的lncRNA只是冰山一角,絕大部分的lncRNA的功能仍然是不清楚的。隨著研究的推進(jìn),各類lncRNA的大量發(fā)現(xiàn),lncRNA的研究作為RNA研究的新領(lǐng)域,已經(jīng)成為一個(gè)非常吸引人的方向,有待廣大科學(xué)家去探尋。
lncRNA研究當(dāng)前面臨的一個(gè)主要挑戰(zhàn)是,研究工具還在不斷開(kāi)發(fā)和改進(jìn)中,而lncRNA研究中非常關(guān)鍵的一步就是發(fā)現(xiàn)與特定疾病相關(guān)的lncRNA?,F(xiàn)階段,基因芯片技術(shù)發(fā)展趨于成熟穩(wěn)定,在此平臺(tái)上,通過(guò)設(shè)計(jì)不同檢測(cè)lncRNA探針篩選lncRNA是一種準(zhǔn)確快捷的方法。
lncRNA特征
lncRNA通常較長(zhǎng),具有mRNA樣結(jié)構(gòu),有些具有poly(A)尾巴,有些沒(méi)有poly(A)尾巴,分化過(guò)程中有動(dòng)態(tài)的表達(dá)與不同的剪接方式,與編碼基因相比,lncRNA表達(dá)量更低。
※ 組織特異性:不同組織之間的lncRNA表達(dá)量不同。
※ 時(shí)空特異性:同一組織或器官的不同生長(zhǎng)階段,其中的lncRNA表達(dá)量也會(huì)變化。
※ lncRNA啟動(dòng)子同樣可以結(jié)合轉(zhuǎn)錄因子,如Oct3/4,Nanog,CREB,Sp1,c-myc,Sox2與p53,局部染色質(zhì)組蛋白同樣具有特征性的修飾方式與結(jié)構(gòu)特征。
※ 大多數(shù)的lncRNA在組織分化發(fā)育過(guò)程中,都具有明顯的時(shí)空表達(dá)特異性,如有人針對(duì)小鼠的1300個(gè)lncRNA進(jìn)行研究,發(fā)現(xiàn)在腦組織中的不同部位,lncRNA具有不同的表達(dá)模式。
※ 在腫瘤與其他疾病中有特征性的表達(dá)方式。
※ lncRNA的亞細(xì)胞位置上也呈多樣化,在細(xì)胞核、細(xì)胞質(zhì)和細(xì)胞器均有分布,甚至某些lncRNA具有獨(dú)特的亞細(xì)胞位置,有可能是全新的亞細(xì)胞構(gòu)成。
lncRNA功能
lncRNA可從染色質(zhì)重塑、轉(zhuǎn)錄調(diào)控及轉(zhuǎn)錄后加工等多種層面實(shí)現(xiàn)對(duì)基因表達(dá)的調(diào)控:
a) lncRNA通過(guò)招募染色質(zhì)重塑復(fù)合物至特定的基因組位點(diǎn)使其發(fā)生催化活性。如HOTAIR21,Xist、RepA和Kcnqot1招募Polycomb complex至HoxD位點(diǎn),使得X染色體或Kcnq1功能域的組蛋白H3 第27位賴氨酸發(fā)生3甲基化(me3K27),誘導(dǎo)異染色質(zhì)形成,從而抑制該區(qū)域基因表達(dá)。
b) lncRNA通過(guò)多種機(jī)制進(jìn)行轉(zhuǎn)錄水平調(diào)控。lncRNA結(jié)合到基因cyclin D1上,招募RNA結(jié)合蛋白TLS來(lái)調(diào)控蛋白CBP和p300的組蛋白乙酰轉(zhuǎn)移酶活性,進(jìn)而抑制cyclin D1轉(zhuǎn)錄。
c) 超保守增強(qiáng)子轉(zhuǎn)錄出lncRNA-Evf2,該lncRNA能激活轉(zhuǎn)錄因子DLX2,進(jìn)而調(diào)控基因Dlx6轉(zhuǎn)錄。
d) DHFR次要啟動(dòng)子區(qū)域轉(zhuǎn)錄出的lncRNA與該基因主要啟動(dòng)子區(qū)域結(jié)合形成三聚體,抑制轉(zhuǎn)錄因子TFIID結(jié)合,從而使基因DHFR發(fā)生沉默。
e) 反義lncRNA能夠與剪接體(splicesome)中鋅指同源mRNA Zeb2的5'剪切位點(diǎn)結(jié)合,使內(nèi)含子未被剪切掉,而該內(nèi)含子序列中保留有內(nèi)部核糖體進(jìn)入位點(diǎn)(IRE位點(diǎn)),翻譯過(guò)程中識(shí)別并結(jié)合該位點(diǎn),導(dǎo)致Zeb2基因表達(dá)和翻譯。
lncRNA分子機(jī)制
隨著lncRNA功能逐步顯現(xiàn),其與靶點(diǎn)的作用機(jī)制成為進(jìn)一步的熱點(diǎn)。早期認(rèn)為原位調(diào)控是LncRNA作用的唯一機(jī)制,它通過(guò)招募形成染色質(zhì)修飾復(fù)合物而沉默鄰近基因轉(zhuǎn)錄,例如IGF2R反義RNA(antisense of IGF2RRNA,AIR)、XIST等。而Hox基因反義基因間RNA(Hox antisense intergenic RNA,HOTAIR)的發(fā)現(xiàn)提示LncRNA可能存在遠(yuǎn)程調(diào)控。同源異型基因(homeotic genes,HOX)在細(xì)胞增殖與定向分化中起關(guān)鍵作用,人類Hox基因簇約含100個(gè)ncRNA基因,其中HOTAIR定位于HOXC基因座12q13.13。HOTAIR的5'端可招募結(jié)合多梳蛋白抑制復(fù)合物2(polycomb repressive complex2,PRC2),借助PRC2上三個(gè)H3K27甲基化酶EZH2、SUZ12和EED,使另一基因座HOXD上長(zhǎng)約40kb的序列轉(zhuǎn)錄沉默,從而在乳腺上皮細(xì)胞內(nèi)使細(xì)胞內(nèi)轉(zhuǎn)錄傾向于胚胎成纖維細(xì)胞樣表型。超過(guò)20%的LncRNA能夠通過(guò)結(jié)合PRC2或其他類似復(fù)合物發(fā)揮作用,提示LncRNA的遠(yuǎn)程調(diào)控機(jī)制在生物體內(nèi)廣泛存在。
其作用機(jī)制如下圖所示,主要包括以下幾種情況:
1) 在編碼蛋白基因的上游啟動(dòng)子區(qū)(橘色)轉(zhuǎn)錄,從而干擾鄰近蛋白編碼基因(藍(lán)色)的表達(dá)(如酵母SER3基因);
2) 抑制RNA 聚合酶Ⅱ,或介導(dǎo)染色質(zhì)重構(gòu)和組蛋白修飾,而影響基因(藍(lán)色)表達(dá);
3) lncRNA(紫色)與編碼蛋白基因的轉(zhuǎn)錄本形成互補(bǔ)雙鏈,干擾mRNA的剪切,進(jìn)而產(chǎn)生不同的剪切形式;
4) lncRNA(紫色)與編碼蛋白基因的轉(zhuǎn)錄本形成互補(bǔ)雙鏈,在Dicer酶作用下產(chǎn)生內(nèi)源性的siRNA,調(diào)控基因的表達(dá)水平;
5) lncRNA(綠色)結(jié)合在特定蛋白質(zhì)上調(diào)節(jié)相應(yīng)蛋白的活性;
6) 作為結(jié)構(gòu)組分與蛋白質(zhì)形成核酸蛋白質(zhì)復(fù)合體;
7) 結(jié)合在特定蛋白上從而改變?cè)摰鞍椎陌|(zhì)定位;
8) 可作為小分子RNA(如miRNA)的前體分子。
聯(lián)系客服