凌恩生物的轉(zhuǎn)錄組分析煥新升級(jí),現(xiàn)在將高級(jí)分析中的GSEA提供給所有用戶(hù),讓高級(jí)分析更加普及化。實(shí)實(shí)在在,走心贈(zèng)送——一如我凌恩生物的走心服務(wù)!
圖 GSEA結(jié)果
具體來(lái)說(shuō),GSEA檢索某一生物過(guò)程相關(guān)的基因的表達(dá)量,并用其形成基因集合。一旦基因集合確定,就可以從基因表達(dá)譜中計(jì)算這些基因FPKM值,用于尋找表達(dá)差異的關(guān)鍵基因并進(jìn)行分類(lèi)。根據(jù)基因表達(dá)的相對(duì)變化,把基因集合劃分為正調(diào)控和負(fù)調(diào)控的,最終進(jìn)行富集檢驗(yàn),比較正負(fù)調(diào)控樣本集的基因表達(dá)差異。通過(guò)計(jì)算基因在每個(gè)樣品中基因集合的富集分值,可以找出基因集合在不同樣本中的富集情況。
GSEA的輸入文件是一個(gè)基因表達(dá)量矩陣,其中的樣本分成了A和B兩組(如上圖),首先對(duì)所有基因進(jìn)行排序(fold change),用來(lái)表示基因在兩組間表達(dá)量的變化趨勢(shì)。排序之后的基因列表其頂部可以看做是上調(diào)的差異基因,其底部是下調(diào)的差異基因。
下面來(lái)看看具體的結(jié)果解讀吧
為便于結(jié)果查閱,每組 GSEA 分析均給出了一個(gè)匯總的 html 頁(yè)面(文件名:index.html)。
對(duì)于富集結(jié)果,根據(jù)上調(diào)/下調(diào)分成了兩個(gè)部分,對(duì)應(yīng)兩個(gè)分組,示例如下:
在每個(gè)組別下富集到的基因集,從總體上看,其表達(dá)量在該組中高表達(dá)。點(diǎn)擊enrichment results in html,可以看到具體的結(jié)果。
老師在這里可以在網(wǎng)頁(yè)查看富集的結(jié)果,如富集到的基因功能信息,具體示例如下
GS為基因集的名字,SIZE代表該基因集下的基因數(shù), NES代表歸一化后的Enrichment score(ES), 注意GSEA采用p value < 5%, q value < 25% 對(duì)結(jié)果進(jìn)行過(guò)濾。點(diǎn)擊GS DESC可以跳轉(zhuǎn)到每個(gè)基因集詳細(xì)結(jié)果頁(yè)面,示例如下
首先是一個(gè)匯總的結(jié)果,Upregulated in class說(shuō)明該基因集在MUT這組中高表達(dá),其他信息和之前介紹的一樣,比如具體的基因功能信息、NES值等。
除此之外,還有一個(gè)詳細(xì)的表格,示例如下
對(duì)于該基因集下的每個(gè)基因給出了詳細(xì)的統(tǒng)計(jì)信息,PROBE是詳細(xì)的基因信息,可以再次點(diǎn)擊就進(jìn)入了該基因NCBI的詳細(xì)說(shuō)明,其中CORE ENRICHMENT代表是否屬于核心基因,如果是Yes,即對(duì)該基因集的Enerchment score做出了主要貢獻(xiàn)的基因。
那常用于高分文章中的圖是什么呢,就是下面這張圖!
這個(gè)表格中的數(shù)據(jù)對(duì)應(yīng)下面這張圖
分成3個(gè)部分,重點(diǎn)為前兩部分,第一部分為基因Enrichment Score的折線(xiàn)圖,橫軸為該基因下的每個(gè)基因,縱軸為對(duì)應(yīng)的ES值, 在折線(xiàn)圖中有個(gè)峰值,該峰值就是這個(gè)基因集的Enrichemnt score,峰值之前的基因就是該基因集下的核心基因。第二部分為hit,用線(xiàn)條標(biāo)記位于該基因集下的基因。
還有一種常見(jiàn)的圖形,其Enrichment score值全部為負(fù)數(shù),對(duì)應(yīng)的在其峰值右側(cè)的基因?yàn)樵摶蚣碌暮诵幕?,并在該組中低表達(dá)。
除此之外,常見(jiàn)文章中還有一種熱圖,示例如下
這張熱圖展示的是位于該基因集下的基因在所有樣本中表達(dá)量的分布,其中每一列代表一個(gè)樣本。每一行代表一個(gè)基因,基因表達(dá)量從低到高,顏色從藍(lán)色過(guò)渡到紅色。
上面就是我們最經(jīng)典的GSEA分析內(nèi)容,通過(guò)GSEA分析,可以識(shí)別基因集在不同條件下的富集和彼此之間的顯著性,從而幫助研究者確定基因集與特定生物學(xué)過(guò)程或疾病的關(guān)聯(lián)性。GSEA經(jīng)常被應(yīng)用于基因表達(dá)譜研究、生物進(jìn)化、藥物靶點(diǎn)鑒定等領(lǐng)域。
凌恩生物永遠(yuǎn)給您提供干貨滿(mǎn)滿(mǎn)的知識(shí)和令人舒心的服務(wù),測(cè)序找凌恩,省時(shí)省心~更有多組學(xué)特價(jià)優(yōu)惠等你來(lái)呦~
聯(lián)系客服