在組學(xué)數(shù)據(jù)分析中,基因富集分析是最常用的方法之一,所有的基因數(shù)據(jù)分析最終都要落實(shí)到功能上去,富集分析作為一種最基礎(chǔ)的功能研究方法,通過(guò)go, kegg pathway等不同的基因功能注釋數(shù)據(jù)庫(kù),再結(jié)合對(duì)應(yīng)的富集分析算法,可以探究輸入的基因富集在哪些功能上。
富集分析的必要性和重要性不言而喻,有很多的成熟的軟件可以來(lái)進(jìn)行這樣的分析,比如clusterProfiler, GSEA等等,然而這些工具的使用還是具備一定的門檻,對(duì)于沒(méi)有編程經(jīng)驗(yàn)的生物學(xué)家而言通過(guò)這些軟件得到富集分析的結(jié)果并不是一件容易的事情。
為了方便廣大科研工作者進(jìn)行富集分析,有很多的在線工具被開發(fā)出來(lái),其操作簡(jiǎn)便,更易上手,最著名的當(dāng)屬DAVID這個(gè)網(wǎng)站了,有接近4000次的引用。然而該網(wǎng)站數(shù)據(jù)更新并不及時(shí),在現(xiàn)在看來(lái),其數(shù)據(jù)庫(kù)版本過(guò)于老舊,而且不支持一些新出的功能注釋數(shù)據(jù)庫(kù)。
webgestalt是一個(gè)專注于富集分析的在線網(wǎng)站,支持多種富集分析算法,而且涵蓋的功能注釋數(shù)據(jù)庫(kù)較為全面,在今年5月份剛剛升級(jí)了版本,對(duì)數(shù)據(jù)庫(kù)進(jìn)行了更新。對(duì)應(yīng)的文章發(fā)表在Nucleic Acids Research上,鏈接如下
https://academic.oup.com/nar/article/47/W1/W199/5494758
網(wǎng)址如下
http://www.webgestalt.org
支持12個(gè)物種,324種基因ID格式,功能注釋不僅包括了常見(jiàn)的go,kegg, 還涵蓋了蛋白質(zhì)相互作用,miRNA靶基因,疾病注釋,藥物靶點(diǎn)等各種注釋信息。支持3種富集分析算法
Overrepresentation Enrichment AnalysisORA
Gene Set Enrichment Analysis(GSEA)
Network Topology-based Analysis(NTA)
官網(wǎng)提供了3種算法的示例,通過(guò)示例數(shù)據(jù)可以快速掌握其用法,無(wú)論哪種富集算法,基本上都分以下兩個(gè)部分
基本參數(shù)指定物種,富集分析的算法,對(duì)應(yīng)的功能注釋數(shù)據(jù)庫(kù),輸入的基因列表,背景基因列表等信息,示意如下
高級(jí)參數(shù)用于對(duì)輸出結(jié)果的過(guò)濾,不同富集算法對(duì)應(yīng)的參數(shù)列表也稍有不同,ORA算法的參數(shù)示意如下
設(shè)置好對(duì)應(yīng)參數(shù),直接點(diǎn)擊submit
按鈕,提交即可。不同富集算法和數(shù)據(jù)庫(kù),結(jié)果展示也不盡相同,但是基本的表格數(shù)據(jù), 柱狀圖,GSEA的富集圖片等結(jié)果都是有的,幾種常見(jiàn)的結(jié)果示意如下
webgestalt通過(guò)鼠標(biāo)點(diǎn)擊就可以輕松實(shí)現(xiàn)各種富集分析,而且數(shù)據(jù)庫(kù)更新的也非常及時(shí),如果需要進(jìn)行富集分析,該網(wǎng)站絕對(duì)值得推薦和使用。
·end·
聯(lián)系客服