中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
聽說你的KEGG分析有大量的基因沒注釋
github上的問題,問了兩個問題,這是其中第二個:

Meanwhile, when I fed the ENTREZID to enrichKEGG, it show me two unreasonable results:

kegg_enrich <- enrichkegg(gene="">
                         organism = 'hsa',
                         keyType = 'ncbi-geneid',
                         pvalueCutoff = 0.05,
                         #pAdjustMethod = 'BH',
                         #qvalueCutoff = 0.2,
                         use_internal_data = FALSE)

head(kegg_enrich)

             ID                           Description GeneRatio  BgRatio       pvalue   p.adjust     qvalue
hsa04380 hsa04380            Osteoclast differentiation    14/281 128/7299 0.0003817040 0.04767338 0.04508266
hsa04070 hsa04070 Phosphatidylinositol signaling system    12/281  99/7299 0.0003875885 0.04767338 0.04508266

I noted that only 281 genes are remained(there are 700+ genes in my list). In case that there is something wrong wtihin my gene list, I also tried my list with DAVID. It gave me reasonable results. So this is my second question, why enrichKEGG cannot recognize my geneids?

大概說他有700+的基因,clusterProfiler做KEGG時只認得281個,比DAVID要差。他有提供一個gene_list.txt在github上,這樣我就有可能幫他看一下。

說比DAVID差是不可能,我把他的gene list上傳到DAVID上,只認得197個,啪啪啪,DAVID的臉好疼。



比DAVID多出42%的基因注釋:

> (281-197)/197
[1] 0.4263959

那么問題回到為什么這么多基因沒有注釋,這大家得問KEGG,KEGG的通路注釋主要集中在代謝通路上,很多基因沒有注釋是事實,你可以嘗試一下用我的另一個包ReactomePA,試一下reactome pathway分析。

當然我不能只說「沒注釋就是沒注釋啊」,「我也很絕望啊」,我必須還給出事實。

clusterProfiler給出了很多的小工具,讓我們檢驗結果相當之容易,我們可以把基因映射到KEGG通路上去:

> bitr_kegg(geneID = new_ids$ENTREZID,
+ fromType='ncbi-geneid', toType='Path',
+ organism='hsa') -> xx
Warning message:
In bitr_kegg(geneID = new_ids$ENTREZID, fromType = 'ncbi-geneid',  :
 62.98% of input gene IDs are fail to map...

提示說~63%的基因是沒有KEGG注釋的,有注釋的基因我們可以通過轉換后的結果得到:

> head(xx)
 ncbi-geneid     Path
1       10023 hsa04310
2       10023 hsa05224
3       10023 hsa05225
4       10057 hsa01523
5       10057 hsa02010
6       10114 hsa04218

而沒有注釋的,也很容易通過比較而得到:

> new_ids$ENTREZ[!new_ids$ENTREZID %in%
+ xx[, 'ncbi-geneid']] %>% head
[1] '100506775' '143458'    '57649'     '54899'     '220323'    '8728'

那么有了這個結果,我們就可以去KEGG數據庫去核查了,看看clusterProfiler有沒有欺騙你。

KEGG的基因注釋可以通過類似于下面這樣的鏈接得到:

http://www.genome.jp/dbget-bin/www_bget?hsa:ENTREZID.

比如說,上面有注釋的基因10023, 通過這個頁面:
http://www.genome.jp/dbget-bin/www_bget?hsa:10023,

可以確認確實是有注釋的。

而沒有注釋的基因100506775, 通過網頁:http://www.genome.jp/dbget-bin/www_bget?hsa:100506775,

也確實可以確認是沒有KEGG注釋的。

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
使用clusterProfiler進行KEGG富集分析
如何利用clusterProfiler獲取最新的KEGG和基因對應關系
單細胞功能注釋和富集分析(GO、KEGG、GSEA)(2021公開課配套筆記)
clusterProfiler|GSEA富集分析及可視化
【技術帖】一篇帶你玩轉KEGG數據庫注釋
ID轉換不用怕(二),R大神Y叔clusterProfiler包幫你忙
更多類似文章 >>
生活服務
熱點新聞
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服