1.home網(wǎng)址:http://www.kegg.jp/kegg/
2.關(guān)于kegg數(shù)據(jù)庫的一些統(tǒng)計(jì)情況:http://www.kegg.jp/kegg/docs/statistics.html截止2018.4.12該數(shù)據(jù)庫總共包含:525個代謝通路(Pathway maps),21,952條同源群(KEGG Orthology (KO) groups),涉及物種442真核生物、4654細(xì)菌,268古細(xì)菌和317種病毒。涉及到基因數(shù)目26,161,327條。
3.區(qū)分map00010、ko00010、hsa00010
??map:參考參考代謝通路圖(圖1),
??ko:高亮過KOs的參考代謝通路圖(圖2紫色表示)
??單屬于人的代謝通路圖以綠色標(biāo)注出(圖3綠色)
圖 1代謝通路圖map00010
圖 2高亮KO后的map00010
圖 3 人的map00010
4. 特殊的代謝通路以及備注
??(1)011與012:編碼以011或012開頭的代謝通路圖為一些整合性質(zhì)的
代謝通路圖,總共包含9個。
??(2)010:是化學(xué)結(jié)構(gòu)圖并沒有新的KO擴(kuò)展
??(3)07:與藥物結(jié)構(gòu)相關(guān)的代謝通路圖,并沒有新的KO擴(kuò)展
??(4)常規(guī)基因kegg數(shù)據(jù)庫注釋分析,就是分析ko中去除011、012、010以及07開頭的代謝通路,總共431條目。
??(5)ko與KO的區(qū)別:ko號碼是KEGG中一類參考代謝通路,而KO代表的是一類具有相似功能的基因簇。
5.在kegg數(shù)據(jù)庫收費(fèi)的情況如何實(shí)現(xiàn)對基因序列的批量注釋?
??(1)通過KEGG的API,首先你可以獲得KEGG數(shù)據(jù)庫中所有物種簡寫列表:http://rest.kegg.jp/list/organism
??(2)使用kobas軟件,與koabs數(shù)據(jù)庫做比對注釋,kobas可以選擇對應(yīng)的參考物種,如果是未知物種可以選擇ko,從kobas的輸出結(jié)果中你可以獲得你所注釋的基因與kegg數(shù)據(jù)庫中的geneID的對應(yīng)關(guān)系
??(3) 以人(hsa)為例,通過KEGG的API你可以獲得你關(guān)心物種的基因geneID所對應(yīng)的代謝通路也就是ko:http://rest.kegg.jp/link/pathway/hsa
??(4)以人(hsa)為例,通過KEGG的API你可以獲得你關(guān)心物種的基因geneID所在的同源群也就是KO號: http://rest.kegg.jp/link/ko/hsa
??(5)最后結(jié)合kobas得到的query與geneID以及kegg數(shù)據(jù)庫中得到的geneID與KO, geneID與ko之間的關(guān)系,就可以完整的到一組未知基因的kegg數(shù)據(jù)庫注釋了。
-END-
才子 撰文
TC 、一棵麥子 整理編輯
本文系歐易生物原創(chuàng)
聯(lián)系客服