宏組學(xué)(Meta-Omics)是涵蓋宏基因組學(xué)、宏轉(zhuǎn)錄組學(xué)和宏蛋白質(zhì)組學(xué)的一門學(xué)科。其中宏基因組研究可以獲知環(huán)境中微生物的物種組成,目前已經(jīng)開展的如火如荼;宏蛋白組描述環(huán)境中微生物的蛋白表達(dá),由于其研究的復(fù)雜性,目前還處于起步階段,但蛋白水平的研究可以進(jìn)行微生物群落的一致性、活性和功能分析,能夠提供宏基因組無法獲取的信息。宏蛋白質(zhì)組也是今天我們要聊的故事的“主角”。
宏蛋白質(zhì)組(Metaproteomics):是指特定時(shí)刻下,環(huán)境微生物所表達(dá)的所有蛋白(Phillp L. Bond, 2004)。所研究種類非常多樣化,比如活性淤泥中的微生物,海洋微生物,土壤中的微生物,發(fā)酵食品中的微生物,腸道微生物,糞便、黏膜腔等。
宏蛋白質(zhì)組研究對象特性:
1. 成分復(fù)雜,干擾物多
2. 微生物種類繁多
3. 受外界環(huán)境因素影響大(季節(jié)、溫度、濕度等)
4. 空間位置復(fù)雜性
5. 存在其他生物:動植物
目前,宏蛋白質(zhì)組研究存在什么難點(diǎn)呢?
宏蛋白質(zhì)組研究存在的難點(diǎn)主要包括三個(gè)方面:樣品制備、質(zhì)譜檢測、數(shù)據(jù)搜索
樣品制備
1.微生物組組成復(fù)雜、體系含有大量雜質(zhì),蛋白質(zhì)提取需要針對性優(yōu)化
2. 同一樣品中的微生物組性質(zhì)不同,需要不同的提取和裂解方案 (革蘭氏陰性菌/陽性菌)
3. 外源性動物植物、人源蛋白、儲存過程中其他來源的微生物污染
4.從復(fù)雜樣品中提取蛋白的難度較高,極容易大量損失蛋白或提取失敗
5.蛋白豐度跨度大,需要一套復(fù)雜有效的分離分析實(shí)驗(yàn)策略
質(zhì)譜檢測
微生物組包含微生物種類繁多,蛋白豐度跨度大
對質(zhì)譜的掃描速度、分辨率、質(zhì)量精度要求高
一些常用的定量蛋白組技術(shù)并不兼容
數(shù)據(jù)搜索
1. 缺乏微生物組蛋白數(shù)據(jù)庫
2.樣品中的許多微生物至今未被鑒定,所以不管是依賴metaproteomics 數(shù)據(jù)庫還是公共數(shù)據(jù)庫,都是不完整的
3.構(gòu)建的數(shù)據(jù)庫過大,會增加錯(cuò)誤率
4.為了達(dá)到較高的蛋白鑒定率,同時(shí)會獲取海量的譜圖及使用巨大的數(shù)據(jù)庫,導(dǎo)致數(shù)據(jù)分析時(shí)間漫長
5.由于微生物種群間的序列相似度較高,目前沒有可能將肽段準(zhǔn)確的歸屬到完全特定的物種
定量時(shí),由于以上問題的存在,導(dǎo)致定量結(jié)果的整合更加困難。
如何進(jìn)行宏蛋白質(zhì)組數(shù)據(jù)分析?
宏蛋白質(zhì)組分析最重要也是最難的一步是數(shù)據(jù)庫的構(gòu)建:
宏蛋白質(zhì)組分析的基礎(chǔ)來自于宏基因組測序的精確結(jié)果,其數(shù)據(jù)庫來源主要通過兩種手段 :通過16s測序得到大體物種組成后在公共數(shù)據(jù)庫中提取相應(yīng)物種序列數(shù)據(jù)庫進(jìn)行整合;或者通過全基因組/轉(zhuǎn)錄組測序等手段深度測序樣品中的DNA/轉(zhuǎn)錄組信息。
由于任一種建庫方法都無法做到有效全覆蓋,很多研究采用了多種來源數(shù)據(jù)庫整合建庫。
大體包括1. 宏基因組測序;2.nr、ensembl或uniprot的微生物全庫;3. 引用其他發(fā)表的文獻(xiàn)中收集的數(shù)據(jù)庫;
如何構(gòu)建數(shù)據(jù)庫?
1.通過Metagenomics數(shù)據(jù)建庫
目前測序的價(jià)格已經(jīng)非常低廉,因此直接進(jìn)行宏基因組測序的方法已經(jīng)實(shí)用,在測序完成后將得到的數(shù)據(jù)庫翻譯成蛋白序列用于宏蛋白質(zhì)組分析。但由于測序深度和讀長的限制,還無法非常全面準(zhǔn)確的覆蓋完整的宏蛋白質(zhì)組序列,需要其他方法作為補(bǔ)充。
2.公共數(shù)據(jù)庫
目前NCBInr、Uniprot(Trembl、Uniref)均包含了數(shù)十萬種細(xì)菌物種,數(shù)千萬條序列,雖然和地球上已知的數(shù)千萬種細(xì)菌物種相比還只是一小部分,但也足以作為測序數(shù)據(jù)庫的有力補(bǔ)充。
3.第三方收集的數(shù)據(jù)庫
有些研究會收集整理其獲得宏蛋白質(zhì)組數(shù)據(jù)庫,我們可以參考其研究背景和對象,選擇相近的數(shù)據(jù)庫對自己研究的分析進(jìn)行補(bǔ)充。類似的有 http://meta.genomics.cn
如下是兩篇文獻(xiàn)中類似的分析思路:
Critical decisions in metaproteomics: achieving high confidence protein annotations in a sea of unknowns.The ISME Journal2017
The impact of sequence database choice on metaproteomic results in gut microbiota studies.Microbiome 2016.
聯(lián)系客服