全基因組關(guān)聯(lián)分析 (Genome-wide association studies, GWAS)現(xiàn)已成功地在復(fù)雜的人類特質(zhì)(traits)和疾病當(dāng)中應(yīng)用,例如身高和精神分裂癥,辨別出相關(guān)的單核苷酸多態(tài)性 (SNP)。這種研究方法是在人類基因組范圍內(nèi)找到序列變異,從而篩選出與特質(zhì)或疾病相關(guān)的序列。
GWAS推動(dòng)了我們對(duì)復(fù)雜疾病的認(rèn)知,但由于1)GWAS需要大量的數(shù)據(jù)和被試來(lái)提高它的統(tǒng)計(jì)效能,2)難以從生物學(xué)的角度解釋GWAS結(jié)果,這給疾病基因的功能驗(yàn)證和治療方案的提出帶來(lái)挑戰(zhàn)(1)。
近幾年來(lái),大規(guī)模的項(xiàng)目例如Genotype-Tissue Expression(GTEx)的開展,給我們帶來(lái)大量的人類組織基因型和基因表達(dá)相匹配的數(shù)據(jù)(2,3)。這些項(xiàng)目給我們提供了途徑,從而探索跨組織轉(zhuǎn)錄調(diào)節(jié)機(jī)制和辨別更多的表達(dá)數(shù)量性狀基因座(expression quantitative trait loci, eQTL,3,4) 。同時(shí),這也為我們提供了平臺(tái),從而能夠解釋SNPs,基因和復(fù)雜特質(zhì)之間的聯(lián)系(5,6,7)。
例如,通過(guò)eQTL和GWAS結(jié)果的匹配,能夠辨別復(fù)雜特質(zhì)相關(guān)的風(fēng)險(xiǎn)基因,而其中一種方法,研究者把它稱為全轉(zhuǎn)錄組關(guān)聯(lián)分析 (transcriptome-wide association analysis, TWAS)。
這種方法首先是在訓(xùn)練后的插補(bǔ)模型 (imputation model)基礎(chǔ)上,使用GWAS的基因型數(shù)據(jù),對(duì)基因表達(dá)的數(shù)據(jù)進(jìn)行插補(bǔ)(8,9)。其次,在插補(bǔ)后的基因表達(dá)和復(fù)雜特質(zhì)之間對(duì)基因?qū)用娴年P(guān)系進(jìn)行評(píng)估。這種研究方法讓我們?cè)鰪?qiáng)了對(duì)許多疾病和復(fù)雜特質(zhì)遺傳基礎(chǔ)的認(rèn)知(10,11)。
2018年哈佛的團(tuán)隊(duì)發(fā)表了一項(xiàng)關(guān)于精神分裂癥的TWAS研究(12)。我們都知道自從2014年Nature上發(fā)表了著名的關(guān)于精神分裂癥相關(guān)的基因位點(diǎn)的文章后(13,圖一),科學(xué)家們一直試圖了解其致病機(jī)理。
圖一:2014年發(fā)表在Nature上關(guān)于精神分裂癥相關(guān)位點(diǎn)的曼哈頓圖 (13)
哈佛的團(tuán)隊(duì)利用TWAS整合了精神分裂癥患者的GWAS數(shù)據(jù)和來(lái)自大腦,血液和脂肪組織的基因表達(dá)數(shù)據(jù)。在鑒定出的157個(gè)精神分裂癥相關(guān)基因中,35個(gè)基因是之前并未發(fā)現(xiàn)的,且42個(gè)基因和染色質(zhì)特質(zhì)(chromatin features)相關(guān),為接下來(lái)的研究指明了方向。
而需要指出的是,此項(xiàng)研究運(yùn)用的方法(見圖二))也有一些弊端。例如,由于轉(zhuǎn)錄調(diào)解取決于選擇的人類組織,現(xiàn)在的插補(bǔ)模型均基于不同的人類組織。同時(shí), 對(duì)于一些復(fù)雜特質(zhì),我們并不清楚與其生物相關(guān)聯(lián)的人類組織。最后,挑戰(zhàn)還在于難以在有限的數(shù)據(jù)中,針對(duì)任何單一的人類組織做出準(zhǔn)確的插補(bǔ)模型。
圖二:2018年哈佛團(tuán)隊(duì)對(duì)精神分裂癥的TWAS研究方法
針對(duì)這些問題,最近,耶魯Hongyu zhao的團(tuán)隊(duì)提出了一個(gè)新的框架去分析TWAS:UTMOST。相比較傳統(tǒng)的TWAS的插補(bǔ)模型建立在分別的人類組織上,這個(gè)方法整合了44種人類組織,從而允許跨組織(cross-tissue)基因表達(dá)的插補(bǔ)和基因?qū)用娴南嚓P(guān)分析(見圖三的UTMOST的分析步驟)。
圖三:UTMOST的分析步驟
他們證實(shí)了這種方法能夠提高在人類組織中基因表達(dá)數(shù)據(jù)插補(bǔ)的準(zhǔn)確性,并且UTMOST能夠在之后的下游關(guān)聯(lián)分析(downstream association analysis)中提供一個(gè)強(qiáng)有力的標(biāo)準(zhǔn),從而可以總結(jié)跨組織的基因?qū)用嫦嚓P(guān)分析,并可以整合不同的分子表型(molecular phenotypes)。例如,他們利用UTMOST在50種復(fù)雜人類特質(zhì)中,辨別出更多和人類組織有關(guān)的基因(圖四)。
圖四:UTMOST在50中復(fù)雜特質(zhì)中辨別出更多和人類組織有關(guān)的基因
將其和傳統(tǒng)的TWAS研究方法比較(圖二:傳統(tǒng)的TWAS;圖三:UTMOST),UTMOST為我們提供了一個(gè)更為靈活的基因?qū)用娴南嚓P(guān)分析,這有利于研究者研究復(fù)雜特質(zhì)和疾病,例如精神分裂癥和癌癥。
UTMOST software, https://github.com/Joker-Jerome/UTMOST/
原文鏈接:https://www.nature.com/articles/s41588-019-0345-7
其他參考文獻(xiàn):
1.Boyle, E. A., Li, Y. I. & Pritchard, J. K. An Expanded view of complex traits: from polygenic to omnigenic. Cell 169, 1177–1186 (2017).
2. Ardlie, K. G. et al. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science 348, 648–660 (2015).
3. Aguet, F. et al. Genetic effects on gene expression across human tissues. Nature 550, 204–213 (2017).
4. Yang, F. et al. Identifying cis-mediators for trans-eQTLs across many human tissues using genomic mediation analysis. Genome Res. 27,1859–1871 (2017).
5. Mohammadi, P., Castel, S. E., Brown, A. A. & Lappalainen, T. Quantifying the regulatory effect size of cis-acting genetic variation using allelic fold change. Genome Res. 27, 1872–1884 (2017).
6. Nicolae, D. L. et al. Trait-associated SNPs are more likely to be eQTLs: annotation to enhance discovery from GWAS. PLoS. Genet. 6, e1000888 (2010).
7. Giambartolomei, C. et al. Bayesian test for colocalisation between pairs of genetic association studies using summary statistics. PLoS Genet. 10, e1004383 (2014).
8. Gamazon, E. R. et al. A gene-based association method for mapping traits using reference transcriptome data. Nat. Genet. 47, 1091–1098 (2015).
9. Gusev, A. et al. Integrative approaches for large-scale transcriptome-wide association studies. Nat. Genet. 48, 245–252 (2016).
10. Mancuso, N. et al. Integrating gene expression with summary associationstatistics to identify genes associated with 30 complex traits. Am. J. Hum. Genet. 100, 473–487 (2017).
11. Hoffman, J. D. et al. Cis-eQTL-based trans-ethnic meta-analysis reveals novel genes associated with breast cancer risk. PLoS Genet. 13, e1006690 (2017).
12. Gusev, A., Mancuso, N., Won, H., Kousi, M., Finucane, H. K., Reshef, Y., ... & Ophoff, R. A. (2018). Transcriptome-wide association study of schizophrenia and chromatin activity yields mechanistic disease insights. Nature genetics, 50(4), 538.
13. Ripke, S., Neale, B. M., Corvin, A., Walters, J. T., Farh, K. H., Holmans, P. A., ... & Pers, T. H. (2014). Biological insights from 108 schizophrenia-associated genetic loci. Nature, 511(7510), 421.
作者信息
題圖:網(wǎng)絡(luò)
論文解析:Ayden (brainnews創(chuàng)作團(tuán)隊(duì)成員)
校審/排版:Simon (brainnews編輯部)
前 文 閱 讀
1,大數(shù)據(jù)時(shí)代:抑郁癥的合理分型能否迎來(lái)新希望?
2,“新型”的神經(jīng)調(diào)節(jié)劑——腦內(nèi)雌激素,對(duì)記憶形成至關(guān)重要
3,抑郁癥研究新焦點(diǎn):運(yùn)動(dòng)--睡眠--精力--情緒之間的動(dòng)態(tài)聯(lián)系
聯(lián)系客服