在基因組遺傳變異的研究方面,有一個方式叫做單核苷酸多態(tài)性 (single nucleotide polymorphism, SNP)。關于 SNP 的含義的話。下面下面這個視頻進行了一定的解釋。有需要了解的可以看一眼。
在了解了 SNP 是什么之后,同時也需要簡單的了解一下關于 SNP 的命名,這樣也方便我們在使用一些 SNP相關數(shù)據(jù)庫的時候知道輸入的內(nèi)容是什么。
rs 號是對于 SNP 的最常見的命名方式。這個是 NCBI 通過一些大規(guī)模的基因組測序發(fā)現(xiàn)的了大量的 SNP,為了對這些 SNP 進行統(tǒng)一的管理就對其進行了逐一的編號。因此幾乎之前發(fā)現(xiàn)的 SNP 基本上都有一個 RS 號。同時在 NCBI 旗下的 SNP 數(shù)據(jù)庫可以對 SNP 進行直接的檢索
在這個 SNP 數(shù)據(jù)庫當中,可以輸入基因/RS 號碼進行直接檢索。例如檢索:rs1421085 。就可以知道 SNP 具體的信息了。
上面這種屬于 SNP 的官方編碼。對于 SNP 而言,只要是位于染色體上。每一個核苷酸就會有相對應的染色體位置。例如chr1: 109817590 就代表在一號染色體上的 109817590 位的這個 SNP。
在剛剛我們使用 SNP 數(shù)據(jù)庫查詢 SNP 的時候。里面涉及到了一些查詢的內(nèi)容。這里就對查詢的內(nèi)容結(jié)果進行一下簡單的介紹。我們查詢一個 SNP 的時候得到的基本信息是這樣的
對于每一個 SNP 在染色體上除了基本的染色體位置,還包括這個 SNP 和基因的關系,以及這個 SNP 是如何發(fā)生改變了。在 SNP 數(shù)據(jù)庫當中,我們可以看到 ?? 那個 SNP 主要是在FTO 的內(nèi)含子上發(fā)生從 T 變成 C 的改變
很多遺傳性疾病是和基因組變異是有關系的。基于之前的研究也發(fā)現(xiàn)了很多 SNP 和疾病的相關性。在ClinVar數(shù)據(jù)庫當中,我們可以了解這個 SNP 和臨床疾病的相關性。經(jīng)過查詢發(fā)現(xiàn)這個 SNP 和肥胖癥是有關的。
每一個 SNP 的發(fā)生頻率都是不一樣的。如果一個 SNP 發(fā)生頻率很低的話,那么對于人群研究而言,可能檢測完發(fā)現(xiàn)都是一個基因型,那就沒有辦法進行后續(xù)的研究了。所以在研究 SNP 之前,需要查看一下這個 SNP 的改變頻率。
SNP 和疾病的關系從機制層面而言的話,可能是這個 SNP 影響一個或者多個基因來發(fā)生作用的。其中和 SNP 有關的一個專業(yè)性術(shù)語就是數(shù)量性狀座位 (quantitative trait locus, QTL)。
關于QTL,就是一種把表型和基因的分子標記聯(lián)合起來分析的統(tǒng)計方法。通過QTL我們可以了解是哪些基因組的標記來影響表型的變化。其中分析標記的最常用的就是單核苷酸多肽(SNP)。而表型的話,可以是很多種類型。這個就延伸出很多種的xQTL。例如eQTL,就是把基因的表達當作表型,來分析樣本的SNP對于基因表達的影響。而meQTL就是把甲基化狀態(tài)看作表型,來分析樣本的SNP對于甲基化的影響。
所以簡單來說QTL是統(tǒng)計方法。而xQTL就是用QTL的統(tǒng)計方法來分析SNP對于x的影響。
cis 和 trans 的定義主要還是取決于相對位置而言的。拿 eQTL 而言的話,如果一個 SNP 對于這個基因 TSS 區(qū)域的上下游 10M 范圍內(nèi)的話,我們認為這個 SNP 的變化可以直接影響這個基因的表達,所以稱之為 cis-eQTL。如果在 1M 范圍以外的話,則有可能這個 SNP 的變化有可能是影響別的基因進而可以影響這個基因的變化。我們稱之為 trans-eQTLs。
除了 QTL 之外,由于 SNP 是主要影響的是核苷酸的改變。所以和核苷酸有關的變化都有可能是 SNP 的調(diào)控機制。比如如果 SNP 是位于蛋白編碼區(qū),那么 SNP 的改變就可能導致編碼的蛋白不同。如果 SNP 是位于內(nèi)含子區(qū),那么就可能影響可變剪切調(diào)控。如果 SNP 位于啟動子區(qū)則可能也影響轉(zhuǎn)錄因子調(diào)控等等
在人體研究方面, SNP 的研究可能在10年左右的時候可能是熱點。目前來看的話,相對來說也是在逐年降低的。尤其是到21年和20年相比。少了近一半。
聯(lián)系客服