Crispr/Cas9在微生物中起到的作用就是識別入侵、將病毒的DNA錄入自己的基因組,當(dāng)病毒再次入侵時候,切割病毒DNA、RNA進而消除病毒的感染。CRISPR(Clustered regularly interspaced short palindromic repeats)是生命進化歷史上,細菌和病毒進行斗爭產(chǎn)生的免疫武器,簡單說就是病毒能把自己的基因整合到細菌,利用細菌的細胞工具為自己的基因復(fù)制服務(wù),細菌為了將病毒的外來入侵基因清除,進化出CRISPR系統(tǒng),利用這個細菌免疫系統(tǒng),細菌地把病毒基因從自己的染色體上切除,這是細菌特有的免疫系統(tǒng)。
Crispr在編輯基因的時候,需要2個成分①Cas9核酸酶;②gRNA(全稱是guide RNA,引導(dǎo)RNA)(需要設(shè)計里面的部分序列)。
其中Cas9核酸酶的基因已經(jīng)被整合到商業(yè)化載體中,因此使用者只要自行設(shè)計sgRNA,然后構(gòu)建Cas9/sgRNA表達載體,轉(zhuǎn)染細胞,就可以行使基因組的定點基因編輯任務(wù)。
gRNA(guided RNA)是CRISPR基因敲除敲入系統(tǒng)中重要的組成部分,由兩部分組成,分別是tracRNA和crRNA。其中crRNA引導(dǎo)cas9定位到要編輯的DNA序列附近,它有一段序列與tracrRNA的一部分是同源的,因此這兩者可以部分結(jié)合。
tracrRNA的作用在于:形成一個莖環(huán)結(jié)構(gòu),與Cas9蛋白結(jié)合,示意圖如下所示:
將上圖的細節(jié)放大(圖片來源于Sigma),如下所示:
Cas9和gRNA會形成一個Cas9核糖核蛋白(ribonucleoprotein,RNP)。這個RNP就能結(jié)合到基因組上的靶序列上。而基因組上的靶序列如果要被切割,需要滿足兩個條件: 第一,gRNA與基因組上有17-21個堿基的同源區(qū),也被稱為protospace。 第二,靶序列附近有PAM(protospacer adjacent motif),需要注意的是,在設(shè)計gRNA時,PAM并不是gRNA的一部分,找公司合成的gRNA時,里面是沒有PAM序列的。
在tracrRNA引導(dǎo)下,gRNA與基因組上的靶序列結(jié)合,進而RNP切割靶序列,形成一個DSB。
下圖是Takara官網(wǎng)的原理示意圖:
外源核苷酸是通過Cas 蛋白識別,入侵的短片段DNA(30-50個堿基對)被稱為protospacers,作為間隔序列插入宿 主CRISPR 位點中,由重復(fù)序列隔開。對于I型和II型系統(tǒng)來說,protospacers來自入侵 DNA 中兩側(cè)出現(xiàn)2-5 個核酸結(jié)構(gòu)(PAM,protospacer adjacent motif)的區(qū)域。一般 protospacers 連接在CRISPR 位點的一端,并且后者通過涉及 Cas1、Cas2 和 游離3’-hydroxyls 等元件的機制,牽引序列。Protospacer 的整合過程中也出現(xiàn)了牽引末端重新序列復(fù)制,這可能涉及宿主聚合酶和DNA修復(fù)機制。如下所示:
CRISPR RNA 在轉(zhuǎn)錄之后,生成初級轉(zhuǎn)錄產(chǎn)物:pre-crRNA,之后經(jīng)過加工,又成為一組短小的 CRISPR衍生RNAs(crRNAs),這些crRNAs 每一個都包含有對應(yīng)于之前遇到的外源DNA的對應(yīng)序列。
在pre-crRNA轉(zhuǎn)錄的同時,與其重復(fù)序列互補的反式激活tracrRNA(Trans-activating crRNA,tracrRNA)也轉(zhuǎn)錄出來,并且激發(fā)Cas9和雙鏈RNA特異性RNase III核酸酶對pre-crRNA進行加工。加工成熟后,crRNA、tracrRNA和Cas9組成復(fù)合體,識別并結(jié)合于crRNA互補的序列,然后解開DNA雙鏈,形成R-loop,使crRNA與互補鏈雜交,另一條鏈保持游離的單鏈狀態(tài),然后由Cas9中的HNH活性位點剪切crRNA的互補DNA鏈,RuvC活性位點剪切非互補鏈,最終引入DNA雙鏈斷裂(DSB)。CRISPR/Cas9的剪切位點位于crRNA互補序列下游鄰近的PAM區(qū)(Protospacer Adjacent Motif)的5’-GG-N18-NGG-3’特征區(qū)域中的NGG位點,而這種特征的序列在每128bp的隨機DNA序列中就重復(fù)出現(xiàn)一次。
Cas9可以解開DNA,gRNA和target dsDNA配對是在解旋之后所進行(文獻為:Sternberg, S. H., et al. (2014). “DNA interrogation by the CRISPR RNA-guided endonuclease Cas9.” Nature 507(7490): 62-67.)。步驟如下:
下圖是Doudna那篇paper的原理解釋的figure
gRNA 設(shè)計靶序列選擇:在NCBI找到該基因CDS區(qū),分析相應(yīng)的基因組結(jié)構(gòu),明確CDS的外顯子部分。按照基因本身的性質(zhì),選擇候選的待敲除位點,確定待敲除位點。對于蛋白編碼基因,如果該蛋白具重要結(jié)構(gòu)功能域,可考慮將基因敲除位點設(shè)計在編碼該結(jié)構(gòu)域的外顯子。可選擇將待敲除位點放在起始密碼子ATG后的外顯子上。如果被敲除的靶標(biāo)基因是microRNA或者lncRNA,可以將待敲除位點設(shè)計在編碼成熟microRNA的外顯子或在編碼成熟microRNA的外顯子的5’和3’側(cè)翼序列。
gRNA設(shè)計:通常情況下我們僅需要在你的目的位置附近找到PAM序列:NGG(N代表任意核苷酸),然后找到其緊鄰的上游20 nt即可 (如下圖所示)。
從前面的原理中可以知道,這個gDNA是與基因組上的正義鏈?zhǔn)窍嗤摹?/p>
目的位置的選擇:我們絕大部分時候的目的是完全敲除一個基因,其原理是利用移碼突變(CRISPR/Cas系統(tǒng)誘導(dǎo)產(chǎn)生indel)。
注:indel全稱為insertion,deletion,即插入,缺失,縮寫為indel, 插入如下: 生物原始基因序列:ATCGTCGAATCCGGTTG 發(fā)生突變基因序列:ATCGTCGAAatcgTCCGGTTG,其中的小寫字母atcg為插入的序列,為插入突變;
缺失: 生物原始基因序列:ATCGTCGAAtccgGTTG 發(fā)生突變基因序列:ATCGTCGAAGTTG,其中,原始序列里的小寫字母tccg為缺失的序列,為缺失突變; 插入和缺失都相對于原始序列來說:缺失指,在原始序列中的某一段丟失;插入指,相對于原始序列在某個位置多了一段序列,即在這個位置插入了一段序列
因此我們一般選擇距離起始密碼子ATG下游200bp范圍內(nèi)的exon區(qū)域。另外,通常一個基因往往會轉(zhuǎn)錄成2個以上的轉(zhuǎn)錄本,所以請選擇盡量靠近5’端的公共部分,保證每個轉(zhuǎn)錄本都會成功移碼突變。
通常情況下,為了便于下游KO mutants的鑒定,我們往往可以作如下設(shè)計:即Cas9的切割位點剛好被一個酶切位點跨過,且附近至少100 bp內(nèi)酶切位點唯一(下游的敲除突變也能通過測序的手段來鑒定)。
上圖的酶切示意圖就顯示了,敲除突變無法被酶切,而野生型的則能夠進行酶切。
不過現(xiàn)在已經(jīng)有了很多在線的gRNA設(shè)計工具,現(xiàn)在就以其中的一個為例說明一下。
現(xiàn)在已經(jīng)有很多可以設(shè)計gRNA的工具,這里直接略過,直接看后文中所附的gRNA設(shè)計工具即可。
我們實驗室自己使用的是U6-sgRNA-SFFV-spCas9-PURO
,示意圖如下所示:
使用的酶切位點是BbsI
,使用BbsI
切開后的切口如下所示:
因此,在合成gRNA的兩條鏈時,正義鏈上的oligo序列前面要加一個cacc
,而負(fù)義鏈上的oligo序列前面要加上aaac
。
例如我們最終確確定的gRNA序列為CTGTTTGTGCAGGGCTCCGA
,它要在兩邊加上caccG,這個cacc與BsmBI酶切后的gtgg配對,加G是因為這個轉(zhuǎn)錄起始位點,必須要加上,如果本身第一個是G,則不需要添加,另一條是5’-TCGGAGCCCTGCACAAACAG-3’,它的兩端要加上aaac與gttt配對。
那么最終需要合成的序列有2條:oligo1:5’-caccGCTGTTTGTGCAGGGCTCCGA -3’; oligo2:5’- aaacTCGGAGCCCTGCACAAACAGc-3’。加粗部分與經(jīng)BbsI酶切后的載體互補配對,BbsI的酶切位點如下所示:
BbsI酶的信息如下所示:
全稱:BbsI-HF
貨號:R3539
保存條件:負(fù)20度
緩沖液:CutSmart Buffer(NEB帶有HF(即High Fidelity)字樣的酶都支持CutSmart)
這里需要注意幾點:
第一:尋找靶序列中的PAM序列,也就是NGG,我們需要注意的是,PAM序列并不是gRNA的一部分,因此在合成gRNA時,里面是沒有PAM序列的;
第二:RNP在切割靶序列時,是可以切割任意一條鏈的DNA的(可能是正義鏈,也可能是反義鏈,總之在做敲除時,最終目的就是破壞DFNA)。
上圖的流程是分三步:
再來看一個文獻中的案例:
文獻信息如下所示:
|
|
文獻中是使用了cas9編輯了斑馬魚的etsrp基因,文獻中的示意圖如下所示:
紅色方框畫的就是靶序列,在Ensembl數(shù)據(jù)庫中檢索斑馬魚的etsrp外顯子2序列,如下所示:
|
|
導(dǎo)入Snapgene,標(biāo)記出來gRNA序列,如下所示:
從上圖可以看到,這個gRNA序列就是位于正義鏈上。
1. Oligo退火形成duplex
Component | Volume |
---|---|
oligo1 | 1ul(100uM) |
oligo2 | 1uL(100uM) |
H2O | 8uL |
total | 10uL |
PCR儀 95℃ 5 min,緩慢降溫至室溫1h,1:200稀釋duplex。
2. 質(zhì)粒酶切
Component | Volume |
---|---|
lentiCRISPR plasmid | 2ug |
BbsI-HF(不同的質(zhì)粒有不同的酶切位點) | 1uL |
10X buffer | 2uL |
H2O | X uL |
total | 10 uL |
加入以上成分,于37攝氏度酶切15分鐘(不同的酶有不同的酶切時間,這個要看說明書)。此處使用的Cas9載體的gRNA插入位點如下所示:
3. 膠回收 大片段約11kb 回收,回收后的線性片段要放到負(fù)80度冰箱,因為BbsI
這個酶消化后的質(zhì)粒(我自己用的質(zhì)粒)有一端是AAA
,容易降解(如果沒有,則放負(fù)20度即可)。
4. 連接
Component | Volume |
---|---|
T4 DNA ligase(TaKaRa,2011A) | 1uL |
10 X DNA ligase buffer | 1uL |
digested lentiCRISPR plasmid | 2uL |
duplex | 6 uL |
total | 10 uL |
室溫連接4-6h,隨后轉(zhuǎn)化,轉(zhuǎn)化時要把所有的連接體系加入到感受態(tài)中,因為載體的連接效率不高。
Component | Volume |
---|---|
lentiCRISPR v2-gDNA plasmid | 4ug |
psPAX2 packaging plasmid | 3ug |
pMD2.G envelope plasmid | 1ug |
如果是使用Lipo3000進行病毒包括,則整個包括體系如下所示:
溶液1 | 溶液2 |
---|---|
① OPTI-MEM 121.25μL | ① psPAX2(1.5μg= X μL)(X) |
② lipo3000 3.75μL(或7.5,第一次需要摸索條件) | ② pMD2G(1μg= YμL)(Y) |
③ 目的質(zhì)粒(2.5μg= Z μL)(Z) | |
④ OPTI-MEM (125μL-X-Y-Z-10= μL) | |
⑤ P3000TM試劑 10μL(最后加) |
注:注:(1)包裝質(zhì)粒PAX2 :pMDG2:和目的基因質(zhì)粒=3:2:5,因此前期工作,每種質(zhì)粒的濃度最好為:[1]psPAX2(500ng/μL)[2]pMD2G(500ng/μL)[3]目的質(zhì)粒(500ng/μL)
(2)Lip3000(μL)∶DNA(μg)的推薦比例為2.5∶1
轉(zhuǎn)染條件與常規(guī)的病毒轉(zhuǎn)染相同。
轉(zhuǎn)染48h后,加入puromycin來篩選細胞,1mL的培養(yǎng)基,加5μL的嘌呤酶素(1mg/mL),也就是說嘌呤霉素的終濃度是5μg/mL。
加了嘌呤霉素的培養(yǎng)基要每天更換,每次里面都要含有5μg/mL的嘌呤霉素,這個時間要持續(xù)7天。在第7天的時候,取一定數(shù)量的細胞,提取DNA,測序,這一步的目的主要在于,確定是否存在有基因敲除的細胞,如果沒有,就要重新包病毒進行敲除。
如果存在基因敲除的細胞,那么gRNA切割位點處就會產(chǎn)生套峰,表示有效編輯的效應(yīng)為50%,如下所示:
當(dāng)測序結(jié)果出現(xiàn)套峰時,表明這批細胞中存在被敲除的細胞,此時就可以分離單克隆了,分離單克隆主要有下面的幾種方法。
有有限稀釋法的過程為:收集細胞,計數(shù),將細胞的密度稀釋為500個/mL,此時,用20μL移液槍吸取細胞懸液先點幾個孔 ,每孔約2μL,然后放在倒置顯微鏡下觀察 ,如每孔 1~2 個細胞,說明細胞濃度合適 ,則可一次點完 96 孔板,每個孔100uL。
這個過程也可以使用流式細胞儀分選,直接分到96孔板中,每孔種1個細胞。
單克隆的鑒定
第一種方法,根據(jù)設(shè)計,推薦使用酶切鑒定的方法(見設(shè)計部分),通量高;
第二種方法,就是提取細胞DNA,跑膠,在gRNA序列的上下游設(shè)計一對引物,產(chǎn)物長度約500bp,敲除的細胞的條帶會縮減,由于gRNA只有20幾個bp,因此普通的瓊脂糖凝膠不容易看出差異,此時可以采用SDS凝膠,如果敲除的基因是非編碼的序列,那么就采用測序法;
第三種方法,測序,如果不熟悉SDS凝膠,可以采用普通的瓊脂糖凝膠,直接切膠,送測序;
第四種方法,如果有抗體,可以使用WB的方法。
聯(lián)系客服