中文字幕理论片,69视频免费在线观看,亚洲成人app,国产1级毛片,刘涛最大尺度戏视频,欧美亚洲美女视频,2021韩国美女仙女屋vip视频
打開APP
未登錄
開通VIP,暢享免費電子書等14項超值服
開通VIP
首頁
好書
留言交流
下載APP
聯(lián)系客服
生物信息學----核酸和蛋白質(zhì)的分析方法
願隨身
>《自然科學》
2012.09.01
關注
生物信息學
核酸和蛋白質(zhì)的分析方法
生物信息學的概念
生物信息學
——
是一門新興的交叉學科,是采用計算機技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、存儲、傳遞、檢索、分析和解讀的科學,是現(xiàn)代生命科學與計算機科學、數(shù)學、統(tǒng)計學、物理學和化學等學科相互滲透而形成的交叉學科。具體的說,生物信息學是把基因組
DNA
序列信息分析作為源頭,破譯隱藏在
DNA
序列中的遺傳語言,特別是非編碼區(qū)的實質(zhì);同時在發(fā)現(xiàn)了新基因信息之后進行蛋白質(zhì)空間結(jié)構(gòu)模擬和預測。
生物信息學的研究內(nèi)容
生物信息的采集、存儲、管理和提供;
基因組序列信息的提取和分析;
功能基因組相關信息分析;
生物大分子結(jié)構(gòu)模擬和藥物設計;
生物信息分析的技術(shù)與方法研究;
生物信息學的研究內(nèi)容
4
基因與基因組的信息學
–
大規(guī)模基因組測序中的信息分析
–
新基因和新
SNP
的發(fā)現(xiàn)與鑒定
–
非編碼區(qū)信息結(jié)構(gòu)分析
–
遺傳密碼起源和生物進化的研究
–
完整基因組的比較研究
.
基因表達的信息學
---
大規(guī)?;蚬δ鼙磉_譜的分析。
DNA
芯片技術(shù)、蛋白質(zhì)譜技術(shù)和蛋白質(zhì)組研究。
4
生物大分子的三維結(jié)構(gòu)信息
---
蛋白質(zhì)結(jié)構(gòu)模擬與分子設計。蛋白質(zhì)功能的分析基礎。方法:同源模建、序列結(jié)構(gòu)聯(lián)配、分子動力學模擬。
4
代謝和疾病發(fā)生途徑的信息
---
細胞發(fā)育、分化的途徑以及疾病發(fā)生與發(fā)展的途徑
基因組序列裝配
基因識別
基因功能預報
基因多態(tài)性分析
基因進化
mRNA
結(jié)構(gòu)預測
基因芯片設計
基因芯片數(shù)據(jù)分析
疾病相關基因分析
基本研究方法
實驗數(shù)據(jù)
公用數(shù)據(jù)
公共數(shù)據(jù)庫
核酸分析
蛋白質(zhì)分析
生物信息學數(shù)據(jù)庫
數(shù)據(jù)庫種類
4
基因組數(shù)據(jù)庫
–
人類基因組數(shù)據(jù)庫
–
各種模式生物基因組數(shù)據(jù)庫
4
核酸和蛋白質(zhì)一級結(jié)構(gòu)序列數(shù)據(jù)庫
4
生物大分子三維空間數(shù)據(jù)庫
4
由以上三類數(shù)據(jù)庫和文獻資料為基礎的二次數(shù)據(jù)庫
生物信息學數(shù)據(jù)庫
全球生物學數(shù)據(jù)庫
4
Major Sequence Repositories
4
Comparative
Genomics
4
Gene Expression
4
Gene Identification and Structure
4
Genetic and Physical Maps
4
Genomic Databases
4
Intermolecular Interactions
4
Metabolic Pathways and Cellular Regulation
4
Mutation Databases
4
Pathology
4
Protein Databases
4
Protein Sequence Motifs
4
Proteome Resources
4
RNA Sequences
4
Retrieval Systems and Database Structure
4
Structure
4
Transgenics
4
Varied Biomedical Content
基因組數(shù)據(jù)庫
4
基因組數(shù)據(jù)庫是分子生物信息數(shù)據(jù)庫的重要組成部分,主要包括人以及鼠、河豚魚、擬南芥、水稻、線蟲、果蠅、酵母、大腸桿菌等各種模式生物。
4
GDB----
人類基因組數(shù)據(jù)庫
4
AceDB----
線蟲基因組數(shù)據(jù)庫
序列數(shù)據(jù)庫
4
核酸序列數(shù)據(jù)庫
----EMBL
、
GENBANK
、
DDBJ
4
蛋白質(zhì)序列數(shù)據(jù)庫
----PIR
、
SWISS-PORT
結(jié)構(gòu)數(shù)據(jù)庫
4
蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫
---PDB
4
蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫
SCOP---
將蛋白質(zhì)按傳統(tǒng)分類方法分成
a
型、
b
型
、
a
/
b
型、
a
+
b
型、多結(jié)構(gòu)域蛋白、膜蛋白和細胞表面蛋白、小蛋白等七大類。
CATH---
將蛋白質(zhì)分為
a
主類、
b
主類、
a
-
b
類、低二級結(jié)構(gòu)類(二級結(jié)構(gòu)成分含量很低的蛋白質(zhì)分子)
二次數(shù)據(jù)庫
4
基因組二次數(shù)據(jù)庫
4
蛋白質(zhì)序列二次數(shù)據(jù)庫
4
蛋白質(zhì)結(jié)構(gòu)二次數(shù)據(jù)庫
4
二次數(shù)據(jù)庫種類繁多,以核酸數(shù)據(jù)庫為基礎構(gòu)建的二次數(shù)據(jù)庫有基因調(diào)控轉(zhuǎn)錄因子數(shù)據(jù)庫
TransFac
,真核生物啟動子數(shù)據(jù)庫
EPD
,克隆載體數(shù)據(jù)庫
Vector
,密碼子使用表數(shù)據(jù)庫
CUTG
等。
4
以蛋白質(zhì)序列數(shù)據(jù)庫為基礎構(gòu)建的二次數(shù)據(jù)庫有蛋白質(zhì)功能位點數(shù)據(jù)庫
Prosite
,蛋白質(zhì)功能位點序列片段數(shù)據(jù)庫
Prints
,同源蛋白家族數(shù)據(jù)庫
Pfam
,同源蛋白結(jié)構(gòu)域數(shù)據(jù)庫
Blocks
。
4
以具有特殊功能的蛋白為基礎構(gòu)建的有免疫球蛋白數(shù)據(jù)庫
Kabat
,蛋白激酶數(shù)據(jù)庫
PKinase
等。
4
以三維結(jié)構(gòu)原子坐標為基礎構(gòu)建的數(shù)據(jù)庫為結(jié)構(gòu)分子生物學研究提供了有效的工具,如蛋白質(zhì)二級結(jié)構(gòu)構(gòu)象參數(shù)數(shù)據(jù)庫
DSSP
,已知空間結(jié)構(gòu)的蛋白質(zhì)家族數(shù)據(jù)庫
FSSP
,已知空間結(jié)構(gòu)的蛋白質(zhì)及其同源蛋白數(shù)據(jù)庫
HSSP
等。
4
蛋白質(zhì)回環(huán)分類數(shù)據(jù)庫則是用于蛋白質(zhì)結(jié)構(gòu)、功能和分子設計研究的專門數(shù)據(jù)庫。
4
此外,酶、限制性內(nèi)切酶、輻射雜交、氨基酸特性表、序列分析文獻等,也屬于二次數(shù)據(jù)庫或?qū)iT數(shù)據(jù)庫。
數(shù)據(jù)庫查詢
(daebase query)
和數(shù)據(jù)庫搜索
(datebase search)
4
數(shù)據(jù)庫查詢(也稱為數(shù)據(jù)庫檢索)是指對序列、結(jié)構(gòu)以及各種二次數(shù)據(jù)庫中的注釋信息進行關鍵詞匹配查找。常用的數(shù)據(jù)庫查詢系統(tǒng)有
Entrez, SRS
等。
4
數(shù)據(jù)庫搜索是指通過特定的序列相似性比對算法,找出核酸或蛋白質(zhì)序列數(shù)據(jù)庫中與檢測序列具有一定程度相似性的序列。常用的數(shù)據(jù)庫搜索系統(tǒng)有
BLAST
、
FASTA
和
BLITZ
。
序列的比較
4
兩兩對齊分析:常用程序有
ALIGN
、
Align
、
B12Seq
等。
4
多重序列對齊分析:常用程序有
Clustal W/X
、
Match-Box
、
CINEMA
等。
4
序列對數(shù)據(jù)庫的對齊分析:常用程序有
BLAST
、
FASTA
和
BLITZ
。
應
用
核酸序列分析
蛋白質(zhì)分析
核酸序列分析
4
核酸序列的檢索
---
對已知核酸序列的檢索
4
核酸序列的基本分析
–
分子質(zhì)量、堿基組成、堿基分布
–
序列變換:反向序列、互補序列、互補反向序列
–
限制性酶切分析:限制酶的所有信息,包括甲基化酶、相應的微生物來源、識別序列位點、裂解位點、甲基化特異性、酶的商業(yè)來源以及參考文獻。
–
克隆測序的分析:測序峰圖的查看、核酸序列中載體的識別和去除、其他人工序列的分析和去除
4
核酸序列的電子延伸
---GenBank
的
UniGene
數(shù)據(jù)庫、意大利
Tigem
的
EST Machine
、
EMBL
的
EST Cluster Project
等
4
基因的電子表達譜分析
---
將待分析序列與
EST
數(shù)據(jù)庫進行序列對庫的檢索,用與待分析核酸序列具有高同源性的
EST
序列所對應的組織來源進行推斷,進而得到該基因的組織表達譜。
SAGE
數(shù)據(jù)庫、
UniGene
、
Tigem
等。
4
核酸序列的電子基因定位分析
---
染色體定位。
–
通過序列標簽
STS
數(shù)據(jù)庫定位
–
利用
UniGene/RH
放射性雜交定位
–
直接利用基因組序列定位
4
cDNA
對應的基因組序列分析
---EST
和
cDNA
的基因組序列查詢了解該基因的基因組結(jié)構(gòu):外顯子
/
內(nèi)含子結(jié)構(gòu)、轉(zhuǎn)錄調(diào)控區(qū)。
4
基于核酸序列對齊分析的功能預測
–
利用數(shù)據(jù)庫的核酸序列的同源性分析
–
兩條核酸序列之間的同源性分析
–
核酸序列之間的多重比對分析及進化分析
4
可讀框架分析
–
cDNA
序列的可讀框架分析
–
基因組序列中的編碼區(qū)
/
內(nèi)含子結(jié)構(gòu)分析
–
cDNA
序列與基因組序列的對齊及顯示,
Sim4
程序。
4
基因啟動子及其他調(diào)控位點分析
---
啟動子、增強子、轉(zhuǎn)錄因子結(jié)合位點、內(nèi)含子與外顯子。
4
重復序列分析
4
引物設計
蛋白質(zhì)序列分析
4
蛋白質(zhì)序列檢索
4
蛋白質(zhì)基本性質(zhì)分析
–
氨基酸組分、分子質(zhì)量、等電點
–
疏水性分析
–
跨膜區(qū)分析
–
前導肽和蛋白質(zhì)定位
–
卷曲螺旋分析
蛋白質(zhì)序列分析
4
蛋白質(zhì)功能預測
–
基于序列同源性分析的蛋白質(zhì)功能預測。
Blast
、
Blast2
、
FASTA
。
–
基于模體、結(jié)構(gòu)位點、結(jié)構(gòu)功能域的蛋白質(zhì)功能預測
4
蛋白質(zhì)結(jié)構(gòu)預測
–
蛋白質(zhì)二級結(jié)構(gòu)預測
–
蛋白質(zhì)三級結(jié)構(gòu)預測
——
與已知結(jié)構(gòu)的序列比較、同源模建、
threading
算法和折疊識別
4
蛋白質(zhì)分子進化分析
生物信息學與基因芯片
4
生物信息學在基因芯片研究與應用中其著重要的作用,從確定基因芯片檢測對象到基因芯片設計,從基因芯片檢測結(jié)果分析到實驗數(shù)據(jù)管理和信息挖掘,都需要生物信息學的支持。而基因芯片技術(shù)又能夠同時、快速、準確地分析大量基因組信息。
生物信息學與藥物設計
選擇藥物作用靶標的標準
侯選藥物靶標的發(fā)現(xiàn)
靶標有效性的驗證
藥物作用機制的研究
計算機輔助藥物設計
研究實例
“
熒光差異顯示
PCR
克隆參與胃腺癌轉(zhuǎn)移的基因
wcl
1”
(王建華等)
4
使用來源于同一個胃腺癌病人的原發(fā)灶
RF-1
和轉(zhuǎn)移灶
RF-48
作為研究腫瘤轉(zhuǎn)移的模型。通過
PCR
技術(shù),克隆
45
個涉及胃腺癌轉(zhuǎn)移相關基因。和原發(fā)灶
RF-1
相比較,發(fā)現(xiàn)轉(zhuǎn)移灶
RF-48
細胞中有
38
個基因被顯著上調(diào),
7
個基因被顯著下調(diào),包括未發(fā)現(xiàn)的基因
3
個,利用生物信息學技術(shù)對其中一個在
RF-48
中高度上調(diào)的
wcl1
進行克隆和鑒定。
具體步驟
原發(fā)灶
RF-1
和轉(zhuǎn)移灶
RF-48
的細胞培養(yǎng)
DD-PCR
獲取差異條帶
同源性的
EST
分析
EST
的拼接和組裝
OFR
識別
編碼氨基酸的相似性分析
RT-PCR
和
Northern
印跡驗證
Wcl1
染色體定位
Wcl1
基因的組織分布
Wcl1
編碼的蛋白質(zhì)空間結(jié)構(gòu)
結(jié)果
克隆
45
個差異表達基因,包括未發(fā)現(xiàn)新基因
3
個。
其中一個
RF-48
中高度上調(diào)的基因命名為
wcl1
,并進行克隆和鑒定,
NCBI
編號
AF364863
。
確定
wcl1
基因結(jié)構(gòu)
---
用
EST
拼接軟件組裝成
664bp
的序列,對其
cDNA
序列進行
ORF
識別,發(fā)現(xiàn)含有
240bp
的完整閱讀框,編碼
79
個氨基酸。
拼接后
RT-PCR
、
Northern
驗證了其正確性。
SAGE
顯示
wcl1
的組織分布
----
在低分化胃腺癌表達高于相應正常胃組織;在胃血管內(nèi)皮表達高于乳腺管癌、腦纖維狀星形細胞瘤。
同源性分析
----wcl1
編碼的蛋白質(zhì)未與已知蛋白質(zhì)具有高度同源性,可能為一種新的蛋白質(zhì)。
染色體定位
----wcl1664bp
重疊群與人
11
號染色體
AP00730
克隆存在高度同源性,但
AP000730
克隆為未完成的草圖序列,沒有完整的基因圖,不能精確定位,只能初步定位于
11q14
。
Wcl1
編碼蛋白質(zhì)空間結(jié)構(gòu)
----
空間二級結(jié)構(gòu)、空間三級結(jié)構(gòu)。
Wcl1
氨基酸順序預測的蛋白質(zhì)的空間三級結(jié)構(gòu)與谷胱苷肽
-S-
轉(zhuǎn)移酶的空間三級結(jié)構(gòu)有
45%
的相似性。
王征旭等研究的“肝癌高表達新基因的克隆和編碼蛋白質(zhì)二級結(jié)構(gòu)分析”
4
目的
研究和克隆新的肝癌相關基因,探索肝癌發(fā)生的分子機制。
4
方法
采用
mRNA
差異顯示技術(shù)和篩選胎盤
cDNA
文庫,獲得新基因全長
cDNA
。制備新基因的
GST
融合蛋白和多克隆抗體,進行
western
雜交和免疫組織化學染色;利用計算機軟件分析新基因的二級結(jié)構(gòu)和功能預測。
4
結(jié)果
克降了一個新的肝癌相關基因全長
cDNA
、
western
雜交證實該基因全長能在
293
細胞中表達、免疫組織化學染色證實該基因編碼蛋白定位于細胞漿,二級結(jié)構(gòu)分析發(fā)現(xiàn)含
2
個
SH3
結(jié)臺結(jié)構(gòu)域和數(shù)個不同的蛋白激酶磷酸化位點。
4
結(jié)論
獲得一個新的肝癌相關基因全長
cDNA
。
其他研究路線
4
大規(guī)模
EST
克隆新基因
–
新基因克隆
組織文庫
---
消減雜交
---
克隆全長
cDNA---
電子拼接、
RACE----
基因全長
----
染色體定位
–
功能預測
cDNA
全長
---
蛋白編碼序列
---
同源性比較
---
功能域、功能基序分析(發(fā)現(xiàn)功能位點)
---
推斷新基因的功能
4
用一條
EST
釣取多個候選同源基因
差異顯示法
---
獲得表達差異的一條
EST---dbEST
數(shù)據(jù)庫電子雜交
---90%
以上同源性的多條
EST---
分別進行序列組裝
---
整合成更長的
EST
序列
---RACE---
基因全長
---
判斷是否為相同基因
---
不同序列視為候選同源基因
常用生物信息學軟件
4
DNA
分析
---DNAClub, DNAssist, DNATool
4
RNA
分析
---RNAdraw, RNAstructure
4
蛋白質(zhì)分析
---aminoXpress
4
引物分析
---primer, Oligo
4
序列綜合分析
---Bioedit, Clustal, LaserGene
4
進化樹分析
---Treeview, Genetree, phylip
4
質(zhì)粒繪圖
本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報
。
打開APP,閱讀全文并永久保存
查看更多類似文章
猜你喜歡
類似文章
生物信息學的打怪升級—初段小白必備
各大類主要數(shù)據(jù)庫介紹
生物信息學數(shù)據(jù)庫
Nr,GenBank, RefSeq, UniProt 數(shù)據(jù)庫的異同
中國大學MOOC的生物信息學之山東大學
生物信息學的主要研究開發(fā)內(nèi)容
更多類似文章 >>
生活服務
熱點新聞
首頁
萬象
文化
人生
生活
健康
教育
職場
理財
娛樂
藝術(shù)
上網(wǎng)
留言交流
回頂部
聯(lián)系我們
分享
收藏
點擊這里,查看已保存的文章
導長圖
關注
一鍵復制
下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!
聯(lián)系客服
微信登錄中...
請勿關閉此頁面
先別劃走!
送你5元優(yōu)惠券,購買VIP限時立減!
5
元
優(yōu)惠券
優(yōu)惠券還有
10:00
過期
馬上使用
×