-
>
中醫(yī)基礎(chǔ)理論
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國(guó)特色社會(huì)主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學(xué)·全國(guó)中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
-
>
中醫(yī)診斷學(xué)--新世紀(jì)第五版
-
>
中藥學(xué)·全國(guó)中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
生物信息學(xué)分析實(shí)踐 版權(quán)信息
- ISBN:9787030278319
- 條形碼:9787030278319 ; 978-7-03-027831-9
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>>
生物信息學(xué)分析實(shí)踐 內(nèi)容簡(jiǎn)介
《生物信息學(xué)分析實(shí)踐》內(nèi)容主要包括生物信息學(xué)簡(jiǎn)介、三太數(shù)據(jù)庫(kù)檢索、引物設(shè)計(jì)及測(cè)序結(jié)果分析、核酸序列分析、蛋白質(zhì)序列分析、蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(cè)、系統(tǒng)發(fā)育分析、RNA分析、參考文獻(xiàn)管理!渡镄畔W(xué)分析實(shí)踐》的一大特色在于豐富的實(shí)例和圖表,使讀者可以很直觀地了解和掌握《生物信息學(xué)分析實(shí)踐》的內(nèi)容。
生物信息學(xué)分析實(shí)踐 目錄
序
前言
**章 生物信息學(xué)簡(jiǎn)介 1
1.1 生物信息學(xué)基礎(chǔ) 1
1.1.1 什么是生物信息學(xué) 1
1.1.2 生物信息學(xué)的形成與發(fā)展 2
1.1.3 生物信息學(xué)的研究?jī)?nèi)容 4
1.2 生物信息學(xué)應(yīng)用 6
1.2.1 生物信息學(xué)的熱點(diǎn)領(lǐng)域 6
1.2.2 信息技術(shù)與生物信息學(xué) 8
第二章 數(shù)據(jù)庫(kù)檢索 11
2.1 綜合性數(shù)據(jù)庫(kù)NCBI 11
2.1.1 NCBI簡(jiǎn)介 11
2.1.2 NCBI數(shù)據(jù)庫(kù)介紹 12
2.1.3 Entrez簡(jiǎn)介 14
2.1.4 Entrez檢索實(shí)例 15
2.2 綜合性數(shù)據(jù)庫(kù)EMBLGEBI 19
2.2.1 EBI簡(jiǎn)介 19
2.2.2 EBI數(shù)據(jù)庫(kù)簡(jiǎn)介 20
2.2.3 SRS簡(jiǎn)介 21
2.2.4 SRS檢索實(shí)例 22
2.2.5 BioMart簡(jiǎn)介 23
2.2.6 BioMart檢索實(shí)例 23
2.3 UCSC基因組瀏覽器 27
2.3.1 UCSC基因組瀏覽器簡(jiǎn)介 27
2.3.2 UCSC基因組瀏覽器檢索實(shí)例 28
第三章 引物設(shè)計(jì)及測(cè)序結(jié)果分析 30
3.1 引物設(shè)計(jì) 30
3.1.1 概述 30
3.1.2 常規(guī)PCR引物設(shè)計(jì)實(shí)例分析 36
3.1.3 簡(jiǎn)并引物設(shè)計(jì) 53
3.2 測(cè)序結(jié)果分析 60
3.3 序列拼接實(shí)例分析 61
第四章 核酸序列分析 75
4.1 常規(guī)分析 75
4.1.1 核酸序列的檢索 75
4.1.2 核酸序列組分分析 75
4.1.3 序列變換 77
4.1.4 限制性酶切分析 78
4.2 比對(duì)分析 82
4.2.1 BLAST比對(duì) 82
4.2.2 雙序列比對(duì) 87
4.2.3 多序列比對(duì) 89
4.3 基因結(jié)構(gòu)識(shí)別 93
4.3.1 ORF識(shí)別及其可靠性驗(yàn)證 93
4.3.2 啟動(dòng)子及轉(zhuǎn)錄因子結(jié)合位點(diǎn)分析 97
4.3.3 重復(fù)序列分析 99
4.3.4 CpGisland 101
4.3.5 3′UTR區(qū) 102
第五章 蛋白質(zhì)序列分析 105
5.1 蛋白質(zhì)序列的基本性質(zhì)分析 105
5.1.1 理化性質(zhì)分析 105
5.1.2 疏水性分析 107
5.1.3 跨膜區(qū)分析 110
5.1.4 信號(hào)肽預(yù)測(cè) 112
5.1.5 Coil區(qū)分析 116
5.1.6 亞細(xì)胞定位 118
5.2 結(jié)構(gòu)域分析及motif搜索 120
5.2.1 結(jié)構(gòu)域分析 120
5.2.2 motif搜索 123
5.3 空間結(jié)構(gòu)預(yù)測(cè) 126
5.3.1 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè) 126
5.3.2 蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè) 129
5.3.3 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法評(píng)價(jià) 138
5.4 抗原表位預(yù)測(cè)分析 139
5.4.1 B淋巴細(xì)胞抗原表位預(yù)測(cè)分析 140
5.4.2 T淋巴細(xì)胞抗原表位預(yù)測(cè)分析 145
第六章 分子進(jìn)化與系統(tǒng)發(fā)育分析 149
6.1 進(jìn)化的分子基礎(chǔ) 149
6.1.1 進(jìn)化樹與分子系統(tǒng)學(xué) 149
6.1.2 相似性與同源性 151
6.1.3 分子進(jìn)化 151
6.2 系統(tǒng)發(fā)育分析 151
6.2.1 DNA和氨基酸序列的進(jìn)化演變 153
6.2.2 系統(tǒng)發(fā)育樹的種類 153
6.2.3 用于系統(tǒng)發(fā)育分析的分子標(biāo)記選擇 154
6.2.4 常用的構(gòu)樹方法及其甄選 156
6.2.5 系統(tǒng)發(fā)育分析常用軟件 159
6.3 系統(tǒng)發(fā)育分析的檢驗(yàn) 165
6.3.1 系統(tǒng)發(fā)育分析方法可靠性的評(píng)價(jià) 165
6.3.2 系統(tǒng)樹的誤差分析及消除方法 166
6.4 系統(tǒng)樹的評(píng)估 168
6.5 系統(tǒng)發(fā)育分析實(shí)例 168
6.5.1 使用MEGA軟件重建NJ樹 172
6.5.2 使用PAUP軟件重建NJ樹 174
6.5.3 使用MEGA軟件重建MP樹 175
6.5.4 使用PAUP軟件重建MP樹 176
6.5.5 使用PAUP軟件重建ML樹 177
6.5.6 貝葉斯樹 177
第七章 RNA分析 181
7.1 RNA簡(jiǎn)介 181
7.1.1 RNA的結(jié)構(gòu) 182
7.1.2 RNA的功能 182
7.1.3 RNA研究進(jìn)展與展望 184
7.2 RNA二級(jí)結(jié)構(gòu) 184
7.2.1 RNA的二級(jí)結(jié)構(gòu)概述 184
7.2.2 RNA二級(jí)結(jié)構(gòu)的預(yù)測(cè)方法 186
7.2.3 RNA結(jié)構(gòu)預(yù)測(cè)實(shí)例分析 188
7.3 高效siRNA的設(shè)計(jì) 191
7.3.1 RNAi的作用機(jī)制 192
7.3.2 siRNA的設(shè)計(jì)原則 193
7.3.3 影響RNAi的其他因素 193
7.3.4 siRNA的設(shè)計(jì)步驟 194
7.3.5 siRNA的合成 194
7.3.6 siRNA干涉效果的評(píng)判 195
7.3.7 siRNA相關(guān)數(shù)據(jù)庫(kù)介紹 195
7.3.8 siRNA設(shè)計(jì)實(shí)例分析 196
7.4 microRNA分析 198
7.4.1 microRNA作用機(jī)制概述 198
7.4.2 miRNA功能與研究方法 200
7.4.3 miRNA生物信息學(xué)分析 201
7.4.4 miRNA及其靶基因預(yù)測(cè)的實(shí)例分析 206
主要參考文獻(xiàn)及網(wǎng)址 211
附錄 218
附錄1 常用生物學(xué)數(shù)據(jù)庫(kù) 218
附錄2 各種主要的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)軟件比較 219
附錄3 名詞解釋 221
彩圖
生物信息學(xué)分析實(shí)踐 節(jié)選
**章 生物信息學(xué)簡(jiǎn)介 1.1 生物信息學(xué)基礎(chǔ) 1.1.1 什么是生物信息學(xué) “生物信息學(xué)”是英文單詞“bioinformatics”的中文譯名。從字面上可以看出,它是一門與生物學(xué)和信息學(xué)兩大熱門學(xué)科都密切相關(guān)的學(xué)科。什么是生物信息學(xué)呢?我們還是從這一詞語(yǔ)的來(lái)源談起。bioinformatics —詞是由美國(guó)學(xué)者林華安博士(H.A.Lim)在1987年首創(chuàng)的。他*初使用的是“compbio”這一單詞,隨后更改為“bioinformatique”。不久,他又進(jìn)一-步將其更改為 bio-informatics (或 bio/informat-cs),又因名稱中的“”或“/”符號(hào)容易導(dǎo)致當(dāng)時(shí)的電子郵件系統(tǒng)問(wèn)題,故將其去除,于是今天我們所看到的“bioinformatics”就正式誕生了,林華安博士也因此贏得了“生物信息學(xué)之父”的美譽(yù)(蔣彥等,2003)。 眾所周知,生物信息學(xué)是一門嶄新的、正如火如荼發(fā)展的交叉學(xué)科,它吸引了越來(lái)越多的來(lái)自生物學(xué)、醫(yī)學(xué)、數(shù)學(xué)以及信息科學(xué)背景的專家學(xué)者投入到生物信息學(xué)的研究當(dāng)中去。但是由于不同領(lǐng)域科學(xué)家興趣的側(cè)重點(diǎn)不同,對(duì)生物信息學(xué)的定義往往具有局限性,猶如盲人摸象(圖1-1)。關(guān)于生物信息學(xué)的定義,到目前為止,國(guó)內(nèi)外眾說(shuō)紛紜,沒(méi)有形成統(tǒng)一的、普遍公認(rèn)的標(biāo)準(zhǔn)。美國(guó)國(guó)家基因組研究中心認(rèn)為,生物信息學(xué)是一門生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)相互交叉融合而產(chǎn)生的新興學(xué)科;美國(guó)佐治亞理工大學(xué)認(rèn)為,生物信息學(xué)是采用數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)等方法分析生物學(xué)、生物化學(xué)和生物物理學(xué)數(shù)據(jù)的一門綜合學(xué)科;美國(guó)密蘇里大學(xué)認(rèn)為,生物信息學(xué)是獲取、存儲(chǔ)和處理生物學(xué)信息的一門科學(xué)與技術(shù);美國(guó)加利福尼亞大學(xué)洛杉磯分校則認(rèn)為,生物信息學(xué)是對(duì)生物學(xué)信息和生物學(xué)系統(tǒng)內(nèi)在結(jié)構(gòu)的研究,它運(yùn)用數(shù)學(xué)和計(jì)算機(jī)科學(xué)的分析理論和實(shí)用工具將分散的生物學(xué)數(shù)據(jù)聯(lián)系起來(lái)。筆者根據(jù)自己對(duì)生物信息學(xué)的認(rèn)識(shí),綜合多方面內(nèi)容,從廣義和狹義兩個(gè)方面對(duì)什么是生物信息學(xué)做了相關(guān)的解釋。 圖1-1 不同領(lǐng)域科學(xué)家對(duì)生物信息學(xué)的認(rèn)識(shí) 1.廣義的生物信息學(xué) 廣義的生物信息學(xué)是指從事對(duì)基因組研究相關(guān)的生物信息的獲取、加工、儲(chǔ)存、分配、分析和解釋。它包括了兩層含義,一個(gè)是對(duì)海量數(shù)據(jù)的收集、整理與服務(wù),也就是管好這些數(shù)據(jù);另一個(gè)是從中發(fā)現(xiàn)新的規(guī)律,也就是用好這些數(shù)據(jù)。具體地說(shuō),生物信息學(xué)是以DNA和蛋白質(zhì)序列等生物信息分析作為源頭,破譯隱藏在序列信息中的語(yǔ)義規(guī)律,闡明海量生物信息的信息實(shí)質(zhì),在此基礎(chǔ)上歸納、整理與遺傳語(yǔ)義信息釋放及調(diào)控相關(guān)的轉(zhuǎn)錄譜和蛋白質(zhì)譜的數(shù)據(jù),從而認(rèn)識(shí)代謝、發(fā)育、分化和進(jìn)化的規(guī)律。廣義的生物信息學(xué)涉及生命的信息交換和傳遞的各個(gè)層次,如核酸、蛋白質(zhì)、細(xì)胞、組織、器官、系統(tǒng)和生物體等。 2.狹義的生物信息學(xué) 狹義的生物信息學(xué)是指綜合應(yīng)用信息科學(xué)、數(shù)學(xué)的理論、方法和技術(shù),管理、分析和利用生物分子數(shù)據(jù)的科學(xué),即分子生物信息學(xué)(molecular bioinformatics)。*初的生物信息學(xué)以基因組DNA序列信息挖掘?yàn)槌霭l(fā)點(diǎn),通過(guò)收集、組織、管理基因組 DNA序列數(shù)據(jù),以期獲得隱藏在基因組序列之中豐富的生物學(xué)知識(shí),從更深層次認(rèn)識(shí)未知的生物世界。然而,隨著技術(shù)的不斷進(jìn)步,生物分子數(shù)據(jù)巳經(jīng)不僅僅限于基因組序列數(shù)據(jù),微陣列、基因本體(gene ontology,GO)注釋、分子圖譜、結(jié)構(gòu)數(shù)據(jù)等其他數(shù)據(jù)的積累也在快速增加,這些數(shù)據(jù)同樣具有豐富的內(nèi)涵?茖W(xué)地利用生物分子數(shù)據(jù)及其分析結(jié)果,可以大大提高研究和開(kāi)發(fā)的科學(xué)性及效率。但是,如何發(fā)展應(yīng)用數(shù)理統(tǒng)計(jì)、模式識(shí)別、動(dòng)態(tài)規(guī)劃、神經(jīng)網(wǎng)絡(luò)、遺傳算法及隱馬爾科夫模型等挖掘海量數(shù)據(jù)中可以闡明細(xì)胞、器官和個(gè)體的發(fā)生、發(fā)育、病變、衰亡的基本規(guī)律的方法,仍是生物學(xué)家所面臨的一個(gè)嚴(yán)峻挑戰(zhàn),生物信息學(xué)也正是在這種挑戰(zhàn)中不斷發(fā)展起來(lái)的交叉學(xué)科。 1.1.2 生物信息學(xué)的形成與發(fā)展 生物信息學(xué)是建立在分子生物學(xué)基礎(chǔ)上的。因此,要了解生物信息學(xué)的發(fā)展就必須先對(duì)分子生物學(xué)的發(fā)展有一個(gè)簡(jiǎn)單的了解。1866年孟德?tīng)枺℅.j.Mendel)根據(jù)實(shí)驗(yàn)結(jié)果提出了基因是以實(shí)物存在的假設(shè)。1871年Mesher從死的白細(xì)胞核中分離出脫氧核糖核酸。1944年阿佛萊(O.T.Avery)、麥克李沃(C M.Mac Leod)和麥克卡(M.McCarty)三人通過(guò)試驗(yàn)證明DNA是生物的遺傳物質(zhì)以前,人們?nèi)匀徽J(rèn)為染色體蛋白質(zhì)攜帶基因,而DNA則被認(rèn)為是一個(gè)小角色。1944年Chargaff發(fā)現(xiàn)了著名的 Chargaff規(guī)律,即DNA中鳥嘌呤的量與胞嘧啶的量總是相等,腺嘌呤與胸腺嘧啶的量總是相等。與此同時(shí),Wilkins與Franklin用X射線衍射技術(shù)測(cè)定了 DNA纖維的結(jié)構(gòu)(圖1-2)。1953年James Watson和Francis Crick通過(guò)大量研究后在Nature雜志上發(fā)表論文,提出了 DNA的雙螺旋三維結(jié)構(gòu).他們的理論奠定了分子生物學(xué)的基礎(chǔ).DNA 雙螺旋模型已經(jīng)預(yù)示出了 DNA復(fù)制的規(guī)則。1956年Kornberg從大腸桿菌中分離出了 DNA聚合酶I (DNA polymerase I ),這種酶能使 dNTP 連接成 DNA。Meselson 和 Stahl 于1958年證明了 DNA半保留復(fù)制。Crick于1954年提出了遺傳信息傳遞的規(guī)律,根據(jù)當(dāng)時(shí)有限的資料, 他把中心法則(central dogma)的公式表述為“DNA—RNA—蛋白質(zhì)”,雖然現(xiàn)在的中心法則已經(jīng)得到新的修正,但Click提出的中心法則對(duì)后來(lái)分子生物學(xué)和生物信息學(xué)的發(fā)展都起到了極其重要的指導(dǎo)作用。1966年,Nirenberg和Khorana 破譯了全部遺傳密碼字典的64個(gè)密碼子,限制性內(nèi)切酶的發(fā)現(xiàn)和重組DNA的克。╟lone)奠定了基因工程的技術(shù)基礎(chǔ)。正是由于分子生物學(xué)的研究對(duì)生命科學(xué)的發(fā)展有巨大的推動(dòng)作用,生物信息學(xué)的出現(xiàn)也就成了一種必然。 1.生物信息學(xué)的萌生 生物信息學(xué)的產(chǎn)生與發(fā)展僅有十幾年的時(shí)間,bioinformatics這一名詞在1991年左右才在文獻(xiàn)中出現(xiàn),而且大多出現(xiàn)在電子出版物中。事實(shí)上,生物信息學(xué)已經(jīng)存在了幾十年,可以說(shuō)是一門有“較長(zhǎng)歷史”的學(xué)科,早在計(jì)算機(jī)初創(chuàng)的1956年就已經(jīng)在美國(guó)田納西州的蓋特林堡召幵過(guò)首次“生物學(xué)中的信息理論討論會(huì)”,這應(yīng)該算作生物信息學(xué)的雛形,只不過(guò)*初人們把生物信息學(xué)稱為基因組信息學(xué)。 20世紀(jì)80年代末,隨著人類基因組計(jì)劃的啟動(dòng),生物實(shí)驗(yàn)和衍生數(shù)據(jù)的大量?jī)?chǔ)存,促使這一新興交叉學(xué)科形成。但由于當(dāng)時(shí)技術(shù)的局限性,這一學(xué)科并沒(méi)有得到重視和發(fā)展。在沉寂了20余年后,才依賴計(jì)算機(jī)科學(xué)、工程學(xué)和應(yīng)用數(shù)學(xué)的迅猛發(fā)展得以飛速發(fā)展。隨著互聯(lián)網(wǎng)的發(fā)展和普及,基于Internet的龐大信息網(wǎng)絡(luò)無(wú)疑對(duì)信息學(xué)的發(fā)展起了巨大的推動(dòng)作用,也為生物信息學(xué)這一全新領(lǐng)域的萌芽和發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。當(dāng)世界各地的科學(xué)家?guī)允颊J(rèn)識(shí)到計(jì)算機(jī)的重要性并著手嘗試?yán)糜?jì)算機(jī)來(lái)組織、儲(chǔ)備和分析生物學(xué)的觀測(cè)資料時(shí),生物信息學(xué)就已經(jīng)萌芽了。然而,那些科學(xué)家當(dāng)時(shí)也許并沒(méi)有意識(shí)到生物信息學(xué)已經(jīng)在他們手里誕生了。 2.生物信息學(xué)數(shù)據(jù)庫(kù) 與生命科學(xué)其他學(xué)科的發(fā)展不同的是,生物信息學(xué)的高速發(fā)展并不是主要依賴于理論上的重大突破,從實(shí)驗(yàn)中獲得的大量數(shù)據(jù)以及基于這些數(shù)據(jù)建立的生物信息數(shù)據(jù)庫(kù)在一定程度上是生物信息學(xué)發(fā)展的動(dòng)力。美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室于1979年建立起 GenBank數(shù)據(jù)庫(kù);1982年歐洲分子生物學(xué)實(shí)驗(yàn)室的核酸序列數(shù)據(jù)庫(kù)(European Molecular Biology Laboratory, EMBL)幵始提供服務(wù);日本也于1984年著手建立國(guó)家*的Nucleic Acids Research雜志在每年**期中會(huì)詳細(xì)介紹各種*新生物信息學(xué)數(shù)據(jù)庫(kù)。在2000年1月1日出版的28卷**期中共介紹了115種通用和專用的數(shù)據(jù)庫(kù)。到2009年,這一數(shù)據(jù)已達(dá)到1170,增長(zhǎng)了10多倍。本書后面的章節(jié)將詳細(xì)介紹有關(guān)數(shù)據(jù)庫(kù)的使用方法,附錄1中列出的是一些比較常用的在線生物學(xué)數(shù)據(jù)庫(kù),供讀者參考。 圖1-2 DNA的X射線衍射照片 圖1-3 GenBank數(shù)據(jù)增長(zhǎng) 1.1.3 生物信息學(xué)的研究?jī)?nèi)容 生物信息學(xué)在短短十幾年間,已經(jīng)發(fā)展成多個(gè)研究方向,國(guó)際上公認(rèn)的生物信息學(xué)研究?jī)?nèi)容大致包括以下幾個(gè)方面。 1.生物信息的收集、存儲(chǔ)、管理與提供 生物信息的收集、存儲(chǔ)、管理與提供主要是指建立國(guó)際基本生物信息庫(kù)及相關(guān)的評(píng)估與檢測(cè)系統(tǒng),從而提供與生物學(xué)研究相關(guān)的在線服務(wù)。目前,大部分的生物學(xué)數(shù)據(jù)庫(kù) 核酸序列數(shù)據(jù)庫(kù)(DNA data bank of Japan,DDBJ),并于1987年幵始提供服務(wù)。1999年,在美國(guó)國(guó)立衛(wèi)生研究院(NIH)建議下,美國(guó)又相繼建立了20個(gè)生物計(jì)算中心,專門從事生物信息學(xué)相關(guān)研究和人才培養(yǎng)。目前,美國(guó)已經(jīng)成為世界上生物信息學(xué)研究實(shí)力*強(qiáng)的國(guó)家之一。GenBank由NIH提供維護(hù),并與DDBJ和EMBL —起,成為國(guó)際核苷酸序列數(shù)據(jù)庫(kù)的主要成員。 GenBank數(shù)據(jù)庫(kù)的堿基總量大約每13~15個(gè)月翻一番,如圖1-3所示。截至2009年8月,登錄的序列總量已經(jīng)達(dá)到108431692條,DNA堿基對(duì)(base pairs)已經(jīng)達(dá)到106533156756條。生物學(xué)數(shù)據(jù)的積累并不僅僅表現(xiàn)在DNA序列方面,與其同步的還有蛋白質(zhì)一級(jí)結(jié)構(gòu),即氨基酸序列的增長(zhǎng)。此外,還有其他大量數(shù)據(jù)庫(kù)資源已經(jīng)面向大眾。 是由一些國(guó)家支持的非贏利性機(jī)構(gòu)和一些知名大學(xué)的研究院所專門提供,也有部分是商業(yè)性質(zhì)的數(shù)據(jù)庫(kù)(如MDL)。分子生物信息數(shù)據(jù)庫(kù)種類繁多,一般而言,這些數(shù)據(jù)庫(kù)可以分為一級(jí)數(shù)據(jù)庫(kù)和二級(jí)數(shù)據(jù)庫(kù)。一級(jí)數(shù)據(jù)庫(kù)的數(shù)據(jù)都直接來(lái)源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過(guò)簡(jiǎn)單的歸類整理和注釋。因此,一級(jí)數(shù)據(jù)庫(kù)具有容量大、更新速度快、用戶面廣等特點(diǎn),運(yùn)行維護(hù)也需要具有高性能的計(jì)算機(jī)硬件和專門的數(shù)據(jù)庫(kù)管理系統(tǒng)(Database Management System,DBMS)作支撐。例如,歐洲生物信息學(xué)研究所維護(hù)EMBL使用的是Oracle,而基因組數(shù)據(jù)庫(kù)GDB的管理、運(yùn)行則基于Sybase數(shù)據(jù)庫(kù)系統(tǒng)。較為流行的數(shù)據(jù)庫(kù)管理軟件有Oracle、Sybase、 Informix和Microsoft SQLServer等。比較重要的一級(jí)核酸數(shù)據(jù)庫(kù)有GenBank、EMBL和DDBJ等;蛋白質(zhì)序列數(shù)據(jù)庫(kù)有Swiss-Prot蛋白質(zhì)序列數(shù)據(jù)庫(kù)(Swiss-Prot Protein Sequence Database)、蛋白質(zhì)信息資源(Protein Information Re-souce,PIR)等;蛋白質(zhì)結(jié)構(gòu)庫(kù)有PDB (Protein Data Bank)等,序列數(shù)據(jù)庫(kù)來(lái)自序列測(cè)定,結(jié)構(gòu)數(shù)據(jù)庫(kù)來(lái)自X射線衍射和核磁共振結(jié)構(gòu)測(cè)定。二級(jí)數(shù)據(jù)庫(kù)是在一級(jí)數(shù)據(jù)庫(kù)、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對(duì)特定目標(biāo)衍生而來(lái),是對(duì)生物學(xué)信息的進(jìn)一步整理。二級(jí)數(shù)據(jù)庫(kù)也稱專門數(shù)據(jù)庫(kù)、專業(yè)數(shù)據(jù)庫(kù)與專用數(shù)據(jù)庫(kù)。雖然二級(jí)數(shù)據(jù)庫(kù)的種類繁多,但其容量小,可以不用大型商業(yè)數(shù)據(jù)庫(kù)軟件支撐。 2.基因組序列信息的提取和分析 利用國(guó)際FST數(shù)據(jù)庫(kù)(dbEST)和各實(shí)驗(yàn)室自己測(cè)定的FST,通過(guò)電子克隆的方法發(fā)現(xiàn)新基因和新的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)位點(diǎn)以及各種功能位點(diǎn);基因組中非編碼區(qū)的信息結(jié)構(gòu)分析,提出理論模型,闡明該區(qū)域的重要生物學(xué)功能;進(jìn)行模式生物完整基因組的信息結(jié)構(gòu)分析和比較研究;利用生物信息研究遺傳密碼起源、基因組結(jié)構(gòu)的演化、基因組空間結(jié)構(gòu)與DNA折疊的關(guān)系,以及基因組信息與生物進(jìn)化關(guān)系等生物學(xué)的重大問(wèn)題。
- >
自卑與超越
- >
唐代進(jìn)士錄
- >
上帝之肋:男人的真實(shí)旅程
- >
伯納黛特,你要去哪(2021新版)
- >
伊索寓言-世界文學(xué)名著典藏-全譯本
- >
我與地壇
- >
姑媽的寶刀
- >
中國(guó)人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述