內容簡介
《生物計算:生物序列的分析方法與應用》介紹生物計算中的幾種主要方法,如序列比對、係統發育分析、蛋白質序列的語義分析與結構預測、基因識彆與生物芯片的數據分析等,給齣它們的基本問題與有關的方法及應用。全書由三部分組成。一部分介紹這些問題的由來與主要內容,給齣它們的基本原理、計算與分析方法及應用意義,同時介紹一些國際上較為通用的軟件包。第二部分是生物學備忘錄,介紹有關生物學的基礎知識。第三部分是數學備忘錄,介紹與這些生物計算有關的數學理論與方法。
《生物計算:生物序列的分析方法與應用》可作為數學、生物、醫學、化學等專業的本科生或研究生教材,其中一部分內容可作為各專業的公共部分,而第二、三部分內容可供各專業適當選用。
內頁插圖
目錄
《數學與現代科學技術叢書》序
前言
第一部分 基本方法
第1章 生物序列突變與比對分析
1.1 生物序列突變與比對問題
1.1.1 生物序列的類型與結構
1.1.2 生物序列突變與比對問題的意義與應用
1.1.3 生物序列比對的原理與方法
1.2 二重序列比對的有關算法
1.2.1 關於動態規劃算法的一些說明
1.2.2 動態規劃算法
1.2.3 統計判決算法的基本思想
1.2.4 BLAST軟件的使用
1.3 多重序列的比對問題
1.3.1 MSA的意義與概況
1.3.2 MSA的定義與優化準則
1.4 MSA算法與計算
1.4.1 MSA算法的基本概念
1.4.2 MSA的算法步驟
1.4.3 ClustalW軟件的使用
1.4.4 關於MSA的幾點說明
1.4.5 幾個多重序列比對應用例子
1.5 SPA算法的原理與計算
1.5.1 SPA算法的基本原理
1.5.2 SPA算法的基本步驟
1.5.3 SPA算法源碼
1.5.4 SPA算法的有關問題討論
1.5.5 SPA算法的一個實例計算
習題與思考
第2章 係統發育分析
2.1 分子係統發育分析的基本概念
2.2 基於距離的方法
2.2.1 非加權分組平均法
2.2.2 鄰接法
2.3 基於特徵的方法
2.4 極大似然和Bayes方法
2.4.1 進化的概率論模型
2.4.2 構建進化樹的極大似然方法
2.4.3 構建進化樹的Bayes方法
2.5 構建進化樹軟件簡介
習題與思考
第3章 蛋白質一級結構的語義分析
3.1 蛋白質一級結構的信息與統計分析法
3.1.1 蛋白質一級結構的語義分析簡介
3.1.2 信息、統計分析法的要素與要點
3.1.3 局部詞的定義與判定
3.1.4 蛋白質一級結構的語義分析
3.2 蛋白質序列語義結構的組閤分析法
3.2.1 關於組閤圖論的有關記號
3.2.2 數據庫的復雜度
3.2.3 數據庫的關鍵詞與核心詞
3.2.4 關於組閤分析的若乾應用問題
習題與思考
第4章 蛋白質結構預測
4.1 蛋白質二級結構預測
4.1.1 蛋白質二級結構預測的評價體係
4.1.2 Chou-Fasman方法
4.1.3 GOR方法
4.1.4 FHD方法
4.2 蛋白質空間結構預測
4.2.1 同源序列搜索
4.2.2 摺疊識彆方法
4.2.3 從頭預測方法
4.3 蛋白質結構預測軟件簡介
4.3.1 PHD軟件使用簡介
4.3.2 使用nnpredict.軟件預測蛋白質二級結構
4.3.3 PSIPRED軟件使用簡介
習題與思考
第5章 基因識彆
5.1 緒論
5.1.1 原核基因識彆
5.1.2 真核基因識彆
5.1.3 常用模式基因組簡介
5.2 基因序列特徵分析
5.2.1 內含子與外顯子
5.2.2 CpG島
5.2.3 密碼子使用偏性
5.3 開放閱讀框識彆
5.3.1 開放閱讀框特性
5.3.2 開放閱讀框識彆原理
5.3.3 開放閱讀框識彆軟件使用
5.4 Markov模型基因識彆方法
5.4.1 隱Markov模型
5.4.2 GENSCAN隱Markov模型方法和原理
5.4.3 GENSCAN軟件使用
5.4.4 基因識彆方法評價
5.5 其他基因識彆方法簡介
5.5.1 神經網絡方法
5.5.2 z麯綫方法
習題與思考
第6章 基因錶達數據分析
6.1 基因錶達序列標簽數據分析簡介
6.1.1 基因錶達序列標簽的概念
6.1.2 基因錶達序列標簽數據的獲取
6.1.3 基因錶達序列標簽數據聚類分析
6.1.4 基因錶達序列標簽的應用
6.2 基因芯片數據的獲取
6.2.1 基本概念
6.2.2 基因芯片實驗過程
6.2.3 基因芯片數據獲取
6.2.4 基因芯片數據內容
6.3 基因芯片數據分析
6.3.1 基因錶達譜芯片數據標準化
6.3.2 基因錶達譜芯片數據散點圖分析
6.3.3 基因錶達差異顯著性分析
6.4 基因芯片數據聚類分析
6.4.1 基本概念
6.4.2 特徵描述
6.4.3 分層聚類方法
6.4.4 模糊聚類方法
6.5 其他基因芯片數據分析方法簡介
6.5.1 支持嚮量機方法
6.5.2 K均值聚類
6.5.3 自組織映射圖聚類
6.6 基因芯片數據分析軟件簡介
習題與思考
第二部分 生物學備忘錄
第7章 核酸與DNA
7.1 細胞與染色體
7.1.1 細胞
7.1.2 染色體概念
7.1.3 染色體特徵
7.2 核酸分子與DNA結構
7.2.1 核酸分子
7.2.2 DNA分子結構
7.3 RNA結構與分類
7.3.1 RNA結構
7.3.2 RNA分類
第8章 氨基酸與蛋白質
8.1 氨基酸
8.1.1 氨基酸組成
8.1.2 氨基酸符號錶示
8.1.3 氨基酸分類
8.2 肽鏈
……
第9章 基因與基因組
第10章 生物信息數據庫
第三部分 數學備忘錄
第11章 智能計算理論與算法
第12章 概率、信息與統計
第13章 隨機過程
參考文獻
索引
精彩書摘
(2)重復序列與基因交叉問題。由人類基因組與各種不同類型生物體基因組的測定發現,在同一生物體(尤其是在高等生物體)的基因組中,存在大量基因的重復與交叉問題。所謂重復序列,就是在同一基因組中一些DNA片段重復齣現,這些片段有長有短,較長的片段長達數百萬,有的片段雖短,但可能重復齣現數百萬次。這種重復不是簡單一緻定義下的相同,而是在一定相似率定義下的重復,因此必須通過序列的比對纔能發現並確定這些重復序列。
基因的交叉就是同一基因在基因組中往往由多條不同的DNA片段組成,在生物學中稱這些組成基因的不同片段為外顯子,中間間隔部分稱為內含子,在基因編碼成蛋白質時,內含子被切除,部分外顯子排列的次序會發生重疊或顛倒,生物學中稱這種現象為基因交叉,這種交叉結構的分析同樣需要序列的比對計算。
前言/序言
生物計算中的理論、方法與應用越來越被生物、醫學及其他醫務工作者所需要與關注,特彆是在人類基因組計劃實施以來,該學科的發展與研究更凸顯齣重要的作用。基因、基因組、蛋白質、蛋白質組等生物學信息的數據采集、儲存與分析及其生物學意義,是生物計算乃至生物、醫學與醫藥的重點研究內容之一。因此在國內外的許多醫科院校均被作為重要課程,與生物信息學和生物計算相關內容的課程不僅是研究生的必修課程或選修課程,也是多個專業本科生的專業必修課程或選修課程。我們先後用瞭近三年的時間,在開展教學和研究工作的同時編寫瞭本書,目的是為生物學和醫學相關專業的本科生與研究生提供一本既通俗易懂,同時又可深入瞭解相關內容的教材,為該學科的建設與發展服務。
自2004年以來,本人有幸多次參加南開大學數學科學學院瀋世鎰教授主持的“生物信息學”討論班。在討論與學習過程中,不僅掌握瞭一些解決生物序列分析與計算的具體算法,更重要的是學到瞭解決生物序列分析的一些新方法和新思想。如生物序列的多種比對算法、數據結構中的語義分析及其在蛋白質結構分析中的應用等。這些方法從不同角度對生物計算中的有關問題進行研究與探討,並在許多方麵得到瞭很好的應用。在學習過程中,與南開大學數學科學學院鬍剛、王奎博士等閤作,對生物計算中的算法以及相關軟件包的使用等問題有瞭更深入與確切的理解,使本書得以順利完成。我們希望能將該領域中的主要內容與方法介紹給讀者。
“生物計算”與“生物信息學”在本質上無大的區彆,國內外的許多院校均把它們看作同一領域的學科。在本書中,我們把“生物計算”看作較偏重於原理與方法,同時注重它們的實現與應用,在介紹國外先進與常用算法的同時,增加瞭相應軟件包的使用與分析等內容。
生物計算:生物序列的分析方法與應用 下載 mobi epub pdf txt 電子書 格式