在线客服
理解生物信息学图书
人气:48

理解生物信息学

收录了生物信息领域的知识,每章开篇都有一个学习效果列表,它总结了该章所涉及的主题,可作为一个反馈清单。

内容简介

《理解生物信息学》中包含,学习效果:每章开篇都有一个学习效果列表,它总结了该章所涉及的主题,可作为一个反馈清单。思维导图:每一章都含有一个思维导图,这是《理解生物信息学》一个特别的教学特征,它确保每个学生都能看到并记住一些特定应用中所必需的步骤。偶尔地,思维导图的两个独立方面也可能有着重要的关联。流程图:每一章的每个小节都有一个流程图以帮助读者记忆该小节所涵盖的主题。作为示例,下面给出了第5章的一个流程图,其中在本节将要解释的概念用深灰色框标注,且相互间用箭头连接起来。例如,两种主要类型的非常优联配:局部和全局将在本章的这一节描述。那些已在之前小节描述过的概念用浅灰色框标注,这样我们就很容易了解本节涉及的主题和已介绍过的主题间的联系。例如,构建联配需要为空缺 打分的方法和为替换打分的方法,两者都已经在这一章描述过了。通过这种方式,整章涉及的主要概念以及相互间的关系就能渐渐地被构架出来。插图:每一章都配有插图。插图的配置是经过充分考虑的,以保障既简单易懂又与本书其他章节保持连贯一致。扩展阅读:在这么一个快速发展的学科中,我们不可能在这本有限的《理解生物信息学》囊括现有的所有知识,更不用说将来的发展了。因此在每章的结尾我们都列了一些研究文献和专业著作的参考文献以帮助读者进一步扩展知识、发展技能。我们根据不同主题收集文章,使得扩展阅读中每节都与这一章相应小节的内容相对应。我们希望这能帮助阅读者以很快的速度找到他们感兴趣的扩展材料。字符表:生物信息学需要使用很多符号,对还不了解生物信息的人来说,许多符号都是不熟悉的。为了帮助读者了解本书适用的符号,我们在《理解生物信息学》后面给出了引用的每个符号、它的定义以及它在本书常出现的位置的列表。名词解释:在文中,所有技术术语在第1次出现时都用黑体显示,且在名词解释中列出其相应的解释。此外,每个在名词解释中的术语都会出现在索引中,这样读者就能很快获得详细介绍这一术语的相应页码。

编辑推荐

导语_点评_推荐词

目录

译者序

前言

给阅读者的短笺

致谢名单

第1部分 基础知识

第1章 核酸的世界

1.1DNA和 RNA的结构

DNA分子是由4种不同类型的碱基组成的线性多聚体

两条互补 DNA链通过碱基配对形成双螺旋

RNA分子通常为单链结构,但在某些情况下可形成碱基配对结构

1.2 DNARNA和蛋白质:中心法则

DNA是信息载体,而 RNA则是信使

信使RNA根据遗传密码翻译产生蛋白质

翻译过程涉及了含 DNA和 RNA的核糖体的转移

1.3基因结构和基因调控

特定的定位序列能和 RNA聚合酶结合,并识别转录起始点

真核生物中的转录起始信号远比细菌中复杂得多

真核生物 mRNA转录物在翻译前需经历一系列修饰

翻译的调控

1.4生命与进化之树

主要生命形式的基本特征

突变可以改变核苷酸序列

总结

名词解释

扩展阅读

第2章 蛋白质结构

2.1初级结构和二级结构

我们可从多个不同水平考察蛋白质结构

氨基酸是蛋白质的组成单位

侧链决定了氨基酸化学和物理特性的不同

蛋白质链中的氨基酸通过肽键共价连接

蛋白质的二级结构由α螺旋?β链构成

在蛋白质结构中已发现了几种不同类型的β折叠片

螺旋和链通过转角?发夹结构和环连接

2.2对生物信息学的启发

某些氨基酸倾向于形成特定的结构单元

从进化角度帮助序列分析

蛋白质结构的计算和可视化

2.3蛋白质通过折叠形成紧凑的结构

蛋白质的三级结构是通过多肽链的路径来定义的

蛋白质折叠的稳定状态是能量低的状态

很多蛋白质是由多个亚基组成的

总结

名词解释

扩展阅读

第3章 数据库的处理

3.1数据库的结构

平面文件数据库以文本文件的方式存储数据

关系数据库广泛应用于存储生物信息

XML的灵活性可以确定定制的数据分类

一些用于生物数据的其他数据库结构

数据库可以通过本地访问或通过互联网相互链接

3.2数据库类型

数据库中不仅仅是数据

原始数据和衍生数据

我们如何定义和链接事物的重要性:本体

3.3数据库搜索

序列数据库

芯片数据库

蛋白质相互作用数据库

结构数据库

3.4数据质量

非冗余性对一些应用特别重要

自动化方法可用于检查数据的一致性

初步的分析和注释通常是自动化完成的

为了产生高质量的注释经常需要人为干预

数据库更新和条目注释版本号的重要性

总结

名词解释

扩展阅读

第2部分 序列联配

第4章 产生和分析序列联配

4.1序列联配的原理

联配是在两个或更多序列的相同区域寻找较大相似性的任务

联配可以揭示序列间的同源性

比较蛋白质序列比核酸序列更容易检测同源性

4.2联配分值

一个联配的质量是通过给予一个量化的分值来衡量的

量化两个序列间的相似性的最简单的方法是百分数

基于一致度的点图可以可视化地评价相似性

真正的匹配不必相同

低一致度比可以被接受为具有显著性

对于打分联配有许多不同的方法

4.3替代矩阵

使用替代矩阵对每个排列后的序列位点分配一个单独的值

PAM 替代矩阵使用密切相关的蛋白质序列集的替代频率

BLOSUM 替代矩阵使用了局部高度保守区域序列的突变数据

替代矩阵的选择取决于要解决的问题

4.4插入空缺

在序列插入空缺以达到和另一条序列的相似度较大,需要罚分制度

动态规划算法可以决定引入空缺

4.5联配类型

对于不同情况采用不同类型的联配

多重序列联配能同时比较一些相似序列

有几种不同的技术可构造多重联配

多重联配可以提高低相似性序列联配的度

ClustalW 可以对 DNA和蛋白质序列进行全局联配

通过合并一些局部联配可以构建多重联配

增加新信息可以改进联配

4.6检索数据库

已开发了快速而的搜索算法

FASTA格式是一个基于较短的相同片段

匹配的快速的数据库搜索方法

BLAST的基础在于发现非常相似的短片段

对不同的问题采用不同版本的BLAST和FASTA

PSIBLAST基于配置文件的数据库搜索

SSEARCH 是一个严格的联配方法

4.7搜索核酸或蛋白质序列

可直接使用或翻译后的 DNA或 RNA序列

必须测试数据库的匹配质量,以确保其不可能是偶然发生

选择一个适当的犈值的阈值有助于限制数据库搜索

低复杂度区域可以将同源性搜索复杂化

不同的数据库可以用来解决具体问题

4.8蛋白质序列模体或模式

建立数据库的模式需要专业知识

BLOCKS数据库包含自动编译的保守蛋白质序列的多重联配的较短序列模块

4.9 使用模式和模体搜索

可以在PROSITE数据库中搜索蛋白质的模式和模体

基于模式的PHIBLAST程序同时搜索同源性和模体匹配

可以使用PRATT从多条序列产生模式

PRINTS数据库包括了指纹图谱,描述一个蛋白质家族的一些保守模体

Pfam数据库定义了蛋白质家族的表达谱

4.10模式和蛋白质功能

可以搜索蛋白质上特定的功能位点

序列比较不是分析蛋白质序列的途径

总结

名词解释

扩展阅读

第5章 序列比对及数据库搜索

5.1替换矩阵和打分

联配分值用于衡量公共进化祖先的似然性

PAM (MDM)替代打分矩阵用于探索蛋白质进化起源

BLOSUM 矩阵用于寻找保守的蛋白质区域

用于核苷酸联配的打分矩阵需由相似的方式得到

替换打分矩阵必须适用于特定的联配问题

插入空缺的打分相对替换而言使用了更为启发式的方法

5.2动态规划算法

使用改进后的 NeedlemanWunsch算法构建全局联配

对动态规划算法的简单改进就能用于局部序列联配

不计算完整的矩阵,牺牲度提高时间效率

5.3索引技术和近似算法

后缀树定位和独特及重复序列的位置

散列索引是一种技术,列出了所有k的起始位置元组 (ktuples)

FASTA算法使用哈希算法和快速链接进行数据库搜索

BLAST算法利用了有限状态自动机

直接比较核酸序列和蛋白质序列,需要对BLAST和FASTA进行特殊的调整

5.4联配分值的显著性

有空缺局部联配的统计可以按相似的算法进行

5.5联配全基因组序列

有效索引和扫描全基因组序列对高等生物序列比对至关重要

密切关联的物种基因组之间复杂进化关系需要创新的联配算法

总结

名词解释

扩展阅读

第6章模式?序列和多序列比对

6.1序列和序列标记

位置特异性分数矩阵是得分矩阵的扩展

解决构建PSSM 时数据缺失问题的方法

PSIBLAST是一个序列数据库检索程序

将序列表现为序列标记

6.2谱式隐马尔可夫模型

用于序列比对的 HMM 的基本结构

利用联配序列建立 HMM 参数

利用谱式 HMM 给序列打分:较大可能路径以及所有路径的总和

利用未联配序列评估 HMM 参数

6.3序列联配

利用联配比较两个PSSM

联配谱式 HMM

6.4利用序列递增 (gradualsequence addition)的多序列比对

序列添加的顺序是基于评估合并联配错误可能性而决定的

许多不同的打分策略用于建立多序列联配

多序列联配是利用向导树以及谱式方法构建的,且可能进一步改进

6.5其他获得多序列联配的方法

多序列联配程序 DIALIGN联配无间隙的区段

利用遗传算法的SAGA多序列联配方法

6.6序列模式发现

在多序列联配中查找模式:eMOTIF和AACC

序列中共有模式的概率查询:Gibbs和MEME

总结

名词解释

扩展阅读

第3部分进化过程

第7章重现进化历史

7.1系统发生树的结构和解释

系统发生树重建进化关系

用几种方式描述树的拓扑结构

一致树和可信树报告拓扑结构的比较结果

7.2分子进化及其结果

大多数相关序列有许多变异了几次的位置

可接受突变速率对所有类型的碱基替换通常是不相同的

密码子不同位置有不同的突变速率

只应该用直系同源基因构建物种系统发生树

基因组大区域变化是常见的

7.3系统发生树构建

核糖体小亚基rRNA序列非常适用于重建物种的进化

构树方法的选择在某种程度上依赖于数据集的大小和质量

在使用这些方法时必需选择一个进化模型

所有的系统发生分析必须以的多序列比对开始

16SRNA序列的一个小数据集的系统发生分析

为酶家族建立基因树有助于发现酶功能的进化

总结

名词解释

扩展阅读

第8章 构建系统发生树

8.1进化模型和进化距离的计算

一个简单但不衡量进化距离的是狆距离

Poisson校正距离考虑了同一位点上的多次突变

Gamma校正距离考虑了不同的序列位点上突变速率的差异

JukesCantor模型再现了核苷酸序列进化的一些基本特征

更复杂的模型区分不同类型突变的相对频率

在 DNA序列上存在核苷酸的偏好

蛋白质序列的进化模型和用于序列联配的替代矩阵密切相关

8.2产生系统发生树

聚类方法基于进化距离产生一个系统发育树

UPGMA方法假定一个恒定的分子钟,并产生一个等距树

FitehMargoliash方法产生一个无根的加性树

邻接法:此方法涉及最小进化的概念

通常使用逐步增加和星形分解方法用以产生一棵起始树用于进一步的探索,这不是最终树

8.3产生多种树的拓扑结构

分枝限界法大大提高了搜索树的拓扑结构的效率

可以通过对一个现存树做一系列细小的变化以优化树拓扑结构

寻找根给出了系统发生树在时间上的方向

8.4评价树的拓扑结构

可使用基于进化距离的函数以评价树

加权简约法寻找具有突变最少的树

使用简约法可以采用不同的方式对突变作加权

可以使用较大似然法用以评估树

四重奏迷惑 (quartetpuzzling)方法在标准执行中也包括了较大似然法

贝叶斯方法也可用于重建系统发生树

8.5评估树的特征和比较树的性

即使是完善的数据和方法也会出现长枝吸引的问题

可以检验内部分枝测试树的拓扑结构

用于比较两棵或两棵以上的树的检验方法

总结

名词解释

扩展阅读

第4部分 基因组特征

第9章 揭示基因组特征

9.1基因组序列的初步分析

将整个基因组序列分割开来简化基因检测

结构 RNA基因和重复序列在进一步分析中可以排除

同源性可以用于原核和真核基因的鉴定

9.2原核基因组中的基因预测

9.3真核基因组中的基因预测

外显子和内含子的预测程序使用了多种方法

基因预测必须要保持正确的阅读框

有些程序只利用查询序列和外显子模型来预测外显子

有些程序只利用查询序列和基因模型来预测外显子

可以利用基因模型和序列相似性来预测基因

相关物种的基因组可以用来帮助基因预测

9.4剪接位点的预测

剪接位点可以由专门的程序独立地鉴定

9.5启动子区域的预测

原核启动子有较好定义的基序

真核启动子一般要比原核启动子复杂

有许多启动子的在线预测工具

启动子预测结果并不十分清晰

9.6证实预测结果

有多种计算基因预测率的方法

翻译预测的外显子可以证实预测的性

构建蛋白质和鉴定同源基因

9.7基因组注释

基因组注释是基因组分析中的一步

GO(geneontology)提供了一套基因注释的标准词汇表

9.8大基因组比较

总结

名词解释

扩展阅读

第10章 基因检测和基因组注释理论章节

10.1利用决策树检测功能 RNA分子

利用tRNAscan算法检测tRNA基因

检测真核生物基因组中的tRNA基因

10.2原核生物基因检测中有用的特征

10.3原核生物基因检测的算法

GeneMark利用了非均匀马尔可夫链(inhomogeneousMarkovchains)和双密码子 (dicodon)统计

GLIMMER利用了编码概率的差值马尔科夫模型

ORPHEUS利用了同源性?密码子统计和核糖体结合位点

GeneMark.hmm 利用状态持续隐马尔可夫模型

EcoParse是一个 HMM 基因模型

10.4真核生物基因检测中用到的特征

真核生物基因与原核生物基因的差异

内含子?外显子和剪切位点

转录因子的启动子序列和结合位点

10.5预测真核生物基因信号

检测核心启动子结合信号是很多真核生物基因预测方法的关键元素

为了定位核心启动子序列信号而设计的一类模型

利用序列一般性质预测启动子区域可以去掉相当数量的假阳性结论

预测真核生物转录和翻译起始位点

转录和翻译终止信号给出基因完整定义

10.6预测外显子和内含子

可以利用普遍序列性质 (generalsequence property)来识别

剪切位点预测

可以通过序列模式与碱基统计相结合预测剪切位点

GenScan将加权矩阵和决策树整合以定位剪切位点

GeneSplicer利用一阶马尔可夫链预测剪切位点

NetPlantGene整合内含子和外显子的神经网络模型以预测剪切位点

其他特征可能也可以用于剪切位点预测

利用特定方法识别起始和终止外显子

利用数据库中的同源区域可以定义外显子

10.7完整真核生物基因模型

10.8预测独立基因之余

功能注释

通过比较相关基因组,可以减少难以确定的预测

基因检测方法的评估和再评估

总结

名词解释 308 oxviiio

扩展阅读

第5部分 二级结构

第11章从序列中获得二级结构

11.1预测方法的类型

基于规则的统计方法使残基形成一个特定二级结构成为可能

最近邻法是结合了有关蛋白质结构额外信息的统计方法

主要利用神经网络及隐马尔可夫方法进行二级结构预测的机器学习方法

11.2 训练和测试数据库

确定蛋白质二级结构的几种方法

11.3预测程序性评估

Q 3 衡量个别残基分配的精度

二级结构的预测不应该期望达到的残基精度

Sov值衡量全元素的预测精度

CAFASP/CASP:无偏的和随时可用的蛋白质预测评估

11.4统计和基于知识的方法

GOR方法用作信息论方法

Zpred程序包括了同源序列和残基保守信息的多重联配

使用多个序列信息提高整体预测精度

最近邻法:使用多个非同源序列

PREDATOR是一种综合了统计和基于知识的程序,其中包括了最近邻法

11.5二级结构预测的神经网络方法

评估神经网络预测的性

基于网络的神经网络二级结构预测程序的几个例子

PROF:蛋白质

网友评论(不代表本站观点)

来自月下青**的评论:

这个商品不错~

2014-03-02 23:29:52
来自无昵称**的评论:

书不错,不过包装实在不敢恭维,买了6本书,就一层纸箱子装,我收到箱子都破了个大洞,书也漏出来了,边角皱皱巴巴的。我还以为就我的这个是这样,恰巧碰的我一个同事,她也买的书,也在抱怨包装太差了,箱子破了个大洞,太不负责了。

2014-04-08 21:46:05
来自无昵称**的评论:

这个商品不错呀,这个商品不错呀,

2014-04-10 01:22:32
来自will728**的评论:

对于完全没基础的还是相当吃力的

2014-05-20 00:05:18
来自ivying0**的评论:

这个商品不错~

2014-05-27 10:12:52
来自gpf8004**的评论:

这个商品不错~

2014-09-01 16:38:45
来自无昵称**的评论:

还可以,学习的书,看着不错

2014-10-15 10:06:21
来自suckboy**的评论:

这个商品不错~

2014-11-10 18:57:20
来自RP王**的评论:

2015-01-06 15:10:41
来自无昵称**的评论:

帮别人买的专业书籍,反应说不错

2015-06-25 15:42:34
来自无昵称**的评论:

2015-07-28 12:38:59
来自xiangyu**的评论:

这个商品不错,这个商品不错

2015-11-23 15:46:22
来自bestwml**的评论:

good

2015-11-28 14:55:20
来自无昵称**的评论:

很实惠,自学用

2016-06-24 23:11:12
来自匿名用**的评论:

宝贝很好,第二天到货

2017-02-12 07:49:34
来自无昵称**的评论:

新概念是经典中俄经典,所以没有什么可挑剔的。不过这套B的后半部门还是有点难度的,个人感觉比1A的前半部分难。也许是AB和1A1B之后不是同一个教育专家出的缘故吧。

2017-06-22 15:42:35
来自匿名用**的评论:

包装挺好,配送也及时

2017-07-15 10:32:27
来自匿名用**的评论:

作为礼物,朋友非常喜欢。物流很快

2017-07-24 21:17:59
来自无昵称**的评论:

纸张很好!

2017-09-07 19:56:20
来自无昵称**的评论:

内容很好,书是正版书,非常值得学习的书

2017-11-02 08:42:29
来自mark303**的评论:

真是样本生物信息学的好书,特别是每章后面的参考文献,这个特别合适。

2012-06-04 12:13:26
来自无昵称**的评论:

一直特想看生物信息学方面的书,系统的学一下,只看了目录,很吸引人

2012-09-16 22:15:57
来自无昵称**的评论:

在当当网买的《理解生物信息学》,这本书质量不错,装订印刷精美,内容先进,推荐各位同行购买

2012-04-20 15:57:45
来自无昵称**的评论:

很好的生物信息学教材,我看过一部分了。感觉很好!非常推荐

2013-04-16 13:52:24
来自江苏blu**的评论:

还是不错的一本参考书,就是弄一帮学生翻译的有点粗糙,要是直接出英文影音版就好了。

2012-11-08 00:12:56
来自gpf8004**的评论:

内容很好,书是正版书,先后买了两本,送朋友一本,非常值得学习的书。

2014-08-31 10:14:58
来自heiheib**的评论:

Zvelebil博士尽可能全面的收录了生物信息领域的知识,是一本内容非常丰富的书,翻译的也不错

2012-04-13 13:20:05
来自无昵称**的评论:

目前为止生物信息学最全面最好的一本书,值得买下来仔细研读。是翻译国外的书,版权贵,所以书价也略贵,不过物有所值

2015-08-26 21:55:25

免责声明

更多出版社