《理解生物信息学》中包含,学习效果:每章开篇都有一个学习效果列表,它总结了该章所涉及的主题,可作为一个反馈清单。思维导图:每一章都含有一个思维导图,这是《理解生物信息学》一个特别的教学特征,它确保每个学生都能看到并记住一些特定应用中所必需的步骤。偶尔地,思维导图的两个独立方面也可能有着重要的关联。流程图:每一章的每个小节都有一个流程图以帮助读者记忆该小节所涵盖的主题。作为示例,下面给出了第5章的一个流程图,其中在本节将要解释的概念用深灰色框标注,且相互间用箭头连接起来。例如,两种主要类型的非常优联配:局部和全局将在本章的这一节描述。那些已在之前小节描述过的概念用浅灰色框标注,这样我们就很容易了解本节涉及的主题和已介绍过的主题间的联系。例如,构建联配需要为空缺 打分的方法和为替换打分的方法,两者都已经在这一章描述过了。通过这种方式,整章涉及的主要概念以及相互间的关系就能渐渐地被构架出来。插图:每一章都配有插图。插图的配置是经过充分考虑的,以保障既简单易懂又与本书其他章节保持连贯一致。扩展阅读:在这么一个快速发展的学科中,我们不可能在这本有限的《理解生物信息学》囊括现有的所有知识,更不用说将来的发展了。因此在每章的结尾我们都列了一些研究文献和专业著作的参考文献以帮助读者进一步扩展知识、发展技能。我们根据不同主题收集文章,使得扩展阅读中每节都与这一章相应小节的内容相对应。我们希望这能帮助阅读者以很快的速度找到他们感兴趣的扩展材料。字符表:生物信息学需要使用很多符号,对还不了解生物信息的人来说,许多符号都是不熟悉的。为了帮助读者了解本书适用的符号,我们在《理解生物信息学》后面给出了引用的每个符号、它的定义以及它在本书常出现的位置的列表。名词解释:在文中,所有技术术语在第1次出现时都用黑体显示,且在名词解释中列出其相应的解释。此外,每个在名词解释中的术语都会出现在索引中,这样读者就能很快获得详细介绍这一术语的相应页码。
导语_点评_推荐词
译者序
前言
给阅读者的短笺
致谢名单
第1部分 基础知识
第1章 核酸的世界
1.1DNA和 RNA的结构
DNA分子是由4种不同类型的碱基组成的线性多聚体
两条互补 DNA链通过碱基配对形成双螺旋
RNA分子通常为单链结构,但在某些情况下可形成碱基配对结构
1.2 DNARNA和蛋白质:中心法则
DNA是信息载体,而 RNA则是信使
信使RNA根据遗传密码翻译产生蛋白质
翻译过程涉及了含 DNA和 RNA的核糖体的转移
1.3基因结构和基因调控
特定的定位序列能和 RNA聚合酶结合,并识别转录起始点
真核生物中的转录起始信号远比细菌中复杂得多
真核生物 mRNA转录物在翻译前需经历一系列修饰
翻译的调控
1.4生命与进化之树
主要生命形式的基本特征
突变可以改变核苷酸序列
总结
名词解释
扩展阅读
第2章 蛋白质结构
2.1初级结构和二级结构
我们可从多个不同水平考察蛋白质结构
氨基酸是蛋白质的组成单位
侧链决定了氨基酸化学和物理特性的不同
蛋白质链中的氨基酸通过肽键共价连接
蛋白质的二级结构由α螺旋?β链构成
在蛋白质结构中已发现了几种不同类型的β折叠片
螺旋和链通过转角?发夹结构和环连接
2.2对生物信息学的启发
某些氨基酸倾向于形成特定的结构单元
从进化角度帮助序列分析
蛋白质结构的计算和可视化
2.3蛋白质通过折叠形成紧凑的结构
蛋白质的三级结构是通过多肽链的路径来定义的
蛋白质折叠的稳定状态是能量低的状态
很多蛋白质是由多个亚基组成的
总结
名词解释
扩展阅读
第3章 数据库的处理
3.1数据库的结构
平面文件数据库以文本文件的方式存储数据
关系数据库广泛应用于存储生物信息
XML的灵活性可以确定定制的数据分类
一些用于生物数据的其他数据库结构
数据库可以通过本地访问或通过互联网相互链接
3.2数据库类型
数据库中不仅仅是数据
原始数据和衍生数据
我们如何定义和链接事物的重要性:本体
3.3数据库搜索
序列数据库
芯片数据库
蛋白质相互作用数据库
结构数据库
3.4数据质量
非冗余性对一些应用特别重要
自动化方法可用于检查数据的一致性
初步的分析和注释通常是自动化完成的
为了产生高质量的注释经常需要人为干预
数据库更新和条目注释版本号的重要性
总结
名词解释
扩展阅读
第2部分 序列联配
第4章 产生和分析序列联配
4.1序列联配的原理
联配是在两个或更多序列的相同区域寻找较大相似性的任务
联配可以揭示序列间的同源性
比较蛋白质序列比核酸序列更容易检测同源性
4.2联配分值
一个联配的质量是通过给予一个量化的分值来衡量的
量化两个序列间的相似性的最简单的方法是百分数
基于一致度的点图可以可视化地评价相似性
真正的匹配不必相同
低一致度比可以被接受为具有显著性
对于打分联配有许多不同的方法
4.3替代矩阵
使用替代矩阵对每个排列后的序列位点分配一个单独的值
PAM 替代矩阵使用密切相关的蛋白质序列集的替代频率
BLOSUM 替代矩阵使用了局部高度保守区域序列的突变数据
替代矩阵的选择取决于要解决的问题
4.4插入空缺
在序列插入空缺以达到和另一条序列的相似度较大,需要罚分制度
动态规划算法可以决定引入空缺
4.5联配类型
对于不同情况采用不同类型的联配
多重序列联配能同时比较一些相似序列
有几种不同的技术可构造多重联配
多重联配可以提高低相似性序列联配的度
ClustalW 可以对 DNA和蛋白质序列进行全局联配
通过合并一些局部联配可以构建多重联配
增加新信息可以改进联配
4.6检索数据库
已开发了快速而的搜索算法
FASTA格式是一个基于较短的相同片段
匹配的快速的数据库搜索方法
BLAST的基础在于发现非常相似的短片段
对不同的问题采用不同版本的BLAST和FASTA
PSIBLAST基于配置文件的数据库搜索
SSEARCH 是一个严格的联配方法
4.7搜索核酸或蛋白质序列
可直接使用或翻译后的 DNA或 RNA序列
必须测试数据库的匹配质量,以确保其不可能是偶然发生
选择一个适当的犈值的阈值有助于限制数据库搜索
低复杂度区域可以将同源性搜索复杂化
不同的数据库可以用来解决具体问题
4.8蛋白质序列模体或模式
建立数据库的模式需要专业知识
BLOCKS数据库包含自动编译的保守蛋白质序列的多重联配的较短序列模块
4.9 使用模式和模体搜索
可以在PROSITE数据库中搜索蛋白质的模式和模体
基于模式的PHIBLAST程序同时搜索同源性和模体匹配
可以使用PRATT从多条序列产生模式
PRINTS数据库包括了指纹图谱,描述一个蛋白质家族的一些保守模体
Pfam数据库定义了蛋白质家族的表达谱
4.10模式和蛋白质功能
可以搜索蛋白质上特定的功能位点
序列比较不是分析蛋白质序列的途径
总结
名词解释
扩展阅读
第5章 序列比对及数据库搜索
5.1替换矩阵和打分
联配分值用于衡量公共进化祖先的似然性
PAM (MDM)替代打分矩阵用于探索蛋白质进化起源
BLOSUM 矩阵用于寻找保守的蛋白质区域
用于核苷酸联配的打分矩阵需由相似的方式得到
替换打分矩阵必须适用于特定的联配问题
插入空缺的打分相对替换而言使用了更为启发式的方法
5.2动态规划算法
使用改进后的 NeedlemanWunsch算法构建全局联配
对动态规划算法的简单改进就能用于局部序列联配
不计算完整的矩阵,牺牲度提高时间效率
5.3索引技术和近似算法
后缀树定位和独特及重复序列的位置
散列索引是一种技术,列出了所有k的起始位置元组 (ktuples)
FASTA算法使用哈希算法和快速链接进行数据库搜索
BLAST算法利用了有限状态自动机
直接比较核酸序列和蛋白质序列,需要对BLAST和FASTA进行特殊的调整
5.4联配分值的显著性
有空缺局部联配的统计可以按相似的算法进行
5.5联配全基因组序列
有效索引和扫描全基因组序列对高等生物序列比对至关重要
密切关联的物种基因组之间复杂进化关系需要创新的联配算法
总结
名词解释
扩展阅读
第6章模式?序列和多序列比对
6.1序列和序列标记
位置特异性分数矩阵是得分矩阵的扩展
解决构建PSSM 时数据缺失问题的方法
PSIBLAST是一个序列数据库检索程序
将序列表现为序列标记
6.2谱式隐马尔可夫模型
用于序列比对的 HMM 的基本结构
利用联配序列建立 HMM 参数
利用谱式 HMM 给序列打分:较大可能路径以及所有路径的总和
利用未联配序列评估 HMM 参数
6.3序列联配
利用联配比较两个PSSM
联配谱式 HMM
6.4利用序列递增 (gradualsequence addition)的多序列比对
序列添加的顺序是基于评估合并联配错误可能性而决定的
许多不同的打分策略用于建立多序列联配
多序列联配是利用向导树以及谱式方法构建的,且可能进一步改进
6.5其他获得多序列联配的方法
多序列联配程序 DIALIGN联配无间隙的区段
利用遗传算法的SAGA多序列联配方法
6.6序列模式发现
在多序列联配中查找模式:eMOTIF和AACC
序列中共有模式的概率查询:Gibbs和MEME
总结
名词解释
扩展阅读
第3部分进化过程
第7章重现进化历史
7.1系统发生树的结构和解释
系统发生树重建进化关系
用几种方式描述树的拓扑结构
一致树和可信树报告拓扑结构的比较结果
7.2分子进化及其结果
大多数相关序列有许多变异了几次的位置
可接受突变速率对所有类型的碱基替换通常是不相同的
密码子不同位置有不同的突变速率
只应该用直系同源基因构建物种系统发生树
基因组大区域变化是常见的
7.3系统发生树构建
核糖体小亚基rRNA序列非常适用于重建物种的进化
构树方法的选择在某种程度上依赖于数据集的大小和质量
在使用这些方法时必需选择一个进化模型
所有的系统发生分析必须以的多序列比对开始
16SRNA序列的一个小数据集的系统发生分析
为酶家族建立基因树有助于发现酶功能的进化
总结
名词解释
扩展阅读
第8章 构建系统发生树
8.1进化模型和进化距离的计算
一个简单但不衡量进化距离的是狆距离
Poisson校正距离考虑了同一位点上的多次突变
Gamma校正距离考虑了不同的序列位点上突变速率的差异
JukesCantor模型再现了核苷酸序列进化的一些基本特征
更复杂的模型区分不同类型突变的相对频率
在 DNA序列上存在核苷酸的偏好
蛋白质序列的进化模型和用于序列联配的替代矩阵密切相关
8.2产生系统发生树
聚类方法基于进化距离产生一个系统发育树
UPGMA方法假定一个恒定的分子钟,并产生一个等距树
FitehMargoliash方法产生一个无根的加性树
邻接法:此方法涉及最小进化的概念
通常使用逐步增加和星形分解方法用以产生一棵起始树用于进一步的探索,这不是最终树
8.3产生多种树的拓扑结构
分枝限界法大大提高了搜索树的拓扑结构的效率
可以通过对一个现存树做一系列细小的变化以优化树拓扑结构
寻找根给出了系统发生树在时间上的方向
8.4评价树的拓扑结构
可使用基于进化距离的函数以评价树
加权简约法寻找具有突变最少的树
使用简约法可以采用不同的方式对突变作加权
可以使用较大似然法用以评估树
四重奏迷惑 (quartetpuzzling)方法在标准执行中也包括了较大似然法
贝叶斯方法也可用于重建系统发生树
8.5评估树的特征和比较树的性
即使是完善的数据和方法也会出现长枝吸引的问题
可以检验内部分枝测试树的拓扑结构
用于比较两棵或两棵以上的树的检验方法
总结
名词解释
扩展阅读
第4部分 基因组特征
第9章 揭示基因组特征
9.1基因组序列的初步分析
将整个基因组序列分割开来简化基因检测
结构 RNA基因和重复序列在进一步分析中可以排除
同源性可以用于原核和真核基因的鉴定
9.2原核基因组中的基因预测
9.3真核基因组中的基因预测
外显子和内含子的预测程序使用了多种方法
基因预测必须要保持正确的阅读框
有些程序只利用查询序列和外显子模型来预测外显子
有些程序只利用查询序列和基因模型来预测外显子
可以利用基因模型和序列相似性来预测基因
相关物种的基因组可以用来帮助基因预测
9.4剪接位点的预测
剪接位点可以由专门的程序独立地鉴定
9.5启动子区域的预测
原核启动子有较好定义的基序
真核启动子一般要比原核启动子复杂
有许多启动子的在线预测工具
启动子预测结果并不十分清晰
9.6证实预测结果
有多种计算基因预测率的方法
翻译预测的外显子可以证实预测的性
构建蛋白质和鉴定同源基因
9.7基因组注释
基因组注释是基因组分析中的一步
GO(geneontology)提供了一套基因注释的标准词汇表
9.8大基因组比较
总结
名词解释
扩展阅读
第10章 基因检测和基因组注释理论章节
10.1利用决策树检测功能 RNA分子
利用tRNAscan算法检测tRNA基因
检测真核生物基因组中的tRNA基因
10.2原核生物基因检测中有用的特征
10.3原核生物基因检测的算法
GeneMark利用了非均匀马尔可夫链(inhomogeneousMarkovchains)和双密码子 (dicodon)统计
GLIMMER利用了编码概率的差值马尔科夫模型
ORPHEUS利用了同源性?密码子统计和核糖体结合位点
GeneMark.hmm 利用状态持续隐马尔可夫模型
EcoParse是一个 HMM 基因模型
10.4真核生物基因检测中用到的特征
真核生物基因与原核生物基因的差异
内含子?外显子和剪切位点
转录因子的启动子序列和结合位点
10.5预测真核生物基因信号
检测核心启动子结合信号是很多真核生物基因预测方法的关键元素
为了定位核心启动子序列信号而设计的一类模型
利用序列一般性质预测启动子区域可以去掉相当数量的假阳性结论
预测真核生物转录和翻译起始位点
转录和翻译终止信号给出基因完整定义
10.6预测外显子和内含子
可以利用普遍序列性质 (generalsequence property)来识别
剪切位点预测
可以通过序列模式与碱基统计相结合预测剪切位点
GenScan将加权矩阵和决策树整合以定位剪切位点
GeneSplicer利用一阶马尔可夫链预测剪切位点
NetPlantGene整合内含子和外显子的神经网络模型以预测剪切位点
其他特征可能也可以用于剪切位点预测
利用特定方法识别起始和终止外显子
利用数据库中的同源区域可以定义外显子
10.7完整真核生物基因模型
10.8预测独立基因之余
功能注释
通过比较相关基因组,可以减少难以确定的预测
基因检测方法的评估和再评估
总结
名词解释 308 oxviiio
扩展阅读
第5部分 二级结构
第11章从序列中获得二级结构
11.1预测方法的类型
基于规则的统计方法使残基形成一个特定二级结构成为可能
最近邻法是结合了有关蛋白质结构额外信息的统计方法
主要利用神经网络及隐马尔可夫方法进行二级结构预测的机器学习方法
11.2 训练和测试数据库
确定蛋白质二级结构的几种方法
11.3预测程序性评估
Q 3 衡量个别残基分配的精度
二级结构的预测不应该期望达到的残基精度
Sov值衡量全元素的预测精度
CAFASP/CASP:无偏的和随时可用的蛋白质预测评估
11.4统计和基于知识的方法
GOR方法用作信息论方法
Zpred程序包括了同源序列和残基保守信息的多重联配
使用多个序列信息提高整体预测精度
最近邻法:使用多个非同源序列
PREDATOR是一种综合了统计和基于知识的程序,其中包括了最近邻法
11.5二级结构预测的神经网络方法
评估神经网络预测的性
基于网络的神经网络二级结构预测程序的几个例子
PROF:蛋白质
这个商品不错~
书不错,不过包装实在不敢恭维,买了6本书,就一层纸箱子装,我收到箱子都破了个大洞,书也漏出来了,边角皱皱巴巴的。我还以为就我的这个是这样,恰巧碰的我一个同事,她也买的书,也在抱怨包装太差了,箱子破了个大洞,太不负责了。
这个商品不错呀,这个商品不错呀,
对于完全没基础的还是相当吃力的
这个商品不错~
这个商品不错~
还可以,学习的书,看着不错
这个商品不错~
好
帮别人买的专业书籍,反应说不错
好
这个商品不错,这个商品不错
good
很实惠,自学用
宝贝很好,第二天到货
新概念是经典中俄经典,所以没有什么可挑剔的。不过这套B的后半部门还是有点难度的,个人感觉比1A的前半部分难。也许是AB和1A1B之后不是同一个教育专家出的缘故吧。
包装挺好,配送也及时
作为礼物,朋友非常喜欢。物流很快
纸张很好!
内容很好,书是正版书,非常值得学习的书
真是样本生物信息学的好书,特别是每章后面的参考文献,这个特别合适。
一直特想看生物信息学方面的书,系统的学一下,只看了目录,很吸引人
在当当网买的《理解生物信息学》,这本书质量不错,装订印刷精美,内容先进,推荐各位同行购买
很好的生物信息学教材,我看过一部分了。感觉很好!非常推荐
还是不错的一本参考书,就是弄一帮学生翻译的有点粗糙,要是直接出英文影音版就好了。
内容很好,书是正版书,先后买了两本,送朋友一本,非常值得学习的书。
Zvelebil博士尽可能全面的收录了生物信息领域的知识,是一本内容非常丰富的书,翻译的也不错
目前为止生物信息学最全面最好的一本书,值得买下来仔细研读。是翻译国外的书,版权贵,所以书价也略贵,不过物有所值