本书系统地介绍了进化算法在生物多序列比对中的应用,根据内容的分类,分为“多序列比对基础篇”“多序列比对模拟篇”和“多序列比对参数篇”三个模块。首先介绍生物多序列比对的基础知识,包括多序列比对的基本概念、原理、方法、常用数据库、常用工具和应用等内容,并介绍进化算法和化理论的基础知识,以及遗传算法、粒子群优化算法和量子粒子群优化算法的优化过程及收敛性分析,为进行多序列比对的模拟提供理论基础;然后详细介绍各进化算法模拟多序列比对的过程与结果;后对于多序列比对重要的目标函数参数进行建模与分析。本书具有系统性强、可读性强、可操作性强等特点。
介绍生物多序列比对的基础知识,包括多序列比对的基本概念、原理、方法、常用数据库、常用工具和应用等内容,并介绍进化算法和化理论的基础知识,以及遗传算法、粒子群优化算法和量子粒子群优化算法的优化过程及收敛性分析,为进行多序列比对的模拟提供理论基础;然后详细介绍各进化算法模拟多序列比对的过程与结果;后对于多序列比对重要的目标函数参数进行建模与分析。本书具有系统性强、可读性强、可操作性强等特点。
作 者 简 介龙海侠 1980年生,2007年获江南大学计算机软件与理论硕士学位,2010年获江南大学轻工信息技术与工程博士学位,现就职于海南师范大学信息科学技术学院,副教授。研究方向:群体智能算法、进化算法、生物信息。硕士期间从事群体智能算法和进化算法的研究及其在聚类、图像分割上的应用研究;博士期间从事生物信息的研究,重点研究多序列比对和培养基的优化;近5年从事深度学习算法和生物信息的研究。已出版教材1部、专著1部,30余篇,主持省级课题2项,作为及时完成人获得省级奖励2项。
李满枝 1979年生,2004年6月获西北工业大学计算数学专业理学硕士学位,现就职于海南师范大学数学与统计学院,副教授。主要研究方向:生物信息学、计算机数值模拟、算法构造等。硕士期间从事基于蒙特卡罗方法的计算机模拟,近5年从事生物信息中的蛋白质功能预测研究。已在国内外核心期刊及学术会议上发表多篇论文,出版专著1部,并作为主要成员参与省级和自然科学项目多项,现主持海南省自然科学基金“生物多序列比对的遗传算法模拟及改进”。 王洪涛 1978年生,2008年6月获海南师范大学应用数学专业理学硕士学位,现就职于海南师范大学数学与统计学院,副教授。主要研究方向:计算机数值模拟、算法构造、数学建模等。在国内外核心期刊及学术会议上发表多篇论文,出版专著1部,并作为主要成员参与海南省自然科学基金项目多项,目前是海南省自然科学基金“生物多序列比对的遗传算法模拟及改进”的第二参与人。
付海艳 1978年生,2002年获山东大学人工智能与模式识别硕士学位,2009年获山东大学系统理论博士学位,现就职于海南师范大学信息科学技术学院,教授。研究方向:评价理论与方法、决策理论与方法、不确定信息处理。硕士期间从事基于模糊集理论的评价方法和决策方法的研究,博士期间从事基于粗糙集理论和模糊集理论的不确定信息处理,近5年从事数据挖掘算法的研究。已出版教材2部、专著1部,30余篇,主持课题1项、省级课题6项,作为及时完成人获得省级奖励2项。
上篇 多序列比对基础篇
第1章 生物多序列比对 3
1.1 生物信息学 3
1.1.1 生物信息学的起源 3
1.1.2 生物信息学的概念 4
1.1.3 生物信息学的主要研究内容 4
1.2 序列比对的概念及其发展历史 8
1.2.1 序列比对的提出与基本概念 8
1.2.2 序列比对的目的和意义 8
1.2.3 国内外研究现状 10
1.2.4 多序列比对面临的挑战 10
1.3 多序列比对的基本原理 11
1.3.1 多序列比对的相关概念 11
1.3.2 序列比对的分类 12
1.3.3 多序列比对的数学定义 13
1.3.4 多序列比对的打分方法 14
1.4 多序列比对方法 22
1.4.1 比对方法 22
1.4.2 多序列比对算法 23
1.5 多序列比对常用数据库 33
1.5.1 综合性数据库 34
1.5.2 基准数据库 36
1.6 多序列比对常用工具 40
1.6.1 搜索工具 40
1.6.2 常用的在线多序列比对工具 42
1.7 多序列比对的应用 45
1.8 其他说明 46
1.8.1 多序列比对算法存在的问题 46
1.8.2 多序列比对算法的运算指标 47
1.8.3 多序列比对算法的展望 48
1.9 本章小结 48
参考文献 49
第2章 进化算法和化理论 53
2.1 进化算法 53
2.1.1 遗传算法 53
2.1.2 遗传规划 54
2.1.3 进化策略 56
2.1.4 进化规划 57
2.1.5 粒子群优化算法 58
2.1.6 量子粒子群优化算法 61
2.2 化理论 63
2.2.1 化问题 64
2.2.2 局部优化算法 66
2.2.3 全局优化算法 67
2.2.4 化问题的求解 67
2.3 本章小结 69
参考文献 69
第3章 遗传算法、粒子群优化算法和量子粒子群优化算法 73
3.1 遗传算法 73
3.1.1 遗传算法的基本思想 73
3.1.2 遗传算法中的基本术语 74
3.1.3 遗传算法的步骤及流程图 75
3.1.4 遗传算法的构成要素 76
3.1.5 遗传算法的优缺点 82
3.1.6 遗传算法的应用现状 84
3.1.7 遗传算法的改进 86
3.2 粒子群优化算法 87
3.2.1 基本粒子群优化算法 87
3.2.2 带惯性权重w的粒子群优化算法 89
3.2.3 带收缩因子 的粒子群优化算法 91
3.3 量子粒子群优化算法 92
3.3.1 势阱模型的建立 92
3.3.2 粒子的基本进化方程 95
3.3.3 QPSO算法的流程 96
3.3.4 QPSO算法的收敛性分析 97
3.4 QPSO算法的改进——基于选择操作的QPSO算法 103
3.4.1 引言 103
3.4.2 采用锦标赛选择操作的QPSO算法(QPSO-TS) 105
3.4.3 采用轮盘赌选择操作的QPSO算法(QPSO-RS) 106
3.4.4 算法的收敛性分析 107
3.5 本章小结 110
参考文献 110
中篇 多序列比对模拟篇
第4章 遗传算法在多序列比对中的应用 115
4.1 基本遗传算法模拟多序列比对 115
4.1.1 引言 115
4.1.2 多序列比对问题及数学描述 117
4.1.3 算法设计 117
4.1.4 实验算例与分析 120
4.1.5 结论 123
4.2 改进遗传算法之初始种群优化 124
4.2.1 引言 124
4.2.2 优化原理 125
4.2.3 几种初始化方法的构造 127
4.2.4 加入MAFFT种子的初始化 130
4.2.5 实验算例与结果 130
4.2.6 结论 135
4.3 改进遗传算法之交叉算子优化 136
4.3.1 引言 136
4.3.2 交叉算子设计 137
4.3.3 实验算例与结果 140
4.3.4 结论 143
4.4 本章小结 144
参考文献 144
第5章 QPSO算法在多序列比对中的应用 149
5.1 多序列比对的含义 149
5.2 基于二进制QPSO算法的序列比对 151
5.2.1 二进制的PSO算法(BPSO) 151
5.2.2 二进制的QPSO算法(BQPSO) 152
5.2.3 基于BPSO或BQPSO的多序列比对 156
5.3 本章小结 163
参考文献 165
第6章 基于隐马尔可夫模型和QPSO算法的多序列比对 167
6.1 引言 167
6.2 隐马尔可夫模型 168
6.2.1 隐马尔可夫模型的基本原理 168
6.2.2 隐马尔可夫模型的基本问题与算法 169
6.3 基于剖面HMM和QPSO的多序列比对 172
6.3.1 融合多样性的QPSO算法 174
6.3.2 评估训练算法的质量 179
6.3.3 模型的联配问题 179
6.3.4 评估比对序列的质量 181
6.4 本章小结 191
参考文献 191
第7章 多序列比对的并行计算 193
7.1 长序列首尾分段并行比对算法 193
7.1.1 引言 193
7.1.2 构造原理 195
7.1.3 数值模拟结果 196
7.1.4 结论 198
7.2 本章小结 198
参考文献 199
下篇 多序列比对参数篇
第8章 多序列比对的参数研究 203
8.1 基于SP目标函数的多序列比对参数研究 203
8.1.1 引言 203
8.1.2 基本定义 204
8.1.3 公式推导 206
8.1.4 实验结果与分析 210
8.1.5 结论 217
8.2 在线工具MAFFT参数研究 218
8.2.1 引言 218
8.2.2 基本定义 220
8.2.3 实验结果与分析 222
8.2.4 结论 229
8.3 本章小结 230
参考文献 231
附录 相关的源代码 235
附录A 基本遗传算法总程序 235
附录B 生成初始种群bio_var 239
附录C 生成初始种群rand_var 243
附录D 选择算子selection 245
附录E 横向多行交叉算子hhor_crossover4to2 248
附录F 纵向交叉算子ver_crossover4to2 253
附录G 变异算子mutation 259
附录H 适应度函数:SP函数 262
附录I 多序列比对参数研究的相关程序 264
附录J HMM和QPSO算法用于多序列比对的程序 266