《视觉机器学习20讲》是计算机、自动化、信息、电子与通信学科方向的专著,详尽地介绍了K-Means、KNN学习、回归学习、决策树学习、Random Forest、贝叶斯学习、EM算法、 Adaboost、SVM方法、增强学习、流形学习、RBF学习、稀疏表示、字典学习、BP学习、CNN学习、RBM学习、深度学习、遗传算法、蚁群方法等基本理论;深入阐述了视觉机器学习算法的优化方法和实验仿真;系统地总结了其优点和不足。
本书特别重视如何将视觉机器学习算法的理论和实践有机地结合,解决视觉机器学习领域中的诸多基础问题,可应用于医学图像分析、工业自动化、机器人、无人车、人脸检测与识别、车辆信息识别、行为检测与识别、智能视频监控等。本书特别重视算法的典型性和可实现性,既包含本领域的经典算法,也包含本领域的研究成果。
本书不仅可作为高年级本科生与研究生教材,而且也是从事视觉机器学习领域研发极为有用的参考资料。
本书是在机器学习领域12位博士多年研究机器学习的基础理论、核心算法、关键技术和应用实践的科学结晶,是作者们多年相关科研实践的心得体会和系统总结。
本书从基本理论、实现方法、改进方法、仿真流程、核心代码、源程序、实验数据等方面深入浅出地阐述了20个常用机器学习方法,适合于从事医学图像分析、工业自动化、机器人、无人车、人脸检测与识别、车辆信息识别、行为检测与识别、智能视频监控等领域的研究生和技术人员。
谢剑斌,博士,教授,国防科学技术大学电子科学与工程学院研究生导师,中国生物特征识别国家标准组委员,中国数字电视国家标准组委员,中国图像图形学会高级会员,计算机学会高级会员,电光与控制编委会委员。长期从事海量视频分析与生物特征识别方面的研究工作,作为项目负责人主持项目8项、部委级项目27项、横向课题39项。在国内外知名期刊发表学术论文90100多篇,出版专著6部,授权国家发明专利21项、实用新型专利32项。荣获国际“发明展”金奖2项、湖南省科技进步二等奖1项、公安部技术革新特别项目奖2项、全国“发明展”金奖12项、铜奖1项。
兴军亮,2012年毕业于清华大学计算机科学与技术系,获工学博士学位,2013年在新加坡国立大学从事博士后研究,现为中国科学院自动化研究所助理研究员,美国电器与电子工程学会(IEEE)会员。研究领域为计算机视觉、模式识别和机器学习,主要研究兴趣为视频中的物体检测、跟踪和分割。目前已在重要国际期刊和会议,如TIP,ICCV,CVPR,ACM Multimedia上多篇,译著两部。在攻读博士期间,曾获得清华大学计算机系学术新秀、清华大学博士论文、清华大学综合一等奖学金等荣誉称号和奖励,在博士后研究期间,带领学生完成的论文Wow!You are so beautiful today!获得2013年ACM Multimedia国际会议论文奖。目前作为项目负责人正在主持一项国家自然科学基金项目,作为项目骨干参与了973、863等多项国家重要研究课题以及与惠普、英特尔、欧姆龙等知名企业的多项合作研究课题。
张立宁,2006年和2009年毕业于西安电子科技大学并分别获学士和硕士学位,2013年毕业于新加坡南洋理工大学电气与电子工程学院,获博士学位,现为新加坡科技研究局资讯通信研究院研究员,美国电气与电子工程师协会会员。研究领域为模式识别与机器视觉,多媒体计算,医学图像处理等。目前已在国际重要刊物如IEEE TIP、TCSVT、TSMC-PartB等多篇,参与编辑著作多部。在攻读硕士和博士学位期间,曾获多项校学生、毕业生等荣誉称号,并作为骨干成员参与中国973、863多项重要研究课题以及新加坡多媒体创新的研究项目。
方宇强,2010年毕业于国防科学技术大学控制科学与工程专业,获得硕士学位,现就读于国防科学技术大学控制科学与工程专业,攻读博士学位。2011年赴香港科技大学计算机科学系访问,2013年在新加坡国立大学计算机系任研究助理。研究领域包括机器学习、计算机视觉和智能系统,主要研究兴趣有高维数据特征分析、视觉特征学习和智能无人系统等。在国内外重要期刊和会议,如ICDM、JFR上发表多篇论文,硕士论文获得湖南省硕士毕业论文。在攻读博士期间作为项目骨干参与了多项国家973、国家自然科学基金重点项目研究。
李沛秦,博士,讲师,任职于国防科学技术大学电子科学与工程学院。长期从事海量视频分析与生物特征识别方面的研究工作,作为技术骨干参与项目3项,省部级项目13项。在国内外知名期刊发表学术论文25篇,参与出版专著2部,授权国家发明专利12项、实用新型专利25项。荣获国际发明展金奖2项、湖南省科技进步二等奖1项、公安部技术革新特别项目奖2项、全国“发明展”金奖1项、铜奖1项。
刘通,博士生,讲师,任职于国防科学技术大学电子科学与工程学院。长期从事海量视频分析与生物特征识别方面的研究工作,作为技术骨干参与项目3项,省部级项目17项。在国内外知名期刊发表学术论文29篇,参与出版专著2部,授权国家发明专利12项、实用新型专利25项。荣获国际“发明展”金奖2项、湖南省科技进步二等奖1项、公安部技术革新特别项目奖2项、全国“发明展”金奖1项、铜奖1项。
闫玮,博士,讲师,任职于国防科学技术大学电子科学与工程学院。长期从事海量视频分析与生物特征识别方面的研究工作,作为技术骨干参与项目3项,省部级项目15项。在国内外知名期刊发表学术论文23篇,参与出版专著2部,授权国家发明专利12项、实用新型专利25项。荣获国际“发明展”金奖2项、湖南省科技进步二等奖1项、公安部技术革新特别项目奖2项、全国“发明展”金奖1项、铜奖1项。
王勇,1982年2月生。2005年7月于四川大学数学学院获学士学位,分别于2007年12月和2011年6月于国防科学技术大学理学院获硕士和博士学位。2011年7月起在中国空气动力研究与发展中心低速所任助理研究员。研究兴趣包括机器学习、统计学习、模式识别与计算机视觉,论文Multi-manifold clustering于2010年获亚太人工智能大会论文奖(Best Paper Award),论文Face recognition using Intrinsicfaces被国际期刊Pattern Recognition评选为该刊2010年第二季度最热门的25篇文章之一(Top 25 Hottest Articles),排行第14。目前主要从事气动声学、机器学习等领域的研究工作。
沈杰,博士生,于2011年6月在上海交通大学数学系获得理学学士学位,多次获得学业奖学金;2014年3月,在上海交通大学计算机系获得工学硕士学位,获得上海市毕业生称号;从2013年8月至2014年4月,在新加坡国立大学视觉和机器学习实验室访问研究;从2014年4月开始,在USA Rutgers大学师从Ping Li教授攻读博士学位。主要研究人物姿势识别、物体识别、特征学习和凸优化理论,在凸优化理论的框架下,设计简单高效的算法。
张政,1983年2月生。2005年7月于空军及时航空学院获学士学位,于2007年12月获国防科学技术大学航天科学与工程学院获硕士学位,于2012年12月获南洋理工(Nanyang Technological University)计算机工程学院博士学位。2013年1月起在国防科学技术大学信息系统与管理学院任讲师。在IEEE Transactions on Multimedia、ICIP等国际期刊和会议上以及时作者近10篇。研究兴趣包括计算机视觉、图像处理、机器学习等。目前主要从事基于视觉的智能监控、巨量视频数据处理和分析等领域的研究工作。
谭筠,博士生,2007年毕业于国防科技大学机电工程与自动化学院,获工学学士学位。2010年暑期,在及时汽车集团公司短期交流学习,合作研制改进了新一代的导航辅助系统。2011年11月至2013年2月获中国国家留学基金委资助,在新加坡国立大学视觉研究组访问学习。研究领域为计算机视觉、模式识别和机器学习,主要研究无人驾驶车辆、汽车主动安全产品中的视觉感知问题。作为主要成员,获得了2011中国智能车未来挑战赛及时名,ICPR2012人类行为识别与定位大赛及时名等国内、国际奖项。在国际、国内主流会议上发表多篇学术论文,获得第十届中国智能机器人学术会议的论文奖。作为项目骨干,参加了国家自然科学基金重大项目、973、863等多项国家重要研究课题。参与开发一系列的汽车主动安全产品,部分已经产业化。
胡俊,1985年6月生。2008年6月于湖南大学电气与信息工程学院获学士学位,2011年12月于国防科学技术大学电子科学与工程学院获硕士学位,并于2012年2月起在国防科学技术大学电子科学与工程学院攻读博士学位。研究兴趣包括信息信号处理、目标检测、识别与跟踪。
绪论
第1讲 K-means
1.1 基本原理
1.2 算法改进
1.3 仿真实验
1.4 算法特点
第2讲 KNN学习
2.1 基本原理
2.2 算法改进
2.3 仿真实验
2.4 算法特点
第3讲 回归学习
3.1 基本原理
3.1.1 参数回归
3.1.2 非参数回归
3.1.3 半参数回归
3.2 算法改进
3.2.1 线性回归模型
3.2.2 多项式回归模型
3.2.3 主成分回归模型
3.2.4 自回归模型
3.2.5 核回归模型
3.3 仿真实验
3.3.1 回归学习流程
3.3.2 基于回归学习的直线边缘提取
3.3.3 基于回归学习的图像插值
3.4 算法特点
第4讲 决策树学习
4.1 基本原理
4.1.1 分类与聚类
4.1.2 决策树
4.1.3 信息增益的度量标准
4.1.4 信息增益度量期望的熵降低
4.1.5 悲观错误剪枝
4.1.6 基本决策树算法
4.2 算法改进
4.2.1 ID3算法
4.2.2 C4.5算法
4.2.3 SLIQ算法
4.2.4 SPRINT算法
4.3 仿真实验
4.3.1 用于学习布尔函数的ID3算法伪代码
4.3.2 C4.5算法构造决策树的伪代码
4.4 算法特点
第5讲 Random Forest学习
5.1 基本原理
5.1.1 决策树
5.1.2 Bagging集成学习
5.1.3 Random Forest方法
5.2 算法改进
5.3 仿真实验
5.3.1 Random Forest分类与回归流程
5.3.2 Forest-RI和For
5.3.3 基于Random Forest的头部姿态估计
5.4 算法特点
第6讲 贝叶斯学习
6.1 基本原理
6.2 算法改进
6.2.1 朴素贝叶斯模型
6.2.2 层级贝叶斯模型
6.2.3 增广贝叶斯学习模型
6.2.4 基于Boosting技术的朴素贝叶斯模型
6.2.5 贝叶斯神经网络模型
6.3 仿真实验
6.3.1 Learn_Bays
6.3.2 Classify_Ba
6.4 算法特点
第7讲 EM算法
7.1 基本原理
7.2 算法改进
7.2.1 EM算法的快速计算
7.2.2 未知分布函数的选取
7.2.3 EM算法收敛性的改进
7.3 仿真实验
7.3.1 EM算法流程
7.3.2 EM算法的伪代码
7.3.3 EM算法应用——高斯混合模型
7.4 算法特点
第8讲 Adaboost
8.1 基本原理
8.1.1 Boosting方法
8.1.2 Adaboost方法
8.2 算法改进
8.2.1 权值更新方法的改进
8.2.2 Adaboost并行算法
8.3 仿真实验
8.3.1 Adaboost算法实现流程
8.3.2 Adaboost算法示例
8.4 算法特点
8.4.1 Adaboost算法的优点
8.4.2 Adaboost算法的缺点
……
第9讲 SVM方法
第10讲 增强学习
第11讲 流形学习
第12讲 RBF学习
第13讲 稀疏表示
第14讲 字典学习
第15讲 BP学习
第16讲 CNN学习
第17讲 RBM学习
第18讲 深度学习
第19讲 遗传算法
第20讲 蚁群方法