在线客服
大数据挖掘与统计机器学习图书
人气:30

大数据挖掘与统计机器学习

序大数据时代的到来,使我们的生活在政治、经济、社会、文化各个领域都产生了很大改变。“数据科学”一词应运而生。如何更好地对海量数据进行分析、得出结论并做出智能决策是统计工作者面临的机遇与挑战...

内容简介

大数据时代的到来,使我们的生活在政治、经济、社会、文化各个领域都产生了很大改变。“数据科学”一词应运而生。如何更好地对海量数据进行分析、得出结论并做出智能决策是统计工作者面临的机遇与挑战。

本书介绍数据挖掘与统计机器学习领域最常用的模型和算法,包括最基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解之外,我们给出了每种方法的R语言实现,以及应用Python语言实现深度学习和支持向量机两种方法。本书的一个亮点是一章给出的两个大数据案例,数据量均在10G左右。我们同时给出了单机版(Python、数据库、R)和分布式(Hadoop、Hive、Spark)两种实现方案。原始数据和程序代码均可在出版社提供的网址下载。

本书面向的主要读者是应用统计专业硕士,希望能够拓展到统计专业高年级的本科生以及其他各个领域有数据分析需求的学生和从业人员。

编辑推荐

导语_点评_推荐词

作者简介

吕晓玲,吉林省吉林市人。现任中国人民大学统计学院副教授,北京五校联合大数据分析硕士培养协同创新平台总协调人。本科与硕士毕业于南开大学数学系概率统计专业,博士毕业于香港城市大学管理科学系。曾经是奥地利约翰开普勒大学应用统计系以及美国加州大学伯克利分校统计系访问学者。一直从事数据挖掘和统计机器学习领域的理论研究,及其在消费者行为方面的应用研究。在数据挖掘以及市场营销方面的项目涉及的领域包括银行、电子商务、交通、教育、广播电视、移动互联网等。

宋捷,四川眉山人。现任首都经济贸易大学统计学院副教授。本科与硕士毕业于四川大学数学系概率统计专业,博士毕业于中国人民大学统计学院。一直从事机器学习与数据挖掘相关领域的理论研究。

目录

第1章概述

1.1名词演化

1.2基本内容

1.3数据智慧

第2章线性回归方法

2.1多元线性回归

2.2压缩方法:岭回归与Lasso

2.3Lasso 模型的求解与理论性质

2.4损失函数加罚的建模框架

2.5上机实践

第3章线性分类方法

3.1分类问题综述与评价准则

3.2Logistic回归

3.3线性判别

3.4上机实践

第4章模型评价与选择

4.1基本概念

4.2理论方法

4.3数据重利用方法

4.4上机实践

第5章决策树与组合方法

5.1决策树

5.2Bagging

5.3Boosting

5.4随机森林

5.5上机实践

第6章神经网络与深度学习

6.1神经网络

6.2深度学习

6.3上机实践

第7章支持向量机

7.1线性可分支持向量机

7.2软间隔支持向量机

7.3一些拓展

7.4上机实践

第8章聚类分析

8.1基于距离的聚类

8.2基于模型和密度的聚类

8.3稀疏聚类

8.4双向聚类

8.5上机实践

第9章推荐系统

9.1基于邻居的推荐

9.2潜在因子与矩阵分解算法

9.3上机实践

第10章大数据案例分析

10.1智能手机用户监测数据案例分析

10.2美国航空数据案例分析

参考文献

大数据挖掘与统计机器学习

在线预览

大数据时代的到来,使我们的生活在政治、经济、社会、文化各个领域都产生了很大改变。“数据科学”一词应运而生。如何更好地对海量数据进行分析、得出结论并做出智能决策是统计工作者面临的机遇与挑战。

本书介绍数据挖掘与统计机器学习领域最常用的模型和算法,包括最基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解之外,我们给出了每种方法的R语言实现,以及应用Python语言实现深度学习和支持向量机两种方法。本书的一个亮点是一章给出的两个大数据案例,数据量均在10G左右。我们同时给出了单机版(Python、数据库、R)和分布式(Hadoop、Hive、Spark)两种实现方案。原始数据和程序代码均可在出版社提供的网址下载。

本书面向的主要读者是应用统计专业硕士,希望能够拓展到统计专业高年级的本科生以及其他各个领域有数据分析需求的学生和从业人员。对于侧重应用的初学者,可略过带星号的章节。

本书由吕晓玲撰写第1章、第2章、第10章,吕晓玲、潘蕊合写第4章和第5章,吕晓玲、宋捷合写第3章、第7章,古楠楠撰写第6章,褚挺进撰写第8章,尹建鑫撰写第9章,由吕晓玲统稿校对。

感谢北京五校联合(中国人民大学、北京大学、中国科学院大学、中央财经大学、首都经济贸易大学)大数据分析硕士培养协同创新平台的所有领导和教师;感谢中国人民大学出版社的鼎力支持;感谢中国人民大学数据挖掘中心(wwwrucdmcnet)的学生参与本书的写作和校对,他们是:钟琰、王小宁、刘撷芯、王高斌、安梦颖、胡见秋、范一苇、苏嘉楠、程豪、范超、要卓、李天博、林毓聪、闫晗、刘梦杭、孙亚楠、董峰池。

数据挖掘与统计机器学习是一个方兴未艾、蓬勃发展的学科领域,鉴于作者的能力和时间非常有限,本书的内容难免有不足和纰漏,还望广大读者不吝赐教,多提宝贵意见。

网友评论(不代表本站观点)

来自无昵称**的评论:

还行

2016-08-24 07:24:30
来自无昵称**的评论:

还没看

2016-08-24 10:22:50
来自无昵称**的评论:

好书

2016-09-05 16:48:24
来自无昵称**的评论:

还不错的感觉,好评

2016-09-23 15:28:57
来自ouyangy**的评论:

下次还来买

2016-11-13 00:30:58
来自陈晓婷3**的评论:

2016-11-21 14:46:55
来自无昵称**的评论:

当当给力,书全,还有图书的清单,这点比某东好。

2016-11-21 23:04:05
来自xuqiqi**的评论:

一直在当当上买书,挺好!

2016-12-04 13:14:38
来自匿名用**的评论:

非常好的商品,适合入门

2017-01-06 16:52:04
来自q***n(**的评论:

商品很不错。。。。。

2017-03-01 12:54:42
来自无昵称**的评论:

很好,谢谢!

2017-04-04 12:54:53
来自0***0(**的评论:

非常好看的书,正版,便宜

2017-04-04 13:04:50
来自匿名用**的评论:

刚收到,物流包装都很好, 应该是正版的 ,看后再评吧

2017-04-05 12:49:57
来自匿名用**的评论:

盗版书目,服了

2017-04-27 15:43:38
来自M***a(**的评论:

数据分析用书!

2017-05-09 19:50:13
来自l***n(**的评论:

这个非常不错啊

2017-06-17 23:08:30
来自j***8(**的评论:

作为参考教材还是不错的!

2017-06-21 15:29:16
来自q***1(**的评论:

书籍在他们一生中起了无比重大的作用。

2017-07-21 01:11:27
来自l***0(**的评论:

很好,正版的。

2017-07-25 06:36:16
来自无昵称**的评论:

到货速度快,赞赞赞赞赞赞赞赞赞赞赞赞

2017-07-31 15:39:27
来自无昵称**的评论:

书不错 认真学习去了 纸质很好 全新正版

2017-08-18 11:09:14
来自无昵称**的评论:

纸张很好!

2017-09-07 19:43:27
来自无昵称**的评论:

好,很不错的书

2017-09-18 12:39:50
来自匿名用**的评论:

上课用,应该好用

2017-09-21 08:20:47
来自xingxin**的评论:

大数据挖掘与统计机器学习 很久没有看到一本如此另外兴奋的图书了,好的故事就是有一种能撩拨人心的能力,它把你拉进去,让你仿若置身其中,跟着主人公开启一段旅程。

2017-10-05 09:57:52
来自匿名用**的评论:

这个商品很不错

2017-11-18 14:58:03
来自匿名用**的评论:

书还行,就是感觉当当快递没有之前快了,下午三四点才到

2017-01-17 17:32:40
来自匿名用**的评论:

包装袋是坏的,然后都是土,难道是沙尘暴造成的?

2017-05-13 08:45:48
来自nanji39**的评论:

这是一件非常好的产品,非常实用,质量得到保证,物流速度也很快,我非常满意。 这是一件非常好的产品,非常实用,质量得到保证,物流速度也很快,我非常满意。

2017-01-13 09:25:45

免责声明

更多相关图书