在线客服
数据科学实战图书
人气:53

数据科学实战

大数据时代的实战宝典,谷歌、微软、eBay等公司一线数据科学家真知灼见,揭秘数据科学相关的新算法、方法与模型
  • 所属分类:图书 >计算机/网络>数据库>数据仓库与数据挖掘  
  • 作者:[美][舒特]([Rachel] [Schutt]),[美][奥尼尔]([Cathy] O'[Neil])
  • 产品参数:
  • 丛书名:--
  • 国际刊号:9787115383495
  • 出版社:人民邮电出版社
  • 出版时间:2015-03
  • 印刷时间:2015-03-05
  • 版次:1
  • 开本:16开
  • 页数:--
  • 纸张:胶版纸
  • 包装:平装
  • 套装:

内容简介

本书脱胎于哥伦比亚大学"数据科学导论"课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、多方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。

目录

作者介绍

关于封面图

第1章简介:什么是数据科学

1.1大数据和数据科学的喧嚣

1.2冲出迷雾

1.3为什么是现在

1.4数据科学的现状和历史

1.5数据科学的知识结构

1.6思维实验:元定义

1.7什么是数据科学家

1.7.1学术界对数据科学家的定义

1.7.2工业界对数据科学家的定义

第2章统计推断、探索性数据分析和数据科学工作流程

2.1大数据时代的统计学思考

2.1.1统计推断

2.1.2总体和样本

2.1.3大数据的总体和样本

2.1.4大数据意味着大胆的假设

2.1.5建模

2.2探索性数据分析

2.2.1探索性数据分析的哲学

2.2.2练习:探索性数据分析

2.3数据科学的工作流程

2.4思维实验:如何模拟混沌

2.5案例学习:RealDirect

2.5.1RealDirect是如何赚钱的

2.5.2练一练:RealDirect公司的数据策略

第3章算法

3.1机器学习算法

3.2三大基本算法

3.2.1线性回归模型

3.2.2足近邻模型(k-NN

3.2.3I(均值算法

3.3练习:机器学习算法基

3.4总结

3.5思维实验:关于统计学家的自动化

第4章垃圾邮件过滤器、朴素贝叶斯与数据清理

4.1思维实验:从实例中学习

4.1.1线性回归为何不适用

4.1.2l(近邻效果如何

4.2朴素贝叶斯模型

4.2.1贝叶斯法则

4.2.2个别单词的过滤器

4.2.3直通朴素贝叶斯

4.3拉普拉斯平滑法

4.4对比朴素贝叶斯和k近邻

4.5Bash代码示例"

4.6网页抓取:APl和其他工具

4.7Jake的练习题:文章分类问题中的朴素贝叶斯模型

第5章逻辑回归

5.1思维实验

5.2分类器

5.2.1运行时间

5.2.2你自己

5.2.3模型的可解释性

5.2.4可扩展性

……

第6章时间戳数据与金融建模

第7章从数据到结论

第8章构建面向大量用户的推荐引擎

第9章数据可视化与欺诈侦测

第10章社交网络与数据新闻学

第11章因果关系研究

第12章流行病学

第13章从竞赛中学到的:数据泄漏和模型评价

第14章数据工程:Mapreduce pregel、Hadoop

第15章听听学生学们怎么说

第16章下一代数据科学家、自大狂和职业道德

网友评论(不代表本站观点)

来自liteach**的评论:

值得一看

2015-09-01 16:26:56
来自yangyan**的评论:

质量嗷嗷的好

2015-10-09 12:25:52
来自无昵称**的评论:

正版图书,不错

2015-10-18 20:50:25
来自vincent**的评论:

很好很喜欢。就是原来以为是很厚一本。

2015-11-04 18:59:32
来自无昵称**的评论:

商品不错

2016-01-10 17:55:03
来自嘿嘿咻9**的评论:

内容很不错,只是翻译水平一般

2016-01-17 16:42:38
来自无昵称**的评论:

很好,优惠力度大

2016-04-23 21:35:15
来自无昵称**的评论:

看目录感觉不错,希望翻译质量能好些

2016-04-24 09:44:58
来自坏孩子e**的评论:

很不错的书,大爱

2016-04-25 14:42:58
来自无昵称**的评论:

2016-04-28 13:21:32
来自无昵称**的评论:

。???

2016-06-18 18:02:21
来自布衣少**的评论:

还可以,挺好的书

2016-07-10 11:52:08
来自zzjnj**的评论:

很好!

2016-09-19 19:33:59
来自无昵称**的评论:

挺好的 我很喜欢

2016-09-21 10:13:13
来自gjlin99**的评论:

不错,喜欢

2016-11-19 08:39:52
来自匿名用**的评论:

不错。很喜欢

2016-12-29 13:17:56
来自匿名用**的评论:

感觉还不错

2017-01-14 09:21:01
来自匿名用**的评论:

书很好,满意。

2017-03-15 15:33:33
来自匿名用**的评论:

有价值的书,跟上我们这个时代

2017-04-05 10:41:17
来自匿名用**的评论:

不错,挺好。

2017-04-15 12:24:02
来自c***6(**的评论:

书籍内容不错,没有什么问题的和好评的就用这个通用评价,差评的和不满意的就单独指出!

2017-04-19 10:24:43
来自***(匿**的评论:

很经典的书,大家可以看看

2017-04-27 06:16:06
来自a***7(**的评论:

还没看,感觉可以

2017-06-30 16:24:01
来自匿名用**的评论:

非常好的一本书,作者写得深入人心。当当正版书

2017-07-13 18:41:13
来自11只慧**的评论:

非常好的一本书值得购买学习。推荐一下。

2017-08-24 13:38:04
来自无昵称**的评论:

工作中需要的专业书

2017-09-09 20:03:39
来自silver5**的评论:

书挺好的 翻译的过程中有些稍微的偏差 但大体和原版保持

2015-05-02 15:51:48
来自匿名用**的评论:

数据科学实战 非常棒的质量,值得认真研读,努力提高自己的数据分析水平。

2017-01-13 11:22:55
来自无昵称**的评论:

我看了前面的两章,觉得值得一读,可以看出除了讲解一些所谓的机器学习技术外,还非常注重人文精神的培养,把一些以前令人困惑的概念讲清楚了,我觉得非常好。

2016-03-18 10:55:59

免责声明

更多相关图书