众所周知,在生活中统计学无处不在,每件事、每个人似乎都可以用统计数字来加以说明。特别是进入大数据时代以后,统计学更是成为炙手可热的学问,它可以帮我们解决很多重要的社会问题,并对“黑天鹅”事件和未来做出预测。
但不可否认的是,统计学本身因为囊括大量的数学内容及专业术语,以至于让人觉得高深莫测、很难亲近。
《赤裸裸的统计学》的作者查尔斯 惠伦“扒光”了统计学“沉闷的外衣”,用生活中有趣的案例、直观的图表、生动诙谐的语言风格,彻底揭开了统计学、大数据和数字的“神秘面纱”,让我们知道期刊、媒体新闻、民意调研中公布的数字从何而来,轻松掌握判断这些统计数字“是否在撒谎”的秘籍。同时,作者还将统计学的工具带入日常生活中,告诉我们为什么不要买,为什么你家附近的商场会知道你怀孕的消息并给你寄来纸尿裤的优惠券,等等。
大数据时代你必须掌握的统计学知识,全部都在《赤裸裸的统计学》中。从今天开始,好好使用统计学和数据吧!
统计学是大数据时代炙手可热的学问,它可以帮我们解决很多重要的社会问题,并对“黑天鹅”事件和未来做出预测。除去大数据的沉闷外衣,呈现生活的真实之美。
视频网站是如何知道你喜欢的电影类型的?
哪些人有可能成为恐怖分子?
我们应该依据什么来评估教学质量,从而帮助孩子选对学校?
商场是如何在你的家人之前就知道你怀孕的消息的?
基尼系数是衡量社会分配公平程度的指标吗?
买福利,去赌场豪赌,投资股票或期货,哪种方式让你跻身富豪排行榜的可能性更大?
“缺乏控制力和话语权”的工作,还是“权力大,责任也大”的工作,更容易让职场人士猝死?
不止这些,生活中你遇到的各种问题都离不开数据和统计学。
统计学已经成为大数据时代炙手可热的学问。它可以帮我们解决很多琐碎的生活问题和重要的社会问题,并对“黑天鹅”事件和未来做出预测。
《赤裸裸的统计学》没有让你避之不及的数学公式,没有满是数字的图表,没有空洞乏味的教科书式说教;《赤裸裸的统计学》有生动诙谐的案例,有你熟悉的生活话题和社会问题,有你一定用得到的统计学知识,有大数据时代的“游戏规则”和“生存法则”。
本书将是你遇到过的好的“数学老师”,它装满了具有现实意义的“课程”,比如为什么大学毕业生的收入会高于普通大学毕业生,还有为什么不要买。
查尔斯 惠伦(Charles Wheelan),于1997~2002年间担任《经济学人》杂志驻美国中西部地区的记者,还为《芝加哥部报》、《纽约时报》和《华尔街日报》撰稿,现任芝加哥公共电台WBEZ节目财经记者。其所著《赤裸裸的经济学》已由中信出版社于2010年出版。
引言 我为什么憎恶微积分却偏爱统计学?
第1章 统计学是大数据时代最炙手可热的学问
基尼系数是否是衡量社会分配公平程度最的指标?视频网站是如何知道你喜欢的电影类型的?祈祷真的能让病人的术后康复状况改善吗?是什么导致自闭症发病率一直走高?哪些人最有可能成为恐怖分子?
第2章 描述统计学
你一直想买的一条连衣裙,商场售价为4999元,先降价25%后再提价25%,你能算出这条连衣裙的最终售价是多少吗?
第3章 统计数字会撒谎
1950年人们的平均时薪是1美元,2012年人们的平均时薪是5美元,你觉得我们的工资水平涨了吗?
第4章 相关性与相关系数
视频网站根本不知道我是谁,但它又是怎么知道我喜欢看人物纪录片而不是电视连续剧、动作片或科幻片的?引言 我为什么憎恶微积分却偏爱统计学?
第1章 统计学是大数据时代最炙手可热的学问
基尼系数是否是衡量社会分配公平程度最的指标?视频网站是如何知道你喜欢的电影类型的?祈祷真的能让病人的术后康复状况改善吗?是什么导致自闭症发病率一直走高?哪些人最有可能成为恐怖分子?
第2章 描述统计学
你一直想买的一条连衣裙,商场售价为4999元,先降价25%后再提价25%,你能算出这条连衣裙的最终售价是多少吗?
第3章 统计数字会撒谎
1950年人们的平均时薪是1美元,2012年人们的平均时薪是5美元,你觉得我们的工资水平涨了吗?
第4章 相关性与相关系数
视频网站根本不知道我是谁,但它又是怎么知道我喜欢看人物纪录片而不是电视连续剧、动作片或科幻片的?
第5章 概率与期望值
买福利彩票,去赌场豪赌、投资股票或期货,哪种方式让你跻身《福布斯》富豪排行榜的可能性更大?
第6章 蒙提 霍尔悖论
在《让我们做个交易》节目中,主持人打开的3号门后面是一头羊,在剩下的1号门和2号门中必定有一扇门后面是汽车,你应该如何选择才能中大奖?
第7章 黑天鹅事件
1%的小概率风险如何在2008年成为击垮美国华尔街的“黑天鹅”,并毁了全球金融体系。
第8章 数据与偏见
2012年,《科学》杂志刊登了一项惊人的发现:在求偶期多次遭受雌性果蝇冷落的雄性果蝇会“借酒消愁”。那么,这些果蝇是如何一醉方休的?
第9章 中心极限定理
一辆坐满肥胖乘客的抛锚客车停在你家附近的路上,你推断一下,它的目的地是马拉松比赛场地,还是国际香肠节展厅?
第10章 统计推断与假设检验
垃圾邮件过滤、癌症筛查、恐怖分子追捕,我们最不能容忍哪件事情出错,又有哪件事情是可以“睁一只眼闭一只眼”的?
第11章 民意测验与误差幅度
民调结果显示,有89%的美国人不相信政府会做正确的事,有46%的美国人认可奥巴马的工作表现。这个结果可以代表美国人的真实想法吗?
第12章 回归分析与线性关系
你认为什么样的工作压力更容易使职场人士猝死,是“缺乏控制力和话语权”的工作,还是“权力大,责任也大”的工作?
第13章 致命的回归错误
世界上3本最有声望的医学期刊上刊登的49篇学术研究论文中有1/3后来都被推翻了,所以,“尽量不要用你的回归分析研究杀人”。
第14章 项目评估与“反现实”
哈佛大学等世界顶尖大学的毕业生进入社会后,其收入往往高于一般大学的毕业生,让他们获得高收入的究竟是常春藤大学的教育优势,还是他们本身就很出色?
结束语统计学能够帮忙解决的5个问题
致谢
假设你所生活的城市正在举办一场马拉松比赛。来自世界各国的运动员们齐聚一堂,准备一决高下,但他们中的许多人都不会说英语。按照比赛组委会的安排,每位运动员在比赛当天的早上签到之后,会被随机分配到一辆驶往起点的长途客车。不凑巧的是,其中的一辆长途客车没有按规定到达比赛现场,为了省去大量额外的运算,我们假设这辆客车上没有一个人有手机,而且车里也没有装载全球定位系统(GPS)设备。作为市民中的一员,你加入了搜寻长途客车的队伍。
偏偏就那么巧,在你家附近有一辆抛锚的长途客车,车上坐着一大群面露不快的国际乘客,他们中没有一个人会说英语。这肯定就是那辆失踪的车,你将会成为这座城市的英雄!但就在此时,一个疑惑出现在你的脑中:这辆车上的乘客看上去都“不瘦”,地说,他们都很胖。粗略扫一眼这些人,你估计这些乘客的平均体重至少有220磅(100公斤)。随机分配的马拉松运动员的体重不可能这么重,你打开对讲机对搜寻总部汇报道:“不是这辆客车,请继续搜寻。”
进一步的调查证实了你最初的判断是正确的。赶到现场的翻译人员经过一番交流后,你终于知道这辆抛锚的客车原本是要前往国际香肠节会场的,正好这一届的香肠节也在这座城市举办,连日期都碰巧相同。而且从视觉角度考虑,参加香肠节的人有可能也穿着宽松的运动长裤。
祝贺你!如果你能够体会上述的推理过程,也就是说,通过快速观察车上乘客的体型来判断他们并非马拉松运动员,那么你就已经领会了中心极限定理的基本理念,剩下的工作就是在这个基本框架下充实细节了。一旦你理解了中心极限定理,统计推断的绝大多数形式将会变得非常直观。
中心极限定理的核心要义就是,一个大型样本的正确抽样与其所代表的群体存在相似关系。当然,每个样本之间肯定会存在差异(比如前往马拉松起点的这么多辆客车,每辆客车乘客的组成都不可能相同),但是任一样本与整体之间存在巨大差异的概率是较低的。正是因为这个逻辑,让你对那辆载满肥胖乘客的抛锚客车做出了快速判断。的确有胖人参加马拉松比赛,每一次马拉松比赛中都会有几百名参赛者的体重在200磅以上,但绝大多数的马拉松运动员还是比较瘦的。因此,如此之多的“重量级”运动员被随机安排到同一辆客车上的概率可以说是很低的,所以你有理由认为这不是那辆失踪的马拉松客车。当然,有可能你的判断是错的,但概率告诉我们你更有可能是对的。
这就是中心极限定理背后的基本经验。如果我们再附加一些统计学工具,就能将正确或错误的可能性进行量化。例如,在一场有10000名选手参加的马拉松比赛中,运动员的平均体重为155磅,我们可以算出,一个包含60名选手(也就是一辆客车的载客量)的随机样本的平均体重大于或等于220磅的概率不足1/100。但在此刻,让我们还是从直觉出发进行计算。通过运用中心极限定理,我们能够得出如下推理,这些推理都将会在下一章里进行深入阐述。 假设你所生活的城市正在举办一场马拉松比赛。来自世界各国的运动员们齐聚一堂,准备一决高下,但他们中的许多人都不会说英语。按照比赛组委会的安排,每位运动员在比赛当天的早上签到之后,会被随机分配到一辆驶往起点的长途客车。不凑巧的是,其中的一辆长途客车没有按规定到达比赛现场,为了省去大量额外的运算,我们假设这辆客车上没有一个人有手机,而且车里也没有装载全球定位系统(GPS)设备。作为市民中的一员,你加入了搜寻长途客车的队伍。
偏偏就那么巧,在你家附近有一辆抛锚的长途客车,车上坐着一大群面露不快的国际乘客,他们中没有一个人会说英语。这肯定就是那辆失踪的车,你将会成为这座城市的英雄!但就在此时,一个疑惑出现在你的脑中:这辆车上的乘客看上去都“不瘦”,地说,他们都很胖。粗略扫一眼这些人,你估计这些乘客的平均体重至少有220磅(100公斤)。随机分配的马拉松运动员的体重不可能这么重,你打开对讲机对搜寻总部汇报道:“不是这辆客车,请继续搜寻。”
进一步的调查证实了你最初的判断是正确的。赶到现场的翻译人员经过一番交流后,你终于知道这辆抛锚的客车原本是要前往国际香肠节会场的,正好这一届的香肠节也在这座城市举办,连日期都碰巧相同。而且从视觉角度考虑,参加香肠节的人有可能也穿着宽松的运动长裤。
祝贺你!如果你能够体会上述的推理过程,也就是说,通过快速观察车上乘客的体型来判断他们并非马拉松运动员,那么你就已经领会了中心极限定理的基本理念,剩下的工作就是在这个基本框架下充实细节了。一旦你理解了中心极限定理,统计推断的绝大多数形式将会变得非常直观。
中心极限定理的核心要义就是,一个大型样本的正确抽样与其所代表的群体存在相似关系。当然,每个样本之间肯定会存在差异(比如前往马拉松起点的这么多辆客车,每辆客车乘客的组成都不可能相同),但是任一样本与整体之间存在巨大差异的概率是较低的。正是因为这个逻辑,让你对那辆载满肥胖乘客的抛锚客车做出了快速判断。的确有胖人参加马拉松比赛,每一次马拉松比赛中都会有几百名参赛者的体重在200磅以上,但绝大多数的马拉松运动员还是比较瘦的。因此,如此之多的“重量级”运动员被随机安排到同一辆客车上的概率可以说是很低的,所以你有理由认为这不是那辆失踪的马拉松客车。当然,有可能你的判断是错的,但概率告诉我们你更有可能是对的。
这就是中心极限定理背后的基本经验。如果我们再附加一些统计学工具,就能将正确或错误的可能性进行量化。例如,在一场有10000名选手参加的马拉松比赛中,运动员的平均体重为155磅,我们可以算出,一个包含60名选手(也就是一辆客车的载客量)的随机样本的平均体重大于或等于220磅的概率不足1/100。但在此刻,让我们还是从直觉出发进行计算。通过运用中心极限定理,我们能够得出如下推理,这些推理都将会在下一章里进行深入阐述。
1.如果我们掌握了某个群体的具体信息,就能推理出从这个群体中正确抽取的随机样本的情况。举个例子,假设某学校的校长手里有本校所有学生的统考成绩(平均分、标准差等),这就相当于一个相关人口数据,再过一个星期的时间,区领导将会来学校随机抽取100名学生进行一次类似统考的测验,这100名学生的成绩—也就是一个样本,将会作为考核该校教学质量的指标。
随机抽取的这100名学生的考试成绩是否能够地反映出全校学生的平均水平呢?校长需要为此担心吗?根据中心极限定理,这100名学生作为一个随机样本,其平均成绩不会与全校学生的平均成绩产生较大差异。
2.如果我们掌握了某个正确抽取的样本的具体信息(平均数和标准差),就能对其所代表的群体做出令人惊讶的推理。从定理的使用角度来看,这与上一点内容正好相反。还是以上述假设为例,如果你是区领导,想要对本区域内的各个学校进行教学质量考核,与校长不同的是,你手中并没有(或不信任)某所学校所有学生的统考成绩,因此就有必要对每所学校进行抽样测试,也就是随机抽取100名学生参加一场类似统考的测验。
作为主管教育的领导,你觉得仅参考100名学生的成绩就对整所学校的教学质量做出判断是可行的吗?答案是可行的。中心极限定理告诉我们,一个正确抽取的样本不会与其所代表的群体产生较大差异,也就是说,样本结果(随机抽取的100名学生的考试成绩)能够很好地体现整个群体的情况(某所学校全体学生的测试表现)。
3.如果我们掌握了某个样本的数据,以及某个群体的数据,就能推理出该样本是否就是该群体的样本之一。这就是我们在本章一开始的时候所举的那个马拉松比赛失踪客车的例子。已知马拉松参赛选手的平均体重(估算),以及那辆抛锚客车上所有乘客的平均体重(目测),通过中心极限定理,我们就能计算出某个样本(客车上的肥胖乘客)属于某个群体(马拉松比赛选手)的概率是多少,如果概率非常低,那么我们就能自信满满地说该样本不属于该群体(例如,客车上的乘客看上去真的不像是一群前往马拉松比赛起点的运动员)。
4.,如果我们已知两个样本的基本特性,就能推理出这两个样本是否取自同一个群体。让我们回到那个(越来越荒谬的)客车的例子上。我们现在得知这座城市即将同时举办马拉松比赛和国际香肠节,假设这两个盛会都将会迎来数以千计的参与者,而且他们都乘坐主办方安排的客车前往会场,因此客车上要么是随机安排的马拉松运动员,要么是随机安排的香肠爱好者。进一步假设有两辆客车在路上撞在一起了(我已经承认这是一个荒谬的例子,所以还请诸位读者勉强读下去吧),作为这座城市的管理者,你被派往现场了解事故情况,看看这两辆客车是不是都前往同一个地点(马拉松比赛或香肠节)。让人不可思议的是,两辆客车上的乘客都不会说英语,但到场的医护人员给你提供了一份关于这两辆车上的乘客体重的详细信息。
仅从这一点信息,你就能推理出这两辆客车前往的是相同的会场还是不同的会场。请再次用你的直觉进行判断,假设其中一辆客车上乘客的平均体重为157磅,标准差为11磅(也就是说绝大部分乘客的体重为146~168磅)。而另一辆客车上乘客的平均体重为211磅,标准差为21磅(即绝大部分乘客的体重为190~232磅)。此刻请忘掉所有的统计学公式,仅凭逻辑做出判断:这两辆客车上的乘客是从同一个群体中随机抽取的样本吗?
不是。一个更有可能的情形是:其中一辆客车上是马拉松运动员,而另一辆客车上则是香肠爱好者。除了平均体重的不同以外,想必你还注意到了两辆客车乘客之间的体重差异要远大于各客车内部乘客的体重差异,总重量较轻的客车里高于平均值一个标准差的乘客体重(168磅),但还是轻于另一辆客车上低于平均值一个标准差的乘客体重(190磅),这一点表明(无论从统计学的角度还是从逻辑的角度)这两个样本有可能来自不同的群体。
如果凭借直觉能理解到这一步的话,就说明你已经理解了93.2%的中心极限定理了。我们需要更进一步,在直觉背后加上一些技术支撑。显而易见,当你登上一辆抛锚的客车,发现里面坐满了身穿宽松运动裤的“肥胖”乘客时,你的直觉会告诉你他们不会是马拉松运动员。而中心极限定理能够让你在直觉的基础上更上一层楼,为你的判断提供数据支持。
……
这本书充满了魅力,一是因为作者拥有喜剧演员般天生的幽默感,使得这本书具有可读性;二是因为作者列举了现实世界中形形色色的案例,旨在告诉读者为什么我们的生活离不开统计学,以及我们为什么一定要掌握一些统计学知识。
——《纽约时报》
本书将是你遇到过的好的“数学老师”。本书装满了具有现实意义的“课程”,比如如何判断民意测验的性,还有为什么你不应该买。
——《旧金山纪事报》
还没读,书质量很好,有塑封,送货到门服务好速度快。希望能读到统计学有趣的一面。
本书从简单的知识点比如平均数、中位数、标准差开始讲起,慢慢深入,涉及相关系数、概率论,然后再逐步引入中心极限定理和正态分布,并提出统计推断和假设检验的概念和基本流程,最后介绍了用途最多的回归分析。在每个部分,除了介绍这些统计学概念和方法外,一定会谈及滥用这些方法可能会出现的错误,越是实用好用的方法,就越是容易被滥用。
印刷排版不错,内容以实例为主,生动有趣,适合建立概念。但是对统计的基础理论介绍不多,需要另外学习。
说谎的数据,和数据背后的真相,都需要自己好好揣摩!
不够深刻,太肤浅,作者思维不够清晰,甚至说有点混乱,往往我要将三遍才能抓住思路,都是高中的知识,感觉没什么大用,例子解读也不深入,不建议理科大学生读
统计本科专业,看起来不吃力,感觉这本书通俗易懂,例子生动有趣,对统计专业和非统计专业的人应该均有帮助。
这本书确实把统计学讲的深入浅出,让人可以理解统计,概率的概念,并与生活中的事相关联。理解了比会一堆数学公式更有用。
作为数据分析入门级,让你对数据分析有个全新的认知
这本书很有魅力,极具可读性,我们一定要掌握一些统计学知识
孩子要求买的,兴趣很浓,一收到货立马看不错的一本书籍,推荐给大家。
趣味性很强,例子很多,很适合文科生及缺乏数据统计意识的同学,理工科生可以买来看着好玩或者是读后讲给没学过概率论与数理统计的人听。一本普及性质的而非专业性质的书。
相当通俗易懂,即便没有统计学基础也可以读懂,蕴含了很多哲学思想。
统计学的教材很难坚持看完。但是这本书很有趣,很适合入门的人学习了解统计学。而且还是在潜移默化当中学习。赞一个!
赤裸的统计学,从另一个角度解读这门抽象的学科,值得一看。
统计学之于大数据时代就是钥匙之于锁,而此书就是揭开统计学面纱,让人步入大数据殿堂的引路者。与传统经济类型的书不同的是,本书中少了说教,更多的像是邻里之间胡唠家常,语言通俗浅显,不搞专有名词轰炸,即便抛出了专有名词,也会马上提供一个浅显的解释,绝不让人一头雾水。作者的语言中透着一种幽默诙谐,那些难懂的知识就这样轻松地流进读者的大脑里,读此书,绝对不虚此行。
豆瓣统计学标签高分书籍,不过都是美国的例子
所有对数据的处理都是对其信息的压缩。相当于它处于高维不可理解的空间,我们对其进行降维切片的时候必定会丢失很多信息。所以必须选择合适的多断面去切片,甚至能不能找到合适切片方式都是问题。
学习些统计学的知识,提高对世界的认知能力,过更美好的生活?
纸质很好,是保护眼睛的纸色,书也很有质感,内容很吸引人,虽然不是学统计学的,但是真心喜欢!
赤裸裸的统计学标?视频网站是如何知道你喜欢的电影类型的?祈祷真的能让病人的术后康复状况改善E吗?是什6么导致自闭症发病作者列举了现实R世界
把枯燥的数学用小故事来阐述、看过之后、惊叹原来统计学和实际生活如此息息相关。了解之后会对生活中的一些现象有更透彻的认识、对于现代人来说、你可以不是此方面的专家、但一定要有大致的了解。
这本书简直有毒啊哈哈哈哈!!爱上统计学!!!虽然入门级别有点过于入门,主要针对毫无基础的小小白,但基础的案例也能说得生动 比起高中数学课本都又有趣又有效 墙裂推荐
赤裸裸的统计学标?视频网站是如何知道你喜欢的电影类型的?祈祷真的能让病人的术后康复状况改善吗?是什么导致自闭症W发病的统计学作者美
现在大谈特谈大数据,可是基础是什么,就是统计学,统计学是现实中很使用的科学
适合有一点统计概念的人阅读最好,能通俗理解一些统计的基本定义,并且实例生动,语言幽默。缺点嘛,理论讲的少一点,看完之后,想了解数理统计的全貌海得再买一本理论方面的书本。全书都是文字居多,在统计里面,这样太少见啦!
用一种通俗易懂的方式向人们介绍统计学,少了一些刻板理论与数学推论公式,很适合课外阅读,有利于培养对统计学的兴趣,业外人士也可以对统计学做一个感性的理解~
作者用诙谐幽默的语言,列举了现实生活中形形色色的案例,在极具可读性的同时,告诉我们为什么我们的生活离不开统计学,以及为什么要掌握一些统计学知识
正在读,对统计学有了初步理解,统计学也很有趣。
非常浅显的基本概念,讲了回归分析最小二乘法、中心极限定理、大数定律、相关系数、正态分布、标准差、中位数等。1、统计学简化难免会丢失细节;2、回归分析可以确定两个变量之间的联系,却无法解释原因和确定因果;3、赌徒谬论。。