R是一种语言,它为高级数据分析人员提供个性化分析的程序编写方式;R是一款统计软件,它为中级数据分析人员提供大量的工具包和函数,直接使用它们就可以实现分析目标;R是一本教科书,它为初学者提供十分丰富而便捷的帮助信息,简单学习,就可以做初步的数据分析;R是一种文化,使用后你会感到传授或学习统计学知识的方式应当改变。
本书是一本基于R语言实现全部例题计算与分析的统计学教材,书中例题的解答和图表均给出了R的详细代码和结果。本主内容共11章,包括数据的可视化等描述性分析方法、推断方法以及实际中常用的一些统计方法等,可作为高等院校统计学专业本科生的基础课程教材,也可作为经济管理类专业及部分理、工、农、林、医药等专业的统计学教材使用,对实际数据分析人员也有参考价值。
贾俊平,中国人民大学统计学院副教授。多年从事统计学教学和研究,著有统计学《统计学》、《统计学—基于R的应用》、《统计学—基于SPSS》、《统计学—基于Excel》、《应用统计学》等多部著作。曾先后获得过教学成果二等奖、北京市教学成果一等奖、宝钢教育奖、北京市经济技术创新标兵等多个奖项。
第 1章数据与 R
第 2章数据的可视化
第 3章数据的描述统计量
第 4章随机变量的概率分布
第 5章参数估计
第 6章假设检验
第 7章类别变量分析
第 8章方差分析
第 9章一元线性回归
第 10章多元线性回归
在保留及时版内容框架的基础上 ,第二版多数章节做了重新做了编写 ,删除了每章的开篇案例和主要术语 ,删除了思考与练习中的思考题 ,只保留了习题 ,更换了大部分习题数据 ,并增加了一些新的习题 .各章均增加了一些新内容 ,书中所有的示意图均使用 R重新绘制 ,优化了例题的 R代码 ,并给出了部分统计方法和原理的 R模拟 .各章的主要变化如下:
第 1章更名为数据与 R. 1.1节简要介绍统计学的概念、数据及其来源 , 1.2节 ~ 1.5节介绍 R的使用 ,包括 R的初步使用、创建 R数据、编写 R函数、图形的控制和布局等.
第 2章更名为数据的可视化 . 2.1节更名为数据的频数分布 ,介绍类别数据的频数分布和数值数据的类别化 ,增加了多维列联表的制作方法 . 2.2节更名为类别数据的可视化 ,新增了作为条形图变种的帕累托图、脊形图和马赛克图 ,以及作为饼图变种的扇形图 . 2.3节更名为数值数据的可视化 ,在展示数据分布的图形中 ,增加了点图、核密度估计曲线等 ;在展示变量间关系的图形中增加了模拟的散点图和气泡图 ;在比较多样本相似性的图形中增加了星图和脸谱图;并新增了时间序列图和洛伦茨曲线等.
第 3章更名为数据的描述统计量 .增加的内容主要有 :加权平均数、百分位数及其 R实现、极差和四分位差的 R实现、偏度和峰度的 R模拟 ,重新编写了数据的综合描述案例.
第 4章 (随机变量的概率分布 )增加了正态分布和标准正态分布的概率密度函数、中心极限定理的 R模拟、样本比例分布的模拟、样本方差分布的模拟等 ,删掉了 4.2.2小节中的 “数据的正态性评估”,其内容放在第 6章假设检验中介绍.
第 5章 (参数估计 )增加了估计量无偏性、有效性和一致性的 R模拟 ,更换了部分例题 ,增加了大样本估计的 z.test函数、一个总体方差估计的 sigma.test函数和两个总体方差比估计的 var.test函数的使用等.
第 6章 (假设检验 ) 6.1节更名为假设检验的原理 ,并对内容作了大量精简 ,同时增加了效应量的介绍 .介绍了正态分布的检验方法 ,如图示方法和检验方法 ,包括 Q-Q图和 P-P图、 Shapiro-Wilk和 Kolmogorov-Smirnov正态性检验 ,增加了一些常用的非参数检验方法,如 Wilcoxon符号秩检验、 Mann-Whitney检验等.
第 7章 (类别变量分析)增加了数据为列联表情形下检验的 R代码.
第 8章 (方差分析 )大部分内容进行了重新编写 ,增加的内容包括效应量分析、多重比较的 HSD方法 .新增了 8.4节,介绍方差分析的假定及其检验方法 ,包括方差齐性检验的图示方法和检验方法 ,如 Bartlett和 Levene方差齐性检验等 .增加了单因子方差分析的非参数方法.
第 9章 (一元线性回归)增加了绘制回归拟合图的 R代码和结果.
第 10章 (多元线性回归 )增加了自变量相对重要性的评价 ,给出了标准化回归系数的计算及其解释;增加了哑变量回归的图示.
第 11章 (时间序列预测 )更换了例题数据 ,增加了 HoltWinters函数格式及参数的介绍,增加了 11.5节,介绍时间序列的平滑,即移动平均的应用.
此外 ,还增加了附录 2:本书使用的 R函数 ,列出了本书使用的主要 R函数的名称及其功能描述.
本书学习资源下载网址: www.rdjg.com.cn.