Stata是公认的应用广泛的专业数据分析软件之一,因其功能丰富、效率高、操作简便,深受广大用户,尤其受在校师生的青睐。 本书为《Stata统计分析与行业应用案例详解》的升级版本(Stata 14.0),沿用版(Stata 12.0)的写作风格,采用先讲解Stata的各个操作功能再通过综合案例讲述Stata在各个行业中实际应用的思路编写。本书内容共分为两个部分:第1部分是第1~16章,按照统计类型讲述Stata的具体应用;第2部分是第17~23章,分行业讲述了Stata的具体应用。各章均附有与正文部分对应的上机操作练习题,目的是着重培养读者的动手能力,使读者在实际练习的过程中能够快速提高应用水平。 本书面向具备一定统计学基础和计算机操作基础的在校各专业学生,以及企事业单位的相关数据统计分析人员。
解读Stata在统计分析中的行业应用(适用范围为Stata 12.0到14.0)57 个基础案例及 7 个大型行业应用案例详解Stata统计分析方法、思路和分析流程61 个上机练习让读者学练结合,快速掌握Stata统计分析方法
张甜,行业资料专家,已出版多部作品,受到读者欢迎。
目 录
第1章 Stata 14.0的基本窗口及管理变量与数据 1
1.1 Stata 14.0窗口说明 1
1.2 Stata 14.0数据文件的创建与读取 2
1.2.1 Stata 14.0数据文件的创建 2
1.2.2 Stata 14.0数据文件的读取 3
1.3 创建和替代变量 4
1.3.1 创建和替代变量概述 4
1.3.2 相关数据来源 4
1.3.3 Stata分析过程 4
1.3.4 结果分析 5
1.3.5 案例延伸 6
1.4 分类变量和定序变量的基本操作 7
1.4.1 分类变量和定序变量概述 7
1.4.2 相关数据来源 7
1.4.3 Stata分析过程 8
1.4.4 结果分析 9
1.4.5 案例延伸 9
1.5 数据的基本操作 10
1.5.1 数据的基本操作概述 10
1.5.2 相关数据来源 10
1.5.3 Stata分析过程 11
1.5.4 结果分析 12
1.5.5 案例延伸 14
1.6 定义数据的子集 14
1.6.1 定义数据的子集概述 14
1.6.2 相关数据来源 15
1.6.3 Stata分析过程 15
1.6.4 结果分析 16
1.6.5 案例延伸 17
1.7 本章习题 17
第2章 Stata图形绘制 20
2.1 实例一——直方图 20
2.1.1 直方图的功能与意义 20
2.1.2 相关数据来源 20
2.1.3 Stata分析过程 21
2.1.4 结果分析 21
2.1.5 案例延伸 22
2.2 实例二——散点图 24
2.2.1 散点图的功能与意义 24
2.2.2 相关数据来源 24
2.2.3 Stata分析过程 24
2.2.4 结果分析 25
2.2.5 案例延伸 25
2.3 实例三——曲线标绘图 27
2.3.1 曲线标绘图的功能与意义 27
2.3.2 相关数据来源 27
2.3.3 Stata分析过程 28
2.3.4 结果分析 28
2.3.5 案例延伸 29
2.4 实例四——连线标绘图 31
2.4.1 连线标绘图的功能与意义 31
2.4.2 相关数据来源 31
2.4.3 Stata分析过程 31
2.4.4 结果分析 32
2.4.5 案例延伸 33
2.5 实例五——箱图 34
2.5.1 箱图的功能与意义 34
2.5.2 相关数据来源 34
2.5.3 Stata分析过程 35
2.5.4 结果分析 35
2.5.5 案例延伸 36
2.6 实例六——饼图 37
2.6.1 饼图的功能与意义 37
2.6.2 相关数据来源 37
2.6.3 Stata分析过程 37
2.6.4 结果分析 38
2.6.5 案例延伸 38
2.7 实例七——条形图 39
2.7.1 条形图的功能与意义 39
2.7.2 相关数据来源 40
2.7.3 Stata分析过程 40
2.7.4 结果分析 41
2.7.5 案例延伸 41
2.8 实例八——点图 42
2.8.1 点图的功能与意义 42
2.8.2 相关数据来源 42
2.8.3 Stata分析过程 43
2.8.4 结果分析 43
2.8.5 案例延伸 44
2.9 本章习题 45
第3章 Stata描述统计 48
3.1 实例一——定距变量的描述性统计 48
3.1.1 定距变量的描述性统计功能与意义 48
3.1.2 相关数据来源 48
3.1.3 Stata分析过程 49
3.1.4 结果分析 49
3.1.5 案例延伸 50
3.2 实例二——正态性检验和数据转换 53
3.2.1 正态性检验和数据转换功能与意义 53
3.2.2 相关数据来源 53
3.2.3 Stata分析过程 53
3.2.4 结果分析 54
3.2.5 案例延伸 55
3.3 实例三——单个分类变量的汇总 57
3.3.1 单个分类变量的汇总功能与意义 57
3.3.2 相关数据来源 57
3.3.3 Stata分析过程 57
3.3.4 结果分析 58
3.3.5 案例延伸 58
3.4 实例四——两个分类变量的列联表分析 59
3.4.1 两个分类变量的列联表分析功能与意义 59
3.4.2 相关数据来源 59
3.4.3 Stata分析过程 59
3.4.4 结果分析 60
3.4.5 案例延伸 61
3.5 实例五——多表和多维列联表分析 61
3.5.1 多表和多维列联表分析功能与意义 61
3.5.2 相关数据来源 62
3.5.3 Stata分析过程 62
3.5.4 结果分析 63
3.5.5 案例延伸 65
3.6 本章习题 65
第4章 Stata参数检验 68
4.1 实例一——单一样本T检验 68
4.1.1 单一样本T检验的功能与意义 68
4.1.2 相关数据来源 68
4.1.3 Stata分析过程 69
4.1.4 结果分析 69
4.1.5 案例延伸 70
4.2 实例二——独立样本T检验 70
4.2.1 独立样本T检验的功能与意义 70
4.2.2 相关数据来源 71
4.2.3 Stata分析过程 71
4.2.4 结果分析 72
4.2.5 案例延伸 72
4.3 实例三——配对样本T检验 73
4.3.1 配对样本T检验的功能与意义 73
4.3.2 相关数据来源 74
4.3.3 Stata分析过程 74
4.3.4 结果分析 75
4.3.5 案例延伸 75
4.4 实例四——单一样本方差的假设检验 76
4.4.1 单一样本方差假设检验的功能与意义 76
4.4.2 相关数据来源 76
4.4.3 Stata分析过程 76
4.4.4 结果分析 77
4.4.5 案例延伸 77
4.5 实例五——双样本方差的假设检验 78
4.5.1 双样本方差假设检验的功能与意义 78
4.5.2 相关数据来源 78
4.5.3 Stata分析过程 79
4.5.4 结果分析 79
4.5.5 案例延伸 80
4.6 本章习题 80
第5章 Stata非参数检验 83
5.1 实例一——单样本正态分布检验 83
5.1.1 单样本正态分布检验的功能与意义 83
5.1.2 相关数据来源 83
5.1.3 Stata分析过程 84
5.1.4 结果分析 84
5.1.5 案例延伸 85
5.2 实例二——两独立样本检验 85
5.2.1 两独立样本检验的功能与意义 85
5.2.2 相关数据来源 86
5.2.3 Stata分析过程 86
5.2.4 结果分析 87
5.2.5 案例延伸 87
5.3 实例三——两相关样本检验 88
5.3.1 两相关样本检验的功能与意义 88
5.3.2 相关数据来源 88
5.3.3 Stata分析过程 88
5.3.4 结果分析 89
5.3.5 案例延伸 90
5.4 实例四——多独立样本检验 90
5.4.1 多独立样本检验的功能与意义 90
5.4.2 相关数据来源 91
5.4.3 Stata分析过程 91
5.4.4 结果分析 92
5.4.5 案例延伸 92
5.5 实例五——游程检验 92
5.5.1 游程检验的功能与意义 92
5.5.2 相关数据来源 93
5.5.3 Stata分析过程 93
5.5.4 结果分析 94
5.5.5 案例延伸 94
5.6 本章习题 95
第6章 Stata方差分析 97
6.1 实例一——单因素方差分析 97
6.1.1 单因素方差分析的功能与意义 97
6.1.2 相关数据来源 97
6.1.3 Stata分析过程 98
6.1.4 结果分析 98
6.1.5 案例延伸 99
6.2 实例二——多因素方差分析 100
6.2.1 多因素方差分析的功能与意义 100
6.2.2 相关数据来源 100
6.2.3 Stata分析过程 100
6.2.4 结果分析 101
6.2.5 案例延伸 103
6.3 实例三——协方差分析 103
6.3.1 协方差分析的功能与意义 103
6.3.2 相关数据来源 104
6.3.3 Stata分析过程 104
6.3.4 结果分析 105
6.3.5 案例延伸 107
6.4 实例四——重复测量方差分析 108
6.4.1 重复测量方差分析的功能与意义 108
6.4.2 相关数据来源 108
6.4.3 Stata分析过程 109
6.4.4 结果分析 110
6.4.5 案例延伸 110
6.5 本章习题 111
第7章 Stata相关分析 113
7.1 实例一——简单相关分析 113
7.1.1 简单相关分析的功能与意义 113
7.1.2 相关数据来源 113
7.1.3 Stata分析过程 114
7.1.4 结果分析 114
7.1.5 案例延伸 115
7.2 实例二——偏相关分析 117
7.2.1 偏相关分析的功能与意义 117
7.2.2 相关数据来源 117
7.2.3 Stata分析过程 117
7.2.4 结果分析 118
7.2.5 案例延伸 119
7.3 本章习题 119
第8章 Stata主成分分析与因子分析 121
8.1 实例一——主成分分析 121
8.1.1 主成分分析的功能与意义 121
8.1.2 相关数据来源 121
8.1.3 Stata分析过程 122
8.1.4 结果分析 123
8.1.5 案例延伸 125
8.2 实例二——因子分析 127
8.2.1 因子分析的功能与意义 127
8.2.2 相关数据来源 127
8.2.3 Stata分析过程 127
8.2.4 结果分析 130
8.2.5 案例延伸 149
8.3 本章习题 151
第9章 Stata聚类分析 152
9.1 实例一——划分聚类分析 152
9.1.1 划分聚类分析的功能与意义 152
9.1.2 相关数据来源 152
9.1.3 Stata分析过程 153
9.1.4 结果分析 154
9.1.5 案例延伸 161
9.2 实例二——层次聚类分析 164
9.2.1 层次聚类分析的功能与意义 164
9.2.2 相关数据来源 164
9.2.3 Stata分析过程 164
9.2.4 结果分析 168
9.2.5 案例延伸 178
9.3 本章习题 186
第10章 Stata最小二乘线性回归分析 187
10.1 实例一——简单线性回归分析 187
10.1.1 简单线性回归分析的功能与意义 187
10.1.2 相关数据来源 187
10.1.3 Stata分析过程 188
10.1.4 结果分析 188
10.1.5 案例延伸 192
10.2 实例二——多重线性回归分析 194
10.2.1 多重线性回归分析的功能与意义 194
10.2.2 相关数据来源 194
10.2.3 Stata分析过程 195
10.2.4 结果分析 196
10.2.5 案例延伸 200
10.3 本章习题 202
第11章 Stata回归诊断与应对 204
11.1 实例一——异方差检验与应对 204
11.1.1 异方差检验与应对的功能与意义 204
11.1.2 相关数据来源 204
11.1.3 Stata分析过程 205
11.1.4 结果分析 206
11.1.5 案例延伸 214
11.2 实例二——自相关检验与应对 217
11.2.1 自相关检验与应对的功能与意义 217
11.2.2 相关数据来源 218
11.2.3 Stata分析过程 218
11.2.4 结果分析 220
11.2.5 案例延伸 226
11.3 实例三——多重共线性检验与应对 227
11.3.1 多重共线性检验与应对的功能与意义 227
11.3.2 相关数据来源 228
11.3.3 Stata分析过程 228
11.3.4 结果分析 229
11.3.5 案例延伸 233
11.4 本章习题 235
第12章 Stata非线性回归分析 237
12.1 实例一——非参数回归分析 237
12.1.1 非参数回归分析的功能与意义 237
12.1.2 相关数据来源 237
12.1.3 Stata分析过程 238
12.1.4 结果分析 239
12.1.5 案例延伸 242
12.2 实例二——转换变量回归分析 244
12.2.1 转换变量回归分析的功能与意义 244
12.2.2 相关数据来源 244
12.2.3 Stata分析过程 245
12.2.4 结果分析 246
12.2.5 案例延伸 251
12.3 实例三——非线性回归分析 251
12.3.1 非线性回归分析的功能与意义 251
12.3.2 相关数据来源 251
12.3.3 Stata分析过程 252
12.3.4 结果分析 253
12.3.5 案例延伸 257
12.4 本章习题 259
第13章 Stata Logistic回归分析 261
13.1 实例一——二元Logistic回归分析 261
13.1.1 二元logistic回归分析的功能与意义 261
13.1.2 相关数据来源 261
13.1.3 Stata分析过程 262
13.1.4 结果分析 263
13.1.5 案例延伸 268
13.2 实例二——多元Logistic回归分析 270
13.2.1 多元Logistic回归分析的功能与意义 270
13.2.2 相关数据来源 270
13.2.3 Stata分析过程 271
13.2.4 结果分析 272
13.2.5 案例延伸 274
13
第1章 Stata 14.0的基本窗口及管理变量与数据Stata是一种功能的统计软件包,是目前欧美最为流行的计量软件之一。它具有容易操作、运行速度快、功能强大的特点。Stata不仅包括一整套预先编排好的分析与数据功能,同时还允许软件使用者根据自己的需要来创建程序,从而添加更多的功能。该软件自从被引入我国后,迅速得到了广大学者的认可与厚爱,适用范围越来越广泛。Stata 14.0是目前Stata的近期版本。本章将初步介绍Stata 14.0的基本窗口、变量管理与数据管理。1.1 Stata 14.0窗口说明在正确安装好Stata 14.0以后,单击Stata主程序的图标文件,即可打开Stata的主界面,如图1.1所示。 图1.1 Stata 14.0主界面与大部分的程序窗口类似,Stata 14.0也有自己的菜单栏、工具栏,但其特色在于主界面中的5个区域:Review、Variables、Command、Results、Properties。? Review(历史窗口)显示的是自本次启动Stata 14.0以来执行过的所有命令。? Variables(变量窗口)显示的是当前Stata数据文件中的所有变量。? Command(命令窗口)是最重要的窗口,在本窗口内可输入准备执行的命令。? Results(结果窗口)显示的是每次执行Stata命令后的执行结果,无论成功还是失败。? Properties(性质窗口)显示的是当前数据文件中制定变量以及数据的性质。各个窗口的大小都可以调节,读者可以用鼠标进行伸缩操作,使其符合自己的风格。1.2 Stata 14.0数据文件的创建与读取1.2.1 Stata 14.0数据文件的创建 下载资源:\video\chap01\… 下载资源:\sample\chap01\正文\案例1.1.dta[例1.1]表1.1记录的是我国2000-2009年上市公司数量的数据。试创建Stata格式的数据文件并保存。表1.1 我国2000-2009年的上市公司数量年份 上交所 深交所2000 572 5162001 646 5142002 715 5092003 780 5072004 837 5402005 834 5472006 842 5922007 860 6902008 864 7612009 870 848操作过程如下: 进入Stata 14.0,打开主程序,弹出如图1.2所示的主界面。 选择“Data”|“Data Editor”|“Data Editor(Edit)”命令,弹出如图1.3所示的“Data Editor(Edit)”对话框。 图1.2 主界面 图1.3 “Data Editor”对话框 在“Data Editor(Edit)”对话框左上角的单元格中输入我们的第1个数据“2000”,系统即自动创建“var1”变量,如图1.4所示。 单击右下方“Properties”(性质窗口)中的“Variables”,“Variables”中的变量特征(包括名称、类型、长度等)即可进入可编辑状态,如图1.5所示。 图1.4 “Data Editor”对话框 图1.5 编辑变量特征 我们对变量名称进行必要的修改,因为第1个变量是年份,所以把“var1”修改为“year”,其他采取系统默认设置,修改完成后在左侧数据输入区域单击,即可弹出如图1.6所示的对话框。 逐一数据录入,其他两个变量参照年份进行设置,并分别将其定义为“shangjiao”和“shenjiao”,数据录入完毕后如图1.7所示。 图1.6 修改“Name”变量 图1.7 录入数据 关闭“Data Editor(Edit)”对话框,在主界面的工具栏里面单击 按钮进行数据保存。1.2.2 Stata 14.0数据文件的读取读取以前创建的Stata格式的数据文件比较简单,有3种方式:? 直接双击该文件,即可打开数据。? 在主界面的菜单栏里面选择“File”|“Open”命令,找到文件后打开即可。? 在主界面的“Command”(命令窗口)中,输入命令:use filename(文件的名称)。1.3 创建和替代变量1.3.1 创建和替代变量概述前面已经介绍了创建、修改数据文件和变量的通用方式,但在有些情况下,我们需要利用现有的变量生成一个新的变量,那么如何快捷方便地实现这种操作呢?Stata 14.0提供了generate以及replace命令以供我们选择使用,其中generate命令是利用现有变量生成一个新的变量,并保留原来的变量不变;而replace命令则是利用现有变量生成一个新的变量替换原来的变量。下面我们就用实例的方式来讲解一下这两个重要命令的应用。1.3.2 相关数据来源 下载资源:\video\chap01\… 下载资源:\sample\chap01\正文\案例1.2.dta[例1.2]我国2009年各地区的就业人口以及工资总额数据如表1.2所示。请使用Stata命令进行操作:(1)试生成新的变量来描述各地区的平均工资情况;(2)试生成平均工资变量来替代原有的工资总额变量;(3)对生成的平均工资变量数据均做除以10的处理;(4)对就业人口变量进行对数平滑处理,从而产生新的变量。