数据分析的核心方法是统计。统计实践的有效工具是SPSS。快速掌握SPSS的正确途径是选择一本从SPSS数据分析“零起点”到“大玩家”的好书。它使读者不再感到数据分析高不可攀、实践过程无章可循、统计理论晦涩难懂、结果解读似是而非,而是让读者成为对SPSS应用高屋建瓴、对方法运用游刃有余、对软件操作融会贯通、对结果解读令人豁然开朗的数据分析高手。《基于SPSS的数据分析(第四版)》一直不懈地坚持着这个目标并努力成为先行者。
正像英国著名作家赫伯特?乔治?韦尔斯所预言的,“统计思维总有24小时会像读与写一样成为一个有效率公民的必备能力!”。这个时代已经到来,请从本书开始,勇敢迈出数据分析实践的步!
薛薇,工学硕士,经济学博士,中国人民大学应用统计学科研究中心副主任,中国人民大学统计学院副教授。主要研究领域:数据挖掘和文本挖掘、复杂网络建模等。关注统计和数据挖掘算法及软件应用、统计数据库系统研发等方面。涉足金融、贸易等复杂网络动态建模,电商数据分析,网络新媒体舆论传播、热点事件主题跟踪和预测建模,社会网络分析和以数据挖掘为依托的客户关系管理等领域。代表性教材有《统计分析与SPSS的应用》《R语言数据挖掘》《基于SPSS Modeler的数据挖掘》等。
目录
第1章SPSS统计分析软件概述
11SPSS使用基础
12SPSS的基本运行方式
13利用SPSS进行数据分析的基本步骤
第2章SPSS数据文件的建立和管理
21SPSS数据文件
22SPSS数据的结构和定义方法
23SPSS数据的录入与编辑
24SPSS数据的保存
25读取其他格式的数据文件
26SPSS数据文件合并
目录
基于SPSS的数据分析(第四版)
第3章SPSS数据的预处理
31数据的排序
32查找重复个案
33变量计算
34数据选取
35计数
36分类汇总
37数据分组
38数据预处理的其他功能
第4章SPSS基本统计分析
41频数分析
42计算基本描述统计量
43交叉分组下的频数分析
44多选项分析
45比率分析
第5章SPSS的参数检验
51参数检验概述
52单样本t检验
53两独立样本t检验
54两配对样本t检验
第6章SPSS的方差分析
61方差分析概述
62单因素方差分析
63多因素方差分析
64协方差分析
第7章SPSS的非参数检验
71单样本的非参数检验
72两独立样本的非参数检验
73多独立样本的非参数检验
74两配对样本的非参数检验
75多配对样本的非参数检验
第8章SPSS的相关分析
81相关分析
82绘制散点图
83计算相关系数
84偏相关分析
第9章SPSS的线性回归分析
91回归分析概述
92线性回归分析和线性回归模型
93回归方程的统计检验
94多元回归分析中的其他问题
95线性回归分析的基本操作
96线性回归分析的应用举例
97曲线估计
第10章SPSS的Logistic回归分析
101Logistic回归分析概述
102二项Logistic回归分析
103二项Logistic回归分析的应用
104多项Logistic回归分析
105多项有序回归分析
第11章SPSS的聚类分析
111聚类分析的一般问题
112层次聚类
113KMeans聚类
第12章SPSS的因子分析
121因子分析概述
122因子分析的基本内容
123因子分析的基本操作及案例
第13章SPSS的判别分析
131判别分析概述
132距离判别法
133Fisher判别法
134贝叶斯判别法
135判别分析的应用
《管子》中有一句话:不明于计数,而欲举大事,犹无舟楫而欲经于水险也。意思是说在不清楚具体数据的情况下想做大事,就如同没有桨的船只航行在激流险滩之中。
对于国家政府来说,所谓大事就是引导社会经济沿着正确的方向健康和谐地发展;对于企事业单位来说,所谓大事就是在经营管理中做出科学有效的决策从而在激烈的市场竞争中生存发展;对于科学研究来说,所谓大事就是透过事物外在的表象深入探索其内在的规律性;对于个人生活来说,所谓大事就是在人生成长和个人理财的重要关口做出明智合理的抉择。
这些都离不开数据,离不开数据分析,离不开统计应用。通过数据处理进行科学的定量分析是成大事者的基本方法和首要条件。
当前,中国面临着国际化大背景下转轨的经济体制和转型的社会环境的综合考验,瞬息万变的信息时代对国家、企事业单位和个人都提出了严峻的挑战,而作为“信息密集”的统计应用也将迎来快速发展的机遇期。
这是我们撰写这套“统计数据分析与应用丛书”的初衷,希望它能够为从事统计应用的实际工作者提供及时有效的帮助,也能够为有志于进行数据分析的在校本科生和研究生打开一扇统计应用的大门。
《论语》中有一句话:工欲善其事,必先利其器。意思是说做事情要取得较好的成就,应当首先利用先进的工具或手段。
突飞猛进的信息技术已经将统计应用引领到一个崭新的水平,并渗透到统计数据处理的各个环节,同时深刻影响着统计工作的全貌。计算机化和网络化是统计应用的必然趋势,它使得统计应用摆脱了复杂公式和计算的羁绊,可以为更多人所理解和使用,所以毫不夸张地说,现代信息技术是解决统计实际问题、掌握统计分析算法、建立统计应用系统的必要条件。
这是我们撰写这套丛书的另外一个初衷,即让更多的读者能够使用计算机等信息技术实现统计数据分析与应用的目标,同时也可以让更多的计算机应用读者能够了解一些统计应用的特征和方
法。同时,近年来在西方发达国家,信息技术人才和统计应用人才一直排名在就业需求榜的前列,我们认为具备统计知识和计算机知识的复合型应用人才在未来将具有巨大的发展前景和明显的从业优势。
在这套丛书的编写过程中,我们注重引进当前统计应用和计算机应用的前沿技术和理论方法,结合在统计应用、科研与教学中的丰富案例和实际经验,着力突出以下特点:
1.针对性。针对不同的读者群,由浅入深地展开统计应用的论述,读者也可以按照《基于EXCEL的统计应用》《基于SPSS的数据分析》《基于SPSS Modeler的数据挖掘》《基于R的统计分析与数据挖掘》和《基于信息技术的统计信息系统》所构成的应用体系,不断提高统计应用能力和统计理论水平。
2.可操作性。以计算机和网络等信息技术为基础,满足统计应用的各种需求,读者可以按照丛书指引的策略和具体的方法解决自己工作生活中的数据处理问题。
3.通俗性。以案例说明原理,以应用解释算法,以发展脉络说明理论形成,努力体现深入浅出的结构安排和文字风格。
不断改革前进是我们这个时代的主旋律,从目前国内相关论著和教材情况看,丛书的上述特点也是许多统计应用学者和同仁所追求的共同方向,在此特别感谢中国人民大学统计学院领导的鼎力支持,感谢中国人民大学出版社各位编辑所付出的辛勤劳动。
统计作为数据处理的方法论,具有广泛的应用领域,而它根本的生命力也在于应用。我们很想为相关读者奉献一套具有一定理论高度,且具备一定指导性和实战性的统计应用书籍,它应该以统计应用案例为主线,以计算机技术为实现工具,可以使普通经营管理人员、基层科研人员、高层决策者、一般数据处理工作者和高年级的高校学生们从中获益。
薛薇