从PDV角度详尽剖析Base SAS常用语句代码及应用,数据挖掘理论和商业应用紧密结合,原创相互贝叶斯文本分类和EM迭代算法代码,三个典型的数据挖掘商业案例分析。
本书是作者多年来在企业实践工作中的经验总结,详细讲解了使用SAS进行商业数据挖掘的方法,其中包含了目前公开出版的诸多SAS教材没有的大量实战内容。
本书内容、新颖独创、综合性强,适合企业人员使用,也可作为数学、统计学、金融、电子商务、医药等专业的本科生、硕士生学习SAS编程和数据挖掘的参考资料。
本系列丛书有:
World Wind Java 三维地理信息系统
精通ASP.NET 4.0
操作系统实现之路
SAS开发经典案例解析
wxWidgets 跨平台程序开发
LDAP详解--IBM Tivoli Directory Server从入门到精通
商业智能深入浅出
QTP自动化测试与框架模型设计
GPGPU编程技术——从GLSL、CUDA到OpenCL
姚志勇,南开大学企业管理硕士,进修统计学硕士。现供职于全球500强商业公司,从事SAS数据挖掘工作8年,有丰富的项目实践经验。管理并自主开发多个大型数据挖掘算法源代码,成功应用于商业实践。
出版说明
前言
第1章 SAS系统简介
1.1 系统简介
1.1.1 SAS系统与商务智能系统
1.1.2 SAS系统与其他数据库的数据交换
1.1.3 SAS语言与SAS系统
1.1.4 SAS9浏览窗口简介
1.2 一个简单的编程实例
1.2.1 编写一个SAS程序
1.2.2 提交一个SAS程序
1.2.3 保存和打开一个SAS程序
1.3 DATA步的数据指针和PDV流程
1.3.1 数据指针和PDV流程
1.3.2 DATA步执行次数
第2章 SAS编程基础
2.1 SAS逻辑库
2.1.1 创建SAS逻辑库
2.1.2 删除SAS逻辑库
2.1.3 长期逻辑库和临时逻辑库
2.2 SAS数据集
2.2.1 SAS数据集命名规则
2.2.2 长期SAS数据集和临时SAS数据集
2.2.3 SAS数据集结构
2.2.4 SAS数据集形式
2.3 SAS索引
2.3.1 创建索引
2.3.2 删除索引
2.4 SAS目录
2.5 数据字典
2.6 SAS变量
2.6.1 变量属性
2.6.2 变量列表
2.6.3 自动变量
第3章 数据获取与数据集操作
3.1 数据获取
3.1.1 LIBNAME方式
3.1.2 PASSTHROUGH方式
3.1.3 IMPORT方式
3.1.4 INPUT方式
3.2 SET语句
3.2.1 语法说明
3.2.2 实例详解
3.2.3 商业实践
3.3 BY语句
3.3.1 语法说明
3.3.2 实例详解
3.4 MERGE语句
3.4.1 语法说明
3.4.2 实例详解
3.5 UPDATE语句
3.5.1 语法说明
3.5.2 实例详解
3.6 MODIFY语句
3.6.1 语法说明
3.6.2 实例详解
3.6.3 商业实践
3.7 PUT语句
3.7.1 语法说明
3.7.2 实例详解
3.7.3 商业实践
3.8 FILE语句
3.8.1 语法说明
3.8.2 实例详解
3.8.3 商业实践
3.9 1INFLE语句
3.9.1 语法说明
3.9.2 实例详解
3.9.3 商业实践
第4章 SAS变量操作
4.1 赋值语句和累加语句
4.1.1 赋值语句
4.1.2 累加语句
4.2 KEEP语句和DROP语句
4.2.1 KEEP语句
4.2.2 DROP语句
4.3 IRETAIN语句
4.3.1 语法说明
4.3.2 实例详解
4.3.3 商业实践
4.4 ARRAY语句
4.4.1 语法说明
4.4.2 实例详解
4.4.3 商业实践
4.5 其他语句
4.5.1 RENAME语句
4.5.2 LENGTH语句
4.5.3 LABEI。语句
第5章 SAS观测值操作
5.1 OUTPUT语句
5.1.1 语法说明
5.1.2 实例详解
5.2 子集IF语句
5.2.1 语法说明
5.2.2 实例详解
5.2.3 子集IF与OUTPUT语句比较
5.3 WHERE语句
5.3.1 语法说明
5.3.2 实例详解
5.3.3 子集IF与WIIERE语句比较
5.4 REPLACE语句和REMOVE语句
5.4.1 REPLACE语句
5.4.2 REMOVE语句
5.4.3 REPLACE、REM0vE与OUTPUT应用
5.5 DELETE语句与STOP语句
5.5.1 DELETE语句
5.5.2 STOP语句
第6章 SAS数据集管理
6.1 APPEND过程
6.1.1 语法说明
6.1.2 实例详解
6.2 SORT过程
6.2.1 语法说明
6.2.2 实例详解
6.2.3 商业实践
6.3 TRANSPOSE过程
6.3.1 语法说明
6.3.2 实例详解
6.4 CONTENTS过程
6.4.1 语法说明
6.4.2 实例详解
6.5 DATASETS过程
6.5.1 语法说明
6.5.2 实例详解
第7章 DAIA步循环与控制
7.1 IF.THEN/ELSE语句与SELECT语句
7.1.1 lF.THEN/ELSE语句
7.1.2 SELECT语句
7.2 DO语句
7.2.1 D0组语句
7.2.2 D0循环语句
7.2.3 DOWHILE语句
7.2.4 DOUNTIL语句
7.2.5 DOOVER语句
7.2.6 商业实践
7.3 各种控制语句
7.3.1 GOT0语句
7.3.2 CONTINUE语句与LEAVE语句
7.3.3 RETIJRN语句
第8章 常用全程语句
8.1 COMMENT语句
8.2 X语句
8.3 FILENAME语句
8.4 %INCLUDE语句
8.5 TITLE语句
8.6 FOOTNOTE语句
第9章 输出控制
9.1 LOG窗口输出控制
9.2 OUTPUT窗口输出控制
9.3 常用ODS输出控制
9.3.1 ODSLISTING
9.3.2 ODSRESUTS
9.3.3 ODSTRACE
9.3.4 ODS0UTPUT
9.3.5 ODSHTML
9.3.6 ODSCSVALL
9.3.7 ODSSELECT
9.3.8 ODSEXCLUDE
第10章 SAS宏变量
10.1 宏运行的内在机制
10.2 宏变量
10.2.1 定义宏变量
10.2.2 显示宏变量
10.2.3 引用宏变量
10.3 宏程序
10.3.1 定义宏
10.3.2 调用宏
10.3.3 宏内宏
10.3.4 宏存储
10.4 宏参数
10.4.1 创建参数
10.4.2 参数赋值
10.5 宏函数
10.5.1 通配函数
10.5.2 计算函数
10.5.3 字符函数
10.5.4 引用函数
10.6 宏语句
10.6.1 %IF.%TIIEN/%ELSE语句
10.6.2 %DO组语句
10.6.3 %DO循环语句
10.6.4 %DO%WHILE循环语句
10.6.5 %D0%UNTIL循环语句
10.7 宏应用
10.7.1 创建宏变量的八种方法
10.7.2 宏程序一般应用
10.7.3 宏程序高级应用
第11章 SQL过程
11.1 单表操作
11.2 多表操作
11.2.1 多表关联
11.2.2 子查询
11.2.3 合并查询
11.2.4 MERGE与SQL比较
11.3 创建、更新与删除表操作
11.3.1 创建表
11.3.2 行操作
11.3.3 列操作
11.3.4.删除表
11.4 使用SQL注意的几个问题
第12章 数据处理实践
12.1 随机抽样
12.1.1 简单无重复随机抽样
12.1.2 分层等比例随机抽样
12.1.3 分层不等比例随机抽样
12.1.4 随机抽样MACRO
12.2 HASH对象
12.2.1 HASH对象的引例
12.2.2 HASH对象的语法
12.2.3 HITER对象的引例
12.2.4 HITER对象的语法
12.2.5 商业实践
12.3 FORMAT综述
12.3.1 PROC步创建
12.3.2 DATA步创建
12.3.3 长期存储及调用
12.4 正则表达式
12.4.1 语法说明
12.4.2 常用函数
12.4.3 实例详解
12.5 宏在SAS与Excel转换中的应用
12.5.1 SAS数据集转换成Excel
12.5.2 Excel转换成SAS数据集
第13章 数据挖掘概念、任务和流程
13.1 数据挖掘概念
13.2 数据挖掘任务
13.3 数据挖掘流程
13.3.1 定义商业目标
13.3.2 编制需求文档
13.3.3 选择数据源
13.3.4 建模流程图
13.4 LOGISTIC建模及结果详解
13.4.1 数学模型
13.4.2 参数估计
13.4.3 模型评价指标
13.4.4 回归系数
13.4.5 变量筛选方法
13.4.6 应用举例及输出结果详解
13.4.7 多值LOGISTIC模型
第14章 响应模型:定位新客户
14.1 前期准备
14.1.1 商业需求
14.1.2 定义目标
14.1.3 选择变量
14.2 数据获取与数据处理
14.2.1 创建建模数据集
14.2.2 变量首次筛选
14.2.3 数据探索
14.2.4 数据清洗
14.2.5 变量二次筛选
14.2.6 变量三次筛选
14.2.7 字符变量压缩
14.3 模型开发
14.3.1 全模型法选择所有候选模型
14.3.2 逐步回归法筛选候选模型
14.3.3 创建两个重要数据集
14.3.4 创建LIFT图
14.3.5 创建评分卡文件
14.4 模型验证
14.4.1 评分卡文件导入
14.4.2 LIFT图比较
14.4.3 模型确认
14.5 模型实施与监控
14.5.1 模型实施
14.5.2 模型监控
14.6 小结
第15章 行为建模:客户行为属性分析
15.1 前期准备
15.1.1 商业需求
15.1.2 定义目标
15.1.3 选择建模方法
15.2 数据获取与处理
15.3 模型开发
15.4 模型验证
15.5 模型打分
15.6 模型预测
15.7 模型实施
15.8 小结
第16章 文本挖掘:Web文本分析
16.1 文本挖掘概念与流程
16.1.1 文本挖掘概念
16.1.2 文本挖掘流程
16.2 商业案例
16.2.1 商业需求
16.2.2 建模框架设计
16.2.3 结合朴素贝叶斯文本分类的EM迭代
16.2.4 数据获取与数据预处理
……
参考文献