SAS编程演义

SAS编程演义 pdf epub mobi txt 电子书 下载 2026

出版者:清华大学出版社
作者:谷鸿秋
出品人:
页数:298
译者:
出版时间:2017-6-1
价格:79
装帧:平装
isbn号码:9787302470571
丛书系列:
图书标签:
  • SAS
  • 统计学
  • 统计
  • sas
  • 数据分析
  • 画图
  • 数据挖掘
  • 谷鸿秋
  • SAS编程
  • 数据分析
  • 统计分析
  • 数据挖掘
  • 编程入门
  • 案例教学
  • 实战
  • 数据处理
  • 商业分析
  • 量化分析
想要找书就要到 小美书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

本书以Base SAS为基础,重点讲解SAS编程技术,内容涵盖SAS 基础知识、数据导入导出、变量与观测操作、数据集操作与管理、函数与例程、SAS格式以及宏编程等。另外,对于目前市面上SAS书籍涉及很少,但是应用频繁的统计表格和统计图形,本书从设计原则、选择思路、绘制方法以及实例步骤等方面做了系统、详细的介绍。

本书打破语法关键字的字典式编排方式,精心凝练10个既相对独立又互相联系的专题,就地取材,采用SAS自带的小数据集,循序渐进,层层递进地来进行讲解讨论。无论是SAS初学者,还是江湖老手,都可从中获益。SAS初学者可以较为全面系统地了解SAS编程技术及其应用场景,江湖老手亦可从高阶技能中获得启发感悟。

深入浅出:数据科学实践与前沿算法解析 图书名称:数据科学实践与前沿算法解析 图书简介 本书旨在为广大读者提供一套全面、深入且极具实践指导意义的数据科学知识体系。我们深刻认识到,在当今这个数据驱动的时代,掌握数据科学的核心技能已不再是少数专家的专属,而是所有渴望在技术前沿占据一席之地的专业人士的必备素养。本书避开了晦涩难懂的理论堆砌,转而聚焦于如何将复杂的统计学原理、机器学习模型与实际业务场景相结合,实现从原始数据到有价值洞察的有效转化。 全书结构严谨,内容覆盖数据科学流程的每一个关键环节,从基础的数据准备、清洗、探索性分析(EDA),到高阶的模型构建、评估与部署,力求为读者构建起一座坚实的知识桥梁。 第一部分:数据科学的基石——环境搭建与数据准备 本部分是读者进入数据科学世界的“入场券”。我们不局限于介绍单一的编程语言,而是采用当前业界最主流的Python生态作为核心工具集。 环境的奠基: 我们将详细阐述如何高效地配置Jupyter Notebook、JupyterLab等交互式开发环境,并指导读者掌握Anaconda的虚拟环境管理技巧,确保项目环境的隔离性与可复现性。 数据获取与清洗的艺术: 真实世界的数据往往是“脏”的,充斥着缺失值、异常点和不一致的格式。本章深度剖析了Pandas库的高级特性,不仅涵盖了基础的数据导入导出(CSV, Excel, SQL数据库),更着重于处理复杂的数据重塑(Reshaping)操作,如`pivot`、`melt`的灵活运用。缺失值处理上,我们将探讨基于统计学(均值、中位数、众数插补)和基于模型的插补策略(如使用KNN进行缺失值预测),并辅以Dask在处理大规模数据集时的并行计算方法。数据类型的标准化、字符串的正则表达式处理以及日期时间序列的精准对齐,都将通过大量实战案例进行演示。 探索性数据分析(EDA)的精髓: EDA是数据挖掘的“侦探工作”。我们倡导“可视化优先”的分析思路。Matplotlib与Seaborn的组合将是我们的主要工具。读者将学会如何利用散点图矩阵(Pair Plot)快速发现变量间的关系,如何使用箱线图和提琴图识别分布偏斜与异常值,以及如何运用热力图(Heatmap)揭示特征间的相关性矩阵。更进一步,我们将引入Plotly和Bokeh,教授如何创建交互式、可嵌入Web应用的动态可视化报告,极大地提升分析结果的沟通效率。 第二部分:经典与现代机器学习算法的深度剖析 这一部分是本书的核心,致力于将理论转化为可操作的模型。我们坚持从算法背后的数学直觉出发,而非直接抛出复杂的公式。 统计学习的基础: 我们从最基础的线性回归和逻辑回归讲起,详细解释最大似然估计(MLE)和最小二乘法(OLS)的几何意义。重点在于回归模型的假设检验、多重共线性诊断(如VIF值计算)以及正则化技术(Lasso, Ridge, Elastic Net)如何有效控制模型复杂度,防止过拟合。 树模型家族的崛起: 决策树、随机森林(Random Forest)的构建原理,尤其是信息增益与基尼不纯度的计算,将被清晰阐述。随后,我们将进入梯度提升机器(GBM)的殿堂。XGBoost, LightGBM, 以及CatBoost作为当前工业界的主流工具,本书将对比分析它们在并行化、内存优化和处理类别特征上的差异与优势,并提供详尽的参数调优指南,指导读者使用Grid Search与Bayesian Optimization(如使用Hyperopt库)进行高效的超参数搜索。 支持向量机(SVM)与核方法的魔力: 我们将可视化地解释最大间隔分类器的原理,并深入理解核函数(如RBF核)如何在低维空间中映射数据,实现非线性可分。 无监督学习的探索: 在聚类分析方面,我们将对比K-Means、DBSCAN(及其对噪声点的鲁棒性)和层次聚类(Agglomerative Clustering)的应用场景。对于高维数据的降维,主成分分析(PCA)的数学原理与实际应用(如特征提取)将与t-SNE和UMAP的非线性降维方法进行区分讨论。 第三部分:模型评估、验证与可靠性构建 一个模型的好坏,不在于其训练误差多小,而在于其泛化能力如何。本部分关注模型部署前的质量把控。 性能度量的全面视角: 读者将学会根据业务需求选择正确的评估指标。对于分类问题,除了准确率(Accuracy),我们还会深入讲解精确率(Precision)、召回率(Recall)、F1-Score、ROC曲线和AUC值的计算与解读。回归问题则侧重于RMSE、MAE和$R^2$的权衡。 稳健的交叉验证策略: 从基础的K折交叉验证到时间序列数据的滚动预测(Rolling Forecast),再到处理类别不平衡数据的分层K折(Stratified K-Fold),本书提供了一套完整的模型稳定性测试框架。 可解释性人工智能(XAI)的实践: 在模型日益复杂的今天,理解“为什么”至关重要。我们将系统介绍SHAP值(SHapley Additive exPlanations)和LIME(Local Interpretable Model-agnostic Explanations),指导读者如何解释复杂模型(如梯度提升树)的个体预测结果,为模型决策提供透明度。 第四部分:前沿进阶——深度学习与时间序列建模 本部分将目光投向更复杂的现代数据结构。 深度学习框架入门(TensorFlow/PyTorch): 我们不会陷入底层GPU编程的细节,而是聚焦于如何利用Keras API快速搭建标准的前馈神经网络(FNN)。讲解激活函数(ReLU, Sigmoid)、损失函数、优化器(Adam, RMSprop)及其收敛机制。 序列数据的处理之道: 针对文本和时间序列,我们将介绍循环神经网络(RNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)在处理序列依赖关系上的优势。重点演示如何使用它们进行股价预测、自然语言的文本分类任务。 强化学习的初步接触: 简要介绍强化学习的MDP框架,并以Q-Learning算法为例,展示其在简单决策问题中的应用,为读者未来探索更复杂的AI应用奠定概念基础。 本书的最终目标是培养读者一种独立解决实际问题的“数据科学家思维”,通过大量的代码示例和贴近现实的案例分析,确保读者不仅能“运行”代码,更能“理解”代码背后的科学原理。

作者简介

谷鸿秋

著名医学院非著名医学毕业生

土鳖博士/野生码农/科研搬砖工

公众号“统技思维”出品人

原人大经济论坛SAS专版/SAS中文论坛卸任版主

数据分析与可视化爱好者

目前主要从事医药领域的统计学设计与统计方法研究

微信公众号:统技思维

统计理论通俗讲解,软件技巧效率提升,思维方法探索启发。

关注作者微信公众号,获取本书代码和相关数据。

目录信息

第1章 人生若只如初见:初识SAS 1
1.1 往事并不如烟 1
1.1.1 逗你玩的发音 1
1.1.2 有点趣的历史 2
1.1.3 逝不去的江湖 5
1.2 选择一厢情愿 5
1.3 软件架构 6
1.4 安装与许可 7
1.5 运行模式 12
1.6 编程界面 12
1.6.1 DMS界面 12
1.6.2 EG界面 14
1.6.3 SAS Studio 界面 14
1.7 版本 16
1.7.1 购买版与大学版 17
1.7.2 免费云端版 17
1.7.3 各操作系统平台版 20
1.7.4 各语言版 20
1.8 本章小结 21
第2章 清歌苦调两不厌:夯实基础 22
2.1 Foundation SAS 22
2.1.1 Foundation SAS的构成 22
2.1.2 Base SAS 23
2.2 SAS数据分析流程 23
2.3 逻辑库与数据集 24
2.3.1 逻辑库 24
2.3.2 数据集 27
2.3.3 变量 31
2.4 SAS编程语言 32
2.4.1 SAS程序结构 32
2.4.2 SAS语法规则 33
2.4.3 SAS语言元素 35
2.4.4 三种逻辑结构 40
2.4.5 数组结构 42
2.4.6 函数与CALL例程 46
2.4.7 结构化查询语言SQL 46
2.4.8 SAS宏MACRO 48
2.5 理解SAS运行机制 49
2.5.1 PDV与DATA步自循环 49
2.5.2 @与@@的困惑 55
2.6 用好SAS Help的秘诀 57
2.6.1 SAS Help知多少 57
2.6.2 看懂SAS Help的基本套路 60
2.6.3 检索SAS Help的小技巧 61
2.6.4 熟悉SASHelp下的数据集 62
2.7 本章小结 63
第3章 苔点狂吞纳线青:读取数据 64
3.1 读取对象与读取方式 64
3.2 数据读取策略 65
3.3 读取DBMS数据文件 66
3.3.1 SAS/ACCESS 与DBMS 66
3.3.2 LIBNAME语句访问DBMS数据文件语法 67
3.4 读取PC数据文件 67
3.4.1 小试牛刀 68
3.4.2 PROC IMPORT语法 68
3.4.3 LIBNAME访问PC文件语法 70
3.4.4 实例扩展 70
3.5 读取Flat数据文件 72
3.5.1 读入CSV文件 72
3.5.2 读入TXT特殊字符分隔的文件 72
3.6 读取流式数据 74
3.6.1 流式数据初探 74
3.6.2 INPUT语句一般语法 74
3.6.3 列表读入式 75
3.6.4 列读入式 77
3.6.5 格式读入式 77
3.6.6 命名读入式 78
3.6.7 DATALINES数据综合案例 79
3.6.8 关于列表、指针及格式等 79
3.7 顺带说说数据导出 80
3.8 数据导入导出的宏 81
3.9 本章小结 81
第4章 行舟来去泛纵横:变量观测 82
4.1 变量与观测操作概览 82
4.2 创建数据集 83
4.2.1 DATA+SET语句 84
4.2.2 SQL CREATE语句 85
4.2.3 过程步的语句与选项 85
4.3 观测与变量的筛选 89
4.3.1 IF与WHERE的辨析 90
4.3.2 KEEP、DROP与RENAME 91
4.3.3 PROC SQL筛选变量与观测 93
4.4 横向的其他操作 93
4.4.1 新变量生成与赋值 94
4.4.2 变量类型转换 98
4.4.3 变量重新分组切割 100
4.4.4 缺失变量查找 102
4.5 纵向的其他操作 103
4.5.1 DATA步实现累加 103
4.5.2 PROC步实现累加 106
4.5.3 LAG与DIF的隔行取物 107
4.6 本章小结 108
第5章 亦应帷幄运鸿筹:数据库集 109
5.1 修改数据集:MODIFY语句 109
5.1.1 MODIFY语句实例 109
5.1.2 MODIFY语句注意事项 111
5.1.3 MODIFY语句语法概览 112
5.2 更新数据集:UPDATE语句 113
5.2.1 UPDATE语句实例 113
5.2.2 UPDATE语句注意事项 113
5.2.3 UPDATE语句语法概览 114
5.3 行列互换(转置):PROC TRANSPOSE 114
5.3.1 行转列(宽表转长表) 114
5.3.2 列转行(长表转宽表) 116
5.3.3 PROC TRANSPOSE注意事项 116
5.3.4 PROC TRANSPOSE语法概览 117
5.4 横向拼接(并接):多SET/MERGE/PROC SQL 117
5.4.1 一对一读入 118
5.4.2 一对一并接 119
5.4.3 匹配并接 119
5.5 纵向拼接(串接):SET /PROC APPEND / PROC SQL 123
5.5.1 SET语句 124
5.5.2 PROC APPEND 124
5.5.3 PROC SQL 125
5.6 PROC SQL表连接 126
5.6.1 左连接(LEFT JOIN) 127
5.6.2 右连接(RIGHT JOIN) 128
5.6.3 内连接(INNER JOIN) 129
5.6.4 全连接(FULL JOIN) 129
5.6.5 表连接操作语法总结 130
5.7 PROC SQL集运算 131
5.7.1 差(EXCEPT) 131
5.7.2 并(UNION) 132
5.7.3 交(INTERSECT) 133
5.7.4 外并(OUTER UNION) 134
5.8 数据集管理 134
5.8.1 初入门庭:制作变量字典 135
5.8.2 大雅之堂:数据集信息 136
5.8.3 大雅之堂:数据集操作 137
5.8.4 大雅之堂:变量信息 138
5.8.5 登峰造极:精通SAS字典 139
5.9 本章小结 143
第6章 间有山川亦奇秀:函数例程 145
6.1 函数和例程是什么 145
6.2 为什么要用函数和例程 146
6.2.1 一个例子感受函数的便利 146
6.2.2 一个例子感受例程的便利 147
6.3 怎么用函数和例程 148
6.3.1 函数语法 148
6.3.2 例程语法 149
6.4 在哪里使用函数和例程 149
6.5 有哪些函数例程可用 150
6.6 高频函数和例程有哪些 152
6.7 不够用怎么办 153
6.8 本章小结 154
第7章 翩跹翠袖拂云裳:巧用格式 155
7.1 何为格式 155
7.2 为何要用格式 156
7.3 格式名的样子 157
7.4 常用系统格式 158
7.4.1 常用输出格式 158
7.4.2 常用输入格式 159
7.5 PROC FORMAT自定义格式 159
7.5.1 自定义格式 159
7.5.2 用数据集定义格式 161
7.5.3 PROC FORMAT语法 161
7.6 格式的妙用 162
7.6.1 格式使用位置 162
7.6.2 变量重分组 163
7.6.3 统计分析过程 164
7.6.4 统计缺失观测 165
7.6.5 条件显示 166
7.7 本章小结 167
第8章 菱花荇蔓随双桨:百变绘图 168
8.1 绘图软件知多少 168
8.2 丑陋死板太难搞 169
8.3 绘图系统瞄一瞄 170
8.3.1 SAS/GRAPH 171
8.3.2 统计过程自动绘图 172
8.3.3 ODS Graphics System 173
8.4 基本原则不能少 179
8.4.1 Less is more 179
8.4.2 图形元素设计 180
8.5 统计图形的选择策略 180
8.5.1 统计图形选择总则 181
8.5.2 案例说明 183
8.6 条图系列(Bar Chart) 184
8.6.1 单式条图 184
8.6.2 频数图 185
8.6.3 带误差限的单式条图 186
8.6.4 单式百分比条图 187
8.6.5 簇拥式复式条图 188
8.6.6 簇拥式复式误差限条图 188
8.6.7 堆叠式复式条图 189
8.6.8 马赛克图 191
8.6.9 镜面式复式条图 191
8.6.10 面板条图 193
8.7 直方图系列(Histogram) 195
8.7.1 简单直方图 195
8.7.2 重叠直方图 196
8.7.3 镜面直方图 197
8.7.4 面板直方图 199
8.8 箱线图系列(Box Plot) 200
8.8.1 简单箱线图 200
8.8.2 分组箱线图 201
8.8.3 面板箱线图 202
8.9 散点图系列(Scatter Plot) 202
8.9.1 X-Y散点图 203
8.9.2 X-Y散点回归图 203
8.9.3 分组散点图 204
8.9.4 面板散点图 205
8.9.5 泡泡图 206
8.9.6 矩阵散点图 207
8.10 折线图系列(Line Plot) 208
8.10.1 简单折线图 208
8.10.2 误差限折线图 209
8.10.3 分组误差限折线图 211
8.10.4 面板误差限折线图 211
8.11 面积图系列(Area Plot) 212
8.11.1 面积图 212
8.11.2 带状图 213
8.12 拟合图系列(Fit Plot) 214
8.12.1 密度曲线 214
8.12.2 回归线 215
8.12.3 椭圆曲线 216
8.12.4 ROC曲线 217
8.12.5 Kaplan–Meier曲线 217
8.12.6 LOESS曲线 219
8.12.7 Spline曲线 221
8.13 森林图系列(Forest Plot) 222
8.13.1 简单森林图 222
8.13.2 亚组分析森林图 223
8.14 地图系列(Map) 226
8.14.1 纯地图 226
8.14.2 统计地图 227
8.14.3 热力地图 228
8.15 PROC SGPLOT总结 229
8.16 八九打扮十分妖 231
8.16.1 更换样式文件 231
8.16.2 SG过程语句选项 232
8.16.3 GTL语句选项 233
8.16.4 创建样式文件 235
8.17 图片属性控制 238
8.18 本章小结 240
第9章 拙中藏巧混天成:统计表格 241
9.1 统计表格是什么 241
9.2 统计表格如何设计 244
9.3 统计表格有哪些用法 245
9.3.1 基线信息表格 245
9.3.2 危险因素表格 246
9.3.3 结局效应表格 246
9.3.4 亚组分析表格 247
9.4 SAS制表方式有哪些 248
9.4.1 统计汇总过程 249
9.4.2 专用制表过程PROC TABULATE 250
9.4.3 专用报告过程PROC REPORT 251
9.5 如何完美实现统计表格 252
9.6 手把手来说明 253
9.6.1 完整实例 253
9.6.2 重点解读 255
9.6.3 技能升华 256
9.7 本章小结 257
第10章 一缕檀烟万佛名:宏中奥秘 259
10.1 学习宏的几个理由 259
10.2 认识宏 261
10.3 宏变量 261
10.3.1 宏变量特性 262
10.3.2 创建宏变量的十种方法 262
10.3.3 宏符号表与作用域 264
10.3.4 掩蔽宏变量 267
10.3.5 显示宏变量值 269
10.3.6 引用宏变量 270
10.4 宏程序 272
10.4.1 宏程序定义与调用 272
10.4.2 宏程序定义与调用语法 272
10.4.3 存储与加密宏程序 273
10.4.4 选择与循环宏语句 274
10.4.5 宏函数及其分类 276
10.5 开发宏程序 277
10.5.1 原则 277
10.5.2 步骤 278
10.5.3 技巧 280
10.6 本章小结 281
附录 282
附录1 统计图形不同样式效果展示 282
附录2 部分统计图形彩图效果(ggStyle样式) 284
附录3 部分统计图形彩图效果(ggplot2样式) 285
附录4 SGPLOT绘图参考 286
附录5 笔者原创宏工具分享列表 292
附录6 优质SAS学习资源列表 293
附录7 SAS编程习惯与编程规范 294
参考文献 297
· · · · · · (收起)

读后感

评分

评分

评分

评分

评分

用户评价

评分

校对工作不行,有很多细节错误。入门还好,但是没有对很多常用函数的说明,过于新手的感觉。画图看起来不错,但是还没看到那。

评分

内容四星,细节贴心加一星~

评分

校对工作不行,有很多细节错误。入门还好,但是没有对很多常用函数的说明,过于新手的感觉。画图看起来不错,但是还没看到那。

评分

解答了当初学习sas的很多疑点,但不推荐完全0基础的人阅读

评分

本书思路:先介绍基本概念,而后精选作者的很多综合实战小技巧。特别适合SAS能力的提升。

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 book.quotespace.org All Rights Reserved. 小美书屋 版权所有