本笔记涵盖SAS编程在多种统计方法中的应用,包括描述性统计、线性与逻辑回归、生存分析等,并介绍判别、聚类、主成分、因子及典型相关分析。
SAS统计分析笔记
本段落记录了在学习SAS过程中的初级统计分析内容,涵盖了描述性统计、线性回归、逻辑回归、生存分析、判别分析、聚类分析、主成分分析以及典型相关分析等。
描述性统计涉及对数据的基本概述,包括均值、方差和标准偏差的计算。使用proc means可以获取这些基本统计数据。
频数表
通过freq语句生成变量的频率分布表(如:`proc freq; tables z; run;`),这会输出z变量的频数表。
Means过程
Means过程能够提供关于特定变量的一系列统计量,例如均值、标准误差等。以计算x变量为例:使用命令 `proc means data=ex2_1; var x; run;`
Univariate过程
此程序用于分析单个变量的数据特征(如`proc univariate data=ex2_1; var x; run;`),可以得出关于x的均值、标准差等信息。
正态检验
通过使用 `normalplot` 选项于univariate过程中执行,以检查特定数据是否符合正态分布。例如:`proc univariate data=ex2_1 normalplot; var x; run;`
可视化图表(茎叶图、箱形图和正态概率图)
这些图形有助于视觉展示数据的特性,并可通过在 `Univariate` 过程中使用`plot`选项生成,比如:创建x变量的茎叶图命令为 `proc univariate data=ex2_1; var x; plot stemleaf; run;`
逻辑回归
一种广泛使用的分类算法,用于预测二元结果的概率。SAS支持通过 proc logistic 过程进行此类分析。
生存分析
适用于研究生命或事件持续时间的分布特性,可通过使用proc lifetest过程完成这项工作。
判别分析和聚类分析
这两者是数据分析中的重要工具:前者(利用 `discrim`)用于预测多类别数据的概率;后者则通过 `cluster` 过程将相似的数据分组在一起进行挖掘。
主成分分析与典型相关性分析
这两种技术分别应用于简化复杂高维数据集和探索变量间的关系,SAS提供了相应的proc princomp 和 proc corr过程来实现这些功能。