变 第四章SAS基本统计过程 各种统计分析方法在SAS中大都以“过程”的形式 存放在SAS过程库中,当我们需要进行某种统计分析 时,只需用PROC步去调用相应的过程,即可得到所需 要的分析结果。 下面分别介绍统计资料的描述和常用的几种假设 检验方法。 SSaS.彭城 Slide I
彭斌 Slide 1 第四章 SAS基本统计过程 各种统计分析方法在SAS中大都以“过程”的形式 存放在SAS过程库中,当我们需要进行某种统计分析 时,只需用PROC步去调用相应的过程,即可得到所需 要的分析结果。 下面分别介绍统计资料的描述和常用的几种假设 检验方法
§1计量资料的描述 SAS中可以对计量资料进行描述的过程有很多, 我们介绍两个常用的过程:MEANS和UNIVARIATE 过程。 1.MEANS过程 MEANS过程用来对数据集中的数值变量计算简单 描述统计量。该过程由下列语句控制: PROC MEANS [options][statistics-keywords]: VAR variables; CLASS variables; 该过程除PROC语句(下划线部分)是必须的外,其它的语 句都是可选的。 SSaS彭城 Slide 2
彭斌 Slide 2 §1 计量资料的描述 SAS中可以对计量资料进行描述的过程有很多, 我们介绍两个常用的过程:MEANS和UNIVARIATE 过程。 1. MEANS过程 MEANS过程用来对数据集中的数值变量计算简单 描述统计量。该过程由下列语句控制: PROC MEANS [options] [statistics-keywords]; VAR variables; CLASS variables; 该过程除PROC语句(下划线部分)是必须的外,其它的语 句都是可选的
变 I).PROC MEANS语句 PROC MEANS [options][statistic-keywords]; 这里的options可以有: DATA=SAS data set:用以说明过程分析处理的数据 集的名字,若省略,则用最近产生的SAS数据集; ALPHA=value:设置计算概率可信区间的置信水平, 这个ALPHA在0-1之间取值,默认为0.05。 SSaS.彭城 Slide 3
彭斌 Slide 3 1).PROC MEANS语句 PROC MEANS [options] [statistic-keywords]; 这里的options可以有: DATA=SAS data set:用以说明过程分析处理的数据 集的名字,若省略,则用最近产生的SAS数据集; ALPHA=value:设置计算概率可信区间的置信水平, 这个ALPHA在0-1之间取值,默认为0.05
关于statistic-keywords,在MEANS:过程中可计算如下的一些统计量: 描述统计量 N:例数, MEAN:均数, STD:标准差, MN:最小值, MAX:最大值, SUM:和,CV:变异系数,STDERR:标准误, SKEW:偏度系数,KURT:峰度系数, CLM:可信区间,LCLM:可信区间下限,UCLM:可信区间上限 分位数 MEDIAN:中位数 ORANGE:四分位数间距 P1、P5、P10、P25、P50、P75、P90、P95、P99 SSaS彭城 Slide 4
彭斌 Slide 4 关于statistic-keywords,在MEANS过程中可计算如下的一些统计量: 描述统计量 N:例数, MEAN:均数, STD:标准差, MIN:最小值, MAX:最大值, SUM:和, CV:变异系数, STDERR:标准误, SKEW:偏度系数,KURT:峰度系数, CLM:可信区间,LCLM:可信区间下限,UCLM:可信区间上限 分位数 MEDIAN :中位数 QRANGE :四分位数间距 P1、P5、P10、 P25、P50、P75、P90、P95、P99
变 2).VAR语句 VAR variables; 规定要计算描述性统计量的数值变量及顺序。若省 略该句,则对所有数值变量计算描述性统计量,除BY、 CLASS语句中列出的变量之外。 3).CLASS语句 CLASS variables; 该语句用CLASS变量定义的观测组分别计算其相应 的描述统计量。 SSaS.彭城 Slide 5
彭斌 Slide 5 2).VAR语句 VAR variables; 规定要计算描述性统计量的数值变量及顺序。若省 略该句,则对所有数值变量计算描述性统计量,除BY、 CLASS语句中列出的变量之外。 3).CLASS语句 CLASS variables; 该语句用CLASS变量定义的观测组分别计算其相应 的描述统计量