第五章计数资料的统计描述与推断 关于计数资料的统计推断,最为常用的是FREQ过程。 FEQ过程可以用于两个目的:一是描述分析,产生频 数表和列联表,可简洁地描述数据;二是统计推断,产生 各种统计量,可分析变量间的关系。 该过程主要由下列语句控制: PROC FREQ <option(s)> TABLES request(s)</option(s)>; WEIGHT variable; 该过程PROC FREQ语句是必需的,其它语句都是可选的。 SSaS彭城 Slide I
彭斌 Slide 1 关于计数资料的统计推断,最为常用的是 FREQ过程。 FREQ过程可以用于两个目的:一是描述分析,产生频 数表和列联表,可简洁地描述数据;二是统计推断,产生 各种统计量,可分析变量间的关系。 该过程主要由下列语句控制: PROC FREQ <option(s)> TABLES request(s) </ option(s)>; WEIGHT variable; 该过程PROC FREQ语句是必需的,其它语句都是可选的。 第五章 计数资料的统计描述与推断
变 1.PROC FREQ <option(s)>; 这里的options'常用的有 > Data=SAS-data-set,指定输入数据集名,若省略,则 用最近建立的数据集。 SSaS彭城 Slide 2
彭斌 Slide 2 1. PROC FREQ <option(s)>; 这里的options常用的有 Data=SAS-data-set,指定输入数据集名,若省略,则 用最近建立的数据集
2.TABLES request(s<option(s)≥: TABLES语句是该过程中非常重要的一条语句。在 一个PROC FREO过程中,可以有任意多个tables语句; 如果没有tables语句,FREQ对数据集中的每个变量 都生成一个单向频数表; 如果tables语句没有任何说明选项(options,FREQ 对tables语句中规定的变量的每个水平将计算频数、累 计频数、占总频数的百分数及累计百分数。 SSaS彭城 Slide 3
彭斌 Slide 3 2. TABLES request(s) </ option(s)>; TABLES语句是该过程中非常重要的一条语句。在 一个PROC FREQ过程中,可以有任意多个tables语句; 如果没有tables语句,FREQ对数据集中的每个变量 都生成一个单向频数表; 如果tables语句没有任何说明选项(options),FREQ 对tables语句中规定的变量的每个水平将计算频数、累 计频数、占总频数的百分数及累计百分数
座 I)在TABLES语句中,用request(s)指定制表要求。这里,可 以是用*连接起来的一个变量或多个变量。在一个TABLES 语句中可以给出任意多个制表要求。 例如: 。Tables a, 对指定变量a产生一个单向频数表; 。Tables a*b;产生以b为列、a为行的二维列联表; 。Tables a*b*c;产生以c列、b为行、a为分层的三维列联 表。这里,按照a的不同取值形成b*c的不同列联表。 。Tables a*(bc);等价于tables a*ba*c; 。Tables(ab)*(cd);等价于tables a*ca*db*cb*d; 。Tables(abc)*d;等价于tables a*db*dc*d; SSaS彭城 Slide 4
彭斌 Slide 4 1) 在TABLES语句中,用request(s)指定制表要求。这里,可 以是用*连接起来的一个变量或多个变量。在一个TABLES 语句中可以给出任意多个制表要求。 例如: 。Tables a; 对指定变量a产生一个单向频数表; 。Tables a*b; 产生以b为列、a为行的二维列联表; 。Tables a*b*c; 产生以c列、b为行、a为分层的三维列联 表。这里,按照a的不同取值形成b*c的不同列联表。 。Tables a*(b c);等价于tables a*b a*c; 。Tables (a b)*(c d);等价于tables a*c a*d b*c b*d; 。Tables (a b c)*d;等价于tables a*d b*d c*d;
2)在TABLES语句的斜杠()后面可以使用如下选 项: > CHISQ:要求进行卡方检验(Chi-Square Test) >Fisher: 要求对大于2×2的表进行Fisher的精确检验; >Agree: 做配对卡方检验; > ALPHA-=p:确定置信区间的水平是100(1-p)%的置信区 间,默认p=0.05; ALL:要求所有由CHⅡSQ、MEASURES和CMH选项给 出的检验和度量; >NOCOL、NOROW、NOPERCENT、NOFREQ 最为常用的选项是CHISQ和FISHER。 SSaS彭城 Slide 5
彭斌 Slide 5 2) 在TABLES语句的斜杠(/)后面可以使用如下选 项: CHISQ:要求进行卡方检验(Chi-Square Test) Fisher:要求对大于2×2的表进行Fisher的精确检验; Agree:做配对卡方检验; ALPHA=p:确定置信区间的水平是100(1-p)%的置信区 间,默认p=0.05; ALL:要求所有由CHISQ、MEASURES和CMH选项给 出的检验和度量; NOCOL、NOROW、NOPERCENT、NOFREQ 最为常用的选项是CHISQ和FISHER