第十一章非参数检验 在社会研究中我们经常要采用定序尺度,但直到现在,我们都还没有机会讨 论涉及到定序尺度的显著性检验。本章要讲述某些用于定序尺度的双样本检验 与以前所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例 如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均 值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非 参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行t检验 时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正 态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在 满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采 用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分 布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用 定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对 正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验 非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要 的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独 立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布” 不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。 不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。 很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯 定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”。 参数检验中的n n非参数检验中的 式中的n0和n分别是两种检验保证实现给定的检验力所需的样本容量。如 果说某种非参数检验的检验效率为95%,就意味着这种非参数检验在使用100 个数据时的效力等于t检验(在正确模型条件下)使用95个数据的效力。 检验力又称检验势,它是用1一β或[-(犯第二类错误的概率)]来定义的
第十一章 非参数检验 在社会研究中我们经常要采用定序尺度,但直到现在,我们都还没有机会讨 论涉及到定序尺度的显著性检验。本章要讲述某些用于定序尺度的双样本检验。 与以前所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例 如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均 值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非 参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行 t 检验 时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正 态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在 满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采 用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分 布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用 定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对 正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验。 非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要 的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独 立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布” 不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。 不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。 很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯 定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”。 式中的 n 0 和 n 分别是两种检验保证实现给定的检验力所需的样本容量。如 果说某种非参数检验的检验效率为 95%,就意味着这种非参数检验在使用 100 个数据时的效力等于 t 检验(在正确模型条件下)使用 95 个数据的效力。 检验力又称检验势,它是用 1―β或[1―(犯第二类错误的概率)]来定义的。 n n En 非参数检验中的 参数检验中的 0 =
也就是说,对于固定的样本容量,检验能够否定错误假设的能力越大,其相对检 验力越大。 第一节符号检验 “符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验 中,对于样本中每个个体的前测与后测,如果我们并不关心(X1-X0)的具体 数值,而只关心是增大了还是减小了。具体来说,就是只研究差值d的符号, 若X1>X0,记作“+” 若X1<X0,记作“一” 若X1=X0,删去 那么我们面对的就将是配对样本的“符号检验”问题了。“符号检验”并不 要求配对样本出自同一个总体,重要的是各个对的结果要相互独立。 符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差 中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之 中位数为零的零假设检验。现将符号检验的零假设和备择假设表达如下 HO:p(+)=p(-)=0.5 H1:单侧检验p(+)>p(-)域p(+)<p(-) 双侧检验p(+)≠p(-) 很显然,符号检验就是先假设p=0.5,按二项分布计算正号“+” 出现次数之抽样分布,然后以样本中正号“+”出现的次数ⅹ作为检验统计量 如果它是B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设, 即认为两总体存在平均水平上的差别。由此可见,符号检验是二项检验的一种实 际应用 [例]假设我们观测15个相配的对,获得两个差为零和13个差不为零,其 中有11个正号,2个负号,试在25%的显著性水平上进行单侧检验。 [解]HO:p=0.5 Hl:p(+)>p(一)
也就是说,对于固定的样本容量,检验能够否定错误假设的能力越大,其相对检 验力越大。 第一节 符号检验 “符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验 中,对于样本中每个个体的前测与后测,如果我们并不关心(X1―X0)的具体 数值,而只关心是增大了还是减小了。具体来说,就是只研究差值 d 的符号, 即 若 X1>X0,记作“+”; 若 X1<X0,记作“―”; 若 X1=X0,删去。 那么我们面对的就将是配对样本的“符号检验”问题了。“符号检验”并不 要求配对样本出自同一个总体,重要的是各个对的结果要相互独立。 符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差 中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之 中位数为零的零假设检验。现将符号检验的零假设和备择假设表达如下 H0:p (+)=p (―)=0.5 H1:单侧检验 p (+)>p (―)或 p (+)<p (―) 双侧检验 p (+)≠p (―) 很显然,符号检验就是先假设 p=0.5,按二项分布计算正号“+” 出现次数之抽样分布,然后以样本中正号“+”出现的次数 x 作为检验统计量。 如果它是 B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设, 即认为两总体存在平均水平上的差别。由此可见,符号检验是二项检验的一种实 际应用。 [例] 假设我们观测 15 个相配的对,获得两个差为零和 13 个差不为零,其 中有 11 个正号,2 个负号,试在 2.5%的显著性水平上进行单侧检验。 [解] H0:p=0.5 H1:p (+)>p (―)
由α=0.025确定否定域,查二项分布表(附表2) (13;13,0.5)=0.000 P(12;13,0.5)=0.002 (11;13,0.5)=0010 (10;13,0.5)=0.0 P(13)+P(12)+P(1)=0.000+0.002+0.010=0.012<0.025 P(13)+P(12)+P(11)+P(10)=0.012+0.035=0.047>0025 所以否定域由ⅹ等于11,12,13组成。现检验统计量ⅹ=11, 所以零假设p=0.5在25%显著性水平上被拒绝。 [例]随机地选择13个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在0.05显 著性水平上,用符号检验检验实验无效的零假设。 配对序号 后测/%值d=X-Xd-d (d-d)2 16 328 HI:p(+)>p( 由上例知,B(x;13,0.5)在a=0025显著性水平上,单侧检验(p >0.5)否定域由ⅹ由11,12,13组成 观察前表知,在13个相配的对中,10个差为正号,3个差为负号, 即检验统计量ⅹ=10。所以零假设p=0.5在25%显著性水平上不能被拒绝
由α=0.025 确定否定域,查二项分布表(附表 2) P (13;13,0.5)=0.000 P (12; 13,0.5)=0.002 P (11; 13,0.5)= 0.010 P (10; 13,0.5)=0.035 P (13) + P(12)+ P (11)=0.000 + 0.002 + 0.010 =0.012<0.025 P (13) + P (12) + P (11) +P(10)= 0.012 + 0.035=0.047>0.025 所以否定域由 x 等于 11,12,13 组成。现检验统计量 x=11, 所以零假设 p=0.5 在 2.5%显著性水平上被拒绝。 [例] 随机地选择 13 个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在 0.05 显 著性水平上,用符号检验检验实验无效的零假设。 [解] H0:p=0.5 H1:p (+)>p (―) 由上例知,B(x;13,0.5)在α=0.025 显著性水平上,单侧检验(p >0.5)否定域由 x 由 11,12,13 组成。 观察前表知,在 13 个相配的对中,10 个差为正号,3 个差为负号, 即检验统计量 x=10。所以零假设 p=0.5 在 2.5%显著性水平上不能被拒绝
对比[例10.31和[例11.1.2]可见,由于符号检验只计及差值d的符号,而没 有计及差值d的大小,所以有时用t检验可以作出拒绝零假设的判定,如改用符 号检验却往往不能作岀这样的判定。因此说,符号检验效力较低。根据计算,就 满足正态分布而言,符号检验法的效率是配对样本t检验的63%。即如果符号 检验法需要样本容量为100的话,那么t检验法只需n=63就可作出相同的检验。 但符号检验运用于定类尺度,对总体分布又无需加以限制,所以就配对样本的显 著性检验而言,其适应面是相当广的。 像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检 验)。 第二节配对符号秩检验 对于配对样本,至此我们已经接触了两种检验,即符号检验和t检验。在符 号检验中,只考虑差值d的符号而不管其大小,并且应用二项分布检验零假设。 另一方面,最有力的检验一—t检验,则不仅需要定距尺度,而且还要求假定 差值d服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征,其效力 也介乎两者之间 配对符号秩检验对于非正态分布的d值,是最佳检验,其检验效力大大高 于符号检验。如果t检验的假定成立,配对符号秩检验的检验效力对于大、小 样本都近乎为95%。因此,在定距尺度测量的水平上,若由于样本容量太小而 不能假定正态分布的时候,配对符号秩检验特别有用。 配对符号秩检验的零假设基本上和符号检验以及用于配对样本的t检验 的零假设相同。配对符号秩检验的步骤如下: (1)首先求出每对数据的差值d (2)不计正负,按绝对值大小把差值d按顺序排列起来 (3)绝对值最小者赋秩为l,第二小者赋秩为2,……,绝对 值最大者赋秩为n(其中绝对值相等者,将它们应得的秩均分之),再在差值 前补填上符号。 (4)求得正差值的秩和T+及负差值的秩和T-。我们期望两个秩和
对比[例 10.3.1]和[例 11.1.2]可见,由于符号检验只计及差值 d 的符号,而没 有计及差值 d 的大小,所以有时用 t 检验可以作出拒绝零假设的判定,如改用符 号检验却往往不能作出这样的判定。因此说,符号检验效力较低。根据计算,就 满足正态分布而言,符号检验法的效率是配对样本 t 检验的 63%。即如果符号 检验法需要样本容量为 100 的话,那么 t 检验法只需 n=63 就可作出相同的检验。 但符号检验运用于定类尺度,对总体分布又无需加以限制,所以就配对样本的显 著性检验而言,其适应面是相当广的。 像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检 验)。 第二节 配对符号秩检验 对于配对样本,至此我们已经接触了两种检验,即符号检验和 t 检验。在符 号检验中,只考虑差值 d 的符号而不管其大小,并且应用二项分布检验零假设。 另一方面,最有力的检验—— t 检验,则不仅需要定距尺度,而且还要求假定 差值 d 服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征,其效力 也介乎两者之间。 配对符号秩检验对于非正态分布的 d 值,是最佳检验,其检验效力大大高 于符号检验。如果 t 检验的假定成立,配对符号秩检验的检验效力对于大、小 样本都近乎为 95%。因此,在定距尺度测量的水平上,若由于样本容量太小而 不能假定正态分布的时候,配对符号秩检验特别有用。 配对符号秩检验的零假设基本上和符号检验以及用于配对样本的 t 检验 的零假设相同。配对符号秩检验的步骤如下: (1) 首先求出每对数据的差值 d 。 (2) 不计正负,按绝对值大小把差值 d 按顺序排列起来。 (3)绝对值最小者赋秩为 l,第二小者赋秩为 2,……,绝对 值最大者赋秩为 n (其中绝对值相等者,将它们应得的秩均分之),再在差值 前补填上符号。 (4)求得正差值的秩和 T+ 及负差值的秩和 T- 。我们期望两个秩和
应该近似相等。如果T+和T相差太大,就应该否定零假设 (5)取两个秩和中较小的一个,即T=min(T+,「,作为检验统计量 (6)给定显著性水平α。如果n小,从配对符号秩检验表(附表9)中直接查 出临界值Ta(n)。如果n大(n>25),就要应用正态近似法,查出Za(单侧检验) 或Zα2(双侧检验,同时检验统计量Z按下式计算 T-n(n+1)/4 n(n+1)(2n+1)/24 (7)若T≤Ta(n),就拒绝零假设,同时认为总体间有显著性差异。 [例]随杋地选择13个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在005显 著性水平上,用配对符号秩检验检验检验实验无效的零假设。 表11,1 前测/%后测/%差值d1a1的秩负秩绝对值 l.5 (+)12 +)8 H0:T+=,即在总体中,正秩和等于负秩和。 H1:T+> 前表给出了有关资料,由此又列出了配对符号秩检验所需要的数据。 根据表中数据,可以看出负秩和小于正秩和。因此检验统计量T取负秩和。 T==1.5+4+8=13.5 由a=0.025,n=13,查表得单侧检验的
应该近似相等。如果 T+和 T-相差太大,就应该否定零假设。 (5)取两个秩和中较小的一个,即 T=min(T+ ,|T-|),作为检验统计量。 (6)给定显著性水平α。如果 n 小,从配对符号秩检验表(附表 9)中直接查 出临界值 Tα(n)。如果 n 大(n>25),就要应用正态近似法,查出 Zα(单侧检验) 或 Zα/2(双侧检验),同时检验统计量 Z 按下式计算 (7)若 T ≤ Tα(n) ,就拒绝零假设,同时认为总体间有显著性差异。 [例] 随机地选择 13 个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在 0.05 显 著性水平上,用配对符号秩检验检验检验实验无效的零假设。 [解] H0:T+ =|T-|,即在总体中,正秩和等于负秩和。 H1:T+ >|T-|。 前表给出了有关资料,由此又列出了配对符号秩检验所需要的数据。 根据表中数据,可以看出负秩和小于正秩和。因此检验统计量 T 取负秩和。 T =|T-|=1.5 + 4 + 8=13.5 由α=0.025,n=13,查表得单侧检验的 ( 1)(2 1)/ 24 ( 1)/ 4 + + − + = n n n T n n Z