第十一章秩转换的非参数检验问题1.某大学进行英语教学模式探讨,将20名大学生按性别、英语初试成绩配成10对,然后随机分配每对学生到两个英语教学模式强化班进行一个月强化训练,训练后对20名大学生进行了模拟四级英语考试,要比较两种英语教学模式效果的差别,应该怎样分析呢?2.为预防大学生心理危机发生,降低自杀危险性,某课题组采用贝克抑郁自评量表(BDI-13)对当地几所高校一年级大学生进行了问卷的抽样调查。其中抑郁的程度分为无、轻、中、重四个等级。要比较不同性别发生抑郁的程度有无差别,应该如何分析?对以上问题需要通过非参数检验回答。非参数检验(nonparametric test)是相对于参数检验(parametrictest)而言的。参数检验是假定随机样本来自某种已知分布(如正态分布)的总体,并对总体分布的参数(如总体均数)进行估计或检验。t检验和方差分析属参数统计方法。非参数检验又称任意分布检验(distribution-freetest),该类方法的统计推断基础是比较分布而不是比较参数,对总体分布不作严格定义,不依赖于总体分布类型,也不对总体参数进行统计推断。非参数统计方法应用十分广泛,可以解决①总体分布不确定。②不能或未加精确测量资料,如等级资料。③一端或两端无确定数值的资料。④分布呈非正态而又无适当的数据转换方法等假设检验问题。非参数统计方法很多,本章主要介绍秩转换的非参数检验。秩转换的非参数检验是先将数值变量从小到大转换成秩,或先将等级从弱到强转换成秩,然后计算检验统计量,其假设检验的结果只对总体分布的位置差别敏感,对总体分布的形状差别不敏感。对于符合参数检验的资料如果用非参数检验方法,由于没有充分利用资料提供的信息,往往导致其检验效率会低手参数检验,犯Ⅱ型错误的概率增大。因此,在实际工作中对符合参数检验或经变量变换后符合参数检验的资料应首选参数检验。本章学习目标1.理解参数与非参数检验法的含义与特点2.熟练掌握熟悉不同设计类型的秩和检验方法3.初步掌握SPSS中秩和检验的操作1
1 第十一章 秩转换的非参数检验 问题 1.某大学进行英语教学模式探讨,将 20 名大学生按性别、英语初试成绩配成 10 对, 然后随机分配每对学生到两个英语教学模式强化班进行一个月强化训练,训练后对 20 名大 学生进行了模拟四级英语考试,要比较两种英语教学模式效果的差别,应该怎样分析呢? 2.为预防大学生心理危机发生,降低自杀危险性,某课题组采用贝克抑郁自评量表 (BDI-13)对当地几所高校一年级大学生进行了问卷的抽样调查。其中抑郁的程度分为无、 轻、中、重四个等级。要比较不同性别发生抑郁的程度有无差别,应该如何分析? 对以上问题需要通过非参数检验回答。非参数检验(nonparametric test)是相对于参数 检验(parametric test)而言的。 参数检验是假定随机样本来自某种已知分布(如正态分布)的总体,并对总体分布的参 数(如总体均数)进行估计或检验。 t 检验和方差分析属参数统计方法。 非参数检验又称任意分布检验(distribution-free test),该类方法的统计推断基础是比较 分布而不是比较参数,对总体分布不作严格定义,不依赖于总体分布类型,也不对总体参数 进行统计推断。非参数统计方法应用十分广泛,可以解决①总体分布不确定。②不能或未加 精确测量资料,如等级资料。③一端或两端无确定数值的资料。④分布呈非正态而又无适当 的数据转换方法等假设检验问题。 非参数统计方法很多,本章主要介绍秩转换的非参数检验。秩转换的非参数检验是先将 数值变量从小到大转换成秩,或先将等级从弱到强转换成秩,然后计算检验统计量,其假设 检验的结果只对总体分布的位置差别敏感,对总体分布的形状差别不敏感。 对于符合参数检验的资料如果用非参数检验方法,由于没有充分利用资料提供的信息, 往往导致其检验效率会低于参数检验,犯Ⅱ型错误的概率增大。因此,在实际工作中对符合 参数检验或经变量变换后符合参数检验的资料应首选参数检验。 本章学习目标 1. 理解参数与非参数检验法的含义与特点 2. 熟练掌握熟悉不同设计类型的秩和检验方法 3. 初步掌握 SPSS 中秩和检验的操作
第一节Wilcoxon符号秩检验Wilcoxon符号秩和检验(Wilcoxonsignedranktest)又称Wilcoxon配对法,Wilcoxon(1945年)提出这个方法,其研究目的是推断配对资料的差值是否来自中位数为零的总体也用于推断总体中位数是否等于指定值。Wilcoxon符号秩和检验的基本思想是:假定两种处理效应相同(或某种处理无作用),则差值的总体分布是对称的,总体中位数为0(H。);在H。所规定的总体中抽样,当观察例数比较多时,正、负秩和应大致相等,差别只是一些随机因素造成的。即如果H。成立,从差值的随机样本中获得正、负秩和相差悬殊的可能性很小。如果样本的正秩和与负秩和差别很大,根据小概率事件在一次抽样中不可能发生的推断理论,我们有理由拒绝H。,接受H,,即认为两种处理效应不同(或某种处理有作用);反之,不拒绝H。,不能认为两种处理效应不同(或某种处理有作用)。一、配对设计资料的分析Wilcoxon符号秩检验用于配对设计样本差值的中位数和0的比较,目的是推断配对样本差值的总体中位数是否和0有差别,即推断配对资料的两个相关样本所来自的两个总体中位数是否有差别。例11-1某大学进行英语教学模式探讨,将20名大学生按性别、英语初试成绩配成10对,然后随机分配每对学生到两个英语教学模式强化班进行强化训练,训练一个月后这10对大学生的模拟四级英语考试成绩如下所示。请问参加不同英语教学模式强化班的效果有无差别?编号123345678910强化1班706268688184648798637强化2班80867773918172897279本例为小样本资料,对两个英语教学模式强化班模拟四级英语考试成绩的差值作正态性检验,得0.05<P<0.10,按α=0.10水准拒绝H。,接受H,,即资料不符合正态分布,不满足配对t检验的条件,作为非正态分布资料,现用Wilcoxon符号秩检验。1.建立检验假设,确定检验水准H。:差值的总体中位数M。=0H:Ma+0α=0.052.计算检验统计量(1)编秩刨除差值为0的对子后,余下的为有效对子数n,见表11-1第(4)栏,有效对子数n=9:按9个差值的绝对值从小到大编秩,遇差值的绝对值相等时需要取平均秩,称为相同秩,表11-1第(4)栏差值的绝对值有2个为3,其秩依次应为1,2,取平均秩各为1.5,秩的正负符号与差值相同,见表11-1第(5)栏。2
2 第一节 Wilcoxon 符号秩检验 Wilcoxon 符号秩和检验(Wilcoxon signed rank test)又称 Wilcoxon 配对法,Wilcoxon (1945 年)提出这个方法,其研究目的是推断配对资料的差值是否来自中位数为零的总体, 也用于推断总体中位数是否等于指定值。 Wilcoxon 符号秩和检验的基本思想是:假定两种处理效应相同(或某种处理无作用), 则差值的总体分布是对称的,总体中位数为 0( H0 );在 H0 所规定的总体中抽样,当观察 例数比较多时,正、负秩和应大致相等,差别只是一些随机因素造成的。即如果 H0 成立, 从差值的随机样本中获得正、负秩和相差悬殊的可能性很小。如果样本的正秩和与负秩和差 别很大,根据小概率事件在一次抽样中不可能发生的推断理论,我们有理由拒绝 H0 ,接受 H1 ,即认为两种处理效应不同(或某种处理有作用);反之,不拒绝 H0 ,不能认为两种处 理效应不同(或某种处理有作用)。 一、配对设计资料的分析 Wilcoxon 符号秩检验用于配对设计样本差值的中位数和 0 的比较,目的是推断配对样本 差值的总体中位数是否和 0 有差别,即推断配对资料的两个相关样本所来自的两个总体中位 数是否有差别。 例 11-1 某大学进行英语教学模式探讨,将 20 名大学生按性别、英语初试成绩配成 10 对,然后随机分配每对学生到两个英语教学模式强化班进行强化训练,训练一个月后这 10 对大学生的模拟四级英语考试成绩如下所示。请问参加不同英语教学模式强化班的效果有无 差别? 编号 1 2 3 4 5 6 7 8 9 10 强化 1 班 70 62 68 68 81 84 64 86 37 79 强化 2 班 80 86 77 73 91 81 72 89 72 79 本例为小样本资料,对两个英语教学模式强化班模拟四级英语考试成绩的差值作正态性 检验,得 0.05 0.10 P ,按 = 0.10 水准拒绝 H0 ,接受 H1 ,即资料不符合正态分布, 不满足配对 t 检验的条件,作为非正态分布资料,现用 Wilcoxon 符号秩检验。 1.建立检验假设,确定检验水准 H0 :差值的总体中位数 Md = 0 H1: Md 0 = 0.05 2.计算检验统计量 (1)编秩 刨除差值为 0 的对子后,余下的为有效对子数 n ,见表 11-1 第(4)栏,有效对子数 n = 9 ; 按 9 个差值的绝对值从小到大编秩,遇差值的绝对值相等时需要取平均秩,称为相同秩, 表 11-1 第(4)栏差值的绝对值有 2 个为 3,其秩依次应为 1,2,取平均秩各为 1.5,秩的正负 符号与差值相同,见表 11-1 第(5)栏
表11-1不同英语教学模式强化班的模拟四级英语考试成绩比较配对号强化1班强化2班差值d秩次(2)(1)(3)(5)(4)=(3)-(2)17079-10-6262 86-24-8368-977-546873-5-358191-10-76848131.576472-8-488689-3-1.592772-35-91079790T =1.5 T. = 43.5(2)求秩和并确定统计量T值正、负差值秩次之和分别以T、T表示,T及T之和等于n(n+1)/2,即1+2+3++n之和,此式可验算T和T的计算是否正确。对例11-1计算得T=1.5,T=43.5,其和为45,n(n+1)/2=9(9+1)/2=45,可见于T,T计算无误。双侧检验时,取绝对值较小的秩和为统计量T,本例取T=1.5。3.确定P值并推断结论A:查表法当n≤50时,查T界值表。查表时,先找到横标目n,将检验统计量T值与此行上的界值范围自左向右逐一相比,若T值在上、下界值范围外,其P值小于表纵标目所示相应概率水平;若T值恰好等于界值,其P值是近似等于相应概率水平(一般很少遇到);若T值在上、下界值范围内,其P值大于相应概率水平。本例n=9,T=1.5,查T界值表,得双侧0.01<P<0.02,按α=0.05水准拒绝H。,接受H,可认为两不同英语教学模式强化班的效果有差别,即强化2班英语教学模式好。注意:如果较小样本出现相同秩较多时,检验结果会存在偏性。因此,应尽量提高测量精度,以避免出现较多的相同秩。B:正态近似法若n>50,超出T界值表的范围,可利用秩和T分布的正态近似法作Z检验,此时T的均数与标准误分别为μ=n(n+1)/4(11-1)0r= /n(n+1)(2n+1)/24(11-2)T分布近似正态分布,有公式(11-3)计算Z值3
3 表11-1 不同英语教学模式强化班的模拟四级英语考试成绩比较 配对号 强化1班 强化2班 差值 d 秩次 (1) (2) (3) (4)=(3)-(2) (5) 1 70 79 -10 -6 2 62 86 -24 -8 3 68 77 -9 -5 4 68 73 -5 -3 5 81 91 -10 -7 6 84 81 3 1.5 7 64 72 -8 -4 8 86 89 -3 -1.5 9 27 72 -35 -9 10 79 79 0 T 1.5 + = T 43.5 − = (2)求秩和并确定统计量 T 值 正、负差值秩次之和分别以 T+ 、T− 表示,T+ 及 T− 之和等于 n n( 1) / 2 + ,即 1 2 3 + + + . +n 之和,此式可验算 T+ 和 T− 的计算是否正确。对例 11-1 计算得 T 1.5 + = ,T 43.5 − = ,其 和为 45, n n( 1) / 2 9(9 1) / 2 45 + = + = ,可见于 T+ ,T− 计算无误。 双侧检验时,取绝对值较小的秩和为统计量 T ,本例取 T =1.5 。 3.确定 P 值并推断结论 A:查表法 当 n 50 时,查 T 界值表。查表时,先找到横标目 n ,将检验统计量 T 值与此行上的 界值范围自左向右逐一相比,若 T 值在上、下界值范围外,其 P 值小于表纵标目所示相应 概率水平;若 T 值恰好等于界值,其 P 值是近似等于相应概率水平(一般很少遇到);若 T 值在上、下界值范围内,其 P 值大于相应概率水平。本例 n = 9 ,T =1.5 ,查 T 界值表, 得双侧 0.01 0.02 P ,按 = 0.05 水准拒绝 H0 ,接受 H1 ,可认为两不同英语教学模式 强化班的效果有差别,即强化 2 班英语教学模式好。 注意:如果较小样本出现相同秩较多时,检验结果会存在偏性。因此,应尽量提高测量 精度,以避免出现较多的相同秩。 B:正态近似法 若 n 50 ,超出 T 界值表的范围,可利用秩和 T 分布的正态近似法作 Z 检验,此时 T 的均数与标准误分别为 T = n(n +1)/ 4 (11-1) T = n(n +1)(2n +1)/ 24 (11-2) T 分布近似正态分布,有公式(11-3)计算 Z 值
Z = - 4μ/-0.5_ I_ - n( +1)/4 - 0.5(11-3)dTVn(n+1)(2n+1)/24式中0.5是连续性校正值,当n足够时可省略这种连续性校正。若相同秩次的个数较多(超过25%)时,用式(11-3)求得的Z值偏小,应按公式(11-4)计算较正的Zc。T-n(n+1)/4-0.5(11-4)Z=n(n+1)(2n+1)_Z(tj-t)V 2448式中t,为第j个(-1,2)含相同秩次的个数。假定某资料中第一次相同秩有2个1.5,第二次相同秩有3个8.5,第三次相同秩有5个25,则t,=2,t2=3,1=5,Z(t -t)=(23 -2)+(33 -3)+(53 -5)=150 。符号秩检验若用于配对的等级资料,则先把等级从弱到强转换成秩(1,2,3,…);然后求各对秩的差值,省略所有差值为0的对子数,令余下的有效对子数为n;最后按n个差值编正秩与负秩,分别计算正秩和与负秩和。对于等级资料,因相同秩多,最好用大样本。二、样本中位数与总体中位数比较一组随机样本来自正态总体,其目的是比较该总体均数与某常数是否不同时,可用1检验;如果是总体分布非正态或未知的一组样本资料,要比较该总体中位数与某数值是否不同,可选用Wilcoxon符号秩和检验。例11-2某课题组为探讨即将毕业的男大学生抑郁水平是否高于在校男生,随机抽取某医学高校五年级男生25名,作贝克抑郁自评量表(BDI-13)的问卷调查。贝克抑郁总分为:0、3、5、16、25、2、0、4、0、4、9、2、2、1、14、12、13、9、5、8、0、7、6、1、6,已知一般高校在校男生贝克总分的总体中位数为3。试比较医学高校即将毕业的男大学生贝克抑郁总分的水平与一般在校男生是否相同?用一样本中位数和总体中位数比较,目的是推断样本所来自的总体中位数M和某个已知的总体中位数M。是否有差别。即用样本各变量值和M。的差值,推断差值的总体中位数与0是否有差别。其检验原理与配对设计资料类似,所不同的只是差值为各观察值与已知总体中位数之差:d=X-M。,其他符号的意义同配对设计资料。计算样本资料25例贝克抑郁总分与已知总体贝克抑郁总分中位数M。=3的差值并进行正态性检验,得W=0.8678,P=0.0039,按α=0.10水准拒绝H。,差值不符合正态分布,即例11-2资料不满足t检验关于样本来自正态分布总体的条件,宜用Wilcoxon符号秩检验。4
4 ( 1)(2 1)/ 24 0.5 ( 1)/ 4 0.5 + + − + − = − − = n n n T T n n Z T T (11-3) 式中 0.5 是连续性校正值,当 n 足够时可省略这种连续性校正。 若相同秩次的个数较多(超过 25%)时,用式(11-3)求得的 Z 值偏小,应按公式(11-4) 计算较正的 Zc。 48 ( ) 24 ( 1)(2 1) ( 1)/ 4 0.5 3 − − + + − + − = j j c n n n t t T n n Z (11-4) 式中 j t 为第 j 个(j=1,2,.)含相同秩次的个数。假定某资料中第一次相同秩有 2 个 1.5, 第二次相同秩有 3 个 8.5,第三次相同秩有 5 个 25,则 t 1 = 2, 2 t = 3, 3 t = 5 , 3 3 3 3 ( ) (2 2) (3 3) (5 5) 150 j j t t − = − + − + − = 。 符号秩检验若用于配对的等级资料,则先把等级从弱到强转换成秩(1,2,3,.);然后求 各对秩的差值,省略所有差值为 0 的对子数,令余下的有效对子数为 n ;最后按 n 个差值编 正秩与负秩,分别计算正秩和与负秩和。对于等级资料,因相同秩多,最好用大样本。 二、样本中位数与总体中位数比较 一组随机样本来自正态总体,其目的是比较该总体均数与某常数是否不同时,可用 t 检验; 如果是总体分布非正态或未知的一组样本资料,要比较该总体中位数与某数值是否不同,可 选用 Wilcoxon 符号秩和检验。 例 11-2 某课题组为探讨即将毕业的男大学生抑郁水平是否高于在校男生,随机抽取 某医学高校五年级男生 25 名,作贝克抑郁自评量表(BDI-13)的问卷调查。贝克抑郁总分 为:0、3、5、16、25、2、0、4、0、4、9、2、2、1、14、12、13、9、5、8、0、7、6、1、 6,已知一般高校在校男生贝克总分的总体中位数为 3。试比较医学高校即将毕业的男大学 生贝克抑郁总分的水平与一般在校男生是否相同? 用一样本中位数和总体中位数比较,目的是推断样本所来自的总体中位数 M 和某个已 知的总体中位数 M0 是否有差别。即用样本各变量值和 M0 的差值,推断差值的总体中位数 与 0 是否有差别。其检验原理与配对设计资料类似,所不同的只是差值为各观察值与已知 总体中位数之差: i 0 d X M = − ,其他符号的意义同配对设计资料。 计算样本资料 25 例贝克抑郁总分与已知总体贝克抑郁总分中位数 0 M = 3 的差值并进行 正态性检验,得 W P = = 0.8678, 0.0039,按 = 0.10 水准拒绝 H0 ,差值不符合正态分布, 即例 11-2 资料不满足 t 检验关于样本来自正态分布总体的条件,宜用 Wilcoxon 符号秩检验
表11-225名高校将毕业的男大学生抑郁贝克总分与3比较样本号贝克总分d=(2)-3秩次(1)(2)(3)(4) 10-3-12.523043527.5416132352522 24 62-1-370-3-12.5841390-3-12.510413119618.5122-1-3213-1-3141-2-7.511141122916122017131021189618.519527.5852017210-3-12.5227416236312.51-224-7.5256312.5T = 226T = 74计算样本资料25例贝克抑郁总分与已知总体贝克抑郁总分中位数M。=3的差值并进行正态性检验,得W=0.8678,P=0.0039,按α=0.10水准拒绝H。,差值不符合正态分布,即例11-2资料不满足t检验关于样本来自正态分布总体的条件,宜用Wilcoxon符号秩检验。对例11-2资料的检验步骤1.建立检验假设,确定检验水准H。:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生相同,即M。=0H,:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生不同,即M。+0α=0.055
5 表11-2 25名高校将毕业的男大学生抑郁贝克总分与3比较 样本号 贝克总分 d= (2)-3 秩次 (1) (2) (3) (4) 1 0 -3 -12.5 2 3 0 — 3 5 2 7.5 4 16 13 23 5 25 22 24 6 2 -1 -3 7 0 -3 -12.5 8 4 1 3 9 0 -3 -12.5 10 4 1 3 11 9 6 18.5 12 2 -1 -3 13 2 -1 -3 14 1 -2 -7.5 11 14 11 22 16 12 9 20 17 13 10 21 18 9 6 18.5 19 5 2 7.5 20 8 5 17 21 0 -3 -12.5 22 7 4 16 23 6 3 12.5 24 1 -2 -7.5 25 6 3 12.5 T 226 + = T 74 − = 计算样本资料 25 例贝克抑郁总分与已知总体贝克抑郁总分中位数 0 M = 3 的差值并进行 正态性检验,得 W P = = 0.8678, 0.0039,按 = 0.10 水准拒绝 H0 ,差值不符合正态分布, 即例 11-2 资料不满足 t 检验关于样本来自正态分布总体的条件,宜用 Wilcoxon 符号秩检验。 对例 11-2 资料的检验步骤 1.建立检验假设,确定检验水准 H0:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生相同,即 Md = 0 H1:医学高校即将毕业的男生贝克抑郁总分水平与一般在校男生不同,即 0 Md = 0.05