第八章单因素方差分析问题在前面的章节中我们介绍了两样本均数差异比较的1检验。但是心理学研究的人的行为非常复杂,往往需要对2组以上的样本均数进行比较。例如在一所国际性大学抽取一定的样本学生进行一次文化公平的智力测试,需要比较来自多个不同国家的学生得分是否存在差异?这里涉及到了两个以上样本均数的比较,如果我们继续使用t检验方法对每一对平均数的差异进行一一比较,将会增加I型错误。本章将介绍的方差分析(AnalysisofVatiance,ANOVA)就是用来解决两个以上样本均数比较问题的。方差分析是借助对变异的分解来比较两个及两个以上样本均数,而变异的分解往往与试验设计类型联系在一起。所以,根据不同的试验设计类型,方差分析根据研究处理因素个数的多少可以分为单因素方差分析(one-wayANOVA)和多因素方差分析(multivariateANOVA)。单因素方差分析是研究同一研究因素的不同水平下,各组样本均数间的差异是否具有统计学意义。多因素方差分析研究多个研究因素下,各组样本均数间的差异是否具有统计学意义。本章重点介绍单因素方差分析。学习目标1.掌握方差分析的基本思想2.了解方差分析中因素、处理和水平的概念3.掌握完全随机设计资料的单因素方差分析4.掌握随机区组设计资料的方差分析5.掌握多个样本均数间的多重比较6.应用SPSS进行方差分析7.了解方差分析的结果解释8.了解方差分析对数据的要求或应用条件第一节完全随机设计资料的方差分析一、完全随机设计思想完全随机设计是指遵循随机化的原则,随机抽取研究对象并将其随机分配到k个处理组,每组分别接受不同的处理。试验结束后,比较各个处理组之间的差异是否具有统计学意义,推论处理因素的效应。如例8-1就是完全随机设计的资料,它将数据按照一个处理因素(指导措施)进行分组整理,属于单因素方差分析。二、方差分析的基本原理样本均数间之所以有差别,可能有两种原因造成:首先它必然有随机误差(包括个体间变异)的影响:其次,如果各组接受的不同处理(treatment)方法产生的不同作用效应。方差分析的基本思想就是把全部观察值之间的变异一一总变异按设计和需要分解成两个或多个组成部分,再作分析。我们通过例8-1的数据来详细说明方差分析的基本思路。例8-1为研究详尽复述(elaboratedrehearsal)在记忆中的作用,某研究者随机抽取了181
1 第八章 单因素方差分析 问题 在前面的章节中我们介绍了两样本均数差异比较的 t 检验。但是心理学研究的人的行为非常复 杂,往往需要对 2 组以上的样本均数进行比较。例如在一所国际性大学抽取一定的样本学生进行一 次文化公平的智力测试,需要比较来自多个不同国家的学生得分是否存在差异?这里涉及到了两个 以上样本均数的比较,如果我们继续使用 t 检验方法对每一对平均数的差异进行一一比较,将会增加 I 型错误。本章将介绍的方差分析(Analysis of Vatiance, ANOVA)就是用来解决两个以上样本均 数比较问题的。 方差分析是借助对变异的分解来比较两个及两个以上样本均数,而变异的分解往往与试验设计 类型联系在一起。所以,根据不同的试验设计类型,方差分析根据研究处理因素个数的多少可以分 为单因素方差分析(one-way ANOVA)和多因素方差分析(multivariate ANOVA)。单因素方差分析是 研究同一研究因素的不同水平下,各组样本均数间的差异是否具有统计学意义。多因素方差分析研 究多个研究因素下,各组样本均数间的差异是否具有统计学意义。本章重点介绍单因素方差分析。 学习目标 1. 掌握方差分析的基本思想 2. 了解方差分析中因素、处理和水平的概念 3. 掌握完全随机设计资料的单因素方差分析 4. 掌握随机区组设计资料的方差分析 5. 掌握多个样本均数间的多重比较 6. 应用 SPSS 进行方差分析 7. 了解方差分析的结果解释 8. 了解方差分析对数据的要求或应用条件 第一节 完全随机设计资料的方差分析 一、完全随机设计思想 完全随机设计是指遵循随机化的原则,随机抽取研究对象并将其随机分配到 k 个处理组,每组 分别接受不同的处理。试验结束后,比较各个处理组之间的差异是否具有统计学意义,推论处理因 素的效应。如例 8-1 就是完全随机设计的资料,它将数据按照一个处理因素(指导措施)进行分组 整理,属于单因素方差分析。 二、方差分析的基本原理 样本均数间之所以有差别,可能有两种原因造成:首先它必然有随机误差(包括个体间变异) 的影响;其次,如果各组接受的不同处理(treatment)方法产生的不同作用效应。方差分析的基本 思想就是把全部观察值之间的变异——总变异按设计和需要分解成两个或多个组成部分,再作分析。 我们通过例 8-1 的数据来详细说明方差分析的基本思路。 例 8-1 为研究详尽复述(elaborated rehearsal)在记忆中的作用,某研究者随机抽取了 18
个受试对象。按完全随机设计方案将他们随机分为三组,要求每组受试者都记忆10个生词,生词内容和难度对每组受试者都是一样的,但给予不同的指导:第一组的受试者可以通过反复朗读单词来记忆;第二组受试者可以通过查生词的意思来记忆:第三组受试者可以通过寻找生词之间的联系来记忆。在经过一段时间记忆后,要求被试者写出所记住的生词,得记住生词个数,结果如表8-1所示。试问不同指导措施在记忆中的作用是否相同?表8-1不同指导措施下各组被试者所记住的生词数第一组第二组第三组合计(i=l)(i=2)(i=3)5府510689(观察值)831065883835263843 ZXiEX(Zx)108656(N)18n,4.336.338.60x(X)6.29124252389Ex?(Zx2)855在表8-1中,用X代表观察值,XX,来表示第i个处理组的第j个观察值,i=1,2,..,k,j=1,2,..,n。n,为第i个处理组的例数,总例数为n,=N。X指第i个处理组的均数,X表示全部试验结果的均数。观察表8-1中各数据间的差异,可以发现以下三种变异:1.总变异全部观察值大小各不相等,其变异就称为总变异(totalvariation)。用SS总表示,其计算公式为各个观察值与总体均数的离均差平方和(sumofsquaresofdeviantfrommean),即:SSe =Z (X -X)(8-1)因为离均差平方和受到观察值个数多少的影响,观察的个数越多,离均差平方和就越大,因此,它与总例数N有关,具体的说与总的自由度有关。总自由度为:V总=V= N-1(8-2)2.组间变异由于各组处理不同所引起的变异称为组间变异(variationbetweengroups)。它反应了处理因素对不同组的影响,同时也包括了随机误差。用SS组间表示,其计算公式为:2
2 个受试对象。按完全随机设计方案将他们随机分为三组,要求每组受试者都记忆 10 个生词,生词内 容和难度对每组受试者都是一样的,但给予不同的指导:第一组的受试者可以通过反复朗读单词来 记忆;第二组受试者可以通过查生词的意思来记忆;第三组受试者可以通过寻找生词之间的联系来 记忆。在经过一段时间记忆后,要求被试者写出所记住的生词,得记住生词个数,结果如表 8-1 所 示。试问不同指导措施在记忆中的作用是否相同? 表 8-1 不同指导措施下各组被试者所记住的生词数 第一组 (i=1) 第二组 (i=2) 第三组 (i=3) 合计 Xij (观察值) 5 5 10 6 8 9 3 8 10 6 5 8 3 8 8 3 5 X I ∑Xi 26 38 43 ( X ) 108 i n 6 6 5 (N) 18 i x 4.33 6.33 8.60 ( X ) 6.29 2 Xi 124 252 389 ( 2 X ) 855 在表 8-1 中,用 X 代表观察值,Xij Xij 来表示第 i 个处理组的第 j 个观察值, i =1,2,.,k , j =1,2,., n 。 i n 为第 i 个处理组的例数,总例数为 i n = N 。 Xi 指第 i 个处理组的均数, X 表示全部试验结果的均数。 观察表 8-1 中各数据间的差异,可以发现以下三种变异: 1. 总变异 全部观察值大小各不相等,其变异就称为总变异(total variation)。用 SS总 表 示,其计算公式为各个观察值与总体均数的离均差平方和(sum of squares of deviant from mean), 即: SS总 = 2 ( ) X X − (8-1) 因为离均差平方和受到观察值个数多少的影响,观察的个数越多,离均差平方和就越大,因 此,它与总例数 N 有关,具体的说与总的自由度有关。总自由度为: v总 = v= N -1 (8-2) 2. 组间变异 由于各组处理不同所引起的变异称为组间变异(variation between groups)。 它反应了处理因素对不同组的影响,同时也包括了随机误差。用 SS 组间表示,其计算公式为:
SS组间=n, (Xi-x)(8-3)组间变异的自由度为:(8-4)V组间=k-1(式中k为组数)3.组内变异每个处理组内部的各个观察值也大小不等,与每组的样本均数X也不相同,这种变异称为组内变异(variationwithingroups)。组内变异只反映随机误差的大小,如个体差异、随机测量误差等。因此,又称为误差变异。用SS组内表示,即:SS组内=-(X,-X,)2(8-5)(8-6)组内变异的自由度为:组内=N-k数理统计可以发现三种变异及相应自由度的关系为:(8-8)SS总=SS组间+SS组内(8-8)V总=V组间+V组内由此可见,总变异可以被分解为组间变异和组内变异两部分,总自由度也可分解为组内自由度和组间自由度。由于组间变异反映处理的效应和随机误差的作用,组内变异反映随机误差的作用。因此,如果没有处理效应或者处理效应的作用没有发挥,组内变异的大小应该与组间变异相同,均反映随机误差的作用。如果处理效应的作用明显,则组内变异与组间变异之间就会不同。以上各部份离均差平方和只能反映变异的绝对大小。为了反映平均变异大小,须将各部份离均差平方和除以相应自由度,其结果称为均方(meansquare,MS),公式为:MS组间=SS祖间/v组间,MS组内=SS组内/v组内(8-9)两个均方值之比为F统计量:F=MS组间/MS组内(8-10)F值越接近1,反映组间变异与组内变异间无显著差异,处理效应的作用就越小。相反,F值越大,反应处理效应越大。但是,F值要大到什么程度才有明显的统计学意义呢?我们可以通过查F界值表得到相应的P值,然后根据事先设定的检验水准α进行统计推断。检验统计量F的计算可以整理成方差分析表见表8-2。表8-2完全随机设计资料方差分析表VSSMSF变异来源N-1总变异ZZ X,?-Ck-1组间变异(Ex,)?SS组间MS组间ZCMS组内V组间n,N-k组内变异ZE(X,-x)SS组内V组内3
3 SS组间 = i i n 2 ( ) Xi X − (8-3) 组间变异的自由度为: v组间 =k-1 (式中 k 为组数 ) (8-4) 3. 组内变异 每个处理组内部的各个观察值也大小不等,与每组的样本均数 Xi 也不相同,这 种变异称为组内变异(variation within groups)。组内变异只反映随机误差的大小,如个体差异、 随机测量误差等。因此,又称为误差变异。用 SS 组内表示,即: 2 ( ) ij i i j SS X X 组内 = − (8-5) 组内变异的自由度为: v N k 组内 = − (8-6) 数理统计可以发现三种变异及相应自由度的关系为: SS总 = SS组间 + SS组内 (8-8) v总 = v组间 + v组内 (8-8) 由此可见,总变异可以被分解为组间变异和组内变异两部分,总自由度也可分解为组内自由度 和组间自由度。 由于组间变异反映处理的效应和随机误差的作用,组内变异反映随机误差的作用。因此,如果 没有处理效应或者处理效应的作用没有发挥,组内变异的大小应该与组间变异相同,均反映随机误 差的作用。如果处理效应的作用明显,则组内变异与组间变异之间就会不同。 以上各部份离均差平方和只能反映变异的绝对大小。为了反映平均变异大小,须将各部份离均 差平方和除以相应自由度,其结果称为均方(mean square,MS),公式为: MS 组间 =SS 组间/v 组间 ,MS 组内=SS 组内/v 组内 (8-9) 两个均方值之比为 F 统计量: F = MS组间 / MS组内 (8-10) F 值越接近 1,反映组间变异与组内变异间无显著差异,处理效应的作用就越小。相反,F 值 越大,反应处理效应越大。但是, F 值要大到什么程度才有明显的统计学意义呢?我们可以通过查 F 界值表得到相应的 P 值,然后根据事先设定的检验水准 α 进行统计推断。 检验统计量 F 的计算可以整理成方差分析表见表 8-2。 表 8-2 完全随机设计资料方差分析表 变异来源 v SS MS F 总变异 N -1 2 ij i j X C− 组间变异 k-1 2 ( )ij j i i X C n − SS v 组间 组间 MS MS 组间 组内 组内变异 N k − 2 ( ) ij i i j X X − SS v 组内 组内
方差分析方法及理论由英国著名的统计学家R.A.Fisher创立。后人为了尊重他,以其名字的首字母来命名该方法所用的分布,称为F分布,故方差分析又称F检验(Ftest)。三、完全随机设计资料方差分析的基本步骤以例8-1介绍完全随机设计资料方差分析的基本步骤。1.建立假设检验和确定检验水准无效假设H。:μ=μ=μ,即3个试验组的总体均数相等备择假设H:川H2、,不全相等,即3个实验组的总体均数不全相等α=0.052.计算检验统计量F应用SPSS软件得到计算结果如表8一3所示:表8-3例8一1的方差分析结果MSSSF变异来源自由度P16总变异82.5349.662<0. 01组间变异24.8310.9114组内变异31.882. 283.确定P值,作出统计推断结论(1)查表确定P值:按α=0.05,组间=2、组内=14查F界值表,得Fo.05(2.14)=3.84,F=10. 91>Fo00(214),P<0. 05。(2)应用SPSS软件直接获得P-0.01,即P<0.05。结论:按α=0.05,拒绝H。,接受H,认为3个处理组的总体均数不全相等,即不同的指导措施对记忆有影响。要深入了解哪两个处理组之间有无差别,需进一步作均数差异的多重比较,具体见本章第三节。四、方差分析相关知识1.方差分析的几个术语(1)因素(Factor):指影响因变量变化的自变量,如在例8-1有关记忆研究中,不同指导措施对记忆产生影响作用,指导措施就是一个因素。在进行方差分析时,因素通常作为分类变量出现。只有一个自变量的实验为单因素实验,对实验结果采用单因方差分析。有两个或两个以上自变量的实验为多因素实验,对实验结果采用多单因方差分析。4
4 方差分析方法及理论由英国著名的统计学家 R. A. Fisher 创立。后人为了尊重他,以其名字的 首字母来命名该方法所用的分布,称为 F 分布,故方差分析又称 F 检验(F test)。 三、完全随机设计资料方差分析的基本步骤 以例 8-1 介绍完全随机设计资料方差分析的基本步骤。 1. 建立假设检验和确定检验水准 无效假设 H0: 1 = 2 = 3 ,即 3 个试验组的总体均数相等 备择假设 H1: 1 、 2 、 3 不全相等,即 3 个实验组的总体均数不全相等 =0.05 2. 计算检验统计量 F 应用 SPSS 软件得到计算结果如表 8-3 所示: 表 8-3 例 8-1 的方差分析结果 变异来源 SS 自由度 MS F P 总变异 82.53 16 组间变异 49.66 2 24.83 10.91 <0.01 组内变异 31.88 14 2.28 3. 确定 P 值,作出统计推断结论 (1)查表确定 P 值:按 =0.05,v组间 =2、v组内 =14 查 F 界值表,得 F0.05(2,14) =3.84, F =10.91> F0.05(2,14) , P <0.05。 (2)应用 SPSS 软件直接获得 P=0.01,即 P <0.05。 结论:按 =0.05,拒绝 H0 ,接受 H1 ,认为 3 个处理组的总体均数不全相等,即不同的指导 措施对记忆有影响。 要深入了解哪两个处理组之间有无差别,需进一步作均数差异的多重比较,具体见本章第三节。 四、方差分析相关知识 1. 方差分析的几个术语 (1)因素( Factor ):指影响因变量变化的自变量,如在例 8-1 有关记忆研究中,不同指导措 施对记忆产生影响作用,指导措施就是一个因素。在进行方差分析时,因素通常作为分类变量出 现。只有一个自变量的实验为单因素实验,对实验结果采用单因方差分析。有两个或两个以上 自变量的实验为多因素实验,对实验结果采用多单因方差分析
(2)水平(Level):因素的不同情况或不同等级称为水平。例如,性别因素在一般情况下包括男、女两个水平,教学方法通常有传统讲授法、自学辅导法、启发探究法等三个水平。在例8-1指导措施因素有朗诵法、理解记忆、联系记忆三个水平。(3)实验处理(Treatment):指多个因素各个水平之间的组合。例如某研究中的因素有性别,取值为1(男)、2(女):还有年级grade,分三个水平:1(初一)、2(初二)、3(初三)。两个变量的组合共可组成6个处理:[1,1]、[1,2]、[1,3]、[2,1]、[2,2]、[2,3],分别代表两种性别与3个年级的6种组合。对于单因素实验数据来说,一个水平就是一种处理。2.方差分析的应用条件与t检验一样,方差分析作为一种参数检验方法,对数据也有要求:(1)样本必须来自正态分布的总体,即每一组内的观察值应该服从正态分布。当样本例数较多的情况下,数据可以近似看作服从正态分布。如果数据有明显的偏离,可通过变量变换的方法加以改善。(2)各组资料总体方差相等,即各总体具有方差齐性(homogeneityofvariance),样本所在总体的方差关系为:0,=2=の3O。(3)各次观察独立,即任何两个观察值之间没有系统相关性。3.方差分析与t检验的区别(1)t检验是用来检验两样本均数差异是否有统计学意义的一种检验方法。当面对两组以上的样本均数比较时,如果继续采用t检验分别对其进行两两比较,则不仅会大幅度增加比较的次数,更严重的是会增加犯I型错误的概率。如例8-1以上资料我们能否用前面所学的两样本t检验进行两两比较(即分别用第一组与第二组、第二组与第三组,第一组与第三组作3次两两比较的t检验)而得出正确的结论呢?答案是不能。因为对数据做的t检验越多,我们更容易犯I型错误。在一次检验中,α=0.05意味着最大容许犯I型错误的可能性是0.05,不犯I型错误的概率则是1一0.05=0.95。但是如上述过程进行3次t检验的比较,每次都有α=0.05的显著性水平的话,此时不犯I型错误的可能性就变为0.95×0.95=0.90,那犯I型错误的概率则增加为1一0.90=0.1。这个过程实际上扩大犯I型错误的概率。如果采用上述思路进行两样本比较的t检验,即10个样本每两个进行比较,其比较次数为k!_ k(k-1) _ 10(101) = 45m=222(k-2)!2当α=0.05时,在45次的比较中,有5次有统计学意义,那么其实际犯I型错误的概率为5/45~0.11,远远大于最大容许概率0.05。由此可见,在运用t检验时,随着其组合次数的增多,犯I型错误的概率就增加,统计推论可靠性的概率就较低。根据方差分析基本原理,方差分析不仅可以对两组及两组以上的样本均数同时进行比较,同时也可以始终在设定的检验水准下进行统计推论。这也是方差分析的优点。(2)当进行两组样本均数的比较时,我们不仅可以用方差分析的方法,还可以用t检验。统计学家已经证明当K=2时,对同一个资料,F=t。但是两者又有不同:t分布是对称分布,n越大,越接近于正态分布。因此,t检验是有方向性的双侧检验。而F分布属于偏态分布,方差分析是无方向性的单侧检验。例如,当K=2时,自由度为20的t分布和自由度为1和20的F分布。设定αa=0.05,此时t值分布在曲线的两侧,分别为一2.086和2.086。而F值只分布在曲线上的一侧,为4.35。这是为什么呢?因为,分布是根据均数的差值建立的曲线,而F分布是根据均数的方差建立的。均数之间的差值可以正数,也可以是负数,所以分布是对称分布。而均数的方差只有正数,n
5 (2)水平(Level):因素的不同情况或不同等级称为水平。例如,性别因素在一般情况下 包括男、女两个水平,教学方法通常有传统讲授法、自学辅导法、启发探究法等三个水平。在 例 8-1 指导措施因素有朗诵法、理解记忆、联系记忆三个水平。 (3)实验处理(Treatment):指多个因素各个水平之间的组合。例如某研究中的因素有性别, 取值为 1(男)、2(女);还有年级 grade,分三个水平:1(初一)、2(初二)、3(初三)。两个变量的组 合共可组成 6 个处理:[1,1]、[1,2]、[1,3]、[2,1]、[2,2]、[2,3],分别代表两种性别与 3 个年 级的 6 种组合。对于单因素实验数据来说,一个水平就是一种处理。 2. 方差分析的应用条件 与 t 检验一样,方差分析作为一种参数检验方法,对数据也有要求: (1)样本必须来自正态分布的总体,即每一组内的观察值应该服从正态分布。当样本例数较多 的情况下,数据可以近似看作服从正态分布。如果数据有明显的偏离,可通过变量变换的方法加以 改善。 (2)各组资料总体方差相等,即各总体具有方差齐性(homogeneity of variance),样本所在 总体的方差关系为: 1 2 3 = = . k 。 (3)各次观察独立,即任何两个观察值之间没有系统相关性。 3. 方差分析与 t 检验的区别 (1)t 检验是用来检验两样本均数差异是否有统计学意义的一种检验方法。当面对两组以上的 样本均数比较时,如果继续采用 t 检验分别对其进行两两比较,则不仅会大幅度增加比较的次数, 更严重的是会增加犯 I 型错误的概率。如例 8-1。 以上资料我们能否用前面所学的两样本 t 检验进行两两比较(即分别用第一组与第二组、第二 组与第三组,第一组与第三组作 3 次两两比较的 t 检验)而得出正确的结论呢?答案是不能。因为 对数据做的 t 检验越多,我们更容易犯 I 型错误。在一次检验中,α=0.05 意味着最大容许犯 I 型 错误的可能性是 0.05,不犯 I 型错误的概率则是 1-0.05 = 0.95。但是如上述过程进行 3 次 t 检验 的比较,每次都有α=0.05的显著性水平的话,此时不犯I型错误的可能性就变为0.95×0.95=0.90, 那犯 I 型错误的概率则增加为 1-0.90 = 0.1。这个过程实际上扩大犯 I 型错误的概率。如果采用 上述思路进行两样本比较的 t 检验,即 10 个样本每两个进行比较,其比较次数为: ! ( 1) 10(10 1) 45 2( 2)! 2 2 k k k m k − − = = = = − 当 α=0.05 时,在 45 次的比较中,有 5 次有统计学意义,那么其实际犯 I 型错误的概率为 5/45 ≈0.11,远远大于最大容许概率 0.05。由此可见,在运用 t 检验时,随着其组合次数的增多,犯 I 型错误的概率就增加,统计推论可靠性的概率就较低。根据方差分析基本原理,方差分析不仅可以 对两组及两组以上的样本均数同时进行比较,同时也可以始终在设定的检验水准下进行统计推论。 这也是方差分析的优点。 (2)当进行两组样本均数的比较时,我们不仅可以用方差分析的方法,还可以用 t 检验。统计 学家已经证明当 K=2 时,对同一个资料,F=t 2。但是两者又有不同:t 分布是对称分布,n 越大, 越接近于正态分布。因此,t 检验是有方向性的双侧检验。而 F 分布属于偏态分布,方差分析是无 方向性的单侧检验。例如,当 K=2 时,自由度为 20 的 t 分布和自由度为 1 和 20 的 F 分布。设定 α =0.05,此时 t 值分布在曲线的两侧,分别为-2.086 和 2.086。而 F 值只分布在曲线上的一侧, 为 4.35。这是为什么呢?因为, t 分布是根据均数的差值建立的曲线,而 F 分布是根据均数的方差 建立的。均数之间的差值可以正数,也可以是负数,所以 t 分布是对称分布。而均数的方差只有正数