第七章两组均数差别比较的t检验问题在心理学研究中,经常会遇到需要比较两组均数差异的问题。例如,对抑郁症患者进行心理治疗前后抑郁评分差异比较的问题,比较心理治疗组与对照组抑郁评分差异的问题,比较男女人格得分差异问题等。由于抽样误差的存在,即使两总体均数相同,从该总体中随机抽得的样本均数往往也不相同。因此当研究得到两样本均数不同时,不能断然作出两总体均数不同的结论,而应通过差别假设检验和相应的统计学分析。此时,如果资料来源总体为正态分布总体,可以选择t检验。本章学习目标1.了解样本均数和总体均数差别比较t检验的概念和方法2.了解配对设计资料t检验的概念和方法3.了解两组样本均数差别比较t检验的概念和方法4.应用SPSS软件进行t检验第一节t检验概述一、t分布的概念从正态分布总体N(μ,α2)中抽得样本的均数X也服从正态分布,记为N(U,=)由第二章可知,对正态变量X作标准化变换,则有:X-μZ = 0xZ服从标准正态分布N(0,1)。当未知的时候,常用S_来代替,则有:X-μ1Sx此时所进行的变换为t变换服从自由度为n一1的t分布。t分布是总体均数和假设检验的理论基础,具有如下特征:单峰分布,以0为中心,左右对称,类似于标准正态分布;自由度V越小,则S-越大,t值越分散,曲线的峰部越矮,尾部越粗;随着自由度v的逐渐增大,t分布逐渐逼近标准正态分布;当v趋于时,t分布就成为标准正态分布,故标准正态分布是t分布的特例。1
1 第七章 两组均数差别比较的 t 检验 问题 在心理学研究中,经常会遇到需要比较两组均数差异的问题。例如,对抑郁症患者进行 心理治疗前后抑郁评分差异比较的问题,比较心理治疗组与对照组抑郁评分差异的问题,比 较男女人格得分差异问题等。 由于抽样误差的存在,即使两总体均数相同,从该总体中随机抽得的样本均数往往也不 相同。因此当研究得到两样本均数不同时,不能断然作出两总体均数不同的结论,而应通过 差别假设检验和相应的统计学分析。此时,如果资料来源总体为正态分布总体,可以选择 t 检验。 本章学习目标 1. 了解样本均数和总体均数差别比较 t 检验的概念和方法 2. 了解配对设计资料 t 检验的概念和方法 3. 了解两组样本均数差别比较 t 检验的概念和方法 4. 应用 SPSS 软件进行 t 检验 第一节 t 检验概述 一、t 分布的概念 从正态分布总体 N(μ,σ2)中抽得样本的均数 X 也服从正态分布,记为 N(μ, 2 X )。 由第二章可知,对正态变量 X 作标准化变换,则有: X X Z − = Z 服从标准正态分布 N(0,1)。当 2 X 未知的时候,常用 X S 来代替 2 X ,则有: X S X t − = 此时所进行的变换为 t 变换服从自由度为 n-1 的 t 分布。t 分布是总体均数和假设检 验的理论基础,具有如下特征: 单峰分布,以 0 为中心,左右对称,类似于标准正态分布; 自由度 越小,则 X S 越大,t 值越分散,曲线的峰部越矮,尾部越粗; 随着自由度 的逐渐增大,t 分布逐渐逼近标准正态分布;当 趋于∞时,t 分布就成 为标准正态分布,故标准正态分布是 t 分布的特例
图7-1t分布示意图二、t检验的适用条件t分布的发现使得小样本统计推断成为可能,以它为基础的假设检验称为t检验。实际工作中t分布的当满足以下条件时,可以进行t检验:1.未知且n较小;2.样本来自正态分布总体:3.两样本均数比较时,要求所对应的两总体方差相等(α=02),即方差齐性。如果方差不齐,必须要进行校正。三、常用的t检验方法1.单组完全随机化设计资料的t检验,即样本均数和总体均数差别比较的t检验。2.随机化配对设计资料的t检验。3.两组完全随机化设计资料的t检验,即两组样本均数差别比较的t检验。第二节样本均数和总体均数差别的t检验一、基本概念从总体中完全随机的抽取一部分个体进行研究,这样的设计成为完全随机化设计2
2 ν=9 4 ν=5 ν=1 -4 -3 -2 -1 0 1 2 3 -4 图 7-1 t 分布示意图 二、t 检验的适用条件 t 分布的发现使得小样本统计推断成为可能,以它为基础的假设检验称为 t 检验。实际 工作中 t 分布的当满足以下条件时,可以进行 t 检验: 1. σ未知且 n 较小; 2. 样本来自正态分布总体; 3. 两样本均数比较时,要求所对应的两总体方差相等(σ1 2=σ2 2),即方差齐性。如果 方差不齐,必须要进行校正。 三、常用的 t 检验方法 1. 单组完全随机化设计资料的 t 检验,即样本均数和总体均数差别比较的 t 检验。 2. 随机化配对设计资料的 t 检验。 3. 两组完全随机化设计资料的 t 检验,即两组样本均数差别比较的 t 检验。 第二节 样本均数和总体均数差别的 t 检验 一、基本概念 从总体中完全随机的抽取一部分个体进行研究,这样的设计成为完全随机化设计
(completelyrandomizeddesign)。从正态总体中N(u,o,)中获得一份含量为n的样本,算得其均数和标准差,如欲判断其总体均数μ是否等于某个已知数Ⅱo,可作此单组完全随机化设计资料的t检验。二、分析思路与步骤以双侧检验为例,t检验的分析思路及步骤如下:1.建立检验假设HO:μ=μ。(无效假设):Hl:。(单侧检验为<或者>。检验水准α,一般情况取0.05,可根据要求确定。2.计算统计量基于已有知识,H.成立时检验统计量X-Hoα~ (v),v=n-1t=S/nX为样本均数,μ。为已知总体均数,S为样本标准差,n为样本含量,v为自由度。在讨论均数差异时常常采用这种类型的检验统计量,实际上是以样本标准误为单位来度量样本均数与总体均数的距离(标准t离差)。3.确定P值以x,S,n和μ。的数值代入上式,得到检验统计量t的值。查阅t分布表,得到自由度为n-1时t分布曲线下当前值及其相反数以外的双侧尾部面积P。4.决策与结论将P值与事前规定的小概率a比较。若P值≤a,则拒绝H:否则,不拒绝Ho。然后结合实际问题与专业知识作出结论。例7-1:为了解大学生的心理健康状况,随机抽取某大学在校大学生25名,用SCL-90症状自评量表进行测定,得出因子总分的均数为144.3,标准差为28.25。已知全国SCL-90因子总分的均数(常模)为130。问该大学在校学生的SCL-90因子总分是否与全国水平相同?解:本例为从总体中抽取一定样本进行调查,且已知全国常模(μ。),宜采用样本均数同总体均数差别比较的双侧t检验。已知X=144.3,μo=130,S=28.25,n=25。1.建立检验假设,确定检验水准Ho:μ=μo,该大学在校学生的SCL-90因子总分与全国水平相同:H:μ≠μo,该大学在校学生的SCL-90因子总分与全国水平不同。d=0. 052.计算检验统计量X-4%0, v=n-11=S/n本例已知X=144.3,μ。=130,S=28.25,n=25,则144.3-1301=.=3.579,V=25-1=2428.25/V253.确定P值以自由度V=24查阅t分布表,ta05/2.24=2.074,t>t0.05/2,24得P<0.05。4.决策与结论P<a,拒绝H,接受H,具有统计学意义,可认为该大学在校学生的SCL-90因子总分与全国水平不同。3
3 (completely randomized design)。从正态总体中 N(μ,σ2)中获得一份含量为 n 的样 本,算得其均数和标准差,如欲判断其总体均数μ是否等于某个已知数μ0,可作此单组完 全随机化设计资料的 t 检验。 二、分析思路与步骤 以双侧检验为例,t 检验的分析思路及步骤如下: 1. 建立检验假设 H0:μ=μ0(无效假设); H1:μ μ0(单侧检验为μ<μ0 或者μ>μ0)。 检验水准α,一般情况取 0.05,可根据要求确定。 2. 计算统计量 基于已有知识,H0 成立时检验统计量 0 ( ), 1 / X t t n S n − = = − X 为样本均数,μ0 为已知总体均数,S 为样本标准差,n 为样本含量, 为自由度。在 讨论均数差异时常常采用这种类型的检验统计量,实际上是以样本标准误为单位来度量样本 均数与总体均数的距离(标准 t 离差)。 3. 确定 P 值 以 X ,S,n 和μ0 的数值代入上式,得到检验统计量 t 的值。查阅 t 分布表,得到自由度为 n-1 时 t 分布曲线下当前值及其相反数以外的双侧尾部面积 P。 4. 决策与结论 将 P 值与事前规定的小概率α比较。若 P 值≤α,则拒绝 H0;否则, 不拒绝 H0。然后结合实际问题与专业知识作出结论。 例 7-1: 为了解大学生的心理健康状况,随机抽取某大学在校大学生 25 名,用 SCL-90 症状自评量表进行测定,得出因子总分的均数为 144.3,标准差为 28.25。已知全国 SCL-90 因子总分的均数(常模)为 130。问该大学在校学生的 SCL-90 因子总分是否与全国水平相 同? 解:本例为从总体中抽取一定样本进行调查,且已知全国常模(μ0),宜采用样本均数 同总体均数差别比较的双侧 t 检验。已知 X =144.3,μ0=130,S=28.25,n=25。 1. 建立检验假设,确定检验水准 H0:μ=μ0,该大学在校学生的 SCL-90 因子总分与全国水平相同; H1:μ≠μ0,该大学在校学生的 SCL-90 因子总分与全国水平不同。 α=0.05 2. 计算检验统计量 0 n 1 / X t S n − = , = - 本例已知 X =144.3,μ0=130,S=28.25,n=25,则 144.3 130 =3.579 28.25/ 25 t − = , =25-1=24 3. 确定 P 值 以自由度 =24 查阅 t 分布表,t0.05/2,24=2.074,t>t0.05/2,24 得 P< 0.05。 4. 决策与结论 P<α,拒绝 H0,接受 H1,具有统计学意义,可认为该大学在校学生的 SCL-90 因子总分与全国水平不同
第三节配对设计资料的t检验一、基本概念将受试者按照某些重要特征相近的原则配成对子,每对中的两个个体随机接受不同的处理,这样的设计称为随机化配对设计(randomizedpaireddesign)。配对设计是研究者为了控制可能存在的主要非处理因素而采用的一种试验设计方法,在心理学研究中,配对设计主要有以下三种情况:将受试对象配成特征(非处理因素)相近的对子,同对的两个受试对象随机接受不同的处理;1.同一受试对象接受两种不同的处理2.同一受试对象接受处理因素前后3.前两种形式比较常用。配对设计下的数据具有一一对应的特征,人们关心的变量是对子的效应差值而不是各自的效应值。相比于完全随机设计,其优点是排除更多个体变异性带来的干扰,在比较两种处理的效应时,可比性更好,常于个体变异性较大时使用。二、分析思路与步骤配对t检验的基本思路是:从理论上说,如果不同的处理的效应之间没有实质差别,将每对数据求差值,差值d的总体均数。应该是0,所以配对资料的t检验可以看成是样本均数d与总体均数μ。一0的比较。因配对设计多为小样本,故常用t检验。此时,假设检验为:Ho:μ=0;H:μa±当HO成立时,检验统计量d-ot~t(v),v= n-1Sa/Vn其中d为差值的均数,Sa为差值的标准差,n为对子数。d-Ed/nEd?-(Ed)? / nSan-1例7-2:为研究某项心理干预措施对抑郁症的作用,对12名抑郁患者于干预前后分别进行生活满意度指数B(LSIB)的心理测试,结果如表7-1。问该项干预措施是否有效?表 7-1抑郁患者干预前后LSIB的测试结果编号d2干预前干预后差值(d)1310132111753213154
4 第三节 配对设计资料的 t 检验 一、基本概念 将受试者按照某些重要特征相近的原则配成对子,每对中的两个个体随机接受不同的处 理,这样的设计称为随机化配对设计(randomized paired design)。配对设计是研究者为 了控制可能存在的主要非处理因素而采用的一种试验设计方法,在心理学研究中,配对设计 主要有以下三种情况: 将受试对象配成特征(非处理因素)相近的对子,同对的两个受试对象随机接受不同的 处理; 1. 同一受试对象接受两种不同的处理 2. 同一受试对象接受处理因素前后 3. 前两种形式比较常用。配对设计下的数据具有一一对应的特征,人们关心的变量是 对子的效应差值而不是各自的效应值。相比于完全随机设计,其优点是排除更多个体变异性 带来的干扰,在比较两种处理的效应时,可比性更好,常于个体变异性较大时使用。 二、分析思路与步骤 配对 t 检验的基本思路是:从理论上说,如果不同的处理的效应之间没有实质差别,将 每对数据求差值,差值 d 的总体均数μd 应该是 0,所以配对资料的 t 检验可以看成是样本 均数 d 与总体均数μd=0 的比较。因配对设计多为小样本,故常用 t 检验。此时,假设检验 为: H0:μ0=0;H1:μd 0。 当 H0 成立时,检验统计量 0 ( ), 1 / d d t t n S n − = = − 其中 d 为差值的均数,Sd 为差值的标准差,n 为对子数。 d = d / n 1 ( ) / 2 2 − − = n d d n Sd 例 7-2:为研究某项心理干预措施对抑郁症的作用,对 12 名抑郁患者于干预前后分别 进行生活满意度指数 B(LSIB)的心理测试,结果如表 7-1。问该项干预措施是否有效? 表 7-1 抑郁患者干预前后 LSIB 的测试结果 编号 干预前 干预后 差值(d) d2 1 10 13 3 2 11 17 5 3 13 15 2
89147751277114757129881790111110914511121741112112合计Zd=47Zd=2471.建立检验假设,确定检验水准Ho:H。=0,千预实施前后无差别:H:U。≠0,干预实施前后有差别。a=0.052.计算检验统计量d-oSa/n其中d=Zd /n=47/12=3.83,d?-(Ed) /n=2.517,n=12Sn-13.83=5.277t:2.517//123.确定P值查阅t界值表,to.05/2,1=2.201,t>to.05/2,则P<0.05。4.决策与结论P<α,拒绝H,接受H,具有统计学意义,可以认为干预实施前后有差别。需要提醒的是,我们假定差值的总体分布为正态分布,并不是假定处理前后的资料为正态分布。第四节两独立样本均数差别的t检验、基本概念将受试对象或实验对象完全随机的分配到两组中,分别接受不同的处理,或分别从两个总体中完全随机的抽取一部分个体进行研究,如此得到的样本为独立样本。这种设计也叫完全随机区组设计,相应的t检验成为独立样本t检验(independentsamplettest)。二、分析思路与步骤假定两独立样本所代表的总体服从正态分布N(μ)(μ1,0.)和N(μ2,2),由于5
5 4 8 9 1 5 7 12 7 7 7 11 4 7 5 12 7 8 9 17 8 9 11 11 0 10 9 14 5 11 12 17 4 12 11 12 1 合计 ∑d=47 ∑d=247 1. 建立检验假设,确定检验水准 H0 :μ0=0,干预实施前后无差别; H1 :μd 0,干预实施前后有差别。 α=0.05 2. 计算检验统计量 其中 d =∑d /n=47/12=3.83, 2 2 ( ) / 2.517 n=12 1 d d d n S n − = = − , 3.83 5.277 2.517 / 12 t = = 3. 确定 P 值 查阅 t 界值表,t0.05/2,11=2.201,t>t0.05/2,则 P<0.05。 4. 决策与结论 P<α,拒绝 H0,接受 H1,具有统计学意义,可以认为干预实施前后有 差别。 需要提醒的是,我们假定差值的总体分布为正态分布,并不是假定处理前后的资料为正 态分布。 第四节 两独立样本均数差别的 t 检验 一、基本概念 将受试对象或实验对象完全随机的分配到两组中,分别接受不同的处理,或分别从两个 总体中完全随机的抽取一部分个体进行研究,如此得到的样本为独立样本。这种设计也叫完 全随机区组设计,相应的 t 检验成为独立样本 t 检验(independent sample t test)。 二、分析思路与步骤 假定两独立样本所代表的总体服从正态分布 N(μ1)(μ1,σ1)和 N(μ2,σ2),由于 S n d t d / − 0 =