第十章协方差分析 第一节协方差分析的意义 协方差分析有二个意义,一是对试验进行统计控制,二是对协方差组分进行估计,现分 述如下。 、对试验进行统计控制 为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控 制,使它们在各处理间尽量一致,这叫试验控制。但在有些情况下,即使作出很大努力也难 以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初 始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研究发现:增重与初始重之间存 在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求。这时可利用 仔猪的初始重(记为x)与其增重(记为y)的回归关系,将仔猪增重都矫正为初始重相同时的增 重,于是初始重不同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始 重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正, 试验误差将减小,对试验处理效应估计更为准确。若y的变异主要由x的不同造成(处理没有 显著效应),则各矫正后的y’间将没有显著差异(但原y的差异可能是显著的)。若y的变异 除掉x不同的影响外,尚存在不同处理的显著效应,则可期望各y’间将有显著差异(但原y间 差异可能是不显著的)。此外,矫正后的y’和原y的大小次序也常不一致。所以,处理平均 数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地 反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做 协方差分析( analysis of covariance) 、估计协方差组分 在第八章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式 若将公式右端的分子分母同除以自由度(m-1),得 ∑(x-x)y-y)(n-1) (10-1) ∑(x-x) (n-1) 其中 ∑ 是x的均方MS,它是x方差G2的无偏估计量:
197 第十章 协方差分析 第一节 协方差分析的意义 协方差分析有二个意义,一是对试验进行统计控制,二是对协方差组分进行估计,现分 述如下。 一、对试验进行统计控制 为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控 制,使它们在各处理间尽量一致,这叫试验控制。但在有些情况下,即使作出很大努力也难 以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初 始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研究发现:增重与初始重之间存 在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求。这时可利用 仔猪的初始重(记为x)与其增重(记为y)的回归关系,将仔猪增重都矫正为初始重相同时的增 重,于是初始重不同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始 重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正, 试验误差将减小,对试验处理效应估计更为准确。若y的变异主要由x的不同造成(处理没有 显著效应),则各矫正后的 y 间将没有显著差异(但原y间的差异可能是显著的)。若y的变异 除掉x不同的影响外,尚存在不同处理的显著效应,则可期望各 y 间将有显著差异(但原y间 差异可能是不显著的)。此外,矫正后的 y 和原y的大小次序也常不一致。所以,处理平均 数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地 反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做 协方差分析(analysis of covariance)。 二、估计协方差组分 在第八章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式: − − − − = 2 2 ( ) ( ) ( )( ) x x y y x x y y r 若将公式右端的分子分母同除以自由度(n-1),得 − − − − − − − = ( 1) ( ) ( 1) ( ) ( )( ) /( 1) 2 2 n y y n x x x x y y n r (10-1) 其中 1 ( ) 2 − − n x x 是x的均方MSx,它是x的方差 2 x 的无偏估计量;
是y的均方MSs,它是y方差σ2的无偏估计量 (x-Xy-y称为x与y的平均的离均差的乘积和,简称均积,记为MPy,即 ∑x∑y ∑(x-xXy-j) (10-2) 与均积相应的总体参数叫协方差( covariance),记为CO(xy)或σx。统计学证明了, 均积MPy是总体协方差COⅣ(xy)的无偏估计量,即EMPx=COH(xy) 于是,样本相关系数r可用均方MSx、MSy,均积MP表示为 MP (10-3) MS MS 相应的总体相关系数p可用x与y的总体标准差Gx、y,总体协方差COxy)或x表 示如下 COv(x, y) (10-4) 均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和 与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积 和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由 度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析 在随机模型的方差分析中,根据均方MS和期望均方EMS的关系,可以得到不同变异来源 的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积Ⅷ和期望均积EM的关 系,可得到不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相 关分析。这些分析在遗传、育种和生态、环保的研究上是很有用处的 由于篇幅限制,本章只介绍对试验进行统控制的协方差分析。 第二节单因素试验资料的协方差分析 设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料 为具对x、y观测值的单向分组资料,其数据一般模式如表10-1所示。 表10-1km对观测值x、y的单向分组资料的一般形式 小理k 观测指标 x11 Xi 观测值 12 (=1,2,xyx;y xkj Vkj 平均数
198 1 ( ) 2 − − n y y 是y的均方MSy,它是y的方差 2 y 的无偏估计量; 1 ( )( ) − − − n x x y y 称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即 MPxy= 1 ( )( ) − − − n x x y y = 1 ( )( ) − − n n x y xy (10-2) 与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或 xy 。统计学证明了, 均积MPxy是总体协方差COV(x,y)的无偏估计量,即 EMPxy= COV(x,y)。 于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为: x y xy MS MS MP r = (10-3) 相应的总体相关系数 可用x与y的总体标准差 x 、 y ,总体协方差COV(x,y)或 xy 表 示如下: x y xy x y COV x y = = ( , ) (10-4) 均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和 与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积 和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由 度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。 在随机模型的方差分析中,根据均方MS和期望均方EMS的关系,可以得到不同变异来源 的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积MP和期望均积EMP的关 系,可得到不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相 关分析。这些分析在遗传、育种和生态、环保的研究上是很有用处的。 由于篇幅限制,本章只介绍对试验进行统控制的协方差分析。 第二节 单因素试验资料的协方差分析 设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料 为具kn对x、y观测值的单向分组资料,其数据一般模式如表10—1所示。 表10—1 kn对观测值x、y的单向分组资料的一般形式 处 理 处理1 处理2 … 处理i … 处理k 观测指标 x y x y … x y … x y 观测值 xij、yij (i=1,2,…k j=1,2,…n) x11 x12 … x1j … x1n y11 y12 … y1j … y1n x21 x22 … x2j … x2n y21 y22 … y2j … y2n … … … … … … xi1 xi2 … xij … xin yi1 yi2 … yij … yin … … … … … xk1 xk2 … xkj … xkn yk1 yk2 … ykj … ykn 总 和 x1. y1. x2. y2. … xi. yi. … xk. yk. 平均数 . 1 x . 1 y . 2 x . 2 y … . i x . i y … . k x . k y
表10-1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法 节。其乘积和的剖分则为 总变异的乘积和SP是x1与x和y与p的离均差乘积之和,即 (xi-x. X(y -y) ∑ Xij yij 其中,x.=∑x2y 中∑ 处理间的乘积和SP是x,与x.和,与j的离均差乘积之和乘以n,即 SP=n∑(x-.),一j.) xi-yi (10 d,=k 处理内的乘积和SP是x与x,和y与,的离均差乘积之和,即 ∑∑(x-x,Xyn-元)=∑∑ ∑xy1=SP-SP(0-7) j=1 dJ。=k(n-1 以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n、n、…、 其和为∑n,则各项乘积和与自由度的计算公式为 SPT= y dr=∑n-1 df, =k-1 n1 d.=∑nk=-d (10-9) 有了上述SP和d,再加上x和y的相应S,就可进行协方差分析 【例10.1】为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对 哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择 初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表 102,试作分析 此例,x.=x1+x2+x3,+x4,=18.25+15.40+1565+13.85=63.15 y.=y1+y2.+y3.+y4=141.80+130.10+144.80+13380=550.50
199 表10—1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一 节。其乘积和的剖分则为: 总变异的乘积和 SPT 是 ij x 与 x.. 和 ij y 与 y.. 的离均差乘积之和,即: k n x y SP x x y y x y k i n j i j i j k i n j T i j i j .. .. ( ..)( ..) 1 1 1 1 = − − = − = = = = (10-5) T df =kn-1 其中, k n y y k n x x x y y x k i i k i i .. , .. .. .. ., .. ., .. 1 1 = = = = = = 。 处理间的乘积和 SPt 是 . i x 与 x.. 和 . i y 与 y.. 的离均差乘积之和乘以n,即: = = = − − = − k i i i k i t i i i i k n x y x y n SP n x x y y 1 1 . . . . 1 ( . ..)( . ..) (10-6) dft = k −1 处理内的乘积和 SPe 是 ij x 与 . i x 和 ij y 与 . i y 的离均差乘积之和,即: = = = = = = − − = − = − k i n j k i T t k i i i n j e i j i i j i i j i j x y SP SP n SP x x y y x y 1 1 1 1 1 . . 1 ( .)( .) (10-7) e df =k(n-1) 以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、…、 nk,其和为 = k i i n 1 ,则各项乘积和与自由度的计算公式为: = = = = − k i n j k i i i i T ij ij i n x y SP x y 1 1 1 . . T df == k i i n 1 -1 (10-8) = = + + + − k i i k k k t n x y n x y n x y n x y SP 1 2 2 2 1 1 1 . . .. .. ... . . . . dft = k −1 = = = k i n j e ij ij i SP x y 1 1 - + + + k k k n x y n x y n x y . . ... . . . . 2 2 2 1 1 1 =SPT-SPt e df == k i i n 1 -k =dfT-dft (10-9) 有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。 【例10.1】 为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对 哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择 初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表 10—2,试作分析。 此例, .. . . . . 1 2 3 4 x = x + x + x + x =18.25+15.40+15.65+13.85=63.15 .. . . . . 1 2 3 4 y = y + y + y + y =141.80+130.10+144.80+133.80=550.50
k=4,n=12,k=4×12=48 表10-2不同食欲增进剂仔猪生长情况表单位:kg) 初生重50日初生重50日初生重 龄重y 重x龄 1.2012.4 1.8512.00 9.40 10.60 9.80 1.3510.80 1.4512.20 1.1010.40 1.1511.60 1.4510.00 1.20 10.30 1.1010.60 1.4011.00 1.40 1.4013.00 观察值 1.4511.80 1.4513.90 1.3512.80 1.5513.40 1.7014.80 1.35 1.4012.30 1.109.60 1.5011.60 l.15 8.50 1.4513.20 1.2012.40 1.6012.60 1.35 12.20 1.2512.00 1.0511.20 1.7012.50 9,30 1.3012.80 1.1011.00 18.2514.8015.40130801565144.8013.851380 平均x,y 1.5211.82 10.84 1.3012.07 1.151.15 协方差分析的计算步骤如下: )求x变量的各项平方和与自由度 1、总平方和及自由度 ∑x (1 1.10 63.15 1.75 dfrx=r1=4×12-1=47 2、处理间平方和与自由度 而不分”如A(8252+15402+15652+1383)-2。=083 48 3、处理内平方和与自由度 SSax)=SSx-SSx)=175-0.83=0.9 dfen=drir-dfrr=47-3=44 (二)求y变量各项平方和与自由度 1、总平方和与自由度 ∑∑- 6=(12.402+12002+-+1100人59053 48=610.35052 2、处理间平方和与自由度 ∑y2 (14 133.80 l168 df
200 k=4,n=12,kn=4×12=48 表10—2 不同食欲增进剂仔猪生长情况表 (单位:kg) 处 理 对照 配方1 配方2 配方3 观 测 指 标 初生重 x 50日 龄重y 初生重 x 50日 龄重y 初生重 x 50日 龄重y 初生 重x 50日 龄重y 观 察 值 xij,yij 1.50 12.40 1.35 10.20 1.15 10.00 1.20 12.40 1.85 12.00 1.20 9.40 1.10 10.60 1.00 9.80 1.35 10.80 1.45 12.20 1.10 10.40 1.15 11.60 1.45 10.00 1.20 10.30 1.05 9.20 1.10 10.60 1.40 11.00 1.40 11.30 1.40 13.00 1.00 9.20 1.45 11.80 1.30 11.40 1.45 13.50 1.45 13.90 1.50 12.50 1.15 12.80 1.30 13.00 1.35 12.80 1.55 13.40 1.30 10.90 1.70 14.80 1.15 9.30 1.40 11.20 1.35 11.60 1.40 12.30 1.10 9.60 1.50 11.60 1.15 8.50 1.45 13.20 1.20 12.40 1.60 12.60 1.35 12.20 1.25 12.00 1.05 11.20 1.70 12.50 1.20 9.30 1.30 12.80 1.10 11.00 总 和 xi.,yi. 18.25 141.80 15.40 130.80 15.65 144.80 13.85 133.80 平 均 ., . i i x y 1.52 11.82 1.28 10.84 1.30 12.07 1.15 1.15 协方差分析的计算步骤如下: (一)求x变量的各项平方和与自由度 1、总平方和及自由度 = − = + + + − = − =1.75 48 63.15 84.8325 48 63.15 (1.50 1.85 ... 1.10 ) .. 2 2 2 2 2 2 2 ( ) k n x SS x T x i j dfT ( x) =kn-1=4×12-1=47 2、处理间平方和与自由度 0.83 48 63.15 (18.25 15.40 15.65 13.85 ) 12 .. 1 . 1 2 2 2 2 2 2 1 2 ( ) = − = + + + − = = k n x x n S S k i t x i dft(x) =k-1=4-1=3 3、处理内平方和与自由度 SSe( x) = SST ( x) - SSt(x) =1.75-0.83=0.92 df e( x) = dfT ( x) - dft( x) =47-3=44 (二)求y变量各项平方和与自由度 1、总平方和与自由度 = − = + + + − = − = 96.76 48 550.5 6410 .31 48 550.5 (12.40 12.00 ... 11.00 ) 2 2 2 2 2 2 2 .. ( ) k n y SS y T y i j dfT ( y) =kn-1=4×12-1=47 2、处理间平方和与自由度 = − = + + + − =11.68 48 550.50 (141.80 130.80 144.80 133.80 ) 12 1 . 1 2 2 2 2 2 2 2 .. ( ) k n y y n SSt y i dft( y) =k-1=4-1=3
3、处理内平方和与自由度 SSay=SSr()-S(y)=96.76-168=8508 (y)m)=47-3=44 (三)求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度 SP=∑∑x,y1-x 63.15×550.50 1.50×12.40+1.85×12.00++1.10×11.00 4x12 732.50-6315×5050=825 T(x, y -1=4×12-1=47 2、处理间乘积和与自由度 x.y A(1825×181+540×10.0+56×1480+1385×1380-26315×5050 4×12 y)2=k-1=4-1=3 处理内乘积和与自由度 SP=SP-SP=8.25-164=661 dfelx, y =dr(x,)-dfnx, x)=47-3=44 平方和、乘积和与自由度的计算结果列于表10-3。 表10-3x与y的平方和与乘积和表 变异来源 处理间() 0.83 11.68 处理内(误差)e) 0.92 85.08 6.61 总变异(T) 47 1.75 96.76 8.25 (四)对x和y各作方差分析(表10-41) 表104初生重与50日龄重的方差分析表 x变量 变量 变异来源 Ms F F值 MS F 处理间 30.830.281333*11683,89202 处理内(误差) 0.920.02 85.081.93 F00s=2.82 总变异 F00=4.26 471.75 分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50日龄平 均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差, 揭示出可能被掩盖的处理间差异的显著性 (五)协方差分析
201 3、处理内平方和与自由度 SSe( y) = SST ( y) - SSt( y ) =96.76-11.68=85.08 df e( y) = dfT ( y) - dft( y) =47-3=44 (三)求x和y两变量的各项离均差乘积和与自由度 1、总乘积和与自由度 kn x y SP x y k i n j T ij ij .. .. 1 1 = − = = 8.25 4 12 63.15 550.50 732.50 4 12 63.15 550.50 1.50 12.40 1.85 12.00 ... 1.10 11.00 = = − = + + + − dfT ( x, y) =kn-1=4×12-1=47 2、处理间乘积和与自由度 kn x y x y n SP k i t i i .. .. . . 1 1 = − = 4 12 63.15 550.50 (18.25 141.80 15.40 130.10 15.65 144.80 13.85 133.80) 12 1 = + + + − =1.64 dft( x, y) =k-1=4-1=3 3、处理内乘积和与自由度 SPe = T SP - SPt =8.25-1.64=6.61 df e( x, y) = dfT ( x, y) - dft( x, y) =47-3=44 平方和、乘积和与自由度的计算结果列于表10—3。 表10—3 x与y的平方和与乘积和表 变异来源 df x SS SS y SPxy 处理间(t) 3 0.83 11.68 1.64 处理内(误差)(e) 44 0.92 85.08 6.61 总变异(T) 47 1.75 96.76 8.25 (四)对x和y各作方差分析(表10—4) 表10—4 初生重与50日龄重的方差分析表 变异来源 df x变量 y变量 F值 SS MS F SS MS F 处理间 3 0.83 0.28 13.33** 11.68 3.89 2.02 F0.05=2.82 F0.01=4.26 处理内(误差) 44 0.92 0.021 85.08 1.93 总变异 47 1.75 96.76 分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50 日龄平 均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差, 揭示出可能被掩盖的处理间差异的显著性。 (五)协方差分析