第九章多因素试验资料的统计分析 多因素试验是指两个或两个以上试验因素的试验,其处理组合数为各因素水平数之积 例如二因素试验中,一因素4水平,另一因素5水平,则这一试验就有4×5=20个处理组合 多因素试验因设计类型不同,故处理组合以不同方式进行田间排列,如完全随机、随机区组 拉丁方、裂区设计和条区设计等等。 第一节二因素完全随机试验资料的统计分析 因素试验的所有处理组合在试验中完全随机排列,而整理资料时,试验数据是按两个 因素交叉分组的,即为两向分组(或称交叉分组)的完全随机试验。 如选用几种温度和几种培养基培养某种真菌,以研究其生长速度,其每个观察值都是某 温度和某一培养基的组合同时作用的结果,故属两向分组资料,因所有观察值是在所有组 合完全随机排列下得到的,故又称二因素完全随机试验。完全随机试验按照处理组合内有无 重复观察值分为两种方差分析方法。 、无重复观察值的二因素试验资料 1.无重复观察值的二因素试验结果的分析 设有A和B两个因素,A因素有a个处理,B因素有b个处理,每一处理组合仅有1个 观察值,则全试验共有ab个观察值,其资料类型如表9.1 表91完全随机设计的二因素试验每处理组合只有一个观察值的资料符号 无重复观察值的二因素试验也叫只有单个观察值的二因素试验,其各项变异来源自由度 与平方和的估计及方差分析见表92。 表92表9.1类型资料自由度和平方和的分解及方差分析 上述这种试验资料如果A、B存在互作,则与误差混淆,因而无法分析互作,也不能取 得合理的试验误差估计。只有AB互作不存在时,才能正确估计误差。但在田间试验上, 9.2类型的方差分析却是常用的。因为在随机区组试验(见第8章)中,处理可看作A因素, 区组可看作B因素:而区组效应是随机模型的,处理和区组的互作在理论上又是不应存在的。 但是,这种设计的误差项自由度一般不应小于12,以较精确地估计误差。 (1)结果整理:将试验结果数据列成两向分组表,见表93。 (2)自由度和平方和的分解;根据表9.2,将各项自由度直接填于表94。以下分解平方和, 求得 6×4=9487838
1 第九章 多因素试验资料的统计分析 多因素试验是指两个或两个以上试验因素的试验,其处理组合数为各因素水平数之积。 例如二因素试验中,一因素 4 水平,另一因素 5 水平,则这一试验就有4×5=20个处理组合, 多因素试验因设计类型不同,故处理组合以不同方式进行田间排列,如完全随机、随机区组、 拉丁方、裂区设计和条区设计等等。 第一节 二因素完全随机试验资料的统计分析 二因素试验的所有处理组合在试验中完全随机排列,而整理资料时,试验数据是按两个 因素交叉分组的,即为两向分组(或称交叉分组)的完全随机试验。 如选用几种温度和几种培养基培养某种真菌,以研究其生长速度,其每个观察值都是某 一温度和某一培养基的组合同时作用的结果,故属两向分组资料,因所有观察值是在所有组 合完全随机排列下得到的,故又称二因素完全随机试验。完全随机试验按照处理组合内有无 重复观察值分为两种方差分析方法。 一、无重复观察值的二因素试验资料 1.无重复观察值的二因素试验结果的分析 设有 A 和 B 两个因素,A 因素有 a 个处理,B 因素有 b 个处理,每一处理组合仅有 1 个 观察值,则全试验共有 ab 个观察值,其资料类型如表 9.1。 表 9.1 完全随机设计的二因素试验每处理组合只有一个观察值的资料符号 无重复观察值的二因素试验也叫只有单个观察值的二因素试验,其各项变异来源自由度 与平方和的估计及方差分析见表 9.2。 表 9.2 表 9.1 类型资料自由度和平方和的分解及方差分析 上述这种试验资料如果 A、B 存在互作,则与误差混淆,因而无法分析互作,也不能取 得合理的试验误差估计。只有 AB 互作不存在时,才能正确估计误差。但在田间试验上,表 9.2 类型的方差分析却是常用的。因为在随机区组试验(见第8章)中,处理可看作 A 因素, 区组可看作 B 因素;而区组效应是随机模型的,处理和区组的互作在理论上又是不应存在的。 但是,这种设计的误差项自由度一般不应小于 12,以较精确地估计误差。 (1)结果整理:将试验结果数据列成两向分组表,见表 9.3。 (2)自由度和平方和的分解;根据表9.2,将各项自由度直接填于表 9.4。以下分解平方和, 求得 94 878.38 6 4 15092 = C =
SSr=602+652+…+652-C=11462 2432+2632+…+2502 C=65.87 SS.=11462-6587-545=43.30 表94表9.3资料的方差分析 (3)F测验:将上述结果录于表94,并算得各MS值。对温度间有无不同效应作F测验 有 1.82 F 对处理间有无不同效应F测验有H:k2=0,得 2.89 推断:温度间无显著差异,不同生长素处理有显著差异。 (4)处理间比较:此例有预先指定的对照,故用DLSD法。求得 2×289 .r? 1.201(节间) 当p=5,v=15时,Do0s=2.90,Do1=3.70,故 DLSD0s=1.201×290=348(节间) DLSDo01=1.201×3.70=444(节间 以DLSD测验各生长素处理与对照的差异显著性于表9.5。 (5)试验结论:由于温度间F测验差异不显著,所以说明不同温度对豌豆见第一朵花时的 总节间数变化影响不大;生长素处理F测验差异显著,其中赤霉素处理的豌豆总节间数最多, 并与对照差异达极显著,其余处理皆与对照无显著差异。 2.线性模型与期望均方 表9.1中任一观察值的线性模型为 μ+t+β,+ (9.1) 上式的μ为总体平均:t和B,分别为因素A和B的效应,可以是固定模型或随机模型 En为随机误差,它彼此独立,并来自正态总体M(Qa2)。上式说明表91类型资料的总变异 (xn-)可分解为A因素处理间效应τ、B因素处理间效应阝,和试验误差Ey三个部分 表9.1类型资料的各变异来源的期望均方见表92
2 114.62 65.87 5.45 43.30 5.45 6 375 382 377 375 65.87 4 243 263 250 60 65 65 114.62 2 2 2 2 2 2 2 2 2 2 = − − = − = + + + = − = + + + = = + + + − = e B A T SS SS C SS C SS C 表 9.4 表 9.3 资料的方差分析 (3) F 测验:将上述结果录于表 9.4,并算得各 MS 值。对温度间有无不同效应作 F 测验 有 H0: 0 2 = ,得 1 2.89 1.82 F = 对处理间有无不同效应 F 测验有 H0: 0 2 k = ,得 52 0.05 4. 2.89 13.17 F = = F 推断:温度间无显著差异,不同生长素处理有显著差异。 (4)处理间比较:此例有预先指定的对照,故用 DLSD 法。求得 1.201( ) 4 2 2.89 1 2 = 节间 sx −x = 当 p=5,ve=15 时,Dt0.05=2.90,Dt0.01=3.70,故 DLSD0.05=1.201×2.90=3.48 (节间) DLSD0.01=1.201×3.70=4.44 (节间) 以 DLSD 测验各生长素处理与对照的差异显著性于表 9.5。 (5)试验结论:由于温度间 F 测验差异不显著,所以说明不同温度对豌豆见第一朵花时的 总节间数变化影响不大;生长素处理 F 测验差异显著,其中赤霉素处理的豌豆总节间数最多, 并与对照差异达极显著,其余处理皆与对照无显著差异。 2.线性模型与期望均方 表 9.1 中任一观察值的线性模型为 ij i j ij x = + + + (9.1) 上式的 为总体平均; i 和 j 分别为因素 A 和B 的效应,可以是固定模型或随机模型; ij 为随机误差,它彼此独立,并来自正态总体 N(0, 2 )。上式说明表 9.1 类型资料的总变异 ( xij − )可分解为 A 因素处理间效应 i 、B 因素处理间效应 j 和试验误差 ij 三个部分。 表 9.1 类型资料的各变异来源的期望均方见表 9.2
、有重复观察值的二因素试验资料 1.有重复观察值的二因素试验结果的分析 设有A、B两个试验因素,A因素有a个处理,B因素有b个处理,共有ab个处理组合 每一组合有n个观察值,则该资料有ab个观察值。如果试验按完全随机设计,则其资料类 型如表9 表9.6完全随机设计的二因素试验,每处理组合有重复观察值的资料符号表 表96类型资料比表9.1类型资料仅增加一项变异来源—-AXB互作,其变异来源的自 由度与平方和分解见表97 3×3×3 SSr=2142+2122+…+1402-C=21928 16922+11822+122 C=17945 3×3 132+13462+133.52 C-17945-3.96=1917 SS=21928-17945-3.96-1917=16.70 (3)F测验:将上述结果录于表99,以固定模型作F测验。假设H:(邯)=0,求 得F=4790928=516F0;假设H:t=0,求得F=89730928=968>F0:假设H:B,=0, 求得F=198/0.928=213<F00。所以该试验肥类×土类的互作和肥类的效应都是极显著的,而 土类间(即表98的3个x,值)无显著差异 (4)平均数的比较: ①各处理组合平均数的比较:肥类×土类的互作显著,说明各处理组合的效应不是各单 因素效应的简单相加,而是肥类效应随土类而不同(或反之)所以宜进一步比较各处理组合 的平均数。在此用新复极差测验,求得 根据y=18,算得各LSR05和LSR0的值于表9.10 表9.10表9.8资料各处理组合平均数的LSR值(新复极差测验) 将表98的各个值除以m=3,即得各处理组合的平均数,以表910的显著尺度测验各 平均数的差异显著性于表9.1 由表9.11可见,A1B1处理组合的产量极显著地高于其他处理组合:其次为A1B2和A1B3
3 二、有重复观察值的二因素试验资料 1.有重复观察值的二因素试验结果的分析 设有 A、B 两个试验因素,A 因素有 a 个处理,B 因素有 b 个处理,共有ab 个处理组合, 每一组合有 n 个观察值,则该资料有 abn 个观察值。如果试验按完全随机设计,则其资料类 型如表 9.6。 表 9.6 完全随机设计的二因素试验,每处理组合有重复观察值的资料符号表 表 9.6 类型资料比表9.1 类型资料仅增加一项变异来源-A×B 互作,其变异来源的自 由度与平方和分解见表 9.7。 179.45 3 3 169.2 118.2 122.0 21.4 21.2 14.0 219.28 6 207.72 3 3 3 (409.4) 2 2 2 2 2 2 2 − = + + = = + + + − = = = SS C SS C C A T 219.28 179.45 3.96 19.17 16.70 179.45 3.96 19.17 3 62.7 54.8 40.6 3.96 3 3 141.3 134.6 133.5 2 2 2 2 2 2 = − − − = − − − = + + + = − = + + = e A B B SS SS C SS C (3)F 测验:将上述结果录于表 9.9 ,以固定模型作 F 测验。假设 H0:() ij = 0 ,求 得 F=4.79/0.928=5.16>F0.01;假设H0:i = 0 ,求得 F=89.73/0.928=96.8>F0.01;假设H0: j = 0 , 求得 F=1.98/0.928=2.13<F0.05。所以该试验肥类×土类的互作和肥类的效应都是极显著的,而 土类间(即表 9.8 的 3 个 j x 值)无显著差异。 (4)平均数的比较: ①各处理组合平均数的比较:肥类×土类的互作显著,说明各处理组合的效应不是各单 因素效应的简单相加,而是肥类效应随土类而不同(或反之);所以宜进一步比较各处理组合 的平均数。在此用新复极差测验,求得 0.554( ) 3 0.928 SE = = g 根据 v=18,算得各 LSR0.05和 LSR0.01 的值于表 9.10。 表 9.10 表 9.8 资料各处理组合平均数的 LSR 值(新复极差测验) 将表 9.8 的各个 Tij 值除以 n=3,即得各处理组合的平均数,以表9.10 的显著尺度测验各 平均数的差异显著性于表 9.11 由表 9.11 可见,A1B1 处理组合的产量极显著地高于其他处理组合;其次为 A1B2 和A1B3
它们之间并无显著差异,但极显著地高于除A1B1外的其他处理组合。除上述外,其余处理组 合间皆无显著差异。 ②各肥类平均数的比较:肥类间的F测验极显著,说明τ;≠0。求得肥类平均数的标准 误差、=032(g),故有各肥类平均数的LSR值于表912,并有显著性测验结果于 3×3 表9.13。 表9.11表9.8资料各处理组合平均数的新复极差测验 由表9.13可见,肥料A1与A3、A2均有极显著的差异;但A3与A2无显著差异 5)试验结论:表98试验的分析结果表明,肥料A1对小麦的增产效果最好,土类间 则无显著差异:但A1施于油砂土比施于其他土壤上更有突出的增产效果,即A1B1处理组合 的小麦产量最高。 2.线性模型与期望均方 表96中任一观察值的线性模型为 xk=μ+T;+β,+()n+E (9.2) 上式的u为总体平均:t和β分别为因素A和B的效应;(TB)为AxB互作:E为 随机误差,遵循分布N(02)。上式说明表96类型资料的总变异(x1k-p)可分解为A因素 效应、B因素效应β、AXB互作(),和试验误差E四个部分。 表9.14表96类型资料各变异来源的期望均方 第二节多因素随机区组试验资料的统计分析 、二因素随机区组试验资料 1.二因素随机区组试验结果的分析 设有A和B两个试验因素,各具a和b个水平,作随机区组设计,有r次重复,则该试 验共得rab个观察值。其各项变异来源的自由度可分解于表9.15 表9.15二因素随机区组试验自由度的分解 变异来源 DE 区组 处理 A×B (a-1)(b-1) r-1)(ab-1
4 它们之间并无显著差异,但极显著地高于除A1B1外的其他处理组合。除上述外,其余处理组 合间皆无显著差异。 ②各肥类平均数的比较:肥类间的 F 测验极显著,说明 i 0 。求得肥类平均数的标准 误差 0.32( ) 3 3 0.928 SE = g = ,故有各肥类平均数的LSR 值于表 9.12,并有显著性测验结果于 表 9.13。 表 9.11 表 9.8 资料各处理组合平均数的新复极差测验 由表 9.13 可见,肥料 A1 与 A3、A2 均有极显著的差异;但 A3 与 A2 无显著差异。 (5)试验结论:表 9.8 试验的分析结果表明,肥料 A1对小麦的增产效果最好,土类间 则无显著差异;但 A1 施于油砂土比施于其他土壤上更有突出的增产效果,即 A1B1 处理组合 的小麦产量最高。 2.线性模型与期望均方 表 9.6 中任一观察值的线性模型为 ijk i j ij ijk x = + + + () + (9.2) 上式的 为总体平均; i 和 j 分别为因素 A 和 B 的效应; ij () 为 A B 互作; ijk 为 随机误差,遵循分布 (0, ) 2 N 。上式说明表9.6 类型资料的总变异 ( − ) ijk x 可分解为 A 因素 效应 i 、B 因素效应 j 、 A B 互作 ij () 和试验误差 ijk 四个部分。 表 9.14 表 9.6 类型资料各变异来源的期望均方 第二节 多因素随机区组试验资料的统计分析 一、二因素随机区组试验资料 1.二因素随机区组试验结果的分析 设有 A 和 B 两个试验因素,各具 a 和 b 个水平,作随机区组设计,有 r 次重复,则该试 验共得 rab 个观察值。其各项变异来源的自由度可分解于表 9.15。 表 9.15 二因素随机区组试验自由度的分解 变异来源 DF 区 组 处 理 A B B A 误 差 r-1 ab-1 − − − − ( 1)( 1) 1 1 a b b a (r-1)(ab-1)
由表9.15可见,二因素的随机区组试验和单因素随机区组试验,在变异来源上的区别仅 在于:前者的处理项可进而分解为A因素水平间(简记为A)、B因素水平间(简记为B)和 AB互作间(简记为AXB)三个部分,因而也就可分解出相应的自由度和平方和 (ab-1)=(1)+(b-1)+(a1b-1) 处理组合自由度=A的自由度+B的自由度+AXB的自由度 -2)2+∑∑( (94) 处理组合平方和=A的平方和+B的平方和+AXB的平方和 上式中,k=12,…,a;}=1,2…,b;x=各处理组合平均数,x=A因素各水平平均数, x=B因素各水平平均数,x=全试验平均数 [例9.3]图91早稻品种和密度随机区组试验的田间排列和产量 表9.16图9.1资料区组和处理产量的两向表 (1)结果整理:将所得结果按处理组合和区组作两向分组整理成表9.16;按品种和密 度作两向分组整理成表917。 表917表图9.1资料品种(4)和密度(B)的两向表 在表9.16和表917中,T=区组总和,TB=处理组合总和,T产品种总和,T=密度总和, T=全试验总和 峻()自由度和平方和的分解:自由度的分解可按表915直接填入918,以下分解各变异来 的平方和 矫正数C= T 20l =1496.33 rb3×3×3 由表9.16按单因素随机区组的分析方法可得 C=40.67 区组S∑2 702+682+63 C=2.89 处理组合S∑T2B 242+202+…+28 误差SS≥=总SS区组SS-处理组合SS=40.67-2.89-2967=8.11,由表917对处理组合项 SS=2967进行再分解
5 由表 9.15可见,二因素的随机区组试验和单因素随机区组试验,在变异来源上的区别仅 在于:前者的处理项可进而分解为 A 因素水平间(简记为 A)、B 因素水平间(简记为B)和 AB 互作间(简记为 A×B)三个部分,因而也就可分解出相应的自由度和平方和 (ab-1)=(a-1)+(b-1)+(a-1)(b-1) (9.3) 处理组合自由度=A 的自由度+B 的自由度+A×B 的自由度 − = − + − + − − + a b kl k l b l a b a kl k r x x rb x x ra x x r x x x x 1 1 2 2 1 1 1 2 2 ( ) ( ) ( ) ( ) (9.4) 处理组合平方和=A 的平方和+B 的平方和+A×B 的平方和 上式中,k=1,2, … ,a;l=1,2,…,b; kl x =各处理组合平均数, k x =A 因素各水平平均数, xl = B 因素各水平平均数, x =全试验平均数。 [例 9.3] 图 9.1 早稻品种和密度随机区组试验的田间排列和产量 表 9.16 图 9.1 资料区组和处理产量的两向表 (1)结果整理:将所得结果按处理组合和区组作两向分组整理成表 9.16;按品种和密 度作两向分组整理成表 9.17。 表 9.17 表图 9.1 资料品种(A)和密度(B)的两向表 在表 9.16和表 9.17 中, Tr =区组总和,TAB=处理组合总和,TA=品种总和,TB=密度总和, T=全试验总和。 (2)自由度和平方和的分解:自由度的分解可按表 9.15 直接填入 9.18,以下分解各变异来 源的平方和 1 496.33 3 3 3 2012 = = = rab T 矫正数C 由表 9.16 按单因素随机区组的分析方法可得 29.67 3 24 20 28 2.89 3 3 70 68 63 8 7 9 40.67 2 2 2 2 2 2 2 2 r 2 2 2 1 2 − = + + + − = = − = + + − = = = − = + + + − = C C r T SS C C ab T SS SS x C C AB t r rab T 处理组合 区组 误差 SSe=总 SST-区组 SSr-处理组合SSt=40.67-2.89-29.67=8.11,由表 9.17 对处理组合项 SSt=29.67 进行再分解