第九讲正交试验分析及分析方法 ORTHOGONAL DESIGN 基本知识 正交试验设计的概念:正交设计是一种研究多因素试验中利用正交表仅挑选部分 有代表性的水平组合构成试验方案设计方法。 二、正交试验设计的优点:节省处理数。在多因素、多水平的试验中,处理组合数相 当多,正交设计的特点就是在较多的全部处理组合中,仅挑选部分有代表性的少数水平组合 进行试验。通过部分试验了解全面试验情况,找到较优的水平组合。例如有4个因素3个水 平的全部处理组合为34=81个,而采用正交表L9(34)只要挑选出有代表性的9个水平组合 进行试验就可以了,节省了8/9的处理。再例如,有5个因素4个水平的试验,全部处理数 为45=1024个,全部试验几乎不可能,若采用L16(45)正交表挑选水平组合,只要16个处 理。所以因素、水平越多,正交试验设计的优点越明显。 三、适宜条件:多因素、多水平、只考察主效而较少考察互作(试验周期长、误差较大) 的多处理试验。 四、分析方法:方差分析法和直观分析法两种。 五、注意:正交设计只是一种利用正交表在全部处理中挑选部分有代表性的水平组合构 成试验方案设计的方法,该试验用那种设计方法排列处理和重复区组还要根据环境条件和试 验条件而定 第一节正交表的基本性质 、正交表的通式 最简单的正交表为:L4(23) 通式为Lm()或Lm(“,t) L为正交表标记m为处理组合数t为因素的水平数k为最多可以安排的因素 数或最多可以考察的效应数或正交表的列数。 表91L4(23)正交表的表型构 处理组合 数 2 221 表头3列,为最多考察的效应数,水平栏为每个因素的水平(1,2),处理列为处理组 合数4个。再例如L(34)(表81)。其中L表示一张正交表,括号内的底数3表示因素的 水平数,3的右上方指数4,表示最多可以安排因素的个数。L右下角的数字9表示试验的 次数(水平组合数)。横表头的“1,2,3,4”是表示正交表4列号:纵表头的“1,2,9” 分别表示9行,也是9个处理的代号:表身中每一列的“1、2、3”分别表示因素的3个水 表92L9(34)正交表
第九讲 正交试验分析及分析方法 ORTHOGONAL DESIGN 基本知识: 一、正交试验设计的概念:正交设计是一种研究多因素试验中利用正交表仅挑选部分 有代表性的水平组合构成试验方案设计方法。 二、正交试验设计的优点:节省处理数。在多因素、多水平的试验中,处理组合数相 当多,正交设计的特点就是在较多的全部处理组合中,仅挑选部分有代表性的少数水平组合 进行试验。通过部分试验了解全面试验情况,找到较优的水平组合。例如有 4 个因素 3 个水 平的全部处理组合为 3 4=81 个,而采用正交表 L9(3 4)只要挑选出有代表性的 9 个水平组合 进行试验就可以了,节省了 8/9 的处理。再例如,有 5 个因素 4 个水平的试验,全部处理数 为 4 5=1024 个,全部试验几乎不可能,若采用 L16(4 5)正交表挑选水平组合,只要 16 个处 理。所以因素、水平越多,正交试验设计的优点越明显。 三、适宜条件:多因素、多水平、只考察主效而较少考察互作(试验周期长、误差较大) 的多处理试验。 四、分析方法:方差分析法和直观分析法两种。 五、注意:正交设计只是一种利用正交表在全部处理中挑选部分有代表性的水平组合构 成试验方案设计的方法,该试验用那种设计方法排列处理和重复区组还要根据环境条件和试 验条件而定。 第一节 正交表的基本性质 一、正交表的通式 最简单的正交表为:L4(2 3) 通式为 Lm(t k)或 Lm(t k,t k) L 为正交表标记 m 为处理组合数 t 为因素的水平数 k 为最多可以安排的因素 数或最多可以考察的效应数或正交表的列数。 表 9.1 L4(2 3)正交表的表型构造 处理组合 列 数 1 2 3 水 平 1 1 1 1 2 1 2 2 3 2 1 2 4 2 2 1 表头 3 列,为最多考察的效应数,水平栏为每个因素的水平(1,2),处理列为处理组 合数 4 个。再例如 L9(3 4)(表 8-1)。其中 L 表示一张正交表,括号内的底数 3 表示因素的 水平数,3 的右上方指数 4,表示最多可以安排因素的个数。L 右下角的数字 9 表示试验的 次数(水平组合数)。横表头的“1,2,3,4”是表示正交表 4 列号;纵表头的“1,2,…9” 分别表示 9 行,也是 9 个处理的代号;表身中每一列的“1、2、3”分别表示因素的 3 个水 平。 表 9.2 L9(3 4)正交表
列号 试验号 123456789 312323 222333 23123 1312 以上所述的正交表各因素的水平数都是相同的。但试验中,有时也会遇到某些试验因 素的水平多些,另一些因素的水平可能少些。这种试验就应该应用混合水平正交表。如Ls (44×24)。其中8表示要安排8个处理组合;括号内的指数1和4表示此表共5列,可以 安排5个因素:括号内的第一个底数4表示第一个因素设4个水平:第二个底数2表示后4 个因素均设2个水平。 有的正交表后附有“两列间的交互列”表,是用于安排因素之间有交互作用的试验,交 互作用随着因素的增加而减小 交表的种类 1、相同水平正交表:2水平正交表L4(23)、L8(27)、L12(21)、L16(215)、L20(219) 3水平正交表L9(3)、L18(37)、L27(313) 4水平正交表L16(45) 5水平正交表L25(56) 2、混合水平正交表:1个因素4个水平另4个因素2水平的正交表L8(4*24) 1个因素6个水平另2个因素2水平的正交表L12(6*22) 2个因素4个水平另9个因素2水平的正交表L16(42*29) 、正交表的性质 正交表具有以下两个特性 1、均衡搭配 以L4(23)为例说明。由表93中看,每一列中不同数字(1,2)出现的次数相等。任 二列中,同一横行的每种数对(1,1)、(1,2)、(2,1)、(2,2)出现的次数相等。即对任 两列来说,其因素水平间的组合都是均衡搭配的 2、整齐可比 由于组合间的均衡搭配,因此,任一因素的任一水平下都必然均衡地包含着其它因素 的各水平。如第一列所在因素的两个水平比较,第1水平是1、2两个试验号的相加,第2 水平是3、4两个试验号的相加。在第1水平中,由于配有第2列、第3列的1、2两个水平: 在第2水平中,也同样配有第2、3列的1、2两个水平,因此第1列所在因素的两个水平是 在相同条件下的比较,具有整齐可比性。对第2、3列的水平间比较也是如此 表93L4(23)正交表 列号 2 试验号 2
列号 试验号 1 2 3 4 1 2 3 4 5 6 7 8 9 1 1 1 1 1 2 2 2 1 3 3 3 2 1 2 3 2 2 3 1 2 3 1 2 3 1 3 2 3 2 1 3 3 3 2 1 以上所述的正交表 各因素的水平数都是相同的。但试验中,有时也会遇到某些试验因 素的水平多些,另一些因素的水平可能少些。这种试验就应该应用混合水平正交表。如 L8 (4 1×2 4)。其中 8 表示要安排 8 个处理组合;括号内的指数 1 和 4 表示此表共 5 列,可以 安排 5 个因素;括号内的第一个底数 4 表示第一个因素设 4 个水平;第二个底数 2 表示后 4 个因素均设 2 个水平。 有的正交表后附有“两列间的交互列”表,是用于安排因素之间有交互作用的试验,交 互作用随着因素的增加而减小。 二、正交表的种类 1、相同水平正交表:2 水平正交表 L4(2 3)、L8(2 7)、L12(2 11)、L16(2 15)、L20(2 19) 3 水平正交表 L9(3 4)、L18(3 7)、L27(3 13) 4 水平正交表 L16(4 5) 5 水平正交表 L25(5 6) 2、混合水平正交表:1 个因素 4 个水平另 4 个因素 2 水平的正交表 L8(4*24) 1 个因素 6 个水平另 2 个因素 2 水平的正交表 L12(6*22) 2 个因素 4 个水平另 9 个因素 2 水平的正交表 L16(4 2*29) 三、正交表的性质 正交表具有以下两个特性 1、均衡搭配 以 L4(2 3)为例说明。由表 9.3 中看,每一列中不同数字(1,2)出现的次数相等。任 二列中,同一横行的每种数对(1,1)、(1,2)、(2,1)、(2,2)出现的次数相等。即对任 两列来说,其因素水平间的组合都是均衡搭配的。 2、整齐可比 由于组合间的均衡搭配,因此,任一因素的任一水平下都必然均衡地包含着其它因素 的各水平。如第一列所在因素的两个水平比较,第 1 水平是 1、2 两个试验号的相加,第 2 水平是 3、4 两个试验号的相加。在第 1 水平中,由于配有第 2 列、第 3 列的 1、2 两个水平; 在第 2 水平中,也同样配有第 2、3 列的 1、2 两个水平,因此第 1 列所在因素的两个水平是 在相同条件下的比较,具有整齐可比性。对第 2、3 列的水平间比较也是如此。 表 9.3 L4(23 )正交表 列号 试验号 1 2 3 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1
例3个因素N、P、K试验,每个因素都具有2个水平:1=不施用、2=施用,利用L4(23)正 交表安排的试验处理为 处理组合列 2 3 空白对照(全部不施) (不用施N) K(不用施P NP(不用施K) 如果要分析N的效果可以从第一列来计算。在第一列上处理组合号1、2的N都是1水平, 而在2、3列上的P、K都是施与不施各一次。第一列上处理组合3、4的N都是2水平,而 在2、3列上的P、K也都是施与不施各一次。这样处理1、2与3、4的差别是P、K施用 数量都一样,而对N来说,处理组合1、2未施用N,而处理组合3、4都施用了N。可见 处理组合1、2与3、4之间是在P与K施用数量相等的基础上施用N与不施用N的差异。 因此,它们的差数可以代表N肥的效果。同样道理,第二列上处理1、3与2、4之间是N 与K施用相等的基础上比较P的效应;第三列上处理1、4与2、3之间是N与P施用相等 的基础上比较K的效应。这种性质就是整齐可比性。 第一列N的效应=处理(3+4)一一处理(1+2) 第二列P的效应=处理(2+4)一一处理(1+3) 第三列K的效应=处理(2+3)一一处理(1+4) 四、正交表的交互作用列 由上例可以看出,如果N、P、K之间存在互作,则第一列中的计算不仅仅是N的效应 还应该有PK的互作。即第一列为N的主效与PK互作的混杂;同理第二列中为P的主效与 NK互作的混杂,第三列中为K的主效与NP互作的混杂。所以采用正交表设计试验时应尽 量考虑到因素间不存在明显互作,或只考察少量因素间的一级互作,这样就可以在不显著的 交互作用列上安排新的因素。正交设计正是利用这一特性达到实施部分处理的目的。具体可 以查阅有关交互作用列附表 五、正交设计的依据 “正交”源于几何学上两向量正交(内积我零)的定义。简单地说就是试验点在试验空 间中分布是均衡的。例如有一个三因素试验(ABC),各有2个水平,如果进行全部试验共 有8个处理组合,它们的分布如图91中左图所示。左图是一个正交六面体。如果以其任二 个平行面代表一个因素的两个水平,以左右两面代表A1、A2,以上下二面代表B1、B2,前 后二面代表C1、C2。则这六个面交有8个点,这8个点代表全面试验的处理组合 根据L4(23)正交表只选做其中4个处理组合,它们分别是:A1B1C1、A2B1C2、A2B2C1 A1B2C2,如图91右图所示。从图中可以看出,这4个处理组合同样代表了8个处理组合, 因为它们均匀地分布在六面体的8个点中,在六面体的任何一个面上都有2个点,每个点 都有三根不同的线相交,故这4个点代表了整个六面体的12根线。“正交性”既每个因素的
例 3 个因素 N、P、K 试验,每个因素都具有 2 个水平:1=不施用、2=施用,利用 L4(23 )正 交表安排的试验处理为 处理组合 列 数 实际处理 1 2 3 水 平 1 1 1 1 空白对照(全部不施) 2 1 2 2 PK (不用施 N) 3 2 1 2 NK (不用施 P) 4 2 2 1 NP (不用施 K) 如果要分析 N 的效果可以从第一列来计算。在第一列上处理组合号 1、2 的 N 都是 1 水平, 而在 2、3 列上的 P、K 都是施与不施各一次。第一列上处理组合 3、4 的 N 都是 2 水平,而 在 2、3 列上的 P、K 也都是施与不施各一次。这样处理 1、2 与 3、4 的差别是 P、K 施用 数量都一样,而对 N 来说,处理组合 1、2 未施用 N,而处理组合 3、4 都施用了 N。可见 处理组合 1、2 与 3、4 之间是在 P 与 K 施用数量相等的基础上施用 N 与不施用 N 的差异。 因此,它们的差数可以代表 N 肥的效果。同样道理,第二列上处理 1、3 与 2、4 之间是 N 与 K 施用相等的基础上比较 P 的效应;第三列上处理 1、4 与 2、3 之间是 N 与 P 施用相等 的基础上比较 K 的效应。这种性质就是整齐可比性。 第一列 N 的效应=处理(3+4)——处理(1+2) 第二列 P 的效应=处理(2+4)——处理(1+3) 第三列 K 的效应=处理(2+3)——处理(1+4) 四、正交表的交互作用列 由上例可以看出,如果 N、P、K 之间存在互作,则第一列中的计算不仅仅是 N 的效应, 还应该有 PK 的互作。即第一列为 N 的主效与 PK 互作的混杂;同理第二列中为 P 的主效与 NK 互作的混杂,第三列中为 K 的主效与 NP 互作的混杂。所以采用正交表设计试验时应尽 量考虑到因素间不存在明显互作,或只考察少量因素间的一级互作,这样就可以在不显著的 交互作用列上安排新的因素。正交设计正是利用这一特性达到实施部分处理的目的。具体可 以查阅有关交互作用列附表。 五、正交设计的依据 “正交”源于几何学上两向量正交(内积我零)的定义。简单地说就是试验点在试验空 间中分布是均衡的。例如有一个三因素试验(ABC),各有 2 个水平,如果进行全部试验共 有 8 个处理组合,它们的分布如图 9.1 中左图所示。左图是一个正交六面体。如果以其任二 个平行面代表一个因素的两个水平,以左右两面代表 A1、A2,以上下二面代表 B1、B2,前 后二面代表 C1、C2。则这六个面交有 8 个点,这 8 个点代表全面试验的处理组合。 根据 L4(2 3)正交表只选做其中 4 个处理组合,它们分别是:A1B1C1、A2B1C2、A2B2C1、 A1B2C2,如图 9.1 右图所示。从图中可以看出,这 4 个处理组合同样代表了 8 个处理组合, 因为它们均匀地分布在六面体的 8 个点中,在六面体的任何一个面上都有 2 个点,每个点 都有三根不同的线相交,故这 4 个点代表了整个六面体的 12 根线。“正交性”既每个因素的
全部水平与另一个因素的全部水平各相配一次的特性。 第二节、正交试验的设计 正交试验的设计,可按以下步骤进行。 确定因素和水平 根据试验的目的确定试验要研究的因素。如果对研究的问题了解较少,可多取一些试验 因素。若对硏究的问题比较了解,因素可少些。确定的因素主要是选择对试验指标影响最大 而又最有经济效果的因素。因素确定后,便可对水平进行划分,每个因素的水平数可以相等 也可以不等,重要的因素或特别希望详细了解的因素水平可多些,其余的可少些 例1研究不同营养成份含量对肉鸡的增重效果,考察了粗蛋白含量(A)的4个水平 (k=4),粗脂肪(B)和粗纤维(C)含量各2个水平(m=2)的三因素不等水平,如表8-3 表94因素水平表 因素 粗蛋白(%)粗脂肪(%)粗纤维(%) 14 3.5 选用合适的正交表 根据试验因素和水平数的多少以及是否需要估计互作来选择合适的正交表。选用正交表 的原则是:即要能安排下试验的全部因素,又要使部分试验的水平组合数尽可能的少。例1 的试验可选用Ls(4×24)。该表是来自L8(27)正交表,(见表9-13)。把Lg(27)正交表 的第1、2两列合并,横行搭配(1,1)的赋予1,(1,2)的赋予2,(2,1)的赋予3,(2 2)的赋予4,便成为L8(4×24)正交表的第1列。根据L8(2)的交互列表知道,第3列 是第1、2列的交互列,为避免效应的混杂,故在L8(4×24)表中也不能再出现,因此 L8(4×24)正交表仅有5列,其结构见表8-5。 三、作表头设计,列出试验方案 表头设计,就是把试验中所选择的各因素及要考察的互作一一排入正交表的表头各列 上。(1)在不考虑交互作用时,哪一因素放到哪一列,原则上可任意放置,只要每一因素占 列即可:(2)若要分析交互作用,或避免交互作用的混杂,就应按指定的列放置,不能任 意放置。本例不考虑交互作用的影响,把A、B、C因素依次安排在第1、2、3列上,第4、 5列为空列,如表8-4。 表95肉鸡增重试验的表头设计 (4×2)列号12345 因素 A B C 表头设计好后,把各列中的水平号换成各因素的具体水平就成试验方案 表96肉鸡增重的正交试验的表头设计 因素 C 增重 (g) 试验号 IⅡⅢ合计Tt 1(14)1(2.5)1(3)1 116115119 2(3.5)2(4)22 114115114 343 2(16)1 117116119 352
全部水平与另一个因素的全部水平各相配一次的特性。 第二节、正交试验的设计 正交试验的设计,可按以下步骤进行。 一、确定因素和水平 根据试验的目的确定试验要研究的因素。如果对研究的问题了解较少,可多取一些试验 因素。若对研究的问题比较了解,因素可少些。确定的因素主要是选择对试验指标影响最大 而又最有经济效果的因素。因素确定后,便可对水平进行划分,每个因素的水平数可以相等, 也可以不等,重要的因素或特别希望详细了解的因素水平可多些,其余的可少些。 例1 研究不同营养成份含量对肉鸡的增重效果,考察了粗蛋白含量(A)的 4 个水平 (k=4),粗脂肪(B)和粗纤维(C)含量各 2 个水平(m=2)的三因素不等水平,如表 8-3。 表 9.4 因素水平表 因素 水平 粗蛋白(%) 粗脂肪(%) 粗纤维(%) 1 2 3 4 14 2.5 3 16 3.5 4 18 20 二、选用合适的正交表 根据试验因素和水平数的多少以及是否需要估计互作来选择合适的正交表。选用正交表 的原则是:即要能安排下试验的全部因素,又要使部分试验的水平组合数尽可能的少。例 1 的试验可选用 L8(4×2 4)。该表是来自 L8(2 7)正交表,(见表 9-13)。把 L8(2 7)正交表 的第 1、2 两列合并,横行搭配(1,1)的赋予 1,(1,2)的赋予 2,(2,1)的赋予 3,(2, 2)的赋予 4,便成为 L8(4×2 4)正交表的第 1 列。根据 L8(2 7)的交互列表知道,第 3 列 是第 1、2 列的交互列,为避免效应的混杂,故在 L8(4×2 4)表中也不能再出现,因此, L8(4×2 4)正交表仅有 5 列,其结构见表 8-5。 三、作表头设计,列出试验方案 表头设计,就是把试验中所选择的各因素及要考察的互作一一排入正交表的表头各列 上。(1)在不考虑交互作用时,哪一因素放到哪一列,原则上可任意放置,只要每一因素占 一列即可;(2)若要分析交互作用,或避免交互作用的混杂,就应按指定的列放置,不能任 意放置。本例不考虑交互作用的影响,把 A、B、C 因素依次安排在第 1、2、3 列上,第 4、 5 列为空列,如表 8-4。 表 9.5 肉鸡增重试验的表头设计 L8(4×2 4)列号 1 2 3 4 5 因素 A B C 表头设计好后,把各列中的水平号换成各因素的具体水平就成试验方案。 表 9.6 肉鸡增重的正交试验的表头设计 因素 试验号 A B C 1 2 3 4 5 增 重 (g) Ⅰ Ⅱ Ⅲ 合计 Tt 1 2 3 1(14)1(2.5)1(3) 1 1 1 2(3.5)2(4) 2 2 2(16)1 1 2 2 116 115 119 114 115 114 117 116 119 350 343 352
2 119120120 359 5 3(18) 122120 4(20)1 124025123 693144114551458144T=969965962T=2896 7111455144114381452 738 T 754 四、确定重复数和试验设计方法 1、正交设计只是利用正交表挑选有代表性的处理组合,如何根据试验环境和条件排列 处理和重复区组还要采用相应的试验设计方法,如随机区组设计、裂区设计等 2、无重复的正交设计试验只能用不显著的交互作用列估计试验误差是不准确的,一般 不能进行方差分析,如果要进行方差分析至少有2个重复。 第三节正交试验结果的实例分析 无交互作用的正交试验设计 正交试验结果分析的方法分直观分析和方差分析两种,这里仅介绍方差分析法 本例试验设三次重复,其结果列于表8-5的右侧,若用n表示试验处理组合数,a、b c分别表示A、B、C的每个水平的试验重复数,r为每个处理组合的重复数。则k=4,m=2, n=8,a=2,b=4,c=4,r=3。方差分析的步骤如下 (一)计算各因素同一水平之和 第一列A:T1=350+343=693 T2=352+359=71 T=367+371=738 T4=372+382=754 第二列B:T1=350+352+367+372=1441 T2=343+359+371+382=1455 其余各列各水平之和的计算方法同上。 (二)各平方和及自由度的剖分 总平方和 SSISS+SS+Sse(SSt为处理组合平方和,SSr为重复间平方和,Sse2为试验 误差)
4 5 6 7 8 2 2 2 1 1 3(18)1 2 1 2 3 2 1 2 1 4(20)1 2 2 1 4 2 1 1 2 119 120 120 125 122 120 126 124 121 124 025 123 128 128 126 359 367 371 372 382 T1 T2 T3 T4 693 1441 1455 1458 1444 711 1455 1441 1438 1452 738 754 Tr=969 965 962 T=2896 四、确定重复数和试验设计方法 1、正交设计只是利用正交表挑选有代表性的处理组合,如何根据试验环境和条件排列 处理和重复区组还要采用相应的试验设计方法,如随机区组设计、裂区设计等。 2、无重复的正交设计试验只能用不显著的交互作用列估计试验误差是不准确的,一般 不能进行方差分析,如果要进行方差分析至少有 2 个重复。 第三节 正交试验结果的实例分析 一、无交互作用的正交试验设计 正交试验结果分析的方法分直观分析和方差分析两种,这里仅介绍方差分析法。 本例试验设三次重复,其结果列于表 8-5 的右侧,若用 n 表示试验处理组合数,a、b、 c 分别表示 A、B、C 的每个水平的试验重复数,r 为每个处理组合的重复数。则 k=4,m=2, n=8,a=2,b=4,c=4,r=3。方差分析的步骤如下: (一)计算各因素同一水平之和 第一列 A: T1=350+343=693 T2=352+359=711 T3=367+371=738 T4=372+382=754 第二列 B: T1=350+352+367+372=1441 T2=343+359+371+382=1455 其余各列各水平之和的计算方法同上。 (二) 各平方和及自由度的剖分 总平方和 SST=SSt+SSr+Sse2 (SSt 为处理组合平方和,SSr为重复间平方和,SSe2 为试验 误差)