第七章混料试验设计与分析 在工农业生产和科学研究中,时常会遇到配方配比问题。比如,将若干种成分 (component),按百分比混合在一起形成混料,如饲料由A、B、C三种原料组成,三种原 料各占百分比是多少动物生长更有利,又例如,某种不锈钢由铁、镍、铜和铬四种元素 组成,我们想知道每种元素所占百分比与抗拉强度的数量关系。这些都是混料问题。对 于上述问题,要进行试验,探索混料各成分的百分比与试验研究指标之间的关系,进而 来回答上述问题。 混料设计(mixture design)就是要合理地选择少量的试验点,通过不同百分比成分的 混料试验,得到试验指标与混料中各种成分所占百分比的回归方程,通过回归方程和其 图形一响应曲面给出统计结论。 自从H.Scheffe1958年提出单纯形格子设计以来,混料回归设计的理论和它的应 用都有很大发展。混料设计在工业、农业和科学试验中都得到广泛的应用。汽油混合物、 混凝土、食品、饲料、医药等产品的研发上都会遇到混料设计问题。本文着重介绍 H.Scheffe提出的混料的单纯形格子设计和单纯形重心设计。 第一节混料设计模型 设p种成分的混料中,p种成分各占的百分比是,…,x。,其对应的试验指 标是y,表示为(x,…,xp,y),其中 2x=1,0≤x≤1,i=1,…p 如果x,…,xpy有关系,设为E(y)=(,…,x) 现要估计它,用多项式去估计,可以用一次、二次、高次多项式进行估计, 一般用二次多项式去估计,如果估计达不到要求,则用高次多项式进行估计。 (1)用二次多项式去估计,即设E(y)=∫(x,…,xn)的估计是: =bx,+bop (7-1) i<i 现以p=3进行说明。三元二次多项式是 =6+∑bx+2b,xx+2bx (7-2) i<j 由x+x2+x3=1可得 -176-
- 176 - 第七章 混料试验设计与分析 在工农业生产和科学研究中,时常会遇到配方配比问题。比如,将若干种成分 (component)按百分比混合在一起形成混料,如饲料由 A、B、C 三种原料组成,三种原 料各占百分比是多少动物生长更有利,又例如,某种不锈钢由铁、镍、铜和铬四种元素 组成,我们想知道每种元素所占百分比与抗拉强度的数量关系。这些都是混料问题。对 于上述问题,要进行试验,探索混料各成分的百分比与试验研究指标之间的关系,进而 来回答上述问题。 混料设计(mixture design)就是要合理地选择少量的试验点,通过不同百分比成分的 混料试验,得到试验指标与混料中各种成分所占百分比的回归方程,通过回归方程和其 图形-响应曲面给出统计结论。 自从 H.Scheffe 1958 年提出单纯形格子设计以来,混料回归设计的理论和它的应 用都有很大发展。混料设计在工业、农业和科学试验中都得到广泛的应用。汽油混合物、 混凝土、食品、饲料、医药等产品的研发上都会遇到混料设计问题。本文着重介绍 H.Scheffe 提出的混料的单纯形格子设计和单纯形重心设计。 第一节 混料设计模型 设 p 种成分的混料中,p 种成分各占的百分比是 1 , , p x x ,其对应的试验指 标是 y ,表示为( 1 , , p x x ,y ),其中 1 1 p i i x = = , 0≤xi≤1,i=1,…,p 如果 1 , , p x x y 有关系,设为 E y f x x ( ) = ( 1 , , p ) 现要估计它,用多项式去估计,可以用一次、二次、高次多项式进行估计, 一般用二次多项式去估计,如果估计达不到要求,则用高次多项式进行估计。 (1)用二次多项式去估计,即设 E y f x x ( ) = ( 1 , , p ) 的估计是: 1 ˆ p p i i ij i j i i j y b x b x x = = + (7-1) 现以 p = 3 进行说明。三元二次多项式是 3 3 3 2 0 1 1 ˆ i i ij i j ii i i i j i y b b x b x x b x = = = + + + (7-2) 由 x1 + x2 + x3 =1 可得
bo box:box2 +box3 x=x(1-x3-x3)=x1-xx2-xx3 X2=X2-XX2-x2X3 x=X3-XX3-X2X3 将其代入回归方程(7-2),加以整理可得 =+∑xx (7-3) i< (2)用一次多项式去估计,即设E(y)=f(x,…,xp)的估计是 5-2解 (3)用三次多项式去估计,即设E(y)=f(x,…,x。)的估计是 -2+2+2-)+点城 或者是 =bx+26,+6x 用{p,d}表示p个成分d次多项式混料设计。试验点(x,…,xp)由{p,d}确定。 经试验所求回归方程可用,则可利用回归方程求出最大值点或最小值点、定值点等。需 要指出的是,以上回归方程中bx,x,不能单纯理解为x,与x,的交互作用,它们只是表 示一种非线性混合的关系。Scheffe认为,当b,>0时,这种非线性混合关系是协调的: 而当b,<0时,则是对抗的。bx,xx也与bxx,一样。 目前,混料设计的方法已有多种,除了前面提到的单纯形格子设计,单纯形重心设 计外、有下界约束的混料设计、轴设计、凸多面体设计、C0x混料设计、混料均匀设计 等。本书只重点介绍单纯形格子设计和单纯形重心设计两种常用的设计方法。 第二节单纯形格子设计与统计分析 单纯形格子设计(simplex lattice design)是混料设计中最先出现的、最基本的一种设 计方法。 {P,d单纯形格子设计,试验点(X,,X)的选择是各成分X,在混料中所占百 分比 0a'a1,1=1,2,p 12 x=0 结合上x=1确定所有试验点。 al 如3,2单纯形格子设计,试验点(6,),=0,1,1=123, x1+x2+x3=1,x,0,i=1,2,3,所以试验点是 (LO.0)(C.L.O).o.)(--0.-o. 用图形表示 -177-
- 177 - ( ) 0 0 1 0 2 0 3 2 1 1 2 3 1 1 2 1 3 2 2 2 1 2 2 3 2 3 3 1 3 2 3 1 b b x b x b x x x x x x x x x x x x x x x x x x x x x x = + + = − − = − − = − − = − − 将其代入回归方程(7-2),加以整理可得 3 3 1 ˆ i i ij i j i i j y b x b x x = = + (7-3) (2)用一次多项式去估计,即设 E y f x x ( ) = ( 1 , , p ) 的估计是 = = p i i i y b x 1 ˆ (3)用三次多项式去估计,即设 E y f x x ( ) = ( 1 , , p ) 的估计是 1 ˆ ( ) p p p p i i ij i j ij i j i j ijk i j k i i j i j i j k y b x b x x r x x x x b x x x = = + + − + 或者是 1 ˆ p p p i i ij i j ijk i j k i i j i j k y b x b x x b x x x = = + + 用 {p,d} 表示 p 个成分 d 次多项式混料设计。试验点 ( x x 1 , , p ) 由 {p,d} 确定。 经试验所求回归方程可用,则可利用回归方程求出最大值点或最小值点、定值点等。需 要指出的是,以上回归方程中 ij i j b x x ,不能单纯理解为 i x 与 j x 的交互作用,它们只是表 示一种非线性混合的关系。Scheffe 认为,当 bij 0 时,这种非线性混合关系是协调的; 而当 bij 0 时,则是对抗的。 ijk i j k b x x x 也与 ij i j b x x 一样。 目前,混料设计的方法已有多种,除了前面提到的单纯形格子设计,单纯形重心设 计外、有下界约束的混料设计、轴设计、凸多面体设计、Cox 混料设计、混料均匀设计 等。本书只重点介绍单纯形格子设计和单纯形重心设计两种常用的设计方法。 第二节 单纯形格子设计与统计分析 单纯形格子设计(simplex lattice design)是混料设计中最先出现的、最基本的一种设 计方法。 {p,d} 单纯形格子设计,试验点 (x x 1 , , p ) 的选择是各成分 i x 在混料中所占百 分比 0 , i x i p = 1 2 , , , 1 , = 1,2, d d 结合 1 1 p i i x = = 确定所有试验点。 如{3,2}单纯形格子设计,试验点 ( 1 2 3 ) 1 , , 0, ,1 1,2,3 2 i x x x x i , = = , , 1 2 3 1 , 0 , 1,2,3 i x x x x i + + = = ≥ ,所以试验点是 ( )( )( ) 1 1 1 1 1 1 1,0,0 0,1,0 0,0,1 , ,0 ,0, 0, , 2 2 2 2 2 2 用图形表示
(0,0,1) x1+x2+5=1 (0,0,1) 丙十2+为=1 -X2 (0,1,0) (1,0,0) (0,1,0) 〔1,0,0) 图7-1单纯形格子设计试验点 图中三角形是x+x2+x=1,x,≥0,i=1,2,3的图形,黑心点表示试验点。图 中,3个顶点表示单一成分的混料,3条边上的点表示两种成分的混料,而三角形内的 点则表示三种成分的混料。 {P,{p,2{P,3}的试验点见表7-1~表7-3 表7-1p,1)单纯形格子设计表 试验号 x X2 … Xp 1 0 0 2… 0 0 0 0 1 表7-2{p,2;单纯形格子设计表 试验号 x X2 3 … Xp-1 子 1 1 0 0 0 0 2 0 0 0.… p 0 0 0 … 0 1 P+1 2 1-2 0 0 0 P+2 1-2 0 2 0 0 P+Ci 0 0 0 … 1-2 1 .178-
- 178 - 图 7-1 单纯形格子设计试验点 图中三角形是 1 2 3 1 0 1,2,3 i x x x x i + + = = , ≥ , 的图形,黑心点表示试验点。图 中,3 个顶点表示单一成分的混料,3 条边上的点表示两种成分的混料,而三角形内的 点则表示三种成分的混料。 p p p ,1 ,2 ,3 的试验点见表 7-1~表 7-3 表 7-1 {p ,1}单纯形格子设计表 试验号 1 x 2 x … p x 1 1 0 … 0 2 0 1 … 0 p 0 0 … 1 表 7-2 {p ,2}单纯形格子设计表 试验号 1 x 2 x 3 x … p−1 x p x 1 1 0 0 … 0 0 2 0 1 0 … 0 0 p 0 0 0 … 0 1 P+1 1 2 1 2 0 … 0 0 P+2 1 2 0 1 2 … 0 0 P+ 2 Cp 0 0 0 … 1 2 1 2
表7-3{p,3}单纯形格子设计表 试验号 X X2 X3 X … Xp-2 Xp-1 子 1 0 0 0 0 0 0 2 0 0 0 0 0 p 0 0 0 0 0 0 1 P+1 2 3 0 0 0 0 0 P+2 2 3 0 0 0 P43 0 0 0 0 P+4 0 0 0 1 2 3 3 1 p2 0 0 0 0 2-3 3 1 p2+1 3 0 0 0 0 p2+2 1-3 3 0 3 0 0 0 Pcp 0 1-3 1 0 0 3 3 下面用一实例来说明单纯形格子设计与试验结果的统计分析方法。 【例7-1】编制一个{3,2}单纯形格子设计的试验方案。 第一步,明确试验研究的目的,根据试验目的确定混料的各种成分(即试验因素)。 本例中混料成分的个数p=3。 第二步,按照专业知识的要求,根据各混料成分所占百分比的范围,确定出试验研 究范围内各成分百分比的最小值。用Z、Z2、Z,表示混料中3种成分的百分比,用a 42、4表示3种成分百分比的最小值。本设计就是要在条件 0≤4≤Z≤1,=1,2,3 Z+Z2+Z3=1 的限制下选择试验点进行试验。根据混料设计的特点,各混料成分百分比的最小值还应 满足条件 a<1 本例假设a1=0.3,42=0,43=0。 第三步,先从专业知识的角度确定需要估计的回归方程的次数d,然后依据混料成 分的个数p和回归方程的次数d山,选择适当的单纯形格子设计表。本例d=2。于是选 择{3,2}单纯形格子设计表,见表7-4。 表7-4{3,2}单纯形格子设计试验方案和试验结果 试验号 试验设计 试验方案 (处理) 女 古 X3 Z Z Z 试验指标 1 1 0 0 1 0 0 5.27 2 0 0 0.3 0.7 0 6.74 0 0 0.3 0 0.7 6.92 4 1/2 1/2 0 0.65 0.35 0 6.34 J 1/2 0 1/2 0.65 0 0.35 6.64 6 0 1/2 12 0.3 0.35 0.35 6.94 -179-
- 179 - 表 7-3 {p ,3}单纯形格子设计表 试验号 1 x 2 x 3 x 4 x … p −2 x p−1 x p x 1 1 0 0 0 … 0 0 0 2 0 1 0 0 … 0 0 0 p 0 0 0 0 … 0 0 1 P+1 3 1 3 2 0 0 … 0 0 0 P+2 3 2 3 1 0 0 … 0 0 0 P+3 3 1 0 3 2 0 … 0 0 0 P+4 3 2 0 3 1 0 … 0 0 0 P 2-1 0 0 0 0 … 0 3 1 3 2 P 2 0 0 0 0 … 0 3 2 3 1 P 2+1 3 1 3 1 3 1 0 … 0 0 0 P 2+2 3 1 3 1 0 3 1 … 0 0 0 P 2+ 3 p c 0 0 0 0 … 3 1 3 1 3 1 下面用一实例来说明单纯形格子设计与试验结果的统计分析方法。 【例 7-1】 编制一个{3,2}单纯形格子设计的试验方案。 第一步,明确试验研究的目的,根据试验目的确定混料的各种成分(即试验因素)。 本例中混料成分的个数 p = 3。 第二步,按照专业知识的要求,根据各混料成分所占百分比的范围,确定出试验研 究范围内各成分百分比的最小值。用 Z1 、Z2 、Z3 表示混料中 3 种成分的百分比,用 1 a 、 2 a 、 3 a 表示 3 种成分百分比的最小值。本设计就是要在条件 0≤ai≤Zi ≤1 , i=1,2,3 1 2 3 Z Z Z + + =1 的限制下选择试验点进行试验。根据混料设计的特点,各混料成分百分比的最小值还应 满足条件 1 1 = p i i a 本例假设 1 a = 0.3, 2 a = 0, 3 a = 0。 第三步,先从专业知识的角度确定需要估计的回归方程的次数 d,然后依据混料成 分的个数 p 和回归方程的次数 d,选择适当的单纯形格子设计表。本例 d = 2。于是选 择{3,2}单纯形格子设计表,见表 7-4。 表 7-4 {3,2}单纯形格子设计试验方案和试验结果 试验号 (处理) 试验设计 试验方案 试验指标 1 x 2 x 3 x Z1 Z2 Z3 1 1 0 0 1 0 0 5.27 2 0 1 0 0.3 0.7 0 6.74 3 0 0 1 0.3 0 0.7 6.92 4 1/2 1/2 0 0.65 0.35 0 6.34 5 1/2 0 1/2 0.65 0 0.35 6.64 6 0 1/2 1/2 0.3 0.35 0.35 6.94
第四步,确定各成分的实际百分比Z与编码值x之间的对应关系。其转换公式为 Z=(1->a)s +a j=l 将a=0.3,,=0,43=0代入,可得Z=0.7x1+0.3,Z=0.7x2,Z3=0.7x3 第五步,根据上式计算各试验点各成分的实际百分比,形成{3,2}单纯形格子设计 的试验方案,经试验得各点试验指标y,见表7-4。 第六步统计分析单纯形格子设计统计分析的主要内容是由试验结果计算回归方 程中的回归系数,从而得到确定的回归方程。 在单纯形格子设计中,回归方程的回归系数可以将表74试验点 (X,x2,x,y),i=1,…,6 分别代入回归方程求出,也可利用多元线性回归方程系数的求法,由试验点 (飞,x,x,X,X,xx,),i=1,…,6确定。本例的回归方程是 少=5.27x1+6.74x2+6.92x3+1.34x1x2+2.18x1x3+0.44x2x3(编码) (7-5) =5.27Z1+6.55Z2+6.29Z3+2.73ZZ2+4.45ZZ3+0.90Z2Z3 (实际)(7-6) 式(7-5)由编码试验点得出,式(7-6)由实际试验点得出。也可将灯=(21-0.3)/0.7, x2=z2/0.7,x3=23/0.7代入式(7-5)得 5.27(Z1-0.3),6.74226.92Z3 1.3432 0.71 ✉十 0.7 0.7 0.7 0.7 2.1833z (0.7 0.7 +044品 y2.26+7.53Z+8.81Z2+8.55Z3+2.73Z,Z2+4.45Z,乙3+0.9022Z3(实际) 方程(7-6)y的最大值是6.96,最大值点是 (Z1,Z2,Z3)=(0.34,0.15,0.51) 方程(7-5)y的最大值是6.96,最大值点(x,x2,x3)=(0.061,0.207,0.732)。由 Z=0.7x1+03,Z3=0.7x2,Z3=0.7x3变换成实际值是 (Z,Z2,Z3)=(0.70.061+0.3,0.7-0.207,0.7-0.732)=(0.34,0.15,0.51) 结论是:混料中的三种成分各占34%、15%、51%时,试验指标y最大,达到6.96。 y的等高线图7-2。 -180-
- 180 - 第四步,确定各成分的实际百分比 Zi 与编码值 i x 之间的对应关系。其转换公式为 1 (1 ) p i j i i j Z a x a = = − + 将 1 a = 0.3, 2 a = 0, 3 a = 0 代入,可得 Z1 = 0.7x1 + 0.3,Z2 = 0.7x2,Z3 = 0.7x3。 第五步,根据上式计算各试验点各成分的实际百分比,形成{3,2}单纯形格子设计 的试验方案,经试验得各点试验指标 y,见表 7-4。 第六步 统计分析 单纯形格子设计统计分析的主要内容是由试验结果计算回归方 程中的回归系数,从而得到确定的回归方程。 在单纯形格子设计中,回归方程的回归系数可以将表 7-4 试验点 ( x x x y i 1 2 3 i i i i , , , 1, ,6 ) , = 分别代入回归方程求出,也可利用多元线性回归方程系数的求法,由试验点 ( x x x x x x x x x y i 1 2 3 1 2 1 3 2 3 i i i i i i i i i i , , , , , , 1, ,6 ) , = 确定。本例的回归方程是: 1 2 3 1 2 1 3 2 3 y x x x x x x x x x ˆ = 5.27 +6.74 +6.92 +1.34 +2.18 +0.44 (编码) (7-5) 1 2 3 1 2 1 3 2 3 y = Z Z Z Z Z Z Z Z Z ˆ 5.27 + 6.55 + 6.29 + 2.73 + 4.45 + 0.90 (实际)(7-6) 式(7-5)由编码试验点得出,式(7-6)由实际试验点得出。也可将 x1=(z1- 0.3)/0.7, x2= z2 /0.7,x3= z3 /0.7 代入式(7-5)得 ( ) 1 2 1 2 3 1 3 2 3 y = + + ˆ -0.3 1.34 5.27 -0.3 6.74 6.92 0.7 + 0.7 0.7 0.7 0.7 -0.3 2.18 0.7 0.44 0.7 0.7 0.7 + + Z Z Z Z Z Z Z Z Z 1 2 3 1 2 1 3 2 3 y=-2.26+7.53 +8.81 +8.55 +2.73 ˆ Z Z Z ZZ +4.45 +0.90 ZZ ZZ (实际) 方程(7-6)y 的最大值是 6.96,最大值点是 (Z1, Z2, Z3)=(0.34,0.15 ,0.51) 方程(7-5)y 的最大值是 6.96,最大值点 ( x x x 1 2 3 , , 0.061,0.207,0.732 ) = ( ) 。由 Z1 = 0.7x1 + 0.3,Z2 = 0.7x2,Z3 = 0.7x3 变换成实际值是 (Z1, Z2, Z3)=(0.7·0.061 + 0.3,0.7·0.207,0.7·0.732)=(0.34,0.15,0.51) 结论是:混料中的三种成分各占 34%、15%、51%时,试验指标 y 最大,达到 6.96。 y 的等高线图 7-2