2.挑选因素 在明确试验目的和确定试验指标后,要分析研宄影响试验指标的因素,从所有的影响因 素中排除哪些影响不大,或者已经掌握的因素,让它们固定在某一状态上,挑选那些对试验 指标可能有较大影响的因素采进行考察。例如,在进行BOD模型的参数估计时,影响因素 有温度、菌种数、硝化作用及时间等,通常是把温度和菌种数控制在一定状态上,并排除硝 化作用的干扰,只通过考察BOD随时间的变化来估计参数。 3.选定试验设计方法 因素选定后,可根据研究对象的具体情况决定选用哪一种试验设计方法。例如,对于单 因素问题,应选用单因素试验设计法;三个以上因素的问题,可以用正交试验设计法;若要 进行模型筛选或确定已知模型的参数估计,可采用序贯实验设计法 4.实验安排 上述问题都解决后,便可以进行实验点位置安排,开展具体的实验工作 下面我们仅介绍单因素试验设计、双因素试验设计及正交试验设计法的部分基本方法, 原理部分可根据需要参阅有关书藉。 二、单因素试验设计 单因素试验设计方法有0618法(黄金分割法)、对分法、分数法、均分法、爬山法和抛 物线法等。前三种方法可以用较少的试验次数迅速找到最佳点,适用于一次只能出一个试验 结果的问题。对分法效果最好,每做一个实验就可以去掉试验范围的一半。分数法应用较广 因为它还可以应用于实验点只能取整数或某特定数的情况,以及限制试验次数和精确度的情 况。均分法适用于一次可以同时得出许多个试验结果的问题。爬山法适用于研究对象不适宜 或者不易大幅度调整的问题 下面介绍对分法、分数法和均分法 1.对分法 采用对分法时,首先要根据经验确定试验范围。设试验范围a~b之间,第一次试验点 安排在(a,b)的中点x[x=(a+b)/2)],若试验结果表明x取大了,则丢去大于x的一半 第二次试验点安排在(a,x)的中点x2x=(a+x)/2)]。如果第一次试验结果表明x取小了 便丢去小于x的一半,第二次试验点就取在(x,b)的中点。这个方法的优点是每做一次试 验便可以去掉一半,且取点方便。适用于预先已经了解所考察因素对指标的影响规律,能够 从一个试验的结果直接分析出该因素的值是取大了或取小了的情况 例如,确定消毒时加氯量的试验,可以采用对分法。 分数法 分数法又叫菲波那契数列法,它是利用菲波那契数列进行单因素优化试验设计的一种 方法。当实验点只能取整数,或者限制试验次数的情况下,采用分数法较好。例如,如果只 能做一次试验时,就在12处做,其精确度为1/2,即这一点与实际最佳点的最大可能距离 为1/2。如果只能做两次试验,第一次试验在2/3处做,第二次在1β3处做,其精确度为1/3.如 果能做三次试验,则第一次在3/5处做试验,第二次在25处做,第三次在165或45处做, 其精确度为1/5…,做几次试验就在试验范围内FFn处做,其精度为1/n+1。如表1所 表中的Fn及Fa叫“菲波那契数”,它们可由下列递推式确定: F。=F1=1,Fk=Fk+Fk2(k=2、3、4、…)
2.挑选因素 在明确试验目的和确定试验指标后,要分析研究影响试验指标的因素,从所有的影响因 素中排除哪些影响不大,或者已经掌握的因素,让它们固定在某一状态上,挑选那些对试验 指标可能有较大影响的因素采进行考察。例如,在进行 BOD 模型的参数估计时,影响因素 有温度、菌种数、硝化作用及时间等,通常是把温度和菌种数控制在一定状态上,并排除硝 化作用的干扰,只通过考察 BOD 随时间的变化来估计参数。 3.选定试验设计方法 因素选定后,可根据研究对象的具体情况决定选用哪一种试验设计方法。例如,对于单 因素问题,应选用单因素试验设计法;三个以上因素的问题,可以用正交试验设计法;若要 进行模型筛选或确定已知模型的参数估计,可采用序贯实验设计法。 4.实验安排 上述问题都解决后,便可以进行实验点位置安排,开展具体的实验工作。 下面我们仅介绍单因素试验设计、双因素试验设计及正交试验设计法的部分基本方法, 原理部分可根据需要参阅有关书藉。 二、单因素试验设计 单因素试验设计方法有 0.618 法(黄金分割法)、对分法、分数法、均分法、爬山法和抛 物线法等。前三种方法可以用较少的试验次数迅速找到最佳点,适用于一次只能出一个试验 结果的问题。对分法效果最好,每做一个实验就可以去掉试验范围的一半。分数法应用较广, 因为它还可以应用于实验点只能取整数或某特定数的情况,以及限制试验次数和精确度的情 况。均分法适用于一次可以同时得出许多个试验结果的问题。爬山法适用于研究对象不适宜 或者不易大幅度调整的问题。 下面介绍对分法、分数法和均分法。 1.对分法 采用对分法时,首先要根据经验确定试验范围。设试验范围 a~b 之间,第一次试验点 安排在(a,b)的中点 xl [ xl = (a+b)/2) ],若试验结果表明 xl 取大了,则丢去大于 xl 的一半, 第二次试验点安排在(a,xl )的中点 x2 [x 2= (a+ xl )/2) ]。如果第一次试验结果表明 x1 取小了, 便丢去小于 xl 的一半,第二次试验点就取在(xl ,b)的中点。这个方法的优点是每做一次试 验便可以去掉一半,且取点方便。适用于预先已经了解所考察因素对指标的影响规律,能够 从一个试验的结果直接分析出该因素的值是取大了或取小了的情况。 例如,确定消毒时加氯量的试验,可以采用对分法。 2.分数法 分数法又叫菲波那契数列法,它是利用菲波那契数列进行单因素优化试验设计的一种 方法。当实验点只能取整数,或者限制试验次数的情况下,采用分数法较好。例如,如果只 能做一次试验时,就在 1/2 处做,其精确度为 1/2,即这一点与实际最佳点的最大可能距离 为 1/2。如果只能做两次试验,第一次试验在 2/3 处做,第二次在 1/3 处做,其精确度为 1/3.如 果能做三次试验,则第一次在 3/5 处做试验,第二次在 2/5 处做,第三次在 1/5 或 4/5 处做, 其精确度为 1/5……,做几次试验就在试验范围内 Fn/Fn+1 处做,其精度为 1/F n+1。如表 1 所 示。 表中的 Fn 及 Fn+1 叫“菲波那契数”,它们可由下列递推式确定: Fo= Fl = 1,FK= FK-l+FK-2 (K=2、3、4、…)
由此得F2=F1+F。=2,F3=F2+F1=3,F4=F3+F2=5.,Fm1=Fa+Fn-1 表1分数法试验点位置与精确度 试次数23|45 等分试验范围的份数 第一次试验点的位置2/33/55/88/313/2121/34 精确度 /3//8n31/211/ 因此,表1第三行中各分数,从分数23开始,以后的每一分数,其分子都是前一分数的分 母,而其分母都是等于前一分数的分子与分母之和,照此方法不难写出所需要的第一次试验 点位置。 分数法各试验点的位置,可用下列公式求得: 第一个试验点=(大数-小数)xFn/Fn+1+小数 新试验点=(大数一中数)+小数 式中:中数一已试的试验点数值。 上述两式推导如下:首先由于第一个试验点x1取在试验范围内的FFn+1处,所以x与试验 范围左端点(小数)的距离等于试验范围总长度的Fn/Fn+倍,即: 第一试验点-小数=[大数(右端点)-小数]xFn/F 移项后,即得式(1) 又由于新试点(x2,x3,…)安排在余下范围内与已试点相对称的点上,因此,不仅新 试点到余下范围的中点的距离等于已试点到中点的距离,而且新试点到左端点的距离也等于 已试点到右端点的距离(图1)即: 新试点-左端点=右端点-已试点 移项后即得式(2)。 已试点 右端点 图1分数法试验点位置示意图 下面以一具体例子说明分数法的应用 某污水厂准备投加三氯化铁改善污泥的脱水性能,根据初步调查投药量在160mg/L以 下,要求通过四次试验确定出最佳投药量。具体计算方法如下 (1)根据式(1)可得到第一个试验点位置: (160-0)x5/8+0=100mg/L) (2)根据式(2)得到第二个试验点位置 (160-100)+0=60(mg/) (3)假定第一点比第二点好,所以在60-160之间找第三点,丢去600的一段,即 (160-100)+60=120(rng/L) 4)第三点与第一点结果一样,此时可用“对分法”进行第四次试验,即在(100+120) 2=100mg/L处进行试验得到的效果最好 3.均分法 当完成试验需要较长时间,或者测试一次要花很大代价,而每次同时测试几个样品和 测试一个样品所花的时间,人力或费用相近时,采用均分法较好。这种方法是每批试验均、 匀地安排在试验范围内。例如每批要做四个试验,我们可以先将试验范围(a,b)均分为五份
由此得 F2 = Fl +Fo=2,F3=F2+Fl=3,F4=F3+F2=5…,Fn+1= Fn+ Fn -1 … 因此,表 1 第三行中各分数,从分数 2/3 开始,以后的每一分数,其分子都是前一分数的分 母,而其分母都是等于前一分数的分子与分母之和,照此方法不难写出所需要的第一次试验 点位置。 分数法各试验点的位置,可用下列公式求得: 第一个试验点= (大数-小数)x Fn/Fn+1 + 小数 (1) 新试验点= (大数一中数) +小数 (2) 式中:中数一已试的试验点数值。 上述两式推导如下:首先由于第一个试验点 x1 取在试验范围内的 Fn/Fn+1 处,所以 x1 与试验 范围左端点(小数)的距离等于试验范围总长度的 Fn/Fn+1 倍,即 : 第一试验点 - 小数= [大数(右端点) - 小数]x Fn/Fn+1 移项后,即得式(1)。 又由于新试点 (x2,x3,…) 安排在余下范围内与已试点相对称的点上,因此,不仅新 试点到余下范围的中点的距离等于已试点到中点的距离,而且新试点到左端点的距离也等于 已试点到右端点的距离(图 1) 即: 新试点-左端点 = 右端点-已试点 移项后即得式(2)。 下面以一具体例子说明分数法的应用。 某污水厂准备投加三氯化铁改善污泥的脱水性能,根据初步调查投药量在 160mg/L 以 下,要求通过四次试验确定出最佳投药量。具体计算方法如下: (1) 根据式(1)可得到第一个试验点位置: (160 - 0)x 5/8 + 0 =100(mg/L) (2) 根据式(2)得到第二个试验点位置: (160-100) + 0 =60 (mg/L) (3) 假定第一点比第二点好,所以在 60—160 之间找第三点,丢去 60—0 的一段,即: (160 -100) +60 = 120 (rng/L) (4) 第三点与第一点结果一样,此时可用“对分法”进行第四次试验,即在(100+120) /2=100mg/L 处进行试验得到的效果最好。 3.均分法 当完成试验需要较长时间,或者测试一次要花很大代价,而每次同时测试几个样品和 测试一个样品所花的时间,人力或费用相近时,采用均分法较好。这种方法是每批试验均、 匀地安排在试验范围内。例如每批要做四个试验,我们可以先将试验范围(a,b)均分为五份
在其四个分点x:,xa,x,,x4处做四个试验,将四个试验样品同时进行测试分析,如果ⅹ, 好,则去掉小于x2和大于x4的部分,留下(x2,x4)范围。然后将留下部分再分成五份,在 未做过试验的四个分点上做试验,这样一直做下去,就能找到最佳点。 图2均分法示意图 均分法是一种古老的实验方法。优点是只需把试验放在等分点上,实验可以同时安排, 也可以一个接一个地安排;其缺点是实验次数较多,代价较大 双因素试验设计 对于双因素问题,往往采取把两个因素变成一个因素的办法(即降维法)来解决,也就是 先固定第一个因素,做第二个因素的试验,然后固定第二个因·素再做第一个因素的试验。 这里介绍两种双因素试验设计。 从好点出发法 这种方法是先把一个因素,例如x固定在试验范围内的某一点x,(o618点处或其他点 处),然后用单因素试验设计对另一因素y进行试验,得到最佳试验点A:(xx,y1),再把因 素y固定在好点y处,用单因素方法对因素x进行试验,得到最佳点A2(xc、y:)若x2<x:, 因为A2比A:好,可以去掉大于xl的部分,如果x∞x:,则去掉小于xl的部分。然后, 在剩下的试验范围内,再从好点A2出发,把x固定在x2处,对因素y进行试验,得到最 佳试验点A,(x:、y),于是再沿直线yyl把不包含A3的部分范围去掉,这样继续下去, 能较好地找到需要的最佳点(见图3)。这个方法的特点是对某一因素进行试验选择最佳点 时,另一个因素都是固定在上次实验结果的好点上(除第一次外)。 2.平行线法 如果双因素问题的两个因素中有一个因素不易改变时,宜采用平行线法。具体方法如下: 设因素y不易调整,我们就把y先固定在其试验范围的05(或0618)处,过该点做平 行于ox的直线,并用单因素方法找出另一因素x的最佳点A。再把因素y固定在0.25处, 用单因素法找出因素x的最佳点Az。比较A和A2,若八1和A2好,则沿直线y0.25将 下面的部分去掉,然后在剩下的范围内再用对分法找出因素y的第三点0.625,第三次试验 将因素y固定在0625处,用单因素法找出因素x的最佳点A3,若九比A3好,则也可将直 线y:0.625以上的部分去掉。这样一直做下去,就可以找到满意的结果(见图4)。 因素y 0.625 图3从好点出发法示意图 图4平行线法示意图 例如,混凝效果与棍凝剂的投加量、pH值、水流速度梯度三因素有关。根据经验分析, 主要的影响因素是投药量和pH值,因贮,可以根据经验把水流速度梯度固定在某一水平上 然后,用双因素试验设计法选择试验点进行试验
在其四个分点 x:,x。,x,,x4 处做四个试验,将四个试验样品同时进行测试分析,如果 x, 好,则去掉小于 x2 和大于 x4 的部分,留下(x2,x4)范围。然后将留下部分再分成五份,在 未做过试验的四个分点上做试验,这样一直做下去,就能找到最佳点。 均分法是一种古老的实验方法。优点是只需把试验放在等分点上,实验可以同时安排, 也可以一个接一个地安排;其缺点是实验次数较多,代价较大。 三、 双因素试验设计 对于双因素问题,往往采取把两个因素变成一个因素的办法(即降维法)来解决,也就是 先固定第一个因素,做第二个因素的试验,然后固定第二个因·素再做第一个因素的试验。 这里介绍两种双因素试验设计。 1.从好点出发法 这种方法是先把一个因素,例如 x 固定在试验范围内的某一点 x,(o.618 点处或其他点 处),然后用单因素试验设计对另一因素 y 进行试验,得到最佳试验点 A:(xx,y1),再把因 素 y 固定在好点 yl 处,用单因素方法对因素 x 进行试验,得到最佳点 A2(xc、y:)。若 x2<x:, 因为 A2 比 A:好,可以去掉大于 xl 的部分,如果 xc>x:,则·去掉小于 xl 的部分。然后, 在剩下的试验范围内,再从好点 A2 出发,把 x 固定在 x2 处,对因素 y 进行试验,得到最 佳试验点 A,(x:、yt),于是再沿直线 y’yl 把不包含 A3 的部分范围去掉,这样继续下去, 能较好地找到需要的最佳点(见图 3)。 这个方法的特点是对某一因素进行试验选择最佳点 时,另一个因素都是固定在上次实验结果的好点上(除第一次外)。 . 2.平行线法 如果双因素问题的两个因素中有一个因素不易改变时,宜采用平行线法。具体方法如下: 设因素 y 不易调整,我们就把 y 先固定在其试验范围的 0.5 ( 或 0.618)处,过该点做平 行于 ox 的直线,并用单因素方法找出另一因素 x 的最佳点 Al。再把因素 y 固定在 0.25 处, 用单因素法找出因素 x 的最佳点 Az。比较 Al 和 A2,若八 1 和 A2 好,则沿直线 y‘0.25 将 下面的部分去掉,然后在剩下的范围内再用对分法找出因素 y 的第三点 0.625,第三次试验 将因素 y 固定在 0.625 处,用单因素法找出因素 x 的最佳点 A3,若九比 A3 好,则也可将直 线 y:0.625 以上的部分去掉。这样一直做下去,就可以找到满意的结果(见图 4)。 例如,混凝效果与棍凝剂的投加量、pH 值、水流速度梯度三因素有关。根据经验分析, 主要的影响因素是投药量和 pH 值,因贮,可以根据经验把水流速度梯度固定在某一水平上, 然后,用双因素试验设计法选择试验点进行试验
四、正交试验设计 在生产和科学研究中遇到的问题,一般都是比较复杂的,包含多种因素,且各个因素又 有不同的状态,它们往往互相交织、错综复杂。要解决这类问题,常常需要做大量试验。例 如,某工业废水欲采用厌氧消化处理,经过分析研究后,决定考察三个因素(如温度、时间 负荷率),而每个因素又可能有三种不同的状态(如温度因素为25℃、30℃、35℃等三个水平), 它们之间可能有33:27种不同的组合,也就是说,要经过27次试验后才能知道那一种组合 最好。显然,这种全面进行试验的方法,非但费时费钱,有时甚至是不可能的。对于这样的 个问题,如果我们采用正交设计法安排试验,只要经过9次试验便能得到满意的结果。对 于多因素问题,采用正交试验设计可以达到事半功倍的效果,这是因为我们可以通过正交设 计合理地挑选和安排试验点,较好地解决多因素试验中的两个突出问题 (1)全面试验的次数与实际可行的试验次数之间的矛盾 (2)实际所做的少数试验与要求掌握的事物的内在规律之间的矛盾 正交试验设计法是一种研究多因素试验问题的数学方法,它主要是使用正交表这一工具 从所有可能的试验搭配中挑选出若干必需的试验,然后再用统计分析方法对试验结果进行综 合处理,得出结果。下面先介绍两个有关的概念 (1)水平;因素变化的各种状态叫因素的水平。某个因素在试验中需要考察它的几种状 态,就叫它是几水平的因素。因素在试验中所处状态(即水平)的变化,可能引起指标发生变 化。例如,在污泥厌氧消化试验时要考察三个因素:温度、泥龄和负荷率,温度因素选择为 25℃、30(2,3512三种状态,这里的25C、30C、35C就是温度因素的三个水平。 因素的水平有的能用数量表示(如温度),有的则不能用数量表示。例如,在采用不同混 凝剂进行水处理试验时,要研究哪种混凝剂较好,在这里各种混凝剂就表示混凝剂这个因素 的各个水平,不能用数量表示。凡是不能用数量表示水平的因素,。q做定性因素。在多因 素试验中,有时会遇到定性因素。对于定性因素,只要对每个水平规定具体含义,就可与定 量因素一样对待。 (2)正交表:用正交设计法安排试验都要用正交表。它是正交试验设计中合理安排试验, 以及对数据进行统计分析的工具。正交表都以统一形式的记号来表示。如L4(2)(图5),字 母L代表正交表LL右下脚的数字“4”表示正交表有4行,即要安排4次试验,括号内的指 数“3”表示表中有3列,即最多可以考察3个因素,括号的底数“2”表示表中每列有1、2两 种数据,即安排试验时,被考察的因素有两种水平1与2,称为1水平与2水平。如表2所 表2L4(2)正交表 试验号 如果被考察各因素的水平不同时,应采用混合型正交表,其表示方式略有不同。如L(4X 2),它表示有8行(即要做8次试验)5列即有5个因素),而括号内的第一项“4”表示被考察 的第一个因素是4水平,在正交表中位于第一列,这一列由1、2、3、4四种数字组成。括 号内第二项的指数“4”表示另外还有4个考察因素,底数“2”表示后4个因素是2水平,即后
四、正交试验设计 在生产和科学研究中遇到的问题,一般都是比较复杂的,包含多种因素,且各个因素又 有不同的状态,它们往往互相交织、错综复杂。要解决这类问题,常常需要做大量试验。例 如,某工业废水欲采用厌氧消化处理,经过分析研究后,决定考察三个因素(如温度、时间、 负荷率),而每个因素又可能有三种不同的状态(如温度因素为 25℃、30℃、35℃等三个水平), 它们之间可能有 33:27 种不同的组合,也就是说,要经过 27 次试验后才能知道那一种组合 最好。显然,这种全面进行试验的方法,非但费时费钱,有时甚至是不可能的。对于这样的 一个问题,如果我们采用正交设计法安排试验,只要经过 9 次试验便能得到满意的结果。对 于多因素问题,采用正交试验设计可以达到事半功倍的效果,这是因为我们可以通过正交设 计合理地挑选和安排试验点,较好地解决多因素试验中的两个突出问题: (1)全面试验的次数与实际可行的试验次数之间的矛盾。 (2)实际所做的少数试验与要求掌握的事物的内在规律之间的矛盾。 正交试验设计法是一种研究多因素试验问题的数学方法,它主要是使用正交表这一工具 从所有可能的试验搭配中挑选出若干必需的试验,然后再用统计分析方法对试验结果进行综 合处理,得出结果。下面先介绍两个有关的概念; (1)水平;因素变化的各种状态叫因素的水平。某个因素在试验中需要考察它的几种状 态,就叫它是几水平的因素。因素在试验中所处状态(即水平)的变化,可能引起指标发生变 化。例如,在污泥厌氧消化试验时要考察三个因素;温度、泥龄和负荷率,温度因素选择为 25℃、30'(2,3512 三种状态,这里的 25'C、30'C、35'C 就是温度因素的三个水平。 因素的水平有的能用数量表示(如温度),有的则不能用数量表示。例如,在采用不同混 凝剂进行水处理试验时,要研究哪种混凝剂较好,在这里各种混凝剂就表示混凝剂这个因素 的各个水平,不能用数量表示。凡是不能用数量表示水平的因素,。q 做定性因素。在多因 素试验中,有时会遇到定性因素。对于定性因素,只要对每个水平规定具体含义,就可与定 量因素一样对待。 (2)正交表:用正交设计法安排试验都要用正交表。它是正交试验设计中合理安排试验, 以及对数据进行统计分析的工具。正交表都以统一形式的记号来表示。如 L4(23 ) (图 5),字 母 L 代表正交表 L,L 右下脚的数字“4”表示正交表有 4 行,即要安排 4 次试验,括号内的指 数“3”表示表中有 3 列,即最多可以考察 3 个因素,括号的底数“2”表示表中每列有 1、2 两 种数据,即安排试验时,被考察的因素有两种水平 1 与 2,称为 1 水平与 2 水平。如表 2 所 示。 如果被考察各因素的水平不同时,应采用混合型正交表,其表示方式略有不同。如 L8 (4X 2 4 ),它表示有 8 行(即要做 8 次试验)5 列(即有 5 个因素),而括号内的第一项“4”表示被考察 的第一个因素是 4 水平,在正交表中位于第一列,这一列由 1、2、3、4 四种数字组成。括 号内第二项的指数“4”表示另外还有 4 个考察因素,底数“2”表示后 4 个因素是 2 水平,即后