大学取得了教授职位。随后,他在剑桥大学任教并成为世界上很 多所大学的客座教授。关于 Fisher的一篇杰出的传记,见J.F Box(1978). Fisher显然是一位开拓者,与此同时,有很多另外 的对实验设计的文献有显著贡献的研究者,包括F. Yates,R.C Bose,O. Kempthorne,W.G. Cochran,以及G.E.P.Box。 本书末尾的文献包含有这些作者的许多著作。 在早期,实验设计方法多数用于农业和生物科学,因此,这 领域的许多专门名词的引入与此有关。首先在工业上应用实验 设计是开始于二十世纪30年代,起始于英国的纺织工业和毛纺工 业。第二次世界大战之后,在美国和西欧的化工工业中引进了实 验设计方法。这些工业集团将实验设计用于产品开发和工序开发 仍然是十分富于创造性的领域。其后,半导体工业和电子工业也 使用了实验设计方法,多年来取得了显著的成功。 近年来,在美国对实验设计的兴趣又重新流行起来,因为很 多工业界发现,他们的海外竞争者已经应用设计的实验许多年,并 且这是他们竞争成功的一个重要的因素。所有的工程师接受实验 设计的正规训练作为他们大学教育的一部分的日子已为期不远了 (但愿尽早来临)。实验设计在工程专业上的成功积累是美国工业 基础未来竞争的关键因素。 1.6在实验方法中用统计方法 在工程、科学和工业中大多的研究工作都是以经验为根据的, 并且广泛使用实验方法。统计方法大大提高了这些实验的效率并 经常强化了由此得出的结论。在实验方法中要明智的使用统计方 法就要求实验者在思想上牢记下列各点 1.利用你对问题的非统计知识。实验者在他们自己的领域内 通常有高深的知识。例如,一位在水文学问题方面工作的土木工 程师有独到的实践经验和在这一领域内的正规的科学训练。在某 ·13·
些领域,有一大堆物理学的理论,是用来论述说明因素和响应之 间的关系的。这类非统计学的知识,在选择因素,确定因素水平, 决定进行多少次重复,解释分析的结果等等方面是极有价值的;这 里,统计学是无法替代的 2.使设计和分析尽可能的简单。别过份热心于使用复杂的, 过于精致的统计方法。相对简单的设计和分析方法几乎总是最好 的。此处是重新强调1.4节中推荐的方法的步骤4的好地方。如 果你谨慎地正确地作出设计,分析方法相对说来几乎总是直截了 当的。但是,如果你马虎地很差地作出设计,即使是用最复杂的 和精巧的统计方法,也是不可能挽救的。 3.识别实际的显著性和统计的显著性之间的差别。仅仅因为 两种试验条件产生统计上不同的平均响应,还不能保证这一差别 大得足以有实际价值。例如,一位工程师可以确定一种汽车燃料 喷射系统的修正方法能够改进汽车汽油行驶的里程数,平均为 0.1英里/加仑。这是一个在统计学上有意义的结果。但是,如果 修正方法耗费1000美元,则0.1英里/加仑的差别可能是太小了 以至于没有任何实际的价值。 4.实验通常是序贯叠代的。在大多数情况中,在研究的开始 阶段,设计内容太广泛的实验是不明智的。成功的设计需要重要 因素的知识,这些因素变化的范围,每个因素合适的水平个数,以 及对每个因素和响应的合适的度量单位。一般说来,我们在实验 之初不能完满地回答这些问题,而是在前进过程中,不断深化对 问题的认识。这就表明,前面讨论过的逐步深化方法或序贯方法 的优越性。当然,也存在完全适用内容广泛的实验的情况,但是 作为一般的法则,大多数的实验应该是序贯的。因此,在初始设 计中,投入的实验资源(试验数,预算,时间,等等),通常不应 该大于25%。第一次的努力只是在于取得经验,而一些资源必须 用来完成实验的最终目的。 14·
简单比较实验 本章,考虑比较两种条件(有时称为处理)的实验。这些实 验常称之为筍单比较实验。我们从一个例子开始,这个实验是要 确定两种不同的产品配方是否会得出相同的结果。我们的讨论,要 求熟识很多基本的统计概念,例如随机变量,概率分布,随机样 本,抽样分布,以及假设检验等等。 2.1引言 硅酸盐水泥砂浆的抗折强度(又称粘合强度)是该产品的重 要特性。比较改良砂浆与未改良砂浆的强度,是工程师所感兴趣 的。这里所说的改良砂浆是在水泥砂浆的配方中加进了聚合乳胶 液。实验者收集了改良配方强度的10个观察值和未改良配方强度 的10个观察值。这些数据列于表2-1。我们把这两种不同的配方 叫做两种处理或者叫做因素配方的两个水平 实验的数据可用点来表示,如图2-1。这种显示方式称之为点 图。目测这些数据得到的直接印象是,未改良砂浆的强度大于改 良砂浆的强度。改良砂浆的平均抗折强度为y1=16.76kgf/cm2, 未改良砂浆的平均抗折强度为y2=17.92kgf/cm2,这两个数据证 15·
实了上述印象是对的。这两个样本的平均抗折强度之间的差似乎 并非微不足道。然而,这并不表明这一差大得足以证明那两个配 方确实是不同的。也许是所观察得的平均强度的差别是由于抽样 的起伏而产生的,而这两个配方实际上却是相同的。另外两个样 本也许会得出改良砂浆的强度超过未改良配方的强度这样的相反 结论 表2- 硅酸盐水泥配方的抗折强度数据 改良砂浆 未改良砂浆 2 16.85 17.50 16.40 17.63 17.21 18.25 16.35 l8.00 16.52 17.75 18.22 16.59 17.96 10 16.57 =改良砂浆 o=未改良砂浆 18 强度(kgf =16.76 ya =1792 图21表21中抗折强度数据的点图
个称为假设检验(有人喜欢叫做显著性检验)的统计推断 方法可用来帮助去比较这两种配方的实验者。假设检验允许在客 观的条件下来比较两种配方,同时意识到存在得出错误结论的风 险。为了提出简单比较实验中所用的假设检验方法,首先需要回 顾并拓广一些基本的统计概念 22基本统计概念 上述硅酸盐水泥实验中的每一次观察,叫做一次试验。各次 试验是有差别的,所以在试验结果中存在起伏,又叫做噪音。这 种噪音通常叫做实验误差或就叫误差。这是一种统计误差·是由 于不可控制的变异而引起的,通常是不可避免的。误差或噪音的 出现意味着相应的变量,即粘合强度,是一随机变量。随机变量 可以是离散型的或连续型的。如果随机变量所可能取值的集合是 有限的或可数无限的,则此随机变量是离散型的,如果随机变量 所可能取值的集合是一个区间,则此随机变量是连续型的 变异性的图示法我们常用简单的图示法来辅助分析实验所 得的数据。如图2-1所示的点图,是用来显示一组小样本数据( 般说,大约20个观察值)的一种很有用的方法。这种点图能使实 验者快速地看出观察值的一般位置或中心趋势及其分散程度。例 如,在硅酸盐水泥实验中,点图显示出两种配方在平均强度上可 能有差别,但两种配方所得的强度变异性则大体上是相同的。 如果数据比较多,则点图中的点就会难于区分,此时就不如 采用直方图了。图2-2表示200个观察值的直方图,这些观察值是 在一个冶炼过程中回收金属所得到的。这一直方图表示出这组数 据的中心趋势、分散程度及其分布的一般形状。直方图是这样构 成的:在水平轴上划分为若干个区间(通常是等长的),在第j个 区间上画一个矩形,使矩形的面积与n,成正比,n是观察值中落 入第j个区间中的数值的个数。 17