图1-3惠斯通电桥 13基本原理 如果例1.1至例1.4所描述的那样的一种实验要最有效地实 行的话,则必须用科学方法来设计实验。所谓实验的统计设计,就 是设计实验的过程,使得收集得的数据适合于用统计方法分析,得 出有效的和客观的结论。如果想从数据作出有意义的结论,用统 计方法作实验设计是必要的。当问题涉及到受实验误差影响的数 据时,只有统计方法才是客观的分析方法。这样一来,任一实验 问题就存在两个方面:实验的设计和数据的统计分析。这两个课 题是紧密相连的,因为分析方法直接依赖于所用的设计。这两个 课题在本书中随处可见。 实验设计的三个基本原理是重复,随机化,以及区组化。所 谓重复,意思是基本实验的重复进行。在1.1节所讨论的冶炼试 验中,重复是由用油淬处理一块样品和用咸水淬处理一块样品所 组成。这样,当在每种淬火介质中处理了五块样品时,我们就说 8
作了五次重复。重复有两条重要的性质。第一,允许实验者得到 实验误差的一个估计量。这个误差的估计量成为确定数据的观察 差是否是统计上的实际差的基本度量单位。第二,如果样本均值 (表示为y)用作为实验中一个因素的效应的估计量,则重复允许 实验者求得这一效应的更为精确的估计量。例如:如果a2是数据 的方差,而有n次重复,则样本均值的方差是 这一点的实际含义是,如果有n=1次重复并观察得y1=145(油 淬)和y2=147(咸水淬),我们可能不能作出关于淬火介质的效 应的满意的推断也就是说,观察差可能是实验误差的结果。另 方面,如果n合理的大,实验误差足够小,则当我们观察得y1 y2时,我们就有相当可靠的结论:对这种特殊的铝合金,咸水 淬比油淬产生更高的硬度。 随机化是实验设计使用统计方法的基石。所谓随机化,我们 的意思是,实验材料的分配和实验的各个试验进行的次序,都是 随机地确定的。统计方法要求观察值(或误差)是独立分布的随 机变量。随机化通常能使这一假定有效。把实验进行适当的随机 化亦有助于“平均出”可能出现的外来因素的效应。例如,设上 述实验的样品,其厚度稍有差异,而淬火介质的效应可能会受样 品厚度的影响。如果所有经受油淬的样品都厚于经受咸水淬的样 ,则我们不断地将一种淬火介质置于不利的地位。给淬火介质 随机地分派样品就会缓解这种问题。 区组化是用来提高试验的精确度的一种方法。一个区组就是 试验材料的一个部分,相比于试验材料全体它们本身的性质应该 更为类似。区组化牵涉到在每个区组内部对感兴趣的实验条件进 行比较。区组化原则的简单例子请看第2章的2.5.1节 实验设计的这些基本原理是每个实验的重要部分。通贯本书 我们将反复地解释并强调这些基本原理
14设计实验指南 在设计和分析一个实验时要使用统计方法的话,和实验有关 的每个人必须预先对所研究的问题究竟是什么,如何收集数据,要 有清晰的认识,至少对如何分析这些数据要有定性的了解。推荐 的步骤概要如下: 1·问题的识别和问题的提法。这一点看起来似乎是明白不过 的,但是在实践中,确认存在需要实验的问题却不是那么简单的, 将问题摆明并变为都可接受的提法也不是那么简单的。须要弄清 有关实验的目的的全部想法。通常,重要的是吸引所有有关人员 的参与,其中包括:工程,质量保证,制造,市场营销,经营,顾 客,以及操作人员(通常,他们有很多看法,却常常被忽略了)。 清晰的问题提法对更好地理解现象和最终求得问题的解答有重大 的帮助。 2.因素和水平的选择。实验者必须选择在实验中准备来变化 的因素,这些因素变化的范围,以及在做实验时对这些因素规定 的水平。还必须考虑如何将这些因素控制在所希望的数值上以及 如何测量这些数值。例如,在浸流焊接试验中,工程师曾经确定 了12个可能影响出现焊接次品的变量。工程师还必须确定每个变 量感兴趣的范围(也就是,每个因素准备来变化的范围)以及每 个变量使用多少个水平。要做到这一点,需要工序知识。这种工 序知识通常是实践经验和理论理解的结合。重要的是,调查研究 所有可能是重要的因素,而不受过去经验的过分影响;特别是在 实验的早期阶段或工序尚未很成熟时。当目的是因素筛选或过程 特征化时,通常最好是保持低的因素水平数(最经常的是用两个 水平)。 3.响应变量的选择。在选择响应变量时,实验者应该确信这 个变量真正会对所研究的过程提供有用的信息。最经常的,是 10·
取测量特性的平均值或标准差(或两者)为响应变量。多重响应 不常用。仪表性能(或测量误差)也是一个重要因素。如果仪表 性能差,则只有相对大的因素效应才能通过实验检测出来,或者 需要做附加的重复实验。 1.实验的设计的选择。如果头三个步骤正确做到了,这一步 相对容易。选择设计涉及考虑样本量(重复次数),对实验选择合 适的试验次序,确定是否划分区组或是否涉及其他随机化约束。本 书讨论一些较重要的实验设计类型,它们可作为对广泛的各种问 题选择合适的实验设计的目录来利用。 在选择设计时,重要的是,思想上总要想着实验的目的。在 很多工程实验中,我们一开始就知道,有些因素水平会使响应得 出不同的数值。因此,我们感兴趣于识别哪些因素引起这种差异 并估计响应改变量的大小。在有的情况中,我们会更感兴趣于验 证一致性。例如,比较两种生产条件A和B,A是标准的,B是 成本较低的。则实验者感兴趣于弄清,比方说,两种生产条件的 产率是否没有差异 5·进行实验。当进行实验时,谨慎监视实验的过程以确保每 件事情都按计划做完是非常重要的。这个阶段中实验方法的错误 通常会破坏实验的有效性。计划在先是成功的关键。在复杂的制 造过程或研究开发环境中实施已设计好的实验,在逻辑方面和计 划方面都容易被低估。 6·数据分析。分析数据应该用统计方法,使得结果和结论都 是客观的,而不是主观憶断。如果实验是正确设计了,并且按设 计实行了,则所需的统计方法不必去费心制备。有很多精美的软 件包可用来分析数据,在数据的解释中,简单的图解法起了重要 的作用。残差分析和模型适合性检测也是重要的分析方法 统计方法不能证明一个因素(或几个因素)有特殊的效应。它 们仅对实验结果的可靠性和有效性提供准则。从本质上说来,应 用统计方法不允许利用实验来证明任何事情,但是,统计方法允
许我们去度量结论中可能出现的误差或者对一个命题附加上置信 水平。统计方法的基本优点是它对作出判决的过程加进了客观性。 统计方法和好的工程知识或工序知识以及常识结合在一起通常会 导至正确的结论。 7·结论和建议。一旦数据分析过了,实验者必须写出有关实 验结果的实践结论并推荐行动的路线。在这一阶段,图解法常常 是有用的,特别是给其他人介绍成果时更是如此。还需进行跟踪 试验与确认试验以证实实验所得结论的正确性 通贯整个过程,重要的是在思想上牢记实验是学习过程的 个重要部分,在学习过程中,我们暂时提出了关于系统的假设,进 行实验来研究这些假设根据实验的结果又提出新的假设,如此等 等这表明,实验是叠代式地逐步深化的。通常的一种主要的错误 是在研究一开始,就去设计一个单一的、庞大的、内容广泛的实验。 个成功的实验需要重要因素的知识这些因素可能变化的整个 范围,使用合适的水平个数,以及对这些变量的合适的度量单位 般说来,我们不能完全知道这些问题的答案,但是,我们要不断 加深对它们的认识。当一个实验规划进行时,我们经常会抛弃一些 不重要的变量,而加进一些其他变量,改变了某些因素的研究范 围,或者加进了新的响应变量。因此我们通常序贯地进行试验,作 为一般法则,在第一次试验中,投入的可用资源不要超过约百分之 25。这会确保有足够的资源用来进行确认试验并最终完成实验的 最后目的。 15历史的回顾 Ronald A. Fisher爵士是一位在实验设计中应用统计方法的 创新者。多年来,他在英国伦敦的 Rothamsted农业实验站担负起 统计和数据分析的任务。 Fisher开发了并首先应用了方差分析作 为实验设计中的统计分析的基本方法。于1933年, Fisher在伦敦 ·12·