气味、光泽等)不是具体数值,…-般要定量化后再进行计算和数据处理。 试验考察指标可以是…一个,也可以是几个,前者称为单考察指标试验设计,后者称为多考 察指标试验设计 2.试验因素 对试验考察指标产生影响的原因或要素称为试验因素。 例如在合金钢40r的淬火试验中淬火硬度与淬火温度(如770、800、850()和冷却方式 如水冷、油冷、空冷)有关。其中淬火温度和冷却方式是试验因素,而淬火硬度是试验考察指 标。 除上述的试验因素外,在试验过程中由于测量、仪器和环境条件等影响,也会影啊到试验 考察指标,称这类因素为误差因素。因素一般用大写字母A、B、C、…来标记 3.因素水平 试验因素在试验中所处的状态、条件的变化可能会引起试验指标的变化,我们把国素变化 的各种状态和条件称为因素的水平。在试验中需要考虑某因素的儿种状态时,则称该因素为几 水平因素。如上例40Cr的淬火试验中,淬火温度为770、800、850℃=种状态,则淬火温度这个 试验因素为三水平因素因素的水应是能够直接被控制的,并且水平的变化能直接影响试验 考察指标有不同程度的变化。术平通常用数字1、23…表示。 1.3.2常用统计量 1.极差 极差是一组数据中的最大值与最小值之差,其计算公式为 R 极差表示一组数据的最大离散程度,它是统计量最简单的一个特征参数,在试验设计中 会经常用到 2.一组数据之和与平均值 在试验设计和数据处理中,设有几个观察值x1x2,…xn我们称之为组数据。这组数据 之和与平均值分别为 71y 3.偏差 偏差也称为高差。偏差在数理统计中一股有两种,一种是与期望值p之间的偏差,另一种 是与平均值κ之间的偏差。在试验设计和数招处理中往往不知道期望值p,而很容易知道平均 值α所以常常把与平均值x之间的偏差作统计量进一步分析研究 设有n个观察值x1,x2,…,x则把每个观察值x(i=1,2,…,n)与平均值x的差值称为 与平均值之间的偏差简称为偏差 很显然,与平均值x之间的偏差的总和为零,即
(x,-x)=0(i=1.2 (1-4) 4.隔T方和与自由度 由式(1-4)可知.一组数据与其均值的各个偏差值有正、负或零,因此各偏差值的总和 为岑听以偏差和不能長明这组数据的任何特征。如果消除掉各个偏差正、负的影响,即以偏差 平方和作为这组数据的一个统计量,则偏差平方和能够衣征这组数据的分散程度,常以S表 设有n个观察值xx2…,xn其平均值为x,则偏差平方和为 S2-(x1-x)2+(x2-x)2-…4(x.-x)2=△(x2-x)2(i=1,2,…n)(1-5) 关」目由度的问勘可以通过下例来说明。 例如有4个数据3、4、6、7由于它们之间有个关系式 3+4+6+ 数学上称这4个效据中只有4-1(此处“1”指一个关系式)个对其平均值是独立的,也就是说, i:述个数据的均值已知为5,且其中3个数据也已知分别为3,4.6,那未第四个数据7就 叮由该关系式所确定这说明第四个数据7受其它3个独立的数据听束约。自巾度是独立数据 的个数,所以该例中的自由度/=41=3。若有n个观察值,与平均值x的偏差平方和的自由 度为n-1个 方与j均方 方也称T均偏差平方和,它表示单位自由度的偏差大小,即偏差平方和S2与自由度f 比值W.即是方差 均方也称标准偏差。由方差v的计算式(17)可知方差v的量纲为观家数据x的量 纲的半方为了与原特性值的量纲相一致.可采用方差V的平方根√V作为一组数据离散程 度的特征参数,即 (t-1.2
2样本及其分布 在生产和科学实验中,会碰到大量的数据如何从这些杂乱无章的数据中,取出有用的情 报,帮助解决问题,用于指导生产,为此,需要对数据进行处理, 数据处理在数理统计中就是通过随机变量的部分观察值来推断随机变量的特性,例如 分布规律和数字特征等。数理统计是具有广泛应用的一个数学分支,它以概率论为理论基础, 根据试验或观察得到的数据,对研究对象的客观规律作出合理的估计与判断 2.1总体与样本 2.11总体 在数理统计中,人们所研究对象的全体称为总体,而组成总体的每个单元称为个体。任何 总体的某项指标,是按一定的规律分布的,因而是一个随机变量,常用大写字母X、Y、Z等表 示。例如,一批灯泡,以其使用寿命指标来衡量它的质量,若规定寿命低于1000h者为次品,要 求确定这批灯泡的次品率。显然这个问题可以归结为求灯泡寿命X这个随机变量的分布函数 F(x),若已求得F(x),则P{X<1000}=F(1000)就是所求的次品率。如果把每只灯泡的寿命 都测出来,问题就得到了圆满的解决,但由于寿命试验是破坏性的,旦获得全部的试验结果, 这批灯泡的灯丝就全部烧断了。因此,是不现实的 再如有一批晶体管,共10万只,若想了解它的某个指标(如直流放大系数),由于测试不会 损坏合格的晶体管,所以最理想的办法是逐一测试。然而限于人力物力和时间,也不可能逐 测试。因此只能取总体的部分来进行试验或测试然后根据这些试验数据推断总体的指 标 总体的类型随研究的问题而定。它所包含的个体数可以是有限的也可以是无限的,例如, 研充某厂某天生产的某种灯泡的次品率,总体是有限的,其个体数就是该天生产的这种灯泡的 总数。但为研究方便仍以研究灯泡的寿命X的分布为例我们常把相同条件下所生产的这种 灯泡的寿命全体,看成个总体。显然,它是一个无限总体,因而灯泡寿命X是一个连续型随 机变量。 21.2样本 从总体ⅹ中随机抽取若干个体观察其某种数量指标的取值过程,称为抽样。从总体中抽 取一个个体以作观繁或试验,这个抽出的个体在未观察前它可能取某个值,也可能取另一个 值因此,它也是一个随机变量,常用带下标的大写字母X、Y.等表示。 从一个总体中随机地抽取n个个体X1,X2,…,X,这样取得的(X1,X2…,X)称为总体 X的一个样本样本中个体的数目称为样本容量。对于样本来说,一次抽取、观察的结果是n个 具体的数据x1,x2…,x,称为样本(X1,X2,…,X)的一个观察值,简称样本观察值。而样本观 繁值的所有可能取值的全体称为样本空间
为了使抽取的样本能反映总体的性质要求抽样是完全随机的和独立的,并且每抽取一个 个体后总体的成分不变,每次抽样的观察值互不影响还要求X,(i=1,2,…,n)必须与总体有 相同的分布函数F(x)。这样的抽样方法称为简单随机抽样。 如果一个样本中每个个体X都与总体X有相同的分布且相互独立,则称这个样本为简 单样本。 综上所述,我们给出如下定义 设X为具有分布函数F(x)的随机变量,若Xt,X2,…,X.为具有相同分布函数F(x)的相 互独立的随机变量则称(X1,X2,…,X,)为来自总体X的容量为n的简单随机样本,简称样 本。它们的观察值x1,x2,…,x.又称为X的n个独立的观察值 2.2样本分布西数与统计量 2.2.1样本分布函数 实际应用中总体的分布函数F(x)往往是未知的,数理统计的任务之一就是由样本的特 性来推断总体的分布。由概率论知,若(X1X2;…X,)为来自总体X的一个样本,则x1,X2, Xn的联合分布函数为 (2-1) 又若X具有概率密度f(x),则X1,X2,…,X.具有联合概率密度 前皕已提到,简单随机样本能很好地反映总体的情况,为了推断总体的分布,这里给出样 本分布函数的定义 设总体X的n个独立的观察值按大小次序排列成 若x≤r<x一,则不大于x的观察值的频率为k/n因而函数 F,(x)= x≤x<x+-1 (2-3) 等于在n次重复独立试验中事件{X≤x}的频率。称之为样本分布函数或经验分布函数。 按经验分布函数的定义,容量为n的简单样本(X2,X2,…,X)的经验分布函数F(x)可 能取的值为0,1,…,,…, “Fn(x)=”表示服从总体分布F(x)的随机变量X取 小于x值这一事件在n次重复独立试验中恰好出现k次,也就是说在这n次试验中,事件{X ≤x)的频率为k,所以按贝努利大数定理,对一个任意的正数,有 limPilF(x-F()2e)=0 在y面上作出y=F(x)及y=F(x)的图形C及C,,如图2-1所示,该等式表明:对任意给 定的正数ε,在横坐标上任意指定值r处.只要n足够大,C与C上点的纵坐标之差的绝对值
不小于E的概率就能小于任意给定的正数。即,当n足够大时,C,的图形在不等式 F(x)-E<y<F(r)+E 所定的带状区域以外的概率可以小于任意的正数。因此当n很大时,样本分布函数F(x)将近 似地等于总体分布函数 图21样本分布函数 还可以进一步证明下列格利文科定理 当→∞时,F(x)依概率1关于x均匀地收敛于F(x),即 P{ lim max|F.()-F(x)|=0}=1 这就是我们用样本推断总体的依据 2.2.2统计量 对于给定的一个样本的实现x1…2…,x,可以计算它的数字特征,并冠以样本两字,以示 与总体数字特征的区别。如.样本k阶原点矩为 2S x2、k=1.2 样本k阶中心矩为 (x,x),k=1,2 样本平均值为 样本方差为 2= (x,-x)2 (2·7) s2的正平方根s称为样本标准离差 x:·n 分別为下列随机变量的观察值: X 8