服从卡方分布。 由2-8式可知,样本方差可写为 (2-16) 如果样本的观察值是NID(p,a2)的,则S2的分布是[a2/(n 1)]x1。于是,如果总体是正态分布的,则样本方差的抽样分布 是卡方分布的常数倍 k-5 图2-6几个卡方分布 若x与X独立,分别是标准正态与卡方的随机变量,则随机 变量 (2-17) √X/ 服从自由度为k的t分布,记为t。t的密度函数是 f(t)I(+1)/2 √kπP(k/2)[(t2/k)+1]*+1)12 (2-18)
当k>2时,t的均值和方差分别是x=0与a2=k/(k-2)。几个 t分布如图2-7所示。若k=∞,则t分布变为标准正态分布。t分 布的百分位数表在附录的表I中给出。若y2,y,…,y是来自 N(p,a2)分布的一个随机样本,则量 2-19) 是自由度为n-1的t分布 k==(正态 图27几个分布 我们要考虑的最后的一个抽样分布是F分布。若X与x2是 两个独立的卡方随机变量,其自由度分别为u与v,则比值 X2/u X2/ v (2-20) 服从分子自由度为a,分母自由度为v的F分布。F的概率密度是 /2 F h(F) F+1 (2-21) 29
两个F分布如图2-8所示。这一分布在实验设计的统计分析中是 十分重要的。F分布的百分位数表在附录的表Ⅳ中给出 10.=5 图 两个F分布 作为一个分布为F的统计量的例子,考虑两个具有共同方差 的独立的正态总体。若y1,y2,…,y1n,是第一个总体的n1个 观察值的随机样本,y2:yz,…,y2,是第二个总体的n2个观察 值的随机样本,则 (2-22) 其中S与S2是两个样本方差这一结果直接由2-15式与2-20式 得出。 24关于均值差的推断,随机化设计 现在,我们准备回到2-1节中提出的硅酸盐水泥砂浆问题上 来。在那里,研究过两个不同的砂浆配方的抗折强度是否有所差 别的问题。在本节中,我们讨论如何利用比较两个处理均值的假 设检验和置信区间方法来分析简单比较实验的数据。 30
通贯本节,我们假定用一个完全随机化的实验设计。在这类 设计中,数据都看作为来自正态分布的一个随机样本。 2.4.1假设检验 个统计假设是一个关于概率分布的参数的命题。例如,在 硅酸盐水泥试验中,我们可以设想,两种砂浆配方的平均粘合强 度是相等的。这一点可以在形式上陈述为 Ho :uI=p H1:p1≠p 其中m是改良砂浆的平均粘合强度,P2是未改良砂浆的平均粘合 强度。命题H0:A=p2称为零假设,命题H1:A≠称为备择 假设。此处所说的备择假设称为双边备择假设,因为既当<P2 时亦当p>P2时命题为真。 为了检验假设,我们取一个随机样本,设计一个程序来计算 个恰当的检验统计量,然后否定或者肯定零假设H1。程序的 部分是用来找出检验统计量的一个导至否定H的数值集合。这 数值集合叫做检验的否定区域。 检验假设时涉及两类错误。如果零假设为真时被否定了,则 产生第I类错误。如果零假设是错误的却未被否定,则出现第 类错误。这两类错误的概率用特定的符号表示为: a=P(第I类错误)=P(否定H|Il为真) B=P(第Ⅱ类错误)=P(未否定HlH为伪) 有时,用检验的功效来操作更为方便,其中 功效=1-B=P(否定HH0为伪) 假设检验的一般程序是规定第I类错误的概率值a,通常叫做检 验的显著性水平,然后设计检验程序,使第』类错误的概率B县 有适当小的值 设想我们能假设两种砂浆配方的抗折强度的方差是相同的 则在完全随机化设计中用于比较两个处理均值的一个恰当的检验 ·31·
统计量是 (2-23) 其中y1与y2是样本均值,n1与n2是样本量,S2是公共方差G= a2=a2的一个估计量,计算式为 (n1-1)S+(n2-1)S2 (2-24) S与S2是两个总体各自的样本方差。为了决定是否否定H。:= p2,我们将to与自由度为n1+n-2的t分布进行比较。如果|to|> 如m…+n2-2,就否定H0,得出的结论是硅酸盐水泥砂浆两种配方的平 均强度是不相同的,其中tan+2-2是自由度为n1+n2-2的t分布 的上a/2百分位数。 这一程序的合理性如下。如果我们是从独立正态分布中进行 抽样,则y-y2的分布是N[1-2,a2(1/n1+1/n2)]。于是, 若a2已知以及H0:p1=2为真,则 y1-y2 (2-25) 的分布是N(0,1)。然而,以S代替2-25式中的a时,就将x 的分布从标准正态分布转换为自由度为n1+n22的t分布了。今 若Hlo为真,2-23式中的to的分布是t1+n2-2,因此,我们能期望 to的值的百分之100(1-a)落在一t2,n+n,-2与t2,m+n,-2之间。如 果零假设为真,一个样本得出的to的值在这一范围之外时,是不 正常的,也就表明Ho应该被否定。a是这一检验法的第I类错误 的概率。 在有些问题中,希望仅从一个均值大于另一个均值时就否定 H于是提出了一个单边备择假设H1:m1>m2;仅当to>ta,n+"22