所有的个体,对此可用1451作为标准傭差的估计值 2)估计a2和b2两个数值,在它们之间若期望有95%的个体, 对此可用 a-b 2.作为标准偏差的估计值 23与正态分布有关的某些特殊分布 231t分布 正态分布的理论是从大量数据中引出来的,当然不适用于少量 的观测数据。在实验室条件下分析测试中通常不可能进行大量的观 测,于是以正态分布为基础的统计检验会使实验工作者得出错误的 结论,爱尔兰化学家戈塞特(W.S, Gosset)发现了这一点,在1908 年他用“ Student”的笔名发表了“平均值的穊率误差”论文。他一方 面从琏论考虑,另一方面抽取一些小的随机样本,导出了来自正态分 布的小样本的平均值的理论分布。 如果不用大样本,就不能知道真正的总体平均值H和标准偏差 σ,但是可以用样本的标准锦差S来代替,用平均值云来代替真值 。当这样做的时候,必须使用一个不依赖于的新的分布,这就是 戈塞特引入的称为“ Student t”的概念。 t=(24) 戈塞特证明了t的分布仅仅依赖于样本容量n,图2-10表明扌分布 与正态分布的关系。 t分布曲线比正态分布曲线扁平,但当样本容量增大时就接近 正态分布曲线,当n为无穷大时t分布曲线就与正态分布曲线重合 了,实际上当样本容量超过30时,这两者之间的差别是很小的。 分布的溉率密度由司都顿分布密度函数给出:
=6 f=1 0.1 图2-10f=1,5,∞的扌分布曲线 r(+1 p(t)a f) T(f) 1 式中f=n-1,是计算标准偏差S的自由度。 在实际应用上,为方便起见,与正态分布一样,将扌分布制成t分 布表形式,见附录中表A-3 了解t分布的概念很有必要,因为它是对小样本的平均值进行 统计检验的基础。 3.2F分布 方差或标准偏差是反映测试精度的重要标志,检验它的变化是 很重要的,F检验的统计量为 式中S和S——分别是数值较大的方差和较小的方差 ∫1和∫2—分别是计算大方差S和计算小方差S的自由 度
F分布的概率密度是由菲歇尔分布函数给出 ∫1+f2 P(F) fi)r(fa' (2+r) 它只取决于计算方差的自由度∫ 08 (1050) 和f2。图2-11表示不同(f1,f2) 0.6 时的分布曲线 104 在实际应用上,为方便起见,把 F分布制成F分布表形式,见附录 中表A-4。表中上端横行中∫1是 图2-11(1,f2)为(10,4)积(10,50)大方差的自由度,左边直列内的 时的F分布概率函度曲线 f2是小方差的自由度。 2.33x2分布 在相同条件下对间一样本重复测量n次,便得到n个测量值,并 可计算得到测量值的方差 1,(m,-)2为总体方差02的 1 无偏估计值。然后,如果再重复测量次,那末再次得到的n个测 量值,一般来说与前次的书个测量值是不同的,由此计算得到的方差 与前者也不相同。因此S2也是一个随机变量,那么S2将服从怎样 的分布呢? 统计学研究指出,当从正态分布总体中随机抽取容量为n的样 本时,x2=(n-1)S2 呈现x2分布,X2分布的概率密度由x2概率 密度函数给出: 9(x2) x2) 33
式中自由度∫=n-1。 2 X2分布的概率密度曲线是不 对称的(见图2-12),曲线的峰度 035 =4 偏度均随自由度f的大小而 变,随自由度增大,不对称性减 005 10 小 附录中表A-5中给出了不 10:3520、2 同自由度和不同概率时的x值。 图2-12不同自由度时x2分布 概率密度曲线 2.4置信区间和统计容许限 既然真值和标准偏差的估计会随样本而异,因此,对真值和标准 偏差的估计用区间估计可能比用“单值”佔计更受欢迎。 2。4.1淵定值的置倌区间 测定值的置信区间也称为测定值的不确定度,表示用误差限规 定的各测定值的分散特性。 在分析测试中,用某一分析方法测得一系列数据之后,往往想知 道单次测定值的置信区间有多大?其平均值的置信区间又有多大? 这一Y信区间也代表了该分析方法的方法误差。 从正态分布曲线可知,在一定误差范内的测定值出现的概率 是一定的,概率大小由曲线下面的相应面积来表示。所以,在估计测 定值的置信区间时,首先应选定偏差超过该区间的概率,即显著性水 平a,或者选定偏差小于该区间的概率,即置信系数(或置信度)y, y=1-a。在分析测试中通常取显著性水平a=0,05(或置信系数y 0,95)是比较适当的。对于同样的显著性水平,样本容量越大,所 得到的置信区间就越窄。 1)单次测定值的置信区间 ·34·
社=2士z1-0 即每次测定值可能在土21-3的区间内波动。式中21-是与显者 性水平a有关的系数,可由附录中表A-2中查到 上述是当n-∞时的情况,当测定次数为有限次时,单次测定 值的置信区间由下式决定: =2士t1-S 式中用标准偏差的估计值S来代替o,用h1-来代替2-,t1-3值 可由附录中表A-3中查到。 单次测定值的置信区间±1-S不仅与选择的显者性水平a有 关,因为不同的a有不同的t-值,而且与估算标准偏差S时的样 本容量n有关,因为#越大,1-值越小,n越大,S也越接近于 (2)平均值的置信区间 21a矿 =c上 2 即平均值可能在±的区间内波动。 上述是→时的情况,当测定次数为有限次时,平均值的置 信区间由下式决定: =厉± 平均值的置信区间±√不仅与选择的显者性水平有关,而且与 估算标准偏差时的样本容量n关系极大。除了样本容量n越大, 35