s53非参数假设检验方法 前面介绍的各种统计假设的检验方法,几乎都假定了总 体服从正态分布,然后再由样本对分布参数进行检验。 但在实际问题中,有时不能预知总体服从什么分布,这 里就需要根据样本来检验关于总体分布的各种假设,这 就是分布的假设检验问题。在数理统计学中把不依赖于 分布的统计方法称为非参数统计方法。 本节讨论的问题就是非参数假设检验问题。 本节主要介绍拟合优度检验,柯尔莫哥洛夫一斯米尔诺 夫( Kolmogrow- Smirnov)检验和独立性检验。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 1 §5.3 非参数假设检验方法 前面介绍的各种统计假设的检验方法,几乎都假定了总 体服从正态分布,然后再由样本对分布参数进行检验。 但在实际问题中,有时不能预知总体服从什么分布,这 里就需要根据样本来检验关于总体分布的各种假设,这 就是分布的假设检验问题。在数理统计学中把不依赖于 分布的统计方法称为非参数统计方法。 本节讨论的问题就是非参数假设检验问题。 本节主要介绍拟合优度检验,柯尔莫哥洛夫-斯米尔诺 夫(Kolmogrow-Smirnov)检验和独立性检验
、x2拟合优度检验 多项分布的x2检验法 设总体是仅取m个可能值的离散型随机变量,不 失一般性,设X的可能值是1,2,…,m,记它取值 为i的概率为p,即 P(X=i)=p,i=1,2,…,m ∑ 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 2 1.多项分布的 2 检验法 设总体是仅取m 个可能值的离散型随机变量,不 失一般性,设X 的可能值是1,2, ,m ,记它取值 为i的概率为 i p , ( ) , 1,2, , P X i p i m = = = i 1 1 m i i p = = 即 且 一、χ 2拟合优度检验
设(X1,X2,…,Xn)是从总体中抽得的简单随机样本, (x1,x2…,xn)是样本观察值。 用N表示样本(x1,x2…,x)中取值为i的个数,即 样本中出现事件{X=的频数,则N是样本的函数, 所(N1,N2,…,Nn)是随机向量,且有 ∑N=n (N1,N2,…,Nn)服从多项分布,其概率分布为 P(N1=几1 92 29 (5.12) n P 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 3 设 1 2 ( , , , ) X X X n 是从总体X 中抽得的简单随机样本, 1 2 ( , , , ) n x x x 是样本观察值。 用 Ni 表示样本 1 2 ( , , , ) n x x x 中取值为 i的个数,即 样本中出现事件X i = 的频数,则Ni 是样本的函数, 所 1 2 ( , , , ) N N Nm 是随机向量,且有 1 . m i i N n = = 1 2 ( , , , ) N N Nm 服从多项分布,其概率分布为 1 2 1 1 2 2 1 2 1 2 ( , , , ) ! ! ! ! m m m n n n m m P N n N n N n n p p p n n n = = = = (5.12)
需要检验假设 0·P2=p0 H1:P≠Pio(i=1,2,…,m) 其中po是已知数。 我们知道,频率是概率的反映。 如果总体的概率分布的确是(P10,P20…,Pno), 那么,当观察个数n愈来愈大时,频率立与之间 的差异将越来越小,因此频率与0之间的差异程 度可以反映出(P10,p2,…,Pn0)是不是总体的真分布 湘潭大学数学与计算科学学院一四4层m
湘潭大学数学与计算科学学院 上一页 下一页 4 需要检验假设 0 0 1 0 : : ( 1,2, , ) i i i i H p p H p p i m = = 其中 pi 0 是已知数。 我们知道,频率是概率的反映。 如果总体的概率分布的确是 ( , , , ) p p p 10 20 0 m , 那么,当观察个数n 愈来愈大时,频率Ni n 与 i0 p 之间 的差异将越来越小, 因此频率Ni n 与 i0 p 之间的差异程 度可以反映出 10 20 0 ( , , , ) m p p p 是不是总体的真分布
卡尔皮尔逊首先提出运用统计量 2_(N-pa)2 (523) z 来衡量一和p0之间的差异程度,这个统计量称为 皮尔逊统计量 直观上比较清楚,如果(D0,P20,…,Pm)是总体 服从的真实概率分布,统计量x2要偏小些,否则就 有偏大的趋势。因此x2可以用来作为多项分布的 检验统计量。但是还需要知道它的分布,下面的 定理给出了它的渐近分布。 湘潭大学数学与计算科学学院一页一页
湘潭大学数学与计算科学学院 上一页 下一页 5 卡尔·皮尔逊首先提出运用统计量 2 2 0 1 0 ( ) m i i n i i N np np = − = (5.23) 来衡量 Ni n 和 i0 p 之间的差异程度,这个统计量称为 皮尔逊统计量。 直观上比较清楚,如果 10 20 0 ( , , , ) m p p p 是总体 服从的真实概率分布,统计量 2 n 要偏小些,否则就 有偏大的趋势。 因此 可以用来作为多项分布的 检验统计量。但是还需要知道它的分布,下面的 定理给出了它的渐近分布。 2 n