二、区间估计:确定一个区间,并给出该区间包含总体参数的概率 点估计的最大缺点就是由于估计量也是统计量,它必然带有一定误差。换句话说估计值 不可能正好等于真值。但估计值与真值到底差多少,点估计中没有给我们任何信息。而区间 估计正好弥补了这个缺点,它不仅给出了真值的范围,而且给出了真值落入这一范围的概率。 因此区间估计给出的信息显然多于点估计。 1.正态总体μ与σ2的置信区间 我们主要针对正态分布讨论μ与2的置信区间。这一方面是因为正态分布确实是最常 见的分布,另一方面是因为中心极限定理保证了当样本足够大时,不管总体服从什么分布, 我们都可以把x看作近似服从正态分布。因此只有当样本含量较小时,我们才需要对总体是 否服从正态分布加以考虑 求μ与σ2的置信区间时,选择统计量和理论分布的方法与§3.3假设检验中完全相同, 然后根据所得到的接受域对未知参量解不等式,即得到所求的置信区间。若所选择的显著性 水平为a,则该区间包含总体参数的概率即为1-a,称为置信水平 例3.13求σ已知时μ的95%置信区间。 解:σ已知时 x-l ~N(o,1 取a=0.05,则:P(-196≤x-≤1.96)=095 o/√n 解不等式,得:P(x-1.96≤≤x+1.96-)=095 即:u的95%置信区间为:(x-1.96 nx+1.96 例3.13求两样本,标准差σ;未知但相等时μ-μ2的1-a置信区间。 解:两样本,标准差未知但相等时的统计量为: A-2) t(m+n-2) m-1)S1+(n-1)S m+n-2 显著性水平为a的接受域为 tan2(m+n-2)≤t≤t1an2(m+n-2) 把t表达式代入,解得μ1u2的1-a置信区间为: (x1-x2)±1(m+n-2)./(m-1)S2+(n-1)S2 例3.15求正态总体σ2的1-a置信区间 解:设样本方差为S2。根据(36)式,有: (n-1)S2
二、区间估计:确定一个区间,并给出该区间包含总体参数的概率。 点估计的最大缺点就是由于估计量也是统计量,它必然带有一定误差。换句话说估计值 不可能正好等于真值。但估计值与真值到底差多少,点估计中没有给我们任何信息。而区间 估计正好弥补了这个缺点,它不仅给出了真值的范围,而且给出了真值落入这一范围的概率。 因此区间估计给出的信息显然多于点估计。 1. 正态总体μ与σ2 的置信区间 我们主要针对正态分布讨论μ与σ2 的置信区间。这一方面是因为正态分布确实是最常 见的分布,另一方面是因为中心极限定理保证了当样本足够大时,不管总体服从什么分布, 我们都可以把 x 看作近似服从正态分布。因此只有当样本含量较小时,我们才需要对总体是 否服从正态分布加以考虑。 求μ与σ2 的置信区间时,选择统计量和理论分布的方法与§3.3 假设检验中完全相同, 然后根据所得到的接受域对未知参量解不等式,即得到所求的置信区间。若所选择的显著性 水平为α,则该区间包含总体参数的概率即为 1-α,称为置信水平。 例 3.13 求σ已知时μ的 95%置信区间。 解:σ已知时 ~ (0,1) / N n x − 取α= 0.05,则: 1.96) 0.95 / ( 1.96 = − − n x P 解不等式,得: ( −1.96 +1.96 ) = 0.95 n x n P x 即:μ的 95%置信区间为: ( 1.96 , 1.96 ) n x n x − + 例 3.13 求两样本,标准差σi 未知但相等时μ1-μ2 的 1-α置信区间。 解:两样本,标准差未知但相等时的统计量为: ~ ( 2) ) 1 1 ( 2 ( 1) ( 1) ( ) 2 2 2 1 1 2 1 2 + − + + − − + − − − − = t m n m n m n m S n S x x t 显著性水平为α的接受域为: ( 2) ( 2) t / 2 m + n − t t 1− /2 m + n − 把 t 表达式代入,解得μ1-μ2 的 1-α置信区间为: ) 1 1 ( 2 ( 1) ( 1) ( ) ( 2) 2 2 2 1 2 1 2 m n m n m S n S x x t a m n + + − − + − − + − 例 3.15 求正态总体σ2 的 1-α置信区间 解:设样本方差为 S 2。根据(3.6)式,有: ~ ( 1) ( 1) 2 2 2 − − n n S
xa(n-1<(n-1)s2 对未知参数σ2解不等式,得 P < (n x2(n-1) σ2的1-a置信区间为 (n-1)S 2∠(n-1)S ≤σ“ x2(n-1) n 上述几道题我们都只进行了公式的推导,而没有代入具体的数字。当需要解决具体问题 ,只须将数字代入即可。同时,我们并不希望同学们死记上述公式,而是要搞清楚在各种 情况下什么是接受域,应当对哪个变量求解不等式,这样才能针对不同情况灵活使用公式 也有几种情况例题中未涉及,如σ2已知时的双样本u检验,σ2未知且不等的近似t检验, 两方差是否相等的F检验等。相信同学们只要真正理解、掌握了上述几道例题的思想与方 法,这些问题是不难解决的。另外,在某些情况下也会要求单侧置信区间,此时只要用单侧 分位数代替双侧分位数即可 2.二项分布中P的置信区间。(参见国标GB4087.2-83) 项分布的概率函数为: P(x=x,p)=Cnp(1-py-,x-0.1,2.-n 参数p的点估计为:-。(n:样本含量。x:样本中具有某种属性的个体数) 置信区间的求法如下(Pu,P1分别为区间的上下限) 1°n<10时,置信区间一般太宽,无实用价值。 2°n≥10时,采用下述公式: Y? (3.24) y2+y1·F1a(1,y2) 其中yY1=2(n-x+1),y2=2x 2+y1/F1.(2y1) 其中Y:=2(n-x),Y2=2(x+1)。 例3.16取n=20,x=8,1-a=0.95,求上单侧,下单侧,双侧置信区间。 解:上单侧:n=20,x=8,Y=2(20-8)=24,y=2(8+1)=18 2.11+2.03 查F分布表,取F.5(15,24)与Fa95(20,24)的平均数 =207代入公式,得 P 18+24/2.070.608 所求区间为:[0,0.608) 下单侧:n=20,x=8,y1=2(20-8+1)=26,y2=2x=16
∴ = − − − − − ( 1) 1 ( 1) ( 1) 2 1 2 2 2 n n S P n 对未知参数σ2 解不等式,得: = − − − − − − 1 ( 1) ( 1) ( 1) ( 1) 2 2 2 2 2 2 1 2 n n S n n S P ∴σ2 的 1-α置信区间为: ( 1) ( 1) ( 1) ( 1) 2 2 2 2 2 2 1 2 − − − − − n n S n n S 上述几道题我们都只进行了公式的推导,而没有代入具体的数字。当需要解决具体问题 时,只须将数字代入即可。同时,我们并不希望同学们死记上述公式,而是要搞清楚在各种 情况下什么是接受域,应当对哪个变量求解不等式,这样才能针对不同情况灵活使用公式。 也有几种情况例题中未涉及,如σ2 已知时的双样本 u 检验,σ2 未知且不等的近似 t 检验, 两方差是否相等的 F 检验等。相信同学们只要真正理解、掌握了上述几道例题的思想与方 法,这些问题是不难解决的。另外,在某些情况下也会要求单侧置信区间,此时只要用单侧 分位数代替双侧分位数即可。 2. 二项分布中 P 的置信区间。(参见国标 GB4087.2–83) 二项分布的概率函数为: ( , ) (1 ) , x x n x P X x n p Cn p p − = = − x = 0, 1, 2, ……n 参数 p 的点估计为: n x 。(n:样本含量。x:样本中具有某种属性的个体数) 置信区间的求法如下(Pu,PL 分别为区间的上下限): 1°n<10 时,置信区间一般太宽,无实用价值。 2°n≥10 时,采用下述公式: ( , ) 1 2 2 2 1 1 2 − + = F PL (3.24) 其中γ1= 2(n-x+1),γ2 = 2x; ( , ) 2 1 2 2 1 1 2 − + = F Pu (3.25) 其中γ1= 2(n-x),γ2 = 2(x+1)。 例 3.16 取 n = 20, x = 8, 1-α= 0.95, 求上单侧,下单侧,双侧置信区间。 解:上单侧:n = 20, x = 8, γ1= 2(20-8)= 24,γ2= 2(8+1)= 18 查 F 分布表,取 F0.95(15,24)与 F0.95(20,24)的平均数: 2.07 2 2.11 2.03 = + 代入公式,得: 0.608 18 24 / 2.07 18 = + Pu = ∴ 所求区间为:[0,0.608)。 下单侧:n = 20, x = 8, γ1= 2(20-8+1)= 26,γ2 = 2x = 16
查F分布表,取Fas(24,16)与Fa9(30,16)的平均数 2.24+2.19 =2215代入公式 =0.217 16+26×2.215 所求区间为:(0.217,1]。 双侧:n=20,x=8 P:Y=2(20-8+1)=26,y2=2·8=16 查F分布表,取Fmn(24,16)与F(30,16)的平均数:263+251=260,代入公式, 得 0.191 16+26×2.6 Pa:Y1=2(20-8)=24,y2=2(8+1)=18, 查表,取F0(15,24)与F05(20,24)的平均244+1.3=2385,代入公式,得: P +24/2.385 ∴所求区间为:(0.191,0.641) 3°n>30,且0.1<-<0.9时,可使用下述近似公式 n P=P-uyR(l-P)/(n+2d) (3.26) P=P2+yP(1-P2)/n+2d) 式中P=x+d-05,B2=x+d+05,m为正态分布的分位数,d为常数,取值见表 n+2d n+2d 表3.1d与ua的取值 置信水平1-a 单侧 双侧 0.90 1.2820.7 1.6451.0 0.95 1.6451 1.9601.5 0.99 2.32 2.5762.5 例3.17取n=40,x=12,1-a=0.95,求双侧置信区间(P,P)。 解:查表,得d=1.5,ua=1.960代入公式,得: ≈x+d-0.512+1.5-0.5 0.3023 n+2d40+2×1.5 x+d+0.512+1.5+0.5 P2 0.3256 n+2d 40+2×1.5
查 F 分布表,取 F0.95(24,16)与 F0.95(30,16)的平均数: 2.215 2 2.24 2.19 = + 代入公式,得: 0.217, 16 26 2.215 16 = + PL = ∴ 所求区间为:(0.217,1]。 双侧:n=20, x=8 PL: γ1= 2(20-8+1)= 26, γ2 = 2·8 = 16 查 F 分布表,取 F0.975(24,16)与 F0.975(30,16)的平均数: 2.60 2 2.63 2.57 = + ,代入公式, 得: 0.191 16 26 2.6 16 = + PL = ; Pu: γ1= 2(20-8)= 24, γ2 = 2(8+1)= 18, 查表,取 F0.975(15,24)与 F0.975(20,24)的平均数: 2.385 2 2.44 2.33 = + ,代入公式,得: 0.641 18 24 / 2.385 18 = + Pu = ∴ 所求区间为:(0.191, 0.641)。 3° n>30, 且 0.1< n x <0.9 时,可使用下述近似公式: (1 )/( 2 ) PL = P1 − u P1 − P1 n + d (3.26) (1 )/( 2 ) Pu = P2 + u P2 − P2 n + d (3.27) 式中 n d x d P n d x d P 2 0.5 , 2 0.5 1 2 + + + = + + − = ,u 为正态分布的分位数,d 为常数,取值见表 3.1。 表 3.1 d 与 uα的取值 置信水平 1-α 单侧 uα d 双侧 uα d 0.90 1.282 0.7 1.645 1.0 0.95 1.645 1 1.960 1.5 0.99 2.326 2 2.576 2.5 例 3.17 取 n=40,x=12, 1-α=0.95, 求双侧置信区间(PL,Pu)。 解:查表,得 d=1.5, uα=1.960 代入公式,得: 0.3023 40 2 1.5 12 1.5 0.5 2 0.5 1 = + + − = + + − = n d x d P 0.3256 40 2 1.5 12 1.5 0.5 2 0.5 2 = + + + = + + + = n d x d P
P=P-UaVP(-P)/(n+2a =03023-196×√03023×0697743 P2+Ua√P2(1-P2)n+2d) 0.3256+196×√03256×0.6744/43 =04657 所求置信区间为:(0.1650,0.4657)。 4°当n>30,且一≤0.1或一≥09时,可采用泊松近似。近似公式为 2n-x+1+ 当-接近0 P (3.28) n+x-2 n+x+2 式中A=x2(2x),2=x20[2(n-x)+2],x2和x2。为x2分布的分位数,依单侧 或双侧区间a可取值a或。括号中为自由度。 22 当-接近0 P n+x+1-1 当-接近1 n+x+1+2 式中2=2x2(2x+2),2222(m-x,x2和x2同上。 例3.18取n=50,x=5,1-a=0.95,求双侧置信区间 解: 0.1,用接近于0的公式 P.:=a25(10)=÷×3.247=1.6235 2 2×16235 h=2n-x+1+1=2×50-5+1+16235 =0.03396 P:几=÷20975(12)=÷×23.337=116685 23.337 0.2188 n-x+A2×50-5+116685 所求置信区间为(0.03396,0.2188) 三、正态总体区间估计与显著性检验的关系: 1°来自于同一不等式,结果是一致的。因此必要时也可使用置信区间进行假设检验:只要 看看H中的理论值是否落在置信区间中就可以了
0.1650 0.3023 1.96 0.3023 0.6977 / 43 (1 )/( 2 ) 1 1 1 = = − PL = P −U P − P n + d 0.4657 0.3256 1.96 0.3256 0.6744 / 43 (1 ) /( 2 ) 2 2 2 = = + Pu = P +U P − P n + d ∴ 所求置信区间为:(0.1650,0.4657)。 4°当 n>30, 且 0.1 n x 或 0.9 n x 时,可采用泊松近似。近似公式为: + + + − − + + = , 1 , 0 2 1 2 当 接近 当 接近 n x n x n x n x n x PL (3.28) 式中 [2( ) 2] 2 1 (2 ), 2 1 2 1 2 = a x = −a n − x + , 2 1 2 a和 −a 为 2 分布的分位数,依单侧 或双侧区间 a 可取值α或 2 。括号中为自由度。 + + + + + − − + = , 1 1 1 , 0 2 2 当 接近 当 接近 n x n x n x n x n x Pu 式中 [2( )] 2 1 (2 2), 2 1 2 2 1 x n x = −a + = a − , 2 1 2 a和 −a 同上。 例 3.18 取 n=50, x=5, 1-α=0.95, 求双侧置信区间。 解: = 0.1 n x ,用接近于 0 的公式。 3.247 1.6235 2 1 (10) 2 1 : 2 PL = 0.025 = = 0.03396 2 50 5 1 1.6235 2 1.6235 2 1 2 = − + + = − + + = n x PL 23.337 11.6685 2 1 (12) 2 1 : 2 Pu = 0.975 = = 0.2188 2 50 5 11.6685 23.337 2 2 = − + = − + = n x Pu ∴ 所求置信区间为(0.03396,0.2188)。 三、正态总体区间估计与显著性检验的关系: 1°来自于同一不等式,结果是一致的。因此必要时也可使用置信区间进行假设检验:只要 看看 H0 中的理论值是否落在置信区间中就可以了
2°直观上有一定差异。显著性检验是把H:μ=μ。视为固定常数,依据它建立理论分布,再 来判断实际观察值X是否小概率事件;区间估计则是把观察值X视为最可能的μ的取值 点估计),再以它为中心建立一个区间,并给出母体参数μ落入这一区间的概率(置信水 3.5非参数检验I:x2检验 前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于 某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检 验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分 布,两个事件是否独立等等 x2检验在非参数检验中应用相当广泛。在以前的检验中我们也用过x2分布,当时用于 检验总体的方差σ2是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下 的 Pearson定理 Pearson定理:当(P1,P2,…P)是总体的真实概率分布时,统计量 np (3.30) 随n的增加渐近于自由度为r-1的x2分布 (3.30)式的统计量也被称为 Pearson计量。其中P,P2,…P为r种不同属性出现的概 率,n为样本含量,n为样本中第i种属性出现的次数。 由于n是样本中第ⅰ种属性出现的次数,是观察值;而p是第i种属性出现的概率,因 此np可被看作是理论上该样本中第i种属性应出现的次数。这样我们就可以换一种写法 把n视为观察值O,np视为理论值T;,则(3.30)式可写成 (O1-11 (3.31) 这样一来, Pearson定理实际是说如果样本确实抽自由(P:,P2,…P)代表的总体,O和 T之间的差异就只是随机误差,则 Pearson统计量可视为服从x2分布:反之若样本不是抽自 由(P1,P2,…P)代表的总体,O和T1之间的差异就不只是随机误差,从而使计算出的统 计量有偏大的趋势。因此对上述 Pearson统计量进行上单尾检验可用于判断离散型数据的观 察值与理论值是否吻合。此时统计假设为:Ho:O1=T:;HA:O≠Tl,但检验是上单尾检验。 显然,上述数据应满足 n2∑P 另外,为了使 Pearson统计量近似服从x(r-1)分布,还要求: 1°各理论值均大于5。即:T≥5,i=1,2,…,r。如果有一个或多个T<5,会使 Pearson 统计量明显偏离ⅹ2分布,可能导致错误检验结果 2°若自由度为1,则应作连续性矫正,即把统计量改为 z=∑-列-0 T 还应注意由于 Pearson统计量的H为O=T,所以统计量值为0意味着H0严格成立
2°直观上有一定差异。显著性检验是把 H0:μ=μ0 视为固定常数,依据它建立理论分布,再 来判断实际观察值 X 是否小概率事件;区间估计则是把观察值 X 视为最可能的μ的取值 (点估计),再以它为中心建立一个区间,并给出母体参数μ落入这一区间的概率(置信水 平)。 §3.5 非参数检验 I:χ2检验 前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于 某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检 验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分 布,两个事件是否独立等等。 χ2 检验在非参数检验中应用相当广泛。在以前的检验中我们也用过χ2 分布,当时用于 检验总体的方差σ2 是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下 的 Pearson 定理。 Pearson 定理:当(P1,P2,…Pr)是总体的真实概率分布时,统计量 = − = r i i i i np n np 1 2 2 ( ) (3.30) 随 n 的增加渐近于自由度为 r-1 的χ2 分布。 (3.30)式的统计量也被称为 Pearson 计量。其中 P1,P2,… Pr 为 r 种不同属性出现的概 率,n 为样本含量,ni 为样本中第 i 种属性出现的次数。 由于 ni 是样本中第 i 种属性出现的次数,是观察值;而 pi 是第 i 种属性出现的概率,因 此 npi 可被看作是理论上该样本中第 i 种属性应出现的次数。这样我们就可以换一种写法, 把 ni 视为观察值 Oi,npi 视为理论值 Ti,则(3.30)式可写成: = − = r i i i i T O T 1 2 2 ( ) (3.31) 这样一来,Pearson 定理实际是说如果样本确实抽自由(P1,P2,…Pr)代表的总体,Oi 和 Ti 之间的差异就只是随机误差,则 Pearson 统计量可视为服从χ2 分布;反之若样本不是抽自 由(P1,P2,…Pr)代表的总体,Oi和 Ti 之间的差异就不只是随机误差,从而使计算出的统 计量有偏大的趋势。因此对上述 Pearson 统计量进行上单尾检验可用于判断离散型数据的观 察值与理论值是否吻合。此时统计假设为:H0:Oi = Ti;HA:Oi ≠ TI,但检验是上单尾检验。 显然,上述数据应满足: = = = = r i i r i Oi n p 1 1 , 1。 另外,为了使 Pearson 统计量近似服从χ2 (r–1)分布,还要求: 1°各理论值均大于 5。即:Ti ≥ 5, i = 1, 2,…,r。如果有一个或多个 Ti < 5,会使 Pearson 统计量明显偏离χ2 分布,可能导致错误检验结果。 2°若自由度为 1,则应作连续性矫正,即把统计量改为: = − − = r i i i i T O T 1 2 2 ( 0.5) (3.32) 还应注意由于 Pearson 统计量的 H0 为 Oi = Ti,所以统计量值为 0 意味着 H0 严格成立