第3章区间估计 区间估计的背景: 对于一个量,如某工件的长厦通过测量和计算 得到它的一个近似值在工程技术上还要同餚出 这个近似值的误差也就是说给出一个区商-ε, a+cl,量a一定落入这个区间于参数的估计世 有类似的问题点估计仅仅给出了参数一个估计 值,有时还需要知道它的蘖性程度这就需要给出 个区间并且说明这个区间以友的概率包含参 数的真值这就是区间估计 3-1
3 - 1 第3章 区间估计 区间估计的背景: , . , , , , ˆ ], . , [ˆ , ˆ 数的真值这就是区间估计 一个区间并且说明这个区间以多大的概率包含参 值 有时还需要知道它的可靠性程度这就需要给出 有类似的问题点估计仅仅给出了参数的一个估计 量 一定落入这个区间内对于参数的估计也 这个近似值的误差 也就是说给出一个区间 得到它的一个近似值在工程技术上还要同时给 出 对于一个量 如某工件的长度通过测量和计算 a a a a, a , , + −
3.1置信区间与置信限 设总体的分布函数(x;0)形 式已知,但其中含有参数,若对于给定值 a(0<α<1),统计量61=61(X1,X2,…,xn)和 02=02(X1,X2,…,Xn)满足: P{1<6<02}=1-0 则称随机区间01,02)是0的置信度为-a的置信区 间,01和02分别称为置信度,a的置信下限和量 信上限,1-c称为置信度。 3-2
3 - 2 3.1 置信区间与置信限 信上限, 称为置信度。 间 , 和 分别称为置信度为 的置信下限和置 则称随机区间 是 的置信度为 的置信区 满足 ,统计量 和 式已知,但其中含有未知参数 ,若对于给定值 设总体 的分布函数 的 形 − − − = − = = 1 1 ˆ ˆ ) 1 ˆ , ˆ ( } 1 ˆ ˆ P{ (X ,X , ,X ) : ˆ ˆ (X ,X , ,X ) ˆ ˆ (0 1) X F(x; ) 1 2 1 2 1 2 2 2 1 2 n 1 1 1 2 n
注: 置信区间不同于一般的间, 它是随机区间,不同本值对应不同的区间在 这些区间中有的包含数的真值,有的则不仓。 当置信度为-α时,这个区间包舍的真值的概率 为1-α。如取=0.05,则置信度熄95说明01,02) 以0.9-的概率包的真值。粗略地说,在随机区间 (01,02)的100个观察值中有5个包含的真值 3-3
3 - 3 注: 的 个观察值中有 个包含 的真值。 以 的概率包含的真值。粗略地说,在随机区间 为 。如取 ,则置信度为 ,说明 当置信度为 时,这个区间包含的真值的概率 这些区间中有的包含参数的真值,有的则不包含 。 它是随机区间,不同的样本值对应不同的区间。 在 置信区间不同于一般的区间, ) 100 9 5 ˆ , ˆ ( 0.9 5 ) ˆ , ˆ 1 0.0 5 0.9 5 ( 1 1 2 1 2 − = −
例1设总体~N(H2σ2),σ2已知 未知设X1,X2,…,X是来自的 样本求μ的置信度为-a的置信区间 解是μ的无偏估计,及~N(0,, 且不依赖于任何其它数,按标准正态分布的o 分位点的定义,有P X一kn2}=1-o,即 PX-.a 2 <H<x+-ua12 =1-a 故我们得到的一个置信度为c的置信区间 3-4
3 - 4 样 本 求 的置信度为 的置信区间。 未 知 设 是来自 的 例 设总体 已 知 − , 1 , X , X , ,X X 1. X ~ N( , ) , , 1 2 n 2 2 故我们得到的一个置信度为 的置信区间: 分位点的定义,有 , 即 且不依赖于任何其它参数,按标准正态分布的上 解 因 是 的无偏估计,及 , − = − + − = − − − 1 z } 1 . n z X n P{X | z } 1 n X P{| ~ N(0,1) n X X / 2 / 2 2 u 2 u 2 u 2
(X c/25 n 或记为Xun2)如取=0.05 则有a2=1.96,若σ=1,n=16于是可得一个置亻 度为09的区间:(X±1,96/16)=(X±049 若由一个样本值算得棒均值的观察值=520, 则得(471,569) 注:10.(4.71,5.69)已不是一个随机区间,但仍称它 为置信度为0.95的置信区间,其直观含义是:若反复抽样 多次,每个样本值(n=16)均确定一个区间,在这么多的区 间中,包含μ的约占95%,不包含的约占5%。现抽样得到的 区间(4.71,5.69)属于那些包含μ的区间的可信度为95%, 或“该区间包含μ”这一事实的可信度为95%
3 - 5 注: 10.(4.71, 5.69)已不是一个随机区间,但仍称它 为置信度为0.95的置信区间,其直观含义是:若反复抽样 多次,每个样本值(n =16)均确定一个区间,在这么多的区 间中,包含的约占95%,不包含的约占5%。现抽样得到的 区间(4.71, 5.69)属于那些包含的区间的可信度为95%, 或“该区间包含”这一事实的可信度为95% . (4.7 1, 5.6 9) . x 5.2 0 0.9 5 (X 1.9 6 1 6) (X 0.4 9) z 1.9 6 1, n 1 6 z ) 0.0 5 n (X z ) n z , X n (X / 2 / 2 / 2 / 2 则 得 若由一个样本值算得样本均值的观察值 , 度 为 的区间: 。 则 有 , 若 ,于是可得一个置信 或记为 。如取 , = = = = = = + − u 2 u 2 u 2 u 2