§7.4区间估计 s当X是连续型随机变量时,对于给定的a, 总是按要求P(0<0<D)=1-a求出置信区 间。 9当X是离散型随机变量时,对于给定的α, 常常找不到区间(8,D)使得P(日<B<B)恰为 1一a,此时去找区间(0,0使得P(0<0<0) 至少为1一a,且尽可能的接近1一a。 6/48
§7.4 区间估计 当X是连续型随机变量时,对于给定的α, 总是按要求 求出置信区 间。 当X是离散型随机变量时,对于给定的α, 常常找不到区间 使得 恰为 1-α,此时去找区间 使得 至少为1-α,且尽可能的接近1-α。 P( ) 1 ( , ) P( ) ( , ) P( ) 6/48
§7.4区间估计 ·置信区间的计算方法 例:设总体X~N(山,G2),G2为已知,为未知,设X1,X2,.,X 是来自X的样本,求的置信水平为1一的置信区间 解:置信区间由样本来确定,X是的无偏估计,可由样本获 得观察值,且X~N(4,σ2n),所以 X-严~N0,1) oIn 它不依赖于任何未知参数,按标准正态分布的上分位点 的定义,有 om-1-a a/2 a12 /2 7/48
置信区间的计算方法 例:设总体X~N(μ,σ 2 ),σ 2为已知,μ为未知,设X1 ,X2 ,.,Xn 是来自X的样本,求μ的置信水平为1-α的置信区间 解:置信区间由样本来确定, 是μ的无偏估计,可由样本获 得观察值,且 ~N(μ,σ 2 /n),所以 ~N(0,1) 它不依赖于任何未知参数,按标准正态分布的上α分位点 的定义,有 §7.4 区间估计 / 2 x z / 2 z / 2 / 2 - X n X / 1 / / 2 z n X P X 7/48
§7.4区间估计 即PF-o an ion)=1-a 这样就得到了的一个置信水平为1一a的置信区间 (-2,X+ Nnah常写成(土。2) 如:取a=0.05,即1-a=0.95,又若o=1,n=16, 查表得z.025=1.96,可得置信水平为0.95的置信区间 (X±0.49) 若由一个样本值算得观察值=5.20,则得到一个 区间(5.20±0.49)即(4.71,5.69)该区间仍称为置信水 平为0.95的置信区间。其含义是该区间包含真值w 的可信程度为95% 8/48
§7.4 区间估计 即 这样就得到了μ的一个置信水平为1-α的置信区间 ,常写成 如:取α=0.05,即1-α=0.95,又若σ=1,n=16, 查表得z0.025=1.96,可得置信水平为0.95的置信区间 ( ±0.49) 若由一个样本值算得观察值 =5.20,则得到一个 区间(5.20±0.49)即(4.71,5.69)该区间仍称为置信水 平为0.95的置信区间。其含义是该区间包含真值μ 的可信程度为95% { / 2 z / 2 } 1 n z X n P X ( , ) / 2 / 2 z n z X n X ( ) / 2 z n X X x 8/48
§7.4区间估计 置信度与精度是一对矛盾, 置信区间长度与估计精度 一般是在保证置信度的条件 置信水平为1一α的置信区间不下,尽可能提高精度 给定a=0.05,则以下概率也成立 Pf-tnmsx-u oIn <z01}=0.95 即PX-O4<<+ z.01}=0.95 n n 0 故置信区间为(仅-乙,X+可 水平为0.95的置信☒简 o),也是置信 ·与区间的取法和样本容量有关 。在相同的置信水平下,置信区间越短,估计精度越高 /48
§7.4 区间估计 置信区间长度与估计精度 置信水平为1-α的置信区间不是唯一的,如在例1中若 给定α=0.05,则以下概率也成立 即 故置信区间为 ,也是置信 水平为0.95的置信区间 与区间的取法和样本容量有关 在相同的置信水平下,置信区间越短,估计精度越高 } 0.95 / { 0.0 4 0.0 1 z n X P z { 0.0 4 z0.0 1} 0.95 n z X n P X ( , ) 0.0 4 0.0 1 z n z X n X 置信度与精度是一对矛盾, 一般是在保证置信度的条件 下,尽可能提高精度 9/48
§7.4区间估计 9现在比较一下两个置信区间的长度,当a=0.05时 对于例1的置信区间长度为n2as×2=3,92 n 对于本例置信区间长度为,。亿4+co)=408g n 9一般的,对于像标准正态分布概率密度函数那样, 其图象单峰且对称的情况,当固定时,取形如例 1那样的按图象对称规律所取的置信区间其长度为 最短,估计精度最高。 另外,在多数情况下,当样本容量增大时,区间 长度减小,精度增高。但往往在实际应用中得到 足够多的大量的样本是不实际的。 10/48
§7.4 区间估计 现在比较一下两个置信区间的长度,当α=0.05时 对于例1的置信区间长度为 对于本例置信区间长度为 一般的,对于像标准正态分布概率密度函数那样, 其图象单峰且对称的情况,当n固定时,取形如例 1那样的按图象对称规律所取的置信区间其长度为 最短,估计精度最高。 另外,在多数情况下,当样本容量增大时,区间 长度减小,精度增高。但往往在实际应用中得到 足够多的大量的样本是不实际的。 n z n 0.025 2 3.922 n z z n ( 0.0 4 0.0 1 ) 4.08 10/48