复习 极大似然估计的求法 选择参数的估计量,使实验结果具有最大概率 估计量的几个评选标准 无偏性 E()=8·样本原点矩是总体原点矩的无偏估计量; 样本方差是总体方差的无偏估计量 无偏估计量的函数未必是无偏估计量 有效性—方差更小的无偏估计量 一·在的所有线性无偏估计量中,样本均值X是最有效的 区间估计—一置信区间
复习 极大似然估计的求法 估计量的几个评选标准 区间估计 ——选择参数的估计量, 使实验结果具有最大概率 无偏性 有效性 一致性 — — ^ E( )= —— 方差更小的无偏估计量. • 样本原点矩是总体原点矩的无偏估计量; • 样本方差是总体方差的无偏估计量 ; • 无偏估计量的函数未必是无偏估计量 ─ • 在 的所有线性无偏估计量中, 样本均值X是最有效的. —— 置信区间
s4单个正态总体均值与方差的置信区间 譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本 得到鱼数N的极大似然估计为1000条 但实际上,N的真值可能大于10003,也“ 可能小于1000条. 若我们能给出一个区间,在此区间内我们合A 理地相信N的真值位于其中,这样对鱼数的估计就有把握多了 也就是说,我们希望确定一个尽可能小的区间,使我们能以 比较高的可靠程度相信它包含真参数值 这里所说的“可靠程度”是用概率来度 湖中鱼数的真值 量的,称为置信概率,置信度或置信水平. 习惯上把置信水平记作1-a,这里a是一个很小的正数
若我们根据一个实际样本 得到鱼数 N 的极大似然估计为1000条. 若我们能给出一个区间, 在此区间内我们合 理地相信 N 的真值位于其中, 这样对鱼数的估计就有把握多了. 但实际上, N 的真值可能大于 1000 条, 也 可能小于1000条. §4 单个正态总体均值与方差的置信区间 也就是说, 我们希望确定一个尽可能小的区间, 使我们能以 比较高的可靠程度相信它包含真参数值. 湖中鱼数的真值 [ ] 这里所说的“可靠程度”是用概率来度 量的, 称为置信概率,置信度或置信水平. 习惯上把置信水平记作 1- , 这里 是一个很小的正数. 譬如,在估计湖中鱼数的问题中, •
置信水平的大小是根据实际需要选定的.例如,通常可取置信 水平=0.95或0.9等等 根据一个实际样本,由给定的置信水平1-a,我们求出一个的 区间(Q,日),使 P(≤0≤6)=1-a, 如何寻找这种区间? 我们选取未知参数的某个估计量,根据置信水平1-a,可以 找到一个正数δ,使得 P(-0|≤δ)=1-a, 只要知道θ的概率分布就可以确定δ.由不等式|6-0|≤8 可以解出: 6-6<6≤b+6 这个不等式就是我们所求的置信区间(,) 下面我们就来正式给出置信区间的定义,并通过例子说明求 置信区间的方法
根据置信水平1- , 可以 找到一个正数 , 例如, 通常可取置信 水平 = 0.95 或 0.9 等等. P( ) 1, 根据一个实际样本, 由给定的置信水平1- , 我们求出一个的 区间( , ), 使 置信水平的大小是根据实际需要选定的. 如何寻找这种区间? P(| ˆ | ) 1 , 使得 ^ 我们选取未知参数的某个估计量 , ^ 只要知道 的概率分布就可以确定 . 下面我们就来正式给出置信区间的定义, 并通过例子说明求 置信区间的方法. ˆ ˆ 由不等式 | ˆ | 可以解出 : 这个不等式就是我们所求的置信区间 ( , )
置信区间的概念 定义4设e是总体X的待估参数,X,X2,…,X是取自 总体X的样本, 对给定值0<a<1,若统计量θ(X1,X2,…,Xn) 和b(X1,X2,…,Xn)满足 P(e<6<6)=1-a, 则称随机区间Q,)为6的置信水平为1-a的双侧置信区间.Q和b 分别称为置信下限和置信上限 置信度置信概率 作区间估计,就是要设法找出两个只依赖于样本的界限(构造 统计量)和日.(旦,0)是随机区间,代入样本值所得的普通区间称 为置信区间的实现 4置信水平为0.95是指100组样本值所得置信区间的实现中, 约有95个能覆盖θ,而不是说一个实现以0.95的概率覆盖了θ 4要求日以很大的可能被包含在置信区间内,就是说,概率 P(0<0<6)=1-a要尽可能大即要求估计尽量可靠 估计的精度要尽可能的高.即要求区间置信的长度尽可能 短,或能体现该要求的其它准则
代入样本值所得的普通区间称 为置信区间的实现. 作区间估计, 就是要设法找出两个只依赖于样本的界限(构造 统计量) 即要求区间置信的长度尽可能 短, 或能体现该要求的其它准则. X1, X2, …, Xn是取自 总体X的样本, P ( ) 1 , 对给定值0<<1, ( , , , ) X1 X2 Xn (X1 , X2 ,, Xn ) ( , ) 满足 定义4 设 是总体 X 的待估参数, 和 分别称为置信下限和置信上限. 一、 置信区间的概念 则称随机区间 为 的置信水平为1- 的双侧置信区间. 若统计量 和 估计的精度要尽可能的高. 要求 以很大的可能被包含在置信区间内, ─ P( < < )= 1- 要尽可能大. ─ 即要求估计尽量可靠. 置信水平为 0.95 是指 100 组样本值所得置信区间的实现中, 就是说 , 概率 置信度 置信概率 和 . ( , )是随机区间, 约有95个能覆盖 , 而不是说一个实现以 0.95 的概率覆盖了
将样本值代入(,)所得的普通区间称为置信区间的实现 置信水平的概率意义;并非一个实现以1a的概率覆盖了θ 估计要尽量可靠,即P(<6<)=1-a要尽可能大 估计的精度要尽可能的高.即要求置信区间的长度尽可能短 可靠度与精度是一对矛盾,一般是在 保证可靠度的条件下尽可能提高精度
置信水平的概率意义; (, ) 并非一个实现以 1- 的概率覆盖了 . 估计的精度要尽可能的高. 即要求置信区间的长度尽可能短. 估计要尽量可靠, ─ 即 P( < < )= 1- 要尽可能大. ─ 可靠度与精度是一对矛盾, 一般是在 保证可靠度的条件下尽可能提高精度. 将样本值代入 所得的普通区间称为置信区间的实现