粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第七讲:最大似然法(I)
粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第七讲:最大似然法(I)
本讲要点 似然函数,最大似然估计量 ▣ 指数与高斯概率密度函数的参数确定举 ▣最大似然估计量的方差 >解析法 >蒙特卡罗法 >RCF边界法 >图解法 口不等精度观测结果的并合 2
2 本讲要点 似然函数,最大似然估计量 指数与高斯概率密度函数的参数确定举 最大似然估计量的方差 不等精度观测结果的并合 ¾解析法 ¾蒙特卡罗法 ¾RCF边界法 ¾图解法
参数估计量的好坏标准 符合程度(一致性) Lim0=0, LimP(0-0>8)=0,对任何ε>0都成立。 n->o0 偏置大小(无偏性) b=E[0-0=0 物理研究中如何 寻找未知参数? 方差大小(有效性) 对任何估计量0,都有Lim VI,]≤1,则渐进效佳估计量。 n→0 vie,] 最大似然法是用来寻求未知参数适当估计值的一种方法 3
3 参数估计量的好坏标准 符合程度(一致性) 偏置大小(无偏性) 方差大小(有效性) ˆ , ˆ (| | ) 0, >0 n n Li m Li m P θ θ θ θ ε ε →∞ →∞ = − > = 对任何 都成立。 ˆ b E = [ ] θ θ− = 0 ' ˆ [ ] ˆ ˆ ' 1 ˆ [ ] n n n V Lim V θ θ θ →∞ θ 对任何估计量 ,都有 ≤ ,则 渐进效佳估计量。 最大似然法是用来寻求未知参数适当估计值的一种方法 最大似然法是用来寻求未知参数适当估计值的一种方法 物理研究中如何 寻找未知参数?
参数估计与概率大小的关系 考虑有数据样本元=(x,,xn),这里x服从pdf分布f(x;0) 目标:估计0。或者更为一般地,估计0=(0,,0m) 如果f(x;)为真,则有 P(对所有在[x,x,+dx]观察到的x)=∏f(x,0)dx i=l 如果假设(包括0的取值)为真 可以预料会使观测结果具有高的概率。 如果假设的0取值远离真值 会使观测结果具有低的概率。 4
4 参数估计与概率大小的关系 1 ( ,..., ) pdf ( ; ) n x x = x x f x θ G 考虑有数据样本 ,这里 服从 分布 。 1 ( ,..., ) θ θ = θ θ m G 目标:估计 。或者更为一般地,估计 如果 (; f x θ ) 为真,则有 1 ( [ , ] ) ( , ) n i i i i i i i P x x dx x f x θ dx = 对所有在 + = 观察到的 ∏ 如果假设 (包括 θ 的取值 )为真 可以预料会使观测结果具有高的概率。 如果假设的 θ 取值远离真值 会使观测结果具有低的概率
似然函数 根据参数好坏与概率大小的关系,可以认为真实的0应使得下式定义的 似然函数 注意:虽然L(O)=∫ampe(;8), L(0)=Πfx,e) 但是L()只是的函数。这是 i 因为在实验完成以后,就可 以被当做常数。 有大的数值。 在经典统计理论里,L(0)并不是0的概率密度函数。 0不是一个随机变量,但0却是。 在贝叶斯统计理论里,把L()=L(x|0)看作给定情况下,x的概率密度 函数,然后利用贝叶斯定理得到验后概率密度函数p(Ox)。 5
5 似然函数 在经典统计理论里,L(θ )并不是θ 的概率密度函数。 根据参数好坏与概率大小的关系,可以认为真实的θ 应使得下式定义的 似然函数 ∏ = = n i i L f x 1 (θ ) ( ,θ ) ˆ θ θ 不是一个随机变量,但 却是。 有大的数值。 () ( ; ), ( ) L fsample x L x θ θ θ θ = G G 注意:虽然 但是 只是 的函数。这是 因为在实验完成以后, 就可 以被当做常数。 ( ) ( | ) (|) L L x x p x θ θ θ θ = G G G 在贝叶斯统计理论里,把 看作给定 情况下, 的概率密度 函数,然后利用贝叶斯定理得到验后概率密度函数