粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第十一讲:置信区间
粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第十一讲:置信区间
本讲要点 统计误差中的标准误差问题 经典置信区间问题 ■利用似然函数或二乘函数确定置信区间 2
2 本讲要点 统计误差中的标准误差问题 经典置信区间问题 利用似然函数或二乘函数确定置信区间
测量结果的表述与含义 实验数据:x,,X 实验目的:估计日 并且还应给出6的方差,即o房。 结果应该报告成下述形式 0b±66=5.73±021 其真正的含义是什么呢? 如果我们知道0将服从某一概率密度函数分布g(0,O),那么上述 结果的正确表述应该是 0的估计值为5.73 的估计值为0.21 → o,测量了g(0,0)的分布宽度 3
3 测量结果的表述与含义 其真正的含义是什么呢? 1,..., n 实验数据:x x ˆ 实验目的:估计 θobs ˆ 5.73 0.21 ˆ ± ˆ = ± θ θ obs σ ˆ ˆ 如果我们知道 θ θ (; 将服从某一概率密度函数分布 g θ ),那么上述 结果的正确表述应该是 θ 的估计值为 5.73 ˆ 0.21 θ σ 的估计值为 m2 ˆ ˆ θ 并且还应给出 θ σ 的方差,即 。结果应该报告成下述形式 ˆ ˆ g( ; ) θ σ θ 测量了 θ 的分布宽度
参数估计值的分布 通常参数估计值服从的概率密度分布函数g(0;)是多维高斯分布 6和=cov©,0,]综合了我们对g(0,0)的了解或估计 可以用来作误差传递的输入参量, 以及用最小二乘法求平均值等等。 我们可以此约定来报告误差,而不管概率密度函数g(0:)的形式。 唯一例外的是当我们要对不同实验求平均值时,它的形式就会发挥作用。 如果g(0,)是高斯形式的话,置信区间可以表述为 [0b-6,0s+6a] 给出了对应于68.3%置信区间范围。 如果g(0:0)不是服从高斯分布 中心置信区间应给出不对称的误差 4
4 参数估计值的分布 ˆ 通常参数估计值服从的概率密度分布函数 g( ; θ θ ) 是多维高斯分布 ˆ ˆ ˆ m ˆ ˆ co v[ , ] ( ; ) θ θ V g = i j θ θ θ G G G 和 综合了我们对 的了解或估计 可以用来作误差传递的输入参量, 以及用最小二乘法求平均值等等。 ˆ 如果 g( ; θ θ ) 是高斯形式的话,置信区间可以表述为 ˆ ] ˆ ˆ , ˆ [ ˆ ˆ θ θ θ obs − σ θ obs + σ 中心置信区间应给出不对称的误差 ˆ 如果 g( ; θ θ ) 不是服从高斯分布 ˆ 我们可以此约定来报告误差,而不管概率密度函数 (g θ θ; ) 的形式。 唯一例外的是当我们要对不同实验求平均值时,它的形式就会发挥作用。 给出了对应于 68.3% 置信区间范围
经典置信区间 假设我们对参数0有估计量日,并且有估计值 obs> 为了正确表述结果,对于所有的0我们仍需要知道g(0:O)的形式。 首先需要指定“上下分布尾部的概率”,例如:=B=0.05 然后找出4.(O),ye(0),使得 a=P(0≥ua(0) (e:e)6 o,8(d,e)d0 =1-G(u,(0);8) 0.5 B=P(0≤VB(0) B 」g(dodd =G(ye(0);0) 5
5 经典置信区间 首先需要指定“上下分布尾部的概率”,例如: α = β = 0.05 ( ) ( ) ˆ ( ( ) ) ˆ ˆ ( ; ) 1 ( ( ); ), ˆ ( ( ) ) ˆ ˆ ( ; ) ( ( ); ) u P u g d G u P g d G α β α θ α β ν θ β α θ θ θ θ θ θ θ β θ ν θ θ θ θ ν θ θ ∞ −∞ = ≥ = = − = ≤ = = ∫ ∫ ˆ ˆ , 假设我们对参数 θ 有估计量 θ θ ,并且有估计值 obs ˆ 为了正确表述结果,对于所有的θ θ 我们 仍需要知道 g( ; θ )的形式。 , u ( ) ( ), 然后找出 α β θ ν θ 使得