粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第十二讲:开拆法
粒子物理与核物理实验中的 数据分析 陈少敏 清华大学 第十二讲:开拆法
本讲要点 数学公式,反应函数(矩阵) 求反应矩阵的逆 修正因子 ·正规化的开拆法 a)Tikhonov规则 b)MaxEnt规则 ·估计量的方差与偏置 ·正规化参数的选择 举例 2
2 本讲要点 数学公式,反应函数(矩阵) 求反应矩阵的逆 修正因子 正规化的开拆法 估计量的方差与偏置 正规化参数的选择 举例 a) Tikhonov 规则 b) MaxEnt 规则
图像还原问题 个常见的问题:由于实验仪器的原因而出现图像变形,例如 10000 30000 10000 8000 25000 8000 20000 6000 6000 15000 4000 4000 10000 2000 2000 5000 aae1e4+1414a1e411t。4 4LL4LLL上L44L -1 -0.5 00.51152 -1080.6040200.20.40.60.81 1 0500.5 1152 真实分布 如果,已知 通过探测器模拟可以 实验观测分布 给出其影响的形式 能否还原出不受实 验仪器影响的分布? → Unfolding(开拆法) 3
3 图像还原问题 ⊗ = 一个常见的问题:由于实验仪器的原因而出现图像变形,例如 如果,已知 通过探测器模拟可以 给出其影响的形式 实验观测分布 能否还原出不受实 验仪器影响的分布? 能否还原出不受实 验仪器影响的分布? Unfolding(开拆法 ) 真实分布
开拆问题的表述 考虑有随机变量y,我们的目标是要找到概率密度函数f(y) 如果函数可参数化为f(y,O),那么确定概率密度函数,等效于 最大似然法 若无参数化形式,可通过构造直方图 80 P,=lin f(ydy )j=1,,M 60 4=4oP,☐"真实的直方图" 40 目标:为4,(或p)构造估计量 20 参数的数日=区间的数目M 问题:y在测量时不可能没有误差 各区间之间填入的数目互 bin j 串,导致f(y)散开变宽。 4
4 开拆问题的表述 考虑有随机变量 ,我们的目标是要找到概率密度函数 如果函数可参数化为 ,那么确定概率密度函数,等效于 若无参数化形式,可通过构造直方图 y f ( y ) ( ;θ ) G f y 最大似然法 θ ˆ G bin ( ) 1,..., j j j t ot j p f y dy j M μ μ p = = = ∫ “真实的直方图 ” 目标: 为 μ j ( 或 p j )构造估计量 问题: y 在测量时不可能没有误差 参数的数目 =区间的数目 M () f y 各区间之间填入的数目互 串,导致 散开变宽
反应矩阵 测量误差的影响:y=真值; X= 观测值 fmeas(x)=R(xIy)fre(y)dy 反应矩阵 观测直方图 写成离散形式 (期待值) M i=1,,N R=P(观测值在第i区|真实值在第j区) 真实直方图 数据:n=(n12,nw) 400 400 这里Y:=E[n] 200 200 注意:d,是常数,n会受 到统计涨落的影响。 0 0.250.50.75 0.25 0.5 0.75 5
5 反应矩阵 测量误差的影响: 数据: y = 真值; x = 观测值 ∫ f x = R x y f y dy meas true ( ) ( | ) ( ) 写成离散形式 R i N M j i ij j , 1,..., 1 = ∑ = = ν μ 观测直方图 (期待值) 反应矩阵 真实直方图 ( | ) R P ij = 观测值在第 i 区 真实值在第 j 区 [ ] ( ,..., ) 1 i i N E n n n n = = ν G 这里 注意: 是常数, 会受 到统计涨落的影响。 μ ν G G , n G