假设检验 假如测量结果为x=(x1,x2,xn)例如:正负电子对撞后所产生的事例 中,对于每个事例,有下列测量量 x1=产生的带电粒子数;x2=粒子的平均横动量;x3=产生的”喷注"数目; 这里x服从在n-维空间的某些与产生事例类型有关的联合概率 密度函数,例如:正负电子对撞,原子核与原子核碰撞,等等。那么 这些联合的概率密度函数f(x)取决于采取何种假设 f(x|Hf(xH)等等 通常情况下很难处理多维的间题, 因此,常常构造低维的统计检验在 简单假设:f(x)无未定参数 不失去甄别各种假设能力的条件下, 复杂假设:f(x;a)含未定参数a 使得(x)成为精简后的数据样本 那么此时的统计量t具有概率密度函数g(t|H)g(t|H1)2 2021-01-29 6
2021-01-29 6 假设检验 1 2 3 x x x = = = 产生的带电粒子数; ; " " ; 粒子的平均横动量 产生的 喷注 数目 0 1 , : , , ( ) ( | ), ( | ), x n f x f x H f x H 这里 服从在 −维空间的某些与产生事例类型有关的联合概率 密度函数 例如 正负电子对撞 原子核与原子核碰撞 等等。那么 这些联合的概率密度函数 取决于采取何种假设。 等等 1 2 ( , ,..., ), n 假如测量结果为 x x x x = 例如:正负电子对撞后所产生的事例 中,对于每个事例,有下列测量量 : ( ;) : ( ) 复杂假设 含未定参数 简单假设 无未定参数 f x f x t x 。 , , x , 使得 成为精简后的数据样本 不失去甄别各种假设能力的条件下 因此 常常构造低维的统计检验 在 通常情况下很难处理多维的 问题 ( ) , 0 1 那么此时的统计量 ( | ), ( | ),... t g t H g t H 具有概率密度函数
拒绝域、第一与第二类误差 考虑统计检验量t服从g(|HD,g(|H1)g() 定义拒绝域使得H假设为真时,t不大可能 接受H0拒绝H0 发生 例如,在上述情况下,t≥tn g(t Hi) 如果观测量t在拒绝域时拒绝H 否则接受H0 假若H为真,但被拒绝的可能性构成第一类误差 a=[g(t|H0)dt(显著水平) 假若接受H,但实际情况却是H为真的可能性构成第二类误差 B=」g(1H1)(1B=功效) 2021-01-29
2021-01-29 7 拒绝域、第一与第二类误差 0 1 0 ( | ) ( | , ,.. , t g t H g t H ) . H t 考虑统计检验量 服从 定义拒绝域 使得 假设为真时,不大可能 发生 ( | ) H0 g t ( | ) H1 g t 接受H0 拒绝H0 = cut t g(t | H )dt 0 − = cut t g(t | H )dt 1 (1- =功效) (显著水平) g(t) t cut t cut 例如,在上述情况下 ,t t 0 0 , , obs t H H 如果观测量 在拒绝域时 拒绝 否则接受 。 0 假若H 为真,但被拒绝的可能性构成第一类误差 0 1 假若接受H H ,但实际情况却是 为真的可能性构成第二类误差
例子:选择不同粒子 束包含K/m粒子的束流穿过2厘米厚的闪烁体,根据电离能损的大小 可以用来进行粒子鉴别。构造能量沉积测量量t,并假设只有两种可能 H0=兀(信号 g(t h) H1=K(本底) 0g=048(030) 通过要求tau来选择x粒子, Gx=0.30(0.18) g( ho) 选择效率为 K cut 8 g(t dt=1-a πt g(t kdt=B cut K 松选择:效率很高,但K本底高 严选择:信号样本纯,但效率低 丌的份额an可从t分布估计f(t2an)=ang(t|)+(1-an)g(t|K) 2021-01-29
2021-01-29 8 例子:选择不同粒子 一束包含K/ 粒子的束流穿过2厘米厚的闪烁体,根据电离能损的大小 可以用来进行粒子鉴别。构造能量沉积测量量 t,并假设只有两种可能 K H0= (信号) H1= K (本底) t g(t) tcut 1 g t H ( | ) 0 通过要求 t<tcut 来选择 粒子, g t H ( | ) 选择效率为 ( | ) 1 ( | ) cut cut t K t g t dt g t K dt − + = = − = = 松选择:效率很高,但 K 本底高; 严选择:信号样本纯,但效率低。 的份额 a 可从 t 分布估计 f t a a g t a g t K ( ; ) ( | ) (1 ) ( | ) = + −
粒子鉴别的概率问题 对于一个具有测量值t的粒子,如何估计是K还是x的概率? h(K|) g(|K) axg(t k)+ag( r) 贝叶斯定理 h(|t) g(|m) axg(t k)+ag(t T 对于贝叶斯论者:上式为粒子是K或x的可信程度 →两种解释 对于频率论者:给定t条件下,粒子是K或x的比率 均有道理 通常情况下,需要给出选择样本的纯度 N,(t<tcut ∫ans(t∫-Mx))t N (Lto [@8(t )+(1-a)g(t K)]dt 丌粒子在区间(-∞,tn]的概率 注意:h(m)有时会被 解释为检验统计量。 2021-01-29
2021-01-29 9 粒子鉴别的概率问题 对于一个具有测量值t 的粒子,如何估计是K 还是 的概率? ( | ) ( | ) ( | ) ( | ) ( | ) ( | ) ( | ) ( | ) a g t K a g t a g t h t a g t K a g t a g t K h K t K K K + = + = 贝叶斯定理 通常情况下,需要给出选择样本的纯度 ( | ) ( | ) ( ) ( ) ( ) [ ( | ) (1 ) ( | )] ( ) ( , ] cut cut cut cut t t cut t t all cut cut N t t a g t dt h t f t dt p N t t a g t a g t K dt f t dt t − − − − = = = + − = − 粒子在区间 的概率 注意: h(|t) 有时会被 解释为检验统计量。 对于贝叶斯论者:上式为粒子是 K 或 的可信程度 对于频率论者:给定 t 条件下,粒子是 K 或 的比率 两种解释 均有道理
纽曼-皮尔森引理与拒绝域 考虑一个多维检验统计量(t1,…,tm),有信号假设H与本底假设H。 问题:如何选择一个最佳的拒绝域或者cut? 纽曼-皮尔森引理:在给定效率条件下,要得到最高纯度的信号样本,或 者在给定的显著水平下得到最高的功效,可以选择下列接受域来实现 g(t ho) 0>c=用以决定效率的常数 g(t HD 对于不含未定参量的最优化一维检验统计量, r=8(/ 简单假设H0与H1的似然之比 g(|H1) 实际应用中,P最好是单值函数。 2021-01-29 10
2021-01-29 10 纽曼- 皮尔森引理与拒绝域 考虑一个多维检验统计量 t=(t1,…,tm) ,有信号假设 H0 与本底假设 H1 。 问题:如何选择一个最佳的拒绝域或者 cut? 纽曼-皮尔森引理:在给定效率条件下,要得到最高纯度的信号样本,或 者在给定的显著水平下得到最高的功效,可以选择下列接受域来实现 用以决定效率的常数 ( | ) ( | ) 1 0 c = g t H g t H 对于不含未定参量的最优化一维检验统计量, ( | ) ( | ) 1 0 g t H g t H r = 简单假设 H0 与 H1 的似然之比 实际应用中,r 最好是单值函数