对两类问题,(4-7)式相当于若 p(X|o)P(o)>p(X/o,)P(),则 X e0)若p(X/o)P(o)<p(X/0,)P(0,),则XE02可改写为:P02若 12(X)= P(X/)0则XE(4-8)P(op(X/)02统计学中称l2(X)为似然比,P(0)/P)为似然比阈值对(4-9)式取自然对数,有:若h(X)= ln /2(X)P(o,Q= lnp(X/0)-np(X/02)≥ln则XE(4-9)P(o))02(4-7),(4-8),(4-9)都是最小错误率贝叶斯决策规则的等价形式
对两类问题,(4-7)式相当于 ( | ) ( ) ( | ) ( ) p X 1 P 1 p X 2 P 2 若 ,则 X 1 ( | ) ( ) ( | ) ( ) 若 p X 1 P 1 p X 2 P 2 ,则 X 2 可改写为: 统计学中称l12(X)为似然比, P(2 ) P(1 ) 为似然比阈值。 对(4-9)式取自然对数,有: 2 1 X (4-7),(4-8),(4-9)都是最小错误率贝叶斯决策规则的等价形式。 2 1 X ( | ) ( | ) ( ) 2 1 12 X X X p p l = ( ) 1 2 ( ) P P 若 ,则 (4-8) ln ( | ) ln ( | ) = p X 1 − p X 2 ( ) ln ( ) 若 h X = l 12 X ( ) ( ) ln 1 2 P P ,则 (4-9)
例4.1假定在细胞识别中,病变细胞的先验概率和正常细胞的先验概率分别为P(@)=0.05,P(の)=0.95。现有一待识别细胞其观察值为X,从类条件概率密度发布曲线上查得:p(X/0)=0.5p(X/0,)=0.2试对细胞X进行分类解:方法1]通过后验概率计算。p(X /ODP(O)P(0, / X) =1~Wp(X (0,)P(,)i-10.5x0.05~0.160.05×0.5+0.95×0.20.2×0.95P(02 / X)=0.8840.05×0.5+0.95×0.2.:.XE02: P(02 / X)>P(0 /X)
= ( ) = 2 1 1 1 | ( ) ( | ) ( ) ( | ) i p i P i p P P X X X 0.16 0.05 0.5 0.95 0.2 0.5 0.05 + = 0.884 0.05 0.5 0.95 0.2 0.2 0.95 ( | ) 2 + P X = ( | ) ( | ) P 2 X P 1 X X 2 例4.1 假定在细胞识别中,病变细胞的先验概率和正常细胞的 先验概率分别为 。现有一待识别细胞, 其观察值为X,从类条件概率密度发布曲线上查得: P(1 ) = 0.05, P(2 ) = 0.95 p(X |1 ) = 0.5 p(X |2 ) = 0.2 试对细胞X进行分类。 解:[方法1] 通过后验概率计算
[方法2]:利用先验概率和类概率密度计算。p(X/)P(o)=0.5×0.05=0.025p(X/0,)P(@)=0.2×0.95=0.19: p(X /0,)P(0)> p(X /0)P(0).XEの,是正常细胞
[方法2]:利用先验概率和类概率密度计算。 p(X |1 )P(1 )= 0.50.05 = 0.025 p(X |2 )P(2 ) = 0.20.95 = 0.19 ( | ) ( ) ( | ) ( ) p X 2 P 2 p X 1 P 1 X 2 ,是正常细胞
4.2.2最小风险贝叶斯决策1.风险的概念*自动灭火系统:*疾病诊断:不同的错判造成的损失不同,因此风险不同,两者紧密相连。考虑到对某一类的错判要比对另一类的错判更为关键把最小错误率的贝叶斯判决做一些修改,提出了“条件平均风险”的概念。最小风险贝叶斯决策基本思想:以各种错误分类所造成的平均风险最小为规则,进行分类决策
最小风险贝叶斯决策基本思想: 以各种错误分类所造成的平均风险最小为规则,进行分类 决策。 4.2.2 最小风险贝叶斯决策 1. 风险的概念 * 自动灭火系统: * 疾病诊断: 不同的错判造成的损失不同,因此风险不同,两者紧密相连 。 考虑到对某一类的错判要比对另一类的错判更为关键, 把最小错误率的贝叶斯判决做一些修改,提出了“条件平均 风险” 的概念
2.决策规则如果观察样本X被判定属于の类,则条件平对M类问题,均风险r(X)指将X判为属于の,类时造成的平均损失L,对P作加权平均Mr(X)= EL,(X)P(0, IX)j=l自然属性为类的样式中,本,被划分到类中在类中产生一错误分类判决后指定的判决号:i-分类,风险增加。样本实际属于的类别号:i将自然属性是の类的样本决策为の类时的是非代价,Li即损失函数。0或负值i=j时L,(X)=正值ij时
对M类问题,如果观察样本X被判定属于ωi类,则条件平 均风险ri (X)指将X判为属于ωi类时造成的平均损失。 = = M j i Li j P j r 1 (X) (X) ( | X) 2. 决策规则 ( ) = = 正值 时 或负值 时 i j i j Li j 0 X 式中, i ——分类判决后指定的判决号; j ——样本实际属于的类别号; Lij——将自然属性是ωj类的样本决策为ωi类时的是非代价, 即损失函数。 自然属性为j类的样 本,被划分到i类中, 在i类中产生一错误 分类,风险增加。 Lij对P作加权平均