当前位置：和泉文库 > 计算机 > 浏览文档

北京大学：《模式识别》课程教学资源（课件讲稿）贝叶斯决策理论（第二部分）

文件格式：PDF，文件大小：373.87KB，售价：7.2元

文档详细内容（约8页）

第二章贝叶斯决策理论 2009.09.29 2 基于最小风险的贝叶斯决策  条件期望损失：对于特定的观察样本 x（特征向量），决策造成的损失对 x 实际所属类别的各种可能的平均，也叫做条件风险：  期望风险：对所有 x 取值所作的决策α(x)所带来的平均风险，即条件风险对 x 的数学期望。 i 1 ( |) ( , ) ( , )( | ) i ij c ij j j R E P               x x R ER R p d ( ) [ ( ( ) | )] ( ( ) | ) ( )      xx xx xx 3 基于最小风险的贝叶斯决策  目标：决策带来的损失的平均值——（平均）风险最小。  决策规则  通过保证对于每个观测值下的条件风险最小，使得决策的数学期望——平均风险最小。基于最小风险的贝叶斯决策是一致最优决策。 1, , , if ( | ) min ( | ) kk i j a Decide R R     x x   4 基于最小风险的贝叶斯决策  最小风险决策的计算步骤  在已知P(ωi)，p(x |ωi)，i=1,…,c，以及给定待识别样本 x 的情况下，根据贝叶斯公式计算后验概率；  利用后验概率及决策表（或损失矩阵），算出每个决策的条件风险；  按照最小的条件风险进行决策。 ( | ) R i x 5 基于最小风险的贝叶斯决策  两类别问题  定义（符号简化）  条件风险 1 1 2 2 ij j : deciding ; : deciding ; ( , ), , 1, 2. i i j            行为行为损失 1 11 1 12 2 2 21 1 22 2 ( |) ( |) ( |) ( |) ( |) ( |) R PP R PP           xxx xxx 6 基于最小风险的贝叶斯决策  两类别问题  决策规则用贝叶斯公式展开 1 21 11 1 12 22 2 2 , if ( ) ( | ) ( )( | ) Decide , otherwise      P P       x x 12 22 2 1 2 21 11 1 2 1 ( )() , if > Decide ( )() , otherwise (| ) ( | ) P P P P                x x

13 Neyman-Pearson 决策  问题的提出  某些两类判决问题，某一类错误较另一类错误更为重要 — 损失更为严重。例如在癌细胞识别问题中，把异常误判为正常的损失更为严重。  先验概率未知。  基本思想  严格限制较重要的一类错误概率，在令其等于某常数的约束下使另一类误判概率最小。 14 Neyman-Pearson 决策  两类错误率  令 R 是整个特征空间，R1 是类别ω1的决策域， R2 是类别ω2的决策域：R1 + R2= R。  P1(error)，P2(error)即两类错误率。 1 2 1 2 1 2 2 1 2 2 11 2 21 1 2 2 11 ( ) ( | ) () ( | ) () ( | )( ) ( | )( ) () ( | ) () ( | ) ( )( ) ( )( ) R R R R R R P error P p d P p d p Pd p Pd P p dx P p d P P error P P error                        x xx x xx x xx x x xx 15 Neyman-Pearson 决策  决策目标：在P2(error)=ε0条件下，求P1(error) 极小值。  根据Lagrange乘子法，建立数学模型其中λ是Lagrange乘子，目标是求γ的极小值。 1 20    P error P error ( ) ( ( ) ),   2 1 1 2 1 11 2 2 20 ( ) (| ) 1 (| ) ; () ( | )1 ( | ) . R R R R P error p d p d P error p d p d               xx xx xx xx 注意： 16 Neyman-Pearson 决策  决策目标：极小化γ  对于固定的λ，要使得γ最小，应满足 1 2 0 21 0 12 (1 ) [ ( ) ( )] (1 ) [ ( ) ( )] R R p p d p p d                   x xx x xx ；或者； 1 21 21 2 , ( | ) ( | ) 0; , ( | ) ( | ) 0; Rp p Rp p            x xx xx x 17 Neyman-Pearson 决策  决策准则 N-P决策规则归结为找阈值λ，使得 λ的显式解不易求解，可用试探法。 1 2 1 2 1 1 2 2 if ( ) ( ), then or ( ) ( ) , then ( ) p p p l p                     xx x x x x x 1 2 0 (| ) . R p d     x x 18 Neyman-Pearson 决策  求决策准则的方法二  令 t 是 R1 和 R2 的分界点（面），将γ分别对 t 和λ求偏导，γ极值点存在的必要条件是： 方程式确定一个分界面，使得P2(error)=ε0 ，同时又使得P1(error)尽可能小。该分界面上 x 值具有一个特点，即它们的两类条件密度函数之比是一个常数，该比值就是Lagrange乘子λ 。 1 1 2 2 0 (| ) 0 ; (| ) 0 ( | ) ; R p t p p d                  x x x x

19 Neyman-Pearson 决策  例解：一个两类问题中，模式均为二维正态分布，其均值矢量和协方差阵分别为：  解： 1 2 12 ( 1,0) , (1,0) , . T T         I 0 设， 0.09 Neyman-Pearson   求的决策阈值。               2 2 1 11 12 2 2 2 2 2 12 1 1 2 11 11 ( | ) exp exp 1 ; 22 22 11 11 ( | ) exp exp 1 ; 22 22 (| ) exp( 2 ). (| ) T T p xx p xx p x p                                              x xx x xx x x 20 Neyman-Pearson 决策  例解  判决准则： 1 1 2 2 1 if exp( 2 ) i e , th 1 - ln 2 en ; x x x               ， . . x 对于不同的，决策边界是平行于的不同直线。（如图） 21 Neyman-Pearson 决策  例解  通过计算P2(error)=ε0求解λ： 1 2 2 1 2 2 ln 2 1 2 2 1 1 2 ln 2 1 1 ( ) (| ) 1 ( 1) exp 2 2 1 ( 1) exp . 2 2 R P error p d x x dx dx x dx                                  x x  0.046 0.089 0.0159 0.258 0.378 0  4 2 1 1/2 1/4  0 与的关系表  22 Neyman-Pearson 决策  最小错误率的Bayes决策与N-P决策  均以似然比为基础；  最小错误率的Bayes决策的阈值是先验概率之比  Neyman-Pearson决策的阈值是Lagrange乘子（和先验概率无关）。 ; ( ) ( ) 1 2   P P 23 其他决策方法（自学）  最大最小决策  基本思想：类先验概率未知，考查先验概率变化对错误率的影响，找出使最小风险贝叶斯决策的风险最大的先验概率，以这种最坏情况设计分类器。  序贯分类方法  基本思想：除考虑分类造成的损失外，还考虑特征获取所造成的代价。先用一部分特征分类，然后逐步加入新特征以减少分类损失，同时衡量总的损失，以求得最优的效益。 24 分类器设计  分类器(classifier)：能够将每个样本都分到某个类别中去（或者拒绝）的计算机算法。  是从特征空间到决策空间的映射。  决策域(decision region)：分类器将 d 维特征空间划分为若干区域。  决策面(decision boundary)：不同类别区域之间的边界，又叫作分类边界、决策边界或分类面。数学上用解析形式表示成决策面方程

25 分类器设计  判别函数(discriminant functions)：是模式（或特征向量）x 的函数，用于表述决策规则。  对于c类别问题，相应于每一类别定义一个函数，构成一组判别函数 gi (x), i = 1,2,…,c，使得即将 x 分类到有最大判别函数值的类别。  判别函数的选择不唯一。如果 f(·) 是一个单调递增函数（如logarithm），将 gi (x) 替换成 f(gi (x)) 不改变判决结果。 简化分析和计算！ ( ) ( ) 1, , , ; ij i gg j xx x       c j i 26 分类器设计  最小错误率Bayes决策  决策规则：将x归于ωi类，如果  判别函数 (1) ( ) ( | ) (2) ( ) ( | ) ( ) (3) ( ) ln ( | ) ln ( ) i i i ii i ii g P gpP gp P          x x x x x x   1, , 1, , 1, , (1) ( | ) max ( | ); or (2) ( | ) ( ) max ( | ) ( ); (| ) (| ) or (3) ( ) , 1, , , ; (| ) (| ) or (4) ln ( | ) ln ( ) max ln ( | ) ln ( ) ; i j j c ii j j j c j i j i ii j j j c P P pP p P p p l j cj i p p pP p P                     x x x x x x x x x x x     27 分类器设计  最小错误率Bayes决策  决策面方程：相邻的两个决策域在决策面上的判别函数值相等，即 ( ) ( ). i j g g x x  28 分类器设计  最小错误率Bayes决策  分类器：一个计算 c 个判别函数并选取与最大判别函数值相对应的类别的网络或机器。 29 分类器设计  两类别的最小错误率Bayes决策  判决函数：可只定义一个判别函数此时的决策规则是 1 2 gg g ( ) ( ) ( ), xxx   1 2 11 2 2 1 1 2 2 (1) ( ) ( | ) ( | ) (2) ( ) ( | )( ) ( | )( ) (| ) ( ) (3) ( ) ln ln (| ) ( ) gP P gp P p P p P g p P                xxx xx x x x x 1 2 if ( ) 0, then decide . g        x x 30 分类器设计  两类别的最小错误率Bayes决策  决策面方程  分类器 g( ) 0. x 

点击进入文档下载页（PDF格式）

共8页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录