第四章贝叶斯分析 Bayesean Analysis 540引言 一、决策问题的表格表示—损失矩阵 对无观察(No-data问题a=6 可用表格(损失矩阵)替代决策树来描述决策问题的后果(损失) T[(0 Tt (8 或 T(O1) T(,) 损失矩阵直观、运算方便 二、决策原则 通常,要根据某种原则来选择决策规则δ,使结果最优(或满意),这种原则就叫决策原 则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策 原则。 三、决策问题的分类 1.不确定型(非确定型) 自然状态不确定,且各种状态的概率无法估计. 2风险型 自然状态不确定,但各种状态的概率可以估计. 四、按状态优于 l≤lk,且至少对某个i严格不等式成立,则称行动a按状态优于a4 541不确定型决策问题
4- 1 第四章 贝叶斯分析 Bayesean Analysis §4.0 引言 一、决策问题的表格表示——损失矩阵 对无观察(No-data)问题 a=δ 可用表格(损失矩阵)替代决策树来描述决策问题的后果(损失): a1 … a j … a m π ( 1 ) l 11 l 1 j l 1m … π ( i ) l i1 l ij … π ( n ) lm1 l nm 或 π ( 1 ) … π ( i ) … π ( n ) a1 l 11 l 1i l 1n … a j l ij … a m lm1 lmn 损失矩阵直观、运算方便 二、决策原则 通常,要根据某种原则来选择决策规则δ ,使结果最优(或满意),这种原则就叫决策原 则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙他决策 原则。 三、决策问题的分类: 1.不确定型(非确定型) 自然状态不确定,且各种状态的概率无法估计. 2.风险型 自然状态不确定,但各种状态的概率可以估计. 四、按状态优于: l ij ≤ l ik I, 且至少对某个 i 严格不等式成立, 则称行动 a j 按状态优于 ak §4.1 不确定型决策问题
一、极小化极大(wald原则法则、准则)a1a2a4 min max 1(0,, a) 或 max min u 例 g 16 6 各行动最大损失:13 12 其中损失最小的损失对应于行动a3 采用该原则者极端保守,是悲观主义者,认为老天总跟自己作对 二、极小化极小 min min 1(0,, a,) maX 例 θ0θθ 各行动最小损失 其中损失最小的是行动a2 采用该原则者极端冒险,是乐观主义者,认为总能撞大运。 三、 Hurwitz准则 上两法的折衷,取乐观系数入 min [A min 1(0, a,)+(1-a max 1(0,, a)1 例如λ=0.5时 3.5 (1-A〕maxk:6.5 两者之和:8.58.5 其中损失最小的是:行动a4 四、等概率准则( aplace) 用∑4来评价行动a的优劣 选mn∑l 2
4- 2 一、极小化极大(wald)原则(法则、准则) a1 a2 a4 min j max i l ( i , a j ) 或 max j min i uij 例: a1 a2 a3 a4 1 10 8 7 9 2 4 1 9 2 3 13 16 12 14 4 6 9 8 10 各行动最大损失: 13 16 12 14 其中损失最小的损失对应于行动 a3 . 采用该原则者极端保守, 是悲观主义者, 认为老天总跟自己作对. 二、极小化极小 min j min i l ( i , a j ) 或 max j max i uij 例: a1 a2 a3 a4 1 10 8 7 9 2 4 1 9 2 3 13 16 12 14 4 6 9 8 10 各行动最小损失: 4 1 7 2 其中损失最小的是行动 a2 . 采用该原则者极端冒险,是乐观主义者,认为总能撞大运。 三、Hurwitz 准则 上两法的折衷,取乐观系数入 min j [λ min i l ( i , a j )+(1-λ 〕 max i l ( i , a j )] 例如 λ =0.5 时 λ min i l ij : 2 0.5 3.5 1 (1-λ 〕 max i l ij : 6.5 8 6 7 两者之和: 8.5 8.5 9.5 8 其中损失最小的是:行动 a4 四、等概率准则(Laplace) 用 i l ij 来评价行动 a j 的优劣 选 min j i l ij
上例:∑4:33343635其中行动a的损失最小 五、后梅值极小化极大准则 sage- Niehans) 定义后梅值 l, -min I k 其中minl为自然状态为,时采取不同行动时的最小损失 构成后梅值(机会成本矩阵S={sn}灬n使后梅值极小化极大即 min max Si 例损失矩阵同上,后梅值矩阵为 1402 0324 各种行动的最大后梅值为3484 其中行动a的最大后梅值最小所以按后梅值极小化极大准则应采取行动1 六、Krle准则: 使损失是效用的负数后果的效用化),再用等概率( Laplace准则 七、莫尔诺( Molnar)对理想决策准则的要求(1954) 1能把方案或行动排居完全序 2优劣次序与行动及状态的编号无关; 3若行动a按状态优于a,则应有a优于a 4无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变; 5在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变 6在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变 542风险型决策问题的决策原则 、最大可能值准则 令T(4)=maxn(O,) 选a,使I(0k,a)=min(Ok,a) 例 T()a1 0.2 6.5 6 62 0.5 63 0.3 π(O2)概率最大,各行动损失为345 应选行动a1 4-3
4- 3 上例: i l ij : 33 34 36 35 其中行动 a1 的损失最小 五、后梅值极小化极大准则(svage-Niehans) 定义后梅值 sij = l ij - min k l ik 其中 min k l ik 为自然状态为 i 时采取不同行动时的最小损失. 构成后梅值(机会成本)矩阵 S={ sij } mn ,使后梅值极小化极大,即: min max j i sij 例:损失矩阵同上, 后梅值矩阵为: 3 1 0 2 3 0 8 1 1 4 0 2 0 3 2 4 各种行动的最大后梅值为: 3 4 8 4 其中行动 a1 的最大后梅值最小,所以按后梅值极小化极大准则应采取行动 1. 六、Krelle 准则: 使损失是效用的负数(后果的效用化),再用等概率(Laplace)准则. 七、莫尔诺(Molnor)对理想决策准则的要求 (1954) 1.能把方案或行动排居完全序; 2.优劣次序与行动及状态的编号无关; 3.若行动 ak 按状态优于 a j ,则应有 ak 优于 a j ; 4.无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变; 5.在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变; 6.在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。 §4.2 风险型决策问题的决策原则 一、最大可能值准则 令 π ( k )=maxπ ( i ) 选 ar 使 l( k , ar )= min j l( k , a j ) 例: π ( i ) a1 a2 a3 1 0.2 7 6.5 6 2 0.5 3 4 5 3 0.3 4 1 0 π ( 2 ) 概率最大, 各行动损失为 3 4 5 ∴ 应选行动 a1
二、贝叶斯原则 使期望损失极小 ∑a,a)(a,) 上例中各行动的期望损失分别为4.13.63.7,对应于a,的期望损失36最小 应选a 三、贝努利原则 损失函数取后果效用的负值再用 Bayes原则求最优行动 四、E_V(均值一方差)准则 若El≤El4且σ≤σ则a优于a 通常不存在这样的a 上例中 E 3.6 5.967 不存在符合EV准则的行动,这时可采用印(p,0)的值来判断μ为效益型后果的期望) - f(p,σ=卩-aσ2 f越大越优 五、不完全信息情况下的决策原则 hodges- Lehmann原则) 状态概率分布不可靠时,可采用 q(a∑v可+mv=12,…,m=12…,n φ越大越优 543贝叶斯定理 条件概率 1A、B为随机试验E中的两个事件 P(A B)=P(AB)/P(B 由全概率公式4j=1,2…,n是样本空间的一个划分 P(B)=∑PBA)P(A) 得 Bayes公式 P(AIB=P(B A)P(A/P(B) =P(BIA) P(A,)/> P(B, )P(A,) 2.对O,X两个随机变量
4- 4 二、贝叶斯原则 使期望损失极小: min j { i l( i , a j ) π ( i ) } 上例中,各行动的期望损失分别为 4.1 3.6 3.7, 对应于 a2 的期望损失 3.6 最小 ∴ 应选 a2 . 三、贝努利原则 损失函数取后果效用的负值,再用 Bayes 原则求最优行动. 四、E—V(均值—方差)准则 若 E l ij ≤ E l ik 且 j k 则 a j 优于 ak 通常不存在这样的 a j 上例中: a1 a2 a3 E 4.1 3.6 3.7 V( 2 ) 2.29 3.79 5.967 不存在符合 E—V 准则的行动, 这时可采用 f(μ ,σ )的值来判断(μ 为效益型后果的期望) μ -α σ f( μ ,σ )= μ -α σ 2 μ -α (μ 2 +σ 2 ) f 越大越优. 五、不完全信息情况下的决策原则(Hodges-Lehmann 原则) 状态概率分布不可靠时, 可采用: φ ( a j )=λ uij i i + min i uij i=1,2,… ,m j=1,2,… ,n φ 越大越优. §4.3 贝叶斯定理 一、条件概率 1.A、B 为随机试验 E 中的两个事件 P(A|B)=P(AB)/P(B) 由全概率公式: A j j=1,2,… ,n 是样本空间的一个划分, P(B)= j P(B| A j )P( A j ) 得 Bayes 公式 P( Ai |B)=P(B| Ai )·P( Ai )/P(B) = P(B| Ai )·P( Ai )/ j P(B| A j )P( A j ) 2. 对Θ ,Χ 两个随机变量
条件概率密度 f(6|x)=f(x6)f(6)f(x) 在主观概率论中 (6|x)=f(x))r(6 其中:π()是θ的先验概率密度函数 f(x|θ)是θ出现时,x的条件概率密度又称似然函数 m(x)是x的边缘密度,或称预测密度 m(x)= f(x|0 )(0 ∑pxm(日,) T(|x)是观察值为x的后验概率密度。 例:A坛中白球30%黑球70% B坛中白球70%黑球30% 两坛外形相同,从中任取一坛,作放回摸球12次其中白球4次,黑球8次,求所取为A坛 的概率 解:设观察值4白8黑事件为x,记取A坛为1,取B坛为O2 在末作观察时,先验概率p(61)=p(2)=0.5 则在作观察后,后验概率 P(81Ix)=p(x0,p(0,)/ p(x],p(0,+p(xe2)p(02) =034x078×0.5/(034×078×0.5+07×038×0.5) =074/(0.74×032) 0.2401/0.2482 =0.967 显然,通过试验、观察、可修正先验分布 544贝叶斯分析的正规型与扩展型 一、正规型分析 由 Baysean原则:先验分布为π(θ)时,最优的决策规则δ是贝叶斯规则δ,使贝叶斯风险 r(π,d)=infr(π,S(x) 其中:r(m,8(x)=ER(θ,8(x) =E[El6,8(x)) 1(0, 8(x)f(x 0 )dxT(e )de 据(1)式,选δ使r(π,δ)达到极小,这就是正规型的贝叶斯分析。 在解实际问题时,求使(1)式极小的δ(x)往往十分困难,尤其在状态和观察值比较复杂 时,Δ集中的策略数目很大,穷举所有的δ(x)有困难,且计算量颇大。实际上可用下法 二、扩展型贝叶斯分析( Extensive Form Analysis 在(1)式中因l6,8)>-00,f(x|0),π()均为有限值
4- 5 ·条件概率密度 f(θ | x)=f(x |θ )f(θ )/f(x) ·在主观概率论中 π (θ | x)=f(x |θ )π (θ )/m(x) 其中:π (θ )是θ 的先验概率密度函数 f(x|θ )是θ 出现时,x 的条件概率密度,又称似然函数. m(x)是 x 的边缘密度, 或称预测密度. m(x)= f(x |θ )π (θ ) dθ 或 i p(x| i )π ( i ) π (θ |x)是观察值为 x 的后验概率密度。 例:A 坛中白球 30%黑球 70% B 坛中白球 70%黑球 30% 两坛外形相同,从中任取一坛,作放回摸球 12 次,其中白球 4 次,黑球 8 次,求所取为 A 坛 的概率. 解:设观察值 4 白 8 黑事件为 x,记取 A 坛为 1 , 取 B 坛为 2 在未作观察时,先验概率 p( 1 )=p( 2 )=0.5 则在作观察后,后验概率 P( 1 |x)=p(x| 1 )p( 1 ) p(x| 1 )p( 1 )+p(x| 2 )p( 2 ) = 0 3 4 . × 0 7 8 . ×0.5 ( 0 3 4 . × 0 7 8 . ×0.5+ 0 7 4 . × 0 3 8 . ×0.5) = 0 7 4 . ( 0 7 4 . × 0 3 4 . ) =0.2401 0.2482 =0.967 显然, 通过试验、观察、可修正先验分布. §4.4 贝叶斯分析的正规型与扩展型 一、正规型分析 由 Baysean 原则:先验分布为π (θ )时,最优的决策规则δ 是贝叶斯规则 ,使贝叶斯风险 r(π , )= inf r(π ,δ (x)) 其中:r(π ,δ (x))= E R(θ ,δ (x)) = E [ E x l(θ ,δ (x)) = x l(θ ,δ (x)) f(x |θ )dxπ (θ ) dθ (1) 据(1)式,选 使 r(π ,δ )达到极小,这就是正规型的贝叶斯分析。 在解实际问题时,求使(1)式极小的δ (x)往往十分困难,尤其在状态和观察值比较复杂 时,Δ 集中的策略数目很大,穷举所有的δ (x)有困难,且计算量颇大。实际上可用下法: 二、扩展型贝叶斯分析(Extensive Form Analysis) 在(1)式中因 l(θ ,δ )>-∞,f(x|θ ),π (θ )均为有限值