1、严格来和合的引 释搜器酷贸 混合策路纳什均衡结果精:。 1、严格变净博弃和浅合草味的引镜 -i 齐王 0808021082482028 收矩阵 格博和合的引 1/+111+-D- A=A=A=月=A=月=% 4-+1+1-1+1+= 马
6 混合策略扩展博弈:当把博弈方在混合策略的策略 空间(概率分布空间)的选择看作一个博弈时,就是 原博弈的“混合策略扩展博弈”。 混合策略纳什均衡:包含混合策略的策略组合构成的 纳什均衡称为“混合策略纳什均衡”。 11:53:31 31 1、 严格竞争博弈和混合策略的引进 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析 首先,本博弈中两博弈方决策的第一个原则,同样也是 不能让对方猜到自己的选择,因而必须在决策时利用随 机性。 第二个原则是他们选择每种策略的概率一定要恰好使对 方无机可乘,即让对方无法通过针对性地倾向某一策略 而在博弈中占上风。 3 1 2 5 A B A B p p p p 2 5 3 1 C D C D p p p p 3 1 2 5 A B A B p p p p 2 5 3 1 C D C D p p p p 1、 严格竞争博弈和混合策略的引进 (3)一个例子 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 混合策略纳什均衡结果 1 1 2 5 3 1 3 1 2 5 C D A B C D C D A B A B p p p p p p p p p p p p 0.2 0.8 0.2 0.8 D C B A p p p p 0.8 0.8 3 0.8 0.2 1 0.2 0.8 2 0.2 0.2 5 2.6 0.8 0.8 2 0.8 0.2 5 0.2 0.8 3 0.2 0.2 1 2.6 2 1 e e u u 1、 严格竞争博弈和混合策略的引进 (4)齐威王田忌赛马 11:53:31 34 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下 上下中 中上下 中下上 上下中 下中上 上 中 下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上 田 忌 齐 威 王 收益矩阵 1、 严格竞争博弈和混合策略的引进 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下a 上中下b 上中下c 上中下d 上中下e 上中下f 上 中 下g 上 中 下h 上 中 下i 上 中 下j 上 中 下k 上 中 下l 田 忌 齐 威 王 得益矩阵 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 上中下a 上中下b 上中下c 上中下d 上中下e 上中下f 上 中 下g 上 中 下h 上 中 下i 上 中 下j 上 中 下k 上 中 下l 田 忌 齐 威 王 得益矩阵 a b c d e f a b c d e f a b c d e f a b c d e f a b c d e f a b c d e f p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p 3 3 3 3 3 3 pa pb pc pd pe pf 1 6 1 6 g h i j k l p p p p p p ( 3 1 1 1 1 1) 1 6 1 (3 1 1 1 1 1) 1 6 1 e e u u 田忌 齐威王 该博弈中,齐威王和田忌都以1/6的相同概率随机选择 各自的六个纯策略,构成本博弈唯一的纯策略纳什均衡。 在上述混合策略下,齐威王的得益为: 1/6(3+1+1+1+1-1)=1 田忌的得益为: 1/6(1-3-1-1-1-1)=-1 即经过多次进行这样的赛马,齐威王平均每次能赢田忌 一千斤铜,这是因为齐威王三匹马的总体实力略胜田忌 的三匹马的缘故。 11:53:31 36 1、 严格竞争博弈和混合策略的引进
1、严格变博弃和观合草的3引 岛 2、多重均衡博弃和混合策略 一夫责之争的通合策毫纳什均衡 l-v 高 的 不是团 ②重表除严格 什均衡 在才牛 7
7 因为对博弈论的贡献而成为1994年经济学诺贝尔奖得 主之一的塞尔腾(Selten)教授,1996年3月在上海的 一次讲演中,举了一个小偷和守卫之间博弈的例子。 一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时 守卫在睡觉,则小偷就能得手,偷得价值为V的赃 物; 如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。 设小偷被抓住后要坐牢,负效用为-P,守卫睡觉而未 遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用 为-D。而如果小偷不偷,则他既无得也无失,守卫不 睡意味着出一份力挣一份钱,他也没有得失。 根据上述假设,小偷在该博弈中有“偷”和“不偷” 两种可选策略,守卫有“睡”和“不睡”两种可选策 略,双方的得益矩阵如下图所示。 (5)小偷和守卫的博弈 1、 严格竞争博弈和混合策略的引进 小偷和守卫的博弈的混合策略纳什均衡 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 0 - D - D’ 守卫 得益(睡) S Pt 小偷 1 偷的概率 0 - D - D’ 守卫 得益(睡) S Pt 小偷 1 偷的概率 * Pt *' Pt 0 - P - P’ 小偷 得益(偷) V Pg 守卫 1 睡的概略 0 - P - P’ 小偷 得益(偷) V Pg 守卫 1 睡的概略 * Pg * Pg 在小偷和守卫的博弈中,小偷分别以概率Pt*和1-Pt*随机选择 “偷”与“不偷”, 守卫分别以概率Pg*和1- Pg*随机选择“睡”与“不睡”时, 双方都不能通过改变策略 或概率改善自己的期望得益,因此构成混合策略纳什均衡,这也是该博弈惟一 的纳什均衡。 (小偷偷的概率应使守卫睡与不睡的收益相同,即为0;守卫睡觉的 概率应使小偷偷与不偷的收益相同,即期望收益为0) (1 ) ( ) 0 (1 ) 0 ( ) (1 ) 0 (1 ) 0 g g g g t t t t p V p P p p V,-D -P,0 p D p S p p 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 偷 pt g p 1pt g 1p V P P p S D S p g t * * 激励的悖论: 1.加重对守卫的处罚(D),短期中的效果是使守卫尽职,在 长期中并不能使守卫更尽职,但会降低盗窃发生的概率; 2.加重对小偷的处罚(P),短期内能抑制盗窃发生率,长期 并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉。 p (C)1 p (F)0 p (C)0 p (F)3 w w w w p (C)2 p (F)0 p (C)0 p (F)1 h h h h 妻子的混合策略 丈夫的混合策略 夫妻之争博弈的混合策略纳什均衡 策略 得益 妻子 (0.75,0.25) 0.67 丈夫 (1/3,2/3) 0.75 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 2, 1 0, 0 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 不难发现,这个结果明显不如夫 妻双方能交流协商时,任何一方 迁就另一方时双方的得益好,因 为那时任何一方都至少得1。这是 因为双方缺乏沟通时很可能出现 最差结果而造成的。 夫妻之争的混合策略纳什均衡 2、多重均衡博弈和混合策略 3、 混合策略和重复剔除严格劣策略法 在包括混合策略的情况下,关于重复剔除严格劣 策略法的结论仍然是成立的。即: ①任何博弈方都不会采用任何严格劣策略,不管 它们是纯策略还是混合策略; ②重复剔除严格劣策略法不会消去任何纳什均衡, 包括纯策略纳什均衡和混合策略纳什均衡; ③如果经过重复剔除后留下的策略组合是惟一的, 那么一定是纳什均衡。 因此,在考虑混合策略的情况下,我们仍然可利 用重复剔除严格劣策略法进行分析,而且实际上 引进混合策略只有使重复剔除严格劣策略法的用 处更大。 一个数值例子 在这个博弈中,博弈方1有U、M和D三种可选策略, 博弈方2有L和R两种可选策略。 不难发现在纯策略的意义上,该博弈中不存在任何严 格下策。因此,如果我们只考虑纯策略,那么两个博 弈方都没有任何严格下策,因而严格下策反复消去法 就无从运用。 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3, 1 0, 2 0, 2 3, 3 1, 3 1, 1 L R UM D 博弈方2 博 弈 方1 3、 混合策略和重复剔除严格劣策略法