第二章完全信息静态博弈 一、博弈的标准式和纳什均衡 一、博弃的标准式和钠什均衡 、的标准式表 二、合略和纳什均衡的春在性 三、二人和博弃 四、应用单创 1、博弈的标准式表述 1、博弈的标准式表述 准式的三果索 学例:四徒田境州双交量是体末指笔) 实量短可由任意多的行和列成,“双实量 列行代来四钱2的枝,在河个字中后图。 一、博弃的标准式表述 1、博弈的标准式表述 举例:齐王田是赛马 博弃的致学表 假设一个有个博方,博弃方1的能集又称第 S表示博方1的第个策
1 第二章 完全信息静态博弈 一、博弈的标准式和纳什均衡 二、混合策略和纳什均衡的存在性 三、二人零和博弈 四、应用举例 一、博弈的标准式和纳什均衡 1、博弈的标准式表述 2、重复剔除严格劣战略 3、纳什均衡 标准式的三要素 (1) 参与人(或称为博弈方) (2) 每个参与人可选择的战略集 (3) 收益:针对所有参与人可选择的战略组合,每一 个参与人获得的收益 1、博弈的标准式表述 举例:囚徒困境(用双变量矩阵来描述) 双变量矩阵可由任意多的行和列组成,“双变量” 指的是在两个博弈方的博弈中,每一个单元格有两 个数字,分别表示两个参与者的收益。 -5, -5 0, -8 -8, 0 -1, -1 坦 白 不坦白 坦 白 不坦白 囚徒2 囚 徒 1 1、博弈的标准式表述 横行代表囚徒1的收益,在两个数字中放在前面; 列行代表囚徒2的收益,在两个数字中放在后面。 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 -1, 1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 -1, 1 3,-3 1,-1 1,-1 1,-1 -1, 1 1,-1 1,-1 3,-3 一、博弈的标准式表述 举例:齐王田忌赛马 齐 王 上中下 上下中 中上下 中下上 下上中 下中上 上中下 上下中 中上下 中下上 下上中 下中上 田忌 注: ① 同时选择战略,不意味着行动必须是同时的; ②标准式不仅可用来描述静态博弈,也可以用来描述序 贯行动的动态博弈,只不过在分析问题时,扩展式博弈 更常用。 11:53:31 6 假设一个博弈有n个博弈方,博弈方i的策略集(又称策略空间) 为Si (i=1,2,…,n) ,用sij∈ Si表示博弈方i的第j个策略; 若si∈Si (i=1,2,…,n),称s=(s1 ,s2 , … ,sn )为一个策略组合; 若用s-i = (s1 ,s2 , … ,si-1, si+1, … ,sn ),则 s = (si ,s-i)。 博弈的数学表述 1、博弈的标准式表述
一、博弈的标准式表述 2、重复别除严格劣战略 用u()巴6.,,(1-L,2)表示方1在 策略食一(, ,及)的得差u,是策略燕 是该博 81×8X.X8上的多元最服, 稳史的结” (Dominant-strategy ,则该表示为 四许的视得路东中的(便白。员白)卖厚上就是 2、重复剔除严格劣战略 2、重复剔除严格劣战略 2) 重复别除产格战略 弃方 小 2、重复剔除严格劣战略 2、重复剔除严格劣战略 ,定义 地。果在 博弃中,不其他博 可变1 给他来的得益要小 相对于后一种
2 11:53:31 7 用ui (s)=ui (s1 ,s2 , … ,sn ) (i=1,2,…,n)表示博弈方i 在 策略组合s=(s1 ,s2 , … ,sn )的得益, ui是策略集 S1×S2×…×Sn上的多元函数。 定义:若一个N人博弈的策略空间为Si ,得益函数为: ui (s)=ui (s1 ,s2 , … ,sn )(i=1,2,…,n),则该博弈表示为: G={N,S1 ,S2 , … ,Sn;u1 ,u2 ,…,un } 。 一、博弈的标准式表述 (1)、占优均衡 如果一个博弈的某个策略组合中的所有策略都是 各个博弈方各自的上策,那么这个策略组合肯定 是所有博弈方都愿意选择的,必然是该博弈比较 稳定的结果。我们称这样的策略组合为该博弈的 一个“占优均衡” (Dominant-strategy Equilibrium)。 占优均衡是博弈分析中最基本的均衡概念之一, 占优均衡分析是最基本的博弈分析方法。 囚徒的困境博弈中的(坦白,坦白)实际上就是 一个占优均衡。 2、重复剔除严格劣战略 (2)、占优均衡分析的局限性 并非每个博弈方都有这种绝对偏好的上策,而且 常常是所有博弈方都没有上策,因为博弈方的最 优策略随其他博弈方的策略而变化正是博弈问题 的根本特征,是博弈关系相互依存性的主要表现 形式。 因此占优均衡不是普遍存在的。 例如赛马博弈就没有占优均衡,因为各个博弈方 的任何策略都不是绝对最优的,每个博弈方都没 有绝对偏好的上策。所以,占优均衡并不能解决 所有的博弈问题,最多只是在分析少数博弈时有 效。 2、重复剔除严格劣战略 (3)、重复剔除严格劣战略 ①、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。 2、重复剔除严格劣战略 定义 一般地,如果在一个博弈中,不管其他博 弈方的策略如何变化,一个博弈方的某种 策略给他带来的得益,总是比另一种策略 给他带来的得益要小,那么我们称前一种 策略为相对于后一种策略的一个“严格劣 策略”。 2、重复剔除严格劣战略 ②举例 为了说明重复剔除严格劣策略法与占优均衡 分析的区别,我们用一个例子来说明。首先 看下图中这个抽象掉现实问题内容的,两个 博弈方分别有三种和两种策略的不对称博弈 问题。 博 弈 方 1 博弈方2 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 上 下 左 中 右 博 弈 方 1 博弈方2 1, 0 1, 3 0, 4 0, 2 上 下 左 中 博 弈 方 1 博弈方2 上 1, 0 1, 3 左 中 博弈方2 上 1, 3 中 2、重复剔除严格劣战略
2、重复剔除严格战略 2、重复剔除严格劣战略 ③重夏剔除严格劣乘暗法的缺格 (4) 2、重复剔除严格劣战略 2、重复剔除严格劣战略 举例 ; 划线法分析囚徒国境 2、重复剔除严格劣战略 2、重复除严格劣战略 钢3、映裹霜体率 当器, 过外不意 阵表示的博
3 ③重复剔除严格劣策略法的缺陷 重复剔除严格劣策略也不能解决所有博弈的分析 问题。因为在许多博弈问题中,上述相对意义上 的严格劣策略往往不存在。如猜硬币、齐威王田 忌赛马、石头,剪子,布等赌胜博弈,没有任何 博弈方的任何策略是相对其他策略的严格劣策略。 此外,在策略数较多的博弈中,重复剔除严格劣 策略法只能消去其中的部分策略,不能消去的策 略组合并不惟一,因此仍然不能完全解决这些博 弈问题。 2、重复剔除严格劣战略 (4)、划线法 ①思想 在具有策略和利益相互依存性的博弈问题中,各个 博弈方的收益既取决于自己选择的策略,还与其他 博弈方选择的策略有关,因此博弈方在决策时必须 考虑其他博弈方的存在和策略选择。 根据这种思想,科学的决策思路应该是:先找出自 己针对其他博弈方每种策略的最佳对策,即自己的 可选策略中与其他博弈方的策略配合,给自己带来 最大收益的策略(这种相对最佳对策总是存在的, 不过不一定惟一),然后在此基础上,通过对其他 博弈方策略选择的判断,包括对其他博弈方对自已 策略判断的判断等,预测博弈的可能结果和确定自 己趵最优策略。 2、重复剔除严格劣战略 ②举例 博 弈 方 1 博弈方2 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 上 下 左 中 右 2、重复剔除严格劣战略 例1 -5, -5 0, -8 -8, 0 -1, -1 坦 白 不坦白 坦 白 不坦白 囚徒2 囚 徒 1 划线法分析囚徒困境 2、重复剔除严格劣战略 例2 划线法是一种非常简便的博弈分析方法,由于它 以策略之间的相对优劣关系为基础,因此在分析 用收益矩阵表示的博弈问题时具有普遍适用性。 当然,这并不意味着每个用收益矩阵表示的博弈 都可以用划线法求出确定性的博弈结果。 事实上,许多博弈根本不存在确定性的结果,当 然也就无法用划线法找出这种结果。我们通过一 些例子来说明。 2、重复剔除严格劣战略 -1, 1 1, -1 1, -1 -1, 1 正面 反面 正面 反面 猜硬币方 盖 硬 币 方 例3、猜硬币博弈 2、重复剔除严格劣战略
2、重复剔除严格劣战略 3、纳什均衡 是叶真位清尖树精使提中肉 在两人博弃的情况下,就是给定你的演路:我的略 划线法分析夫妻之争 奔中的“ 3、纳什均衡 3、纳什均衡 ①、纳什均衡的定义 在博奔G一代中,如果由各个博奔方的各一个 策略组成的采个策略组合( )中,任一博弃方的策 46 对任意气S都成立,则称何,内G-代4 的一个纳什均商。 电麻之为纯兼暗销什均离(Pure-strategy Nash Equilibrin血,PNE] 3、纳什均衡 3、纳什均衡 ③、纳什均衡与 严格带泉电 ★表1:表十来方0因品一,3 ★克理2:在知个棒方的棒来G中。如果量复剩雕 头系 纳什地衡
4 2, 1 0,0 0, 0 1, 3 时装 足球 时装 足球 丈 夫 妻 子 划线法分析夫妻之争 2、重复剔除严格劣战略 例4、夫妻博弈 通过划线法找出的具有稳定性的策略组合,不管是否惟 一,都有一个共同的特性,即其中每个博弈方的策略都 是针对其他博弈方策略或策略组合的最佳对策。 在两人博弈的情况下,就是“给定你的策略,我的策略 是我最好的策略;给定我的策略,你的策略也是你最好 的策略”。事实上,具有这种性质的策略组合,正是非 合作博弈理论中最重要的一个解概念,即博弈中的“纳 什均衡”(Nash Equilibrium)。 3、纳什均衡 * i s 在博弈 中,如果由各个博弈方的各一个 策略组成的某个策略组合 中,任一博弈方i的策 略 ,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡。 ( , ) * * i n s s { , ; , } G S1 Sn u1 un ( , , , ,... ) ( , , , ,... ) * * 1 * 1 * 1 * * 1 * * 1 * i 1 i i i n i i ij i n u s s s s s u s s s s s ij i s S ( , ) * * i n s s { , ; , } G S1 Sn u1 un ( , , ,... ) * * 1 * 1 * 1 i i n s s s s 也称之为纯策略纳什均衡(Pure-strategy Nash Equilibrium, PNE) 3、纳什均衡 ①、 纳什均衡的定义 11:53:31 22 ②、纳什均衡的一致预测性 一致预测性是指这样一种性质:如果所有博弈方都预测一个 特定的博弈结果会出现,那么所有的博弈方都不会利用该预测 或者这种预测能力,选择与预测结果不一致的策略,即没有哪 个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终 真会成为博弈的结果。 即:如果所有博弈方都预测一个特定的纳什均衡会出现,那么, 没有人有兴趣作不同的选择。 一致预测性是纳什均衡的本质属性。 一致预测性使纳什均衡是稳定的和自我强制的。 3、纳什均衡 ③、纳什均衡与重复剔除严格劣策略 3、纳什均衡 占优均衡和纳什均衡之间的关系是:占优均衡是 包含在纳什均衡范围之内的,占优均衡肯定是纳 什均衡,但纳什均衡不一定是占优均衡。 划线法与纳什均衡的关系更清楚,前两者正是在 可以用得益矩阵表示的博弈中寻找纳什均衡的方 法。 纳什均衡和重复剔除严格劣策略法之间的关系要 复杂一些,关键是这两者之间是否存在相容性, 也即重复剔除严格劣策略法是否会消去纳什均衡? 对于纳什均衡和重复剔除严格劣策略法的关系, 下面的两个定理给出了答案。 24 定理1: 在n个博弈方的博弈G={S1 ,S2 , … ,Sn; u1 ,u2 ,…,un } 中,如果s * =(s1 * ,s2 * , … ,sn * )是G的一个纳什 均衡,那么重复剔除严格劣策略法一定不会将它消去。 3、纳什均衡 定理2:在n 个博弈方的博弈G中,如果重复剔除 严格劣策略法排除了除s * =(s1 * ,s2 * ,…,sn * )之外的所 有策略组合,那么s *一定是该博弈惟一的纳什均衡
二、合哈和纳什均衡的春在性 二、桌合草哈和纳什均衡的春在性 ,1、严格竟年博弃和混合策略的写引进 暗和格下策反复消去油 >4混合略反应 一5、纳什均衡的存在性 ·6、多重纳什均衡博弃的分析 1、严格变净博弃响痕合草嗜的引进 1、严格境摩博弃和视合限味的引城 的利益仍 行的。 在这两 力选择任 】、严格变李博来和杏菜哈的引 1、格弃和领合第哈的引 了2)合第略、合略博和混合策略纳什均南 (少清币 )”不存在前国定文 P+"◆P4
5 二、混合策略和纳什均衡的存在性 前面介绍的纳什均衡分析方法可以相当圆满地解决 许多博弈问题。但如果博弈中不存在纳什均衡或者 纳什均衡不惟一,如猜硬币、齐威王田忌赛马或夫 妻之争博弈那样、那么前述纳什均衡分析就无法对 博弈方的选择和博弈结果作明确的预测,无法给博 弈方提供明确的建议。 因此到目前为止介绍的纳什均衡分析方法,还不能 完全满足完全信息静态博弈分析的需要。 为此,本节将对不存在纳什均衡和存在多个纳什均 衡的博弈作一些讨论,关键是要引进在分析这两类 博弈时非常重要的“混合策略”和“混合策略纳什 均衡” (Mixsd-strategy Nash Equilibrium, MNE)概念。 二、混合策略和纳什均衡的存在性 1、严格竞争博弈和混合策略的引进 2、多重均衡博弈和混合策略 3、混合策略和严格下策反复消去法 4、混合策略反应函数 5、纳什均衡的存在性 6、多重纳什均衡博弈的分析 11:53:31 26 1、 严格竞争博弈和混合策略的引进 我们首先对各博弈方的利益和偏好始终不一致的,在 通常策略的基础上没有纳什均衡的博弈问题进行分析。 这类博弈也可以称为“严格竞争博弈"。 前面介绍猜硬币博弈和齐威王田忌赛马博弈时曾经说过, 如果这些傅弈只进行一次,那么我们无法明确预测博弈 的结果,不管是哪个博弈方,也不管他们选择的是哪个 策略,都不能保证得到较好的结果。 通过前面的分析我们进一步知道,之所以上述博弈没有 可预测的明确结果, 不能确定博弈方的策略,根本原因 在于这些博弈中没有纳什均衡策略组合。 那么这是否意味着在这样的博弈中,各个博弈方选择任 何策略都是一样的,因此可以随意选择呢? 1、 严格竞争博弈和混合策略的引进 这个问题的答案是否定的。事实上,在这些博 弈中,博弈方的选择仍然是很有讲究的,策略 选择的好坏对博弈方的利益仍然有很大的影响。 齐威王田忌赛马博弈和猜硬币博弈时,我们已 经简单讨论过这两个博弈中各个博弈方策略选 择的基本原则。当时得出的结论是,在这两个 博弈中,各博弈方必须保证自身策略选择的随 机性,以防止其他博弈方猜到自己的策略,或 利用自己对策略选择的偏好获利。 这里我们以猜硬帀博弈为例,进一步沿着这种 思路分析此类博弈中博弈方的策略选择和博弈 结果。 1、 严格竞争博弈和混合策略的引进 (1)猜硬币博弈 11:53:31 29 -1, 1 1, -1 1, -1 -1, 1 正 面 反 面 猜硬币方 盖 硬 币 方 正 面 反 面 (A)不存在前面定义的纳什均衡策略组合 (B)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念 (2)混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 中,博弈方i的策略 空间为 ,则博弈方i以概率分布 随机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中 对j=1,···,k都成立,且 11:53:31 30 ( , ) pi pi1 pik 0 pij 1 pi1 pik 1 G { , ; , } 1 n 1 n S S u u Si { , } i1 ik s s 1、 严格竞争博弈和混合策略的引进