2019/6/20 本章内容 第8章博弈论 81不完全信息静态博弈 Game Theory 82完全信息动态博弃 马俊 国际商学院 2019年6月3日 A兰 么 8.1不完全信息静态博实 5d 新博弃和贝叶斯纳什均衡 节讨论至少 方不完全清 813双方报价拍卖 81.4拍卖规则设计问题和墙示原理 8.15混合策略和不完全值息 在联 △世 △出 8.1.1静态贝叶斯博弈和 贝叶斯纳什均衡 一、静态贝叶斯博弈的例子 (一)略标拍实 三、海萨尼装 。密封递交标书 四、贝叶斯钠什均衡 每个博年方的估价通活是自己的私人信总
2019/6/20 1 第8章 博弈论 Game Theory 马俊 国际商学院 2019年6月3日 1 本章内容 8.1 不完全信息静态博弈 8.2 完全信息动态博弈 8.1.1 静态贝叶斯博弈和贝叶斯纳什均衡 8.1.2 暗标拍卖 8.1.3 双方报价拍卖 8.1.4 拍卖规则设计问题和揭示原理 8.1.5 混合策略和不完全信息 8.1 不完全信息静态博弈 本节讨论至少有一个博弈方不完全清楚其 他某些博弈方的得益的不完全信息静态博弈, 也称“静态贝叶斯博弈”。得益信息不充分和 博弈进程信息不充分是有差异的,因此不完全 信心博弈与不完美信息博弈有不同的表示和分 析方法。但不完全信息与不完美信息也有很强 的内在联系,可通过一定的方式统一起来,因 此不完全信息博弈和不完美信息博弈也可以用 相同的方法进行研究。 8.1.1 静态贝叶斯博弈和 贝叶斯纳什均衡 一、 静态贝叶斯博弈的例子 二、 静态贝叶斯博弈的一般表示 三、 海萨尼转换 四、 贝叶斯纳什均衡 一、 静态贝叶斯博弈的例子 (一)暗标拍卖 • 密封递交标书 • 统一时间公正开标 • 标价最高者以所报标价中标 • 中标博弈方的得益不仅取决于标价,还取决于他对拍卖 标的物的带有很大主观性的估计 • 每个博弈方的估价通常是自己的私人信息
2019/6/20 (二)不完全信息的古诺模型 不完全信息古诺模型直接分析 不完全信惠表现在 厂商2的成本有两种可能, mmx(a-g-4)-cn4,或者maxa-g-4)-cz4, 是厂商2的私人信总,厂商1只月 道可能性(概率分布),因此厂 maxta-q.-q(Cu)-ch+(1-0Ma-q.-g:(c)-clo.? 商1对厂商2的得益不完全清楚。 gi(en)-a-2e (cn-e) i(c)-8-2g+0(cn-01) gi--2++0-9e 3 A出 A丝 二、静态贝叶斯博弈的一般表示 三、海萨尼转换 ·完全信息静态博弈的一般表达式: 举先款不韩 1引进虚拟自然博弃方,可称为博弃方0。其作用是在博奔方选择 的一般表达式 白取他们的类型 2.博弈方0让每个实际博弈方知通自己的类型。但不让(全部或 部分)博弃方知通其绝博弃方的类型 再造行择 持,即各个实标博方 △出 △丝 四、贝叶斯纳什均衡 贝叶斯纳什均衡定义 静态贝叶斯博弈策略定义: 贝叶斯钠什均衡: 在静态贝叶斯博G {4 在静态贝叶新博G。…,,…,云 e 类型。博年方格从自己的行为空间A中相应选择的行动 则称策略组合S=(,,)为G的一个纯策略)坝叶斯钠什均衡 △性 △兰 2
2019/6/20 2 (二)不完全信息的古诺模型 不完全信息表现在: 厂商2的成本有两种可能, 是厂商2的私人信息,厂商1只知 道可能性(概率分布),因此厂 商1对厂商2的得益不完全清楚。 1 2 1 1 1 2 2 2 2 ( ) (高成本时) 1 低成本时 H L P Q a Q Q q q C c q C c q C c q = − = + = = − − = − − − 不完全信息古诺模型直接分析 max{ [ ( ) ] (1 )[ ( ) ] } max[( ) ] max[( ) ] 1 1 * 1 1 1 2 * 1 2 2 2 * 2 2 1 * 1 1 2 2 a q q c c q a q q c c q a q q c q a q q c q H L q L q H q − − − + − − − − − − − − − − 或者 3 2 (1 ) ( ) 3 6 2 ( ) ( ) 6 1 3 2 ( ) * 1 1 * 1 2 * 1 2 H L H L L L H L H H a c c c q c c a c c q c c c a c c q c − + + − = + − − + = − − + − + = 二、静态贝叶斯博弈的一般表示 • 完全信息静态博弈的一般表达式: • 静态贝叶斯博弈的一般表达式: { , , ; , , } G = S1 Sn u1 un { , , ; , , ; , , ; , , } { , , ; , , ; , , } 1 1 1 1 1 1 1 n n n n n n n G A A T T p p u u G A A T T u u = = 三、海萨尼转换 0 1 1 1.引进虚拟自然博弈方,可称为博弈方0,其作用是在博弈方选择 之前,为每个实际博弈方按随机方式或者说抽取他们的类型,构 成向量 ( , , ),其中 , 1, , 2.博弈方 让每个实际博弈方知道自己的类型,但不让(全部或 部分)博弈方知道其他博弈方的类型 3.在前述基础上,再进行原来的静态博弈,即各个实际博弈方 同时从各自的行为空间中选择行动方案 , , 4.各博弈方得益 ( n i i n i i t t t t T i n a a u u a = = = 1, , , ), 1, , n i a t i n = 海萨尼转换把不完全信息博弈 转换成不完美信息动态博弈 四、贝叶斯纳什均衡 静态贝叶斯博弈策略定义: 类型 ,博弈方 将从自己的行为空间 中相应选择的行动 。 函数 。 设定对于“自然”可能为博弈方 抽取的各种 中 博弈方 的一个策略,就是自己各种可能类型 的一个 在静态贝叶斯博弈 i i i i i i i i i i n n n n t i A a S t S t i i t t T G A A T T p p u u ( ) ( ) , ( ) { , , ; , , ; , , ; , , } 1 1 1 1 = 贝叶斯纳什均衡定义 1 1 1 1 * * * * 1 1 1 1 1 * * * 1 在静态贝叶斯博弈 { , , ; , , ; , , ; , , } 中,如果对任意博弈方 和他的每一种可能的类型 , ( )所选择的行动 都能满足 max { [ ( ), , , , ( ), , ( ), ] ( | )} 则称策略组合 ( , , )为 的一个(纯策略)贝叶斯纳什均衡 i i i n n n n i i i i i i i n n i i i a A t N G A A T T p p u u i t T S t a u S t S a S t S t t p t t S S S G − − + + − = = 贝叶斯纳什均衡:
2019/6/20 8.1.2暗标拍卖(Sealed Auction) 线性策略均衡 -b,当b> 设博弈方的策略为b,(心,)=a,+cPh=b=0 g=u6...)=c-b/2.当6=b g-鸟P6>a,+,】 0,当6<b, 学肉%4之到 四%-6P6>1+g-)P4=b, △ 8.1.3双方报价拍卖(Double Auction) 贝叶斯纳什均衡 棋型 买方报价R,卖方报价P 对任意,0】B,必须满足 如果B之B以价格P=(仍+P)/2成交,否则不成交. 对任意,∈0P,项满是 a2-r2 一价均衡 线性策略均衡 给定0中任意一个值 买方策略P(,)=a,+c 方策略P,)=a+c R=+B=+ R2P→y。2y+1/4
2019/6/20 3 8.1.2 暗标拍卖(Sealed Auction) − = − = = i j i i i j i i i j i i b b v b b b v b b b u u b b v v ,当 ,当 ,当 0 ( , , , ) ( )/ 2 1 2 1 2 ( ) { }] 2 1 max[( ) { } i i i j i i i j b v b P b b v b P b b i − + − = 线性策略均衡 设博弈方j的策略为bj (vj ) = aj + cjvj ;P{bi = bj} = 0 max[( ) ] max[( ) { }] max[( ) { }] j i j i i b j i j i i j b i i i j j j b c b a v b c b a v b P v v b P b a c v i i i − = − − = − − + + = j i j i j i j i i a v a v a v a b v ,当 ,当 ( ) 2 8.1.3 双方报价拍卖(Double Auction) 模型 相互知道对方估价标准分布于 ,区间上 买方对货物估价为 ,卖方估价为 如果 ,以价格 成交,否则不成交。 买方报价 ,卖方报价 [0 1] ( )/ 2 b s b s b s b s v v P P P P P P P = + 贝叶斯纳什均衡 ] { ( )} 2 [ ( )| ( )] max[ [0 1] ( ) b s s b s s b s s b P b b b P P P v P E P v P P v v v P v b + − 对任意 ,, 必须满足 ] { ( ) } 2 [ ( )| ( ) ] max[ [0 1] ( ) s b b s s b b b b s P s s s v P P v P P E P v P v P v P v s − + 对任意 ,, 必须满足 ( ) b b P v ( ) s s 双方策略为 P v 一价均衡 b v 0 x 1 交易 b v b s v = v s v 卖方策略: 时, ,否则 ,即不卖 买方策略: 时, ,否则 ,即不买 给定 ,中任意一个值 , 1 0 [0 1] s = = = = s s b b b v x P x P v x P x P x 线性策略均衡 s s s s s b b b b b P v a c v P v a c v = + = + ( ) ( ) 卖方策略 买方策略 0 1 1 交易 b v b s v = v s v = +1/ 4 b s v v s s b b s b b P c a P P a v P b + − − + )] 2 ( 2 1 max[ b b b s s b b s s P c a c P v a c P P s + − − + + + ) ] 2 ( 2 1 max[ 4 1 3 2 , 12 1 3 2 Pb = vb + Ps = vs + Pb Ps vb vs +1/ 4
2019/6/20 两种均衡的比较和均衡效率 81.4拍卖规则设计问题和揭示原理 线性策略均衡比一价均衡效率高 的贝叶斯纳什均衡 拍卖规则设计问题 代价 二、直接机制和揭示原理 的效 A出 A型 - 拍卖规则设计问题 二、直接机制和揭示原理 收真机制 不 型是什 ·拍去设计、拍实方式透择:底价、保证金、中标 信息揭示 装是了家 经宽盆气之6-一-1 △出 说实话的直接机制 只有两个投标人,他们的估价类型心⅓都0,止标准分布 =5xW-与=化-g) 些g-当-若a-动 阶条件a=a12.当0=2时,a=1,?= △性 △兰 4
2019/6/20 4 两种均衡的比较和均衡效率 • 线性策略均衡比一价均衡效率高 • 不存在能实现所有潜在交易利益的贝叶斯纳什均衡。 • 这正是信息不完全的效率损失,代价。 • 线性策略均衡的效率是最高的 8.1.4 拍卖规则设计问题和揭示原理 一、 拍卖规则设计问题 二、 直接机制和揭示原理 一、 拍卖规则设计问题 • 投标人较少,且不识货时,买方的出价可能非常低, 使拍卖商品得不到应有价格,如果投标人之间形成某 种形式的串通,则卖方更吃亏。 • 投标人参与投标而不中标没有任何代价,投标人就不 会积极争取成交,会采用低标价多次参加投标的方法, 希望投机获较大利益。如果投标人都这样做,价格肯 定会偏低,对卖方不利。 • 拍卖规则设计、拍卖方式选择:底价、保证金、中标 规则和价格。 • 实现理论、实施理论 • 信息揭示——真实类型和估计是可以了解的吗? 二、直接机制和揭示原理 直接机制 必须成立 ,概率之和 如果投标方 中标,则价格为 。对各种可能的声明情况 ,即要随机选择哪个投标方中标,随机选择的概率为 。 假如各投标人的声明是 ,则投标人 拍得标的的概率为 做声明,不管他的真实类型是什么 不要求诚实,因此投标人 可以选择其类型空间 中的任意类型 投标人同时声明自己对标的的估价(即他们的类型)。因为并 ( , , ) ( , , ) ( , , ) ( , , ) 1 ( , , ) ( , , ) 2. ( , , ) 1. ' ' 1 ' ' 2 1 ' ' 1 ' ' 1 ' ' 1 ' ' 1 ' ' 1 n i n + n + + n n i n i n i n i t t q t t q t t q t t i p t t q t t q t t i i T 说实话的直接机制 / 2. / 2 1, 1. [0,1] [0 1] 1 2 1 2 1 2 i i i i i p V i q V q q V V V V V = = + 中标的价格为 投标人 中标的概率为 , 两投标人同时声明 、 , 只有两个投标人,他们的估价类型 、 都是 ,上标准分布 ( ) 2 ( ) 2 max ( ) 2 ( ) 2 2 2 ' ' i i i i i i i i a i i i i i i i i i a a aV V V aV aV V V aV V V Eu i − = − = − = − • 设线性齐次策略: • 说真话—— Vi = aiVi ai ai Vi =Vi 一阶条件 = / 2,当 = 2时, =1, =1 i a
2019/6/20 揭示原理 8.1.5混合策略和不完全信息 定强: 海萨尼1973年结论:完 全信息静态博 任何贝叶斯博弈的任何贝叶斯纳什均衡,都 信息的近似博弈的一个纯策 可以被一个说实话的直接机制“代表”。 的得益不完全确定, 不完全信息夫妻之争 妻子的脑界值策高和得拉 时装-x,得益2+.)+二x0=2+) 是1以.得名0+1= 不光金仙雕火物之单 文夫的临界值策略和得益 时装/符位26+64三x0=6+6 和都是0,对上标准分布 G=M4.4:T.T:p..P.u.u 足政-,得道1+0: △ 均衡 B.2完全信息动态博弃 w=-3+5+正h-6+25+玉 821动态博奔的表示法和特点 责子时1-3++支夫选足球6+25+国 均衡的 2 3 什均衡 趋向于0时,上述两服率分布地向于314和23, 与完全信意夫李之争合略钠什均衡的率分布两 5
2019/6/20 5 揭示原理 定理: 任何贝叶斯博弈的任何贝叶斯纳什均衡,都 可以被一个说实话的直接机制“代表”。 8.1.5 混合策略和不完全信息 • 海萨尼1973年结论:完全信息静态博弈中的一 个混合策略纳什均衡,几乎总是可以被解释成 一个有少量不完全信息的近似博弈的一个纯策 略贝叶斯纳什均衡。 • 可理解为,混合策略的根本特征不是博弈方以 随机方式选择策略,而是博弈方对其他博弈方 的得益不完全确定。 不完全信息夫妻之争 和 都是[0,x]上标准分布 { , ; , ; , ; , } G = Aw Ah Tw Th pw ph uw uh 0, 0 0, 0 时装 妻 子 丈夫 足球 足球 时装 不完全信息夫妻之争 2 ,1 w +t h 1,3+t 0, 0 0, 0 时装 妻 子 丈夫 足球 足球 时装 完全信息夫妻之争 2,1 1,3 w t h t x x h x x h x h w x t x h x x h t x h x w x w w − = − + = + − − + + / 0 1 ( )/ (2 ) 0 (2 ) 足球 ,得益 时装 ,得益 妻子的临界值策略和得益 丈夫的临界值策略和得益 x x w x w x x w x h x t x w x x w t x w h x h h − + = − − = + − + + ( )/ 1 0 / (3 ) 0 (3 ) 足球 ,得益 时装 ,得益 均 衡 3 6 2 9 3 1 2 3 9 3 1 3 6 2 9 3 , 2 3 9 3 x x x h x w − + + − − + + − − + + = − + + = 妻子选时装: ,丈夫选足球: x趋向于0时,上述两概率分布趋向于3/4和2/3。 与完全信息夫妻之争混合策略纳什均衡的概率分布同。 8.2 完全信息动态博弈 8.2.1 动态博弈的表示法和特点 8.2.2 可信性和纳什均衡的问题 8.2.3 子博弈和子博弈完美纳什均衡 8.2.4 几个经典动态博弈模型