我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢?我们 可以说出好几个理由。没有一个理由本身就有足够的说服力,不过,只要把几个理由结合起 来,就能形成一个有力的答案。 首先,存在避免循环推理的必要,因为循环推理帮不上忙。均衡在没完没了的“我知道 他知道我知道…”的循环里是稳定不变的,这使参与者对其他人的行动的估计能保持连贯 性。各方正确预计别人的行动,并且确定自己的最佳对策。 均衡策略的第二个好处岀现在零和博弈中。在这种博弈里,参与者的利益严格相悖。你 的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在 做的事情会有什么样的最佳对策 第三个理由是,均衡方法注重实效。要想知道梨子的滋味,就要吃一吃。我们将会利用 均衡方法讨论许多博弈。希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为 指导方针。相信这么做会使我们的分析更有意思,比抽象地讨论均衡方法的优点更有意义 最后,可能存在一个对均衡概念的误解,希望各位可以避免。当我们说博弈的结果是均 衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利 的结果。有利或者不利的评价永远属于另外一个问题,答案视各个案例的具体情况而各有不 同 在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价 格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说, 该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量称之为均衡产量。均衡分析 是经济学中的重要分析。 那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的 结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 纳什均衡是一最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策 略都是最好的,此时没有人愿意先改变自己的策略
我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢?我们 可以说出好几个理由。没有一个理由本身就有足够的说服力,不过,只要把几个理由结合起 来,就能形成一个有力的答案。 首先,存在避免循环推理的必要,因为循环推理帮不上忙。均衡在没完没了的“我知道 他知道我知道……”的循环里是稳定不变的,这使参与者对其他人的行动的估计能保持连贯 性。各方正确预计别人的行动,并且确定自己的最佳对策。 均衡策略的第二个好处出现在零和博弈中。在这种博弈里,参与者的利益严格相悖。你 的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在 做的事情会有什么样的最佳对策。 第三个理由是,均衡方法注重实效。要想知道梨子的滋味,就要吃一吃。我们将会利用 均衡方法讨论许多博弈。希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为 指导方针。相信这么做会使我们的分析更有意思,比抽象地讨论均衡方法的优点更有意义。 最后,可能存在一个对均衡概念的误解,希望各位可以避免。当我们说博弈的结果是均 衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利 的结果。有利或者不利的评价永远属于另外一个问题,答案视各个案例的具体情况而各有不 同。 在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价 格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说, 该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量称之为均衡产量。均衡分析 是经济学中的重要分析。 那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一 结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 纳什均衡是一最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策 略都是最好的,此时没有人愿意先改变自己的策略
在上面的“买一一卖”的博弈中,可以解释为什么在现实中讨价还价后买卖能做成的原 因,因为这对双方来说都是最优选择。同时在“买—一卖”博弈中,其均衡对双方来说是全 局最优的。 警察与小偷 是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点一—所谓纯策 略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点 所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳 什于1950年证明了的纳什定理。我们下面将在“警察与小偷”的博弈中给出混合策略的说 明 在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的 治安。现在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷 要实施偷盗。因为分身乏术,警察一次只能在一个地方巡逻:而小偷也只能去一个地方。假 定银行需要保护的财产价格为2万元,酒馆的财产价格为1万元。若警察在某地进行巡逻 而小偷也选择了去该地,就会被警察抓住:若警察没有巡逻的地方而小偷去了,则小偷偷盗 成功。警察怎么巡逻才能使效果最好? 个明显的做法是,警察对银行进行巡逻,这样,警察可以保住2万元的财产不被偷窃 可是如此,假如小偷去了酒馆,偷窃一定成功。这种做法是警察的最好做法吗?有没有对这 种策略改进的措施? 这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略 选择是每个参与者的最优(混合)策略选择 对于这个例子,对于警察的一个最好的做法是,警察抽签决定去银行还是酒馆。因为银 行的价值是酒馆的两倍,所以用两个签代表银行,比如如果抽到1、2号签去银行,抽到3 号签去酒馆。这样警察有2/3的机会去银行进行巡逻,1/3的机会去酒馆。而小偷的最优 选择是:以同样抽签的办法决定去银行还是去酒馆偷盜,只是抽到1、2号签去酒馆,抽到 3号签去银行,那么,小偷有1/3的机会去银行,2/3的机会去酒馆
在上面的“买——卖”的博弈中,可以解释为什么在现实中讨价还价后买卖能做成的原 因,因为这对双方来说都是最优选择。同时在“买——卖”博弈中,其均衡对双方来说是全 局最优的。 警察与小偷 是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点——所谓纯策 略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点—— 所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳 什于 1950 年证明了的纳什定理。我们下面将在“警察与小偷”的博弈中给出混合策略的说 明。 在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的 治安。现在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷, 要实施偷盗。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。假 定银行需要保护的财产价格为 2 万元,酒馆的财产价格为 1 万元。若警察在某地进行巡逻, 而小偷也选择了去该地,就会被警察抓住;若警察没有巡逻的地方而小偷去了,则小偷偷盗 成功。警察怎么巡逻才能使效果最好? 一个明显的做法是,警察对银行进行巡逻,这样,警察可以保住 2 万元的财产不被偷窃。 可是如此,假如小偷去了酒馆,偷窃一定成功。这种做法是警察的最好做法吗?有没有对这 种策略改进的措施? 这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略 选择是每个参与者的最优(混合)策略选择。 对于这个例子,对于警察的一个最好的做法是,警察抽签决定去银行还是酒馆。因为银 行的价值是酒馆的两倍,所以用两个签代表银行,比如如果抽到 1、2 号签去银行,抽到 3 号签去酒馆。这样警察有 2/3 的机会去银行进行巡逻,1/3 的机会去酒馆。而小偷的最优 选择是:以同样抽签的办法决定去银行还是去酒馆偷盗,只是抽到 1、2 号签去酒馆,抽到 3 号签去银行,那么,小偷有 l/3 的机会去银行,2/3 的机会去酒馆
警察与小偷之间的博弈,如同小孩子之间玩“剪刀石头布”的游戏,在这样一个游戏中, 不存在纯策略均衡,对每个小孩来说,自己采取出“剪刀”、“布”还是“石头”的策略应 当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。如果对方知道你出其 中一个策略的“可能性”大,那么你在游戏中输的可能性就大。因此,每个小孩的最优混合 策略是采取每个策略的可能性是1/3。在这样的博弈中,每个小孩各取三个策略的1/3是 纳什均衡。由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略:而混合策略 是参与者在各种备选策略中采取随机方式选取的。在博弈中,参与者可以改变他的策略,而 使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时, 此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。 启示1:没有把真正的问题找出来就盲目采取行动,是最愚蠢的做法。能够找出问题, 已经可以说是把问题解决一半了 启示2:解决问题的公式 (1)找出问题发生的原因 (2)分辨情报的价值 3)彻底推行解决方案 (4)观察事情进行得是否顺利。 任何事情都看似很难,实质不难;任何事情都比你预期的更令人满意:任何事情都能办 好,而且是在最佳的时刻办好一一麦可斯韦尔定律有助你走出阴霾 斗鸡博弈的难局 试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果 方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双 方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败:如果两只公 鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己 不退,但是此时面临着两败俱伤的结果
警察与小偷之间的博弈,如同小孩子之间玩“剪刀石头布”的游戏,在这样一个游戏中, 不存在纯策略均衡,对每个小孩来说,自己采取出“剪刀”、“布”还是“石头”的策略应 当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。如果对方知道你出其 中一个策略的“可能性”大,那么你在游戏中输的可能性就大。因此,每个小孩的最优混合 策略是采取每个策略的可能性是 l/3。在这样的博弈中,每个小孩各取三个策略的 1/3 是 纳什均衡。由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混合策略 是参与者在各种备选策略中采取随机方式选取的。在博弈中,参与者可以改变他的策略,而 使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时, 此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。 启示 1:没有把真正的问题找出来就盲目采取行动,是最愚蠢的做法。能够找出问题, 已经可以说是把问题解决一半了。 启示 2:解决问题的公式: (1)找出问题发生的原因; (2)分辨情报的价值; (3)彻底推行解决方案; (4)观察事情进行得是否顺利。 任何事情都看似很难,实质不难;任何事情都比你预期的更令人满意;任何事情都能办 好,而且是在最佳的时刻办好——麦可斯韦尔定律有助你走出阴霾。 斗鸡博弈的难局 试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一 方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双 方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公 鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己 不退,但是此时面临着两败俱伤的结果
两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付:如果一方“前进”, 另外一方“后退”,前进的公鸡获得1的支付,贏得了面子,而后退的公鸡获得-1的支付, 输掉了面子,但没有两者均“前进”受到的损失大:两者均“后退”,两者均输掉了面子获 得-1的支付。当然这些数字只是相对的值。 这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进、谁退?一个博弈, 如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一事先知道的 惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果 来。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。 用这个博弈来解释美苏两个超级大国之间的古巴导弹危机,是最合适不过的了。 面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择?而对于美 国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择?也就是说,这两只大公鸡均在考 虑采取进的策略还是退的策略? 战争的结果当然是两败俱伤,而任何一方退下来(而对方不退)则是不光彩的事。结果是 苏联将导弹从古巴撤了下来,做了丢面子的“撤退的鸡”。美国坚持了自己的策略,做了“不 退的鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而发生美苏战争一一这是 美国不愿意看到的,美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏 两霸之间发生的最严重的一次危机。 这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子, 但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡” 博弈的结果。 启示:任何事情都看似很难,实质不难:任何事情都比你预期的更令人满意:任何事情 都能办好,而且是在最佳的时刻办好一一麦可斯韦尔定律有助你走出阴霾 左边还是右边 前面我们己知,在博弈中纳什均衡点如果有两个或两个以上,结果就难以预料。这对每 个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。一个小例子就是两个骑自行车
两者如果均选择“前进”,结果是两败俱伤,两者均获得-2 的支付;如果一方“前进”, 另外一方“后退”,前进的公鸡获得 1 的支付,赢得了面子,而后退的公鸡获得-l 的支付, 输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子获 得-1 的支付。当然这些数字只是相对的值。 这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进、谁退?一个博弈, 如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一事先知道的 惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果 来。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。 用这个博弈来解释美苏两个超级大国之间的古巴导弹危机,是最合适不过的了。 面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择?而对于美 国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择?也就是说,这两只大公鸡均在考 虑采取进的策略还是退的策略? 战争的结果当然是两败俱伤,而任何一方退下来(而对方不退)则是不光彩的事。结果是 苏联将导弹从古巴撤了下来,做了丢面子的“撤退的鸡”。美国坚持了自己的策略,做了“不 退的鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而发生美苏战争——这是 美国不愿意看到的,美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏 两霸之间发生的最严重的一次危机。 这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子, 但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡” 博弈的结果。 启示:任何事情都看似很难,实质不难;任何事情都比你预期的更令人满意;任何事情 都能办好,而且是在最佳的时刻办好——麦可斯韦尔定律有助你走出阴霾。 左边还是右边 前面我们已知,在博弈中纳什均衡点如果有两个或两个以上,结果就难以预料。这对每 个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。一个小例子就是两个骑自行车
的人对面碰头,很容易互相“向住”:因为不知道对方会不会躲、往哪边躲,自己也不知该 如何反应,于是撞到一起。 自行车相撞一般不会造成什么大麻烦,可是如果换成马车、汽车,就可能出现伤亡。所 以,应该有一个强制性的规定,来告诉人们该怎么做。 开车的时候你应该走哪一边?假如别人都靠右行驶,你也会留在右边。套用“假如我认 为他认为”的框架进行分析,假如每个人都认为其他人认为每个人都会靠右行驶,那么每个 人都会靠右行驶,而他们的预计也全都确切无误。靠右行驶将成为一个均衡。 不过,靠左行驶也是一个均衡,正如在英国、澳大利亚和日本出现的情况。这个博弈有 两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多 个均衡,所有参与者必须就应选择哪一个达成共识,否则就会导致困惑 海上航行也要面临同样的问题,尽管大海辽阔,但是航线却是比较固定的,因此船只交 会的机会很多,这些船只属于不同的国家,如何调节谁进谁退的问题呢?先来看一个小笑话 一艘军舰在夜航中,舰长发现前方航线上出现了灯光。 舰长马上呼叫:“对面船只,右转30度。” 对方回答:“请对面船只左转30度。” 我是美国海军上校,右转30度。” “我是加拿大海军二等兵,请左转30度。” 舰长生气了:“听着,我是‘列克星顿’号战列舰舰长,这是美国海军最强大的武装力 量,右转30度!” 我是灯塔管理员,请左转30度。” 即使你官阶、舰船再大,灯塔也不会给你让路。那么,如果是两条船相遇,又如何决定
的人对面碰头,很容易互相“向住”:因为不知道对方会不会躲、往哪边躲,自己也不知该 如何反应,于是撞到一起。 自行车相撞一般不会造成什么大麻烦,可是如果换成马车、汽车,就可能出现伤亡。所 以,应该有一个强制性的规定,来告诉人们该怎么做。 开车的时候你应该走哪一边?假如别人都靠右行驶,你也会留在右边。套用“假如我认 为他认为”的框架进行分析,假如每个人都认为其他人认为每个人都会靠右行驶,那么每个 人都会靠右行驶,而他们的预计也全都确切无误。靠右行驶将成为一个均衡。 不过,靠左行驶也是一个均衡,正如在英国、澳大利亚和日本出现的情况。这个博弈有 两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多 个均衡,所有参与者必须就应选择哪一个达成共识,否则就会导致困惑。 海上航行也要面临同样的问题,尽管大海辽阔,但是航线却是比较固定的,因此船只交 会的机会很多,这些船只属于不同的国家,如何调节谁进谁退的问题呢?先来看一个小笑话: 一艘军舰在夜航中,舰长发现前方航线上出现了灯光。 舰长马上呼叫:“对面船只,右转 30 度。” 对方回答:“请对面船只左转 30 度。” “我是美国海军上校,右转 30 度。” “我是加拿大海军二等兵,请左转 30 度。” 舰长生气了:“听着,我是‘列克星顿’号战列舰舰长,这是美国海军最强大的武装力 量,右转 30 度!” “我是灯塔管理员,请左转 30 度。” 即使你官阶、舰船再大,灯塔也不会给你让路。那么,如果是两条船相遇,又如何决定 呢?