述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。”这 就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进 了社会公共利益的增长。即自利会带来互利 传统经济学秉承了亚当·斯密的思想。传统经济学认为:人的经济行为的根本动机是自 利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的 财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只 需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公 正,自然会增进社会福利 但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参 与者可以相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规 佛家讲因果律,儒家讲究“财自道生,利缘义取”。从囚徒困境看来,如果一味地想算 计别人,算来算去,最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑 那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。 2.经济自由与效率 关于经济自由主义,笔者不得不在这里着重笔墨写这么额外的一小节。在目前中国 的经济、管理领域,经济自由主义者的观点已是喧嚣尘上、风靡一时,如江河之泛滥,一发 不可收拾。他们恨不能将中国所有的大型国有企业全部分解成原始资本主义的小商小贩,妄 图在一夜之间造就出梦幻般的完全自由竞争的市场经济体系。按照经济学家左大培的观点 中国经济自由主义者的思想是“有中国特色的经济自由主义” 在资本主义早期,成千上万的小私有者投资工商业作为谋生手段,亚当·斯密正是在这 种背景下才假设经济个体行为不会影响其他个体行为,并推断出个体利益最大化也就是社会 利益的最大化。后来资本的高度集中使其日益脱离生产,变为纯粹攫取利润的工具,理论模 型开始注意经济生活中各利益主体之间的相互影响和相互作用。一种研究经济个体如何在复 杂的竞争关系中使自身利益最大化的理论“经济博弈论”应运而生。 正如上一节所述,“囚徒困境”本身就己经推翻了自由经济主义存在的理论基础。囚 徒困境揭示了:个体理性的选择与群体理性选择之间的矛盾,从个体利益出发的行为往往不 能实现团体的最大利益;同时也揭示了市场理性本身的内在矛盾,从个体理性出发的行为最 终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。从“囚徒困境”与“囚 徒困境”变形模型中,我们可以证明:人们的相互交往过程中,每个行为主体的利己主义决 策结果,可能是有效率的,也可能是无效率的,但多次重复这种决策肯定是低效率的。它实 际上证明了亚当·斯密200年前提出的每个人自私自利就可以实现社会最大福利的假设的不 可实现性。在现代市场经济中,人们在多次交往或者重复博弈后发现,遵循平等合作规则要 比通过欺诈获得少数几次不义之财更有利。如果一直按照工业社会的传统规则博弈下去,人 类将面临“一切人坑害一切人”的社会 笔者这里再举一个实例证实,自由竞争并不是最优效的经济体系,而政府管制也不是最 无效的手段 1971年,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,财大 气粗的各大烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的 通过。政府管制最终的结果是,尽管烟草广告因受到限制而减少,可是烟草公司的利润却提 高了。实际上,政府禁令不仅没有打击烟草公司,反而是把陷入白热化广告战的各大烟草集 团从“囚徒困境”中解放了出来。 16
16 述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。” 这 就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进 了社会公共利益的增长。即自利会带来互利。 传统经济学秉承了亚当·斯密的思想。传统经济学认为:人的经济行为的根本动机是自 利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的 财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只 需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公 正,自然会增进社会福利。 但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会福利的最优。每一个参 与者可以相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规 则。 佛家讲因果律,儒家讲究“财自道生,利缘义取”。从囚徒困境看来,如果一味地想算 计别人,算来算去,最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑, 那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。 2.经济自由与效率 关于经济自由主义,笔者不得不在这里着重笔墨写这么额外的一小节。在目前中国 的经济、管理领域,经济自由主义者的观点已是喧嚣尘上、风靡一时,如江河之泛滥,一发 不可收拾。他们恨不能将中国所有的大型国有企业全部分解成原始资本主义的小商小贩,妄 图在一夜之间造就出梦幻般的完全自由竞争的市场经济体系。按照经济学家左大培的观点, 中国经济自由主义者的思想是 “有中国特色的经济自由主义”。 在资本主义早期,成千上万的小私有者投资工商业作为谋生手段,亚当·斯密正是在这 种背景下才假设经济个体行为不会影响其他个体行为,并推断出个体利益最大化也就是社会 利益的最大化。后来资本的高度集中使其日益脱离生产,变为纯粹攫取利润的工具,理论模 型开始注意经济生活中各利益主体之间的相互影响和相互作用。一种研究经济个体如何在复 杂的竞争关系中使自身利益最大化的理论“经济博弈论”应运而生。 正如上一节所述,“囚徒困境”本身就已经推翻了自由经济主义存在的理论基础。囚 徒困境揭示了:个体理性的选择与群体理性选择之间的矛盾,从个体利益出发的行为往往不 能实现团体的最大利益;同时也揭示了市场理性本身的内在矛盾,从个体理性出发的行为最 终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。从“囚徒困境”与“囚 徒困境”变形模型中,我们可以证明:人们的相互交往过程中,每个行为主体的利己主义决 策结果,可能是有效率的,也可能是无效率的,但多次重复这种决策肯定是低效率的。它实 际上证明了亚当·斯密 200 年前提出的每个人自私自利就可以实现社会最大福利的假设的不 可实现性。在现代市场经济中,人们在多次交往或者重复博弈后发现,遵循平等合作规则要 比通过欺诈获得少数几次不义之财更有利。如果一直按照工业社会的传统规则博弈下去,人 类将面临“一切人坑害一切人”的社会。 笔者这里再举一个实例证实,自由竞争并不是最优效的经济体系,而政府管制也不是最 无效的手段。 1971 年,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,财大 气粗的各大烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的 通过。政府管制最终的结果是,尽管烟草广告因受到限制而减少,可是烟草公司的利润却提 高了。实际上,政府禁令不仅没有打击烟草公司,反而是把陷入白热化广告战的各大烟草集 团从“囚徒困境”中解放了出来
在20世纪60年代,美国烟草行业竞争激烈,为了争夺市场,各大烟草公司都必须耗费 巨额费用大做广告,这无疑降低了它们的利润水平。也就是说,如果烟草公司都不做广告, 它们的利润要更高。可是,如果其中一家公司不做广告,它的市场份额就会被其他公司抢走 这正是一个囚徒困境:某公司放弃做,而其它公司仍然大作广告抢占市场,放弃做广告的公 司必然利益受损。在这种情况下,做广告就是每一个广告公司的优势策略。即使烟草公司能 够达成都不做广告的协议,但是这个协议的约束力太低,这在上一节已经解释过,这并不能 将烟草行业从广告战的泥潭中解救出来。 这个时候国家出台法令对于烟草行业来说反而是个好事,烟草公司靠自己做不到的事 情,政府做到了。因为国家法律具有强制性的作用,相当于是烟草集团之间签订了极具约束 力的协议,同时政府承担了监督烟草公司是否违反协议的成本 除了自由竞争之外,中国的经济自由主义者还强调,经济只应关注效率,不要强求公平, 更加谬误的是他们又把效率只片面地看成是个人或家庭的发财致富。我们可以发现,这种思 想在社会上引起了很恶劣糟糕的一种思想潮流。在书店里充斥着如何发财致富的书籍,而所 谓的一些成功人士则是人们顶礼膜拜的新偶像。 他们甚至还认为,经济体系可以不要任何秩序的竞争,一切都应放任自流,反对靠政府 的干预来建立秩序。所谓秩序,就是游戏规则,就是一个博弈对局的规则。比如很多知名的 所谓经济学家竞然公开颂扬“全民炒股”、全国性的房地产投机之类的对经济具有极强破坏 力的现象。更有甚者是,某经济学居然从理论上推出这样的结论:“腐败适度存在,能使改 革进一步推进”还有经济学家公开宣称“腐败和贿赂成为改革过程得以顺利进行的润滑剂”。 关于这个问题,笔者会在后面的章节用博弈论的方法与观点来说明其荒谬性与无耻性。 3.“囚徒困境”的破解:无限次重复博弈与有限次重复博弈 “不识庐山真面目,只缘身在此山中。”我们继续囚徒困境的讨论,从上几节的解释中, 我们可以看出,严格囚徒困境的前提条件是博弈各方不可以进行合作,也就是不能够制订有 约東力的协议。但在实际上,合作是文明的基础,比如兴修水利、组织国防、创建企业等都 是合作而产生的,无怪乎哲学家卢梭写了本书《社会契约论》,认为契约是整个人类社会存 在的前提条件之一。 前面已经分析过,如果囚徒困境只是一次性的博弈,那么签订协议是毫无意义的,其纳 什均衡点并不会改变。可以签订协议的一个最基本的条件,就是博弈需要重复若干 至少大于一次。就恋爱博弈来看,男女双方在交往的过程,随时都在博弈,因为相爱的过程 中任何一个时点都是有可能分手的。用博弈论的术语来说,这是一种囚徒困境的重复博弈。 无数爱情故事中的悲欢离合、精彩跌宕正是这个博弈模型的表现。当然那种素不相识一对男 女,偶尔在酒吧中相遇,于是宾馆订房、春梦一场,拂晓之后就各自分道扬镳的一夜情是理 所当然的一次性囚徒困境博弈 我们在这里要注意的是,重复博弈与我们前面所提及一般性的动态博弈是不同的。多轮 动态博弈中,参与者能够了解到博弈中的每一步其它参与者的在自己选择某种策略下的行 ,而重复博弈的参与者无法了解到在任何一个步中,其它参与者的策略选择。 囚徒困境一旦从一次性博弈转变为重复博弈,情况会发生非常大的变化,博弈的结局也 就是纳什均衡点可能会完全不同。举个最简单的例子,大家都知道国外的黑手党组织严密 对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员,一定会被组织谋杀。我 们假设前面的囚徒困境故事不是发生在中国,而是意大利,囚犯A和B都是黑手党成员。 他们很可能宁愿被判处终生囚禁,也不愿意出狱之后被同伙干掉 实际上,在重复型的囚徒困境中,并不是签订合作协议很困难,困难的是这个协议对博
17 在 20 世纪 60 年代,美国烟草行业竞争激烈,为了争夺市场,各大烟草公司都必须耗费 巨额费用大做广告,这无疑降低了它们的利润水平。也就是说,如果烟草公司都不做广告, 它们的利润要更高。可是,如果其中一家公司不做广告,它的市场份额就会被其他公司抢走。 这正是一个囚徒困境:某公司放弃做,而其它公司仍然大作广告抢占市场,放弃做广告的公 司必然利益受损。在这种情况下,做广告就是每一个广告公司的优势策略。即使烟草公司能 够达成都不做广告的协议,但是这个协议的约束力太低,这在上一节已经解释过,这并不能 将烟草行业从广告战的泥潭中解救出来。 这个时候国家出台法令对于烟草行业来说反而是个好事,烟草公司靠自己做不到的事 情,政府做到了。因为国家法律具有强制性的作用,相当于是烟草集团之间签订了极具约束 力的协议,同时政府承担了监督烟草公司是否违反协议的成本。 除了自由竞争之外,中国的经济自由主义者还强调,经济只应关注效率,不要强求公平, 更加谬误的是他们又把效率只片面地看成是个人或家庭的发财致富。我们可以发现,这种思 想在社会上引起了很恶劣糟糕的一种思想潮流。在书店里充斥着如何发财致富的书籍,而所 谓的一些成功人士则是人们顶礼膜拜的新偶像。 他们甚至还认为,经济体系可以不要任何秩序的竞争,一切都应放任自流,反对靠政府 的干预来建立秩序。所谓秩序,就是游戏规则,就是一个博弈对局的规则。比如很多知名的 所谓经济学家竟然公开颂扬“全民炒股”、全国性的房地产投机之类的对经济具有极强破坏 力的现象。更有甚者是,某经济学居然从理论上推出这样的结论:“腐败适度存在,能使改 革进一步推进”。还有经济学家公开宣称“腐败和贿赂成为改革过程得以顺利进行的润滑剂”。 关于这个问题,笔者会在后面的章节用博弈论的方法与观点来说明其荒谬性与无耻性。 3.“囚徒困境”的破解:无限次重复博弈与有限次重复博弈 “不识庐山真面目,只缘身在此山中。”我们继续囚徒困境的讨论,从上几节的解释中, 我们可以看出,严格囚徒困境的前提条件是博弈各方不可以进行合作,也就是不能够制订有 约束力的协议。但在实际上,合作是文明的基础,比如兴修水利、组织国防、创建企业等都 是合作而产生的,无怪乎哲学家卢梭写了本书《社会契约论》,认为契约是整个人类社会存 在的前提条件之一。 前面已经分析过,如果囚徒困境只是一次性的博弈,那么签订协议是毫无意义的,其纳 什均衡点并不会改变。可以签订协议的一个最基本的条件,就是博弈需要重复若干次,当然 至少大于一次。就恋爱博弈来看,男女双方在交往的过程,随时都在博弈,因为相爱的过程 中任何一个时点都是有可能分手的。用博弈论的术语来说,这是一种囚徒困境的重复博弈。 无数爱情故事中的悲欢离合、精彩跌宕正是这个博弈模型的表现。当然那种素不相识一对男 女,偶尔在酒吧中相遇,于是宾馆订房、春梦一场,拂晓之后就各自分道扬镳的一夜情是理 所当然的一次性囚徒困境博弈。 我们在这里要注意的是,重复博弈与我们前面所提及一般性的动态博弈是不同的。多轮 动态博弈中,参与者能够了解到博弈中的每一步其它参与者的在自己选择某种策略下的行 动,而重复博弈的参与者无法了解到在任何一个步中,其它参与者的策略选择。 囚徒困境一旦从一次性博弈转变为重复博弈,情况会发生非常大的变化,博弈的结局也 就是纳什均衡点可能会完全不同。举个最简单的例子,大家都知道国外的黑手党组织严密, 对待背叛者的惩罚非常残忍。一个黑手党成员告发别的黑手党成员,一定会被组织谋杀。我 们假设前面的囚徒困境故事不是发生在中国,而是意大利,囚犯 A 和 B 都是黑手党成员。 他们很可能宁愿被判处终生囚禁,也不愿意出狱之后被同伙干掉。 实际上,在重复型的囚徒困境中,并不是签订合作协议很困难,困难的是这个协议对博
弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后,博弃参与 者都有作弊的动机,因为至少在作弊的这一局博弈中,作弊者可以得到更大的收益。还是用 爱情来打比方,常言道:“婚姻是走向爱情的坟墓”,但从博弈论的角度来看,婚姻恰恰是男 女双方签订的一种协议,具有一定约束力的协议,因为一旦对方背叛婚姻,就会受到家庭的 压力与社会舆论的谴责 在博弈理论中,博弈专家已经用数学证明出,在无限次重复博弈的情况下,合作可能是 稳固的。如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会 招致对方在下一次博奔时的报复:;而双方都取合作态度会带来合作收益。但是在现实社会生 活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的。当一个人知道他 终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他 人的事情,这就回复到有限次重复博弈的境况。 对于有限次囚徒困境博弈,美国密西根大学的罗伯特·爱克斯罗德教授( Robert axelrod) 曾经做过一个著名的博弈论试验。这个试验的思路非常简单:任何想参加这个计算机竞赛的 人都扮演“囚徒困境”模型中一个囚犯。他们把自己的策略编λ计算机程序,然后这些程序 会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们 每个人都要在合作与背叛之间做出选择。试验参与者连续玩上200次,于是这就更逼真地反 映了日常人际关系。 试验的结果表明,囚徒困境在同样重复数十次或一百次的情况下,只要两个参与者仍然 还是理性人(这可以在该试验的参加者所编程序中反映出),博弈的结果仍然是囚徒A和B 相互把对方招供出来。为了解释这个问题,我们不妨讨论一个博弈两次的模型 我们首先考虑第二次博弈的情况,由于这是最后一次博弈,自然没有后面的博弈对这次 博弈的影响,因此也不就不必为将来打算,个人都只追求这次博弈的最大利益,于是第二次 博弈的结果应该和一次囚徒困境博弈完全一样,自然是囚徒A和B都坦白,达到纳什均衡 现在再来考虑第一次博弈的情况,博弈参与者A已经很清楚最后一次博弈,B一定会招供 那么即使囚徒A不坦白,在下一次博弈时,B也一定会招供,这次博弈A不坦白对下一次 博弈没有任何好的影响,那么作为理性人的A一定仍然选择坦白。对于B,也是一样的道 理。由此可见,第一次博弈自然也和一次性囚徒困境博弈完全一样 其实不论是两次博弈,还是3次,4次,甚至是上百次,只要是有限次数的重复囚徒困 境博弈,其思路方法都是一样的。这种方法就是我们在前文中提到的倒推法( Backward induction),这在博弈论中,对于重复博弈与动态博弈是一种重要的分析方法,当然这对我 们在日常生活中分析问题也不无裨益。比如,汽车企业之间的价格战往往不是一次性降价, 而是一轮一轮地降价,这种类似的问题都可以用有限次囚徒困境模型来分析,事实情况和我 们前面的分析完全相同,汽车企业之间每一次的价格博弈的纳什均衡只有一个,那就是全体 降价 笔者在这一节最后还要补充一个问题,就是多人重复囚徒困境的博弈。实际上,生活中 的两人博弈毕竟是特例,绝大部分的情况还是多人博弈,比如上面提到的汽车价格战。在多 人博弈中,只有其它所有参与者在第k-1次博弈中都是合作的,某个参与者才会在的k次 博弈中采取合作策略。然而,这一策略会带来一个协调问题,任何人的一个小小失误都会导 致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈,最终导致所有人的背叛。 更糟糕的是,一旦出现这种情况,没有任何人会主动开始合作。因此,我们可以这么说,多 人重复囚徒困境(无论有限或无限)中稳定的合作几乎是不可能的 比如1992年英镑事件前后,可以明显感觉到有关游戏各方的思路与分析、行为模式 游戏中的德国、英国、意大利等的共同利益是建立统一的欧洲共同体;而它们在考虑统一货 币的利益时,均在强调自己的利益:德国在其中的地位很特殊,它具有双重身份,既是欧洲
18 弈各方是否具有很强的约束力。一个合作契约建立的困难在于任何协议签订之后,博弈参与 者都有作弊的动机,因为至少在作弊的这一局博弈中,作弊者可以得到更大的收益。还是用 爱情来打比方,常言道:“婚姻是走向爱情的坟墓”,但从博弈论的角度来看,婚姻恰恰是男 女双方签订的一种协议,具有一定约束力的协议,因为一旦对方背叛婚姻,就会受到家庭的 压力与社会舆论的谴责。 在博弈理论中,博弈专家已经用数学证明出,在无限次重复博弈的情况下,合作可能是 稳固的。如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会 招致对方在下一次博弈时的报复;而双方都取合作态度会带来合作收益。但是在现实社会生 活中又不完全这样,人总是要死的,因而人与人之间的博弈不是无限次的。当一个人知道他 终将退出博弈时,他就可能不再害怕此后别人对他的报复,从而可以在博弈结束前做损害他 人的事情,这就回复到有限次重复博弈的境况。 对于有限次囚徒困境博弈,美国密西根大学的罗伯特·爱克斯罗德教授(Robert Axelrod) 曾经做过一个著名的博弈论试验。这个试验的思路非常简单:任何想参加这个计算机竞赛的 人都扮演“囚徒困境”模型中一个囚犯。他们把自己的策略编入计算机程序,然后这些程序 会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们 每个人都要在合作与背叛之间做出选择。试验参与者连续玩上 200 次,于是这就更逼真地反 映了日常人际关系。 试验的结果表明,囚徒困境在同样重复数十次或一百次的情况下,只要两个参与者仍然 还是理性人(这可以在该试验的参加者所编程序中反映出),博弈的结果仍然是囚徒 A 和 B 相互把对方招供出来。为了解释这个问题,我们不妨讨论一个博弈两次的模型。 我们首先考虑第二次博弈的情况,由于这是最后一次博弈,自然没有后面的博弈对这次 博弈的影响,因此也不就不必为将来打算,个人都只追求这次博弈的最大利益,于是第二次 博弈的结果应该和一次囚徒困境博弈完全一样,自然是囚徒 A 和 B 都坦白,达到纳什均衡。 现在再来考虑第一次博弈的情况,博弈参与者 A 已经很清楚最后一次博弈,B 一定会招供, 那么即使囚徒 A 不坦白,在下一次博弈时,B 也一定会招供,这次博弈 A 不坦白对下一次 博弈没有任何好的影响,那么作为理性人的 A 一定仍然选择坦白。对于 B,也是一样的道 理。由此可见,第一次博弈自然也和一次性囚徒困境博弈完全一样。 其实不论是两次博弈,还是 3 次,4 次,甚至是上百次,只要是有限次数的重复囚徒困 境博弈,其思路方法都是一样的。这种方法就是我们在前文中提到的倒推法(Backward induction),这在博弈论中,对于重复博弈与动态博弈是一种重要的分析方法,当然这对我 们在日常生活中分析问题也不无裨益。比如,汽车企业之间的价格战往往不是一次性降价, 而是一轮一轮地降价,这种类似的问题都可以用有限次囚徒困境模型来分析,事实情况和我 们前面的分析完全相同,汽车企业之间每一次的价格博弈的纳什均衡只有一个,那就是全体 降价。 笔者在这一节最后还要补充一个问题,就是多人重复囚徒困境的博弈。实际上,生活中 的两人博弈毕竟是特例,绝大部分的情况还是多人博弈,比如上面提到的汽车价格战。在多 人博弈中,只有其它所有参与者在第 k-1 次博弈中都是合作的,某个参与者才会在的 k 次 博弈中采取合作策略。然而,这一策略会带来一个协调问题,任何人的一个小小失误都会导 致采取背叛策略的其他参与者的数量如同滚雪球一样地愈演愈烈,最终导致所有人的背叛。 更糟糕的是,一旦出现这种情况,没有任何人会主动开始合作。因此,我们可以这么说,多 人重复囚徒困境(无论有限或无限)中稳定的合作几乎是不可能的。 比如 1992 年英镑事件前后,可以明显感觉到有关游戏各方的思路与分析、行为模式。 游戏中的德国、英国、意大利等的共同利益是建立统一的欧洲共同体;而它们在考虑统一货 币的利益时,均在强调自己的利益;德国在其中的地位很特殊,它具有双重身份,既是欧洲
汇率机制的基础,也是德国货币稳定的保证。这就形成了“囚徒困境”的博弈模型。索罗斯 的量子基金发起攻击的主要原因在于:德国联邦银行总裁“暗示”不会放弃德国的利益。而 英国、意大利等国家在本国利益受到损害时,也必然倾向于自保。而在这种分歧加剧的背景 下,无疑会加重有关各方拒绝承认错误的立场,这又进一步加重了分歧,索罗斯正是利用这 套机制获利的。 这个结论似乎是一个令人绝望的,绝望之处必有希望,欧元已经成功地在欧洲大陆通行, 成为可以与美圆相抗衡的硬通货。这其中的道理,笔者在下一节将告诉读者,什么样的游戏 规则可以保证博弈各方稳定合作 4.威胁、承诺、作弊与惩罚 西方哲学家卢梭说过,“究竟是什么不可思议的艺术,使人类找到一种法,通过强迫 人们服从,从而使他们获得自由? 其中最著名的一个答案是由托马斯·霍布斯给出的。霍布斯是现代英国君主立宪政体的 理论奠基人,其代表作是政治学名著《利维坦》( Leviathan)。所谓“利维坦”,是《圣 经》中的一种力大无穷的巨兽名字的音译,在书中意指一个强大的国家。霍布斯说:“人的 自然本性是自私自利、恐惧、贪婪、残暴无情,人对人互相防范、敌对、争战不已,像狼和 狼一样处于可怕的自然状态中。于是出于人的理性,人们相互间同意订立契约,放弃各人的 自然权利,把它托付给某一个人或一个由多人组成的集体(如议会、董事会、法院等),这 个人或集体能把大家的意志化为一个意志,能把大家的人格统一为一个人格:大家都服从他 的意志,服从他的判断。这个人或这个集体就是主权者,而像这样通过社会契约而统一在 个人格之中的一群人就组成了国家。这就是伟大的利维坦的诞生,用更尊敬的方式来说,这 就是活的上帝的诞生。”按照他的观点,没有集权的合作是不可能产生的。因此,一个有力 的政府是必要的。 霍布斯对合作协议的观点是:“不带剑的契约不过是一纸空文。它毫无力量去保障一个 人的安全。”这就是说,没有权威的协议并不是导致民主,而是导致无政府状态。最后,霍 布斯总结道,“在一切政体中,最坏的政体并不是专制而是无政府状态。” 霍布斯的观点虽然有些偏激,但却不无道理。根据博弈论的观点,无论是一次性或有限 次重复博弈,“囚徒困境”产生这种结局的原因是两个囚犯都基于自身利益的角度考虑,这 最终导致合作协议无法稳定遵守。 实际上,决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个,即承诺与 威胁。所谓承诺,在囚徒困境中就是囚徒向对方相互许诺,在下一次博弈时会采取让对方有 利的行为,也就是不坦白与对方合作;所谓威胁,就是某个囚徒告知对方如果下一次博弃时 其采取招供策略而不合作,在下下一次博弈时就会采取不利于对方的策略即招供 其实,在社会生活中,承诺与威胁是非常常见的现象。比如女生告诉她男朋友,如果他 敢结交其他的女生,只要被发现一次,就立刻分手,这是威胁:而她男朋友向她发誓绝对自 己是个专一的情圣,决不会背叛爱情,这就是承诺。再比如,在外交中,美国经常向中国承 诺只承认一个中国的原则,我国政府向国际社会承诺中国强大也决不会采用霸权政策。大家 常见的很多耳熟目详的俗语都是承诺与威胁,比如“人不犯我,我不犯人”、“坦白从宽,抗 拒从严”、“以眼还眼,以牙还牙”等 合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈者进行策略选择 之前作出的,如果承诺与威胁对博弈者的约束力越小,那么合作的可能性就越小。假想一个 可信度很小的承诺与威胁,比如参加考试的学生向监考老师承诺在没有老师监考的时候决不 会作弊,不难想象考场中将会是什么样的一种景象,学生并不都是道德高尚、具有很强自制
19 汇率机制的基础,也是德国货币稳定的保证。这就形成了“囚徒困境”的博弈模型。索罗斯 的量子基金发起攻击的主要原因在于:德国联邦银行总裁“暗示”不会放弃德国的利益。而 英国、意大利等国家在本国利益受到损害时,也必然倾向于自保。而在这种分歧加剧的背景 下,无疑会加重有关各方拒绝承认错误的立场,这又进一步加重了分歧,索罗斯正是利用这 套机制获利的。 这个结论似乎是一个令人绝望的,绝望之处必有希望,欧元已经成功地在欧洲大陆通行, 成为可以与美圆相抗衡的硬通货。这其中的道理,笔者在下一节将告诉读者,什么样的游戏 规则可以保证博弈各方稳定合作。 4.威胁、承诺、作弊与惩罚 西方哲学家卢梭说过,“究竟是什么不可思议的艺术,使人类找到一种法,通过强迫 人们服从,从而使他们获得自由?” 其中最著名的一个答案是由托马斯·霍布斯给出的。霍布斯是现代英国君主立宪政体的 理论奠基人,其代表作是政治学名著《利维坦》(Leviathan)。所谓“利维坦”,是《圣 经》中的一种力大无穷的巨兽名字的音译,在书中意指一个强大的国家。霍布斯说:“人的 自然本性是自私自利、恐惧、贪婪、残暴无情,人对人互相防范、敌对、争战不已,像狼和 狼一样处于可怕的自然状态中。于是出于人的理性,人们相互间同意订立契约,放弃各人的 自然权利,把它托付给某一个人或一个由多人组成的集体(如议会、董事会、法院等),这 个人或集体能把大家的意志化为一个意志,能把大家的人格统一为一个人格;大家都服从他 的意志,服从他的判断。这个人或这个集体就是主权者,而像这样通过社会契约而统一在一 个人格之中的一群人就组成了国家。这就是伟大的利维坦的诞生,用更尊敬的方式来说,这 就是活的上帝的诞生。”按照他的观点,没有集权的合作是不可能产生的。因此,一个有力 的政府是必要的。 霍布斯对合作协议的观点是:“不带剑的契约不过是一纸空文。它毫无力量去保障一个 人的安全。”这就是说,没有权威的协议并不是导致民主,而是导致无政府状态。最后,霍 布斯总结道,“在一切政体中,最坏的政体并不是专制而是无政府状态。” 霍布斯的观点虽然有些偏激,但却不无道理。根据博弈论的观点,无论是一次性或有限 次重复博弈,“囚徒困境”产生这种结局的原因是两个囚犯都基于自身利益的角度考虑,这 最终导致合作协议无法稳定遵守。 实际上,决定合作协议是否能够被囚徒双方执行的最关键的基本要素有两个,即承诺与 威胁。所谓承诺,在囚徒困境中就是囚徒向对方相互许诺,在下一次博弈时会采取让对方有 利的行为,也就是不坦白与对方合作;所谓威胁,就是某个囚徒告知对方如果下一次博弈时 其采取招供策略而不合作,在下下一次博弈时就会采取不利于对方的策略即招供。 其实,在社会生活中,承诺与威胁是非常常见的现象。比如女生告诉她男朋友,如果他 敢结交其他的女生,只要被发现一次,就立刻分手,这是威胁;而她男朋友向她发誓绝对自 己是个专一的情圣,决不会背叛爱情,这就是承诺。再比如,在外交中,美国经常向中国承 诺只承认一个中国的原则,我国政府向国际社会承诺中国强大也决不会采用霸权政策。大家 常见的很多耳熟目详的俗语都是承诺与威胁,比如“人不犯我,我不犯人”、“坦白从宽,抗 拒从严”、“以眼还眼,以牙还牙”等。 合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是在博弈者进行策略选择 之前作出的,如果承诺与威胁对博弈者的约束力越小,那么合作的可能性就越小。假想一个 可信度很小的承诺与威胁,比如参加考试的学生向监考老师承诺在没有老师监考的时候决不 会作弊,不难想象考场中将会是什么样的一种景象,学生并不都是道德高尚、具有很强自制
能力的人。即使在有老师监督考场,并威胁如果有学生敢于顶风作案,必然严惩不待,比如 考卷直接判零分。设想一下,如果这种威胁仅仅是威胁,在学生作弊后并未真的采取什么严 惩的行动,那么学生作弊的风险非常小,考场纪律依然与没有老师一样。由此可见,监考老 师在一定程度上不得不要做一个霍布斯所说的“利维坦”式的专制者。 从实际的整个社会生活说来,对于有限次重复博弈合作问题的解决主要有2个典型方 法,那就是国家法律与社会道德。至于其他解决方法在本质上并不会超脱于它们 5.国家法律 100多年以前,粱启超曾说过:“我国成文法之起原不可确指,然以数千年之思想往往 视法律与命令同为一物。”直至今日,很多人在骨子里面往往还是视法律和命令同为一物。 从命令的角度来理解法律,是指个人意志或某个集团的意志以上下级纵向关系的方式传达 具有直接的强制力,在命令者与被命令者之间缺乏公正程序、严格的概念解释以及独立的第 三者裁判等中间环节或者客观化机制作为媒介。这样的法律往往是朝令夕改,其约束力并不 能保持长久。更严重的是,这种法律经常演变成是权力的合法外衣,为个人私欲谋取利益 而法律不再成为凌驾于社会生活博弈的超然之物,而是让博弈又多了一个权力者的不公平参 与。真正的法律是在顾及社会各方利益博弈均衡的结果,在社会博弈中具有独立性,不参与 博弈。同时,合理的法律必须又要有强制性,不管是对社会大众还是掌握权力的人,都拥有 至高无上的权威,所有的人都必须遵守法律的约定,包括制定与执行法律的人,否则必然要 受到无法逃脱的惩罚。 在这样一种法治环境中,法律必然可以改善囚徒困境。我们来看这样一个例子。如所前 述,我们假定执法人员独立于博弈之外,有公司A与公司B是商业上的合作伙伴,公司A 经常向公司B购买原材料,由于两家公司在不同的城市,于是两个公司经过谈判之后签定 买卖合同,一般在一周之后的那一天,公司A打现金打入公司B的银行帐户,公司B则发 货到公司A,若违约则处于2~5倍罚款。实际上,如果公司A与公司B都是理性人,那么 他们的合作就是一个有限次数重复博弈,在社会不存在法律的情况下,在两个公司任何一次 交易中都有可能有某一家公司不遵守合同,逃款或逃货,即使公司A现金充裕,而公司B 货源充足。所谓的熟人欺诈也是这个道理。然而,在我们理想的法律环境下,公司A和B 最佳策略都是合作。不妨假设公司A与公司B每年的交易都有十几次,平均每笔生意为100 万,若违约则罚款200万。见下图,公司A与公司B合作时,双方收益均为20万(指公司 A与公司B的利润);公司A付款,而公司B不发货,A损失100万,B收益100万;公司 A不付款,公司B发货,公司A收益120万(其中包含20万的利润),公司B损失80万(指 公司B货物的成本,也就是收入减去利润);公司A不付款,公司B不发货,双方收益为 零。当然,这里还要说明的是这个博弈中没有考虑商业信誉的问题,商誉是社会道德中的问 题,后面笔者会详细讨论 公司A 合作 不合作 公司B合作 -100 不合作 100 图3法律模型 很显然这是一个有限次重复博弈的囚徒困境,注意到前文所介绍的模型都是对称的,这 个博弈则是非对称博弈,这更加贴切于日常生活的真相。在没有法律背景的条件下,双方选
20 能力的人。即使在有老师监督考场,并威胁如果有学生敢于顶风作案,必然严惩不待,比如 考卷直接判零分。设想一下,如果这种威胁仅仅是威胁,在学生作弊后并未真的采取什么严 惩的行动,那么学生作弊的风险非常小,考场纪律依然与没有老师一样。由此可见,监考老 师在一定程度上不得不要做一个霍布斯所说的“利维坦”式的专制者。 从实际的整个社会生活说来,对于有限次重复博弈合作问题的解决主要有 2 个典型方 法,那就是国家法律与社会道德。至于其他解决方法在本质上并不会超脱于它们。 5.国家法律 100 多年以前,粱启超曾说过:“我国成文法之起原不可确指,然以数千年之思想往往 视法律与命令同为一物。”直至今日,很多人在骨子里面往往还是视法律和命令同为一物。 从命令的角度来理解法律,是指个人意志或某个集团的意志以上下级纵向关系的方式传达, 具有直接的强制力,在命令者与被命令者之间缺乏公正程序、严格的概念解释以及独立的第 三者裁判等中间环节或者客观化机制作为媒介。这样的法律往往是朝令夕改,其约束力并不 能保持长久。更严重的是,这种法律经常演变成是权力的合法外衣,为个人私欲谋取利益, 而法律不再成为凌驾于社会生活博弈的超然之物,而是让博弈又多了一个权力者的不公平参 与。真正的法律是在顾及社会各方利益博弈均衡的结果,在社会博弈中具有独立性,不参与 博弈。同时,合理的法律必须又要有强制性,不管是对社会大众还是掌握权力的人,都拥有 至高无上的权威,所有的人都必须遵守法律的约定,包括制定与执行法律的人,否则必然要 受到无法逃脱的惩罚。 在这样一种法治环境中,法律必然可以改善囚徒困境。我们来看这样一个例子。如所前 述,我们假定执法人员独立于博弈之外,有公司 A 与公司 B 是商业上的合作伙伴,公司 A 经常向公司 B 购买原材料,由于两家公司在不同的城市,于是两个公司经过谈判之后签定 买卖合同,一般在一周之后的那一天,公司 A 打现金打入公司 B 的银行帐户,公司 B 则发 货到公司 A,若违约则处于 2~5 倍罚款。实际上,如果公司 A 与公司 B 都是理性人,那么 他们的合作就是一个有限次数重复博弈,在社会不存在法律的情况下,在两个公司任何一次 交易中都有可能有某一家公司不遵守合同,逃款或逃货,即使公司 A 现金充裕,而公司 B 货源充足。所谓的熟人欺诈也是这个道理。然而,在我们理想的法律环境下,公司 A 和 B 最佳策略都是合作。不妨假设公司 A 与公司 B 每年的交易都有十几次,平均每笔生意为 100 万,若违约则罚款 200 万。见下图,公司 A 与公司 B 合作时,双方收益均为 20 万(指公司 A 与公司 B 的利润);公司 A 付款,而公司 B 不发货,A 损失 100 万,B 收益 100 万;公司 A 不付款,公司 B 发货,公司 A 收益 120 万(其中包含 20 万的利润),公司 B 损失 80 万(指 公司 B 货物的成本,也就是收入减去利润);公司 A 不付款,公司 B 不发货,双方收益为 零。当然,这里还要说明的是这个博弈中没有考虑商业信誉的问题,商誉是社会道德中的问 题,后面笔者会详细讨论。 20 20 120 -80 -100 100 0 0 很显然这是一个有限次重复博弈的囚徒困境,注意到前文所介绍的模型都是对称的,这 个博弈则是非对称博弈,这更加贴切于日常生活的真相。在没有法律背景的条件下,双方选 公司 B 合 作 子 不合作 合 作 不合作 子 图 3 法律模型 公司 A