要人们很勉强接受约太强旳假设.而H,现实生活中存在:荇大量 的局势,其叶局中人的利益只是郃分地相反.但即使对这些所谓 的多人合作对策,我们仍然能借鉴来自两个局中人情形的丰经 验和理论知识.例如,在本章后面我们将详细考虑的著名的闪犯 两难对筆就导致对在诸妇超级市场竞争顾客、政治家寻求选票 或动物竞争食物那长·-开始只有竞争者的群体中合作行为怎样 能发展起米的许多洞察初-一肴,这类局势表现为包括有许多局 中人的局势.然而,结果是面对竞争者的总的局势的很多重特 性可通过考虑一对相互作用来把握住.因为很少有-个或更多的 竞争者同时相互对峙的情形.这将转而导致一系列两人对策 所以记住这些想法,我们回到基本的令人困惑的问题:白 事理的局中人如何在没有鞍点的两人零和对策中进行活动呢? 让我们通过再次考虑一个在美国独立战争时期(1775-1783)出 现的有点过于简化的军事态势这样的对策问题 康科德军火库对策 英国人决定要进攻在康科德的美国军火库.同时美国情 报部门截获了这个重要情报但是美国并不知道英国将走哪条 路线:走陆路还是走海路.不幸的是,美国的军力要同时抵御两[10 条路线的进犯,力量是太小了,因此美国最高指挥部必须选择其 中的这条或另一条路线来防御 而事实的真正要害是,英国人的弹药不足所以如果两军相 遇,英国人将撤退.但如果两军不相遇,英国人将占领弹药库并 获得大量弹药的控制.如果发生了这种情况,双方都必须对英国 人从康科德返回时采取什么行动作出决策.美方或可选择在已 ①译注:美国马萨诸塞州东部城镇.为美国独战争的始发地 之
知的英方返回路线上伏韦,或进兵军火库并立即在车火库进攻 英国问样、英国人或可以选择立即在臼天撤离笮火库或等剑夜 间再从军火库撤退.这些不同的可能性导致每…方能来取冈种 不同的行动步骤,分别标以A.,A-Ⅱ,…,B-‖l,B-.A表示 美方的选择,B表示英方的选择 A-I=鮭韵斯钾,然击,B-!=从海上来,后立即离升 A-I。陆路防御,缜后迂攻,BⅡ=从海上来,后等到夜釦 A-Ⅲ=海上防彿,然后代击,H-=从陆路来,然后立即商H A-Ⅳ≤海上防御,然萨攻:H-Ⅳ=从陆路来,然后等到泔 现在我们来考虑支付要指出的第…点是两军的利益是截 然相反的.因此,康科德军火库对策是一个两个局中人的零和对 策—就如同俾斯麦海战那样.所以我们就任意地商定度量美 方的支付,英国人在每种情形中得到的支付为美方支付的负值 因为英国人的弹药不足,如果两军相遇则优势属于美方.如 果美方采取行动A.Ⅰ或A-Ⅱ,而英方以B-或B-Ⅳ响应就会 发生正面遭遇.如果美方选择A-Ⅲ或A-Ⅳ,而英方选择B-1或 B-Ⅱ,也将出现正面遭遇这四种组合中的任一种对美方都台;出 最好叮能的结果,所以对每对这样的选择我们都给它们,如 说,2点的支付.对于矩阵中其余的表值我们说明如下.如果英 国人白天遇到伏击,他们将被歼灭—这对美方恰恰是好的这 发生在行动对(A-I,B-)或(A-Ⅲ,B-)上.所以在这样的情 形中美方又得到2点的记分.但是如果在夜间英国人遇到伏击 [}他们就能克服困难后到达目的地,并给美方以0点支付这些就 是(AI,B-Ⅱ)和(A-Ⅲ,B-Ⅳ)的行动对现在如果美方进攻军 火库而英国人已撤离,即选择(A-,B-J)和(A-Ⅳ,B-Ⅲ),美方 也得分0点但若美方进攻并发现英国人在等待夜间撤退,双方 都将蒙受惨重损失而美方只得到1点,这些决策相应于行动对 (A-Ⅱ,B-Ⅱ)和(A-,B-B).把所有这些信息放在一起,我们就 能写下支付矩阵中的有关表值如下:
禁娘额韵 岁国 海路 海路 陆路 陆路 立即走等到夜间立即走等到夜间 美国 AI陆路、伏击 A-Ⅱ陆路、进攻 A-海路、伏击 2022 220 A-海路、进攻 粗略地审视一下支付矩阵就能发现每行的最小值是这样 个事实;因此,这些极小斗的极大就是0.另方面,每列中的最 大值是2,这样就得到这些极大中的极小就是2.极大极小点和极 小极大点是不一致的;就这个对策而言没有鞍点结果是,美方和 英方司令官都没有他们可以采取的清晰地、“防弹的”行动步 骤甚至事先向对手宣布 旦获悉其敌手的行动时也 不会冒严重遗憾的风险行动步骤简言之,康科德军火库对策在 纯策略意义下无解,令官中的一人过早地泄露他的特定行动步 骤就会导致他将失去如果他不泄露的话不必放弃的点数.例如 在没有有关提前知道英方计划的情报的情况下,A-或A看起 来对美方有利,因为除了英方的一个选择外,每一个都给出2点 的最大支付.但是如果美方司令官事先知道(或许通过像内森·黑 尔①这样的间谍的报告得知)英方将走海路、并等待到夜间撤离 (行动B1,他当然就会避免采取行动A-1,因为相对于英方的这 个特定选择,这个行动给予美方司令官的是最小支付(同时又是 最大的遗憾)事实上,如巢英方事先宣称B为其目的,行动A-L12 )详注: Nathan fate,1755.6.6-1776.9,22.美国独立战争时期的争 官,在侦察英车时被捕牺料.毕业于耶鲁大学(1773)
就是美方司令官最坏的可能选择.所以,这里我们就有了一个在 纯策略意义下无解的对策的例子;对每一·方而言,不管另--方选 择做什么都不存在订采取的最好行动简之,不存在鞍点 在这样的对策肀,我们自已感受到的情况类似于很早以前 试图求解方程x2+1=0(该方程无实数解)的方程论研究者所 面临的情况.这个困难的历史性解决是创造了一种新的数的概 念,即,复数,在复数系中…ˉ切都恢复正常、可以理解.在对策论 中也是这样,解决我们称之为“无鞍点两难问题”的出路就是 要创造我们认为合理的行为意味着什么的新概念 我们已看到,如果对策有一个鞍点,每一方都能事先宣石他 们的行动,而且无论怎样都不会危及他们获得最好可能的支付 所以事先知道你的对手将要做什么的信息无助于增加你的收 入一一当然要假设你和你的对手都是合理地行动的.但是在不 存在鞍点的情形,所有可寄予希望的事都不再有效,因为那时我 们已经失掉了关于“合理”意味着什么的概念.结果是要再现这 类“对泄露情报具有的免疫性”的方法就是以如下方式行动:在 你没有做之前你甚至不知道自已将要去做什么!尽管初一看, 这听起来也许有点自相矛盾,特别是就我们按惯例把什么看作 是构成“合理的行为”而言是如此,下一节我们将证明这种“没有 知识”的权威意见可以翻译为一种最优策略概念的可行的推广 而且是一种将导致无鞍点两难问题的解决的推广. 让他们去猜吧 在鲍博·迪伦①的歌曲“鲍博·迪伦的第115个梦”中,他说 到已从监狱中逃出,然后必须决定是否要返回监狱帮助他的朋 ①译注: Bob dylan.1941.5.24~,美国歌星和作曲家.其歌曲以崭 新的文学歌词在流行音乐中独树一帜 2
友或听任朋友们的命运安排,自己乘船扬帆而去.在歌曲中,他让掷 枚硬币,在这两种山能性中作出决定鲍博…迪伦的决策程序可用 来极好地阐明在无鞍点对策中支配如何选择行动的步骤的原圳.13i 在这种对策中,由于前面概述过的原因.局中人把他们的选 择对其对手保密是至关重要的.有什么使你的决策保密比随机 选择你的决策更好的方法呢!这种方法的特点是直到由诸如轮 盘赌轮子的旋转,或者鲍博·迪伦的硬币抛掷的某种随机化机制 实际上发出命令作出冼择之前,局中人自己都还不知道他们将 要采取什么行动.当然,通常会是这样一种情况,即某些选择看 起来比其他选择更有吸引力所以并非所有可能的行动都给以 同等的权重;于是,为做出选择所需要的是一个偏重的硬币或者 是某些带权重的骰子.因此,我们现在把局中人的策略看作是由 规定了由这种随机化机制所选择的任何特定行动的可能性的 组概率给出的 当然,如果行动是随机选择的,说它有-…-个确定的支付就不再 有意义现在局中人最好是把由使用某一策略得到期望支付看作是 应用该策略所得到的叫报的度量,其中期望值是由考虑所取的可利 用的不同行动的相对能性来计算的为牢记住这些概念,这里 有一个能阐明无鞍点对策中的最佳局的熟悉的儿童游戏 石头—剪刀一纸对策 这是一个有两个局中人的对策,这两个局中人分别称为马 克西米利安( Maximilian)和*涅瓦( Minerva)(以下就简称为Max 和Min),他们必须同时在以下三个可能的选择中选个:石头 纸或剪刀.这种对抗的结果由下列规则给出 1.纸包住石头 石头粉碎剪刀 3.剪刀剪开纸 --3