第一章决策埋论星础1 都是上的一个概率分布,使得p(S|S)=1,且 p(RT)=p(R|S)p(S|T),RsS,Ⅵ→S 我们用A(Q)表示上所有的贝叶斯条件概率系所组成的集合 对任一有限集Z,我们用△(Z)表示Z上对Z中每个元素都赋予止概率 的所有概率分布所组成的集,于是 △(Z)=1q∈△(Z)iq(z)>0,Vz∈Z (1.6) △()中的任何一个概率分布p都可以由下式生成△(9)中的一个条件概 率系p pit I S) 若t∈S p(t1S)=0 若 由这种方式从△(9)中的分布所生成的条件概率系没有包含△()的全部内 容,但△(g)中其余的任何一个贝叶斯条件概率系都可以被表达为由此方式生 成的条件概率系的极限。这一事实从下述定理可以得到肯定,定理的证明,参见 迈尔森(1986 定理14概率函数p是Δ'(3)中的一个贝叶斯条件概率系的充要条件是, 在△(9)中存在一个概率分布序列{p"-1使得,对的每个非空子集S和 中的每个t都有 p(1S)=imp(t)若t∈S p(t|S)-0 若t∈S 1.7贝叶斯模型的局限性 我们已经看到期望效用最大化定理是如何从公理系推导出来的了,而这些22 公理作为对理性偏好的一个刻划从直觉来看似乎合情合理。因为有了这个结 论,数理社会科学家有信心认为,基于期望效用最大化而建立的人类行为数学 模型应该有广泛的适用性和重要的意义。本书在很大程度上就是在这种信心激 励下的产物。 尽量了解期望效用最大化在实际决策中的适用范围是很重要的。在考虑这 个问题时,我们必须记住,征何个次策模型都可以被描述性地或处方性地使 用。这就是说,我们用一个模型去试图描述或预测人们将做什么,或者用一个
18博弈论 模型作为我们自己(或我们的顾客)的决策指南。一个模型预测上的有效性可 以用实验或经验数据来检验;但-一个决策模型处方上的有效性是难以检验的, 我们只能询问了解这个模型的人,若他不依据这个模型做决策,他是否会感到 他正在犯一个错误。 从直觉公理系推导出来的期望效用最大化定理1.1,是期望效用最大化在 处方上有效的一种证明,只要这种证明是可能的。尽管也有其他一些决策模型 被提出过,但就处方性日的而言,几乎没有一个能挑战期望效用最大化模型的 逻辑吸引力。 当然,任何一个决策模型的描述性作用和处方性作用之间都有一种密切的 关系。如果一个模型对一个决策者来说是处方上有效的,那么,只有在他犯错 误时才会偏离这个模型。人总是要犯错误的,但人又会尽量避免。当一个人已 经有充分的时间去弄清楚一个局势并且清楚地思考了它,我们可以预期他将会 相对少地犯错误。因此,我们可以预期期望效用最大化在很多局势中是预测上 准确的。 然而,决策方面的实验研究已经揭示出了一些系统背离期望效用最大化的 行为。[参看阿拉依斯和哈根( Allais and Hagen,1979);卡尼曼和特弗斯基 ( Kahneman and Tversky,1979);卡尼曼、斯洛维克( Slovic)和特弗斯基, 1982。」这一研究导致了一些在描述上可能有更大准确性的新决策模型的提出 23[参看卡尼曼和特弗斯基,1979;麦奇纳( Machina),1982]。我们在这里讨论 3个著名的例子,这些例子,人们看来是常常违背期望效用最大化的:一个是 效用函数不适用,一个是主观概率不适用,一个是任何经济模型都不适用。 首先考虑一个著名的悖论,由M.阿拉依斯提出(参见阿拉依斯和哈根 1979)。设X={12,1,0}(单位为百万美元,本例中下同),且令 f1=,10[12]+.90[0 2=.11[1]+.8[0] f3=[1] ∫4=,10[12]+,89[1.+.01[0] 许多人表现的偏好为f1>f2和f3>∫4(回顾没有下标的>意味着下标是 )。这些人或许感到1200万美元明显地好于100万美元,所以f2与f1相比, 彩金低些的彩票即使中彩概率稍稍高一点也是没有吸引力的。另一方面,它们 宁可接受∫3中肯定的100万美元,而不愿意接受∫4,即以1%的概率一无所 获作为代价去换取10%将其彩金从100万美元提高到1200万美元的诱惑。 这样的偏好是不能用任何效用函数去解释的,为了证明这一点,注意 5∫1+.5/3=.05[12]+.5[1]+.45[0 f2+.5f4
第一章决策理论基础 因此,共同的偏好f1>f2和∫3>f4一定违反了严格的客观替代性公理。 另外一类悖论引起了对决策理论中主观概率之作用的挑战,最早见于埃尔 斯伯格( Ellsberg,1961)的经典论文屮。畫费(1968)给出了这类悖论的 个简单例子。令X=-$100,$100,=A,N,且令 bA($100A)=1=bA(-$100N) by(-$100A)=1=b($100|N) 也就是说,bA是个100美元的赌,如果A发生,决策者;而b、是决策者 赌N,100美元,即如果N发生,决策者就贏得100美元。假设A表示美国 队将在下一次全明星赛(美国棒球赛事)中获胜这个状态,而N表示国家队 将在下一次全明星赛中获胜这个状态。(这两个队中间必然有一个队在全明星24 赛中获胜,因为只有这两个队而且棒球比赛规划不允许出现平局。) 许多对美国捧球赛几乎一无所知的人都表示偏好.5[$100]+.5[ $100]>bA和,5[$100+.5[-$100]>b。也就是说,他们将严格地偏 好通过掷一枚公正的硬币并以100美元赌正面朝上胜于以100美元赌全明星赛 中哪个队会获胜。这样的偏好是不能用Ω上任何主观概率分布来解释的。由 于9中至少有一个状态的发生概率必定大于或等于,5,故赌这个状态下胜队 所给出的期望效用一定至少与赌掷一枚公正的硬币所给出的期望效用一样大。 从另一种方式也可以看出这一点,注意 50bA+,50by=.5[$100]+.5[-$100] 50(.5[$100]+.50[·$100]+.50(.5[$100+.5[-$100]) 故上面所表示的共同偏好一定违反了严格的客观替代性公理。 为了说明构造一个既在预测上准确又在处方上有吸引力的决策模型之困 难,卡尼曼和特弗斯基(1982)提出了下述例子。情形A:你准备观看戏剧表 演,为此你已经花40美元买了一套票,在你将到剧院之际,突然发觉票从口 袋中丢失了,你必须决定是再花40美元去另买一套票(还有类似座位的票出 售)还是简单地回家。情形B:你准备到剧院观看演出,票的价格是每套40 美元,你没有事先买好票,而在临行时放了40美元在口袋中,在你将到剧院 之际,突然发觉钱从你的口袋中丢失了,你必须决定是用赊帐卡(尚在)买票 还是简单地回家。 正如卡尼曼和特弗斯基(1982)所报告的,大多数人都说在情形A中他 们会简单地回家,但在情形B中会买票。然而,在这两种情形的每一种情形 中,由两个选择所得到的最后结果都是,一方面观看演出并支出了80美元 另-一方面没有观看演出而支出了40美元。因而,任何一个经济模型,只要它 假定在这两种情形中,决策者所关心的所有因素只是货币财富水平和戏剧消 25 费水平,都不可能对这样的行为做出解释
20博弈论 任何一个分析模型的效力总是来自于其简化假设,这些简化假设能使我们 将不同的局势视作分析上的等价,而这种简化假设总是值得疑问的。一个能对 本例中的普遍行为做出准确预测的模型,一定是在对事件顺序做了详尽描述的 基础上对这两种情形加以区分了的,尽管这些事件顺序并没有对结果产生影 响。然而,如果将模型用作处方上的日的,做这种区分,将可能减少模型正常 的吸引力。(如果一个顾问告诉你,应该在情形A与情形B中总是采取某种不 同的行为,你会怎么想?) 期望效用最大化的解释力可以通过凸出扰动( salient perturbations)分析 而扩展到对许多貌似矛盾的情形的分析。某给定决策问题的一个扰动就是任何 另一个(在某种意义上)与之非常相似的决策问题。对任何一个给定的决策问 题,如果实际面临这个决策问题的人很可能会采取其在某个扰动决策问题中 样的行动,我们就说这个扰动是凸出的。当人们发现决策问题难以理解而且扰 动情形又与他们通常体验的情形很相像时,这个决策问题的特定扰动可能也是 凸出的。如果我们能对个人决策问题的凸出扰动进行预测,那么在这个凸出扰 动中最大化他/她期望效用的决策可能会是对其行为的一个准确预测。 举例而言,让我们重新考虑赌美国全明星赛哪个队会获胜的问题。为了让 个决策者在1b4,bN,.5[$10+.5[-100]}上表达出他的偏好序 (≈a),对这个集合中的每一刈元素,我们必须问他,如果无增加信息地提供 给他,也就是不再给他关于Ω中真实状态的任何新的信息,他在这副赌博 选择是将会选择哪一个。换句话说,当我们问他是愿意拿100美元去赌美国队 获胜还是愿意拿100美元去赌抛一枚公正的硬币时,我们假定,提供选项给他 的唯一事实不会改变他对全明星赛的信息。然而,人们通常只有在拥有一些特 殊信息或信念时才去打赌。因此,对于某个对棒球赛知之其少的人来说,当有 人提供给他的打赌选项中有赌美国队胜这个选择时,这通常是因为对方有信息 26表明美国队可能会输。在这种情形下,一个去赌全明星赛中某方获胜的机会应 该(由贝叶斯公式)让一个对棒球赛一无所知的人降低其对该方获胜的主观概 率,因此他可能更愿意去赌一枚公正的硬币。我们可以在受控实验中尽可能无 信息地提供赌项,甚至可以告诉实验对象这些赌项是无附加信息地提供的,但 这是很不自然的,以致实验对象反而会以为我们只会提供我们认为会输的队给 他们赌胜。 1.8占优 有时决策者发现主观的概率难以确定。这一点在傅弈论中特别真实是有根 本的理论原因的。在一个博弈局势中,一个决策者所面临的未知环境或“世界 状态”可能包括其他人即将做出的决策结果。因此,为了确定他在这个状态空
第一至决策理论基础21 问上的主观概率分布,决策者必须考虑到他所知道的其他人决策过程的全部信 息、。从这些其他人也关心他的决策角度而言,他的关于其他人行为的信念至少 部分地基于其他人关于他将怎么做的信念。因此,确定其他人行为的主观概率 可能要求决策者了解一些由自己的决策过程所产生的预期结果,其中有一部分 正是确定自己的主观概率。解决这个貌似悖论的问题正是博奔论讨论的主题 将在本书随后的各章中展开论述。 然而有时候,无论决策者的信念是什么,某些决策选择对他来说都不可能 是最优的。在由决策理论转向博弈论之前,本节介绍一些能说明何时这种与概 率无关的论断会成立的基本结论。 考虑一个决策者,他具有一个状态依赖(sate- dependent)效用函数u X×→R且能在X中选择任何一个x,即把X改成理解为决策者可利用的决 策选择集。如果他在Ω中每个状态t的主观概率是p(t)[即p(t)=p(t|Q), ↓t∈a],那么,决策者将会从X屮选择某个特定的y,其前提是 ∑p(t)u(y,t)≥∑p(t)x(x,t),x∈x 性是许多数理经济学中出现的集合的一个重要特征。一个向量集是凸的 ( convex),其充要条件是,对于任意两个向量p和q以及0与1之间的任一数 字入,若p和q都在这个向量集中,则向量小+(1-A)q也一定在这个集合 中。从几何意义上说,凸性意味着连结集合内任意两点的整个线段也都一定包 含于此集之中。 定理1.5若给定:X×→R和Ⅹ中的y,则△()中使得y为最优的所 有p所组成的集合是个凸集。 证明设y对决策者拥有信念p或者q来说都是最优的,令λ是0与1之间 的任一数,而r=p+(1-入)q,那么对X中的任意x都有 ∑,(t)n(y,1)=A∑力(t)n(y,t)+(1-)g(t)z(y,t) ≥入∑p(t)(x,t)+(1-入)∑q(t)n(x,) r(tu(r, t) 因此,对信念r来说y是最优的。 举例而言,设X={a,B,y,Q=11,2},且效用函数a如表1-1所 示。由于只有两个状态,故p(1)=1-p(a2)。对决策者来说,a是其最优决