第一章决策理论基砒 则这个决策者将赌g。于是,如果t足真实状态,该决策者最终得到彩金x的 概率是af(xt)1(1-a)g(xt)因而,af+(1-a)g表示这个基于f和g 并按照这个随机的彩票选择过程而生成的复合彩票。 对任一彩金x,我们令[x}表示一个总是肯定给出彩念x的彩票。即, 对每个状态t有 [x(y|t)=1若 ](yt)=0若 y}了 因而,axj+(1-a)y!表示分别以概率a和(l-a)给出彩金x或彩金y 的彩票 1.3公理系 个埋性决策者的偏好所应满足的一些基本性质可以用一组公理表示。除 非另有说明,对于L中的彩票e、f、g和h等全部、E中的事件S和T及介 于0与1之间的数a和B,这些公理都是成立的。 公理1.1A和1.1B断定了偏好在彩票集上构成完备的传递序。 公理11A(完备性)fsg或者g≈sf 公理1.1B(传递性)如果fsg且g≈sh,则f之sh 易于验证,公理1.1B还暗含了-些其他的传递序的结论,诸如:若∫ g且g~sh,则有∫~sh;若∫>sg且g≈sh,则有f>sh等。 公理1.2断言,只有可能状态才是与决策者相关的,因此,给定事件 S,对于只在S以外的状态有所不同的两个彩票对决策者而言将是无差异 的。 公理12(相关性)若f(·|t)=g(·|t)Mt∈S,则f-sg 公理1.3肯定地认为,得到一个较好的彩票的概率总是越高越好。 公理13(单调性)若f>sh且0≤R<∝≤1,则af+(1-a)h>f10 +(1-p)h 基于公理1.3,公理1.4断言Y∫+(1-γ)h总是随着γ的增大而连续地变 得越来越好,因此,对偏好次序介于∫和h之间的任一彩票,总存在某个由f 和h随机化产生的一个复合彩票与之一样好。 公理1.4(连续性)若∫sg且g≈sh,则存在某个数Y,使得0≤ ≤1且g~sYf+(1-Y)h 替代性公理(也被称为独立性公理或肯定性公理)在下述意义上或许是公
8博弈论 理系中最重要的…个:即使没有其他的公理,替代性公理也能对决策者偏好应 具有的性质产生很强的限制。它们也应该是很直观的公理。这些公理表达了这 样的思想,即如果决策者必须在两个选择屮取其一,又存在两个互斥事件且其 中之灬必然发生,而他在每个事件下都偏好于第一个选择,那么,在知道哪个 事件发生之前,他一定偏好于第一个选择(否则,他将表现出一种偏好,按照 这种偏好,必然存在某个事件使得他在知道该事件是真实的之后,他肯定想颠 倒偏好顺序而偏好于第二个选择)。在公理1.5A和1.5B中,事件是用随机的 彩票选择过程而客观随机化的,如前一节所讨论的那样;而在公理1.6A和 1.6B屮,事件是主观未知事件,即是Ω的非空子集。 公理1.5A(客观替代性)若e之sf,g之sh且0≤a≤1,则ae+(1 a)g之saf+(1-a)h 公理1.5B(严格的客观替代性)若e>s∫,gzsh且0<a≤1,则 (1-ag>saf+(1-a)h 公理1.6A(主观替代性)若fxsg,f7g且S∩T=,则f 公理1.6B(严格的主观替代性) 若f>sg,f>rg且SnT=0, 则f>surg 为了充分地了解替代性公理的重要性,考虑一下在决策理论中,当我们试 图去掉它们所引起的困难或许是有帮助的。作为一个简单的例子,设想一个人 偏好x胜于y,但他又偏好.5[y]+.5[z]胜于.5[x]+.5[z],从而违 背了替代性公理。再假设w是他认为好于.5[x]4.5[z]而又坏于.5[y] +.5[z]的某个彩金,即 x>y但.5[y]+.5[z]>[v]>.5[x]+.5[z 现在考虑下述局势:决策者必须首先决定是否接受彩金w。若他不要彩金v, 那就掷一枚硬币,如果正面朝上他将获得彩金z,而当反面朝上时他将在彩金 x与y之间选择其一。 这个决策者应该怎样做呢?他有三个可能的决策策略:(1)接受t",(2) 拒绝v,但若硬币反面朝上时选择x,(3)拒绝,但若硬币反面朝上时选 择y。如果他采用第一个策略,则他获得彩票v;如果他采用第二个策略,则 他获得彩票.5[x]+.5[z];如果他采用第三个策略则他获得彩票.5y +.5[z]。由于他在这三个彩票中最喜欢.5[y]+.5[z],故第三个策略对 他来说是最好的,所以他应该拒绝。然而,如果他拒绝了,而且硬币出 现了反面朝上的情况,则他的偏好规定,他应该选择x而不是y。因此,如果 他拒绝t,实际上,当正面朝上时将以z结束,而当反面朝上时以x结束
第一章决策理论基础 但这个彩票.5x」+.5z]坏于ω,从而他一开始就应该接受v,这就得出 了矛盾。 因此,如果我们在没有替代性公理的情况下谈论“理性的”决策,那我们 必须明确理性的决策者能否保证自匚采用其随后就想改变的策略(如果能,在 本例中“理性的”行为将导致5[y]+.5[z])。如果他们不能做出这样的 承诺,那我们乜必须明确他们是能预见他们未来行为的不一致(此种情况下 本例的结果应该是[v])还是不能预见(此种情况下,本例的结果应该是.5 [x]+.5[z])。如果这些假定看起来没有一个是合情合理的,那么为了避免 这种困境,我们必须接受替代性公理作为我们对理性所下定义的一部分。 公理1.7要求次策者绝不会对所有的彩金都是无差异的。这个公理只是一 个正则性条件以保证在每个状态下都会多少有点利害关系发生。 公理1.7(利害性)对于中的每个状态t,X中都存在彩金y和z,使得 有没有公埋1.8,我们只是在表述我们的主要结论时在形式上有所不同, 并不影响这些主要结论的成立与否,在这种意义上,它对于我们的分析而言是 可要可不要的。公理18断言,决策者在世界所有状态下对客观赌博总是具有 相同的偏好序。如果这个公理不成立,那是因为同样的彩金在不同的状态下可 以有不同的评价值。 公理18(状态中性)对于中的任意两个状态r和t,若f(·|r)=f (·|t)且g(·r)=g(·|t),又有∫≈1rg,则f1 1.4期望效用最大化定理 上的一个条件概率函数( conditional-probability function)是任何一个这 样的函数p:三→△(a2),它能对中的每个状态t和每个事件S都具体指定非 负的条件概率p(t|S),且使得 p(t|s)=0若t∈s,且∑p(r|S)=1 给定任一这样的条件概率函数,我们可以写 p(RIS)=∑力(rS),ⅤRsS,WS∈旦 个效用函数{ utility function)可以是从X×到实数集R的任一函数 对于效用函数a:X×→R,当且仪当它实际上不依赖于状态,于是就存在某 个函数U:X→R使得对所有的x和t都有u(x|t)=U(x)时,u才被称为是
博弈论 状态独立( state independent)的。 给定任一这样的条件概率函数p和任一效用函数a,再给定L中的任一 彩票∫和三中的任一事件S,令E2(u(f)|S)表示当p(·S)为世界真实 状态的概率分布时,由f所决定的彩金的期望效用值,即 E(n()S)=∑p(4ls)>(x,)(x|t) 定理1.1公理1.1AB、1.2、1.3、1.4、1.5AB、1.6AB和1.7同时满足的 充要条件是存在一个效用函数u:X×→R和一个条件概率函数p:三→Δ (Ω)使得 maxa(x,t)=1且minu(x,t)=0,t∈2 p(RT)=p(RS)p(ST),R,S和T使得 (1.4) RESC TO且S≠O fsg当且仅当E((f)|S)≥E(u(g)S (1.5) f,g∈L,S∈E 进一步而言,如果除公理1.1AB~1.7之外,同时满足公理1.8的充分必 要条件是:式(1.3)~(1.5)对一个状态独立的效用函数也成立。 在这个定理中,条件(1.3)是一个规范化条件,它断言,在每个状态下 可以选用在0与1之间取值的效用函数(回顾X和都被假定为有限集)。条 件(1.4)是贝叶斯公式的一个变形,它给出了一个事件下所确定的条件概率 是如何与另一个事件下所确定的条件概率相联系的。不过,这个定理最重要的 部分是条件(1.5),它断言决策者总是偏好于具有较高期望效用的彩票。由条 件(15),我们一旦确定了v和p,就可以预测决策在决策局势中的最优选择 行为。决策者将利用他由Q中已观察到的事件而形成的主观概率,对他来说, 在可供选择的彩票中,挑选那个具有最高的期望效用的彩票。注意到,在X 和Ω都是有限集时,只有有限多个效用和概率值需要被确定。因而,决策者 在L中无限多个彩票上的偏好可以由有限多个数字完全表征。 为了能在实践中应用这个结论,我们需要一个对所有x、t和S来确定效 用u(x,t)和概率p(t|S)的程序。正如雷费(1968)所强调指出的那样, 这样的程序确实存在,它们构成了实际决策分析的基础。为了明确表示这样的 一个程序并证明定理1.1,让我们使用决策者的偏好满足公理1.AB~17的 假定,从定义一些特殊的彩票开始。 让a1表示一个在每个状态下都给决策者最好彩金的彩票;让a0表示一个 在每个状态下都给决策者最差彩金的彩票。即对于每一状态t和彩金y和z都 有a1(y|t)=1=a0(z1t),其中y和z对X中每个x都满足y之14x之{i{z。这 14样的最好彩金和最差彩金在每个状态下都能找到,因为偏好关系(之:)在有
第一章决理论基础11 限集X上构成一个完备的传递序。 对于三中的任一事件S,令bs表示这样的彩票,它使得 bs(·it)=a1(·1t)若t∈S hs(·|t)=a(·|t)若teS 即bs是“赌S",如果S发生则给出可能的彩金中最好的,否则,给出可能 彩金中最坏的。 对于任一彩金x和任一状态t,令cx,表示一个彩票,使得 ](·|r)若 (·|r)=a0(·|r)若r≠ 即cx,除了在状态t给出彩金x之外,在其余状态下都是给出最差的彩金。 现在,在给定满足公理1.1AB-1.7的偏好后,我们可以定义一个确定满 足定理的效用和概率的程序了。对每个x和t,首先问决策者:“如果知道t 是世界真实状态,你认为怎样的一个数β让你感到[x]与Ra1+(1-β)a0之 间是无差异的?”由连续性公理知,这样的一个数字一定存在。那么,让 (x,t)等于他所同答的,则 [ -:u(x, t)a+(1-u(x, t))ao 对每个t和S,再问决策者:“如果知道真实状态在S中,你认为怎样的 个数y让你觉得b:与Ya1+(1-y)a0之间是无差异的?”同样由连续性公 理知,这样的数γ一定存在(主观替代性公理保证了a1sb1sa0)。令p (tS)等于他所确定的y,则 blz-sp(t!S)a1+(1-p(i S))ao 在定理1.1的证明中,我们将说明用这种方式定义的u和p确实满足定 理的所有条件。因而,有限多个提问就足以确定那些完全刻划了决策者偏好的 概率和效用。 定理11的证明设p和u是如上所构造的。首先从公理系推导出条件 (1.5)。相关性公理和a(x,t)的定义蕴含着,对于每个状态r,有 (x,t)b;t+(1-u(x,t) 15 于是主观替代性公理意味着,对每个事件S,有 C 4(x,t)b;+(1-u(x,t)la0 公理15A和1.5B一起暗示了f≈sg当且仅当 ①原文只有传递序,不足以欣立—译者注。 ②原文误为r¢t——译者注