(数学模型 博弈的解的概念:纳什均衡(NE: Nash equilibrium) Nash:1994年获诺贝尔经济学奖 NE:单向改变战略不能提高自己效用,即每一方的战略 对于他方的战略而言都是最优的,称为最优反应 纯战略)纳什均衡4(a1,a2)≥4(42a2),a1∈{123}, (a,a2)≥2(a1,a2),a2∈{12} 非常数和 M={mn32=20 M=2221博弈(双矩 2.21 阵表示) 不存在(纯)NE (纯)NE:a=(an1,a2)=(2,2)
博弈的解的概念:纳什均衡 (NE: Nash Equilibrium) 不存在(纯)NE ( , ) ( , ), {1,2}. ( , ) ( , ), {1,2,3}, 2 2 * 2 1 * 2 * 2 1 1 * 1 1 2 * 2 * 1 1 u a a u a a a (纯战略)纳什均衡 u a a u a a a Nash: 1994年获诺贝尔经济学奖 NE: 单向改变战略不能提高自己效用,即每一方的战略 对于他方的战略而言都是最优的, 称为最优反应. − = = 2 1 2 0 1 0 { } M mij 3 2 (纯)NE: a *=(a1 * , a2 * ) =(2, 2) − − − − = 2,2 1, 1 2, 2 2,1 1, 1 1,1 ' M 非常数和 博弈(双矩 阵表示)
数学模型 混合战略(策略: Strategy) 盟军的混合战略集 S1={(p,p2p2)0≤p≤1∑=1 德军的混合战略集 S2={q(q1,q2)|0≤9s1∑q1=1 32 期望收益U1(,)=p2=∑∑pm U2(p,q)=-U/1(P,q 盟军 max pMO p∈S1 完全信息静态博弈 有限博弈矩阵博弈(2人) 德军 min pl g∈S2 零和博弈常数和博弈
混合战略(策略:Strategy) 盟军的混合战略集 期望收益 •盟军 •德军 S1={p=(p1 , p2 , p3 ) | } = = 3 1 0 1, 1 i pi pi 德军的混合战略集 S2={ q=(q1 , q2 ) | } = = 2 1 0 1, 1 i qi qi T p S pMq 1 max T q S pMq 2 min 完全信息 静态博弈 有限博弈 矩阵博弈 (2人) 零和博弈 常数和博弈 ( , ) ( , ) ( , ) 2 1 3 1 2 1 1 U p q U p q U p q pMq p m q i j i i j j T = − = = = =
数学模型 模型求解mxpM pM T mIn p∈ q∈S2 理性推理:不管自己怎么做,另一方总是希望尽量 使自己得分尽量低.(二人零和博弈,完全竞争) 从一个给定的战略中期望得到的赢得,总是 采用该策略时他们可能得到的最坏的赢得! 盟军可以用 min pM来衡量策略p的好坏 德军可以用 max Mq来衡量策略q的好坏 盟军max(p)= min pM 线性P2=35,p3=2/5 德军min()=maxM7规划g=15,q2=4/5 (p,q):混合(策略)纳什均衡( Mixed ne)最优值均为2/5
模型求解 理性推理:不管自己怎么做,另一方总是希望尽量 使自己得分尽量低. (二人零和博弈,完全竞争) •盟军 •德军 T p S pMq 1 max T q S pMq 2 min 线性 规划 从一个给定的战略中期望得到的赢得,总是 采用该策略时他们可能得到的最坏的赢得! 盟军可以用min pM来衡量策略p的好坏 max U1 (p) = min pM min U2 (q) = max MqT 德军可以用max MqT来衡量策略q的好坏 (p * , q * ): 混合(策略)纳什均衡(Mixed NE) p2 *=3/5,p3 *=2/5 q1 *=1/5,q2 *=4/5 最优值均为2/5
数学模型 模型评述 00 M=10 占优( dominate):盟军的行动2占优于1 (前面的非常数和博弈M类似) 混合策略似乎不太可行!但概率可作为参考. 现实:盟军让预备队原地待命(行动2),而德军 没有选择撤退(行动2),结果德军大败 °博弈规则至关重要的,如参与人决策的时间顺序 决策时拥有哪些信息等. 多人(或非常数和博弈问题,一般不能用上面的线性 规划方法求解,而通过纳什均衡的定义求解
•占优(dominate):盟军的行动2占优于1 (前面的非常数和博弈M’类似) •混合策略似乎不太可行! 但概率可作为参考. ----现实:盟军让预备队原地待命(行动2),而德军 没有选择撤退(行动2),结果德军大败. 模型评述 • 博弈规则至关重要的,如参与人决策的时间顺序、 决策时拥有哪些信息等. − = 1 1 1 0 0 0 M •多人(或非常数和)博弈问题,一般不能用上面的线性 规划方法求解,而通过纳什均衡的定义求解
数学模型 小结:博弈模型的基本要素 参与人 行动空间(及战略空间) 效用函数 理性假设参与者完全理性最大化效用) 纳什均衡单向改变战略不能提高自己效用 其他因素 行动顺序(静态、动态) 信息结构(完全、不完全)
小结:博弈模型的基本要素 • 参与人 理性假设 • 行动顺序(静态、动态) • 信息结构(完全、不完全) • 行动空间(及战略空间) • 效用函数 参与者完全理性(最大化效用) 其他因素 纳什均衡 单向改变战略不能提高自己效用