有限策略的两人博弈 S1={S11S12,S 13 21 ■参与者1的策略s1是他应对参与者2选择s21的最佳 反应策略如果 11(S 11∞21 1(1221 并且 1(S 1121 Player 2 s1a1(s1821),v2(s1,s2)u1(s1,s2),a2(s1182) Player1s12u2(s12,s21),u(s12,2) u(s1222), 2(s12S22) 13 u1(s13,S21),u2( S13r521 )a1(s13,s2),v2(s13,52)
有限策略的两人博弈 S 1={ s11, s12, s13} S 2={ s21, s22 } 参与者 1的策略 s 1 1 是他应对参与者 是他应对参与者 2 选择 s 2 1 的最佳 反应策略 如果 u 1(s11 , s21) u 1(s12 , s21) 并且 u 1(s11 , s21) u 1(s13 , s21). Player 2 s21 s22 Pl 1 s11 u 1(s11,s21), u 2(s11,s21) u 1(s11,s22), u 2(s11,s22) Player 1 s u (s s ) u (s s ) u (s s ) u (s s ) 12 u 1(s 1 2,s 2 1), u 2(s 1 2,s 2 1) u 1(s 1 2,s 2 2), u 2(s 1 2,s 2 2) s13 u 1(s13,s21), u 2(s13,s21) u 1(s13,s22), u 2(s13,s22) 11
利用最优反应函数寻找纳什均衡 在一个两人博弈中,(S1,s2)是一个纳什均衡, 当且仅当参与者1的策略s1是他应对参与者2选 择S的最佳策略,而且参与者2的策略s2是他应 对参与者1选择s的最佳策略 Prisoner 2 Mum Confess 1 1-9 0 Prisoner 1 Confess 0 9|=6,=6
利用最优反应函数寻找纳什均衡 在一个两人博弈中,( s1, s 2)是一个纳什均衡, 当且仅当参与者 当且仅当参与者 1的策略 s1是他应对参与者 是他应对参与者 2 选 择 s2的最佳策略,而且参与者2的策略 s2是他应 对参与者 1选择 s1的最佳策略 。 Prisoner 2 M -1 , -1 -9 , 0 Prisoner 1 Confess Mum Mum 0 , -9 -6 , -6 Prisoner 1 Confess 12
利用最优反应函数寻找纳什均衡 Player 2 C R T 0 3 Player 1 M 043 4-03 402 3 33 B 3 3.5 ■M'是参与者1应对参与者2选择L的最优反应 ■T是参与者1应对参与者2选择C’的最优反应 B'是参与者1应对参与者2选择R的最优反应 ■L是参与者2应对参与者1选择T的最优反应 ■C’是参与者2应对参与者1选择M'的最优反应 R'是参与者2应对参与者1选择B的最优反应
利用最优反应函数寻找纳什均衡 Player 2 L’ C’ R’ Player 1 T’ 0 , 4 4 , 0 3 , 3 Player 1 M’ 4 , 0 0 , 4 3 , 3 B’ 3 , 3 3 , 3 3.5 , 3.6 M’ 是参与者 1 应对参与者 2 选择 L’ 的最优反应 T’ 是参与者 1 应对参与者 2 选择 C’ 的最优反应 B’是 参与者 1 应对参与者 2 选择 R’ 的最优反应 L’ 是参与者 2 应对参与者 1选择T’的最优反应 C’是参与者 2 应对参与者 1选择M’的最优反应 R’ 是参与者 2 应对参与者 1选择B’的最优反应 13
例子:旅客&本地人 Bar 2 $2 4 $5 $2 10 10 14 12 14 15 Bar 1 4 12,14 20,20 28 15 $5 15,14 15,28 25,25 利用最优反应函数寻找纳什均衡
例子:旅客&本地人 Bar 2 $2 $4 $5 Bar 1 $2 10 , 10 14 , 12 14 , 15 Bar 1 $4 12 , 14 20 , 20 28 , 15 $5 15 , 14 15 , 28 25 , 25 利用最优反应函数寻找纳什均衡 14
例子:夫妻之战 Opera Prize Fight Opera 2,1|0 0 Chi Prize Fight 0 0 1 Opera时C应对P选择 Opera的最优反应 Opera时P应对C选择 Opera的最优反应 因此( Opera, Opera)是一个纳什均衡 Fight时C应对P选择Fght的最优反应 Fight时P应对C选择 Fight的最优反应 因此,( Fight, Fight)是一个纳什均衡
例子: 夫妻之战 Pat Opera Prize Fight 2 , 1 0 , 0 0 , 0 1 , 2 Chris Opera Prize Fight Opera 时C应对P选择Opera的最优反应 Prize Fight , , Opera 时P应对C选择Opera的最优反应 因此 (Opera, Opera) 是一个纳什均衡 Fi ht g 时C应对P选择Fi ht g 的最优反应 Fight 时P应对C选择Fight的最优反应 因此, (Fight, Fight) 是 个纳什均衡 一 15