第2讲完全信息静态博弈 纳什均衡-纯策略 李婷,ltng@fudan.edu.cn 复旦大学
第2讲 完全信息静态博弈 纳什均衡-纯策略 李婷, liting@fudan edu cn liting@fudan.edu.cn 复旦大学
新的观点:纳什均衡 Player 2 C R 0 4 4 0 5 Player 1 M4 0 4 5 3 3 6 6 策略组合(B,R)有如下性质: 参与者1在参与者2选择R时,除了选择B之外不可能获得更 好的收益。 ≯参与者2在参与者1选择B时,除了选择R之外不可能获得 更好的收益
新的观点: 纳什均衡 Player 2 L CR Player 1 T 0 , 4 4 , 0 5 , 3 y M 4 , 0 0 , 4 5 , 3 B 3 , 5 3 , 5 6 , 6 策略组合(B, R) 有如下性质: 参与者1在参与者2选择R时,除了选择B之外不可能获得更 好的收益。 参与者2 在参与者1 选择 B时,除了选择R之外不可能获得 更好的收益。 2
新的观点:纳什均衡 Player 2 R 3 3 Player 1 TMB 043 403 043 3 33 3.6 策略组合(B',R)有如下性质: ≯参与者1在参与者2选择R时,除了选择B’之外不可能获得 更好的收益 ≯参与者2在参与者1选择B'时,除了选择R之外不可能获 得更好的收益
新的观点: 纳什均衡 Player 2 L’ C’ R’ Player 1 T’ 0 , 4 4 , 0 3 , 3 Player 1 M’ 4 , 0 0 , 4 3 , 3 B’ 3 , 3 3 , 3 3.5 , 3.6 策略组合(B’, R’)有如下性质: 参与者1在参与者2选择R’时,除了选择B’之外不可能获得 更好的收益。 参与者2 在参与者1 选择 B’时,除了选择R’之外不可能获 得更好的收益。 3
定义:纳什均衡 在一个标准式的博弈{S1,S2,…Sn,Ⅲ1,l2,…,ln 中,一个策略组合(S1,,Sn)是纳什均衡,如果对 于每一个参与者i, 已知其他人的选择, (S1…,S1-1,s1,S}+1…,Sm) 参与者不可能有 比s*更好的选择了 ≥l1(S1,…,S-1,Si,S1+1,3n 对于所有的s∈S,那么,s使得 Maximize;(S1,…,S1-1,S12S1+12…,n) Subject to s;∈S Prisoner 2 Mum Confess Prisoner 1 9 0 Confess 0 9 6 6
定义: 纳什均衡 在一个标准式的博弈{S1 , S2 , ..., Sn , u1 , u2 , ..., un 中, 一个策略组合 ( ,..., ) * * 1 n 中, 个策略组合 (s1 ,...,sn ) 是纳什均衡,如果 对 于每一个参与者 i, ( ) * * * * * u s s s s s 已知其他人的选择, 参与者i 不可能有 ( ,..., , , ,..., ) ( ,..., , , ,..., ) * * 1 * 1 * 1 1 1 1 i i i i n i i i i n u s s s s s u s s s s s 参与者i 不可能有 比si* 更好的选择了。 ( , , , , , , ) i 1 i 1 i i1 n 对于所有的 i Si s . 那么, *is 使得 M i i ( ) M * * * * aximize ( ,..., , , ,..., ) i 1 i 1 i i 1 n u s s s s s Subject to i Si s Prisoner 2 Mum Confess Prisoner 1 Mum -1 , -1 -9 , 0 4 1 Confess 0 , -9 -6 , -6
有限策略的两人博弈 S1={s11,s12rS13}S2=s21,S22} (s11s2)是一个纳什均衡,如果 1121 11(s 1221r 11(S 1 11 21)≥1(s13,s21)并且 11/=21 1122 Player 2 s1a1(s1821),v2(s1,s2)u1(s1,s2),a2(s1182) Player1s12u2(s12,s21),u(s12,2) u(s1222), 2(s12S22) 13 u1(s13,S21),u2( S13r521 )a1(s13,s2),v2(s13,52)
有限策略的两人博弈 S 1={ s11, s12, s13} S 2={ s21, s22 } ( s 1 1 , s21 ) 是 个纳什均衡 一 ,如果 u 1 ( s11 , s21) u 1 ( s12 , s21), u 1 ( s11 , s21 ) u 1 ( s13 , s21 ) 并且 u 2 ( s11 , s21) u 2 ( s11 , s22 ). Player 2 s21 s22 Pl 1 s11 u 1(s11,s21), u 2(s11,s21) u 1(s11,s22), u 2(s11,s22) Player 1 s u (s s ) u (s s ) u (s s ) u (s s ) 12 u 1(s 1 2,s 2 1), u 2(s 1 2,s 2 1) u 1(s 1 2,s 2 2), u 2(s 1 2,s 2 2) s13 u 1(s13,s21), u 2(s13,s21) u 1(s13,s22), u 2(s13,s22) 5