考试博弈 报 (-10,-10) 学生 及格 接受 (-1,1) 老师 不及格学生报复(-10,-10) 接
老师 学生 学生 及格 不及格 报复 接受 报复 接受 (-10,-10) (-1, 1) (-10, -10) (1, -1) 考试博弈
逆向归纳法( backward induction) 在有限博弈中,我们可以用逆向归纳法 求解精炼纳什均衡:从最后一个决策点 开始,找出该子博弈的纳什均衡;然后 再倒回到倒数第二个决策点,找出决策 者的最优决策(假定最后一个决策者的 决策是最有的;如此一直到初始决策点, 所有子博弈上的最优选择就是精炼纳什 均衡。又称“ rollback
逆向归纳法(backward induction) • 在有限博弈中,我们可以用逆向归纳法 求解精炼纳什均衡:从最后一个决策点 开始,找出该子博弈的纳什均衡;然后 再倒回到倒数第二个决策点,找出决策 者的最优决策(假定最后一个决策者的 决策是最有的;如此一直到初始决策点, 所有子博弈上的最优选择就是精炼纳什 均衡。又称“rollback
举例 (2,Q) (5,0) R 4,2)
举例 1 2 1 (2,0) (5,0) (4,2) (1,1) U D R L U’ D’
均衡路径与非均衡路径 精炼纳什均衡下所经过的决策点和最优选择构 成的路径,称为均衡路径( equilibrium path); 其他的路径是非均衡路径( off-equilibrium path) 均衡结果依赖于非均衡路径上的选择:1只所 以一开始就选择U,是因为他预期如果选择D 的话,2将选择L;而2只所以选择L,是因为她 预期如果选择R的话,1将选择U
均衡路径与非均衡路径 • 精炼纳什均衡下所经过的决策点和最优选择构 成的路径,称为均衡路径(equilibrium path); • 其他的路径是非均衡路径(off-equilibrium path); • 均衡结果依赖于非均衡路径上的选择:1只所 以一开始就选择U,是因为他预期如果选择D 的话,2将选择L;而2只所以选择L,是因为她 预期如果选择R的话,1将选择U’