博弈论与策略行为(8):重复博弈 上面讨论的“囚徒的困境”暗含的几个假定是静态的一次性博弈, 结果陷入了个体理性决策导致集体非理性结果的困境。现在我们 改变假定条件,讨论博弈可以多次进行的重复博弈( Repeated Game)。这时囚犯同时选择不交代有可能成为纳什均衡点 因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选 择。例如,A有机会与B组成策略联盟,并对B宣布如下方针:我 将选择沉默,并要求你也如此来增进各自利益;然而,如果你半 途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这 方针与A利益致,因而是可信的。从B角度来看,如和A合作 可在每阶段得到1年监禁的较好结果;如中途变卦,固然当期可 得一次3个月的更好结果,但此后便每次面临3年监禁后果,显然 是不利的。因而,重复性博弈中,”沉默+沉默“点可能成为对 双方最佳选择,因而成为纳什均衡点。—由于博弈条件由一次 性变为重复性,均衡状态随之发生变化
博弈论与策略行为(8):重复博弈 • 上面讨论的“囚徒的困境”暗含的几个假定是静态的一次性博弈, 结果陷入了个体理性决策导致集体非理性结果的困境。现在我们 改变假定条件,讨论博弈可以多次进行的重复博弈(Repeated Game)。这时囚犯同时选择不交代有可能成为纳什均衡点。 • 因为重复性博弈中选择坦白的机会成本太高,可能成为不利的选 择。例如,A有机会与B组成策略联盟,并对B宣布如下方针:我 将选择沉默,并要求你也如此来增进各自利益;然而,如果你半 途背叛选择坦白,我从下一阶段游戏开始便一直采取坦白。这一 方针与A利益一致,因而是可信的。从B角度来看,如和A合作, 可在每阶段得到1年监禁的较好结果;如中途变卦,固然当期可 得一次3个月的更好结果,但此后便每次面临3年监禁后果,显然 是不利的。因而,重复性博弈中,”沉默+沉默“点可能成为对 双方最佳选择,因而成为纳什均衡点。——由于博弈条件由一次 性变为重复性,均衡状态随之发生变化
博弈论与策略行为(9):序列博弈 ·至此讨论的博弈是参与者同时选择。在序列博弈( Sequential Game)中,各 博弈方先后依次行动。下面支付矩阵描述了一个博弈,如果同时行动,它有两 个纳什均衡点(“甜,咸”与“"咸,甜”)。假定厂商A可以先推出甜饼干 如较快投入生产),我们就有了序列博弈:A先作决策,B随后选择。A决策 时必须考虑竞争者的理性反应:它知道不论自己推出那种饼干,B出于自身利 益会推出另一种。因而A推出甜饼干,B在给定A决策时选择成饼干;给定B的 选择A的选择仍然最佳。结果两个纳什均衡点收敛为一个(下,左)。其中A 由于具有先行者优势( First Mover's Advantage)而得到较大利益, 厂商B 咸饼干 甜饼干 咸饼干 10,20 商A 甜饼干 20,10
博弈论与策略行为(9):序列博弈 • 至此讨论的博弈是参与者同时选择。在序列博弈(Sequential Game)中,各 博弈方先后依次行动。下面支付矩阵描述了一个博弈,如果同时行动,它有两 个纳什均衡点(“甜,咸”与“咸,甜”)。假定厂商A可以先推出甜饼干 (如较快投入生产),我们就有了序列博弈:A先作决策,B随后选择。A决策 时必须考虑竞争者的理性反应:它知道不论自己推出那种饼干,B出于自身利 益会推出另一种。因而A推出甜饼干,B在给定A决策时选择咸饼干;给定B的 选择A的选择仍然最佳。结果两个纳什均衡点收敛为一个(下,左)。其中A 由于具有先行者优势(First Mover’s Advantage)而得到较大利益, -5,-5 20,10 -5,-5 10,20 咸饼干 咸饼干 甜饼干 甜饼干 厂商B 厂商A