重复博弈与战略空间的扩展 假定上属博弈重复多次或无限次;那么,每个参与人 有多个可以选择的战略:仅举几例 AlD:不论过去什么发生,总是选择不合作; AC:不论过去什么发生,总是选择合作; 合作不合作交替进行; ·tit- for-tat:从合作开始,之后每次选择对方前一阶段的 行动; trigger strategies:从合作开始,一直到有一方不合作, 然后永远选择不合作
重复博弈与战略空间的扩展 • 假定上属博弈重复多次或无限次;那么,每个参与人 有多个可以选择的战略:仅举几例: • All-D: 不论过去什么发生,总是选择不合作; • All-C: 不论过去什么发生,总是选择合作; • 合作-不合作交替进行; • tit-for-tat: 从合作开始,之后每次选择对方前一阶段的 行动; • trigger strategies: 从合作开始,一直到有一方不合作, 然后永远选择不合作
“囚徒困境”的一般表示 合作 不合作 作 S, R 不合作 R, S 满足:R>T>P>S;(S+RT+T
“囚徒困境”的一般表示 合作 不合作 合作 不合作 T,T S,R R,S P,P 满足:R>T>P>S; (S+R)<T+T
支付函数 双方都不合作 丿(al-d,ll-d)=P+8P+82P+δ3P+…=P 1-δ 对δ的解释: 贴现率; 博弈继续的概率; 者的结合; 般化:未来收益的重要程度
支付函数 • 双方都不合作: • 对 的解释: – 贴现率; – 博弈继续的概率; – 二者的结合; – 一般化:未来收益的重要程度 − = + + + + = 1 1 (all - d,all - d) ... 2 3 V P P P P P
无名氏定理( Folk theorem) 在无限次重复博弈中,如果参与人对未 来足够重视(δ足够大),那么,任何 程度的合作都可以通过一个特定的子博 弈精炼纳什均衡得到。 这里“合作程度”定义为整个博弈中合 作出现的频率。 50年代就人所共知,但无人有发明权;
无名氏定理(Folk Theorem) • 在无限次重复博弈中,如果参与人对未 来足够重视( 足够大),那么,任何 程度的合作都可以通过一个特定的子博 弈精炼纳什均衡得到。 • 这里“合作程度”定义为整个博弈中合 作出现的频率。 • 50年代就人所共知,但无人有发明权;
Tit-for -tat 纳什均衡,但不是精炼纳什均衡: (TFT,TFT)=T+8+827+637+…=7 1-δ (A-D,TFT)=T+8P+82P+δ3P+…=T+P
Tit-for-tat • 纳什均衡,但不是精炼纳什均衡: − = + + + + = 1 1 (TFT, TFT) ... 2 3 V T T T T T − = + + + + = + 1 (All - D,TFT) ... 2 3 V T P P P T P