第十章博弈论 第一节博弈论基础 博弈论( Game Theory) 博弈论研究决策主体的行为相互发生直接作用时的决策,以及这种决 策的均衡问题。也就是说,一个主体(一个人或一个企业)的选择受到其 他主体选择的影响,并且其选择反过来会影响到其他主体的选择,这类的 的决策问题和均衡问题就是博弈论硏究的对象。在这个意义上说,博弈论 也称为“对策论” 博弈论中的个体决策与传统经济学中的行为个体决策不同。 博弈论的基本概念 1、参与者/局中人( players):在博弈中选择行动以最大化自己效用的决 策主体 2、行动( actions, moves):参与者的决策变量 3、战略( strategies):参与者选择行动的规则
第十章 博弈论 第一节 博弈论基础 一、博弈论(Game Theory) 博弈论研究决策主体的行为相互发生直接作用时的决策,以及这种决 策的均衡问题。也就是说,一个主体(一个人或一个企业)的选择受到其 他主体选择的影响,并且其选择反过来会影响到其他主体的选择,这类的 的决策问题和均衡问题就是博弈论研究的对象。在这个意义上说,博弈论 也称为“对策论”。 博弈论中的个体决策与传统经济学中的行为个体决策不同。 二、博弈论的基本概念 1、参与者/局中人(players):在博弈中选择行动以最大化自己效用的决 策主体。 2、行动(acttions, moves):参与者的决策变量。 3、战略(strategies):参与者选择行动的规则
4、信息( information):是参与人在博弈中的知识,特别是有关其他参 与人(对手)的特征和行动的知识。 5、支付收益( payoff):是参与人从博弈中获得的效用水平,是所有参 与人战略或行动的函数,也是是每个参与人真正关心的东西 6、结果( outcomes):是指博弈分析者感兴趣的要素的集合。 7、均衡( equilibrium):是所行参与人的最优战略或行动的组合 上述概念中,参与人、行动、结果统称为博弈规则,博弈分析的目的 是使用博弈规则决定均衡。 、博弈的分类 1、合作博弈( cooperative game)和非合作博弈(non- cooperative game 人们的行为相互作用时,当事人能不能达成一个具有约束力的协议,如 果有,就是合作博弈;反之,则是非合作博弈。 现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈
4、信息(information):是参与人在博弈中的知识,特别是有关其他参 与人(对手)的特征和行动的知识。 5、支付/收益(payoff):是参与人从博弈中获得的效用水平,是所有参 与人战略或行动的函数,也是是每个参与人真正关心的东西。 6、结果(outcomes):是指博弈分析者感兴趣的要素的集合。 7、均衡(equilibrium):是所行参与人的最优战略或行动的组合。 上述概念中,参与人、行动、结果统称为博弈规则,博弈分析的目的 是使用博弈规则决定均衡。 三、博弈的分类 1、合作博弈(cooperative game)和非合作博弈(non- cooperative game ): 人们的行为相互作用时,当事人能不能达成一个具有约束力的协议,如 果有,就是合作博弈;反之,则是非合作博弈。 现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈
2、静态博弈( static game)与动态博弈( dynamic game): 按参与人行动的先后顺序划分,静态博弈:参与者同时决策,或非同时 决策但后决策者不知道先决策者的行动。动态博弈:参与者的行动有先后, 后决策者能观察到县决策者的行动,并据此选择行动。 3、完全信息博弈( games of complete information)和不完全信息博弈 games of incomplete information 完全信息指的是每一个参与人对所有其他参与人(对手)的特征、战略空 间及支付函数有准确的知识;否则,就是不完全信息
2、静态博弈(static game)与动态博弈(dynamic game): 按参与人行动的先后顺序划分,静态博弈:参与者同时决策,或非同时 决策但后决策者不知道先决策者的行动。动态博弈:参与者的行动有先后, 后决策者能观察到县决策者的行动,并据此选择行动。 3、完全信息博弈(games of complete information)和不完全信息博弈 ( games of incomplete information ): 完全信息指的是每一个参与人对所有其他参与人(对手)的特征、战略空 间及支付函数有准确的知识;否则,就是不完全信息
第二节完全信息静态博弈 、博弈的标准式( nomal form representation) 例:囚徒困境。囚徒面临的问题可用下图所示的双变量矩阵表来描 述 在此博弈中,每一囚徒 囚犯B 有两种战略可供选择:招认、 沉默招认 沉默)。 在一组特定的战略组合 囚犯A|-1,-1-9,0 招认[0,-9-6,-6 被选定后,两人的收益由矩 阵中相应单元的数据来表示。 博弈的标准表述包括:()博弈的参与者,(2)每一参与者可供选择的战 略集,(3)针对所有参与者可能选择的战略组合,每一个参与者获得的 收益。 可以用支付矩阵表述一个博弈
第二节 完全信息静态博弈 一、博弈的标准式(nomal form representation) 例:囚徒困境。囚徒面临的问题可用下图所示的双变量矩阵表来描 述。 -1,-1 -9,0 0,-9 -6,-6 囚犯B 囚犯A 沉默 招认 沉默 招认 在此博弈中,每一囚徒 有两种战略可供选择:招认、 沉默)。 在一组特定的战略组合 被选定后,两人的收益由矩 阵中相应单元的数据来表示。 博弈的标准表述包括:(1)博弈的参与者,(2)每一参与者可供选择的战 略集,(3)针对所有参与者可能选择的战略组合,每一个参与者获得的 收益。 可以用支付矩阵表述一个博弈
假定有n个参与者参加博弈,序号分别为1,2,,n,第i个参与者可以 选择的战略集合(的战略空间)为S,每个具体的战略s为S的元素。令 (s1,s2,…,sn为每个参与人选定一个战略的组成的战略组合,u表示在 该战略组合下参与人i的收益收益函数:u1(s,S2,…,sn),表述的标准 形式为 二、占优战略均衡( Dominant-stragety equilibrium) 一般来说,由于每个参与者的效用(支付)是博弈中所有参与人的战 咯的函数,因此每个参与者的最优战略选择依赖于所有其他参与人的战略 选择。但在—些特殊的博弈中,一个参与人的最优战略可能并不依赖于其 他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优 战略是唯一的,这样的最优战略被称为“占优战略”( dominant stragety)。 在博弈G=S…,Sn矶1…Ln中,假定s,s"为参与者的两个战略,如果 对于其他局中人的任一战略选择,战略s,的收益都大于于s",即 l4(S12…,S-1,s1,s+1:sn)>u(S1;…,S-1,s"1,S+1,Sn) 对其他局中人的战略空间S1…S=1,S5S中每一种可能的战略组合(S1…,S1 S,sn)均成立,则称s相对于s",是局中人i的严格占优战略
假定有n个参与者参加博弈,序号分别为1,2,…,n,第i个参与者可以 选择的战略集合(i的战略空间)为Si ,每个具体的战略si为Si 的元素。令 ( s1,s2,…,sn )为每个参与人选定一个战略的组成的战略组合,ui表示在 该战略组合下参与人i的收益收益函数:ui( s1,s2,…,sn ),表述的标准 形式为: G S Sn u un , , ; , , = 1 1 二、占优战略均衡(Dominant-stragety equilibrium) 一般来说,由于每个参与者的效用(支付)是博弈中所有参与人的战 略的函数,因此每个参与者的最优战略选择依赖于所有其他参与人的战略 选择。但在—些特殊的博弈中,一个参与人的最优战略可能并不依赖于其 他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优 战略是唯一的,这样的最优战略被称为“占优战略”(dominant stragety)。 )均成立,则称 相对于 是局中人 的严格占优战略。 对其他局中人的战略空间 中每一种可能的战略组合( ( ) ( ) 对于其他局中人的任一战略选择,战略 的收益都大于于 ,即 在博弈 中,假定 , 为参与者 的两个战略,如果 s s s s i S S S S s s u s s s s s u s s s s s s s G S S u u s s i i n i i i i n i i i i i n i i i i n i i n n i i , ' " , , , , , , , , , , ' , , , , , " , , ' " , , ; , , ' " 1 1 1 1 1 1 1 1 1 1 1 1 1 1 + − + − − + − + =