第十二章二人有限非零和(双矩阵)对策 双矩阵对策及其特性 设二人有限非零和对策问题的局中人为和∏,策略 集分别为S1={a1,a2,…,Cn},S2={B,B2…,B A=la,]和B=[bLm分别为和∏的支付矩阵,其中 b分别为I和相应于c和B的赢得。双矩阵对策 记为G=(S1,S2,(A,B) I的混合策略集S={X=(x1 )|∑x=1,x≥0} ∏的混合策略集S2={=(y1…yn)∑y=1,y≥0}
一、双矩阵对策及其特性 1 1 2 2 1 2 1 2 { , }, { , } [ ] [ ] ( , ,( )) m n ij m n ij m n ij ij i j S S A a B b a b G S S A B 设二人有限非零和对策问题的局中人为 和 ,策略 集分别为 , , , , , = 和 = 分别为 和 的支付矩阵,其中 , 分别为 和 相应于 和 的赢得。双矩阵对策 记为 , 。 * 1 1 1 * 2 1 1 { ( ) | 1, 0} { ( ) | 1, 0} m m i i i n n i i i S X x x x x S Y y y y y 混合策略集 混合策略集 的 的
在矩阵对策中,由于I的得就是∏的失,二人 处于完全竞争的非合作状态。而在双矩阵对策中, 由于I的得并不一定等于∏的失,二人可以同时得, 故二人之间可能合作,从而得到更多的利益 A+B=0时,双矩阵对策即化为矩阵对策
A B 0时,双矩阵对策即化为矩阵对策。 在矩阵对策中,由于 的得就是 的失,二人 处于完全竞争的非合作状态。而在双矩阵对策中, 由于 的得并不一定等于 的失,二人可以同时得, 故二人之间可能合作,从而得到更多的利益
、非合作双矩阵对策 解的概念与存在性定理 平衡局势: 设X∈S,Y∈S2,若对任何X∈S和任何Y∈S2 有XAy≤X"AY X BYX BY 则称(X,y)为双矩阵对策G的平衡局势 平衡局势(X,Y)对应的二局中人的期望收益 (X"AY,X"By)就是G的值,记为U’,V”)
1.解的概念与存在性定理 平衡局势: * * * * * * 1 2 1 2 * * * * * * * * , , ( , ) T T T T X S Y S X S Y S X AY X AY X BY X BY X Y G 设 若对任何 和任何 , 有 则称 为双矩阵对策 的平衡局势。 * * * * * * * * , ( , ) ( , ) T T X Y X AY X BY G U V 平衡局势( )对应的二局中人的期望收益 就是 的值,记为
定理1:任何双矩阵对策至少存在一个平衡局势。 定理2:(X,Y)为双矩阵对策G的一个平衡局势的 充要条件是存在数p和q使[Xyp'q" 是下述问题的一个解: max (X AY+X BY-p-q AY≤pE XB≤aE EX=EY=1 XY≥0 其中E,E为分量为1的向量
* * * * * * * * , [ ] max . . 1 , 0 , 1 T T T n T m T T m n m n X Y G p q X Y p q X AY X BY p q AY pE X B qE s t E X E Y X Y E E ( )为双矩阵对策 的一个平衡局势的 充要条件是存在数 和 使 是下述问题的一个解: ( ) 其中 为分量为 的向量。 定理2:
2.2×2双矩阵对策的解法 当A和B均为2×2阶时,A41a12,B=b21b2 相应的双矩阵对策可表示为 y 1101 (0≤x1≤1,0≤y≤1 1-x(a21b1)(a2,b2 若(X,γ)是均衡局势,由平衡局势的定义,X和Y应 分别是XAy在S1上和X”BY在S2上的极大点
当A和B均为2×2阶时, 相应的双矩阵对策可表示为: 11 11 12 12 21 21 22 22 ( , ) ( , ) ( , ) ( , ) a b a b a b a b 1 y 1 1 y 1 1 x 1 x I II 1 1 (0 x 1,0 y 1) * * * * * * * * 1 2 ( , ) T T X Y X Y X AY S X BY S 若 是均衡局势,由平衡局势的定义, 和 应 分别是 在 上和 在 上的极大点。 11 12 11 12 21 22 21 22 , , a a b b A B a a b b