博弈论与策略行为(3):支配策略 由于游戏参与者试图实现自身利益最大化并具有机智而理性的决策能力,加 上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结 果。从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2 1分别对1,0)。同样,对于B来说,选择策略“左”得到的利益总是优于 ‘右”(1,2分别对o,1)。因此,我们可以确定预期均衡选择策略是A选 择“下”而B选择“左”的策略。 这一博弈中每个参与者都存在一个支配策略( Dominant Strategy,又称占 优或超优策略)。不管其它参与者如何选择,每个局中人自有的那个最优选择 称作支配策略,由此实现的均衡是支配均衡(又称占优或超优均衡) 厂商B 左 右 上 1,2 0,1 厂商A 2,1 1,0
博弈论与策略行为(3):支配策略 • 由于游戏参与者试图实现自身利益最大化并具有机智而理性的决策能力,加 上信息方面的假定,所以上述支付矩阵表示的博弈具有一个简单而确定的结 果。从厂商A角度来说,它采取策略“下”而得到的支付总是好于“上”(2, 1分别对1,0)。同样,对于B来说,选择策略“左”得到的利益总是优于 “右”(1,2分别对0,1)。因此,我们可以确定预期均衡选择策略是A选 择“下”而B选择“左”的策略。 • 这一博弈中每个参与者都存在一个支配策略(Dominant Strategy,又称占 优或超优策略)。不管其它参与者如何选择,每个局中人自有的那个最优选择 称作支配策略,由此实现的均衡是支配均衡(又称占优或超优均衡)。 1,2 2,1 1,0 0,1 左 上 右 下 厂商B 厂商A
博弈论与策略行为(4):囚徒的困境 下面支付矩阵表示著名的“囚徒的困境( Prisoners, dilemma)游戏。从博弈 论角度看,这是一个存在支配均衡的博弈:因为对囚犯A,B来说,无论对方如 何选择,“坦白”都是各自的最优选择 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而 由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了它们达到更 好的互利选择,它们面临“囚徒的困境”。我们将看到,寡头垄断厂商经常面 临类似的困境。 囚犯B 坦白 保持沉默 坦白 A坐3年牢 A坐3个月牢 B坐3年牢 B坐10年牢 囚犯A 保持 A坐10年牢 A坐1年牢 沉默 B坐3个月牢 B坐1年牢
博弈论与策略行为(4):囚徒的困境 • 下面支付矩阵表示著名的“囚徒的困境(Prisoners’ Dilemma)”游戏。从博弈 论角度看,这是一个存在支配均衡的博弈:因为对囚犯A,B来说,无论对方如 何选择,“坦白”都是各自的最优选择。 • 虽然从两名囚犯共同利益看,最好的选择是合作,即同时选择保持沉默,然而, 由于猜忌,试图获得更大好处(3个月刑期)等竞争性动机阻碍了它们达到更 好的互利选择,它们面临“囚徒的困境”。我们将看到,寡头垄断厂商经常面 临类似的困境。 A坐3年牢 B坐3年牢 A坐1年牢 B坐1年牢 A坐10年牢 B坐3个月牢 A坐3个月牢 B坐10年牢 坦白 坦白 保持沉默 保持 沉默 囚犯B 囚犯A
博弈论与策略行为(5):纳什均衡 ·支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵表 示的博弈中,厂商A,B在选择做广告问题上存在的策略关系。其中厂商A没有 支配策略。因为A的最佳决策取决于B的选择。例如,当B选择做广告时,A应 当选择做广告,由此得到10而不是6的支付得益;然而,当B选择不做广告时, A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需要 同时决策,A应当如何决策? 解答这一问题,A需要把自己放在B的位置,从B的角度看什么是最好的选择 并在此基础上考虑自己的选择。支付矩阵表明B有一个支配策略:不论A选择 如何,B选择做广告时利益较大(5,8对0,2),因而A可以判断B会选择做 广告。而在B做广告时,A应当选择做广告。因而,均衡结局是双方都做广告。 商B 做广告 不做广 做广告 10,5 15,0 厂商A 不做广告 6,8 20,2
博弈论与策略行为(5):纳什均衡 • 支配均衡是一个特例,并非每个博弈都存在支配均衡。下面修改的支付矩阵表 示的博弈中,厂商A,B在选择做广告问题上存在的策略关系。其中厂商A没有 支配策略。因为A的最佳决策取决于B的选择。例如,当B选择做广告时,A应 当选择做广告,由此得到10而不是6的支付得益;然而,当B选择不做广告时, A应当选择不做广告,从而得到20而不是15的支付得益。假定两个厂商需要 同时决策,A应当如何决策? • 解答这一问题,A需要把自己放在B的位置,从B的角度看什么是最好的选择, 并在此基础上考虑自己的选择。支付矩阵表明B有一个支配策略:不论A选择 如何,B选择做广告时利益较大(5,8对0,2),因而A可以判断B会选择做 广告。而在B做广告时,A应当选择做广告。因而,均衡结局是双方都做广告。 10,5 6,8 20,2 15,0 做广告 不做广告 厂商B 厂商A 做广告 不做广告
博弈论与策略行为(6):纳什均衡 上述均衡结果被称作纳什均衡( The nash Equilibriun)。纳什均衡 指组给定对手行为前提下个对各博弈方存在的最佳选择;在纳什 均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不 可能单方面通过变换策略来提高他的所获支付。美国数学家和统计 学家纳什(Nash)50年代提出这-概念,所以称作纳什均衡。 在上面广告策略关系事例中,给定厂商B做广告的策略,A所能做 的一个最好选择是做广告;而当A做广告时,B的选择仍是它能做 的最好的。因而,纳什均衡条件得到满足。 它与支配策略均衡的区别在于:在纳什均衡下,“我(你)所做的 是绘定你(我)的选择我(你)所能做的最好的”,而支配均衡下, 我(你)所做的是不讼你(我)的选择我(你)所能做的更好 的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配均衡
博弈论与策略行为(6):纳什均衡 • 上述均衡结果被称作纳什均衡(The Nash Equilibrium)。纳什均衡 指一组给定对手行为前提下个对各博弈方存在的最佳选择;在纳什 均衡状态下,只要其它参与者不变换策略选择,任何单个参与者不 可能单方面通过变换策略来提高他的所获支付。美国数学家和统计 学家纳什(Nash)50年代提出这一概念,所以称作纳什均衡。 • 在上面广告策略关系事例中,给定厂商B做广告的策略,A所能做 的一个最好选择是做广告;而当A做广告时,B的选择仍是它能做 的最好的。因而,纳什均衡条件得到满足。 • 它与支配策略均衡的区别在于:在纳什均衡下,“我(你)所做的 是给定你(我)的选择我(你)所能做的最好的”,而支配均衡下, “我(你)所做的是不论你(我)的选择我(你)所能做的更好 的”。支配均衡必然是纳什均衡,但纳什均衡未必是支配均衡
博弈论与策略行为(7):纳什均衡 ·一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策略),有时又 可能不存在纳什均衡。下面左表存在两个纳什均衡:其中“上,左″是纳什均 衡(A选上,则B选左;且B选左时A仍应选上);“下,右”也是纳什均衡 (A选下,则B选右;且B选右时A仍应选下)。如没有更多信息,则无法判断 均衡在什么位置。右表没有纳什均衡。如A选“上″,B则选“左”;然而当B 选“左”时,A却应当选“下”。反之,A选“下”时,B应选“右”;然而当 B选右时,A又应选“上”。没有均衡点 局中人B 局中人B 左 右 左 右 上2,1 0,0 上0,0 局中人A 局中人A 下0,0 1,3 (左) (右)
博弈论与策略行为(7):纳什均衡 • 一个博弈可能有好几个纳什均衡(即几组稳定并且自我坚持的策略),有时又 可能不存在纳什均衡。下面左表存在两个纳什均衡:其中“上,左”是纳什均 衡(A选上,则B选左;且B选左时A仍应选上);“下,右”也是纳什均衡 (A选下,则B选右;且B选右时A仍应选下)。如没有更多信息,则无法判断 均衡在什么位置。右表没有纳什均衡。如A选“上”,B则选“左”;然而当B 选“左”时,A却应当选“下”。反之,A选“下”时,B应选“右”;然而当 B选右时,A又应选“上”。没有均衡点。 2,1 0,0 1,2 0,0 左 上 右 下 局中人B 局中人A 0,0 1,0 -1,3 0,-1 左 上 右 下 局中人B 局中人A (左) (右)