博弈论简介 2、囚徒困境的启示(续) ·(C,C)这个状态是不稳定的,任何人都能 通过单方面改变自己的策略增加自己的 收益。因此,每个人都有意愿离开这个 状态,即改变自己的策略为D。 。囚徒困境反映了个人理性与集体利益的 矛盾
博弈论简介 2、囚徒困境的启示(续) (C, C)这个状态是不稳定的,任何人都能 通过单方面改变自己的策略增加自己的 收益。因此,每个人都有意愿离开这个 状态,即改变自己的策略为D。 囚徒困境反映了个人理性与集体利益的 矛盾
3、纳什均衡 假设有n个玩家(agent,player)参与 博弈,给定其他人策略的条件下,每个玩 家选择自己的最优策略(个人最优策略可 能依赖于也可能不依赖于他人的策略), 从而使自己效用最大化。所有局中人策略 构成一个策略组合(Strategy Profile)。 各个参与人的在某个时间点的策略的 有序集称为策略组合,比如囚徒困境中的 (D,D),(C,C),(C,D)都是策略组合
3、纳什均衡 假设有n个玩家(agent, player)参与 博弈,给定其他人策略的条件下,每个玩 家选择自己的最优策略(个人最优策略可 能依赖于也可能不依赖于他人的策略), 从而使自己效用最大化。所有局中人策略 构成一个策略组合(Strategy Profile)。 各个参与人的在某个时间点的策略的 有序集称为策略组合,比如囚徒困境中的 (D, D), (C, C), (C, D)都是策略组合
3、纳什均衡 纳什均衡指的是这样一种策略组合,即在给 定别人策略的情况下,没有人愿意单方面改变自 己的策略,从而打破这种均衡
3、纳什均衡 纳什均衡指的是这样一种策略组合,即在给 定别人策略的情况下,没有人愿意单方面改变自 己的策略,从而打破这种均衡