Memory-Augmented Monte Carlo Tree Search* SA18033015夏秋冬 Xiao C,Mei J,Muller M.Memory-augmented monte carlo tree search[C]//Thirty-Second AAAI Conference on Artificial Intelligence.2018
1 Memory-Augmented Monte Carlo Tree Search* SA18033015 夏秋冬 * Xiao C, Mei J, Müller M. Memory-augmented monte carlo tree search[C]//Thirty-Second AAAI Conference on Artificial Intelligence. 2018
ABSTRART 这篇论文提出了记忆增强的蒙特卡洛树搜索算法 (Memory-Augmented Monte Carlo Tree Search M-MCTS),为在线实时搜索提供了一个新的利用泛 化性的方法。 M-MTCS的核心思想是为MCTS增加了一个记忆结 构,该结构的每一个入口都含有一个特殊状态信息。 记忆结构结合相似状态的估计产生一个近似的值估计
ABSTRART 这篇论文提出了记忆增强的蒙特卡洛树搜索算法 (Memory-Augmented Monte Carlo Tree Search, M-MCTS),为在线实时搜索提供了一个新的利用泛 化性的方法。 M-MTCS 的核心思想是为 MCTS 增加了一个记忆结 构,该结构的每一个入口都含有一个特殊状态信息。 记忆结构结合相似状态的估计产生一个近似的值估计
ABSTRART 作者发现,基于记忆的值估计结果比温和条件下高 概率的普通蒙特卡洛算法估计结果更好。 作者在围棋游戏中评测了M-MCTS的性能。实验 结果表明,在相同模拟次数下,M-MCTS优于原 来的MCTS
ABSTRART • 作者发现,基于记忆的值估计结果比温和条件下高 概率的普通蒙特卡洛算法估计结果更好。 • 作者在围棋游戏中评测了 M-MCTS 的性能。实验 结果表明,在相同模拟次数下,M-MCTS 优于原 来的 MCTS
背景介绍 蒙特卡罗树搜索(Monte Carlo Tree Search) 蒙特卡罗树搜索是一种基于树数据结构、能权衡 探索与利用、在搜索空间巨大仍然比较有效的的 搜索算法 MCTS是一种找到逼近纳什均衡衡的搜索策略,一般 用于通用游戏的对弈问题中
背景介绍 蒙特卡罗树搜索(Monte Carlo Tree Search) • 蒙特卡罗树搜索是一种基于树数据结构、能权衡 探索与利用、在搜索空间巨大仍然比较有效的的 搜索算法 • MCTS是一种找到逼近纳什均衡的搜索策略,一般 用于通用游戏的对弈问题中
背景介绍 MCTS: ·选举selection)是根据当前获得所 BaCK-PF008B8T16 有子步骤的统计结果,选择一个 最优的子步骤。 Select tne pest action ang reture 扩展(expansion)在当前获得的统 计结果不足以计算出下一个步骤 时,随机选择一个子步骤。 模拟(simulation)模拟游戏,进入 下一步。 ingry.Stay Foolis 反向传播Back-Propagation)根据 游戏结束的结果,计算对应路径 上统计记录的值
背景介绍 MCTS: • 选举(selection)是根据当前获得所 有子步骤的统计结果,选择一个 最优的子步骤。 • 扩展(expansion)在当前获得的统 计结果不足以计算出下一个步骤 时,随机选择一个子步骤。 • 模拟(simulation)模拟游戏,进入 下一步。 • 反向传播(Back-Propagation)根据 游戏结束的结果,计算对应路径 上统计记录的值