设计一个学习系统 基本设计方法和学习途径 (以西洋跳棋为例 选择训练经验 选择目标函数 选择目标函数的表示 选择函数逼近算法 最终设计 2003.12.18 机器学习-引言作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-引言作者:Mitchell 译者:曾华军等讲者:陶晓鹏 6 设计一个学习系统 • 基本设计方法和学习途径 (以西洋跳棋为例) – 选择训练经验 – 选择目标函数 – 选择目标函数的表示 – 选择函数逼近算法 – 最终设计
设计一个学习系统 西洋跳棋学习问题 任务T,下西洋跳棋 性能标准P,击败对手的百分比 训练经验E,和自己进行训练对弈 学习系统需要选择 要学习的知识的确切类型 对于这个目标知识的表示 种学习机制 2003.12.18 机器学习-引言作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-引言作者:Mitchell 译者:曾华军等讲者:陶晓鹏 7 设计一个学习系统 • 西洋跳棋学习问题 – 任务T,下西洋跳棋 – 性能标准P,击败对手的百分比 – 训练经验E,和自己进行训练对弈 • 学习系统需要选择 – 要学习的知识的确切类型 – 对于这个目标知识的表示 – 一种学习机制
选择训练经验 第一个关键属性,训练经验能否为系统 的决策提供直接或间接的反馈 第二个重要属性,学习器在多大程度上 控制样例序列 第三个重要属性,训练样例的分布能多 好地表示实例分布,通过样例来衡量最 终系统的性能 2003.12.18 机器学习-引言作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-引言作者:Mitchell 译者:曾华军等讲者:陶晓鹏 8 选择训练经验 • 第一个关键属性,训练经验能否为系统 的决策提供直接或间接的反馈 • 第二个重要属性,学习器在多大程度上 控制样例序列 • 第三个重要属性,训练样例的分布能多 好地表示实例分布,通过样例来衡量最 终系统的性能
选择目标函数 目标函数 Choosemove ChooseMove:B→M,接受合法棋局集合中 的棋盘状态作为输入,并从合法走子集合中 选择某个走子作为输出 问题转化 我们把提高任务T的性能P的问题转化(或简 化)为学习像 ChooseMove这样某个特定的 目标函数 2003.12.18 机器学习-引言作者: Mitchel译者:曾华军等讲者:陶晓鹏
2003.12.18 机器学习-引言作者:Mitchell 译者:曾华军等讲者:陶晓鹏 9 选择目标函数 • 目标函数ChooseMove – ChooseMove: B→M,接受合法棋局集合中 的棋盘状态作为输入,并从合法走子集合中 选择某个走子作为输出 • 问题转化 – 我们把提高任务T的性能P的问题转化(或简 化)为学习像ChooseMove这样某个特定的 目标函数