当前位置：和泉文库 > 计算机 > 浏览文档

《机器学习》课程配套教学电子教案（PPT课件讲稿）第3章决策树学习

文件格式：PPT，文件大小：109KB，售价：9.77元

文档详细内容（约38页）

基本的决策树学习算法大多数决策树学习算法是一种核心算法的变体采用自顶向下的贪婪搜索遍历可能的决策树空间 ID3是这种算法的代表 2003.11.18 机器学习-决策树学习译者:曾华军等作者: Mitchell讲者:陶晓鹏

2003.11.18 机器学习-决策树学习译者：曾华军等作者：Mitchell 讲者：陶晓鹏 6 基本的决策树学习算法 • 大多数决策树学习算法是一种核心算法的变体 • 采用自顶向下的贪婪搜索遍历可能的决策树空间 • ID3是这种算法的代表

基本的决策树学习算法(2) ID3的思想自顶向下构造决策树从“哪一个属性将在树的根节点被测试”开始使用统计测试来确定每一个实例属性单独分类训练样例的能力 D3的过程分类能力最好的属性被选作树的根节点根节点的每个可能值产生一个分支训练样例排列到适当的分支重复上面的过程 2003.11.18 机器学习-决策树学习译者:曾华军等作者: Mitchell讲者:陶晓鹏

2003.11.18 机器学习-决策树学习译者：曾华军等作者：Mitchell 讲者：陶晓鹏 7 基本的决策树学习算法（2） • ID3的思想 – 自顶向下构造决策树 – 从“哪一个属性将在树的根节点被测试”开始 – 使用统计测试来确定每一个实例属性单独分类训练样例的能力 • ID3的过程 – 分类能力最好的属性被选作树的根节点 – 根节点的每个可能值产生一个分支 – 训练样例排列到适当的分支 – 重复上面的过程

表3-1用于学习布尔函数的D3算法概要 D3(Examples, Target attribute, Attributes) 创建树的root节点如果 Examples都为正,返回abe+的单节点树root 如果 Examples都为反,返回habe-的单节点树root 如果 Attributes为空,那么返回单节点roo, labehExamples中最普遍的 Target attribute值否则开始 A←- Attributes中分类 examples能力最好的属性 root的决策属性←A 对于A的每个可能值ⅵ 在root下加一个新的分支对应测试A=vi 令 Examples为 Examples中满足A属性值为v的子集如果 Examples为空在这个新分支下加一个叶子节点,节点的 label=Examples中最普遍的 bute值否则在新分支下加一个子树ID3( Examples, Target attribute, Attributes-{A}) 结束返回root 2003.11.18 机器学习-决策树学习译者:曾华军等作者: Mitchell讲者:陶晓鹏

2003.11.18 机器学习-决策树学习译者：曾华军等作者：Mitchell 讲者：陶晓鹏 8 表3-1 用于学习布尔函数的ID3算法概要 • ID3(Examples, Target_attribute, Attributes) • 创建树的root节点 • 如果Examples都为正,返回label=+的单节点树root • 如果Examples都为反,返回label=-的单节点树root • 如果Attributes为空，那么返回单节点root，label=Examples中最普遍的Target_attribute值 • 否则开始 – AAttributes中分类examples能力最好的属性 – root的决策属性A – 对于A的每个可能值vi • 在root下加一个新的分支对应测试A=vi • 令Examplesvi为Examples中满足A属性值为vi的子集 • 如果Examplesvi为空 – 在这个新分支下加一个叶子节点，节点的label=Examples中最普遍的 Target_attribute值 – 否则在新分支下加一个子树ID3（Examplesvi,Target_attribute,Attributes-{A}） • 结束 • 返回root

最佳分类属性信息增益用来衡量给定的属性区分训练样例的能力 ID3算法在增长树的每一步使用信息増益从候选属性中选择属性用熵度量样例的均一性熵刻画了任意样例集的纯度给定包含关于某个目标概念的正反样例的样例集S,那么S相对这个布尔型分类的熵为 Entropy (s=-p+log2p+-p-log p 信息论中对熵的一种解释,熵确定了要编码集合S中任意成员的分类所需要的最少二进制位数更一般地,如果目标属性具有c个不同的值,那么S相对于c个状态的分类的熵定义为 Entropy(S)∑-pkgP 2003.11.18 机器学习-决策树学习译者:曾华军等作者: Mitchell讲者:陶晓鹏

2003.11.18 机器学习-决策树学习译者：曾华军等作者：Mitchell 讲者：陶晓鹏 9 最佳分类属性 • 信息增益 – 用来衡量给定的属性区分训练样例的能力 – ID3算法在增长树的每一步使用信息增益从候选属性中选择属性 • 用熵度量样例的均一性 – 熵刻画了任意样例集的纯度 – 给定包含关于某个目标概念的正反样例的样例集S，那么S相对这个布尔型分类的熵为 Entropy(S)=-p+log2p+ - p-log2p- – 信息论中对熵的一种解释，熵确定了要编码集合S中任意成员的分类所需要的最少二进制位数 – 更一般地，如果目标属性具有c个不同的值，那么S相对于c个状态的分类的熵定义为 Entropy(S)= = − c i pi pi 1 2 log

最佳分类属性(2) 用信息增益度量期望的熵降低属性的信息增益,由于使用这个属性分割样例而导致的期望熵降低 Gain(S, A)=Entropys) Entropys) Gain(S,A)是在知道属性A的值后可以节省的二进制位数例子 2003.11.18 机器学习-决策树学习译者:曾华军等作者: Mitchell讲者:陶晓鹏

2003.11.18 机器学习-决策树学习译者：曾华军等作者：Mitchell 讲者：陶晓鹏 10 最佳分类属性（2） • 用信息增益度量期望的熵降低 – 属性的信息增益，由于使用这个属性分割样例而导致的期望熵降低 – Gain(S,A)是在知道属性A的值后可以节省的二进制位数 – 例子   = − ( ) ( ) | | ( , ) ( ) v Values A v v Entropy S S S Gain S A Entropy S

点击进入文档下载页（PPT格式）

共38页，可试读13页，点击继续阅读 ↓↓

您可能感兴趣的文档

《机器学习》课程配套教学电子教案（PPT课件讲稿）第4章人工神经网络（ANN）
西部网络技术培训课程_计算机网络基本知识
西部网络技术培训课程_Multicasting-组播
西部网络技术培训课程_TCP/IP及组网技术（局域网和广域网技术）
西部网络技术培训课程_TCP/IP及组网技术（局域网和广域网技术）
西部网络技术培训课程_TCP/IP及组网技术（局域网和广域网技术）
西部网络技术培训课程_TCP/IP及组网技术（局域网和广域网技术）
成都理工大学：《单片微机原理及应用》课程教学资源（PPT课件）第八讲几种有特色的单片机
成都理工大学：《单片微机原理及应用》课程教学资源（PPT课件）第七讲单片机应用系统设计
成都理工大学：《单片微机原理及应用》课程教学资源（PPT课件）第六讲 C-51程序设计
成都理工大学：《单片微机原理及应用》课程教学资源（PPT课件）第五讲接口与系统扩展（2/2）
成都理工大学：《单片微机原理及应用》课程教学资源（PPT课件）第四讲接口与系统扩展（1/2）
《机器学习》课程配套教学电子教案（PPT课件讲稿）第11章分析学习
《机器学习》课程配套教学电子教案（PPT课件讲稿）第8章基于实例的学习
《机器学习》课程配套教学电子教案（PPT课件讲稿）第13章增强学习
《机器学习》课程配套教学电子教案（PPT课件讲稿）第10章学习规则集合
《机器学习》课程配套教学电子教案（PPT课件讲稿）第1章引言（讲者：陶晓鹏）
《机器学习》课程配套教学电子教案（PPT课件讲稿）第12章归纳和分析学习的结合
《机器学习》课程配套教学电子教案（PPT课件讲稿）第2章概念学习和一般到特殊序
《机器学习》课程配套教学电子教案（PPT课件讲稿）第7章计算学习理论
《机器学习》课程配套教学电子教案（PPT课件讲稿）第5章评估假设
《机器学习》课程配套教学电子教案（PPT课件讲稿）第6章贝叶斯学习
《机器学习》课程配套教学电子教案（PPT课件讲稿）第9章遗传算法
北京大学计算机研究所：《数字图像处理》课程教学资源（PDF课件）第一章数字图像基础（基础概念）

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录