当前位置：和泉文库 > 计算机 > 浏览文档

《机器学习》Overfitting（过适合）

Reduced-Error Pruning Split data into training and validation set Do until further pruning is harmful: 1. Evaluate impact on validation set of pruning each possible node (plus those below it) 2. Greedily remove the one that most improves validation set accuracy produces smallest version of most accurate subtree · What if data is limited?

文件格式：PPT，文件大小：253KB，售价：5.61元

文档详细内容（约19页）

3) Overfitting(过适合) Effect of Reduced-Error Pruning 0.9 0.85 0.8 0.75 0.7 0.6 On training data On test data On test data(during pruning)---- 0102030405060708090100 Size of tree(number of nodes)

3) Overfitting(过适合)

4.其他属性选择标准: the gain criterion tends to favor attributes with many values a be an attribute with values al. a2.. av a be an attribute formed from a by splitting one of the values into two gain(a)>=gain(a) “信息增益比” gain(A)/IV(a) Iv(A)=-∑ n log2 pi+ ni Pit ni i=l p+n p+n

4. 其他属性选择标准： the gain criterion tends to favor attributes with many values. A be an attribute with values A1, A2, ... Av A' be an attribute formed from A by splitting one of the values into two. gain(A') >= gain(A) “信息增益比

表21 例子号高度头发眼睛类别淡黄矮高高高矮高高矮淡黄兰兰兰褐十+ 2345678 红镇黑黑黑淡黄兰褐褐 [头发=淡黄∨红色][眼睛=蓝色]→ [头发=黑色][眼睛=褐色→

表2.1 例子号高度头发眼睛类别 1 矮淡黄兰 + 2 高淡黄兰 + 3 高红兰 + 4 高淡黄褐 – 5 矮黑兰 – 6 高黑兰 – 7 高黑褐 – 8 矮淡黄褐 – [头发=淡黄∨红色][眼睛=蓝色] → + [头发=黑色] ∨[眼睛=褐色] → –

第三章规则学习算法 1.基本概念: 定义1(例子).设E=D1XD2×…×Dn是n维有穷向量空间, 其中D是有穷离散符号集。E中的元素e=(V1,V2…,Vn)简记为<V>叫做例子。其中j∈D 例如:对表2.1 D1={高,矮};D2={淡黄,红,黑};D3={兰,褐} E=D1×D,×D 例子e=(矮,淡黄,兰) 定义2。选择子是形为x=A的关系语句,其中x为第j个属性, A≤D;公式(或项)是选择子的合取式,即⌒[x=Aj, 其中J∈{1,…,n};规则是公式的析取式,即L其中Li为公式

第三章规则学习算法 1. 基本概念：定义1 （例子）. 设E=D1×D2 ×… ×Dn 是n维有穷向量空间，其中 Dj是有穷离散符号集。E中的元素e=(V1 ,V2 , …,Vn)简记为<Vj>叫做例子。其中Vj∈Dj。例如：对表2.1 D1={高，矮}；D2={淡黄，红，黑}；D3={兰，褐} E=D1 × D2 × D3 例子 e=(矮，淡黄，兰）定义2。选择子是形为[xj=Aj ]的关系语句，其中xj为第j个属性， Aj  Dj; 公式（或项）是选择子的合取式，即 [xj=Aj], 其中 J  {1, …,n}; 规则是公式的析取式，即，其中Li为公式。  jJ Li l i=1 

点击进入文档下载页（PPT格式）

共19页，可试读7页，点击继续阅读 ↓↓

您可能感兴趣的文档

《机器学习》第四章示例学习的实用化
《机器学习》怎样使用不完全学习概念
《机器学习》第三章概念学习和一般到特殊序
《机器学习》第三章概念学习和一般到特殊序
《机器学习》扩张矩阵算法
《机器学习》Star生成：Induce方法
《机器学习》第三章规则学习算法
《机器学习》（英文版）Choose initial “seed” events from
《机器学习》第一章关于机器学习的一般论题
《机器学习》（英文版）Given：E-a set of data events k-the number of clusters
《机器学习》（英文版）Table 1. The explanation-based generalization problem Given
《机器学习》（英文版）Table 1. The explanation-based generalization problem Given
《机器学习》（英文版）ExampleⅤ ersion Space
《机器学习》第三章规则学习算法
《机器学习》第三章规则学习算法
《机器学习》扩张矩阵算法
《机器学习》遗传选择
南通农业职业技术学院精品课程：《AutoCAD 2002中文版应用教程》第1章概述（汪立军）
南通农业职业技术学院精品课程：《AutoCAD 2002中文版应用教程》第10章尺寸标注（汪立军）
南通农业职业技术学院精品课程：《AutoCAD 2002中文版应用教程》第11章三维绘图（汪立军）
南通农业职业技术学院精品课程：《AutoCAD 2002中文版应用教程》第12章图形输出（汪立军）
南通农业职业技术学院精品课程：《AutoCAD 2002中文版应用教程》第13章专业绘图技巧（汪立军）
南通农业职业技术学院精品课程：《AutoCAD 2002中文版应用教程》第2章绘图基础（汪立军）
南通农业职业技术学院精品课程：《AutoCAD 2002中文版应用教程》第3章绘图设置（汪立军）

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录