当前位置：和泉文库 > 计算机 > 浏览文档

中国科学技术大学：《机器学习》课程PPT教学课件（讲稿）第二章模型评估与选择

 经验误差与过拟合  评估方法  性能度量  比较检验  偏差与方差  阅读材料

文件格式：PPTX，文件大小：2.49MB，售价：9.74元

共43页，可试读15页，点击往前阅读 ↑↑

文档详细内容（约43页）

大纲口经验误差与过拟合口评估方法口性能度量口比较检验口偏差与方口阅读材料

大纲  经验误差与过拟合  评估方法  性能度量  比较检验  偏差与方差  阅读材料

评估方法现实任务中往往会对学习器的泛化性能、时间开销、存储开销、可解释性等方面的因素进行评估并做出选择我们假设测试集是从样本真实分布中独立采样获得, 将测试集上的“测试误差”作为泛化误差的近似,所以测试集要和训练集中的样本尽量互斥

评估方法现实任务中往往会对学习器的泛化性能、时间开销、存储开销、可解释性等方面的因素进行评估并做出选择我们假设测试集是从样本真实分布中独立采样获得，将测试集上的“测试误差”作为泛化误差的近似，所以测试集要和训练集中的样本尽量互斥

评估方法通常将包含个m样本的数据集D={(x1,y),(x2,v),…,(xm,m)} 拆分成训练集S和测试集T: 口留出法: ●直接将数据集划分为两个互斥集合 ●训练/测试集划分要尽可能保持数据分布的一致性 ●一般若干次随机划分、重复实验取平均值 ●训练/测试样本比例通常为2:1~4:1

评估方法  留出法： ⚫ 直接将数据集划分为两个互斥集合 ⚫ 训练/测试集划分要尽可能保持数据分布的一致性 ⚫ 一般若干次随机划分、重复实验取平均值 ⚫ 训练/测试样本比例通常为2:1~4:1 通常将包含个样本的数据集拆分成训练集和测试集：

评估方法口交叉验证法: 将数据集分层采样划分为k个大小相似的互斥子集,每次用k-1个子集的并集作为训练集,余下的子集作为测试集,最终返回k个测试结果的均值,k最常用的取值是10 L DiDaDa. D D- Ds DoDid 训练集测试集 D1D2D3DDDD-DD][Da→测试结果1 D,D,D, DA DS Do D,DD[D]一测试结果2平均返回结果 DaD, D: Ds Da Ds D Did[一测试结果10 10折交叉验证示意图

评估方法  交叉验证法：将数据集分层采样划分为k个大小相似的互斥子集，每次用k-1个子集的并集作为训练集，余下的子集作为测试集，最终返回k个测试结果的均值，k最常用的取值是10

评估方法与留出法类似,将数据集D划分为k个子集同样存在多种划分方式, 为了減小因样本划分不同而引入的差别,k折交叉验证通常随机使用值,例如常宽的“10次10折交叉验证”次k折交叉验证结果的均不同的划分重复p次,最终的评估结果是假设数据集D包含m个样本,若k=m,则得到留一法: ●不受随机样本划分方式的影响 ●结果往往比较准确 ●当数据集比较大时,计算开销难以忍受

评估方法与留出法类似，将数据集D划分为k个子集同样存在多种划分方式，为了减小因样本划分不同而引入的差别，k折交叉验证通常随机使用不同的划分重复p次，最终的评估结果是这p次k折交叉验证结果的均值，例如常见的“10次10折交叉验证” 假设数据集D包含m个样本，若令，则得到留一法： ⚫ 不受随机样本划分方式的影响 ⚫ 结果往往比较准确 ⚫ 当数据集比较大时，计算开销难以忍受

点击进入文档下载页（PPTX格式）

共43页，可试读15页，点击继续阅读 ↓↓

您可能感兴趣的文档

山东大学：《面向对象程序设计》课程教学资源（PPT课件讲稿）第四章编写对象接口
《网站设计与建设 Website design and developments》课程教学资源（PPT课件讲稿）第三部分网站设计技术第10章 HTML基础
清华大学：《计算机导论》课程电子教案（PPT教学课件）第8章计算机领域的典型问题
《单片机应用技术》课程PPT教学课件（C语言版）第7章定时器/计数器
面向对象编程 Object-Oriented Programming（PPT课件讲稿）继承 Inheritance
《C语言程序设计》课程教学资源（PPT课件）第6章数据类型和表达式
Scanning Electron Microscopy（SEM）
《The C++ Programming Language》课程教学资源（PPT课件讲稿）Lecture 03 Standard Template Library & Generic Programming
计算机问题求解（PPT讲稿）图的计算机表示以及遍历
系统软件与软件安全（PPT讲稿）构造安全、高效的系统软件
中国科学技术大学：《计算机体系结构》课程教学资源（PPT课件讲稿）第3章流水线技术
合肥学院：《数据库原理与应用》课程教学资源（PPT课件）第4章数据库的创建与管理
《C语言程序设计》课程电子教案（PPT课件）第三章控制语句
安徽理工大学：《计算机网络》课程PPT教学课件（第4版）第1章概述（编著：谢希仁）
中国人民大学：《数据库系统概论 An Introduction to Database System》课程教学资源（PPT课件讲稿）第九章关系查询处理和查询优化
《人工智能技术导论》课程教学资源（PPT课件讲稿）第8章不确定性知识的表示与推理
福建工程学院：《C#程序设计》课程教学资源（实验指导书）
《计算机网络技术》课程教学资源（PPT课件讲稿）Chapter 03 物理层
沈阳理工大学：《网站建设与维护》课程教学资源（PPT课件讲稿）第四章动态网页基础
东南大学：《操作系统概念 Operating System Concepts》课程教学资源（PPT课件讲稿）13 文件系统 I/O Systems
《C语言程序设计》课程教学资源（PPT课件讲稿）第6章函数
《高级语言程序设计》课程教学资源（试卷习题）试题一（无答案）
中国科学技术大学：《密码学导论》课程教学资源（PPT课件讲稿）第4章数论基础（主讲：李卫海）
香港科技大学：Cross-Selling with Collaborative Filtering（PPT讲稿）

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录