当前位置：和泉文库 > 计算机 > 浏览文档

《机器学习》课程教学资源：《机器学习》参考书籍PDF电子版（清华大学出版社，著：周志华）

机器学习是计算机科学的重要分支领域，本书作为该领域的入门教材，在内容上尽可能涵盖机器学习基础知识的各方面.全书共16章，大致分为3个部分：第1部分（第1~3章）介绍机器学习的基础知识：第2部分（第4~10章）讨论一些经典而常用的机器学习方法（决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习)：第3部分（第11~16章）为进阶知识，内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等每章都附有习题并介绍了相关阅读材料，以便有兴趣的读者进一步钻研探索。

文件格式：PDF，文件大小：37.53MB，售价：50.12元

共434页，可试读40页，点击往前阅读 ↑↑

文档详细内容（约434页）

2.4比较检验 1.0 05 FNR 代价曲线期望总体代价正例概率代价 1.0 图2.5代价曲线与期望总体代价 2.4比较检验有了实验评估方法和性能度量，看起来就能对学习器的性能进行评估比较了：先使用某种实验评估方法测得学习器的某个性能度量结果，然后对这些结果进行比较.但怎么来做这个“比较”呢？是直接取得性能度量的值然后“比大小”吗？实际上，机器学习中性能比较这件事要比大家想象的复杂得多.这里面涉及几个重要因素：首先，我们希塑比较的是泛化性能，然而通过实验评估方法我们获得的是测试集上的性能，两者的对比结果可能未必相同；第二，测试集上的性能与测试集本身的选择有很大关系，且不论使用不同大小的测试集会得到不同的结果，即便用相同大小的测试集，若包含的测试样例不同，测试结果也会有不同；第三，很多机器学习算法本身有一定的随机性，即便用相同的参数设置在同一个测试集上多次运行，其结果也会有不同.那么，有没有适当的方法对学习器的性能进行比较呢？统计假设检验(hypothesis test)为我们进行学习器性能比较提供了重要依据.基于假设检验结果我们可推断出，若在测试集上观察到学习器A比B好则A的泛化性能是否在统计意义上优于B,以及这个结论的把握有多大.下面更多关于假设检验的介绍可参见NeIIck,2010. 我们先介绍两种最基本的假设检验，然后介绍几种常用的机器学习性能比较方法.为便于讨论，本节默认以错误率为性能度量，用€表示. 2.4.1假设检验假设检验中的“假设”是对学习器泛化错误率分布的某种判断或猜想，例如“=0”，现实任务中我们并不知道学习器的泛化错误率，只能获知其测试错误率.泛化错误率与测试错误率未必相同，但直观上，二者接近的可能性应比

第2章模型评估与选择 [t-a2,t/2l内，则不能拒绝假设“μ=o”,即可认为泛化错误率为co,置信度为 1一a;否则可拒绝该假设，即在该显著度下可认为泛化错误率与0有显著不同.α常用取值有0.05和0.1.表2.3给出了一些常用临界值。表2.3双边t检验的常用临界值 k 2 5102030 上面介绍的两种方法都是对关于单个学习器泛化性能的假设进行检验，而在现实任务中，更多时候我们需对不同学习器的性能进行比较，下面将介绍适用于此类情况的假设检验方法。 2.4.2交叉验证t检验对两个学习器A和B,若我们使用k折交叉验证法得到的测试错误率分别为，兮，，和导，喝，，呢，其中e和e孕是在相同的第i折训练/测试集上得到的结果，则可用k折交叉验证“成对t检验”(paired t-tests)来进行比较检验.这里的基本思想是若两个学习器的性能相同，则它们使用相同的训练/测试集得到的测试错误率应相同，即c= 具体来说，对k折交叉验证产生的k对测试错误率：先对每对结果求差 △：=4-甲；若两个学习器性能相同，则差值均值应为零.因此，可根据差值 △1，△2，，△k来对“学习器A与B性能相同”这个假设做t检验，计算出差值的均值4和方差g2,在显著度α下，若变量 T= V (2.31) 小于临界值。/2，k-1,则假设不能被拒绝，即认为两个学习器的性能没有显著差别；否则可认为两个学习器的性能有显著差别，且平均错误率较小的那个学习器性能较优.这里t。/2,k-1是自由度为k-1的t分布上尾部累积分布为a/2 的临界值欲进行有效的假设检验，一个重要前提是测试错误率均为泛化错误率的独立采样.然而，通常情况下由于样本有限，在使用交叉验证等实验估计方法时不同轮次的训练集会有一定程度的重叠，这就使得测试错误率实际上并不独立会导致过高估计假设成立的概率.为缓解这一问题，可采用“5×2交叉验证

点击进入文档下载页（PDF格式）

共434页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录