当前位置：和泉文库 > 计算机 > 《机器学习》课程教学资源：《统计学习方法》参考书籍PDF电子版（清华大学出版社，第2版，共22章，作者：李航）

《机器学习》课程教学资源：《统计学习方法》参考书籍PDF电子版（清华大学出版社，第2版，共22章，作者：李航）

统计学习方法即机器学习方法，是计算机及其应用领域的一门重要学科。本书分为监督学习和无监督学习两篇，全面系统地介绍了统计学习的主要方法。包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场，以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔可夫链蒙特卡罗法、潜在狄利克雷分配和PageRank算法等。

文件格式：PDF，文件大小：91.93MB，售价：49.68元

共472页，可试读40页，点击往前阅读 ↑↑

文档详细内容（约472页）

18 第1章统计学习及监督学习概论 2.经验风险最小化与结构风险最小化在假设空间、损失函数以及训练数据集确定的情况下，经验风险函数式(1.14)就可以确定。经验风险最小化(empirical risk minimization,ERM)的策略认为，经验风险最小的模型是最优的模型。根据这一策略，按照经验风险最小化求最优模型就是求解最优化问题：聘∑，fe》 (1.15) 其中，下是假设空间。当样本容量足够大时，经验风险最小化能保证有很好的学习效果，在现实中被厂泛采用。比如，极大似然估计(maximum likelihood estimation)就是经验风险最小化的一个例子。当模型是条件概率分布、损失函数是对数损失函数时，经验风险最小化就等价于极大似然估计。但是，当样本容量很小时，经验风险最小化学习的效果就未必很好，会产生“过拟合”(over-fitting)现象结构风险最小化(structural risk minimization,SRM)是为了防止过拟合而提出来的策略。结构风险最小化等价于正则化(regularization)。结构风险在经验风险上加上表示模型复杂度的正则化项(regularizer)或罚项(penalty term)。在假设空间、损失函数以及训练数据集确定的情况下，结构风险的定义是： Rm=六∑6fe》+A0 (1.16) 其中J()为模型的复杂度，是定义在假设空间下上的泛函。模型∫越复杂，复杂度 J()就越大：反之，模型f越简单，复杂度J()就越小。也就是说，复杂度表示了对复杂模型的惩罚。入≥0是系数，用以权衡经验风险和模型复杂度。结构风险小需要经验风险与模型复杂度同时小。结构风险小的模型往往对训练数据以及未知的测试数据都有较好的预测。比如，贝叶斯估计中的最大后验概率估计(maximum posterior probability esti- mation,MAP)就是结构风险最小化的一个例子。当模型是条件概率分布、损失函数是对数损失函数、模型复杂度由模型的先验概率表示时，结构风险最小化就等价于最大后验概率估计结构风险最小化的策略认为结构风险最小的模型是最优的模型。所以求最优模型，就是求解最优化问题： CL(,f()》+λJ(f) (1.17)

20 第1章统计学习及监督学习概论例如，当损失函数是0-1损失时，测试误差就变成了常见的测试数据集上的误差率(error rate) N ∑≠红，》 eut= (1.20) 这里I是指示函数(indicator function),即y≠f(x)时为l,否则为0。相应地，常见的测试数据集上的准确率(accuracy)为 >I(vi=f(z:)) (1.21)）显然， Ttest +etest =1 训练误差的大小，对判断给定的问题是不是一个容易学习的问题是有意义的，但本质上不重要。测试误差反映了学习方法对未知的测试数据集的预测能力，是学习中的重要概念。显然，给定两种学习方法，测试误差小的方法具有更好的预测能力，是更有效的方法。通常将学习方法对未知数据的预测能力称为泛化能力(generalization ability),这个问题将在1.6节继续论述。 1.4.2过拟合与模型选择当假设空间含有不同复杂度（例如，不同的参数个数）的模型时，就要面临模型选择(model selection)的问题。我们希望选择或学习一个合适的模型。如果在假设空间中存在“真”模型，那么所选择的模型应该逼近真模型。具体地，所选择的模型要与真模型的参数个数相同，所选择的模型的参数向量与真模型的参数向量相近。如果一味追求提高对训练数据的预测能力，所选模型的复杂度则往往会比真模型更高。这种现象称为过拟合(over-fitting)。过拟合是指学习时选择的模型所包含的参数过多，以至出现这一模型对已知数据预测得很好，但对未知数据预测得很差的现象。可以说模型选择旨在避免过拟合并提高模型的预测能力。下面，以多项式函数拟合问题为例，说明过拟合与模型选择。这是一个回归问题。例1.1假设给定一个训练数据集①： T={(x1,h),(x2,2),·,(xN,w)} 其中，x∈R是输入x的观测值，∈R是相应的输出y的观测值，i=1,2,·,N。 ①本例米自参考文献2②

点击进入文档下载页（PDF格式）

共472页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录