当前位置：和泉文库 > 计算机 > 浏览文档

复旦大学：《商务智能》课程PPT教学课件（商务数据分析）05 数据挖掘技术方法

文件格式：PPT，文件大小：10.24MB，售价：36.84元

文档详细内容（约227页）

集成学习(1) 集成学习方法训练多个学习器并结合它们来解决一个问题个集成学习模型由多个基学习器( base learner)构成,而基学习器可以是决策树、神经网络或其他学习算法,它们需要在训练数据上训练。集成学习可以使用同一种基学习算法(同质的基学习器,也可以使用多种学习算法训练不同种类的学习器构建异质集成。集成学习一般比基学习器的泛化能力更强,可以把比随机猜测稍好的弱学习器变成可以精确预测的强学习器 learner 1 learner 2 combination earner n

36 集成学习（1） ◼ 集成学习方法训练多个学习器并结合它们来解决一个问题。 ◼ 一个集成学习模型由多个基学习器(base learner)构成，而基学习器可以是决策树、神经网络或其他学习算法，它们需要在训练数据上训练。 ◼ 集成学习可以使用同一种基学习算法（同质的基学习器，也可以使用多种学习算法训练不同种类的学习器构建异质集成。 ◼ 集成学习一般比基学习器的泛化能力更强，可以把比随机猜测稍好的弱学习器变成可以精确预测的强学习器

集成学习(2) 构建一个集成模型的计算未必显著高于单一学习器。这是因为单一学习器模型调参经常会产生多个版本的模型,这与在集成学习中构建多个基学习器的代价是相当的常用于网络入侵检测、分子生物活性和蛋白质位点预测、肺栓塞检测、客户关系管理、教育数据挖掘、音乐推荐、电影推荐等。 0.25 -o- averag 0.20 口- best single ●… combination 0.10 level

37 集成学习（2） ◼ 构建一个集成模型的计算未必显著高于单一学习器。这是因为单一学习器模型调参经常会产生多个版本的模型，这与在集成学习中构建多个基学习器的代价是相当的。 ◼ 常用于网络入侵检测、分子生物活性和蛋白质位点预测、肺栓塞检测、客户关系管理、教育数据挖掘、音乐推荐、电影推荐等

Stacking Stacking方法(知识蒸馏)是指训练一个模型用于组合其他各个模型先训练多个不同的模型,然后把训练得到的各个模型的输出为输入来训练一个模型,以得到一个最终的输出。 Training Classification z乏a Meta-Classifier

38 Stacking ◼ Stacking方法（知识蒸馏）是指训练一个模型用于组合其他各个模型。 ◼ 先训练多个不同的模型，然后把训练得到的各个模型的输出为输入来训练一个模型，以得到一个最终的输出

Bagging 基本思想是用一个不稳定(数据集小的变化可能使分类结果有显著的变化)、弱学习算法(准确率不高) 对一个训练集用该算法使用多次,得到多个分类模型对于新样本的分类,可以用这些分类模型进行投票 (得票最多的类别作为结果),结果会提高决策树的分类准确率。 ■可以处理大数据集。 Blue

39 Bagging ◼ 基本思想是用一个不稳定（数据集小的变化可能使分类结果有显著的变化）、弱学习算法（准确率不高），对一个训练集用该算法使用多次，得到多个分类模型。对于新样本的分类，可以用这些分类模型进行投票（得票最多的类别作为结果），结果会提高决策树的分类准确率。 ◼ 可以处理大数据集

Boosting技术 C5.0使用 Boosting来提高模型准确率 Boosting的基本思想是每个样本都赋予权重,每次迭代对分类错误的样本增加权重,以便下次的样本关注这些样本。这种方法也能提高不稳定分类算法的准确率。 Boosting和 Bagging的区别是 Bagging的训练集是随机选择,相互独立的,分类模型可以并行生成;而 Boosting的训练集不是独立的,与前一轮的学习有关,分类模型只能顺序生成。 boost 调练集训练可基()模

40 Boosting技术 ◼ C5.0使用Boosting来提高模型准确率。 ◼ Boosting的基本思想是每个样本都赋予权重，每次迭代对分类错误的样本增加权重，以便下次的样本关注这些样本。这种方法也能提高不稳定分类算法的准确率。 ◼ Boosting和Bagging的区别是Bagging的训练集是随机选择，相互独立的，分类模型可以并行生成；而Boosting的训练集不是独立的，与前一轮的学习有关，分类模型只能顺序生成

点击进入文档下载页（PPT格式）

共227页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

复旦大学：《商务智能》课程PPT教学课件（商务数据分析）04 数据挖掘基础（数据挖掘原理）
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）03 在线分析处理 Online Analytical Processing
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）02 数据仓库 Data Warehouse
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）11 大数据分析与应用 Big data analytics and applications
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）10 流程智能 Process Intelligence
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）01 商务智能概论 Introduction to Business Intelligence
《商务智能》课程学习资料：集成学习实用机器学习方法 Ensemble Learning
复旦大学：《商务智能》课程教学讲义（商务数据分析）电子推荐系统
复旦大学《商务智能》课程参考资料：室内位置服务与商业智能
《计算机教育Computer Education》：数据分析类课程的技能培养方法探讨（复旦大学：赵卫东，蒲实）
《计算机教育Computer Education》：基于项目实践的机器学习课程改革（复旦大学：赵卫东，袁雪茹）
复旦大学：《商务智能》课程学习资料（商务数据分析）一个课程内容专题（主题）的详细教学设计与实施方案
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）06 数据挖掘应用
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）07 Web挖掘基础
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）08 知识管理
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）09 搜索引擎优化 Search Engine Optimization
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）关联规则 CARMA Continuous Association Rule Mining Algorithm
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）密度聚类——算法详解
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）序列模式挖掘算法
中国科学院计算技术研究所：《高级人工智能》PPT课件_贝叶斯网络——概率推理（史忠植）
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第10章基于逻辑回归模型的高危
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第11章卷积神经网络在音频质量评价领域的应用
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第1章数据分析过程的主要问题
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第2章保险产品推荐

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录