集成学习的关键步骤 口如果构建不同的基学 习器? Training data 口如何将基学习狳合Dm)(Dn Data m 起来? Learner Learner2.:·.·: Learner m Modell Model2)·…······( Model m Model combiner 互联网新技术在线教育领航者 业晕学院 ▲ ChinaHadoop.cn
互联网新技术在线教育领航者 集成学习的关键步骤 如果构建不同的基学 习器? 如何将基学习器综合 起来? Training Data Data1 Data2 Data m Learner1 Learner2 Learner m Model1 Model2 Model m Model Combiner
如何构建不同的学习器? 日来用不同的学习算法 口来用相同的学习算法,但使用不同的参数 日不同的数据集 不同的样本子集 在每个数据集中使用不同的特征 日 Homogenous ensemble 采用相同的学习算法,但使用不同的训练集 Data1≠Data2≠,,≠ Data r Learner 1= Learner2=..= leaner m Bagging: booststrap sample the training set Boosting: reweight the training set 互联网新技术在线教育领航者 业晕学院 ▲ ChinaHadoop.cn
互联网新技术在线教育领航者 如何构建不同的学习器? 采用不同的学习算法 采用相同的学习算法,但使用不同的参数 不同的数据集 不同的样本子集 在每个数据集中使用不同的特征 Homogenous ensemble: 采用相同的学习算法,但使用不同的训练集 Data1 Data2 … Data m Learner1 = Learner2 = … = Leaner m Bagging: booststrap sample the training set Boosting: reweight the training set
如何构建不同的基学习器? 口不同的算法,但使用相同的训练集 日A:算法 口C:分类器 A1 C1 Training A2 Set L 互联网新技术在线教育领航者 业晕学院 ▲ ChinaHadoop.cn
互联网新技术在线教育领航者 如何构建不同的基学习器? 不同的算法,但使用相同的训练集 A: 算法 C: 分类器 Training Set L A1 A2 An … C1 C2 Cn …
如何构建不同的基学习器? 口相同的算法但是不同的参数设置 日A:算法 口P:参数设置 C1 Training P2 A C2 Set L Pn Cn 互联网新技术在线教育领航者 业晕学院 ▲ ChinaHadoop.cn
互联网新技术在线教育领航者 如何构建不同的基学习器? 相同的算法但是不同的参数设置 A: 算法 P: 参数设置 P1 Training Set L A C1 C2 Cn P2 Pn …
如何构建不同的基学习器? 口在不同训练集上使用相同的算法 口典型倒子: ■ Bagging ■ Boosting C1 Training 2 C2 Set L Ln 口L:训练集 互联网新技术在线教育领航者 业晕学院 ▲ ChinaHadoop.cn
互联网新技术在线教育领航者 如何构建不同的基学习器? 在不同训练集上使用相同的算法 典型例子: Bagging Boosting L: 训练集 Training Set L A … C1 C2 Cn … L1 L2 Ln