直推学习(自训练方法)在已标记的数据上训练,然后对未标记数据进行预测,取预测置自训练的思路信度最高的样本直接对其进行标签定义,然后将这类样本纳入当前训练样本中,重新学习以得到新的模型过程这一过程不断迭代,直到满足终止条件
直推学习(自训练方法) 这一过程不断迭代,直到满足终止条件。 在已标记的数据上训练,然后对未标记数据进行预测,取预测置 信度最高的样本直接对其进行标签定义,然后将这类样本纳入当 前训练样本中,重新学习以得到新的模型。 自训练的 思路 过程
生成式方法判别方法生成方法由数据直接学习决策函数Y=f(X)或者条件概率分布由数据学习联合概率密度分布P(X,Y),然后由P(YX)P(YIX)作为预测的模型,即判别模型。判别方法关心=P(X,Y)/P(X)求出条件概率分布P(YIX)作为预测的模型的是对于给定的输入X,应该预测什么样的输出Y。即生成模型。典型的生成模型有:朴素贝叶斯和隐马典型的判别模型包括k近邻,感知机,决策树,支持尔科夫模型等。向量机等。半设所有数据(无论是否有标记)都是由潜在的模型“生成”的。这个假设使得我能通过潜在模型的参数将未标记数据与学习目标联系起来,而未标记数据的标记作模型的缺失参数,通常可基于EM算法进行极大似然估计求解出来
生成式方法 由数据学习联合概率密度分布P(X,Y),然后由P(Y|X) =P(X,Y)/P(X)求出条件概率分布P(Y|X)作为预测的模型, 即生成模型。典型的生成模型有:朴素贝叶斯和隐马 尔科夫模型等。 由数据直接学习决策函数Y=f(X)或者条件概率分布 P(Y|X)作为预测的模型,即判别模型。判别方法关心 的是对于给定的输入X,应该预测什么样的输出Y。 典型的判别模型包括k近邻,感知机,决策树,支持 向量机等。 判别方法 生成方法 半设所有数据(无论是否有标记)都是由潜在的模型“生成”的。这个假设使得我能通过潜在模 型的参数将未标记数据与学习目标联系起来,而未标记数据的标记作模型的缺失参数,通常可基 于EM算法进行极大似然估计求解出来