主要内容 决策树基本概念 决戴树算法 决策树研究问题 主要参考文献
主要内容 决策树基本概念 决策树算法 决策树研究问题 主要参考文献
决策树 决戴树基本概念 关于分类问题 分类( Classification)任务就是通过学习获得一个目标函数 ( Target Function)f,将每个属性集ⅹ映射到一个预先定义好的类 标号yo 分类任务的输入数据是纪录的集合,每条记录也称为实例 或者样例。用元组(Xy)表示,其中,Ⅹ是属性集合,y是一个 特殊的属性,指岀样例的类标号(也称为分类属性或者目标属性)
决策树 决策树基本概念 关于分类问题 分类(Classification)任务就是通过学习获得一个目标函数 (Target Function)f, 将每个属性集x映射到一个预先定义好的类 标号y。 分类任务的输入数据是纪录的集合,每条记录也称为实例 或者样例。用元组(X,y)表示,其中,X 是属性集合,y是一个 特殊的属性,指出样例的类标号(也称为分类属性或者目标属性)
决策树分类的步骤 数据库 建立模型 训练样本( training samples) 测试样本( testing samples) 评估模型 2021/2/9
决策树分类的步骤 13 数据库 2021/2/9 训练样本(training samples) 建立模型 测试样本(testing samples) 评估模型
决策树 决策树基本概念 解决分类问题的一般方法 通过以上对分类问题一般方法的描述,可以看出分类问题 般包括两个步骤: 1、模型构建(归纳) 通过对训练集合的归纳,建立分类模型。 2、预测应用(推论 根据建立的分类模型,对测试集合进行测试
决策树 决策树基本概念 解决分类问题的一般方法 通过以上对分类问题一般方法的描述,可以看出分类问题 一般包括两个步骤: 1、模型构建(归纳) 通过对训练集合的归纳,建立分类模型。 2、预测应用(推论) 根据建立的分类模型,对测试集合进行测试
决策树 决策树基本概念 解决分类问题的一般方法 训练集(类标号 TID A1 A2 )影 A3 学习算法 100 1234 YNYN 125 LSL 400 NNYN 学习模型 归纳 415 M 棋型 检验集(类标号来知) TID A1 A2 A3 类 应用模型 100 1234 YNYN 125 ???2 推论 400 415
决策树 决策树基本概念 解决分类问题的一般方法 TID A1 A2 A3 类 1 Y 100 L N 2 N 125 S N 3 Y 400 L Y 4 N 415 M N 学习算法 学习模型 模型 TID A1 A2 A3 类 应用模型 1 Y 100 L ? 2 N 125 S ? 3 Y 400 L ? 4 N 415 M ? 训练集(类标号已知) 检验集(类标号未知) 归纳 推论