ch10决策树
Ch 10. 决策树
特征类型 数值数据( numerical data) 例:{1.2,4.5,33} ·模式间可以计算距离度量 ·基于度量的模式分类方法 标称数据( nominal data) 例:{红色,有光泽,甜,小} ·模式间没有距离的概念 ·非度量方法
特征类型 • 数值数据(numerical data) • 例:{1.2, 4.5, 3.3} • 模式间可以计算距离度量 • 基于度量的模式分类方法 • 标称数据 (nominal data) • 例:{红色,有光泽,甜,小} • 模式间没有距离的概念 • 非度量方法
决策树 ·什么是决策树? 决策树是一种类似流程图的树形结构,每个内部节点表 示一个测试(查询),该节点的每个分支表示该测试的 个结果,每个叶节点表示一个类别 决策树的构成 根节点(root) 分支( branch) 叶节点(leaf)
决策树 • 什么是决策树? • 决策树是一种类似流程图的树形结构,每个内部节点表 示一个测试(查询),该节点的每个分支表示该测试的 一个结果,每个叶节点表示一个类别 • 决策树的构成 • 根节点(root) • 分支(branch) • 叶节点(leaf)
决策树 root Color? level o green red vellow Size? Shape? Size? level bis round thin medium Watermelon Apple grape Size?) Banana( Apple (taste? level 2 g sweet soul Grapefruit Lemon Cherry Grape level 3
决策树
决策树 ·决策树分类过程 ·从根节点开始,首先对某一属性的取值提问 Color? ·与根节点相连的不同分支,对应这个属性的不同取值 ° green;yeow;red; ·根据不同的回答,转向相应的分支 green ·在新到达的节点处做同样的分支判断 Size?-big ·这一过程持续,直到到达某个叶节点,输出该叶节点的 类别标记 Watermelon
决策树 • 决策树分类过程 • 从根节点开始,首先对某一属性的取值提问 • Color? • 与根节点相连的不同分支,对应这个属性的不同取值 • green; yellow;red; • 根据不同的回答,转向相应的分支 • green • 在新到达的节点处做同样的分支判断 • Size? – big. • 这一过程持续,直到到达某个叶节点,输出该叶节点的 类别标记 • Watermelon