决策树基础 训练集∶数据的集合’用于生成树(模型) 测试集:用于测试树(模型)的性能 训练集 算法 决策树作用: ●通过训练集 算法指导下 生成决策树 决策树新数据 新数据进行划分 否则是“三拍”决策决策
决策树基础 训练集:数据的集合,用于生成树(模型) 测试集:用于测试树(模型)的性能 决策树作用: ⚫ 通过训练集 ⚫ 算法指导下 ⚫ 生成决策树 ⚫ 新数据进行划分 ⚫ 否则是“三拍”决策 训练集 算法 决策树 新数据 决策
决策树基础 实例决策树怎么做?谁是父节点? 谁是下一层子节点?为什么是它? No.头痛肌肉痛体温流感 3!=6 正常)_NO 1)是(1)高1 3是h是1)很高1 温肌肉 0)是母一旺常O)H 肌下头-体温 、N 6否00是①〕很高(2)M·体温头肌肉 7是()20)高)m。体温肌肉头
决策树基础 实例 No. 头痛 肌肉痛 体温 患流感 1 是(1) 是(1) 正常(0) N(0) 2 是(1) 是(1) 高(1) Y(1) 3 是(1) 是(1) 很高(2) Y(1) 4 否(0) 是(1) 正常(0) N(0) 5 否(0) 否(0) 高(1) N(0) 6 否(0) 是(1) 很高(2) N(1) 7 是(1) 否(0) 高(1) Y(1) 决策树怎么做?谁是父节点? 谁是下一层子节点?为什么是它? ⚫ 头-肌肉-体温 ⚫ 头-体温-肌肉 ⚫ 肌肉-头-体温 ⚫ 肌肉-体温-头 ⚫ 体温-头-肌肉 ⚫ 体温-肌肉-头 3 3 P = = 3! 6 三 拍 决 策
决策树 决策树算法 决策树的用途 计年龄收入学生信誉归类:买计算机 64青高否良不买 64青高否优不买 128中高否良买 60老中否良买 假定公司收集了左表数据,那么对 64老低是良 买 于任意给定的客人(测试样例), 64老低|是「优不买 你能帮助公司将这位客人归类吗? 64中低是优买 即:你能预测这位客人是属于“买” 128青|中否良不买 计算机的那一类,还是属于“不买” 64青低|是良买 计算机的那一类? 132 中是良 又:你需要多少有关这位客人的信 64青中是优买 息才能回答这个问题? 32 中否优买 32 高是良 63老中否优不买
决策树 决策树算法 计 数 年龄 收入 学生 信誉 归类:买计算机 ? 64 青 高 否 良 不买 64 青 高 否 优 不买 128 中 高 否 良 买 60 老 中 否 良 买 64 老 低 是 良 买 64 老 低 是 优 不买 64 中 低 是 优 买 128 青 中 否 良 不买 64 青 低 是 良 买 132 老 中 是 良 买 64 青 中 是 优 买 32 中 中 否 优 买 32 中 高 是 良 买 63 老 中 否 优 不买 1 老 中 否 优 买 假定公司收集了左表数据,那么对 于任意给定的客人(测试样例), 你能帮助公司将这位客人归类吗? 即:你能预测这位客人是属于“买” 计算机的那一类,还是属于“不买” 计算机的那一类? 又:你需要多少有关这位客人的信 息才能回答这个问题? 决策树的用途
决策树 决策树算法 决策树的用途 计年龄收入学生信誉归类:买计算机 谁在买计算机? 64青高 良优良良 不买 年龄? 128中高否 头 青 60老 头 老 64老低是良 64老低是优不买 生? 信誉? 64中低是 头 128青中 良不买 优 64青低是良买 不买 不买 头 132老中是良 64青中是优 32 优买 32中高是良 63老中否优不买 1老中否优
决策树 计 数 年龄 收入 学生 信誉 归类:买计算机 ? 64 青 高 否 良 不买 64 青 高 否 优 不买 128 中 高 否 良 买 60 老 中 否 良 买 64 老 低 是 良 买 64 老 低 是 优 不买 64 中 低 是 优 买 128 青 中 否 良 不买 64 青 低 是 良 买 132 老 中 是 良 买 64 青 中 是 优 买 32 中 中 否 优 买 32 中 高 是 良 买 63 老 中 否 优 不买 1 老 中 否 优 买 谁在买计算机? 年龄? 学生? 买 信誉? 青 中 老 否 是 优 良 不买 买 不买 买 决策树的用途 决策树算法
决策树 决策树的用途 决策树算法 计年龄收入「学生信誉 归类:买 计算机? 64青高否 不买 64青高否 不买 谁在买计算机? 128中高否 60 64老 良优良良良优优良良良优 青 64|老 不买 64 学生? 头 信誉? 128青 不买 64青低 优 132老 64 是是是否是是是否 不买 不买 32 32 63
决策树 计 数 年龄 收入 学生 信誉 归类:买 计算机? 64 青 高 否 良 不买 64 青 高 否 优 不买 128 中 高 否 良 买 60 老 中 否 良 买 64 老 低 是 良 买 64 老 低 是 优 不买 64 中 低 是 优 买 128 青 中 否 良 不买 64 青 低 是 良 买 132 老 中 是 良 买 64 青 中 是 优 买 32 中 中 否 优 买 32 中 高 是 良 买 63 老 中 否 优 不买 1 老 中 否 优 买 谁在买计算机? 年龄? 学生? 买 信誉? 青 中 老 否 是 优 良 不买 买 不买 买 决策树的用途 决策树算法