决策树基本流程 1、选取一个属性,以该属性为根节点,以该属性取值为根节点分枝,进行画树。 2、考察每个子类,若其中的实例结论完全相同,则以这个相同的结论作为相应分枝路径末端 的叶子节点; 3、否则,选取一个非父节点的属性,按这个属性的不同取值对该子集进行分类,并以该属性 作为节点,以这个属性的诸取值作为节点的分枝,继续进行画树。 4、如此继续,直到所分的子集全都满足:实例结论完全相同,而得到所有的叶子节点为止。 Hangchou①ianzi Universi的杭州电子科技大学 School of Computer Science and Tecfnology计算机学院周文库
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 决策树基本流程 1、选取一个属性,以该属性为根节点,以该属性取值为根节点分枝,进行画树。 2、考察每个子类,若其中的实例结论完全相同,则以这个相同的结论作为相应分枝路径末端 的叶子节点; 3、否则,选取一个非父节点的属性,按这个属性的不同取值对该子集进行分类,并以该属性 作为节点,以这个属性的诸取值作为节点的分枝,继续进行画树。 4、如此继续,直到所分的子集全都满足:实例结论完全相同,而得到所有的叶子节点为止
实例 决策树学习举例 序号 性别 年龄段 婚状 保险类别 某保险公司的汽车驾驶保险类别 1e 女和 <21 未和 Ce 划分的部分事例表。 20 女和 <21e 已 Ce 3 男 <21e 未e Co 4e 男 <21e 已 Be 以该表为一个实例集,用决策树 5 女和 ≥21且≤25 未e A 学习来归纳该保险公司汽车驾驶 6e 女和 ≥21且≤25 已e A 保险类别的划分规则。 Te 男 ≥21且≤25 未 C 8 男即 ≥21且≤25和 已 Be 9o 女和 >25 未e A 10e 女e >25 已e A 11e 男 >250 未和 B 120 男 >250 已 Be Hangchou①ianzi Universi的y杭州电子科技大学 School of Computer Science and Tecfnology计算机学院周文库
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 决策树学习举例 某保险公司的汽车驾驶保险类别 划分的部分事例表。 以该表为一个实例集,用决策树 学习来归纳该保险公司汽车驾驶 保险类别的划分规则
决策树学习举例2 按属性“性别”的不同取值将其分类。S应被分类为两个子集: S1={(3,C),(4,B),(7,C),(8,B),(11,B),(12,B)} S2={(1,C),(2,C),(5,A),(6,A),(9,A),(10,A)} 可得到以性别作为根节点的部分决策树。 :{1,C),(2,C),(3,C),(4,B),(5,A),(6,A),(7,C),(8,B),(9,A),(10,A),(11,B),(12,B)} 性别 男 女 S1:{3,C),(4,B),(7,C),(8,B),(11,B),(12,B)} S2:{(1,C),(2,C),(5,A),(6,A),(9,A),(10,A)} Hangzhou①ianzi Universi的杭州电子科技大学 School of Computer Science and T2 chnologry计算机学院周文库
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 决策树学习举例2 按属性“性别”的不同取值将其分类。S应被分类为两个子集: S1= {(3,C), (4,B), (7,C), (8,B), (11,B), (12,B)} S2= {(1,C), (2,C), (5,A), (6,A), (9, A), (10,A)} 可得到以性别作为根节点的部分决策树
决策树学习举例3 再对S,和S2按“年龄段”将其分类,分别得到子集S1,S12,S13和S21,S22,S23。于是可进一步得 到含有两层节点的部分决策树。 S:{1,C),(2,C),(3,C),(4,B),(5,A),(6,A),(7,C),(8,B),(9,A),(10,A),(11,B),(12,B)} 性别 男 女 S1:{3,C),(4,B),(7,C),(8,B),(11,B),(12,B)} S2:{(1,C),(2,C),(5,A),(6,A),(9,A),(10,A)} 年龄段 年龄段 大 小 大 中 中 S1:{(11,B),(12,B)} S13:{3,C),(4,B)} S21:{1,C),(2,C)} S23:{(9,A),(10,A)} S12:{(7,C),(8,B)} S22:{(5,A),(6,A)}
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 决策树学习举例3 再对S1和S2按“年龄段”将其分类,分别得到子集S11, S12, S13和S21, S22, S23。于是可进一步得 到含有两层节点的部分决策树
决策树学习举例4 除S2和S13外,其余子集中各实例的保险类别已完全相同,不需再对其进行分类,每个子集中相同 保险类别值可作为相应分枝的叶子节点。 S:{(1,C),(2,C),(3,C),(4,B),(5,A),(6,A),(7,C)(8,B),(9,A),(10,A),(11,B),(12,B)} 性别 男 女 S1:{3,C),(4,B),(7,C),(8,B),(11,B),(12,B)} S2:{1,C),(2,C),(5,A),(6,A),(9,A),(10,A)} 年龄段 年龄段 大 小 小 大 中 中 S11:{(11,B),(12,B)} S13:{3,C),(4,B)} S21:{(1,C),(2,C)} S23:{(9,A),(10,A)} B S12:{(7,C),(8,B)} S2z:{5,A),(6,A)} A A
Hangzhou Dianzi University 杭州电子科技大学 School of Computer Science and Technology 计算机学院 周文晖 决策树学习举例4 除S12和S13外,其余子集中各实例的保险类别已完全相同,不需再对其进行分类,每个子集中相同 保险类别值可作为相应分枝的叶子节点