25 建模简介 isics文件源节点从re-redi,ay数据文件读取,格式数 "文件 装在Demos文件 名 用位 图痛5tist1cs文件源节点读取数据 tree credit.sav 固跑®面 导入文t体:CProgram FlesVBMSP554 Demree.credt sav 安盘名称:。谈取名朴和听道©读取标查作为名付 。该权数搭和所控©该极标控作力数进 类型节点指定每个字段的测量级别。测量级别是一种指示字段中数据类型的类别。我们 的源数据文件使用三种不同的测量级别
25 建模简介 Statistics 文件源节点从 tree_credit.sav 数据文件读取 SPSS Statistics 格式数 据,该文件安装在 Demos 文件夹中。(名为 $CLEO_DEMOS 的特殊变量用于引用位于当 前 IBM® SPSS® Modeler 安装下的该文件。这样,无论当前的安装文件夹或版本是什 么,均可以确保路径有效。) 图片 4-3 使用 Statistics 文件源节点读取数据 类型节点指定每个字段的测量级别。测量级别是一种指示字段中数据类型的类别。我们 的源数据文件使用三种不同的测量级别
26 章4 连续字段(例如年龄字段)包含连续的数字值,而名义字段(例如信用评价字段)有两 个或多个不同值,例如不良、优良或无信用历史。有序字段(例如收入水平字段)用于 描述其有顺序固定的不同值的数据,在本例中为低、中和高。 鼎装书点设置目标和输人字成 Type ☒ 线心回 0-口 、可四清件值清尚所有值 应用置 角色设置为目标 对于其他字段,将角色设置为输入。输入字段有时也称为预测变量,或建模算法用其 值来预测目标字段值的字段。 CAID建模节点生成模型。 在建模节点的 “字段” 选项卡中,己选中使用预定义角色,这意味着将按在类型节点 使用目标和输入。我们可以在此处更改字段角色,但本例中我们不做任何史
26 章 4 连续字段(例如年龄字段)包含连续的数字值,而名义字段(例如信用评价字段)有两 个或多个不同值,例如不良、优良或无信用历史。有序字段(例如收入水平字段)用于 描述具有顺序固定的不同值的数据,在本例中为低、中和高。 图片 4-4 用类型节点设置目标和输入字段 对于每个字段,类型节点还指定角色,以指示每个字段在建模中扮演的部分。将字段 信用评价的角色设置为目标,此字段指示指定的客户是否拖欠贷款。这是目标,或者 是要预测其值的字段。 对于其他字段,将角色设置为输入。输入字段有时也称为预测变量,或建模算法用其 值来预测目标字段值的字段。 CHAID 建模节点生成模型。 在建模节点的“字段”选项卡中,已选中使用预定义角色,这意味着将按在类型节点 中的指定使用目标和输入。我们可以在此处更改字段角色,但本例中我们不做任何更 改使用这些角色
27 建模简介 、单击“构建选项”选项卡。 恩片定模节点、“字段”选项卡 Creditrating ☒ ⑦▣ 目标布 字投同地适厦发选项侧注年 使用预定火向色U ○使用自定义字段分配(C dn Credt rating e level ard 8品82 ¥山1☑ 确定习心运行面双消 应用□适 此处包含的选项可以用于指定要构建的模型类型。 由于我们想要一个全新的模型,因此使用默认选项构建新模型 我们还要求它为单个标准决策树模型,并且不包含任何增强,因此保留默认目标选 项构建单个树
27 建模简介 E 单击“构建选项”选项卡。 图片 4-5 CHAID 建模节点、“字段”选项卡 此处包含的选项可以用于指定要构建的模型类型。 由于我们想要一个全新的模型,因此使用默认选项构建新模型。 我们还要求它为单个标准决策树模型,并且不包含任何增强,因此保留默认目标选 项构建单个树
28 章4 我们可以选择启动允许对模型进行微调的交互建模会话,本示例只使用默认设置生成 模型来生成模型。 恩片罐碳节点、“构建选项选项卡 Creditrating oa▣ 目标(0) 您要敏什么 基率B) @回新模型)@据续训5税狗调型但 停止规S】 成本c 空件 众数@生成权恐四。画动文互会话间 ○增强模型准璃性(o0sn0(回) Q增模8定性(gmg(© 为大数集使型(要SyV 定门●滋行包消圆 应用园蒸同 对于此示例,我们希望保持树的结构简单,因此通过增加用于父节点和子节点的最小 个案数限制树的增长。 、在“构建选项”选项卡上,从左侧的导航器窗格选择停止规则。 、选择使用绝对值选项。 ·将父分支中的最小记录数设置为400
28 章 4 我们可以选择启动允许对模型进行微调的交互建模会话,本示例只使用默认设置生成 模型来生成模型。 图片 4-6 CHAID 建模节点、“构建选项”选项卡 对于此示例,我们希望保持树的结构简单,因此通过增加用于父节点和子节点的最小 个案数限制树的增长。 E 在“构建选项”选项卡上,从左侧的导航器窗格选择停止规则。 E 选择使用绝对值选项。 E 将父分支中的最小记录数设置为 400
29 建模简介 ,将子分支中的最小记录数设置为200。 男药整决策树设置停止标准 Creditrating ☒ oa▣ 字服日内适项线项注军 目标 使用百分比 是本心 停止规5) 子分支%冲的最小记录知山10日 术本C) ©使用地时证回 整件) 子分表中的最小记绿数心:200日 磷定门D池行回及消○ 应用国适
29 建模简介 E 将子分支中的最小记录数设置为 200。 图片 4-7 为构建决策树设置停止标准 在本例中,我们可以使用所有其他默认选项,因此单击运行以创建模型。(另外,也 可以右键单击该节点,然后从上下文菜单中选择运行,或选择节点,并从“工具”菜 单中选择运行。)