20 章3 ·双击。双击鼠标左键可将节点置于流工作区并编辑现有节点。 中健单击。单击鼠标中健并拖动光标可在流工作区中连接节点。双击鼠标中键可 断开某个节点的连接。如果没有三键鼠标,可在单击并拖动鼠标时通过按A1 键来模拟此功能。 使用快捷键 IBW国SPSS Mode1er中的许多规化编程楼作均有与之关联的快捷键。例加,可通过单 击某个节点并按键盘上的Delete锭将此节点刷除。同样,可在按住Ctrl键的同时按S 健快速保存某个流。类似控制命令用Ctr1健与另一个键的组合来表示,例如Cr1-S。 标准Windows操作中采用了许多快捷键,例如Ctrl-X表示剪切。SPSS Modeler不仅 支持这些快捷键,而且还支持下列应用程序特定的快捷键。 注意:某些时候,SPSS Modeler中使用的旧快捷键会与标准Windows快捷键发生冲 突。这些旧快捷键与A1t键组合使用仍然有效。例如,Ctrl-A1t-C可用来切换高 速缓存的开与关。 变的快建理 快捷键函数 Ctrl=A Ctrl-x 剪切 Ctrl-N 新建流 Ctr1-0 打开流 Ctrl-P 打印 Ctrl-C 桔贴 Ctrl可 粘贴 Ctrl-Z 撒消 Ctrl-0 选择选定节点的所有下游节点 Ctrl-W 取消选择所有下游节点(使用Ctr1-Q切换 Ctrl- 从选定节点运行 Ctrl-s 保存当前沉 1t一箭头按所用箭头键的方向在流工作区中移动所选节点。 Shift-F10打开选定节点的上下文菜单 麦的旧热健快捷键 快捷健函数 Ctrl-A1t-D复制节点 Ctr1-A1t-L载入节点 Ctrl-At-R重命名节点 Ctrl-At-U创建用户输入节点
20 章 3 双击。双击鼠标左键可将节点置于流工作区并编辑现有节点。 中键单击。单击鼠标中键并拖动光标可在流工作区中连接节点。双击鼠标中键可 断开某个节点的连接。如果没有三键鼠标,可在单击并拖动鼠标时通过按 Alt 键来模拟此功能。 使用快捷键 IBM® SPSS® Modeler 中的许多可视化编程操作均有与之关联的快捷键。例如,可通过单 击某个节点并按键盘上的 Delete 键将此节点删除。同样,可在按住 Ctrl 键的同时按 S 键快速保存某个流。类似控制命令用 Ctrl 键与另一个键的组合来表示,例如 Ctrl-S。 标准 Windows 操作中采用了许多快捷键,例如 Ctrl-X 表示剪切。SPSS Modeler 不仅 支持这些快捷键,而且还支持下列应用程序特定的快捷键。 注意:某些时候,SPSS Modeler 中使用的旧快捷键会与标准 Windows 快捷键发生冲 突。这些旧快捷键与 Alt 键组合使用仍然有效。例如,Ctrl-Alt-C 可用来切换高 速缓存的开与关。 表 3-1 支持的快捷键 快捷键 函数 Ctrl-A 全选 Ctrl-X 剪切 Ctrl-N 新建流 Ctrl-O 打开流 Ctrl-P 打印 Ctrl-C 粘贴 Ctrl-V 粘贴 Ctrl-Z 撤消 Ctrl-Q 选择选定节点的所有下游节点 Ctrl-W 取消选择所有下游节点(使用 Ctrl-Q 切换) Ctrl-E 从选定节点运行 Ctrl-S 保存当前流 Alt - 箭头 键 按所用箭头键的方向在流工作区中移动所选节点。 Shift-F10 打开选定节点的上下文菜单 表 3-2 支持的旧热键快捷键 快捷键 函数 Ctrl-Alt-D 复制节点 Ctrl-Alt-L 载入节点 Ctrl-Alt-R 重命名节点 Ctrl-Alt-U 创建用户输入节点
21 1 BM SPSS Modeler概述 快捷健函数 Ctr1-A1t-C切换高速缓存开关 Ctrl-A1t-F刷新高速缓存 Ctrl-At-X扩展超节点 Ctr-At-Z放大/缩小 Delete 删除节点或连接 打印 可在IBM#SPSS Modeler中打印下列对象 ■流图表 ·图形 ■表 ·报告(来自报告节点和工程报告) ■脚本(来自“流属性”、“独立脚本”或“超节点脚本”对话框) ·模型(模型浏览器、包含当前内容的对话框选项卡、树查看器) ■注解(使用输出的“注解”选项卡) 要打印对象: ■要不预览就打印,请单击工具栏上的“打印”按钮 ■要在打印前设置页面,请选择“文件”菜单中的页面设置。 ·要在打印前预览,请选择“文件”菜单中的打印预览 ·要查看标准打印对话框中用于选择打印机以及指定外观的选项,请选择“文件”菜 单中的打印。 自动化IBM SPSS Modeler 由于高级数据挖据往往是 一个冗长的复杂过程,因此IBM®SPSSR Modeler包含对几种类 型的编码和自动处理的支持。 ■表达式操作控制语言(CLE)是一种用于分析和操作在SPSS Modeler流中流动的数据 的语言 ,数据挖掘人员可在流操作中广泛使用CL创语言来执行根据成本和收入 数据推导利润这样的简单任务或将b日志数据转换为具有有用信息的一系列字 路复杂任务用有台。参黄第7章中的什么6?中 夏杂 ·脚本编写是用于在用户界面上实现过程自动化的强大工具。用户以鼠标或键盘实现 的操作也可以通过脚本来实现,可以为节点设置选项并使用C子集实现派生。 ,请参阅第2章中的脚本编写橱
21 IBM SPSS Modeler 概述 快捷键 函数 Ctrl-Alt-C 切换高速缓存开关 Ctrl-Alt-F 刷新高速缓存 Ctrl-Alt-X 扩展超节点 Ctrl-Alt-Z 放大/缩小 Delete 删除节点或连接 打印 可在 IBM® SPSS® Modeler 中打印下列对象: 流图表 图形 表 报告(来自报告节点和工程报告) 脚本(来自“流属性”、“独立脚本”或“超节点脚本”对话框) 模型(模型浏览器、包含当前内容的对话框选项卡、树查看器) 注解(使用输出的“注解”选项卡) 要打印对象: 要不预览就打印,请单击工具栏上的“打印”按钮。 要在打印前设置页面,请选择“文件”菜单中的页面设置。 要在打印前预览,请选择“文件”菜单中的打印预览。 要查看标准打印对话框中用于选择打印机以及指定外观的选项,请选择“文件”菜 单中的打印。 自动化 IBM SPSS Modeler 由于高级数据挖掘往往是一个冗长的复杂过程,因此 IBM® SPSS® Modeler 包含对几种类 型的编码和自动处理的支持。 表达式操作控制语言 (CLEM) 是一种用于分析和操作在 SPSS Modeler 流中流动的数据 的语言。数据挖掘人员可在流操作中广泛使用 CLEM 语言来执行根据成本和收入 数据推导利润这样的简单任务或将 Web 日志数据转换为具有有用信息的一系列字 段和记录这样的复杂任务。有关详细信息,请参阅第 7 章中的什么是 CLEM?中 的IBM SPSS Modeler 14.1 用户 指南。 脚本编写是用于在用户界面上实现过程自动化的强大工具。用户以鼠标或键盘实现 的操作,也可以通过脚本来实现。可以为节点设置选项并使用 CLEM 子集实现派生。 还可以指定输出并操纵生成的模型。 有关详细信息,请参阅第 2 章中的脚本编写概 述中的IBM SPSS Modeler 14.1 脚本编写 和自动化指南
4 建模简介 模型是一组规则、公式或方程式,可以用它们根据一组输入或变量来预测输出。例 如, 一家财务机构可根据对过往申请人的己知信息,使用模型预测贷款申请人可能存 在优良还是不良风险。 笑测结果是预性分新的中心目标并且了建核过程是使用即S 胃草的决莱树损型 0 总i计100000246 11.50 总计315347 总计22443553 总计46023113 果收入=中等 则二“优良” 修康不刻使用卡方台动交互效应检测)模型时。肯在进行常规的介绍。大部分 泛应 用于SPSS Modeler中的1 他建模类型 Integraolutond
章 4 建模简介 模型是一组规则、公式或方程式,可以用它们根据一组输入或变量来预测输出。例 如,一家财务机构可根据对过往申请人的已知信息,使用模型预测贷款申请人可能存 在优良还是不良风险。 能够预测结果是预测性分析的中心目标,并且了解建模过程是使用 IBM® SPSS® Modeler 的关键。 图片 4-1 简单的决策树模型 本示例使用决策树模型,该模型使用一系列决策规则对记录进行分类(并预测响 应),例如: 如果收入 = 中等 并且卡 <5 则 ->“优良” 本示例使用 CHAID(卡方自动交互效应检测)模型时,旨在进行常规的介绍,大部分 概念会广泛应用于 SPSS Modeler 中的其他建模类型。 © Copyright Integral Solutions Limited 1994, 2010 22
23 建模简介 均需要首先了解进入该模型的数据。此示例中的数据包含有关银 字段名 描述 Credit_rating 信用评价:0=不良,1=优良,9= 年龄 Age in years 收入 收入水平,1=低,2=中,3=高 Credit cards 势有腺傻型数量:1少于五张 教有 教有程度:1=高中,2=大学 Car_loans 整离售数量:1设有该一药 银行可维护 个包含银行贷款客户历史信息,包括这些客户是正在还贷(信用评价=优 良)还是在拖欠贷款(信用评价三不良)的数据库,银行希望使用现有的数据建立一个 模型,允许他们预测未来贷款申请人拖欠贷款的可能性。 使用决策树模型,您可分析两组客户的特征,并预测拖欠贷款的可能性 本示例使用了名为modelingintro.str的流,该流位于streams子文件夹下的Demos文 件夹中。数据文件是tree_credit.sav。有关详细信息,请参阅第4页码第1章中 的Demos文件夹。 我们来看一下流。 一从主菜单中选择下列选项: 文件>打开流 ,单击“打开”对话框的工具栏上的金色模型块图标,然后选择Demos文件夹。 双击streams文件夹。 双击名为modelingintro.str的文件
23 建模简介 无论要了解哪种模型,均需要首先了解进入该模型的数据。此示例中的数据包含有关银 行客户的信息。其中使用了下列字段: 字段名 描述 Credit_rating 信用评价:0=不良,1=优良,9= 丢失值 年龄 Age in years 收入 收入水平:1=低,2=中,3=高 Credit_cards 持有的信用卡数量:1=少于五张, 2=五张或更多 教育 教育程度:1=高中,2=大学 Car_loans 贷款的汽车数量:1=没有或一辆, 2=超过两辆 银行可维护一个包含银行贷款客户历史信息,包括这些客户是正在还贷(信用评价 = 优 良)还是在拖欠贷款(信用评价 = 不良)的数据库。银行希望使用现有的数据建立一个 模型,允许他们预测未来贷款申请人拖欠贷款的可能性。 使用决策树模型,您可分析两组客户的特征,并预测拖欠贷款的可能性。 本示例使用了名为 modelingintro.str 的流,该流位于 streams 子文件夹下的 Demos 文 件夹中。数据文件是 tree_credit.sav。有关详细信息,请参阅第 4 页码第 1 章中 的Demos 文件夹。 我们来看一下流。 E 从主菜单中选择下列选项: 文件 > 打开流 E 单击“打开”对话框的工具栏上的金色模型块图标,然后选择 Demos 文件夹。 E 双击 streams 文件夹。 E 双击名为 modelingintro.str 的文件
24 章4 构建流 里孩 固→+ tree_creditsav 色利 国 8 要构建流以创建模型,至少需要三个元素: ■一个从某些外部源读取数据的源节点,在本示例中为IBM SPSS Statistics数 据文件。 ■一个在运行流时生成模型块的建模节点。 在本例中,我们使用CHD建模节点。CHAID,或卡方自动交互效应检测,是一种通过使 用称作卡方统计量的特定统计类型识别决策树中的最优分割来构建决策树的分类方法。 该流中还包含“表”节点和“分析”节点,创建模型块并将其添加到流中后,将使 用这两个节点查看评分结果
24 章 4 构建流 图片 4-2 建模流 要构建流以创建模型,至少需要三个元素: 一个从某些外部源读取数据的源节点,在本示例中为 IBM® SPSS® Statistics 数 据文件。 一个指定字段属性的源节点或“类型”节点,字段属性包括测量级别(字段包含的 数据类型)以及每个字段在建模过程中的角色是目标还是输入等。 一个在运行流时生成模型块的建模节点。 在本例中,我们使用 CHAID 建模节点。CHAID,或卡方自动交互效应检测,是一种通过使 用称作卡方统计量的特定统计类型识别决策树中的最优分割来构建决策树的分类方法。 如果在源节点中指定了测量级别,则可以去掉单独的“类型”节点。从功能上来说,结 果是一样的。 该流中还包含“表”节点和“分析”节点,创建模型块并将其添加到流中后,将使 用这两个节点查看评分结果