当前位置：和泉文库 > 计算机 > 浏览文档

复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第4章 SPSS Modeler介绍

• IBM SPSS Modeler简介 • 建模组件介绍 – 数据预处理组件 – 数据挖掘建模组件 – 知识表示 • 建模流程 – 决策树分析

文件格式：PPTX，文件大小：4.8MB，售价：9.92元

文档详细内容（约47页）

数据集成组件汇总节点是对记录(行)进行操作的节点,作用是对各字段进行于> 加总、合计、取均值等操作,在处理汇总操作后可以增加新的字段,但是在汇总之前要对记录进行预处理,将缺失值进行处理, 否则对汇总结果造成影响,最终分析结论产生较大误差合并节点的作用是合并多个输入数据,并输出包含某些关键字段数据的输出。合并节点被广泛使用在不同数据源的合并和集成,避免重复数据。追加节点是将一个源中的数据传递到下游流程中,作用是连接各组记录,合并类似结构的数据,所以各源的字段类型需要致,即分类类别无法追加到连续字段中。如果是数据结构不同的数据集,则没太大作用

议程数据集成组件汇总节点是对记录（行）进行操作的节点，作用是对各字段进行加总、合计、取均值等操作，在处理汇总操作后可以增加新的字段，但是在汇总之前要对记录进行预处理，将缺失值进行处理，否则对汇总结果造成影响，最终分析结论产生较大误差。合并节点的作用是合并多个输入数据，并输出包含某些关键字段数据的输出。合并节点被广泛使用在不同数据源的合并和集成，避免重复数据。追加节点是将一个源中的数据传递到下游流程中，作用是连接各组记录，合并类似结构的数据，所以各源的字段类型需要一致，即分类类别无法追加到连续字段中。如果是数据结构不同的数据集，则没太大作用

数据选择组件数据选择得到数据集的简化表示。它可以用来得到数据集的简化表示,虽然数据容量上小得多,但是能够保持数据的完整性,规避数据冗余,并产生同样的分析效果

议程数据选择组件 • 数据选择得到数据集的简化表示。它可以用来得到数据集的简化表示，虽然数据容量上小得多，但是能够保持数据的完整性，规避数据冗余，并产生同样的分析效果

数据选择组件选择节点可以从一些数据库(或数据流)中,根据特定的某个条件,选择出一些符合特定要求的数据,独立地呈现在输出中。选择条件可以用CLEM进行指定,在窗口中可以输入函数来选择符合条件的数据。样本节点可对庞大的数据进行抽样,用于提高计算性能和选择对应数据进行专门地分析,以此提高效率。其优势是在条件允许的情况下,对抽样样本评估可以提髙运行效率;可以选择特定的记录或者交易组进行分析,例如,对偏离值分析,或者对购物车的分析;可以对指定数据或者观测值进行随机数据分析

议程数据选择组件选择节点可以从一些数据库（或数据流）中，根据特定的某个条件，选择出一些符合特定要求的数据，独立地呈现在输出中。选择条件可以用CLEM进行指定，在窗口中可以输入函数，来选择符合条件的数据。样本节点可对庞大的数据进行抽样，用于提高计算性能和选择对应数据进行专门地分析，以此提高效率。其优势是在条件允许的情况下，对抽样样本评估可以提高运行效率；可以选择特定的记录或者交易组进行分析，例如，对偏离值分析，或者对购物车的分析；可以对指定数据或者观测值进行随机数据分析

数据变换组件在数据预处理中,数据通常被变换或者统一格式,使挖掘过程耗费时间更短,更有效,更精确。通常,数据变换的方式有以下几种:光滑、构造特征、聚集、规范化、分门别类

议程数据变换组件 • 在数据预处理中，数据通常被变换或者统一格式，使挖掘过程耗费时间更短，更有效，更精确。通常，数据变换的方式有以下几种：光滑、构造特征、聚集、规范化、分门别类

数据变换组件类型节点是非常重要的节点,其作用是对指定的字段元数据和相应的属性进行更改,可以对数据的测量级别和属性,进行过滤、修改,此外还可以设置控制选项、字段建模、制定标签、指定值等平衡节点主要针对数据特别分散的数据,可以遵循指定的系数条件,调整数据不集中的比例。平衡是通过复制记录或随机删除的方法来实现的,所以每次运行其结果集并不固定。一般情况下要选中“仅平衡训练数据”,特别是在遇到不平衡检验或验证分区得分时,当然,如果流中不存在分区字段,则此选项无效

议程数据变换组件类型节点是非常重要的节点，其作用是对指定的字段元数据和相应的属性进行更改，可以对数据的测量级别和属性，进行过滤、修改，此外还可以设置控制选项、字段建模、制定标签、指定值等。平衡节点主要针对数据特别分散的数据，可以遵循指定的系数条件，调整数据不集中的比例。平衡是通过复制记录或随机删除的方法来实现的，所以每次运行其结果集并不固定。一般情况下要选中“仅平衡训练数据”，特别是在遇到不平衡检验或验证分区得分时，当然，如果流中不存在分区字段，则此选项无效

点击进入文档下载页（PPTX格式）

共47页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第3章可视化的分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第2章保险产品推荐（主讲：赵卫东）
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第1章数据分析过程的主要问题
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第11章卷积神经网络在音频质量评价领域的应用
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第10章基于逻辑回归模型的高危
中国科学院计算技术研究所：《高级人工智能》PPT课件_贝叶斯网络——概率推理（史忠植）
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）序列模式挖掘算法
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）密度聚类——算法详解
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）关联规则 CARMA Continuous Association Rule Mining Algorithm
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）09 搜索引擎优化 Search Engine Optimization
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）08 知识管理
复旦大学：《商务智能》课程PPT教学课件（商务数据分析）07 Web挖掘基础
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第5章香水销售分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第6章银行信用卡欺诈与拖欠行为分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第7章海底捞火锅运营分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第8章商务宾馆竞争分析
复旦大学：《数据挖掘实用案例分析》课程教学资源（PPT课件讲稿）第9章耐热导线工厂质量管理数据分析
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 01 An Overview of Business Intelligence, Analytics, and Decision Support
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 02 Data Warehousing
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 03 Business Reporting, Visual Analytics, and Business Performance Management
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 04 Data Mining
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 05 Text and Web Analytics
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 06 Big Data and Analytics
《商务智能：数据分析的管理视角 Business Intelligence, Analytics, and Data Science：A Managerial Perspective》教学资源（PPT课件，第3版）Chapter 07 Business Analytics：Emerging Trends and Future Impacts

点击购买下载（PPTX）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录