2.1 数据类型. 2 2.1.1 离散型数据.2 2.1.2 连续型数据.2 2.2 数据预处理. 2 2.2.1 数据预处理的原因.2 2.2.2 数据预处理的主要步骤.3 2.3 数据清理. 5 2.3.1 空缺值.5 2.3.2 噪声数据.5 2.4 数据集成. 7 2.4.1 实体识别问题.7 2.4.2 数据冗余.7 2.4.3 元组重复.8 2.5 数据归约. 8 2.5.1 数据立方体聚集.9 2.5.2 维归约.10 2.5.3 数量归约.11 2.5.4 数据压缩.12 2.6 数据变换. 12 2.6.1 数据规范化.12 2.6.2 数据离散化与概念分层.13 2.7 数据预处理的软件操作(SPSS Modeler). 16 2.7.1 数据类型.16 2.7.2 数据清理.17 (1)缺失值与无效值.17 (2)孤立值和极值.22 2.7.3 数据集成.25 (1)纵向追加.25 (2)横向合并.26 (3)元组重复.28 2.7.4 数据归约.29 (1)抽样.29 (2)分箱.32 (3)特征选择.36 (4)因子分析.37 2.7.5 数据变换.40
文件格式: PDF大小: 496.04KB页数: 6
1.1 什么是数据挖掘. 2 1.2 数据挖掘的步骤. 2 1.3 数据挖掘的主要功能. 4 1.3.1 预测性.4 1.3.2 描述性.5 1.4 在何种数据上进行数据挖掘. 7 1.4.1 数据库数据.7 1.4.2 数据仓库.8 1.4.3 事务数据.8 1.5 数据挖掘的工具. 8 1.6 数据挖掘研究的主要方向. 9 1.6.1 数据挖掘的方法.9 1.6.2 用户交互技术.9 1.6.3 数据挖掘的性能和可扩展性.9 1.6.4 针对不同数据或数据源的数据挖掘技术 .9 1.7 数据挖掘的应用领域. 10 1.8 SPSS Modeler 软件使用概述. 10 1.8.1 软件简介.10 1.8.2 软件窗口.12 1.8.3 数据流的基本操作.13
文件格式: PDF大小: 831.52KB页数: 8
《线性代数》课程教学资源(PPT课件)第四章 向量组的线性相关性 4-5 线性方程组的解的结构
文件格式: PPTX大小: 1.85MB页数: 49
《线性代数》课程教学资源(PPT课件)第四章 向量组的线性相关性 4-4 向量空间
文件格式: PPTX大小: 1.52MB页数: 21
《线性代数》课程教学资源(PPT课件)第四章 向量组的线性相关性 4-3 向量组的秩
文件格式: PPTX大小: 1.61MB页数: 29
《线性代数》课程教学资源(PPT课件)第四章 向量组的线性相关性 4-2 向量组的线性相关性
文件格式: PPTX大小: 1.67MB页数: 34
《线性代数》课程教学资源(PPT课件)第四章 向量组的线性相关性 4-1 n维向量
文件格式: PPTX大小: 1.41MB页数: 13
《线性代数》课程教学资源(PPT课件)第五章 相似矩阵及二次型 5-7 正定二次型
文件格式: PPTX大小: 1.43MB页数: 14
《线性代数》课程教学资源(PPT课件)第五章 相似矩阵及二次型 5-6 用配方法化二次型成标准形
文件格式: PPTX大小: 1.42MB页数: 13
《线性代数》课程教学资源(PPT课件)第五章 相似矩阵及二次型 5-5 二次型及其标准形
文件格式: PPTX大小: 1.64MB页数: 27
©2026 mall.hezhiquan.com 和泉文库
帮助反馈侵权