数据挖掘——期末复习
数据挖掘——期末复习
第一章、数据挖掘概论
第一章、数据挖掘概论
数据挖掘:数据库中的知识挖掘(KDD) 口数据挖掘——知识挖掘 模式评估 的核心 数据挖掘 任务相关数据 数据仓库 选择 数据清理 数据集成 数据库
数据挖掘: 数据库中的知识挖掘(KDD) ❑ 数据挖掘——知识挖掘 的核心 数据清理 数据集成 数据库 数据仓库 任务相关数据 选择 数据挖掘 模式评估
知识挖掘的步骤 了解应用领域 口了解相关的知识和应用的目标 创建目标数据集:选择数据 数据清理和预处理:(这个可能要占全过程60%的工作量) 数据缩减和变换 ¤找到有用的特征,维数缩减/变量缩减,不变量的表示。 ■选择数据挖掘的功能 ¤数据总结,分类模型数据挖掘,回归分析,关联规则挖掘,聚类分析 等 选择挖掘算法 数据挖掘:寻找感兴趣的模式 模式评估和知识表示 口可视化,转换,消除冗余模式等等 运用发现的知识
知识挖掘的步骤 ◼ 了解应用领域 ❑ 了解相关的知识和应用的目标 ◼ 创建目标数据集: 选择数据 ◼ 数据清理和预处理: (这个可能要占全过程60%的工作量) ◼ 数据缩减和变换 ❑ 找到有用的特征,维数缩减/变量缩减,不变量的表示。 ◼ 选择数据挖掘的功能 ❑ 数据总结, 分类模型数据挖掘, 回归分析, 关联规则挖掘, 聚类分析 等. ◼ 选择挖掘算法 ◼ 数据挖掘: 寻找感兴趣的模式 ◼ 模式评估和知识表示 ❑ 可视化,转换,消除冗余模式等等 ◼ 运用发现的知识
体系结构:典型数据挖掘系统 图形用户界面 模式评估 数据挖掘引擎 知识库 数据库或数据仓库服务器 数据清洗 数据集成 过滤 数据库 数据仓库
体系结构:典型数据挖掘系统 数据仓库 数据清洗 过滤 数据库 数据库或数据仓库服务器 数据挖掘引擎 模式评估 图形用户界面 知识库 数据集成