当前位置：和泉文库 > 计算机 > 浏览文档

浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第五章概念描述：特征化与比较

从数据分析的角度看,数据挖掘可以分为描述性挖掘和预测性挖掘描述性挖掘:以简洁概要的方式描述数据,并提供数据的有趣的一般性质。预测性数据挖掘:通过分析数据建立一个或一组模型,并试图预测新数据集的行为。

文件格式：PPT，文件大小：917.5KB，售价：16.13元

文档详细内容（约62页）

数据概化:数据立方体方法执行计算并将结果存储在数据立方体中优点: 口数据概化的一种有效实现口可以计算各种不同的度量值比如: count),sum(, average(0,max() 口概化和特惩分析通过一系列的数据立方体操作完成,比如上 ■缺点 °毋署蒜整蘖桊的醌宮筆萋獒墊翟星犧您分套 ¤缺乏智能分析,不能自动确定分析中该使用哪些维,应该概化到哪个层次

数据概化：数据立方体方法 ◼ 执行计算并将结果存储在数据立方体中 ◼ 优点： ❑ 数据概化的一种有效实现 ❑ 可以计算各种不同的度量值 ◼ 比如：count(), sum(), average(), max() ❑ 概化和特征分析通过一系列的数据立方体操作完成，比如上卷、下钻等 ◼ 缺点 ❑ 只能处理非数值类型的维和简单聚集数值类型的度量值（大部分现有商业系统中，只能为非数值类型的维产生概念分层） ❑ 缺乏智能分析，不能自动确定分析中该使用哪些维，应该概化到哪个层次

面向属性的归纳种面向关系数据查询的、基于汇总的在线数据分析技术。受数据类型和度量类型的约束比较少 ■面向属性归纳的基本思想: ¤使用关系数据库査询收集任务相关的数据 ¤通过考察任务相关数据中每个属性的不同值的个数进行概化, 方法是属性删除或者是属性概化 ¤通过合并相等的,概化的广义元组,并累计他们对应的计数值进行聚集操作 a通过与用户交互,将广义关系以图表或规则等形式,提交给用户

面向属性的归纳 ◼ 一种面向关系数据查询的、基于汇总的在线数据分析技术。 ◼ 受数据类型和度量类型的约束比较少 ◼ 面向属性归纳的基本思想： ❑ 使用关系数据库查询收集任务相关的数据 ❑ 通过考察任务相关数据中每个属性的不同值的个数进行概化，方法是属性删除或者是属性概化 ❑ 通过合并相等的，概化的广义元组，并累计他们对应的计数值进行聚集操作 ❑ 通过与用户交互，将广义关系以图表或规则等形式，提交给用户

面向属性的归纳的基本步骤数据聚焦,获得初始工作关系进行面向属性的归纳口基本操作是数据概化,对有大量不同值的属性,进行进一步概化 ■属性删除 ■属性概化 ¤属性概化控制:控制概化过程,确定有多少不同的值才算是有大量不同值的属性属性概化临界值控制概化关系临界值控制

面向属性的归纳的基本步骤 ◼ 数据聚焦，获得初始工作关系 ◼ 进行面向属性的归纳 ❑ 基本操作是数据概化，对有大量不同值的属性，进行进一步概化 ◼ 属性删除 ◼ 属性概化 ❑ 属性概化控制：控制概化过程，确定有多少不同的值才算是有大量不同值的属性 ◼ 属性概化临界值控制 ◼ 概化关系临界值控制

数据聚焦(1) 目的是获得跟任务相关的数据集,包括属性或维,在 DMQL中他们由 in relevance to子句表示示例口DMQL:描述Big- Universit!y数据库中研笼生的一般特征 use Big University DB mine charas七eris七 ics as science students" in relevance to name, gender, major, birth place r birth date, residence, phone#, gpa from studen七 where status in graduate

数据聚焦（1） ◼ 目的是获得跟任务相关的数据集，包括属性或维，在 DMQL中他们由in relevance to子句表示。 ◼ 示例： ❑ DMQL: 描述Big-University数据库中研究生的一般特征 use Big_University_DB mine characteristics as “Science_Students” in relevance to name, gender, major, birth_place, birth_date, residence, phone#, gpa from student where status in “graduate

数据聚焦(2) ¤将数据挖掘査询转换为关系查询 Select name, gender, major, birth place r birth date, residence, phone#, gpa from student where status in (Msc,"MBA"PhD"] 数据聚焦时的困难口用户在指定相关的数据集方面存在困难,遗漏在描述中可能起作用的属性口用户可能引进太多的属性

数据聚焦（2） ❑ 将数据挖掘查询转换为关系查询 Select name, gender, major, birth_place, birth_date, residence, phone#, gpa from student where status in {“Msc”, “MBA”, “PhD” } ◼ 数据聚焦时的困难 ❑ 用户在指定相关的数据集方面存在困难，遗漏在描述中可能起作用的属性 ❑ 用户可能引进太多的属性

点击进入文档下载页（PPT格式）

共62页，可试读20页，点击继续阅读 ↓↓

您可能感兴趣的文档

浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第四章数据挖掘原语、语言和系统结构
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第三章数据预处理
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第二章数据仓库和数据挖掘的OLAP技术
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第一章序论（主讲教师：王灿）
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第七章分类和预测
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第九章电子商务与数据挖掘
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）期末复习
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第八章聚类分析
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第六章大型数据库中的关联规则挖掘
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第10章 applet和高级图形界面
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第9章创建用户界面
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第8章图形程序设计入门
《网页制作宝典》第1章网页制作初识
《网页制作宝典》第10章 JavaScriptDHTML和技术
《网页制作宝典》第11章示例网页利用ASP实现交互功能
《网页制作宝典》第12章利用ADO实现网页与数据库的链接
《网页制作宝典》第2章创建站点
《网页制作宝典》第3章网页文本的处理
《网页制作宝典》第4章网页表格的处理
《网页制作宝典》第5章网页框架的处理
《网页制作宝典》第6章网页图像处理
《网页制作宝典》第7章在网页中使用超链接
《网页制作宝典》第8章网页表单的处理
《网页制作宝典》第9章美化网页

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录