当前位置：和泉文库 > 计算机 > 浏览文档

浙江大学：《数据挖掘》课程电子教案（PPT教学课件）期末复习

第一章、数据挖掘概论数据挖掘:数据库中的知识挖掘(KDD)

文件格式：PPT，文件大小：211.5KB，售价：18.61元

文档详细内容（约73页）

数据仓库与异种数据库集成传统的异种数据库集成: 口在多个异种数据库上建立包装程序( wrappers)和中介程序 (mediators 口查询驱动方法——当从客户端传过来一个查询时,首先使用元数据字典将查询转换成相应异种数据库上的查询;然后, 将这些查询映射和发送到局部查询处理器口缺点:复杂的信息过虑和集成处理,竞争资源 ■数据仓库:更新驱动口将来自多个异种源的信息预先集成,并存储在数据仓库中供直接查询和分析高性能

数据仓库与异种数据库集成 ◼ 传统的异种数据库集成: ❑ 在多个异种数据库上建立包装程序（wrappers）和中介程序（mediators ） ❑ 查询驱动方法——当从客户端传过来一个查询时，首先使用元数据字典将查询转换成相应异种数据库上的查询；然后，将这些查询映射和发送到局部查询处理器 ❑ 缺点：复杂的信息过虑和集成处理，竞争资源 ◼ 数据仓库: 更新驱动 ❑ 将来自多个异种源的信息预先集成，并存储在数据仓库中，供直接查询和分析 ❑ 高性能

OLTP系统和OLAP系统的比较特征 OLTP OLAP 任务特点操作处理信息处理面向事务分析用户办事员、DBA、数据库专业人员经理、主管、数据分析员功能日常操作长期信息分析、决策支持 DB设计基于ER,面向应用星型雪花,面向主体数据最新的、详细的历史的、汇总的视图详细的、二维关系型汇总的、多维的任务单位简短的事务复杂的查询访问数据量数十个数百万个用户数数千个数百个 DB规模 100M-数GB 100GB-数TB 优先性高性能、高可用性高灵活性、端点用户自治度量事务吞吐量查询吞吐量、响应时间

OLTP系统和OLAP系统的比较特征 OLTP OLAP 任务特点操作处理信息处理面向事务分析用户办事员、DBA、数据库专业人员经理、主管、数据分析员功能日常操作长期信息分析、决策支持 DB设计基于E-R，面向应用星型/雪花，面向主体数据最新的、详细的历史的、汇总的视图详细的、二维关系型汇总的、多维的任务单位简短的事务复杂的查询访问数据量数十个数百万个用户数数千个数百个 DB规模 100M-数GB 100GB-数TB 优先性高性能、高可用性高灵活性、端点用户自治度量事务吞吐量查询吞吐量、响应时间

从关系表和电子表格到数据立方体 ■数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看作是数据立方体形式。多维数据模型围绕中心主题组织,该主题用享实表表示。享实是数值度量的数据立方体允许以多维数据建模和观察。它由维和事实定义维是关于一个组织想要记录的视角或观点。每个维都有一个表与之相关联,称为维表。享实表包括事实的名称或度量以及每个相关维表的关键字在数据仓库的研究文献中,一个n维的数据的立方体叫做基本方体。给定一个维的集合,我们可以构造一个方体的格,每个都在不同的汇总级或不同的数据子集显示数据,方体的格称为数据立方体。 0维方体存放最高层的汇总,称作顶点方体;而存放最底层汇总的方体则称为基本方体

从关系表和电子表格到数据立方体 ◼ 数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看作是数据立方体形式。多维数据模型围绕中心主题组织，该主题用事实表表示。事实是数值度量的。 ◼ 数据立方体允许以多维数据建模和观察。它由维和事实定义。 ◼ 维是关于一个组织想要记录的视角或观点。每个维都有一个表与之相关联，称为维表。 ◼ 事实表包括事实的名称或度量以及每个相关维表的关键字 ◼ 在数据仓库的研究文献中，一个n维的数据的立方体叫做基本方体。给定一个维的集合，我们可以构造一个方体的格，每个都在不同的汇总级或不同的数据子集显示数据，方体的格称为数据立方体。 0维方体存放最高层的汇总，称作顶点方体；而存放最底层汇总的方体则称为基本方体

度量的分类个数据立方体的度量是一个数值函数,该函数可以对数据立方体的每一个点求值。度量可以根据其所用的聚集函数分为三类: a分布的( distributive):将函数用于n个聚集值得到的结果和将函数用于所有数据得到的结果一样。比如: count0,sum(),min0,max)等口代数的( algebraic):函数可以由一个带M个参数的代数函数计算(M为有界整数),而每个参数值都可以有一个分布的聚集函数求得比如:avg0,minN(O, standard deviation0 口整体的( holistic):描述函数的子聚集所需的存储没有一个常数界比如: median0,mode0,rank0

度量的分类 ◼ 一个数据立方体的度量是一个数值函数，该函数可以对数据立方体的每一个点求值。度量可以根据其所用的聚集函数分为三类： ❑ 分布的(distributive)：将函数用于n个聚集值得到的结果和将函数用于所有数据得到的结果一样。 ◼ 比如：count()，sum()，min()，max()等 ❑ 代数的(algebraic)：函数可以由一个带M个参数的代数函数计算（M为有界整数），而每个参数值都可以有一个分布的聚集函数求得。 ◼ 比如：avg()，min_N()，standard_deviation() ❑ 整体的(holistic)：描述函数的子聚集所需的存储没有一个常数界。 ◼ 比如：median()，mode()，rank()

概念分层: location维的一个概念分层 a region Europe North america country Germany ain anada Mexico city Frankfurt Vancouver Toronto office L Chan.. M. Wind

概念分层：location维的一个概念分层 all Europe North_America Germany Spain Canada Mexico Vancouver L. Chan M. Wind ... ... ... ... ... ... all region office country city Frankfurt Toronto

点击进入文档下载页（PPT格式）

共73页，可试读20页，点击继续阅读 ↓↓

您可能感兴趣的文档

浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第八章聚类分析
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第六章大型数据库中的关联规则挖掘
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第10章 applet和高级图形界面
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第9章创建用户界面
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第8章图形程序设计入门
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第二篇面向对象程序设计第7章数组和向量
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第二篇面向对象程序设计第6章类的继承性
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第二篇面向对象程序设计第5章使用对象和类编写程序
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第4章方法
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第3章控制语句
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第2章基本数据类型和基本操作
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第1章 Java入门（主讲：赵铭伟）
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第九章电子商务与数据挖掘
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第七章分类和预测
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第一章序论（主讲教师：王灿）
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第二章数据仓库和数据挖掘的OLAP技术
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第三章数据预处理
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第四章数据挖掘原语、语言和系统结构
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第五章概念描述：特征化与比较
《网页制作宝典》第1章网页制作初识
《网页制作宝典》第10章 JavaScriptDHTML和技术
《网页制作宝典》第11章示例网页利用ASP实现交互功能
《网页制作宝典》第12章利用ADO实现网页与数据库的链接
《网页制作宝典》第2章创建站点

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录