当前位置：和泉文库 > 计算机 > 浏览文档

浙江大学：《数据挖掘》课程电子教案（PPT教学课件）期末复习

第一章、数据挖掘概论数据挖掘:数据库中的知识挖掘(KDD)

文件格式：PPT，文件大小：211.5KB，售价：18.61元

文档详细内容（约73页）

多维数据模型上的OLAP操作上卷(roup):汇总数据口通过一个维的概念分层向上攀升或者通过维规约下钻(dr"-down):上卷的逆操作口由不太详细的数据到更详细的数据,可以通过沿维的概念分层向下或引入新的维采实切片和切块s| lice and dice) ¤投影和选择操作转轴( pivot 口立方体的重定位,可视化,或将一个3维立方体转化维一个2维平面序列其他OLAP操作口钻过( drill across):执行涉及多个事实表的查询口钻透( drill through):使用关系SQL机制,钻到数据立方体的底层, 到后端关系表

多维数据模型上的OLAP操作 ◼ 上卷(roll-up):汇总数据 ❑ 通过一个维的概念分层向上攀升或者通过维规约 ◼ 下钻(drill-down)：上卷的逆操作 ❑ 由不太详细的数据到更详细的数据，可以通过沿维的概念分层向下或引入新的维来实现 ◼ 切片和切块(slice and dice) ❑ 投影和选择操作 ◼ 转轴(pivot) ❑ 立方体的重定位，可视化，或将一个3维立方体转化维一个2维平面序列 ◼ 其他OLAP操作 ❑ 钻过(drill_across)：执行涉及多个事实表的查询 ❑ 钻透(drill_through)：使用关系SQL机制，钻到数据立方体的底层，到后端关系表

数据仓库设计的四种视图数据仓库设计的四种视图 a自顶向下视图允许我们选择数据仓库所需的相关信息口数据源视图 ■揭示被操作数据库系统所捕获、存储和管理的信息 a数据仓库视图有事实表和维表所组成口商务查询视图从最终用户的角度透视数据仓库中的数据

数据仓库设计的四种视图 ◼ 数据仓库设计的四种视图 ❑ 自顶向下视图 ◼ 允许我们选择数据仓库所需的相关信息 ❑ 数据源视图 ◼ 揭示被操作数据库系统所捕获、存储和管理的信息 ❑ 数据仓库视图 ◼ 有事实表和维表所组成 ❑ 商务查询视图 ◼ 从最终用户的角度透视数据仓库中的数据

三种数据仓库模型企业仓库 ¤搜集关于跨越整个组织的主题的所有信息数据集市口企业范围数据的一个子集,对于特定的客户是有用的。其范围限于选定的主题,比如一个商场的数据集市独立的数据集市VS.非独立的数据集市(数据来自于企业数据仓库) 虚拟仓库 ¤操作数据库上的一系列视图 a只有一些可能的汇总视图被物化

三种数据仓库模型 ◼ 企业仓库 ❑ 搜集关于跨越整个组织的主题的所有信息 ◼ 数据集市 ❑ 企业范围数据的一个子集，对于特定的客户是有用的。其范围限于选定的主题，比如一个商场的数据集市 ◼ 独立的数据集市 VS. 非独立的数据集市（数据来自于企业数据仓库） ◼ 虚拟仓库 ❑ 操作数据库上的一系列视图 ❑ 只有一些可能的汇总视图被物化

OLAP服务器类型逻辑上,OLAP服务器从数据仓库或数据集市中给商业用户提供多维数据物理上,OLAP的底层数据存储实现可以有多种不同的方式口关系OLAP服务器( ROLAP) 使用关系数据库或扩展的关系数据库存放并管理数据仓库的数据,而用OLAP中间件支持其余部分包括每个DBMS后端优化,聚集导航逻辑的实现,附加的工具和服务较大的可扩展性口多维OLAP服务器 MOLAP) 基于数组的多维存储引擎(稀疏矩阵技术) 能对预计算的汇总数据快速索引口混合OLAP服务器( HOLAP) 结合上述两种技术,更大的使用灵活性口特殊的SQL服务器在星型和雪花模型上支持SQL査询

OLAP服务器类型 ◼ 逻辑上，OLAP服务器从数据仓库或数据集市中给商业用户提供多维数据 ◼ 物理上，OLAP的底层数据存储实现可以有多种不同的方式 ❑ 关系OLAP服务器(ROLAP) ◼ 使用关系数据库或扩展的关系数据库存放并管理数据仓库的数据，而用OLAP中间件支持其余部分 ◼ 包括每个DBMS后端优化，聚集导航逻辑的实现，附加的工具和服务 ◼ 较大的可扩展性 ❑ 多维OLAP服务器(MOLAP) ◼ 基于数组的多维存储引擎（稀疏矩阵技术） ◼ 能对预计算的汇总数据快速索引 ❑ 混合OLAP服务器(HOLAP) ◼ 结合上述两种技术，更大的使用灵活性 ❑ 特殊的SQL服务器 ◼ 在星型和雪花模型上支持SQL查询

方体计算的多路数组聚集方法(1) 将数组分成块( chunk,一个可以装入内存的小子方) 压缩的稀疏数组寻址:( chunk id,ofet) 通过访问立方体单元,计算聚集。可以优化访问单元组的次序, 使得每个单元被访问的次数最小化,从而减少内存访问和磁盘O 的开销。 Cites e C245246448 13141516 哪个是多路数组 6 聚集的最佳遍历 b2 B(city b 951 次序? 2 4 ao al 2 3 a(month)

方体计算的多路数组聚集方法(1) ◼ 将数组分成块（chunk,一个可以装入内存的小子方） ◼ 压缩的稀疏数组寻址：(chunk_id, offset) ◼ 通过访问立方体单元，计算聚集。可以优化访问单元组的次序，使得每个单元被访问的次数最小化，从而减少内存访问和磁盘I/O 的开销。 A(month) B 29 30 31 32 1 2 3 4 5 9 13 14 15 16 61 62 63 64 45 46 47 48 a0 a1 c3 c2 c1 c 0 b3 b2 b1 b0 a2 a3 C(item) B(city) 44 28 56 40 24 52 36 20 60 哪个是多路数组聚集的最佳遍历次序？

点击进入文档下载页（PPT格式）

共73页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第八章聚类分析
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第六章大型数据库中的关联规则挖掘
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第10章 applet和高级图形界面
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第9章创建用户界面
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第三篇图形程序设计第8章图形程序设计入门
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第二篇面向对象程序设计第7章数组和向量
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第二篇面向对象程序设计第6章类的继承性
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第二篇面向对象程序设计第5章使用对象和类编写程序
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第4章方法
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第3章控制语句
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第2章基本数据类型和基本操作
大连理工大学：《Java语言程序设计》课程电子教案（讲稿）第一篇程序设计基础第1章 Java入门（主讲：赵铭伟）
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第九章电子商务与数据挖掘
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第七章分类和预测
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第一章序论（主讲教师：王灿）
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第二章数据仓库和数据挖掘的OLAP技术
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第三章数据预处理
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第四章数据挖掘原语、语言和系统结构
浙江大学：《数据挖掘》课程电子教案（PPT教学课件）第五章概念描述：特征化与比较
《网页制作宝典》第1章网页制作初识
《网页制作宝典》第10章 JavaScriptDHTML和技术
《网页制作宝典》第11章示例网页利用ASP实现交互功能
《网页制作宝典》第12章利用ADO实现网页与数据库的链接
《网页制作宝典》第2章创建站点

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录