当前位置：和泉文库 > 计算机 > 浏览文档

《数据把掘概念与技术》第八章(8-6) 多维关联规则挖掘

多维事务数据库DB的结构为 (ID,AA2,, Anitems),A是DB中的结构化属性(例如顾客的年龄,职业收入等),而 items是同事务连接的项的集合(例如购物篮中频繁项集)。每一个 t=(id,aa 2..2 items-t)由两部分信息组成: 维信息(a1,a2man)项集信息。挖掘过程分为两部分:挖掘维度信息的模式和从投影的子DB中找出频繁项集。

文件格式：PPT，文件大小：189.5KB，售价：8.97元

文档详细内容（约31页）

8.6多维关联规则挖掘多维事务数据库DB的结构为 ( ID,ALA2y.Anuitems),A是DB中的结构化属性(例如顾客的年龄,职业收入等),而 tems是同事务连接的项的集合(例如购物篮中频繁项集)。每 t=(daa2/… an/items+由两部分信息组成维信息(a1a2,n和项集信息。挖掘过程分为两部分挖掘维度信息的模式和从投影的子DB中找出频繁项集

8.6 多维关联规则挖掘 ◼ 多维事务数据库DB的结构为 (ID,A1 ,A2 ,…,An ,items) ，Ai是DB中的结构化属性(例如顾客的年龄,职业,收入等)，而 items是同事务连接的项的集合(例如购物篮中频繁项集)。每一个 t=(id,a1 ,a2 ,…,an ,items-t)由两部分信息组成：维信息(a1 ,a2 ,…,an )和项集信息。 ◼ 挖掘过程分为两部分：挖掘维度信息的模式和从投影的子DB中找出频繁项集

例如,事务DB如表8-3所示。表8-3多维事务数据库DB D A1 A1 itel 01 YZ n Z W X.Z.W 04 c XY 首先找出频繁多维值的组合,然后寻找DB 中相应的频篆项集。设支持度阈值为2,即属性值的组合出现两次或两次以上为频繁项集,称为多维模式或叫做MD模式

◼ 例如，事务DB如表8-3所示。 ◼ 首先找出频繁多维值的组合，然后寻找DB 中相应的频繁项集。设支持度阈值为2，即属性值的组合出现两次或两次以上为频繁项集，称为多维模式或叫做MD-模式

要挖掘MD模式时,可以使用最早由beye和 Ramakrishnan(它是个有效的“冰山立方体”,见下图)开发的改进BUC算法。 0D(顶点)方体 1-D方体 2D方体 (age, income (a ncome, buys 3-D(基本)方体图6-17方体的格形成3D数据立方体(每个方体代表一个不同分组,基本方体包含三个谓词age, income和 buys)

◼ 要挖掘MD-模式时，可以使用最早由beyer和Ｒamakrishnan(它是个有效的“冰山立方体”，见下图)开发的改进BUC算法

BUC算法的基本步骤如下:首先,在第—维 (A1)中按值的字母顺序将每个项进行排序。 1在该维中仅有的MD模式为(a,米,*),因为只有a值的支持度大于2。其它维的值()在第一步不相关,可取任意值。在DB中选择那些具有MD模式的项。即T01 和03事务。针对第二维(A2)值1和2,对简化的DB进行再一次排序。没有符合支持度的模式,所以不存在A1和A2值的MD模式。因此可忽略A2

◼ BUC算法的基本步骤如下:首先，在第一维 (A1)中按值的字母顺序将每个项进行排序。 1.在该维中仅有的MD-模式为(a,*,*)，因为只有a值的支持度大于2。其它维的值(*)在第一步不相关，可取任意值。在DB中选择那些具有MD-模式的项。即T01 和T03事务。针对第二维(A2),值1和2,对简化的DB进行再一次排序。没有符合支持度的模式，所以不存在A1和A2值的MD-模式。因此可忽略A2

在第三维(A3)中按字母顺序进行排序。子集 (a*,m)出现两次,因此它是一个MD模式。 2.重复步骤1的过程:只从A2开始,不需要搜索第一维。第二次迭代从A2开始,MD模式为(*,2* 针对A3,不存在其它MD模式。最后一次迭代,从A3开始,(**m为MD模式

在第三维(A3)中按字母顺序进行排序。子集 (a,*,m)出现两次，因此它是一个MD-模式。 2.重复步骤1的过程：只从A2开始，不需要搜索第一维。第二次迭代从A2开始，MD-模式为(*,2,*), 针对A3，不存在其它MD-模式。最后一次迭代，从A3开始，(*,*,m)为MD-模式

点击进入文档下载页（PPT格式）

共31页，可试读12页，点击继续阅读 ↓↓

您可能感兴趣的文档

《数据把掘概念与技术》第八章(8-6) 多维关联规则挖掘
《数据把掘概念与技术》第八章（8-1）购物篮分析
《数据把掘概念与技术》第五章（5-5）方差分析
《数据把掘概念与技术》第五章（5-1）统计推断
《数据把掘概念与技术》第二章数据准备
《数据把掘概念与技术》第三章数据归约
《数据把掘概念与技术》第七章决策树和决策规则
《数据把掘概念与技术》第七章（7-4）修剪决策树
《数据把掘概念与技术》第一章数据挖掘的概念
《数据把掘概念与技术》第九章根据内容检索
《数据把掘概念与技术》第九章（9-3）文本检索
广东白云学院：《单片机原理与应用》教学大纲
《数据把掘概念与技术》第六章（6-1）聚类概念
《数据把掘概念与技术》第六章(6-3) 凝聚层次聚类
《数据把掘概念与技术》第四章从数据中学习
万博科技职业学院：《Visual Basic程序设计》第一章概论
万博科技职业学院：《Visual Basic程序设计》第三章 BASIC语言基础
万博科技职业学院：《Visual Basic程序设计》第五章选择结构设计
万博科技职业学院：《Visual Basic程序设计》第四章程序的输入和输出
万博科技职业学院：《Visual Basic程序设计》第十章菜单和工具栏
万博科技职业学院：《Visual Basic程序设计》第八章过程一子程序和函数
万博科技职业学院：《Visual Basic程序设计》第六章循环程序结构
万博科技职业学院：《Visual Basic程序设计》第九章对话框
万博科技职业学院：《Visual Basic程序设计》第七章数组

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录