当前位置：和泉文库 > 计算机 > 浏览文档

重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 5 Mining Frequent Patterns, Association and Correlations：Basic Concepts and Methods

◼ Basic Concepts ◼ Frequent Itemset Mining Methods ◼ Which Patterns Are Interesting?—Pattern Evaluation Methods ◼ Summary

文件格式：PPT，文件大小：2.07MB，售价：20.74元

共78页，可试读20页，点击往前阅读 ↑↑

文档详细内容（约78页）

从高频集导出关联规则 R1:烤鸭-->面饼、面酱。S=40%,C=66.6% 解释:买烤鸭的顾客占3/5,买了烤鸭又同时买了 {面饼,面酱}顾客占2/5,说明在买烤鸭的人当中又买了{面饼、面酱}的占{(2/5)/(3/5)}=666% 按朴素的,但不一定总是正确的看法,把买烤鸭视为原因,右边的买{面饼、面酱}的视为结果,现有数据表明,这种因果关系有666%的正确性(不是想当然拍脑袋得出的神仙数字)

从高频集导出关联规则 ◼ R1：烤鸭 --> 面饼、面酱。S=40%，c=66.6% ◼ 解释：买烤鸭的顾客占3/5，买了烤鸭又同时买了 {面饼，面酱} 顾客占2/5，说明在买烤鸭的人当中又买了{面饼、面酱}的占{(2/5) / (3/5) }=66.6% ◼ 按朴素的，但不一定总是正确的看法，把买烤鸭视为原因，右边的买{面饼、面酱}的视为结果，现有数据表明，这种因果关系有66.6%的正确性（不是想当然拍脑袋得出的神仙数字）。 16

■R1:烤鸭->面饼、面酱。S=40%,C=66.6% ■R2:面饼->烤鸭、面酱,s=40%,C=66.6% ■R3:面酱->面饼、烤鸭,s=40%,C=50% 而这些规则的运用之妙成乎于人,例如用R1,将烤鸭降价以促销面饼、面酱,很可能会破产(一等置信度,导致了破产); ■用R2将面饼降价,以促销烤鸭,可能会发财 (一等置信度,导致了发财) ■用R3,引不起顾客的热情。 ■可见,真理(知识)藏在数据中,还要人去去伪存真 17

◼ R1：烤鸭 --> 面饼、面酱。S=40%，c=66.6% ◼ R2：面饼 --> 烤鸭、面酱，s=40%，c=66.6% ◼ R3：面酱 --> 面饼、烤鸭，s=40%，c=50% ◼ 而这些规则的运用之妙成乎于人，例如∶ ◼ 用R1，将烤鸭降价以促销面饼、面酱，很可能会破产（一等置信度，导致了破产）； ◼ 用R2 将面饼降价，以促销烤鸭，可能会发财；（一等置信度，导致了发财）； ◼ 用R3，引不起顾客的热情。 ◼ 可见，真理（知识）藏在数据中，还要人去去伪存真。 17

挖掘关联规则实际过程,易见分两大步 ■(a)筛出高频集。给定支持度阈值t,模仿选举的“唱票-计票”把频率高于t的单项集,双项集,…K项集找出来,这一步至少扫描数据库K遍, 而且,多项集之组合数量很大,比较费时间。计算置信度,比较简单,左边的支持度做分母, 两边合起来的的支持度做分子。 ■在第一步中,当商品总数T比较大,例如实际大超市中,例如T>105,欲考察K项商品之间关联, 啗K比较大,例如K>10时,涉及到组合爆炸,也许, 用高档计算机也需要若干天,若干月,用行话描述, 朴素方法的 Scalar|ity不好

挖掘关联规则实际过程，易见分两大步 ◼ (a) 筛出高频集。给定支持度阈值t ,模仿选举的“唱票-计票”把频率高于t的单项集，双项集，…,K项集找出来，这一步至少扫描数据库K遍，而且，多项集之组合数量很大，比较费时间。 ◼ 计算置信度，比较简单，左边的支持度做分母，两边合起来的的支持度做分子。 ◼ 在第一步中，当商品总数T比较大，例如实际大超市中，例如T>105 , 欲考察K项商品之间关联，当K比较大，例如K>10时，涉及到组合爆炸，也许，用高档计算机也需要若干天，若干月，用行话描述，朴素方法的 Scalability不好。 18

Aprior构造性命题 (k+1)项的高频集一定可以用其两个k项的高频子集连接而成。 ■{烤鸭,面饼,面酱}是高频集,用JOIN表示数据库中的连接运算,则这个三项集可用两个双项(高频) 集连接而成: ■{烤鸭,面饼}JoIN{面饼,面酱}=={烤鸭,面饼,面酱} (k+1)项的高频集有(k+1)个k项子集(且都是高频的),容易找到其中的两个,使他们有K-1项相同, 连接即可

Aprior构造性命题： ◼ （k+1）项的高频集一定可以用其两个k项的高频子集连接而成。 ◼ {烤鸭，面饼，面酱} 是高频集，用 JOIN 表示数据库中的连接运算，则这个三项集可用两个双项（高频）集连接而成： ◼ {烤鸭，面饼} JOIN {面饼，面酱} == {烤鸭，面饼，面酱} ◼ （k+1）项的高频集有（k+1）个k项子集（且都是高频的），容易找到其中的两个，使他们有K-1项相同，连接即可。 19

Scalable Frequent Itemset Mining Methods Apriori: A Candidate generation-and-Test Approach Improving the Efficiency of Apriori FPGrowth: A Frequent Pattern-Growth approach ECLAT: Frequent Pattern Mining with vertical Data Format

20 Scalable Frequent Itemset Mining Methods ◼ Apriori: A Candidate Generation-and-Test Approach ◼ Improving the Efficiency of Apriori ◼ FPGrowth: A Frequent Pattern-Growth Approach ◼ ECLAT: Frequent Pattern Mining with Vertical Data Format

点击进入文档下载页（PPT格式）

共78页，试读已结束，阅读完整版请下载

您可能感兴趣的文档

重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 4 OLAP - Data Warehousing and On-line Analytical Processing
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 3 Data Preprocessing
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 2 about data - Getting to Know Your Data
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 1 introduction
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第7章机器人规划
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第6章机器学习
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第5章搜索策略
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第4章智能计算（计算智能）
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第3章推理技术
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_第2章知识表示
重庆师范大学：《人工智能 AI》精品课程PPT教学课件_绪论、第1章人工智能概述
重庆师范大学：《人工智能》精品课程PPT教学课件_VR虚拟现实和AR增强现实技术
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 6 Advanced Frequent Pattern Mining
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 7 Classification：Basic Concepts
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 8 Cluster Analysis：Basic Concepts and Methods
重庆大学：《数据仓库与数据挖掘 Data Warehouse and Data mining》课程PPT教学课件（英文版）Chapter 9 Outlier Analysis
延安大学：《网页制作基础教程》课程教学资源_教学大纲
延安大学：《网页制作基础教程》学术论文_基于AJAX技术的Web模型在网站互动平台的应用研究
延安大学：《网页制作基础教程》学术论文_基于RIA技术的实验演示系统的设计与实现
延安大学：《网页制作基础教程》学术论文_服务器推技术在实验演示系统中的应用
延安大学：《网页制作基础教程》学术论文_用户行为驱动的网页布局自动调整的研究
《网页制作基础教程》参考书籍（PDF）：JavaScript 权威指南（第四版）
《网页制作基础教程》参考书籍（PDF）：Python学习手册（第3版，涵盖Pathon 2.5）
《网页制作基础教程》参考书籍：CSS Mastery 精通CSS书籍——高级WEB标准解决方案（人民邮电出版社）

点击购买下载（PPT）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录