信息检索与数据挖掘 2019/5/51 5月21日12:00前,提交文献阅读相关素材 6月3日12:00前,提交实验报告及相关素材 信息检索与数据挖掘 补充:数据挖掘经典算法概述 4月29日,补充:概率图及主题模型 5月6日,补充:数据挖掘经典算法概述(1) 5月8日,补充: 数据挖掘经典算法概述(2) 5月13日,第12章Web搜索 5月15日,第13章多媒体信息检索 5月20日,复习 5月22日,同学们文献阅读报告 5月27日,同学们文献阅读报告 6月3日,期末考试【暂定】
信息检索与数据挖掘 2019/5/5 1 信息检索与数据挖掘 补充:数据挖掘经典算法概述 4月29日,补充:概率图及主题模型 5月6日,补充:数据挖掘经典算法概述(1) 5月8日,补充:数据挖掘经典算法概述(2) 5月13日,第12章 Web搜索 5月15日,第13章 多媒体信息检索 5月20日,复习 5月22日,同学们文献阅读报告 5月27日,同学们文献阅读报告 6月3日,期末考试【暂定】 5月21日12:00前,提交文献阅读相关素材 6月3日12:00前,提交实验报告及相关素材
信息检索与数据挖掘 2019/5/52 名词演化 ,数据挖掘(data mining) ·数据库的知识发现(KDD,Knowledge Discovery in Database) ·模式识别(pattern recognition) 。人工智能(Artificial intelligence.) .机器学习(machine learning) ·统计机器学习(statistical learning)
信息检索与数据挖掘 2019/5/5 2 名词演化 • 数据挖掘(data mining) • 数据库的知识发现(KDD, Knowledge Discovery in Database) • 模式识别(pattern recognition) • 人工智能(Artificial intelligence) • 机器学习(machine learning) • 统计机器学习(statistical learning)
信息检索与数据挖掘 2019/5/53 Top 10 algorithms in data mining,2007 This paper presents the top 10 data mining algorithms identified by the IEEE International Conference on Data Mining (ICDM) in December 2006:C4.5,k-Means,SVM,Apriori,EM,PageRank, AdaBoost,kNN,Naive Bayes,and CART.These top 10 algorithms are among the most influential data mining algorithms in the research community...... These 10 algorithms cover classification,clustering,statistical learning,association analysis,and link mining,which are all among the most important topics in data mining research and development. Xindong Wu,Vipin Kumar,J.Ross Quinlan,et al.Top 10 algorithms in data mining. Knowledge and Information Systems,14(1):1-37,2008.Published online:4 December 2007
信息检索与数据挖掘 2019/5/5 3 Top 10 algorithms in data mining, 2007 Xindong Wu, Vipin Kumar, J. Ross Quinlan, et al. Top 10 algorithms in data mining. Knowledge and Information Systems, 14(1):1–37, 2008. Published online: 4 December 2007. This paper presents the top 10 data mining algorithms identified by the IEEE International Conference on Data Mining (ICDM) in December 2006: C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. These top 10 algorithms are among the most influential data mining algorithms in the research community…… These 10 algorithms cover classification, clustering, statistical learning, association analysis, and link mining, which are all among the most important topics in data mining research and development
信息检索与数据挖掘 2019/5/54 数据挖掘十大经典算法 C4.5 CART AdaBoost Naive Bayes Apriori kNN K-Means SVM k-Means SVM C4.5 Apriori EM The Top Ten Algorithms in CART Data Mining EM Naive Bayes PageRank KNN AdaBoost Pagerank c第l2章Web搜索 [1]Xindong Wu,Vipin Kumar,J.Ross Quinlan,et al.Top 10 algorithms in data mining.Knowledge and Information Systems,14(1):1-37,4 December 2007
信息检索与数据挖掘 2019/5/5 4 数据挖掘十大经典算法 [1] Xindong Wu, Vipin Kumar, J. Ross Quinlan, et al. Top 10 algorithms in data mining. Knowledge and Information Systems, 14(1):1–37, 4 December 2007. Pagerank ⊂ 第12章Web搜索 Naive Bayes kNN k-Means SVM EM C4.5 CART AdaBoost Apriori
信息检索与数据挖掘 2019/5/55 今日内容:数据挖掘经典算法概述 。教材中有的 ·Naive Bayes、EM、K-neans、SVM、kNN 。决策树 。ID3、C4.5、CART ·把若干个分类器整合为一个分类器 ·Bagging 。Boosting ·AdaBoost,1995 ·流数据挖掘:频繁项集 ·确定性数据中频繁项集挖掘的相关算法 ·A-Priori[1994] 。Eclat[1997] FP-growth(Frequent Pattern growth)[2000] ·不确定数据的频繁项集的挖掘 。Web中的数据挖掘 ·哈希(hash)与哈希表(Hash Table) ·布隆过滤器(Bloom Filter) ·近似重复检测
信息检索与数据挖掘 2019/5/5 5 今日内容:数据挖掘经典算法概述 • 教材中有的 • Naive Bayes、EM、K-means、SVM、kNN • 决策树 • ID3、C4.5、CART • 把若干个分类器整合为一个分类器 • Bagging • Boosting • AdaBoost,1995 • 流数据挖掘:频繁项集 • 确定性数据中频繁项集挖掘的相关算法 • A-Priori [1994] • Eclat [1997] • FP-growth (Frequent Pattern growth) [2000] • 不确定数据的频繁项集的挖掘 • Web中的数据挖掘 • 哈希(hash) 与哈希表(Hash Table) • 布隆过滤器(Bloom Filter) • 近似重复检测