参考书及资料 。大数据技术原理与应用一—概念、存储、处理、分析与应 用,林子雨,人民邮电出版社,2015年8月第1版 Jimmy lin and chris dyer, Data-Intensive Text Processing with MapReduce, 2013.1 Tom White, Hadoop: The Definitive Guide, O'Reilly 3rd,2012.5. 数据挖掘:概念与技术, Jiawei Han和 Micheline Kamber著,机械工业出版社(最新版) 大数据:互联网大规模数据挖掘与分布式处理[ Mining of massive datasets],[美] Anand rajaraman,[美 Jeffrey david Ullman著;王斌译,人民邮电出版社, 2012-09-01 来自互联网的各种搜索资料
参考书及资料 ◦ 大数据技术原理与应用——概念、存储、处理、分析与应 用,林子雨,人民邮电出版社,2015年8月第1版 ◦ Jimmy Lin and Chris Dyer, Data-Intensive Text Processing with MapReduce, 2013.1. ◦ Tom White, Hadoop: The Definitive Guide, O'Reilly, 3rd, 2012.5. ◦ 数据挖掘:概念与技术,Jiawei Han和Micheline Kamber 著,机械工业出版社(最新版) ◦ 大数据:互联网大规模数据挖掘与分布式处理 [Mining of Massive Datasets],[美] Anand Rajaraman,[美] Jeffrey David Ullman 著; 王斌 译,人民邮电出版社, 2012-09-01 ◦ 来自互联网的各种搜索资料 2019/5/16 16
数据库技术的演化(1) 19605和以前: 0文件系统 1970S 层次数据库和网状数据库 19805早期 关系数据模型,关系数据库管理系统( RDBMS)的实 现
数据库技术的演化 (1) 1960s和以前: ◦ 文件系统 1970s: ◦ 层次数据库和网状数据库 1980s早期: ◦ 关系数据模型, 关系数据库管理系统(RDBMS)的实 现 2019/5/16 17
数据库技术的演化(2) 19805晚期 各种高级数据库系统(扩展的关系数据库,面向对象数据库等 等) 面向应用的数据库系统(空间数据库,时序数据库,多媒体 数据库等等) 1990s 数据挖掘,数据仓库,多媒体数据库和网络数据库 2000s 流数据管理和挖掘 基于各种应用的数据挖掘 XML数据库和整合的信息系统
数据库技术的演化 (2) 1980s晚期: ◦ 各种高级数据库系统 (扩展的关系数据库,面向对象数据库等 等.) ◦ 面向应用的数据库系统 (空间数据库,时序数据库,多媒体 数据库等等) 1990s: ◦ 数据挖掘, 数据仓库, 多媒体数据库和网络数据库 2000s ◦ 流数据管理和挖掘 ◦ 基于各种应用的数据挖掘 ◦ XML数据库和整合的信息系统 2019/5/16 18
数据挖掘技术 丶数据爆炸问题 。自动数据收集工具和成熟的数据库技术使得大量的 数据被收集,存储在数据库、数据仓库或其他信息 库中以待分析。 我们拥有丰富的数据,但却缺之有用的信 丶解决方法:数据仓库技术和数据挖掘技术 数据仓库( Data Warehouse)和在线分析处理(OLAP) 。数据挖掘:在大量的数据中挖掘感兴趣的知识(规 则,规律,模式,约束)
数据挖掘技术 数据爆炸问题 ◦ 自动数据收集工具和成熟的数据库技术使得大量的 数据被收集,存储在数据库、数据仓库或其他信息 库中以待分析。 我们拥有丰富的数据,但却缺乏有用的信 息 解决方法:数据仓库技术和数据挖掘技术 ◦ 数据仓库(Data Warehouse)和在线分析处理(OLAP) ◦ 数据挖掘:在大量的数据中挖掘感兴趣的知识(规 则,规律,模式,约束) 2019/5/16 19
什么是数据挖掘? 数据挖掘(从数据中发现知识) 从大量的数据中挖掘哪些令人感兴趣的、有用的、隐含的、 先前未知的和可能有用的模式或知识 挖掘的不仅仅是数据(所以“数据挖掘”并非一个精确的用 丶数据挖掘的替换词 数据库中的知识挖掘(KDD) 知识提炼 数据/模式分析 数据考古 数据捕捞、信息收获等等
什么是数据挖掘? 数据挖掘 (从数据中发现知识) ◦ 从大量的数据中挖掘哪些令人感兴趣的、有用的、隐含的、 先前未知的和可能有用的模式或知识 ◦ 挖掘的不仅仅是数据(所以“数据挖掘”并非一个精确的用 词) 数据挖掘的替换词 ◦ 数据库中的知识挖掘(KDD ) ◦ 知识提炼 ◦ 数据 /模式分析 ◦ 数据考古 ◦ 数据捕捞、信息收获等等。 2019/5/16 20