第12章数据仓库与数据挖掘技术 宁可、吴菁、胡海编著 教材:数据库技术及应用2006年4月
第12章数据仓库与数据挖掘技术 教材:数据库技术及应用 2006年4月 宁可、吴菁、胡海编著
本章要点 数据仓库的基本概念 数据仓库与联机事务处理 数据仓库的基本特点 数据仓库的基本体系结构 ·数据仓库的数据模型 数据仓库系统的前端工具-联机分析处理 数据仓库的前端工具数据挖掘 T
本章要点 • 数据仓库的基本概念 • 数据仓库与联机事务处理 • 数据仓库的基本特点 • 数据仓库的基本体系结构 • 数据仓库的数据模型 • 数据仓库系统的前端工具-联机分析处理 • 数据仓库的前端工具-数据挖掘
目录 12.1数据仓库的基本概念 12.2数据仓库的基本特点 12.3数据仓库的基本体系结构 12.4数据仓库的数据库模式 12.5数据仓库的前端工具 12.5.1联机分析处理 12.5.2数据挖掘 小结
目 录 12.1 数据仓库的基本概念 12.2 数据仓库的基本特点 12.3 数据仓库的基本体系结构 12.4 数据仓库的数据库模式 12.5 数据仓库的前端工具 12.5.1 联机分析处理 12.5.2 数据挖掘 小结
121数据仓库的基本概念 数据仓库的概念提出于20世纪80年代中期。目前数据仓库的定义 不完全统一。“数据仓库之父” WH. Inmon在其( Building the Data Warehouse)一书中定义:数据仓库是支持管理决策过程的、面向主题 的、集成的、随时间而变、持久的数据集合。它指出了数据仓库技术 是解决企业决策支持系统的重要手段。 数据仓库与传统的数据库系统有着本质的区别。传统的数据库都 是事务处理型,主要是对数据库联机的日常操作,这种数据库应用称 为联机事务处理( OnLine Transaction Processing,简称OLTP)。而数 据仓库是为了满足管理层和分析人员的信息需求,从来自不同地点或 不同操作系统的不同数据源的数据进行计算机辅助分析决策,称决策 支持系统( Decision Support Systems,简称DSS)
12.1 数据仓库的基本概念 数据仓库的概念提出于20世纪80年代中期。目前数据仓库的定义 不完全统一。“数据仓库之父”W.H.Inmon在其(Building the Data Warehouse)一书中定义:数据仓库是支持管理决策过程的、面向主题 的、集成的、随时间而变、持久的数据集合。它指出了数据仓库技术 是解决企业决策支持系统的重要手段。 数据仓库与传统的数据库系统有着本质的区别。传统的数据库都 是事务处理型,主要是对数据库联机的日常操作,这种数据库应用称 为联机事务处理(OnLine Transaction Processing,简称OLTP)。而数 据仓库是为了满足管理层和分析人员的信息需求,从来自不同地点或 不同操作系统的不同数据源的数据进行计算机辅助分析决策,称决策 支持系统(Decision SupportSystems,简称DSS)
数据仓库系统与传统的数据库系统区别 (1)驱动和面向对象不同。OLTP事务驱动,面向应用的:而DDS是分析驱动, 面向分析的 (2)特性不同。OLTP一般是操作频率高、处理时间短、一次操作量小,对系 统性能要求高;而DSS的分析处理一次操作量大,往往需要连续运行几 个小时或更长,占用的大量系统资源,但对系统的性能要求比较宽松 (3)数据集成问题。OLTP一般只需要与本部门业务有关的当前数据,对于整 个企业范围内的集成应用考虑很少。而DSS需要集成的数据,全面而正 确的数据是进行有效分析和决策的首要前提,相关数据收集的越完整, 得到的结果就越可靠 (4)历史数据问题。OLTP一般只需要当前的数据,数据库中一般也只存放更 新后的数据。但对于DSS决策分析来说,历史数据是非常重要的,许多 分析方法都以大量的历史数据为依据来进行分析,分析历史数据对于把 握企业的发展方向是很重要的。 (5)数据的综合问题,OLTP处理的是大量的细节数据,这些细节往往需要综 合后被DSS所用,而OLTP不具备这种综合能力 综上所述,传统的事务型数据库是不适用于决策支持系统的,DSS的需 是数据仓库技术出现的根本原因
数据仓库系统与传统的数据库系统区别 (1) 驱动和面向对象不同。OLTP事务驱动,面向应用的;而DDS是分析驱动, 面向分析的。 (2) 特性不同。OLTP一般是操作频率高、处理时间短、一次操作量小,对系 统性能要求高;而DSS的分析处理一次操作量大,往往需要连续运行几 个小时或更长,占用的大量系统资源,但对系统的性能要求比较宽松。 (3) 数据集成问题。OLTP一般只需要与本部门业务有关的当前数据,对于整 个企业范围内的集成应用考虑很少。而DSS需要集成的数据,全面而正 确的数据是进行有效分析和决策的首要前提,相关数据收集的越完整, 得到的结果就越可靠。 (4) 历史数据问题。OLTP一般只需要当前的数据,数据库中一般也只存放更 新后的数据。但对于DSS决策分析来说,历史数据是非常重要的,许多 分析方法都以大量的历史数据为依据来进行分析,分析历史数据对于把 握企业的发展方向是很重要的。 (5) 数据的综合问题,OLTP处理的是大量的细节数据,这些细节往往需要综 合后被DSS所用,而OLTP不具备这种综合能力。 综上所述,传统的事务型数据库是不适用于决策支持系统的,DSS的需 求是数据仓库技术出现的根本原因