122数据仓库的基本特点 1.数据仓库是面向主题的 与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行 组织的。主题是一个抽象的概念,是对企业信息系统中的数据在较高层次上进行抽象的综合、 归类并进行分析利用。在逻辑意义上,它是相应企业中某一宏观分析领域所涉及的分析对象。 2.数据仓库是集成的 数据仓库的数据主要是作分析用,分析用数据的最大特点在于它不局限于某个具体的操 作数据,而是对细节数据的归纳和整理。数据仓库中的综合数据不能从原有数据库系统中直 接得到而需从其中抽取。 3.数据仓库是稳定的 数据仓库主要是为信息分析提供综合的、集成的、面向某一分析主题的数据,这些数据 主要涉及维护查询。数据仓库数据反映的是一段相当长的时间内历史数据的内容,而不象事 务处理中的数据是频繁变化的数据。当数据经过集成进入数据仓库后是极少进行更新或根本 不考虑更新 数据仓库是随时间变化的 虽然数据仓库中的数据一般是不更新的,但是在数据仓库的整个生存周期中的数据集合 却是随着时间的变化而变化的。主要表现在以下方面 首先,数据仓库随着时间的变化要不断删除旧的数据内容。数据仓库中的数据也有存储 期限,一旦超过了这一期限,过期的数据就要被删除。数据仓库中的数据并不是永远保存, 》后时间更长而已。其次,数据仓库中保存的数据是历史数据,对用户来说不能更改数 的数据,但可以随着时间变化系统定期进行刷新,把OLTP数据库变化的数据追加到 数据仓库中,随时导出新的综合数据和统计数据
12.2 数据仓库的基本特点 1.数据仓库是面向主题的 与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行 组织的。主题是一个抽象的概念,是对企业信息系统中的数据在较高层次上进行抽象的综合、 归类并进行分析利用。在逻辑意义上,它是相应企业中某一宏观分析领域所涉及的分析对象。 2.数据仓库是集成的 数据仓库的数据主要是作分析用,分析用数据的最大特点在于它不局限于某个具体的操 作数据,而是对细节数据的归纳和整理。数据仓库中的综合数据不能从原有数据库系统中直 接得到而需从其中抽取。 3.数据仓库是稳定的 数据仓库主要是为信息分析提供综合的、集成的、面向某一分析主题的数据,这些数据 主要涉及维护查询。数据仓库数据反映的是一段相当长的时间内历史数据的内容,而不象事 务处理中的数据是频繁变化的数据。当数据经过集成进入数据仓库后是极少进行更新或根本 不考虑更新。 4.数据仓库是随时间变化的 虽然数据仓库中的数据一般是不更新的,但是在数据仓库的整个生存周期中的数据集合 却是随着时间的变化而变化的。主要表现在以下方面: 首先,数据仓库随着时间的变化要不断删除旧的数据内容。数据仓库中的数据也有存储 期限,一旦超过了这一期限,过期的数据就要被删除。数据仓库中的数据并不是永远保存, 只是保存时间更长而已。其次,数据仓库中保存的数据是历史数据,对用户来说不能更改数 据仓库中的数据,但可以随着时间变化系统定期进行刷新,把OLTP数据库变化的数据追加到 数据仓库中,随时导出新的综合数据和统计数据
123数据仓库的基本体系结构 数据仓库的基本体系结构主要包括:数据集成、数据存储和数据査询与分 析工具。数据仓库的基本体系结构如图13-1所示。 (1)数据源 数据源包括数据库、文件系统、 Internet上HTML文件以及其他数据源。数 据源一般是异构的,通过网络连接,数据仓库应能通过ODBC或JDBC等机制,访问 各数据源。 数据库 仓库管理工具 文件系统 查询 抽取转换加载刷新 元数据 报表 数据仓库 HTML文件 元数据管理 图形接口 数据挖掘 仓库建模工具 其他数据 数据源 数据集成 数据存储 分析工具 图131数据仓库篚基本体系结构
12.3 数据仓库的基本体系结构 数据仓库的基本体系结构主要包括:数据集成、数据存储和数据查询与分 析工具。数据仓库的基本体系结构如图13-1所示。 (1) 数据源 数据源包括数据库、文件系统、Internet上HTML文件以及其他数据源。数 据源一般是异构的,通过网络连接,数据仓库应能通过ODBC或JDBC等机制,访问 各数据源