数据仓库 Data warehouse 赵卫东博士 复旦大学软件学院 wdzhao@fudan.edu.cn
1 数据仓库 Data Warehouse 赵卫东 博士 复旦大学软件学院 wdzhao@fudan.edu.cn
事务型处理 事务型处理:即操作型处理,是指对数据库的联机操作 处理OLTP。事务型处理是用来协助企业对响应事件或 事务的日常商务活动进行处理。它是事件驱动、面向应 用的,通常是对一个或一组记录的增、删、改以及简单 查询等(大量、简单、重复和例行性)。 在事务型处理环境中,数据库要求能支持日常事务中的 大量事务,用户对数据的存取操作频率高而每次操作处 理的时间短
2 事务型处理 n 事务型处理:即操作型处理,是指对数据库的联机操作 处理OLTP。事务型处理是用来协助企业对响应事件或 事务的日常商务活动进行处理。它是事件驱动、面向应 用的,通常是对一个或一组记录的增、删、改以及简单 查询等(大量、简单、重复和例行性)。 n 在事务型处理环境中,数据库要求能支持日常事务中的 大量事务,用户对数据的存取操作频率高而每次操作处 理的时间短
分析型处理 分析型处理:用于管理 Operational Informational 人员的决策分析,例如 Data Data Access DSS、EIS和多维分析等 Data Warehouse 它帮助决策者分析数据 Environment 以察看趋向、判断问题。 分析型处理经常要访问 Data 大量的历史数据,支持 Warehouse 复杂的查询。 分析型处理过程中经常 用到外部数据,这部分 数据不是由事务型处理 系统产生的,而是来自 于其他外部数据源
3 分析型处理 n 分析型处理:用于管理 人员的决策分析,例如 DSS、 EIS和多维分析等。 它帮助决策者分析数据 以察看趋向、判断问题。 n 分析型处理经常要访问 大量的历史数据,支持 复杂的查询。 n 分析型处理过程中经常 用到外部数据,这部分 数据不是由事务型处理 系统产生的,而是来自 于其他外部数据源
事务型处理数据和分析型处理数据的区别 特性 OLTP 特征 操作处理 信息处理 面向 事务 分析 用户 办事员、DBA、数据库专业人员 知识工人(如经理、主管、分析员) 功能 日常操作 长期信息需求,决策支持 DB设计 基于E-R,面向应用 星形/雪花,面向主题 数据 当前的;确保最新 历史的;跨时间维护 汇 原始的,高度详细 汇总的,统一的 视图 详细,一般关系 汇总的,多维的 工作单位 短的、简单事务 复杂查询 存取 读/写 大多为读 关注 数据进入 信息输出 操作 主关键字上索引/散列 大量扫描 访问记录数 数十个 数百万 用户数 数千 数百 DB规模 10OMB到GB 100GB到TB 优先 高性能,高可用性 高灵活性,端点用户自治 度量 事务吞吐量 查询吞吐量,响应时间
4 事务型处理数据和分析型处理数据的区别 特性 OLTP OLAP 特征 面向 用户 功能 DB 设计 数据 汇总 视图 工作单位 存取 关注 操作 访问记录数 用户数 DB规模 优先 度量 操作处理 事务 办事员、DBA、数据库专业人员 日常操作 基于E-R,面向应用 当前的;确保最新 原始的,高度详细 详细,一般关系 短的、简单事务 读/写 数据进入 主关键字上索引/散列 数十个 数千 100MB到GB 高性能,高可用性 事务吞吐量 信息处理 分析 知识工人(如经理、主管、分析员) 长期信息需求,决策支持 星形/雪花,面向主题 历史的;跨时间维护 汇总的,统一的 汇总的,多维的 复杂查询 大多为读 信息输出 大量扫描 数百万 数百 100GB到TB 高灵活性,端点用户自治 查询吞吐量,响应时间
数据库系统的局限性 数据库适于存储高度结构化的目 client Internet 常事务细节数据,而决策型数据 applicati 多为厉史性、汇总性或计算性数 Application la owsers 据,多表现为静态数据,不需直 接更新,但可周期性刷新。 决分析型数据是多维性,分析 ■在事务处理环境中,决策者可能 并不关心具体的细节信息,在决 策分析环境中,如果这些细节数 据量太大一方面会严重影响分析 效率,另一方面这些细节数据会 document 分散决策者的注意力。 Data managemen Oracle la DB2 5
5 数据库系统的局限性 n 数据库适于存储高度结构化的日 常事务细节数据,而决策型数据 多为历史性、汇总性或计算性数 据,多表现为静态数据,不需直 接更新,但可周期性刷新。 n 决策分析型数据是多维性,分析 内容复杂。 n 在事务处理环境中,决策者可能 并不关心具体的细节信息,在决 策分析环境中,如果这些细节数 据量太大一方面会严重影响分析 效率,另一方面这些细节数据会 分散决策者的注意力。 DB2 Oracle SQL Server Excel spreadsheet XML document Internet client SSL applications Browsers Data management layer Application layer Web servers