数据仓库与操作数据库系统 操作数据库系统的主要任务是联机事务处理 OLTP ¤日常操作:购买,库存,银行,制造,工资,注册, 记帐等 ■数据仓库的主要任务是联机分析处理OLAP ¤数据分析和决策支持,支持以不同的形式显示数据 以满足不同的用户需要
数据仓库与操作数据库系统 ◼ 操作数据库系统的主要任务是联机事务处理 OLTP ❑ 日常操作: 购买,库存,银行,制造,工资,注册, 记帐等 ◼ 数据仓库的主要任务是联机分析处理OLAP ❑ 数据分析和决策支持,支持以不同的形式显示数据 以满足不同的用户需要
OLAP VS OLTP ( 用户和系统的面向性 口面向顾客(事务)VS.面向市场(分析) 数据内容 口当前的、详细的数据VS.历史的、汇总的数据 数据库设计 实体一联系模型(ER)和面向应用的数据库设计VS 星型/花模型和面向主题的数据库设计
OLAP VS. OLTP (1) ◼ 用户和系统的面向性 ❑ 面向顾客(事务) VS. 面向市场(分析) ◼ 数据内容 ❑ 当前的、详细的数据 VS. 历史的、汇总的数据 ◼ 数据库设计 ❑ 实体-联系模型(ER)和面向应用的数据库设计 VS. 星型/雪花模型和面向主题的数据库设计
OLAP VS OLTP (2 ■数据视图 口当前的、企业内部的数据Vs.经过演化的、集成的 数据 访问模式 事务操作VS.只读查询(但很多是复杂的查询) 任务单位 简短的事务VS.复杂的查询 访问数据量 a数十个VS.数百万个
OLAP VS. OLTP (2) ◼ 数据视图 ❑ 当前的、企业内部的数据 VS. 经过演化的、集成的 数据 ◼ 访问模式 ❑ 事务操作 VS. 只读查询(但很多是复杂的查询) ◼ 任务单位 ❑ 简短的事务 VS. 复杂的查询 ◼ 访问数据量 ❑ 数十个 VS. 数百万个
OLAP VS OLTP(3) 用户数 口数千个VS.数百个 数据库规模 口100M-数GBVS.100GB-数TB 设计优先性 高性能、高可用性VS.高灵活性、端点用户自治 度量 口事务吞吐量Vs.查询吞吐量、响应时间 更多的区别见教科书P28,表2-1
OLAP VS. OLTP (3) ◼ 用户数 ❑ 数千个 VS. 数百个 ◼ 数据库规模 ❑ 100M-数GB VS. 100GB-数TB ◼ 设计优先性 ❑ 高性能、高可用性 VS. 高灵活性、端点用户自治 ◼ 度量 ❑ 事务吞吐量 VS. 查询吞吐量、响应时间
为什么需要一个分离的数据仓库? 提高两个系统的性能 口DBMS是为OLTP而设计的:存储方式,索引,并发控制,恢复 口数据仓库是为OLAP而设计:复杂的OLAP查询,多维视图, 汇总 ■不同的功能和不同的数据 ¤历史数据:决策支持需要历史数据,而这些数据在操作数据 库中一般不会去维护 口数据汇总:决策支持需要将来自异种源的数据统一(如聚集 和汇总) 口数据质量:不同的源使用不一致的数据表示、编码和格式 对这些数据进行有效的分析需要将他们转化后进行集成
为什么需要一个分离的数据仓库? ◼ 提高两个系统的性能 ❑ DBMS是为OLTP而设计的:存储方式,索引, 并发控制, 恢复 ❑ 数据仓库是为OLAP而设计:复杂的 OLAP查询, 多维视图, 汇总 ◼ 不同的功能和不同的数据: ❑ 历史数据: 决策支持需要历史数据,而这些数据在操作数据 库中一般不会去维护 ❑ 数据汇总:决策支持需要将来自异种源的数据统一(如聚集 和汇总) ❑ 数据质量: 不同的源使用不一致的数据表示、编码和格式, 对这些数据进行有效的分析需要将他们转化后进行集成