面向主题 数据仓库中的数据是按照各种主题来组织的。主题在数据仓 库中的物理实现是一系列的相关表,这不同于面向应用环境 如保险公司按照应用组织可能是汽车保险、生命保险、伤亡 保险,而数据仓库是按照客户、政策、保险金和索赔来组织 数据。 面向主题的数据组织方式可在较高层次上对分析对象的数据 给出完整、一致的描述,能完整、统一的刻画各个分析对象 所涉及的企业的各项数据以及数据之间的联系,从而适应企 业各个部门的业务活动特点和企业数据的动态特征,从根本 上实现数据与应用的分离
11 面向主题 n 数据仓库中的数据是按照各种主题来组织的。主题在数据仓 库中的物理实现是一系列的相关表,这不同于面向应用环境。 如保险公司按照应用组织可能是汽车保险、生命保险、伤亡 保险,而数据仓库是按照客户、政策、保险金和索赔来组织 数据。 n 面向主题的数据组织方式可在较高层次上对分析对象的数据 给出完整、一致的描述,能完整、统一的刻画各个分析对象 所涉及的企业的各项数据以及数据之间的联系,从而适应企 业各个部门的业务活动特点和企业数据的动态特征,从根本 上实现数据与应用的分离
集成性 数据仓库中的数据是从原 有分散的源数据库中提取 出来的,其每一个主题所 对应的源数据在原有的数 据库中有许多冗余和不 致,且与不同的应用逻辑 too D B2 Information Integrator 相关。为了创建一个有效 的主题域,必须将这些来 自不同数据源的数据集成 起来,使之遵循统一的编匪 码规则。 12
12 集成性 n 数据仓库中的数据是从原 有分散的源数据库中提取 出来的,其每一个主题所 对应的源数据在原有的数 据库中有许多冗余和不一 致,且与不同的应用逻辑 相关。为了创建一个有效 的主题域,必须将这些来 自不同数据源的数据集成 起来,使之遵循统一的编 码规则
稳定性 数据仓库内的数据有很长的时间跨度,通常是5-10年。 数据仓库中的数据反映的是一段时间内历史数据的内容,是不同 时点的数据库快照的集合,以及基于撰写快照进行统计、综合和 重组的导出数据。主要供企业高层决策分析之用,所涉及的数据 操作主要是査询,一般情况下并不进行修改操作 数据仓库中的数据是不可实时更新的,仅当超过规定的存储期限, 才将其从数据仓库中删除,提取新的数据经集成后输入数据仓库 13
13 稳定性 n 数据仓库内的数据有很长的时间跨度,通常是5-10年。 n 数据仓库中的数据反映的是一段时间内历史数据的内容,是不同 时点的数据库快照的集合,以及基于撰写快照进行统计、综合和 重组的导出数据。主要供企业高层决策分析之用,所涉及的数据 操作主要是查询,一般情况下并不进行修改操作. n 数据仓库中的数据是不可实时更新的,仅当超过规定的存储期限, 才将其从数据仓库中删除,提取新的数据经集成后输入数据仓库
时变性 时变性:许多商业分析要求对发展趋势做出预测,对发展趋 势的分析需要访问历史数据。因此数据仓库必须不断捕捉 OLTP数据库中变化的数据,生成数据库的快照,经集成后增 加到数据仓库中去;另外数据仓库还需要随时间的变化删去 过期的、对分析没有帮助的数据,并且还需要按规定的时间 段增加综合数据 14
14 时变性 n 时变性:许多商业分析要求对发展趋势做出预测,对发展趋 势的分析需要访问历史数据。因此数据仓库必须不断捕捉 OLTP数据库中变化的数据,生成数据库的快照,经集成后增 加到数据仓库中去;另外数据仓库还需要随时间的变化删去 过期的、对分析没有帮助的数据,并且还需要按规定的时间 段增加综合数据
支持管理决策 ■数据仓库支持叽LAP(联机分析处理)、数据挖掘和决策 分析。0LAP从数据仓库中的综合数据出发,提供面向分 析的多维模型,并使用多维分析的方法从多个角度、多 个层次对多维数据进行分析,使决策者能够以更加自然 的方式来分析数据。数据挖掘则以数据仓库和多维数据 库中的数据为基础,发现数据中的潜在模式和进行预测 因此,数据仓库的功能是支持管理层进行科学决策,而 不是事务处理。 15
15 支持管理决策 n 数据仓库支持OLAP(联机分析处理)、数据挖掘和决策 分析。OLAP从数据仓库中的综合数据出发,提供面向分 析的多维模型,并使用多维分析的方法从多个角度、多 个层次对多维数据进行分析,使决策者能够以更加自然 的方式来分析数据。数据挖掘则以数据仓库和多维数据 库中的数据为基础,发现数据中的潜在模式和进行预测。 因此,数据仓库的功能是支持管理层进行科学决策,而 不是事务处理