数据集成 使用XML ML格式具备描述各种类型数据的能力,ⅫML解析器在各种平台上都 被开发人员使用,可以在不同的异构系统之间交换数据。 > 基于因特网的ML/EDI方式取代传统EDI ■从源数据库中提取所需数据,转化为标准ML文档(需遵循业内共同遵守的 XML Schema); ■ 应用系统通过HTTP将ML文档传送到目标系统; 目标系统接收ML文档,按照约定的L Schema对传来的数据进行校验 通过解析器取出ⅫML文档中的数据保存到自己的系统中。 图形用门 界血过 应加子 XML浏览器 目标数据库 川户接1层 DOM客户满AP 同步模块 转换模块 XML接!1 XML中间件 元数据模块 安全模块 ML虚拟集中在储器 3 XML-Based Virtual Database ML信息 变化数据捕获 控制表法 SHA法 日志法 Vrap灯 Wrapper Wrapper 数据抽取层 Sq12000 Access Oracle 数据呢 构件库 知识库 数据作 教务管理系统 人事管理系统 财务管理系统
学以致用 DATABASE@UESTC 用以促学 XML格式具备描述各种类型数据的能力,XML解析器在各种平台上都 被开发人员使用,可以在不同的异构系统之间交换数据。 基于因特网的XML/EDI方式取代传统EDI 从源数据库中提取所需数据,转化为标准XML文档(需遵循业内共同遵守的 XML Schema); 应用系统通过HTTP将XML文档传送到目标系统; 目标系统接收XML文档,按照约定的XML Schema对传来的数据进行校验 ,通过解析器取出XML文档中的数据保存到自己的系统中
数据集成 关键问题 ☒ 936 >异构数据源集成是数据库领域的经典和热点问题 ■集成范围问题: ◆不是所有数据源中的数据都能集成 ■ 数据资源所有权问题: ◆保障原有数据源的权限 ■全局模式问题: ◆数据聚合(统一的数据库)和ETL(数据仓库)方法需要做好元数据工作, 建立全局模式 ■模式映射问题: ◆应用系统数据库与虚拟数据库或数据仓库间的数据映射 ■数据动态集成问题: CDC:Changed Data Capture ◆不是建立大的、统一不变的数据库,集成数据库需要从变化的数据源 中集成新数据 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 异构数据源集成是数据库领域的经典和热点问题 集成范围问题: 不是所有数据源中的数据都能集成 数据资源所有权问题: 保障原有数据源的权限 全局模式问题: 数据聚合(统一的数据库)和ETL(数据仓库)方法需要做好元数据工作, 建立全局模式 模式映射问题: 应用系统数据库与虚拟数据库或数据仓库间的数据映射 数据动态集成问题: CDC:Changed Data Capture 不是建立大的、统一不变的数据库,集成数据库需要从变化的数据源 中集成新数据
本章内容 ☒ 36 数据集成 数据仓库 数据挖掘 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 数据集成 数据仓库 数据挖掘
数据仓库 概述 ☒ 由数据库 (DB)发展到数据仓库(DW),或者数据仓库的 产生背景 数据丰富,信息贫乏 ◆随着数据库技术的发展,企事业单位建立了大量的数据库,数据越来 越多,而辅助决策信息却很贫乏,如何将大量的数据转换为辅助决策 信息成了研究的热,点。 ■异构环境数据的转换和共享 ◆由于各类数据库产品的增加,异构环境的数据也随之增加,如何实现 这些异构环境数据的转换和共享也成了研究的热点。 ■利用数据进行事务处理转变为利用数据支持决策 ◆数据库中的大量数据是事务型数据,即该数据是对每一项工作和管理 对象的具体的、细节性的描述。如何利用它们来支持辅助决策。如何 利用历史数据的分析来进行预测。 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 由数据库(DB)发展到数据仓库(DW),或者数据仓库的 产生背景 数据丰富,信息贫乏 随着数据库技术的发展,企事业单位建立了大量的数据库,数据越来 越多,而辅助决策信息却很贫乏,如何将大量的数据转换为辅助决策 信息成了研究的热点。 异构环境数据的转换和共享 由于各类数据库产品的增加,异构环境的数据也随之增加,如何实现 这些异构环境数据的转换和共享也成了研究的热点。 利用数据进行事务处理转变为利用数据支持决策 数据库中的大量数据是事务型数据,即该数据是对每一项工作和管理 对象的具体的、细节性的描述。如何利用它们来支持辅助决策。如何 利用历史数据的分析来进行预测
数据仓库 概述 ☒ >数据库与数据仓库的对比 数据库 数据仓库 面向应用 面向主题 数据是详细的,细节数据 数据是综合的或是提炼的 保存当前数据 保存过去和现在的数据 数据是可更新的 数据不更新 操作需求是事先可知的 操作需求是临时决定的 数据非冗余 数据时常冗余 查询的是原始数据 查询的是经过加工的数据 事物处理需要的是当前数据 决策分析需要过去、现在的数据 支持事物处理 支持决策分析 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 数据库与数据仓库的对比