36 《数据库新技术》 第5章数据仓库与数据挖掘 电子科技大学计算机学院 魏祖宽 anl exweeQuestc.edu.cn 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 电子科技大学 计算机学院 魏祖宽 anlexwee@uestc.edu.cn 《数据库新技术》 第5章 数据仓库与数据挖掘
本章内容 ☒ 36 数据集成 数据仓库 数据挖掘 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 数据集成 数据仓库 数据挖掘
数据集成 概述 数据集成的必要性 ■历史数据的价值—数据是资产(增值、交易) ◆开发或引进许多独立运行的应用系统 ◆存储、管理、维护数据 ■异构环境数据源 ◆文件数据库、网络数据库等,不同时期、不同公司、不同工具、不同平 台上开发,运行在不同的操作系统和数据库平台上; ◆系统彼此封闭、数据无法交换共享,形成冗余数据、垃圾数据,无法数 据一致性 ■企业应用系统需要访问各种异构数据源,需要将内部数据进 行发布和交换 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 数据集成的必要性 历史数据的价值——数据是资产(增值、交易) 开发或引进许多独立运行的应用系统 存储、管理、维护数据 异构环境数据源 文件数据库、网络数据库等,不同时期、不同公司、不同工具、不同平 台上开发,运行在不同的操作系统和数据库平台上; 系统彼此封闭、数据无法交换共享,形成冗余数据、垃圾数据, 无法数 据一致性. 企业应用系统需要访问各种异构数据源,需要将内部数据进 行发布和交换
数据集成 概述 > 目的: ■把具有不同来源、格式 用户 、特点和性质的数据在 逻辑上或物理上有机地 集中起来为企业提供全 请求 结果 面的数据共享。 >关键: 数据集成系统 ■以一种统一的数据模式 描述各数据源中的数据 ,屏蔽它们的平台、数 据结构等异构性,实现 熟柴一 刻照紧N 菊照紧的 数据的无缝集成。 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 目的: 把具有不同来源、格式 、特点和性质的数据在 逻辑上或物理上有机地 集中起来为企业提供全 面的数据共享 。 关键: 以一种统一的数据模式 描述各数据源中的数据 ,屏蔽它们的平台、数 据结构等异构性,实现 数据的无缝集成。 数 据 源 1 数据集成系统 数 据 源 2 数 据 源 3 请求 结果 用户
数据集成 概述 ☒ >数据集成的难,点 ■异构性:数据模型异构、系统异构 ◆数据语义不同 ◆相同语义的数据的表示形式不同 ◆数据源的使用环境不同:不同的硬件设备、操作系统、网络协议 ■分布性:数据源分布在不同地,点,在连接、传输和安全(权限)方面 的问题。 ■自治性:集成系统不影响各局部应用系统,局部数据源保持独立性 ◆在不通知集成系统的前提下改变自身的结构和数据 学以致用 DATABASE@UESTC 用以促学
学以致用 DATABASE@UESTC 用以促学 数据集成的难点 异构性:数据模型异构、系统异构 数据语义不同 相同语义的数据的表示形式不同 数据源的使用环境不同:不同的硬件设备、操作系统、网络协议 分布性:数据源分布在不同地点,在连接、传输和安全(权限)方面 的问题。 自治性:集成系统不影响各局部应用系统,局部数据源保持独立性 在不通知集成系统的前提下改变自身的结构和数据