莲喇4桂降发多六毒 管理信息系统 第三讲数据库与数据库管理 【教学目的和要求】 1.理解数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程和特点 2. 数据库系统的体系结构 3. 掌握从现实世界到概念模型和数据模型抽象的含义,不同的数据库模型,实体关系图画法, 4. 理解数据库管理系统(DBMS)的功能及其工作过程 6 了解多媒体数据库的组成 6. 了解数据仓库和数据挖掘的概念 【主要内容】 3.1数据库与数据库营理系统 3.1.1数据库技术的发展 3.1.2数据库系统的体系结构 3.1.3数据模型 3.1.4数据库管理系统(DBMS)的功能及其工作过程 3.2数据仓库和数据挖掘(阅读) 3.2.1数据仓库的概念 3.2.2为什么需要数据仓库 3.2.3数据仓库的价值 3.2.4数据仓库框架结构 3.2.5数据挖掘 小结 习题三 案例 【电子教案】 参见:第三讲数据库与数据库系统 【重点与难点】 1. 数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程 2. 数据库系统的体系结构: 3. 数据模型。 【教材和参考读物】 《管理信息系统一一理论与实践》第三章 《管理信息系统》甘仞初第三章 【教学时数】2 第1页共19页
管理信息系统 第三讲 数据库与数据库管理 【教学目的和要求】 1. 理解数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程和特点 2. 数据库系统的体系结构 3. 掌握从现实世界到概念模型和数据模型抽象的含义,不同的数据库模型,实体关系图画法, 4. 理解数据库管理系统(DBMS)的功能及其工作过程 5. 了解多媒体数据库的组成 6. 了解数据仓库和数据挖掘的概念 【主要内容】 3.1 数据库与数据库管理系统 3.1.1 数据库技术的发展 3.1.2 数据库系统的体系结构 3.1.3 数据模型 3.1.4 数据库管理系统(DBMS)的功能及其工作过程 3.2 数据仓库和数据挖掘(阅读) 3.2.1 数据仓库的概念 3.2.2 为什么需要数据仓库 3.2.3 数据仓库的价值 3.2.4 数据仓库框架结构 3.2.5 数据挖掘 小结 习题三 案例 【电子教案】 参见:第三讲数据库与数据库系统 【重点与难点】 1. 数据库在人工管理、文件管理、数据库系统的三个阶段的发展过程 2. 数据库系统的体系结构; 3. 数据模型。 【教材和参考读物】 《管理信息系统——理论与实践》第三章 《管理信息系统》甘仞初 第三章 【教学时数】 2 第 1 页 共 19 页
肖好经份餐多大景 管理信息系统 第3讲数据库与信息管理 数据库技术是计算机科学的一个重要分支。20世纪50年代以来,计算机应用由科学研究逐步扩 展到企业、政府部门和社会的各个领域,数据处理很快上升为计算机应用的一个最重要的方面。自 1968年第一个商品化数据管理系统问世以来,数据库技术得到迅速发展。近年来,随着网络技术和 多媒体技术的发展,基于互联网的融合多媒体技术的数据库技术显示出更为广阔的技术前景,成为 信息管理、办公自动化的主要技术支持手段。 数据库技术研究如何科学地组织数据和存储数据,如何高效地检索数据和处理数据,以及如何 既减少数据冗余,又能保障数据安全,实现数据共享。在计算机应用的领域中,管理信息系统方面 的应用占90%以上,而数据库技术又是管理信息系统的基础。因此,可以说,数据库是当今计算机 应用中覆盖范围最为广泛的应用。 3.1 数据库与数据库管理系统 3.1.1数据库技术的发展 数据处理的首要任务是数据管理。数据管理是指如何分类、组织、存储、检索及维护数据库。 数据管理技术经历了人工管理、文件管理、数据库系统三个阶段。表3-1给出了三个阶段的特征比 较。 表3-1数据管理的三个阶段 人工管理 文件管理 数据库管理 数据管理者 用户 文件系统 数据库管理系统 面向的对象 某个应用程序 某个应用 多个应用 共享程度 无共享,冗余度大 共享性差,冗余度大 共享性好,冗余度小 不独立,与程序一 独立性差, 与程序相 具有高度的物理独立性和逻 独立性 体化 关性强 辑独立性 文件形式多样化,单 整体结构化程度高,以数据 结构化 无结构 个文件有记录结构, 模型描述 文件之间是独立的 数据库管理系统提供安全 控制 应用程序自己控制 应用程序自己控制 性、完整性、并发控制和恢 复能力 1.人工管理阶段 从1946年计算机诞生至20世纪50年代中期,计算机主要用于科学计算。计算机除硬件设备外 没有任何软件可用,使用的外存只有磁带、卡片和纸带,没有磁盘等直接存取设备。软件中只有汇 编语言,没有操作系统,对数据的处理,完全由人工进行管理。 人工管理阶段的数据模型如图3-1所示。图中显示程序和数据是一体化的,虽然以虚线将程序和 数据分成两部分,事实上,它们之间是混为一体的。 第2页共19页
管理信息系统 第 3 讲 数据库与信息管理 数据库技术是计算机科学的一个重要分支。20 世纪 50 年代以来,计算机应用由科学研究逐步扩 展到企业、政府部门和社会的各个领域,数据处理很快上升为计算机应用的一个最重要的方面。自 1968 年第一个商品化数据管理系统问世以来,数据库技术得到迅速发展。近年来,随着网络技术和 多媒体技术的发展,基于互联网的融合多媒体技术的数据库技术显示出更为广阔的技术前景,成为 信息管理、办公自动化的主要技术支持手段。 数据库技术研究如何科学地组织数据和存储数据,如何高效地检索数据和处理数据,以及如何 既减少数据冗余,又能保障数据安全,实现数据共享。在计算机应用的领域中,管理信息系统方面 的应用占 90%以上,而数据库技术又是管理信息系统的基础。因此,可以说,数据库是当今计算机 应用中覆盖范围最为广泛的应用。 3.1 数据库与数据库管理系统 3.1.1 数据库技术的发展 数据处理的首要任务是数据管理。数据管理是指如何分类、组织、存储、检索及维护数据库。 数据管理技术经历了人工管理、文件管理、数据库系统三个阶段。表 3-1 给出了三个阶段的特征比 较。 表 3-1 数据管理的三个阶段 人工管理 文件管理 数据库管理 数据管理者 用户 文件系统 数据库管理系统 面向的对象 某个应用程序 某个应用 多个应用 共享程度 无共享,冗余度大 共享性差,冗余度大 共享性好,冗余度小 独立性 不独立,与程序一 体化 独立性差,与程序相 关性强 具有高度的物理独立性和逻 辑独立性 结构化 无结构 文件形式多样化,单 个文件有记录结构, 文件之间是独立的 整体结构化程度高,以数据 模型描述 控制 应用程序自己控制 应用程序自己控制 数据库管理系统提供安全 性、完整性、并发控制和恢 复能力 1. 人工管理阶段 从 1946 年计算机诞生至 20 世纪 50 年代中期,计算机主要用于科学计算。计算机除硬件设备外 没有任何软件可用,使用的外存只有磁带、卡片和纸带,没有磁盘等直接存取设备。软件中只有汇 编语言,没有操作系统,对数据的处理,完全由人工进行管理。 人工管理阶段的数据模型如图 3-1 所示。图中显示程序和数据是一体化的,虽然以虚线将程序和 数据分成两部分,事实上,它们之间是混为一体的。 第 2 页 共 19 页
莲喇南餐多六号 管理信息系统 程序1← 数据集1 程序2←÷→ 数据集2 程序N← 数据集N 图3-1数据人工管理模型 在人工管理阶段,数据管理呈现如下特点: ●数据不保存。一组数据对应于一个应用程序,应用程序与其处理的数据结合成一个整体。 在进行计算时,系统将应用程序和数据一起装入,程序运行结束后,释放内存空间,程序 和数据同时被撤销。 ●没有软件对数据进行管理。应用程序设计者不仅要考虑数据之间的逻辑关系,还要考虑存 储结构、存取方法以及输入方式等。如果存储结构发生变化,程序中读写数据的程序也要 发生改变,数据没有独立性。 ●没有文件概念。数据的组织方法由程序设计人员自行设计和安排。 ● 数据面向应用。数据附属于程序,即使两个应用程序使用相同的数据,也必须各自定义数 据的存储和存取方式,不能共享相同的数据定义,因此,程序与程序之间可能有大量的重 复数据。 2.文件管理阶段 20世纪50年代后期到60年代中期,计算机不仅用于科学计算,也大量用于经营管理活动。硬 件设备有了磁盘、磁鼓等直接存储设备:软件发展了操作系统和各种高级语言。 文件系统的模型如图3-2所示。通过文件系统,程序和数据之间有了比较清晰的边界。不同的 程序可以使用相同的文件,反过来,一个程序也可以访问不同的文件。 文件系统阶段数据管理有如下特点: ·数据可长期保存在磁盘上。用户可通过程序对文件进行查询、修改、插入或删除操作。 ●文件系统提供程序和数据之间的读写方法。文件管理系统是应用程序与数据文件之间的一 个接口。应用程序通过文件管理系统建立和存储文件:反之,应用程序要存取文件中的数 据,必须通过文件管理系统实现。用户不必关心数据的物理位置,程序和数据之间有了一 定的独立性。 ●文件形式多样化。因为有了直接存取设备,所以可以建立索引文件、链接文件和直接存取 文件等。对文件的记录可顺序访问和随机访问。文件之间是相互独立的,文件与文件之间 的联系需要用程序实现。 数据的存取基本上以记录为单位。 第3页共19页
管理信息系统 程序 1 数据集 1 程序 2 数据集 2 程序 N 数据集 N 图 3-1 数据人工管理模型 在人工管理阶段,数据管理呈现如下特点: z 数据不保存。一组数据对应于一个应用程序,应用程序与其处理的数据结合成一个整体。 在进行计算时,系统将应用程序和数据一起装入,程序运行结束后,释放内存空间,程序 和数据同时被撤销。 z 没有软件对数据进行管理。应用程序设计者不仅要考虑数据之间的逻辑关系,还要考虑存 储结构、存取方法以及输入方式等。如果存储结构发生变化,程序中读写数据的程序也要 发生改变,数据没有独立性。 z 没有文件概念。数据的组织方法由程序设计人员自行设计和安排。 z 数据面向应用。数据附属于程序,即使两个应用程序使用相同的数据,也必须各自定义数 据的存储和存取方式,不能共享相同的数据定义,因此,程序与程序之间可能有大量的重 复数据。 2. 文件管理阶段 20 世纪 50 年代后期到 60 年代中期,计算机不仅用于科学计算,也大量用于经营管理活动。硬 件设备有了磁盘、磁鼓等直接存储设备;软件发展了操作系统和各种高级语言。 文件系统的模型如图 3-2 所示。通过文件系统,程序和数据之间有了比较清晰的边界。不同的 程序可以使用相同的文件,反过来,一个程序也可以访问不同的文件。 文件系统阶段数据管理有如下特点: z 数据可长期保存在磁盘上。用户可通过程序对文件进行查询、修改、插入或删除操作。 z 文件系统提供程序和数据之间的读写方法。文件管理系统是应用程序与数据文件之间的一 个接口。应用程序通过文件管理系统建立和存储文件;反之,应用程序要存取文件中的数 据,必须通过文件管理系统实现。用户不必关心数据的物理位置,程序和数据之间有了一 定的独立性。 z 文件形式多样化。因为有了直接存取设备,所以可以建立索引文件、链接文件和直接存取 文件等。对文件的记录可顺序访问和随机访问。文件之间是相互独立的,文件与文件之间 的联系需要用程序实现。 z 数据的存取基本上以记录为单位。 第 3 页 共 19 页
莲喇头特倚餐多本居 管理信息系统 文件1 程序1 文件2 文件系统 程序2 文件3 程序3 图3-2文件系统模型 文件系统的缺陷是: 。数据冗余大,因为文件是为特定的用途设计的,因此会造成数据在多个文件中重复存储。 ●数据的不一致。这是由数据冗余和文件之间的独立性造成,在更新数据时,很难保证同一 数据在不同文件中的统一。 ·程序与数据之间的独立性差。修改文件的存储结构后,相关的程序也要修改。 3.数据库管理阶段 20世纪60年代后期开始,存储技术有了很大的发展,产生了大容量磁盘。计算机用于管理的规 模更加庞大,数据量急剧增长,为了提高效率,人们着手开发和研制更加有效的数据管理模式,并 由此提出了数据库的概念。 1968年,IBM公司研制成功数据库管理系统(Information Management System,IMS)标志着数 据管理技术进入了数据库阶段。MS为层次型数据库。l969年,美国数据系统语言协会(Conference On Data System Language)公布了数据库工作组报告,对研制开发网状数据库起了巨大推动作用。l970 年,BM公司的研究员EE.Codd连续发表论文,奠定了关系数据库的基础。 数据库系统的数据存取模型如图3-3所示。 应用程序1 数据库 应用程序2 管理系统 数据库 。。。。 应用程序n 图3-3数据共享示意图 与文件管理相比,数据库技术有了很大的改进,主要表现为: ●数据库中的数据是结构化的。在文件系统中,数据是无结构的,即不同文件中的记录之间 第4页共19页
管理信息系统 程序 1 程序 2 程序 3 文件 1 文件 2 文件 3 文件系统 图 3-2 文件系统模型 文件系统的缺陷是: z 数据冗余大,因为文件是为特定的用途设计的,因此会造成数据在多个文件中重复存储。 z 数据的不一致。这是由数据冗余和文件之间的独立性造成,在更新数据时,很难保证同一 数据在不同文件中的统一。 z 程序与数据之间的独立性差。修改文件的存储结构后,相关的程序也要修改。 3. 数据库管理阶段 20 世纪 60 年代后期开始,存储技术有了很大的发展,产生了大容量磁盘。计算机用于管理的规 模更加庞大,数据量急剧增长,为了提高效率,人们着手开发和研制更加有效的数据管理模式,并 由此提出了数据库的概念。 1968 年,IBM 公司研制成功数据库管理系统(Information Management System,IMS)标志着数 据管理技术进入了数据库阶段。IMS 为层次型数据库。1969 年,美国数据系统语言协会(Conference On Data System Language)公布了数据库工作组报告,对研制开发网状数据库起了巨大推动作用。1970 年,IBM 公司的研究员 E F. Codd 连续发表论文,奠定了关系数据库的基础。 数据库系统的数据存取模型如图 3-3 所示。 应用程序 1 数据库 应用程序 2 图 3-3 数据共享示意图 与文件管理相比,数据库技术有了很大的改进,主要表现为: z 数据库中的数据是结构化的。在文件系统中,数据是无结构的,即不同文件中的记录之间 应用程序 n 管理系统 数据库 ···· 第 4 页 共 19 页
肖外垤悔贸多大是 管理信息系统 没有联系,它只在数据项之间有联系。数据库系统不仅考虑数据项之间的联系,还要考虑 记录之间的联系,这种联系是通过存储路径来实现的。 ●数据库中的数据是面向系统的,对于任何一个系统来说,数据库中的数据结构是透明的。 任何应用程序都可以通过标准化接口访问数据库,如图3-3所示。 数据库系统比文件系统有较高的数据独立性。 ● 数据库系统为用户提供了方便统一的接口。用户可以用数据库系统提供的查询语言和交互 式命令操纵数据库。用户也可以用高级语言编写程序来访问数据库,扩展了数据库的应用 范围。 不仅如此,数据库技术的发展使数据管理上了一个新台阶,在数据完整性、安全性、并发访问 和数据恢复方面,数据库管理系统都提供了非常完善的功能选择。 ●数据完整性 保证数据库存储数据的正确性。例如预定同一班飞机的旅客不能超过飞机的定员数:定购货物 中,订货日期不能大于发货日期。使用数据库系统提供的存取方法,设计一些完整性规则,对数据 值之间的联系进行校验,可以保证数据库中数据的正确性。 ●数据安全性 并非每个应用都可以存取数据库中的全部数据。例如在一个人事档案数据库中,只有被授权的 访问者才可以读取数据,并进行修改:其他访问者的权限一般限于浏览特定的数据项,而不是全部 数据。 ●并发控制 当多个用户同时存取、修改数据库中的数据时,可能会发生相互干扰,使数据库中的数据完整 性受到破坏,而导致数据的不一致。数据库并发控制防止了这种现象的发生,提高了数据库的访问 效率。 ●数据库的恢复 任何系统都不可能永远正确无误地工作,数据库系统也是如此。运行过程中,会出现硬件或软 件的故障。数据库系统具有恢复能力,能把数据库恢复到最近某个时刻的正确状态。 3.1.2数据库系统的体系结构 可以从不同的角度分析数据库系统的体系结构,从DBMS角度看,数据库系统采用三级模式结构, 也就是内模式、外模式和概念模式;从数据库的物理分布来考察,又分为集中式数据库、C/S结构、 B/S结构等,这就是数据库系统的体系结构。 目前市场上流行的数据库系统软件产品多种多样,支持不同的数据模型,使用不同的数据库语言 和应用系统开发工具,建立在不同的操作系统之上,但绝大多数数据库都具有三级模式的特征。数 据库的三级模式分为:外模式、内模式和概念模式,如图3-4所示。 第5页共19页
管理信息系统 没有联系,它只在数据项之间有联系。数据库系统不仅考虑数据项之间的联系,还要考虑 记录之间的联系,这种联系是通过存储路径来实现的。 z 数据库中的数据是面向系统的,对于任何一个系统来说,数据库中的数据结构是透明的。 任何应用程序都可以通过标准化接口访问数据库,如图 3-3 所示。 z 数据库系统比文件系统有较高的数据独立性。 z 数据库系统为用户提供了方便统一的接口。用户可以用数据库系统提供的查询语言和交互 式命令操纵数据库。用户也可以用高级语言编写程序来访问数据库,扩展了数据库的应用 范围。 不仅如此,数据库技术的发展使数据管理上了一个新台阶,在数据完整性、安全性、并发访问 和数据恢复方面,数据库管理系统都提供了非常完善的功能选择。 z 数据完整性 保证数据库存储数据的正确性。例如预定同一班飞机的旅客不能超过飞机的定员数;定购货物 中,订货日期不能大于发货日期。使用数据库系统提供的存取方法,设计一些完整性规则,对数据 值之间的联系进行校验,可以保证数据库中数据的正确性。 z 数据安全性 并非每个应用都可以存取数据库中的全部数据。例如在一个人事档案数据库中,只有被授权的 访问者才可以读取数据,并进行修改;其他访问者的权限一般限于浏览特定的数据项,而不是全部 数据。 z 并发控制 当多个用户同时存取、修改数据库中的数据时,可能会发生相互干扰,使数据库中的数据完整 性受到破坏,而导致数据的不一致。数据库并发控制防止了这种现象的发生,提高了数据库的访问 效率。 z 数据库的恢复 任何系统都不可能永远正确无误地工作,数据库系统也是如此。运行过程中,会出现硬件或软 件的故障。数据库系统具有恢复能力,能把数据库恢复到最近某个时刻的正确状态。 3.1.2 数据库系统的体系结构 可以从不同的角度分析数据库系统的体系结构,从 DBMS 角度看,数据库系统采用三级模式结构, 也就是内模式、外模式和概念模式;从数据库的物理分布来考察,又分为集中式数据库、C/S 结构、 B/S 结构等,这就是数据库系统的体系结构。 目前市场上流行的数据库系统软件产品多种多样,支持不同的数据模型,使用不同的数据库语言 和应用系统开发工具,建立在不同的操作系统之上,但绝大多数数据库都具有三级模式的特征。数 据库的三级模式分为:外模式、内模式和概念模式,如图 3-4 所示。 第 5 页 共 19 页