450 likes | 629 Views
第 6 章 数据库系统与 信息系统. 本章学习目标 本章主要介绍数据库的基本知识,以及 数据库系统的一般体系结构,其中概括介绍了关系系统 。 ● 为什么要采用数据库方法进行数据管理 ● 知道一个数据库系统由哪些部分组成. ● 知道数据库系统的三种数据模型,当前主要以哪一种为主 ● Access 2002 数据库系统中数据库的创建与设计、操纵与应用 ● 信息系统 基本概念 ● 知道进行信息系统开发有哪些数据库系统和可视化工具. 第6章 数据库系统与信息系统.
E N D
第 6 章 数据库系统与信息系统 本章学习目标 本章主要介绍数据库的基本知识,以及数据库系统的一般体系结构,其中概括介绍了关系系统。 ● 为什么要采用数据库方法进行数据管理 ● 知道一个数据库系统由哪些部分组成
● 知道数据库系统的三种数据模型,当前主要以哪一种为主 ● Access 2002数据库系统中数据库的创建与设计、操纵与应用 ● 信息系统基本概念 ● 知道进行信息系统开发有哪些数据库系统和可视化工具
第6章 数据库系统与信息系统 6.1 数据库系统和数据模型 6.2 数据库应用实例 6.3Access 2002数据库管理系统 6.4 信息系统
6.1 数据库系统和数据模型 • 6.1.1 数据处理简史 • 6.1.2 数据库的体系结构 • 6.1.3 数据模型的基本概念
6.1.1 数据处理简史 • 1. 文件处理系统 • 2. 初期的数据库技术 • 3.客户机—服务器数据库应用 • 4.使用Internet技术的数据库 • 5.新的数据库技术
新的数据库技术 • 新的开发工具,新型事务模型,动态模式数据库,非精确查询 • 分布式数据库和并行数据库 • (2) 多媒体数据库技术 • (3) 知识库和数据挖掘技术 • (4) 演绎数据库 • (5) 主动数据库
6.1.2 数据库方法 首先,要求数据作为公共资源而集中管理控制,为许可的各种用户所普遍共享,消去数据冗余,节省存储空间。 其次,当数据变更时,能节省对多个数据副本的多次变更操作,保持数据的一致性。 再次,还要求数据具有更高的独立性,不但具有物理独立性,而且具有逻辑独立性。
数据库方法的优点: 1.数据集成 数据的集成是数据库管理系统的主要目的。通过数据集成来统一计划与协调遍及各相关应用领域的信息资源,这样可使数据得到最大程度的共享,且冗余最少。
2.数据共享 集成的数据管理
3.数据冗余最少 在非数据库系统中.每个应用拥有各自的数据文件,这常常带来大量的数据冗余,如上述工资发放应用、人事应用、劳资应用和业务档案应用,每一个都可能拥有一个包含职工信息(如职工号、姓名、性别、职称、工资等)的文件。对于数据库方法,如前所述,这些分立而有冗余的数据文件被集成为单一的逻辑结构.而且每一数据项值可以理想地只存储一次。
4.数据一致性 通过消除或控制数据冗余,可以在一定范围内避免数据的不一致性。例如,假定张三的工资“115元”这个数据存储在数据库的两个不同记录中,则当张三工资变动而要更新他的工资额时,若无控制,且只更新一个记录,则会引起同一数据的两个副本的不一致性,此时称数据库是不一致的。 显然,引起不一致性的根源是数据冗余。若一个数据在数据库中只存储一次,则根本不可能发生不一致性。
5.实施统一标准 数据库对数据进行集中管理控制,但数据库必须由人实现和进行维护管理,所以一个数据库系统必须包括一个称为数据库管理的组织机构(DBA)。其在管理上负责制定并实施进行数据管理的统一标准和控制过程。统一标准的数据有利于共享与彼此交换,有利于数据定义的重叠或冲突问题的解决以及今后的变更。
6.统一安全、保密和完整性控制 DBA机构对数据库有完全的管辖权且负责建立对数据的加入、检索、修改、删除权限及有效性的检验过程,可以对数据库中各种数据的每一类型的操作建立不同的检验过程。这种集中控制和标准过程较之分散数据文件的系统加强了对数据库的保护,使数据的定义或结构与数据之间的使用发生冲突的可能性最小。在检验控制方面,数据库比传统的文件危险性更大,因为它牵涉的用户更多。
7.数据独立 数据说明与使用数据的程序分离称为数据独立。换句话说,就是数据或应用程序的修改不彼此引起对方的修改(在适当范围内)。数据库系统提供了两层数据独立。其一是,不同的应用程序(用户)对同样的数据可以使用不同的视图,这意味着应用程序在一定范围内修改时,可以只修改数据库视图而不修改数据本身的说明;反之,数据说明的修改,在一定范围内不引起应用程序的修改。这种独立称数据的逻辑独立。其二是,可改变数据的存储结构或存取方法以适应变化的需求而无需修改现有的应用程序,这称为数据的物理独立。
8.减少应用程序的开发与维护 数据库方法表现在应用方面的一个主要优点是:在数据库上开发新的事务所花的代价和时间大大减少。由于数据库中的数据具有共享性、独立性及统一标准等,使程序设计员不再承担主文件(基本数据文件)的设计、建造与维护的繁重负担,所以开发新应用软件的代价和为用户提供服务所需要的时间期限等,都可大大减小。
6.1.3 数据库的体系结构 • DBMS的三级体系结构 ANSI/SPARC DBMS研究组提出的数据库管理系统的体系结构分为三层: • 内模式(存储模式)是最接近物理存储的—也就是数据的物理存储方式 • 外模式(用户模式)是最接近用户的—也就是用户所看到的数据视图 • 概念模式(公共逻辑模式,或有时称逻辑模式)是介于前两者之间的间接的层次
一个数据库系统是由数据、软件、硬件和人员组成的一个集合体。一个数据库系统是由数据、软件、硬件和人员组成的一个集合体。 2.数据库 一个数据库可以定义为满足一个或多个用户信息要求的集成数据存储库。此定义包含了一个数据库的要素:集成、共享、存储和信息。关于数据库的集成与共享在前面已有较详细叙述,这里不再重复,现仅就后两者作简要说明。
数据库的存储指的是它存储于计算机系统中。一个数据库包含的数据量很大,一般用数以兆字节计,所以只能存于外存设备(主要是磁盘)上,数据库在运行过程中还将不断扩大,因此要求外存储器容量较大。另一面,数据库中包含的数据类型多,数据间的联系复杂,因而有一个数据在存储设备上如何组织及如何有效存取的问题,同时,还要根据用户的地理分布要求确定数据应是存储于单个计算机系统中还是分散于多个计算机系统中。
3. 数据库系统软件 数据库系统的终端用户关心的是业务,他们将数据库系统作为一个工具用来实现他们的业务工作,要将用户的要求变成对物理数据库的存取,在用户与物理数据库之间需要一系列软件的支持。
(1)数据库管理系统 处理所有用户对数据库存取请求的软件系统叫数据库管理系统或DBMS(Data Base Management System),它是数据库系统中的核心软件部件。由DBMS提供的一个总的功能是向用户隐蔽数据库的物理(或硬件)级细节,换句话说,就是提供了一个比物理级更高的数据库视图,并支持按这个更高视图表示的用户操作。 DBMS有两个主要支持操作的部分:数据库控制子系统和数据库存储子系统。数据库控制子系统是面向用户的,它接受用户程序的数据请求(如“读”、“写”等)。
(2)非DBMS软件 非DBMS是指除DBMS之外作为一个一般意义下的数据库管理系统应该具有的软件部件,它与DBMS协同工作但不属于DBMS本身的功能部件。这类软件主要有:操作系统、程序设计语言及其编译系统,在数据库系统中程序设计语言又称为宿主语言,如COBOL、FORTRAN、C语言等;数据通信系统,它管理所有与远程终端的通信;各种应用程序,它们直接服务于终端用户的各种业务需求,并向DBMS发数据请求。
(3)集成数据库管理软件 这种软件是辅助或配合DBMS工作的功能部件,一般不能独立使用,总是与某种DBMS集成在一起,但非DBMS所必备的功能,是在DBMS上再开发的。这种软件有自动报表生成程序、表处理程序、数据库应用开发工具、数据库辅助设计工具、数据库测试工具、数据转换设施等等,如dBASE的dFORMAT,Rdb的DATATRIEVE和FMS等。
4.数据库系统用户 一个数据库系统的建设与许多人相关,按他们的技能与工作性质的不同可分为两大类:数据处理与非数据处理人员。 数据处理人员包括应用程序员、系统程序员、数据库管理员(DBA)、计算机操作员(包括数据录入员)。 非数据处理用户就是一般的业务人员,他们没有什么数据处理专业知识。上述各类人员的工作都是为了支持他们的,所以他们称为最终(或终端)用户。
5.数据库系统硬件 数据库系统对硬件也有一些特殊要求,如要求较大的内存。因为,操作系统、数据库管理系统的各功能部件及应用程序要存储在内存,还有数据库的各种表格、目录、系统缓冲区、各用户工作区及系统通信单元等都要占用内存。 数据库本身要求大容量直接存取存储设备和较高的通道能力。一般的数据库系统都要求处理机有较强的数据处理能力,如变字长运算、字符处理等。
6.1.4 数据模型的基本概念 数据模型是用来描述数据的一组概念和定义。一般来说,数据的描述包括数据的静态特性和数据的动态特性两个方面。 现在世界上运行的数据库系统有好几百,分类方法也很多,但根据它们的数据模型来看,可划分为三类:层次模型、网状模型、关系模型。
6.2 数据库应用实例 6.2.1 对学生选课例子的感性认识 6.2.2对学生选课例子的理性认识 6.2.3 学生选课系统的工程设计
6.2.1 对学生选课例子的感性认识 建立一个信息管理系统以实现对学生选课这一信息的管理 姓名 学号 年龄 性别 课程名称 课程号 成绩 授课老师 老师职称
关系模型的基本结构是表,即关系 关系模型是建立在集合论的基础上,用集合代数来定义一个关系,关系可形象化为一张二维表。 关系模型由关系数据结构、关系数据操作和关系数据的完整性约束条件三部分组成。在关系模型中,客观世界的实体以及实体之间的各种联系均用关系来表示。 为了保证关系数据库的正确性,关系模型有3 类完整性约束条件:实体完整性、参照完整性和用户定义的完整性。
6.2.2 对学生选课例子的理性认识 1 感性认识中存在的问题 • 例如,设有包括11个属性的学生选课关系模式SDC(学号,姓名,授课教师,成绩,系代码,系名,系所在地,课程号,课程名,课程类别,学分) • 在该模式中就可能出现上述提到的一些异常。为解决这些异常,现将该模式分解如下: • S(学号,姓名,课程号,成绩,系代码) • D(系代码,系名,系所在地) • C(课程号,课程名,学分) • TC(授课教师,课程号,课程类别)
2 关系模式的范式 在以关系模型为基础的数据库中,用关系来描述现实世界。关系具有概念单一性特点,一个关系可以描述一个实体,又可以描述实体之间的联系。关系数据库设计理论主要包括三方面的内容:数据依赖,范式,模式设计方法。数据依赖在此起着核心作用。 对关系规范化的分解过程体现出了“一事一地”的设计原则,即一个关系反映一个实体或一个联系,不应当把几样东西混合在一起。
3 对“学生选课”问题的理性认识 关系模式的规范化是关系到数据库设计的重要概念,规范化的目的是使结构合理,消除存储异常,使数据冗余尽量小,便于插入、删除和更新。关系规范化的原则是:遵从概念单一化“一事一地”原则
6.2.3 学生选课系统的工程设计 从概念模型向关系模型的转换的实质,是认识过程由感性认识抽象上升到理性认识(理论)的过程。 1. E-R图 美籍华人陈平山1976 年提出了用E-R 模型来描述客观世界并建立概念模型的工程方法。该方法也被称为实体联系模型或E-R 图
2. E-R 图转换为关系模型 概念模型只是客观世界到机器世界的一个中间层次,它还需要转换成机器世界能支持的数据模型,即关系模型。 根据概念模型向关系模型的转换规则,例子的概念模型E-R 图可以转换为下面的关系模型,关系的码用下划线标出。 学生={学号,姓名,年龄,性别} 课程={课程号,课程名,学时,学分} 学生成绩={学号,课程号,分数}
在关系数据理论的指导下建立起正确的关系模型后,还要根据具体的关系数据库管理系统(如Oracle、Informix、SyBase或FoxPro等)对该模型进行定义,将以上三个表的有关定义和约束条件存放在数据库的数据字典中,供系统调用,便可进行有关数据的输入、修改和查询工作。在关系数据理论的指导下建立起正确的关系模型后,还要根据具体的关系数据库管理系统(如Oracle、Informix、SyBase或FoxPro等)对该模型进行定义,将以上三个表的有关定义和约束条件存放在数据库的数据字典中,供系统调用,便可进行有关数据的输入、修改和查询工作。
6.4 信息系统 6.4.1 信息系统的基本概念 6.4.2 几种常用的信息系统
6.4.1 信息系统的基本概念 • 信息系统定义为:对信息进行采集、处理、存储、管理、检索和传输、必要时并能向有关人员提供有用信息的系统。 • 信息系统(IS)是一个由人员、活动、数据、网络和技术等要素组成的集成系统,其目的是对组织的业务数据进行采集、存储、处理和交换,以支持和改善组织的日常业务运作,满足管理人员解决问题和制定决策对信息的各种需求
信息系统的分类 • (1)事务处理系统 • (2)管理信息系统 • (3)决策支持系统
2. 决策支持系统的组成 数据库管理子系统 模型库管理子系统 方法库管理子系统 知识库管理子系统 会话子系统
6.4.2 几种常用的信息系统 1. 管理信息系统 管理信息系统(MIS),一个由人、计算机等组成的能进行信息的收集、传送、储存、维护和使用的系统,能够实测企业的各种运行情况,并利用过去的历史数据预测未来,从企业全局的角度出发辅助企业进行决策,利用信息控制企业的行为,帮助企业实现其规划目标
2 地理信息系统GIS GIS(Geographic Information System)是计算机科学、地理学、测量学、地图学等多门学科综合的技术 GIS是处理地理数据的输入、输出、管理、查询、分析和辅助决策的计算机系统.。
3 资源信息系统 资源信息是巨大的社会财富,资源数据库是将各种资源信息转化为生产力、达到资源数据共享的重要手段。资源数据库是利用计算机输入、贮存、输出的先进技术和系统软件对数据进行科学的管理 目前国际上资源信息系统一般属于综合型较多、它集数据库、模型或专家系统、图形、图像系统于一体。资源信息系统的建立依赖于遥感技术和计算机技术的发展。