1 / 152

第三章:空间数据管理

第三章:空间数据管理. 一、前言 1. 数据管理的几个阶段. 人工管理阶段 文件系统阶段 数据库阶段 高级数据库阶段. 1) 人工管理阶段 (五十年代中期以前). ( 1 )没有专用的软件对数据进行管理; ( 2 )没有文件的概念; ( 3 )数据是面向应用的,不共享。. 2) 文件管理阶段. ( 1 )数据可以长期保存在文件中; ( 2 )由文件系统管理数据; ( 3 )数据共享性差,冗余度大; ( 4 )数据独立性差。. 数据独立性的含义 ( 1 ) 物理独立性 :用户的应用程序不会因为物理表示和 访问技术的改变而改变。

Download Presentation

第三章:空间数据管理

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第三章:空间数据管理

  2. 一、前言1.数据管理的几个阶段 • 人工管理阶段 • 文件系统阶段 • 数据库阶段 • 高级数据库阶段

  3. 1) 人工管理阶段(五十年代中期以前) (1)没有专用的软件对数据进行管理; (2)没有文件的概念; (3)数据是面向应用的,不共享。

  4. 2) 文件管理阶段 (1)数据可以长期保存在文件中; (2)由文件系统管理数据; (3)数据共享性差,冗余度大; (4)数据独立性差。 数据独立性的含义 (1)物理独立性:用户的应用程序不会因为物理表示和 访问技术的改变而改变。 (2)逻辑独立性:用户的应用程序与数据库的逻辑结构 是相互独立的,也就是说,数据的逻辑结构改变了,用 户程序也可以不变。

  5. 应用程序 1 文件 1 文件 2 存 取 方 法 应用程序 2 应用程序 3

  6. 3) 数据库阶段 特点: (1)数据结构化是数据库与文件系统的根本区别; (2)数据的共享性高,冗余度低,易扩展; (3)数据独立性高; (4)数据库系统为用户提供了方便的用户接口; (5)数据由DBMS统一管理和控制。 —数据的安全(Security)保护 —数据的完整性(Integrity)检查 —并发(Concurrency)控制 —数据库恢复(Recovery)

  7. 应用程序 1 数据 数据 数据 应用程序 2 DBMS 数据 应用程序 3 数据库系统阶段

  8. 各阶段的比较 阶段 人工管理阶段 文件处理阶段 数据库系统 时间 50年代 60年代 70年代 数据共享性 无共享 共享差 共享好 数据独立性 无独立性 独立性差 物理独立性高 一定逻辑独立性 数据结构化 无结构化 纪录内有结构 整体结构化 整体结构化差 用数据摸型描述

  9. 4) 高级数据库阶段 • 分布式数据库 • 空间数据库 • 面向对象数据库 • 数据仓库

  10. 常用的数据文件顺序文件、索引文件、随机文件、倒排文件。常用的数据文件顺序文件、索引文件、随机文件、倒排文件。 GIS中常自定义数据文件来组织空间数据。 2. 数据文件 1)、顺序文件(Sequential File) 最简单的文件组织形式顺序文件中数据按记录中主关键字的顺序组织。 顺序文件的记录,逻辑上是按主关键字排序的,而在物理存储上可以有不同的方式,包括: 向量方式、链方式、块方式。

  11. 4205 4215 1002 4210 4200 1003 1001 1004 向量方式 : 逻辑结构同物理结构一致; 链方式 : 通过指针连结逻辑顺序; 块方式 : 上述两种方式的结合(块内是向量方式 ,块间是链方式 ) 链方式 物理地址 逻辑地址 内容 盘地址 关键字 数据项 4200 1001 4205 1002 4210 1003 4215 1004 顺序文件的查找主要为顺序查找、折半查找等

  12. 2)索引文件(Index File) 存储内容包括: 1.记录本身(主文件) 2.若干索引表 这种带有索引表的文件叫索引文件。

  13. 索引表中列出: 1.记录的关键字 2.记录在文件中的位置(地址)。

  14. 弧段数据文件 弧段索引表

  15. 如已知一多边形坐标数据文件,可建立索引文件如已知一多边形坐标数据文件,可建立索引文件 多边形号 坐标点数 1001 102 x1 y1 X2 y2 x3 y3 …. x101 y101 x1 y1 200 65 x1 y1 x2 y2 …. x64 y64 x1 y1 2006 86 x1 y1 • 索引文件 索引有序文件 • 多边形号 物理地址 多边形号 物理地址 • 200 • 200 1001 • 2006 2006 无序 有序

  16. 读取记录时,只要提供记录的关键字值,系统通过查找索引表获得记录的位置,然后取出该记录。读取记录时,只要提供记录的关键字值,系统通过查找索引表获得记录的位置,然后取出该记录。 索引表一般都是经过排序的,也可以是非顺序的;可以是单级索引,也可以是多级索引,多级索引可以提高查找速度,但占用的存储空间较大.

  17. 随机文件又称直接文件,其存储是根据记录关键字的值,通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。查找时,通过同样的转换方法,可以直接得到所需要的记录 。 3)、随机文件(Direct Access File)

  18. 通过HASH函数(哈希函数) 把关键字转换为地址进行存取的文件。 D= F(Key) 哈希函数

  19. 4)倒排文件(Inverted File ) • 倒排文件是带有辅索引的文件,其中辅索引是按照一些辅关键字来组织索引的(注意:索引文件是按照记录的主关键字来构造索引的,也叫主索引)。 • 倒排文件是一种多关键字的索引文件,其中的索引不能唯一标识记录,往往同一索引指向若干记录。通过辅索引不能直接读取记录,而要通过主关键字才能查到记录的位置。

  20. 倒排文件的主要优点: 在处理多索引检索时,可以在辅检索中先完成查询的‘交’、‘并’等逻辑运算,得到结果后再对记录进行存取,从而提高查找速度.

  21. 土地资源文件

  22. 3、数据库(Database,简称DB) 数据库是是存储在计算机中、按一定数据模型组织、可共享的数据集合,这些数据用于各种应用系统中。 应用程序1 应用程序2 应用程序3 • 数据库中数据的特点: • 数据是持久的 • 数据是集成的 • 数据是共享的 • 数据按一定的数据模型组织、描述和储存

  23. 4、数据库管理系统(DBMS) DBMS(DataBase Management System)是位于用户与操作系统之间的一层数据管理软件,它提供了数据库的访问接口。 DBMS的主要功能: • 数据定义功能 • 数据操作功能 • 数据库运行管理(恢复、并发控制、安全性、完整性) • 数据库的建立和维护功能 DBMS的目的: 提供方便地、有效地存取数据库信息的环境。

  24. DBMS在信息系统中的位置 应用开发系统 DBMS 操作系统 硬件

  25. 5、数据库系统(Database System DBS) 数据库系统是指在计算机系统中引入数据库后的系统,包括: 数据库 数据库管理系统(及其开发工具) 应用系统 数据库管理员 用户 Database Administrator DBS = DB + DBMS + APPLICATION + DBA + USER

  26. 最终用户 应用系统 应用开发工具 DBMS 应用程序员 操作系统 数据库管理员 数据库 数据库系统构成

  27. 小知识点:文件处理系统和数据库管理系统 • 数据定义使用特定的数据结构定义,利用文件形式存储,称之为文件处理系统。 文件处理系统

  28. 文件处理系统缺点: • 首先每个应用程序都必须直接访问所使用的数据文件,应用程序完全依赖于数据文件的存储结构,数据文件修改时应用程序也随之修改; • 其次的是数据文件的共享程度差; • 另外缺乏集中控制也会带来一系列数据库的安全问题。

  29. 数据库管理系统 • 数据库管理系统(Database Management System,DBMS)是在文件处理系统的基础上进一步发展的系统。 可以认为,DBMS在用户应用程序和数据文件之间起到了桥梁作用。

  30. DBMS优点: DBMS优点是提供了数据独立性,即应用程序访问数据文件时,不必知道数据文件的物理存储结构。当数据文件的存储结构改变时,不必改变应用程序 。

  31. 小知识点:空间数据库与空间数据库管理系统 • 空间数据库指的是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般以特定结构的文件的形式组织在存储介质之上的。 • 空间数据库管理系统则是指对物理介质上存储的地理空间数据进行语义和逻辑上的定义,提供必需的空间数据查询检索和存取功能,以及能够对空间数据进行有效的维护和更新的一套软件系统。

  32. 二、空间数据模型

  33. 传统的地理数据模型 • 1)层次模型 树数据结构 描述了各类客体及客体之间的联系。然而,层次模型限制每个客体类最多只能有一个双亲客体类,而一个双亲客体则可有多个子女客体类。 双亲和子女客体类之间即形成了所谓的层次关系。

  34. 用户区 A B C N1 A N4 a3 a4 N3 a5 a6 a3 a4 a6 a3 a5 a1 a5 a6 a2 B C N1N4 N1N3 N3N4 N1N4 N2N4 N1N2 N2N4 N3N4 N2N3 a1 a2 N2 优点:层次分明,组织有序; 缺点:数据独立性较差;难以表达多对多的关系;导致数据冗余

  35. 用户区 N1 A A B C N4 a3 a4 N3 a5 a6 B a1 a2 a3 a4 a5 a6 C a1 a2 N2 N1 N2 N3 N4 2)网络模型 图数据结构 优点:能描述多对多关系 缺点:结构复杂,限制它在空间数据表达中的应用

  36. 3)关系模型 表数据结构 80年代后主导数据库是基于关系模型。关系模型的理论基础是关系理论,它通过关系运算操作数据。 优点:概念简单,结构灵活,易理解,易维护;有标准的关系查询语言SQL支持。 缺点:不适合描述非结构特征数据

  37. N1 A N4 a3 a4 N3 a5 a6 B C a1 a2 N2

  38. 关系模型中的有关概念 关系:关系是一个二维表,表的每行对应一个元组,表的每一列对应一个域。 关键字:关系中的某一属性组,若它的值唯一地标识了一个元组,则称该属性组为候选关键字。若一个关系中有多个候选关键字,则选定一个为主关键字。 关系数据库:一系列关系的集合构成一个关系数据库。关系数据库有型、值之分。 关系完整性:即指关系的正确性、相容性和有效性。它是给定的关系模型中数据及其联系的所有制约和依存规则,用以限定数据库状态及状态变化,从而保证数据的正确、相容和有效。

  39. 关系模型的完整性有三类:实体的完整性、参照完整性和用户定义的完整性关系模型的完整性有三类:实体的完整性、参照完整性和用户定义的完整性

  40. 范式:关系满足某种规范化的形式称为范式。从一个低一级范式的关系模式,通过模式分解转换为若干个高一级关系模式集合的过程,叫做规范化。范式:关系满足某种规范化的形式称为范式。从一个低一级范式的关系模式,通过模式分解转换为若干个高一级关系模式集合的过程,叫做规范化。 第一范式:关系中的每个属性是原子的、不可分割的数据项。在关系数据库中,若一个关系模式满足1NF,它就是合法的。

  41. 非第一范式关系表

  42. 第一范式关系表

  43. 第二范式:是指关系在满足1NF的基础上,每一个非主属性完全函数依赖于该关系的关键字。即当一个非关键字字段部分地函数依赖于关键字时,就违反了2NF。第二范式:是指关系在满足1NF的基础上,每一个非主属性完全函数依赖于该关系的关键字。即当一个非关键字字段部分地函数依赖于关键字时,就违反了2NF。

  44. 分解为第二范式的关系表 非第二范式关系表 *学生学号 *学生学号 *学生学号 学生姓名 *课程名称 学生姓名 性别 性别 成绩 籍贯 籍贯 课程名称 成绩

  45. 第三范式:指关系在满足第二范式的基础上,其非关键字属性(即非主属性)既非函数依赖,也不传递依赖于关键字,即属于3NF的关系,其非关键字属性之间都是独立的,不存在函数依赖关系第三范式:指关系在满足第二范式的基础上,其非关键字属性(即非主属性)既非函数依赖,也不传递依赖于关键字,即属于3NF的关系,其非关键字属性之间都是独立的,不存在函数依赖关系

  46. 非第三范式关系中的传递依赖 分解成两个第三范式关系 * 生学号 * 生学号 *学生所在系 学生姓名 学生姓名 性别 系所在地点 性别 出生日期 出生日期 籍贯 籍贯 学生所在系 学生所在系 系所在地点

  47. 传统数据模型存在的主要问题(黄杏元,地理信息系统概论)传统数据模型存在的主要问题(黄杏元,地理信息系统概论)

  48. 面向对象的地理数据模型(自学) 1、概念 a.基本思想:面向对象的基本思想是通过对问题领域进行自然分割,用更接近人类通常思维的方式建立问题领域的模型,并进行结构模拟和行为模拟,从而使设计出的软件能尽可能地直接表现出问题的求解过程。

  49. Polygon-object 对象标识 arc-object 对象状态 Function(perimeter) 对象功能 私有消息 公有消息 b.一些术语的基本概念: • 对象

  50. • 消息 • 方法

More Related