410 likes | 507 Views
第一章 地理数据系统. 地理数据类型及其变换 地理数据的分布特征 地理数据库. 一 . 地理数据类型及其变换. ( 一 ) 地理数据的基本类型. 空间数据: 用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范围及空间联系。 属性数据:用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征。. 空间数据的表达:. 点 —— 由一个独立的坐标点( x , y )定位,是空间上不可再分的几何实体 。
E N D
第一章 地理数据系统 • 地理数据类型及其变换 • 地理数据的分布特征 • 地理数据库
一.地理数据类型及其变换 (一) 地理数据的基本类型 • 空间数据:用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范围及空间联系。 • 属性数据:用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征。
空间数据的表达: • 点——由一个独立的坐标点(x,y)定位,是空间上不可再分的几何实体 。 • 线——由若干个(至少两个,理论上是无穷个)坐标点(xi,yi)(i =1,2,…)定义,有一定的长度和走向,表示线状地物或点实体之间的联系。 • 面——表示在空间上连续分布的地理景观或区域。
点 网络 地域类型 区域 线 面 地带 三种基本的地理几何实体及其组合
(二)、地理数据的变换 是将原始数据的每个数据通过某种特定的运算把它们变成一个新的数值,而且数值的变化不依赖于数据集合中其他数据的数值。 变换方式:对数变换、开(立)方平方变换、倒数变换、概率变换、模数变换、指数变换、滑动平均变换、差分算子法、累加(减)生成数法 变换目的:去伪存真、易识规律、减少变幅、便于建模等。
二.地理数据的分布特征 (一) 地理数据的来源与整理 地理数据的渠道来源 : ① 来自于观测、测量部门的有关专业数据。 ② 来自于统计年鉴、统计公报中的有关自然资源及社会经济发展数据。 ③ 来自于有关单位或个人的不定期的典型调查数据、抽样调查数据。 ④ 来自于政府公报、政府文件中的有关数据。
来自于档案、图书等文献资料中的有关数据。 • 来自于互联网(Internet)的有关共享数据。 • 地图图件。主要包括各种比例尺的地形图、影像地图、专题地图等。 • ⑧遥感数据。主要包括各种航空遥感数据和卫星遥感数据。 • ⑨其它来源的有关数据。 整理的基本步骤: 1.检查资料 2.统计分组 3.绘制图表
举例说明: 上海市年降水量表(单位:mm)
第一步: 求变数的全距R 所谓全距(或称极差),就是地理数据中的最大值与最小值之差: 由上表可知: 第二步: 确定组数n , 按 Sturges公式计算: 或查下表:
可确定组数为8 第三步 计算组距h:
第四步 确定组限 组限是指组的界限,即组距两端的数值。数值小的为起点数值,称为下限;数值大的为终点数值,称为上限。 第一组的下限值,可从样本数据最小值中减去1/2的组距求得, 下限为: 其上限等于下限值再加上组距,即:
(二) 地理数据的分布特征值 (一)集中性的代表值 • 1.平均数: ① 算术平均数 简单算术平均数 加权算术平均数
②几何平均数 • 未分组资料 • 分组资料
下表为各国原煤生产量,计算年平均发展速度 (单位:104t)
2.中位数(也称中央数):将地理数据按从大到小排列,居中间位置的那个数. ① 对于未分组的地理数据: 当样本数n为奇数时,中位数是位置排在第(n+1)/2位的数据: 例如现有某地九年年平均气温资料,如下表:
当样本数n为偶数时,中位数是排在中间位置的两个数据平均数:当样本数n为偶数时,中位数是排在中间位置的两个数据平均数: 例如,某地八年季节性冻土深度,如下表:
② 对于分组的地理数据: 确定中位数所在的组位置,可按下式计算中位数:
3.众数:是变量序列中出现频数(次数)最多的数. 计算方法 分为以下两种情况: ① 未分组的地理数据,可以根据每一个数据出现的频数大小直接确定众数。 ② 对于已经分组的地理数据,众数的计算步骤如下: a.确定频数最多的组为众数所在组。 b.按以下公式计算众数:
例1:下表给出了某农场各农田地块的面积,试计算其平均值、中位数和众数。例1:下表给出了某农场各农田地块的面积,试计算其平均值、中位数和众数。 应按照未分组数据计算其平均值(54.25)、中位数(52.5)和众数(50),
例2:下表给出了中国西部地区某城市2000年家庭月收入的抽样调查结果,试计算其平均值、中位数和众数。例2:下表给出了中国西部地区某城市2000年家庭月收入的抽样调查结果,试计算其平均值、中位数和众数。
解题步骤: • 用公式(2.4.2)计算平均数: • 计算中位数。先确定中位数所在组的位置,再按照(2.4.3)计算中位数Me =2588.46(元),或者按(2.4.4)计算中位数。 • 计算众数。先确定众数所在组。再按照公式(2.4.5)计算众数。首先确定众数所在组。显然,众数所在组应该在第二组。再按照公式(2.4.5)计算众数M0 =3476.19 (元),或者按照公式(2.4.6)计算众数(元)。
x 偏倚性的三种情形 比较平均数、中位数和众数的相对位置关系
(二)离散性的代表值 1.绝对离散度 (1)离差(偏差、离均差): 指每一个地理数据与平均值的差,代表每一个数据与平均值的离散程度。计算公式为: 例如,朝阳县和固原县1961~1970年间的降水量离差表,如下表:
离差表 (2)离差平方和: 它从总体上衡量一组地理数据与平均值的离散程度,其计算公式为:
(3)方差 各离差平方和除以其数据的个数。 总体方差计算公式为: 样本方差计算公式为:
(4)标准差 总体标准差(方差的平方根),计算公式为: 样本标准差计算公式为:
式中 n-1称为自由度 1.设一个样本含有n个变量,都同样用来计算标准差,每一个 与 比较都有一个离差。但均值也是从样本资料中估算出来的,即由每一个变量与自身的1/n做比较,实际上相当与n-1个比较。 2.样本方差受 的约束,在n个离差之中只有n-1个离差可以自由取值。
2.相对离散度 变异系数(或离差系数、变差系数),简记作(Cv):表示了地理数据的相对变化(波动)程度,其计算公式为:
例:对于下表中的数据,分别计算极差、离差、离差平方和、方差、标准差、标准差的无偏估计,以及变异系数。例:对于下表中的数据,分别计算极差、离差、离差平方和、方差、标准差、标准差的无偏估计,以及变异系数。
步骤: • 计算离差平方和: • 计算方差: • 计算标准差: • 计算标准差的无偏估计(样本标准差): • 计算变异系数:
例:变异系数的一个应用实例--中国经济发展水平的省际差异分析例:变异系数的一个应用实例--中国经济发展水平的省际差异分析 以xi代表中国各省(市、自治区)的人均GDP,则计算得到的变异系数Cv就测度了中国经济发展水平的省际差异。
结果分析: • 变差系数由1978年的117.64%减小到1990年的66.82%,然后再增加到1999年的76.66%。 • 在1978~1990年期间,中国经济发展水平的省际差异呈缩小趋势,而1990~1999年期间则呈扩大趋势。 • 国家区域发展政策的实施对省际经济发展差异的变化有很大的影响。
三.地理数据库 (一) 数据库 数据库理论上定义为贮存的数据集合,它采用多个系统或程序能共同使用的形式贮存数据. (二) 地理数据库的建立 地理数据库主要包括以下几个部分: 1.计算机硬件设备 2.地理数据库软件—数据库管理系统(DBMS) • 建立数据库命令 • 添加数据命令 • 删除数据命令 • 修改数据命令 • 检索数据命令
3.地理数据文件 • 4.地理数据库应用程序 • 地理数据库建立步骤包括: • 用户需求调查 • 系统分析 • 系统设计 • 系统调试与运行