290 likes | 439 Views
第四章 空间分布. 主要内容:. §4 - 1 空间分布类型. §4 - 2 空间分布参数的描述. §4 - 3 空间聚类. §4 - 1 空间分布类型. 分布对象 :点、线、面。 分布区域 :线、面 。 分布方式 :离散、连续. §4 - 2 空间分布参数的描述. 以数字形式对空间分布进行描述,常用的描述参数施 分布密度 、 平均值 、 极值 、 离差等 。. 1 、分布密度和均值 1 ) 分布密度 :指单位分布区域内的分布对象的数量,是两个比率尺度数据的比值。 注意 :应采用正确的计算方法。 在分布密度的计算中有两个计量问题:
E N D
第四章 空间分布 主要内容: §4-1 空间分布类型 §4-2 空间分布参数的描述 §4-3空间聚类
§4-1 空间分布类型 分布对象:点、线、面。分布区域:线、面 。分布方式:离散、连续
§4-2 空间分布参数的描述 以数字形式对空间分布进行描述,常用的描述参数施分布密度、平均值、极值、离差等。 1、分布密度和均值 1)分布密度:指单位分布区域内的分布对象的数量,是两个比率尺度数据的比值。 注意:应采用正确的计算方法。 在分布密度的计算中有两个计量问题: 一是分布对象即分子的计算: • 对分布对象发生频数的计算 • 对分布对象几何度量的计算 • 对点状要素以频数计 • 对线状要素以长度计 • 对面积要素以面积计 • 对分布对象的某种属性的计算。例如对沿河流分布的城市计算其人口。 二是对分布区域即分母的计量 • 对线状分布区域按长度计算 • 对面状分布区域按面积计算
分布密度的计算举例: §4-2 空间分布参数的描述 1.某地区汽车加油站的密度=加油站数/总公里路程 2.某地区森林覆盖率=森林面积/地区总面积 3.某省人口密度=人口数/该省总面积 4.某地区交通网密度=交通网总长度/区域总面积 5.城市商业网点密度=商业网点数/城区总面积 6.某河流沿岸防护堤建筑比率=防护堤总长度/河岸总长度 2)均值:针对分布现象或者其属性的,如人口平均密度、城市平均规模、平均气温、平均高程等。
2、分布中心可概略表示分布总体的位置。一般用距离计算的方法描述。2、分布中心可概略表示分布总体的位置。一般用距离计算的方法描述。 §4-2 空间分布参数的描述 1)算术平均值中心 注:没有考虑点之间的差异。 2)加权平均中心 关键:权重的确定。
§4-2 空间分布参数的描述 3)中位中心 采用寻优算法
定义:在点群中设置一个点,该点到点群中各点的最大距离小于任何其他点相对于点群中最远点的距离定义:在点群中设置一个点,该点到点群中各点的最大距离小于任何其他点相对于点群中最远点的距离 地理意义:如果在n个点群中设置一个点位,那么应该力求使该点到点群中的所有点都不至于过远。 几何意义:(xe,ye)就是点群的最小外接圆的圆心。 近似方法:找出一点群中相距最远的点对,其连线的中心点可以作为(xe,ye)的起始替代点 §4-2 空间分布参数的描述 4)极值中心
§4-2 空间分布参数的描述 中位中心 极值中心 平均中心 分布中心的距离是对两个不同点状群体之间的关系的最简单的描述。分布中心的移动是描述离散群体随时间在空间演变的一个重要参数。
对于离散点群,可以拟合一条直线L:.点群相对于L的距离反映了离散点群在点群走向上的离散程度,而L的走向则描述了点群的总体走向。对于离散点群,可以拟合一条直线L:.点群相对于L的距离反映了离散点群在点群走向上的离散程度,而L的走向则描述了点群的总体走向。 3、分布轴线离散点群在空间的分布趋势(走向)通过分布轴线来计算。 §4-2 空间分布参数的描述
4、离散度不同的离散度反映了不同的分布特性4、离散度不同的离散度反映了不同的分布特性 §4-2 空间分布参数的描述 分布中心相同 相同的分布密度
§4-2 空间分布参数的描述 1)平均距离:所有点与分布中心距离的平均值 2)标准距离:一般指算术平均中心 注:相同的分布密度因离散度的不同也会对应不同的分布,具有不同的分布特性,离散度同时也是对分布密度的补充。
4)平均邻近距离 §4-2 空间分布参数的描述 3)极值距离
目的:对空间物体的集群性进行分析,将其分为几个不同的子群(类)。目的:对空间物体的集群性进行分析,将其分为几个不同的子群(类)。 聚类算法: 1)系统聚类:分析之初假定n个点自成一类,再逐步合并,在聚类过程中,分类逐步减少,直至聚至一个适当的分类数目。 2)逐步分解:聚类之初假定n个点合为一类,然后逐步分解,在聚类过程中,分类越来越多,直至一个适当的数目。 3)判别聚类:先确定若干聚类中心,然后逐点比较以确定离散点的归属。 §4-3 空间聚类 一、聚类的意义和方法 • 聚类中最常用的准则是距离准则和离差准则。
一、聚类统计量的计算 (一)距离 在空间聚类中通常采用的是欧式距离,两个空间点Pi(Xi,Yi),Pj(Xj,Yj) 之间的欧式距离为: 对于两个空间点群S和T,它们分别含有若干点,则需要定义S和T之间的距离dST,处于不同的考虑, dST有不同的定义方法。 空间点群的几种距离
(二)离差 各个数值xi与其平均值的离散程度。对任一点群T,其群内离差(平方和)的计算如下: 全部点群的群内离差平方之和为
两子群S,T合并 设S,T合并后的新点群为U,则E的增量 ,根据群内离差平方和公式有: U与另一子群R合并引起的E增量△Eru可以采用递推算法,根据上式 则上式改为:
二、系统聚类 基本思想:首先是n个样本各自成一类,然后计算类与类之间的距离,选择距离最小的两类合并成一个新类,计算新类与其它类的距离,再将距离最小的两类进行合并,这样每次减少一类,直到达到所需的分类数或所有的样本都归为一类为止。 1:东北区2:内蒙古及长城沿线区 3:黄淮海区4:黄土高原区 5:长江中下游区6:西南区 7:华南区8:甘新区9:青藏区 3 4 9 2 8 1 5 7 6 九大农业区聚类分析
计算: • 1)起始聚类统计量的计算 • 2)统计量在子群合并过程中的刷新 计算出各点之间两两距离矩阵S0
依此类推有: G17={7,15}={5,6,7} G18={3,13}={1,2,3} G19={8,17}={5,6,7,8} G20={4,18}={1,2,3,4} G21={19,20}={1,2,3,4,5,6,7,8} G22={12,16}={9,10,11,12} G23={21,22}={1,2,3,4,5,6,7,8,9,10,11,12}
2.离差平方和 从S0出发,同样第一步合并1,2,记为G13={1,2},根据离差式刷新S0,得S1,例如:
如果将全部点群分为两个子群,则: 距离反映的是个体间的亲疏关系。着重于点与点两两之间的距离。 离差反映的是群体内的亲疏程度。在子群的容量上具有相对平衡的特点 如果分为三类
三、判别聚类 基本思想:先确定各子群中心或初步分类,然后将空间点与这些中心或初始类逐一比较,判别点的归属。 典型点法:利用空间点群之间的距离来寻找m个典型点位,将这些点位作为聚类中心,根据空间点与这些典型点的距离,将点划归到最近的一类。 1.计算点群平均中心 Xp=Xi/n=49,Yp=Yi/n=52
2.计算所有点到(Xp, Yp)的距离: d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 d12 949 730 272 325 585 820 1352 100 514 333 1252 1332 3.选取距( Xp, Yp)最远的一个点作为第一个聚类中心,(7点) 4.计算其余点与点7的距离di7与di之和di7+ di 1 2 3 4 5 6 7 8 9 10 11 12 3141 3623 1720 2992 758 1053 / 840 3876 2726 6216 5432 选取di7+ di的最大者,得d117+d11=6216,则点11为第二聚类点。 5.计算其余点与点11的距离di11,进而计算di7+ di+ di11,得: 1 2 3 4 5 6 7 8 9 10 11 12 6473 5890 3884 4063 4227 4282 / 2888 4038 3231 / 5856 选取di7+ di+ di11最大者,点1成为第三个聚类点。
6.对点群分类,将空间点归入最近的聚类点所代表的子群。6.对点群分类,将空间点归入最近的聚类点所代表的子群。 将12个点分为{1,2,3,4}{7,5,6,8}{11,9,10,12}