470 likes | 591 Views
第 8 讲 空间分析( 2 ). 城市建设系 GIS 教研室. 课 题: 空间分析(二) 目的要求: 通过本讲的学习,理解 GIS 中插值分析的意义,基本理论。了解常用插值方法的作用及应用领域范围。理解空间统计分类分析的基本理论和技术方法及其作用范围。 教学重点: 整体及局部插值方法及其应用、空间分类统计方法及其应用 教学难点: 插值方法的选择、分类统计方法的选择应用 教学课时: 2 课时 教学方法 : 讲授 本次课涉及的学术前沿: 分类统计方法中的专家打分模型. 第 8 讲 空间分析(二). 城市建设系 龙岳红. 7 .空间插值. 概念:
E N D
第8讲 空间分析(2) 城市建设系GIS教研室
课 题:空间分析(二) 目的要求:通过本讲的学习,理解GIS中插值分析的意义,基本理论。了解常用插值方法的作用及应用领域范围。理解空间统计分类分析的基本理论和技术方法及其作用范围。 教学重点:整体及局部插值方法及其应用、空间分类统计方法及其应用 教学难点:插值方法的选择、分类统计方法的选择应用 教学课时:2课时 教学方法: 讲授 本次课涉及的学术前沿:分类统计方法中的专家打分模型 第8讲 空间分析(二) 城市建设系 龙岳红
7.空间插值 • 概念: • 空间插值 :用于将离散点的测量数据转换为连续的数据曲面。广泛应用于等值线自动制图、数字高程模型的建立、不同区域界线现象的相关分析和比较研究等。 • 空间内插算法 • 通过已知点的数据推求同一区域其他未知点数据的计算方法 • 空间外推算法 • 通过已知区域的数据推求其他区域数据的方法 空间插值理论假设空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。
7.空间插值 必须进行空间插值的情况: • 现有的离散曲面的分辨率、像元大小或方向与所要求的不符 • 现有的连续曲面的数据模型与所需的数据模型不符 • 现有的数据不能完全覆盖所要求的区域范围 离散空间 连续空间
7.空间插值 • 空间插值的数据源 • 摄影测量得到的正射航片或卫星影象 • 卫星或航天飞机的扫描影象 • 野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线) • 数字化的多边形图、等值线图
7.空间插值 • 空间插值的数据通常是复杂空间变化有限的采样点的测量数据,这些已知的测量数据称为“硬数据” • 如果采样点数据比较少的情况下,可以根据已知的导致某种空间变化的自然过程或现象的信息机理,辅助进行空间插值,这种已知的信息机理,称为“软信息” • 但通常情况下,由于不清楚这种自然过程机理,往往不得不对该问题的属性在空间的变化作一些假设,例如假设采样点之间的数据变化是平滑变化,并假设服从某种分布概率和统计稳定性关系。
7.空间插值 空间点采样的方法: 完全规则采样 • 当区域景观大量存在有规律的空间分布模式时会得到片面的结果 • 完全随机采样 • 随机采样点之间的位置是不相关的 • 完全随机采样会导致采样点的分布不均,一些点的数据密集,另一点的数据缺少。
7.空间插值 空间点采样的方法: • 成层随机采样:随机采样和规则采样的结合,即单个的点随机的分布于规则的格网内 • 聚集采样:用于分析不同尺度的空间变化 • 规则断面采样:常用于河流、山坡剖面的测量 • 等值线采样:是数字化等高线图插值数字高程模型最常用的方法。
7.空间插值 各种不同的采样方式
7.空间插值 用研究区域所有的采样点的数据进行全区特征拟合 • 空间插值方法 • 整体插值方法 • 边界内插方法 • 趋势面分析 • 变换函数插值 • 局部插值方法 • 最近邻点法:泰森多边形方法 • 移动平均插值方法:距离倒数插值 • 样条函数插值方法 • 空间自协方差最佳插值方法:克里金插值 用局域内邻近的数据点来估计未知点的值 其中最重要的有线性内插法、双线性插值、趋势面插值、样条插值及克里金(Kriging)插值,这些方法有的是整体拟合,有的是局部拟合。
7.空间插值——整体差值法(1)边界内插法 • 边界内插法 • 假设任何重要的变换发生在边界上,边界内的变化是均匀的,同质的,即在各方向都是相同的。 • 这种概念模型经常用于土壤和景观制图,可以通过定义“均质的”土壤单元、景观图斑来表达其他的土壤、景观特征属性
7.空间插值——整体差值法(1)边界内插法 • 在边界内插的实际应用中,应考虑数据源是否符合这些理论假设: • 属性值在图斑或景观单元内是随机变化的,不是有规律的 • 同一类别的所有图斑存在同样的类方差(噪声) • 所有的属性值都呈正态分布 • 所有的空间变化发生在边界上,是突变而不是渐变
7.空间插值——整体差值法(2)趋势面分析 • 趋势面分析:根据采样点的属性数据与地理坐标的关系,进行多元回归分析得到平滑数学平面方程的方法 • 思路:先用已知采样点数据拟合出一个平滑的数学平面方程,再根据该方程计算无测量值的点上的数据 • 该理论假设:地理坐标是独立变量、属性值是独立变量且正态分布,同样回归误差也是与位置无关的独立变量 整体内插主要采用趋势面分析技术。
7.空间插值——整体差值法(2)趋势面分析 描述大范围空间(长距离)渐变特征最简单的方法是多项式回归分析。 其基本思想是用多项式表示线(数据是一维时)或面(数据是二维时)按最小二乘法原理对数据点进行的拟合,拟合时假定数据点的空间坐标x,y为独立变量,而表征特征值的z坐标为因变量。
7.空间插值——整体差值法(2)趋势面分析 对于一维的数据,需用二次或高次多项式。 一次线性变化数学模型: z=b0+b1x 二次非线性变化曲面数学模型: z=b0+b1x+b2x2 在趋势面分析中对于二维的更复杂的数据,可以用一次线性内插法,也可能需用二次或高次多项式。 二次趋势面数学模型: z=b0+b1x+b2y+b3x2+b4xy+b5y2 趋势面是平滑函数,很难正好通过原始数据点,除非数据点少而且曲面的次数高才能使曲面正好通过原始数据点。
7.空间插值——整体差值法(2)趋势面分析 线性回归分析 高次多项式
7.空间插值——局部插值法 局部插值步骤: • 定义一个邻域或搜索范围 • 搜索落在此邻域范围的数据点 • 选择表达这有限个点的空间变化的数学函数 • 为落在规则格网单元上的数据点赋值。重复这个步骤直到格网上的所有点赋值完毕
7.空间插值——局部插值法(1)最近邻点法 • Thiessen多边形或Voronoi多边形差值法 • 采用一种极端的边界内插方法,只用最近的单个点进行区域插值。泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其他数据点的距离,并用其内数据点进行赋值。连接所有数据点的连线形成Delaunay三角形,与不规则三角网TIN具有相同的拓扑结构。
7.空间插值——局部插值法(2)移动平均插值7.空间插值——局部插值法(2)移动平均插值 • 距离倒数插值 • 综合了泰森多边形的邻近点方法和趋势面分析的渐变方法的长处,假设未知点X0属性值是在局部领域内中所有数据点的距离加权平均值。
7.空间插值——局部插值法(3)样条函数插值7.空间插值——局部插值法(3)样条函数插值 • 样条函数是一个分段函数,进行一次拟合只有与少数点拟合,同事保证曲线段连接处连续。 • 因此样条函数可以修改少数数据点配准而不必重新计算整条曲线,插值速度快,能够保留局部的变化特征。 • 缺点是其误差不能直接估算。并且在实际中还要解决样条块的定义及如何在三维空间中将这些块拼成复杂曲面,又不引入原始曲面中所没有的异常现象等问题。
7.空间插值——局部插值法(3)样条函数插值7.空间插值——局部插值法(3)样条函数插值 • 常用样条函数是三次样条函数,用于三维情况,此时进行的是曲面内插。 • 采用三次曲面来描述格网内的内插值时,则待定点内插值ZP为: • ZP= a1x3y3+a2x2y3+a3xy3+a4y3+a5x3y2 +a6x2y2+a7xy2+a8y2+a9x3y+a10x2y+ a11xy+a12y+a13x3+a14x2+a15x+a16。
7.空间插值——局部插值法(3)样条函数插值7.空间插值——局部插值法(3)样条函数插值 • B样条函数 • 是感兴趣区间以外均为零的其他样条的和,可按简单的方法用地磁多项式进行局部拟合。 • 常用于数字化的线划在显示之前进行平滑处理,例如土壤、地质图上的各种边界,传统的制图总希望绘出较平滑的曲线。存在的问题是平滑之后周长和面积的计算与平滑前不同。
7.空间插值——局部插值法(4)克里金插值 • 空间自协方差最佳插值方法——克里金插值 • 该方法充分吸收了地理统计的思想,认为任何在空间连续性变化的属性是非常不规则的,不能用简单的平滑数学函数进行模拟,可以用随机表面给予较恰当的描述。这些连续性变化的空间属性称为“区域性变量”,如像气压、高程、及其他连续性变化的描述指标变量。这种应用地理统计方法进行空间插值的方法被称为克里金(Kriging)插值。
7.空间插值——局部插值法 (4)克里金插值 • Kriging插值方法在空间相关范围分析的基础上,用相关范围内的采样点来估计待插点属性值。 • (1)数据检验与分析,删去明显偏离实际的采样数据点。 • (2)数据预处理。 • (3)绘制方差图,了解空间变量的集聚范围与方向。 • (4)克里金插值估计。 • 相对来说,克里金插值则能较好地反映各种地形变化,但克里金方法的计算量很大,因此在对大面积区域大数据量内插时,这是一个不能不考虑的因素。
7.空间插值——线性内插法 线性内插法 用线性曲面方程Zp=b0+b1x+b2y拟合待定点附近的地形面(例如TIN模型中的三角平面可视为线性曲面)。可用3个数据点求解待定系数,然后根据线性曲面方程计算待定点的高程值。
7.空间插值——双线性插值 双线性插值 用曲面方程Zp=a0+a1x+a2y+a3xy拟合待定点附近的地形面,也可以表示为 Zp=(ax+b)(cy+d)。 即认为待定点附近的地形面的高程Zp在x轴方向呈线性变化,同时在y轴方向上也呈线性变化。可用待定点附近的4个数据点来计算双线性曲面函数的待定系数,再根据曲面函数计算待定点的高程值。
7.空间插值——移动拟合法 移动拟合法 (1) 移动拟合法是用二次多项式来拟合地面高程,即Zp=Ax2+Bxy+Cy2+Dx+Ey+F, 通常把坐标原点平移到待定点之后利用上式,采用待定点为圆心的圆周内6个数据点求解函数的待定系数,然后根据曲面方程计算Zp
7.空间插值——移动拟合法 移动拟合法(2) 当数据点多于6个时,可按最小二乘法求解待定系数。根据数据点距待定点远近不同,利用“距离越远对插值点的影响越小”的思想,可赋以适当的权值,权重可采用W=1/di2或W=[(R-di)/di]2或W=exp(-di2/R2)等形式(其中di为距离,R为采样圆半径),该方法称为按距离加权最小二乘内插法。
7.空间插值——移动拟合法 移动拟合法(3) 首先建立误差方程式: 再根据最小二乘法原理,按vwvT=min的方法,建立方程式求解待定系数。 移动拟合法的结果显示误差分布和地形坡度大小没有特别显著的关系,在地性线地区无法显示出这些转折地地形。
8.空间统计分类分析 (一)分类评价中常用的数学方法 (分类方法) • 主成分分析(Principal Component Analysis,PCA) • 层次分析法 • 系统聚类分析 • 判别分析
8.空间统计分类分析 1、主成分分析法 概念 主成分分析是以取样点作为坐标轴,以变量作为矢量,通过相似系数建立相关矩阵,研究变量之间的亲疏关系。 方法 利用变量之间的相关矩阵,通过由用户确定的阈值,从数据库变量集合中选择一定数量的关键独立变量,以消除其他冗余变量。这种方法克服了变量选择时的冗余和相关,然后选择信息最丰富的少数因子进行各种聚类分析。
8.空间统计分类分析 计算方法 设有m个样本,n个变量,构造矩阵 其斜方差方阵只为对称矩阵
8.空间统计分类分析 用Jacobi方法找出线性变换 使得 y1, y2,…,yn互不相关,R矩阵的特征值越大,该主成分的贡献越大,因而可以选择累计贡献百分比在一定阈值以内的若干因子作为主因子参加分析运算。
8.空间统计分类分析 2、层次分析法(AHP) 概念 在分析涉及大量相互关联、相互制约的复杂因素时,各因素对问题的分析有着不同程度的重要性,决定它们对目标的重要性序列对问题的分析十分重要。 AHP方法把相互关联的因素按隶属关系划分为若干层次,请有经验的专家们对各层次各因素的相对重要性给出定量指标,利用数学方法,综合众人意见给出各层次各要素的相对重要性权值,作为综合分析的基础。
8.空间统计分类分析 3、聚类分析 概念 变量聚类分析就是将一组数据点或变量,按照其在性质上亲疏远近的程度进行分类。 两个数据点在m维空间的相似性可以利用这些点在变量空间的距离来度量。一般距离采用欧氏距离或马氏距离。距离越小,表明两者的相似性越大。 应用 系统聚类是根据多种地学要素对地理实体进行划分,对不同的要素划分类别往往反映不同目标的等级序列,如土地分等定级、水土流失强度分级等。
(a) 栅格数据系统样图 (b) 提取要素“2”的聚类结果 聚类分析示意图
8.空间统计分类分析 4、判别分析 概念 判别分析与聚类分析同属分类问题,所不同的是,判别分析是根据理论与实践,预先确定出等级序列的因子标准,再将分析的地理实体安排到序列的合理位置上。 常规的判别分析主要有距离判别法和Bayes最小风险判别法等。 应用 对于诸如水土流失评价、土地适宜性评价等有一定理论根据的分类系统的定级问题比较适用。
8.空间统计分类分析 (二)常用的空间统计分析方法 1、常规统计分析 常规统计分析主要完成对数据集合的均值、总和、方差、频数、峰度系数等参数的统计分析。 2、空间自相关分析 空间自相关分析是认识空间分布持征、选择适宜的空间尺度来完成空间分析的最常用的方法。
∑∑Wij ( xi – x )( xj – x ) N I = — * Wij xi – x Wij 表示实体 i 与 j 的空间关系,它通过拓扑关系获得。 Wij=1表示空间实体 i 与 j 相邻; Wij=0表示空间实体 I 与 j 不相邻。 I 的值介于 –1 与 1 之间: I=1 表示空间自正相关,空间实体呈聚合分布; I=-1 表示空间自负相关,空间实体呈离散分布; I=0 表示空间实体是随机分布的。 其中: N 表示空间实体数目; xi 表示空间实体的属性值; x 是 xi 的平均值; 8.空间统计分类分析 对于空间自相关分析,目前普遍使用空间自相关系数表示,其计算公式如下
8.空间统计分类分析 3、回归分析 回归分析是处理变量之间具有相关关系的一种数理统计方法。实际上,回归分析和相关分析都是研究和处理变量之间具有相互关系的一种数理统计方法,但它们之间既有联系,又有区别。 在研究对象和内容上两者是相同的,但相关分析主要是研究要素之间的密切程度,并没有严格的自变量和因变量之分;而回归分析则主要是研究变量之间的数学表达形式,因而有自变量和因变量之分,可以通过自变量的值来预测、内插因变量的取值。从这里可以看出,回归分析有预测的性质。
8.空间统计分类分析 回归分析的主要内容可概括如下: (1)从一组空间数据出发,确定这些变量间的定量数学表达式,即回归方程; (2)根据一个或几个变量的值来预测或控制另一个变量的取值; (3)从影响某一地学过程的许多变量中,找出那些变量是主要的,那些变量是次要的,这些变量之间又有什么关系。 根据变量的多少,可以把回归分析分为一元回归模型和多元回归模型。变量之间的关系有的是线性关系,有的是非线性关系。
8.空间统计分类分析 4、趋势分析 通过数学模型模拟地理特征的空间分布与时间过程,将地理要素时空分布的实测数据点之间的不足部分内插或预测出来。 趋势面是一个光滑的数学曲面,它能够集中地反映空间数据在大范围内的变化趋势。趋势面与实际地学变量构成的空间曲面不同,它只是实际曲面的一种近似值。即实际曲面等于趋势面与残差面之和。 实际曲面=趋势面+残差面 • 趋势面反映了区域性的变化规律,它受大范围内系统性因素的控制; • 残差曲面则反映了局部性的变化特点,这些特点受局部性因素和随机因素的控制。
8.空间统计分类分析 趋势面分析的数学表达式 用于计算趋势面的数学表达式有多项式函数和傅立叶级数之分。最常用的是多项式函数。 按多项式函数中自变量的个数,可分为一维、二维、三维趋势面拟合等种类,每一类又可按多项式的系数分为一次、二次、三次、四次、五次等趋势面。 在实际工作中,二维趋势面是一种最常用的方法。
8.空间统计分类分析 5、专家打分模型 • 将相关的影响因素按其相对重要性排队,给出各因素所占的权重值; • 对每一要素内部进行进一步分析,按其内部的分类进行排队,按各类对结果的影响给分,从而得到该要素内各类别对结果的影响量; • 最后系统进行复合,得出排序结果。以表示对结果影响的优劣程度,作为决策的依据。
Gp = WiCip 8.空间统计分类分析 其数学表达式为: 式中, Gp表示p点的最终复合结果值; Wi表示第i个要素的权重; Cip表示第i个要素在p点的类别的专家打分分值。
8.空间统计分类分析 专家打分模型实现 ①打分:用户首先在每个feature的属性表里增加一个数据项,填入专家赋给的相应的分值; ②复合:调用加权符合程序,根据用户对各个 feature 给定的权重值进行叠加,得到最后的结果。
作业及思考题 • 空间数据插值的作用是什么。 • 例举空间内插的方法。 • 例举空间统计分类分析的方法。