搜档网
当前位置:搜档网 › 空间插值方法

空间插值方法

空间插值方法
空间插值方法

7.空间插值

7.1空间插值的概念和理论

空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较,它包括了空间内插和外推两种算法。空间内插算法是一种通过已知点的数据推求同一区域其它未知点数据的计算方法;空间外推算法则是通过已知区域的数据,推求其它区域数据的方法。在以下几种情况下必须作空间插值:

1)现有的离散曲面的分辨率,象元大小或方向与所要求的不符,需要重新插值。例如将一个扫描影象(航空像片、遥感影象)从一种分辨率或方向转换到另一种分辨率或方向的影象。

2)现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值。如将一个连续的曲面从一种空间切分方式变为另一种空间切分方式,从TIN到栅格、栅格到TIN或矢量多边形到栅格。

3)现有的数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内插为连续的数据表面。

空间插值的理论假设是空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。然而,还有另外一种特殊的插值方法——分类,它不考虑不同类别测量值之间的空间联系,只考虑分类意义上的平均值或中值,为同类地物赋属性值。它主要用于地质、土壤、植被或土地利用的等值区域图或专题地图的处理,在“景观单元”或图斑内部是均匀和同质的,通常被赋给一个均一的属性值,变化发生在边界上。

7.2空间插值的数据源

连续表面空间插值的数据源包括:

●摄影测量得到的正射航片或卫星影象;

●卫星或航天飞机的扫描影象;

●野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线);

●数字化的多边形图、等值线图;

空间插值的数据通常是复杂空间变化有限的采样点的测量数据,这些已知的测量数据称

为“硬数据”。如果采样点数据比较少的情况下,可以根据已知的导致某种空间变化的自然过程或现象的信息机理,辅助进行空间插值,这种已知的信息机理,称为“软信息”。但通常情况下,由于不清楚这种自然过程机理,往往不得不对该问题的属性在空间的变化作一些假设,例如假设采样点之间的数据变化是平滑变化,并假设服从某种分布概率和统计稳定性关系。

采样点的空间位置对空间插值的结果影响很大,理想的情况是在研究区内均匀布点。然而当区域景观大量存在有规律的空间分布模式时,如有规律间隔的数或沟渠,用完全规则的采样网络则显然会得到片面的结果,正是这个原因,统计学家希望通过一些随机的采样来计算无偏的均值和方差。但是完全随机的采样同样存在缺陷,首先随机的采样点的分布位置是不相关的,而规则采样点的分布则只需要一个起点位置,方向和固定大小的间隔,尤其是在复杂的山地和林地里比较容易。其次完全随机采样,会导致采样点的分布不均,一些点的数据密集,另一些点的数据缺少。图5-15列出空间采样点分布的几种选择。

图5-15:各种不同的采样方式

规则采样和随机采样好的结合方法是成层随机采样,即单个的点随机的分布于规则的格网内。聚集采样可用于分析不同尺度的空间变化。规则断面采样常用于河流、山坡剖面的测量。等值线采样是数字化等高线图插值数字高程模型最常用的方法。

7.3空间插值方法

空间插值方法可以分为整体插值和局部插值方法两类。整体插值方法用研究区所有采样点的数据进行全区特征拟合;局部插值方法是仅仅用邻近的数据点来估计未知点的值。

整体插值方法通常不直接用于空间插值,而是用来检测不同于总趋势的最大偏离部分,在去除了宏观地物特征后,可用剩余残差来进行局部插值。由于整体插值方法将短尺度的、局部的变化看作随机的和非结构的噪声,从而丢失了这一部分信息。局部插值方法恰好能弥补整体插值方法的缺陷,可用于局部异常值,而且不受插值表面上其它点的内插值影响。

7.3.1整体插值方法

1)边界内插方法

边界内插方法假设任何重要的变化发生在边界上,边界内的变化是均匀的,同质的,即在各方向都是相同的。这种概念模型经常用于土壤和景观制图,可以通过定义“均质的”土壤单元、景观图斑,来表达其它的土壤、景观特征属性。

边界内插方法最简单的统计模型是标准方差分析(ANOV AR)模型:

式中,z是在x0位置的属性值,μ是总体平均值,αk是k类平均值与μ的差,ε为类间平均误差(噪声)。

该模型假设每一类别k的属性值是正态分布;每类k的平均值(μ+αk)由一个独立样品集估计,并假设它们是与空间无关的;类间平均误差ε假设所有类间都是相同的。

评价分类效果的指标是,为类间方差,为总体方差,比值越小

分类效果越好。分类效果的显著性检验可以用F检验。

实质上,边界内插方法的理论假设是:

●属性值z在“图斑”或景观单元内是随机变化的,不是有规律的;

●同一类别的所有“图斑”存在同样的类方差(噪声);

●所有的属性值都呈正态分布;

●所有的空间变化发生在边界上,是突变而不是渐变。

在使用边界内插时,应仔细考虑数据源是否符合这些理论假设。

2)趋势面分析

某种地理属性在空间的连续变化,可以用一个平滑的数学平面加以描述。思路是先用已知采样点数据拟合出一个平滑的数学平面方程,再根据该方程计算无测量值的点上的数据。这种只根据采样点的属性数据与地理坐标的关系,进行多元回归分析得到平滑数学平面方程的方法,称为趋势面分析。它的理论假设是地理坐标(x,y)是独立变量,属性值Z也是独立变量且是正态分布的,同样回归误差也是与位置无关的独立变量。

多项式回归分析是描述长距离渐变特征的最简单方法。多项式回归的基本思想是用多项式表示线、面,按最小二乘法原理对数据点进行拟合。线或面多项式的选择取决于数据是一维的还是二维的。

用一个简单的示例来说明,地理或环境调查中特征值z沿一个断面在x1,x2…x n处采样,若z值随x值增加而线性增大,则该特征值的长期变化可以用下面一个回归方程进行计算:

其中,b0,b1为回归系数,ε为独立于x的正态分布残差(噪声)。

然而许多情况下,不是以线性函数,而是以更为复杂的方式变化,则需用二次多项式进行拟合:

对于二维的情况,XY坐标的多元回归分析得到的曲面多项式,形式如下:

前三种形式分别是:

平面

斜平面

二次曲面

其中,p是趋势面方程的次数。

是趋势面多项式正常情况下的最少项数个数。零次多项式是平面,

有1个项数;一次多项式是斜平面,有3个项数;二次曲面有6个项数,三次趋势面有10个项数。

计算系数b i是一个标准的多元回归问题。趋势面分析的优点是非常容易理解,至少是在计算方面。另外大多数情况下可用低次多项式进行拟合,但给复杂的多项式赋与明确的物理意义比较困难。

趋势面是个平滑函数,很难正好通过原始数据点,除非是数据点少且趋势面次数高才能是曲面正好通过原始数据点,所以趋势面分析是一个近似插值方法。实际上趋势面最有成效的应用是揭示区域中不同于总趋势的最大偏离部分,所以趋势面分析的主要用途是,在使用某种局部插值方法之前,可用趋势面分析从数据中去掉一些宏观特征,不直接用它进行空间插值。

趋势面拟合程度的检验,同多元回归分析一样,可用F分布进行检验,其检验统计量为:

其中,U为回归平方和,Q为残差平方和(剩余平方和),p为多项式项数(不包括常数项b0),n为使用数据点数目。当F>F a时,趋势面显著,否则不显著。

3)变换函数插值

根据一个或多个空间参量的经验方程进行整体空间插值,也是经常使用的空间插值方法,这种经验方程称为变换函数。下面以一个研究实例进行说明。

冲积平原的土壤重金属污染与几个重要因子有关,其中距污染源(河流)的距离,和高程两个因子最重要。一般情况,携带重金属的粗粒泥沙沉积在河滩上,携带重金属的细粒泥沙沉淀在低洼的在洪水期容易被淹没的地方,而那些洪水频率低的地方,由于携带重金属污染泥沙颗粒比较少,受到污染轻。由于距河流的距离和高程是比较容易得到的空间变量,可以用各种重金属含量与它们的经验方程进行空间插值,以改进对重金属污染的预测。本例回归方程的形式如下:

式中是z(x)某种重金属含量(ppm),b0…b n是回归系数,p1…p n是独立空间变量,本例p1

是距河流的距离因子,p2是高程因子。

这种回归模型通常叫做转换函数,大多数GIS软件都可以计算。转换函数可以应用于其他独立变量,如温度、高程、降雨量和距海、植被的距离关系可以组合为一个超剩含水量的函数。地理位置及其属性可以尽可能多的信息组合成需要的回归模型,然后进行空间插值。但应该注意的一点是,必须清楚回归模型的物理意义。还要指出的是所有的回归转换函数都

属于近似的空间插值。

整体插值方法通常使用方差分析和回归方程等标准的统计方法,计算比较简单。其它的许多方法也可用于整体空间插值,如傅立叶级数和小波变换,特别是遥感影象分析方面,但它们需要的数据量大。

7.3.2局部插值方法

局部插值方法只使用邻近的数据点来估计未知点的值,包括几个步骤:

1)定义一个邻域或搜索范围;

2)搜索落在此邻域范围的数据点;

3)选择表达这有限个点的空间变化的数学函数;

4)为落在规则格网单元上的数据点赋值。重复这个步骤直到格网上的所有点赋值完毕。

使用局部插值方法需要注意的几个方面是:所使用的插值函数;邻域的大小、形状和方向;数据点的个数;数据点的分布方式是规则的还是不规则的。

1)最近邻点法:泰森多边形方法

泰森多边形(Thiessen,又叫Dirichlet 或V oronoi多边形)采用了一种极端的边界内插方法,只用最近的单个点进行区域插值。泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其它数据点的距离,并用其内数据点进行赋值。连接所有数据点的连线形成Delaunay三角形,与不规则三角网TIN 具有相同的拓扑结构。

GIS和地理分析中经常采用泰森多边形进行快速的赋值,实际上泰森多边形的一个隐含的假设是任何地点的气象数据均使用距它最近的气象站的数据。而实际上,除非是有足够多的气象站,否则这个假设是不恰当的,因为降水、气压、温度等现象是连续变化的,用泰森多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的。

2)移动平均插值方法:距离倒数插值

距离倒数插值方法综合了泰森多边形的邻近点方法和趋势面分析的渐变方法的长处,它假设未知点x0处属性值是在局部邻域内中所有数据点的距离加权平均值。距离倒数插值方法是加权移动平均方法的一种。加权移动平均方法的计算公式如下:

式中,权重系数由函数计算,要求当时,一般取倒数或负

指数形式。其中最常见的形式是距离倒数加权函数,形式如下:

式中,x j为未知点,x i为已知数据点。

加权移动平均公式最简单的形式称为线性插值,公式如下:

距离倒数插值方法是GIS软件根据点数据生成栅格图层的最常见方法。距离倒数法计算值易受数据点集群的影响,计算结果经常出现一种孤立点数据明显高于周围数据点的“鸭蛋”分布模式,可以在插值过程中通过动态修改搜索准则进行一定程度的改进。

3)样条函数插值方法

在计算机用于曲线与数据点拟合以前,绘图员是使用一种灵活的曲线规逐段的拟合出平滑的曲线。这种灵活的曲线规绘出的分段曲线称为样条。与样条匹配的那些数据点称为桩点,绘制曲线时桩点控制曲线的位置。曲线规绘出的曲线在数学上用分段的三次多项式函数来描述这种曲线,其连接处有连续的一阶和二阶连续导数。

样条函数是数学上与灵活曲线规对等的一个数学等式,是一个分段函数,进行一次拟合只有与少数点拟合,同时保证曲线段连接处连续。这就意味着样条函数可以修改少数数据点配准而不必重新计算整条曲线,趋势面分析方法做不到这一点,(图16)。

图5-16:样条函数的局部特征

(a:当二次样条曲线的一个点位置变化时,只需要重新计算四段曲线;

b:而一次样条曲线的一个点位置变化时,只需要重新计算两段曲线)

一般的分段多项式p(x)定义为:

p(x)=p i (x) x i < x < x i+1( i=1, 2, 3…, k-1 )

( j=0, 1, 2, ..., r-1; i=1, 2, ... , k-1 )

x1, ..., x k-1将区间x0,x k分成k个子区间,这些分割点称“断点”,曲线上具有这些x值的点称为“节”。函数p i(x)为小于等于m次的多项式。r项用来表示样条函数的约束条件:

r=0,无约束;

r=1,函数连续且对它的导数无任何约束;

r=m-1,区间[x0x k]可用一个多项式表示;

r=m,约束条件最多。

m=1,2,3时的样条分别为一次、二次、三次样条函数,其导数分别是0阶、1阶、2阶导数,二次样条函数的每个节点处必须有一阶连续导数,三次样条函数的每个节点初必须有二阶连续导数。r=m的简单样条只有k+m个自由度,r=m=3有着特殊的意义,因为它是三次多项式,该函数首次被人们称为样条函数。术语“三次样条”用于三维情况,此时进行曲面内插,而不是曲线内插。

由于离散子区间的范围较宽,可能是一条数字化的曲线,在这个范围内计算简单样条会引起一定的数学问题,因此在实际应用中都用B样条—一种特殊的样条函数。B样条是感兴趣区间以外均为零的其它样条的和,因此可按简单的方法用低次多项式进行局部拟合。

B样条经常用于数字化的线划在显示之前进行平滑处理,例如土壤、地质图上的各种边界,传统的制图总希望绘出较平滑的曲线。但是用B样条做多边形边界平滑也存在一些问题,特别是多边形面积和周长的计算,结果会与平滑前的不同。

综上所述,样条函数是分段函数,每次只用少量数据点,故插值速度快。样条函数与趋势面分析和移动平均方法相比,它保留了局部的变化特征。线性和曲面样条函数都在视觉上上得到了令人满意的结果。样条函数的一些缺点是:样条内插的误差不能直接估算,同时在实践中要解决的问题是样条块的定义以及如何在三维空间中将这些“块”拼成复杂曲面,又不引入原始曲面中所没有的异常现象等问题。

4)空间自协方差最佳插值方法:克里金插值

前面介绍的几个插值方法对影响插值效果的一些敏感性问题仍没有得到很好的解决,例如趋势面分析的控制参数和距离倒数插值方法的权重对结果影响很大,这些问题包括:

●需要计算平均值数据点的数目;

●搜索数据点的邻域大小、方向和形状如何确定;

●有没有比计算简单距离函数更好的估计权重系数的方法;

●与插值有关的误差问题。

为解决这些问题,法国地理数学学家Georges Matheron和南非矿山工程师D.G.Krige研究了一种优化插值方法,用于矿山勘探。这个方法被广泛地应用于地下水模拟、土壤制图等领域,成为GIS软件地理统计插值的重要组成部分。这种方法充分吸收了地理统计的思想,认为任何在空间连续性变化的属性是非常不规则的,不能用简单的平滑数学函数进行模拟,可以用随机表面给予较恰当的描述。这种连续性变化的空间属性称为“区域性变量”,可以描述象气压、高程及其它连续性变化的描述指标变量。这种应用地理统计方法进行空间插值的方法,被称为克里金(Kriging)插值。地理统计方法为空间插值提供了一种优化策略,即在插值过程中根据某种优化准则函数动态的决定变量的数值。Matheron ,Krige等人研究的插值方法着重于权重系数的确定,从而使内插函数处于最佳状态,即对给定点上的变量值提供最好的线性无偏估计。

克里金插值方法的区域性变量理论假设任何变量的空间变化都可以表示为下述三个主要成分的和(图5-17):

1)与恒定均值或趋势有关的结构性成分;

2)与空间变化有关的随机变量,即区域性变量;

3)与空间无关的随机噪声项或剩余误差项。

图5-17:区域变量理论将复杂的空间变化分为三个部分

(i)地形的平均特性;(ii)空间相关的不规则变化;(iii)随机的、局部的变化

另x为一维、二维或三维空间中的某一个位置,变量z在x处的值可又下式计算:

式中,m(x)是描述z(x)的结构性成分的确定性函数;是与空间变化有关的随机变化项,

即区域性变量;是剩余误差项,空间上具有零平均值、与空间无关的高斯噪声

项。

克里金方法的第一步是确定适当的m(x)函数,最简单的情况是m(x)等于采样区的平均值,距离矢量h分离的两点x,x+h之间的数学期望等于零:

式中z(x), z(x+h) 是随机

变量z在x, x+h处的值,同时还假设两点之间的方差只与距离h有关,于是:

式中,是一种函数,称为半方差函数。

区域性变量理论的两个内在假设条件是差异的稳定性和可变性,一旦结构性成分确定后,剩余的差异变化属于同质变化,不同位置之间的差异仅是距离的函数。这样,区域性变量计算公式可以写成下式的形式:

半方差的估算公式如下:

式中,n为距离为h的采样点对的数目(n对点),采样间隔h也叫延迟。对应于h的

的图被称为“半方差图”。图5-18表示一个典型的半方差图。

半方差是定量描述区域性变化的第一步,它为空间插值、优化采样方案提供了有益的信息。为了求得半方差图,必须先得到拟合半方差的理论模型,在半方差理论模型中:

1)延迟h的值较大的部分曲线呈水平方向。曲线的水平部分成为“梁(Sill)”。说明在延迟的这个范围内数据点没有空间相关性,因为所有的方差不随距离增减而变化。

2)曲线从的低值升到梁为止的延迟范围,称为“变程(Range)”。变程是半方差

图最重要的部分,因为它描述了与空间有关的差异怎样随距离变化的。在变程范围内距离越近的点具有更相近的特征。变程给移动加权平均方法提供了一个确定窗口大小的方法。很显然,数据点和未知点之间的距离大于变程范围,表明该数据点与未知点距离太远,对插值没有作用。

3)图中的拟合模型没有通过原点,而是在的正方向与坐标轴相截。

图5-18:半方差图

按半方差计算公式,当h=0时,必须为零。模型中出现的正值是剩

余误差的估计值,它是与空间无关的噪声。称为“核(Nugget)”方差,是观测误差的

和距离间隔很小的情况下的空间变化的组合。

当存在明显的变程和梁,同时核方差也很重要但数值不太大的情况下,可用球面模型进行半方差拟合(图5-19-1)。公式是:

0 < h < a

h >= a

h=0

式中,a是变程,h是延迟,c0+c1为梁。一般情况下用球面模型拟合效果比较理想。

如果存在明显的核方差和梁,而没有渐变的变程,则可用指数模型(图5-19-2)进行拟合:

如果核方差相对于与空间变化有关的随机变化很小的情况下,最好使用比较弯

曲的曲线,如高斯曲线:(图5-19-4)

如果空间变化随变程渐变,但没有梁,则可用线性模型(图5-19-3)进行拟合:

式中,b为线的斜率。当变程的大小远超过人们希望的插值范围时,也用线性模型。

前面的讨论都假设地表特征在各个方向都是相同的,然而许多情况下空间变化中的

都具有明显的方向性,这是就要用不同参数的模型来拟合半方差图。

图5-19:各种不同的变方差图

拟合后的半方差图重要的用途是确定局部内插需要的权重因子。确定的过程与

加权移动插值方法类似,但不是按一种固定的函数计算,而是按采样点数据的半方差图的统计分析原理计算。即:

权重的选择应使是无偏估计,且估计的方差小于观测值的其它线性组合产生的方差。

的最小方差为:

只有下式成立时,才可获得的最小方差:

式中,是z在采样点x i, x j之间的半方差;是采样点x j和未知点x0

之间的半方差,这两个量均可从已拟合模型的半方差图上得到。量计算最小方差需要的拉格朗日算子。

这个方法叫常规克里金插值。它是一个精确插值模型,内插值或最佳局部均值与数据点上的值一致。制图中常用比采样间隔更细的规则格网进行插值,内插值又可用前边提到的方

法转换成等值线图。与此类似,估计的误差,又叫克里金方差,可以用来制图以反映在

整个研究区内插值结果的可靠性。

克里金插值方法的目的是提供确定权重系数最优的方法和并能描述误差信息。由于克里金点模型(常规克里金模型)的内插值与原始样本的容量有关,当样本少的情况下,采用简单的点常规克里金插值的内插结果图会出现明显的凹凸现象。可以通过修改克里金方程以估计子块B内的平均值来克服这一缺点。该方法叫块克里金插值,该方法对估算给定面积试验小区的平均值或对给定格网大小的规则格网进行插值比较适用。

子块B内z的均值为:

式中,S B为子块B的面积。z(x)仍用相同的估计公式:

最小方差仍为:

但成立条件则变为:

空间插值算法汇总

空间插值算法: 1、距离倒数乘方法 (Inverse Distanee to a Power ) 距离倒数乘方格网 化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降。对于 一个较大的方次,较近的数据点被给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距离倒数成比例。当计算一个格网结点时,配给的权重是一个分数,所有权重的总和等于1.0。当一个观测点与一个格网结点重合时,该观测点被给予一个实际为1.0的权重,所有其它观测点被给予一个几乎为0.0的权重。换 言之,该结点被赋给与观测点一致的值。这就是一个准确插值。距离倒数法的特征之一是要在格网区域内产生围绕观测点位置的"牛眼"。用距离倒 数格网化时可以指定一个圆滑参数。大于零的圆滑参数保证,对于一个特定的结点,没有哪个观测点被赋予全部的权值,即使观测点与该结点重合也是如此。圆滑参数通过修匀已被插值的格网来降低"牛眼"影响。 2、克里金法 (Kriging)克里金法是一种在许多领域都很有用的地质统计格网化方法。克里金法试图那样表示隐含在你的数据中的趋势,例如,高点会是沿一个脊连接,而不是被牛眼形等值线所孤立。克里金法中包含了几个因子:变化图模型,漂移类型和矿块效应。 3、最小曲率法 (Minimum Curvature )最小曲率法广泛用于地球科学。 用最小曲率法生成的插值面类似于一个通过各个数据值的,具有最小弯曲量的

长条形薄弹性片。最小曲率法,试图在尽可能严格地尊重数据的同时生成尽可能圆滑的曲面。使用最小曲率法时要涉及到两个参数:最大残差参数和最大循环次数参数来控制最小曲率的收敛标准 4、多元回归法(Polynomial Regression )多元回归被用来确定你的数据 的大规模的趋势和图案。你可以用几个选项来确定你需要的趋势面类型。 多元回归实际上不是插值器,因为它并不试图预测未知的Z值。它实际上是一个趋势面分析作图程序。使用多元回归法时要涉及到曲面定义和指定XY的最高方次设置,曲面定义是选择采用的数据的多项式类型,这些类型分别是简单平面、双线性鞍、二次曲面、三次曲面和用户定义的多项式。参数设置是指定多项式方程中X和Y 组元的最高方次。 5、径向基本函数法 (Radial Basis Function )径向基本函数法是多个数据 插值方法的组合。根据适应你的数据和生成一个圆滑曲面的能力,其中的 复二次函数被许多人认为是最好的方法。所有径向基本函数法都是准确的插值器,它们都要为尊重你的数据而努力。为了试图生成一个更圆滑的曲面,对所有这些方法你都可以引入一个圆滑系数。你可以指定的函数类似于克里金中的变化图。当对一个格网结点插值时,这些个函数给数据点规定了一套最佳权重。 6谢别德法(Shepard's Method )谢别德法使用距离倒数加权的最小 乘方的方法。因此,它与距离倒数乘方插值器相似,但它利用了局部最小二乘方来消除或减少所生成等值线的"牛眼"外观。谢别德法可以是一个准确或圆滑插值器。在用谢别德法作为格网化方法时要涉及到圆滑参数的设置。圆滑参数是使谢别德法能够象一个圆滑插值器那样工作。当你增加圆滑参数的值时,圆滑的效果越好。

空间插值方法汇总

空间插值方法汇总 Inverse Distance to a Power(反距离加权插值法) Kriging(克里金插值法) Minimum Curvature(最小曲率) Modified Shepard's Method(改进谢别德法) Natural Neighbor(自然邻点插值法) Nearest Neighbor(最近邻点插值法) Polynomial Regression(多元回归法) Radial Basis Function(径向基函数法) Triangulation with Linear Interpolation(线性插值三角网法) Moving Average(移动平均法) Local Polynomial(局部多项式法) 1、距离倒数乘方法 距离倒数乘方格网化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降。对于一个较大的方次,较近的数据点被给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距离倒数成比例。当计算一个格网结点时,配给的权重是一个分数,所有权重的总和等于1.0。当一个观测点与一个格网结点重合时,该观测点被给予一个实际为 1.0 的权重,所有其它观测点被给予一个几乎为 0.0 的权重。换言之,该结点被赋给与观测点一致的值。这就是一个准确插值。距离倒数法的特征之一是要在格网区域内产生围绕观测点位置的"牛眼"。用距离倒数格网化时可以指定一个圆滑参数。大于零的圆滑参数保证,对于一个特定的结点,没有哪个观测点被赋予全部的权值,即使观测点与该结点重合也是如此。圆滑参数通过修匀已被插值的格网来降低"牛眼"影响。 2、克里金法 克里金法是一种在许多领域都很有用的地质统计格网化方法。克里金法试图那样表示隐含在你的数据中的趋势,例如,高点会是沿一个脊连接,而不是被牛眼形等值线所孤立。克里金法中包含了几个因子:变化图模型,漂移类型和矿块效应。 3、最小曲率法 最小曲率法广泛用于地球科学。用最小曲率法生成的插值面类似于一个通过各个数据值的,具有最小弯曲量的长条形薄弹性片。最小曲率法,试图在尽可能严格地尊重数据的同时,生成尽可能圆滑的曲面。使用最小曲率法时要涉及到两个参数:最大残差参数和最大循环次数参数来控制最小曲率的收敛标准。 4、多元回归法 多元回归被用来确定你的数据的大规模的趋势和图案。你可以用几个选项来确定你需要的趋势面类型。多元回归实际上不是插值器,因为它并不试图预测未知的 Z 值。它实际上是一个趋势面分析作图程序。使用多元回归法时要涉及到曲

两种空间插值方法的比较研究

两种空间插值方法的比较研究 摘要:距离倒数加权法算法简单,容易实现,适合分布较均匀的采样点集,但容易出现“牛眼”现象;克里金法是一种无偏最优估计法,精度较高,适合空间自相关程度高的数据,但其算法复杂,实现较难。这两种 方法各有其适用情形,本文比较了这两种方法的优劣并提出算法优化的思路。 关键字:距离倒数加权,克里金,优化 1引言 空间插值是根据一组已知的离散数据或分区数据,按照某种假设推求出其他未知点或未知区域的数据的过程,简单的说就是由已知空间特性推求未知空间特性。它是地学研究中的基本问题,也是GIS 数据处理的重要内容。在利用GIS 处理空间数据的过程中,需要进行空间插值的场合很多,如采样密度不够、采样分布不合理、采样存在空白区、等值线的自动绘制、数字高程模型的建立、区域边界分析、曲线光滑处理、空间趋势预测、采样结果的2.5维可视化等[1]。通过归纳,空间插值可以简化为以下三种情形:(1)现有离散曲面的分辨率、像元大小或方向与所要求的不符,需要重新插值。例如将一个扫描影像(航空像片、遥感影像)从一种分辨率或方向转换为另一种分辨率或方向的影像。(2)现有连续曲面的数据模型与所需的数据模型不符,需要重新插值。如将一个连续曲面从一种空间切分方式变为另一种空间切分方式,从TIN 到栅格、栅格到TIN 或矢量多边形到栅格。(3)现有数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内插为连续的数据表面[2]。。 现有的空间插值方法多种多样,但每一种方法都有其适用情形和无法避免的缺陷,本文分析了距离倒数加权法和克里金法的插值结果,并提出改进的思路。 2方法 距离倒数加权法和克里金法都是建立在地理学第一定律之上的,即:空间距离越近,地理事物的相似性越大[3]。它们都是通过确定待插点周围采样点的权重来求取待插点的估计值,可统一表示。设n x x ,,1 为区域上的一系列观测点,)(,),(1n x Z x Z 为相应的观测值。待插点0x 处的值)(0x Z 可采用一个线性组合来估计: ∑==n i i i x Z x Z 10)()(λ (1)

空间插值算法汇总

空间插值算法: 1、距离倒数乘方法(Inverse Distance to a Power)距离倒数乘方格网化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降。对于一个较大的方次,较近的数据点被给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距离倒数成比例。当计算一个格网结点时,配给的权重是一个分数,所有权重的总和等于1.0。当一个观测点与一个格网结点重合时,该观测点被给予一个实际为 1.0 的权重,所有其它观测点被给予一个几乎为0.0 的权重。换言之,该结点被赋给与观测点一致的值。这就是一个准确插值。距离倒数法的特征之一是要在格网区域内产生围绕观测点位置的"牛眼"。用距离倒数格网化时可以指定一个圆滑参数。大于零的圆滑参数保证,对于一个特定的结点,没有哪个观测点被赋予全部的权值,即使观测点与该结点重合也是如此。圆滑参数通过修匀已被插值的格网来降低"牛眼"影响。 2、克里金法(Kriging)克里金法是一种在许多领域都很有用的地质统计格网化方法。克里金法试图那样表示隐含在你的数据中的趋势,例如,高点会是沿一个脊连接,而不是被牛眼形等值线所孤立。克里金法中包含了几个因子:变化图模型,漂移类型和矿块效应。 3、最小曲率法(Minimum Curvature)最小曲率法广泛用于地球科学。用最小曲率法生成的插值面类似于一个通过各个数据值的,具有最小弯曲量的长条形薄弹性片。最小曲率法,试图在尽可能严格地尊重数据的同时,生成尽可能圆滑的曲面。使用最小曲率法时要涉及到两个参数:最大残差参数和最大循环次数参数来控制最小曲率的收敛标准。 4、多元回归法(Polynomial Regression)多元回归被用来确定你的数据的大规模的趋势和图案。你可以用几个选项来确定你需要的趋势面类型。多元回

ArcGIS中几种空间插值方法

ArcGIS 中几种空间插值方法 1. 反距离加权法(IDW) ArcGIS 中最常用的空间内插方法之一,反距离加权法是以插值点与样本点之间的距离为权重的插值方法,插值点越近的样本点赋予的权重越大,其权重贡献与距离成反比。可表示为: 1111() ()n n i p p i i i i Z Z D D ===∑∑ 其中Z 是插值点估计值,Z i (i=1Λn)是实测样本值,n 为参与计算的实测样本数,D i 为插值点与第i 个站点间的距离,p 是距离的幂,它显著影响内插的结果,它的选择标准是最小平均绝对误差。 2.多项式法 多项式内插法(Polynomial Interpolation)是根据全部或局部已知值,按研究区域预测数据的某种特定趋势来进行内插的方法,属统计方法的范畴。在GA 模块中,有二种类型的多项式内插方法,即全局多项式内插和局部多项式内插。前者多用于分析数据的全局趋势;后者则是使用多个平面来拟合整个研究区域,能表现出区域内局部变异的情况。 3.样条函数内插法 样条函数是一个分段函数,进行一次拟合只有少数点拟合,同时保证曲线段连接处连续,这就意味着样条函数可以修改少数数据点配准而不必重新计算整条曲线。样条函数的一些缺点是:样条内插的误差不能直接估算,同时在实践中要

解决的问题是样条块的定义以及如何在三维空间中将这些“块”拼成复杂曲面,又不引入原始曲面中所没有的异常现象等问题。 4.克里格插值法 克里格法是GIS 软件地理统计插值的重要组成部分。这种方法充分吸收了地理统计的思想,认为任何在空间连续性变化的属性是非常不规则的,不能用简单的平滑数学函数进行模拟,可以用随机表面给予较恰当的描述。这种连续性变化的空间属性称为“区域性变量”,可以描述象气压、高程及其它连续性变化的描述指标变量。地理统计方法为空间插值提供了一种优化策略,即在插值过程中根据某种优化准则函数动态的决定变量的数值。Kriging 插值方法着重于权重系数的确定,从而使内插函数处于最佳状态,即对给定点上的变量值提供最好的线性无偏估计。 对于普通克里格法,其一般公式为 01()()n i i i Z x Z x λ==∑,其中,Z(x i )(i=1, Λ,n)为n 个样本点的观测值,Z(x 0)为待定点值,i λ为权重,权重由克立格方程组: 011 (,)(,)1n i i j i i n i i C x y C x x λμλ==?-=????=??∑∑ 决定,其中,C(x i ,x j )为测站样本点之间的协方差,C(x i ,x 0)为测站样本点与插值点之间的协方差,μ为拉格朗日乘子。 插值数据的空间结构特性由半变异函数描述,其表达式为: () 21 1()(()())2()N h i i i h Z x Z x h N h ν==-+∑ 其中,N(h)为被距离区段分割的试验数据对数目,根据试验变异函数的特性,选

arcgis空间内插值教程

GIS空间插值(局部插值方法)实习记录 一、空间插值的概念和原理 当我们需要做一幅某个区域的专题地图,或是对该区域进行详细研究的时候,必须具备研究区任一点的属性值,也就是连续的属性值。但是,由于各种属性数据(如降水量、气温等)很难实施地面无缝观测,所以,我们能获取的往往是离散的属性数据。例如本例,我们现有一幅山东省等降雨量图,但是最终目标是得到山东省降水量专题图(覆盖全省,统计完成后,各地均具有自己的降雨量属性)。 空间插值是指利用研究区已知数据来估算未知数据的过程,即将离散点的测量数据转换为连续的数据曲面。利用空间插值,我们就可以通过离散的等降雨量线,来推算出山东省各地的降雨量了。 二、空间插值的几种方法及本次实习采用的原理和方法 –整体插值方法 ?边界内插方法 ?趋势面分析 ?变换函数插值 –局部分块插值方法 ?自然邻域法 ?移动平均插值方法:反距离权重插值 ?样条函数插值法(薄板样条和张力样条法) ?空间自协方差最佳插值方法:克里金插值 ■局部插值方法的控制点个数与控制点选择问题 局部插值方法用一组已知数据点(我们将其称为控制点)样本来估算待插值点(未知点)的值,因此控制点对该方法十分重要。 为此,第一要注意的是控制点的个数。控制点的个数与估算结果精确程度的关系取决于控制点的分布与待插值点的关系以及控制点的空间自相关程度。为了获取更精确的插值结果,我们需要着重考虑上述两点因素(横线所示)。 第二需要注意的是怎样选择控制点。一种方法是用离估算点最近的点作为控制点;另一种方法是通过半径来选择控制点,半径的大小必须根据控制点的分布来调整。 S6、按照不同方法进行空间插值,并比较各自优劣 打开ArcToolbox——Spatial Analyst 工具——插值,打开插值方法列表,如下图:

降雨空间插值分析

第五章降雨空间插值分析 降雨空间插值分析是系统的中间件,其主要任务是把流域内175个雨量站的资料利用空间插值方法合理地插值到分布式水文模型所应用的空间网格上,以便于利用历史和实时自动测报雨量进行模型的率定和模拟验证,其输出结果以数据库或数据文本方式储存。 该层次的功能主要包括以下三个方面:(1)把175站雨量信息合理地插值到计算网格;(2)雷达降雨与分布式水文模型耦合接口;(2)暴雨数值预报与分布式水文模型耦合接口。 5.1 概述 降雨空间插值分析是本系统的关键技术之一。该部分的功能实现途径如下: (1)建立统一的基础空间数据库,包括统一的网格、单元、区域、子流域划分及编码,实现对同一区域对象的地理、水文、气象综合描述。系统的基本分辨率规定为空间1km×1km; (2)多源降雨信息的同化及整合。无论是自动测报实时雨量,还是历史数据(包括月、日、时等时段),通过该软件都可以生成网格上的空间分布数据。 (3)数值天气预报产品转化为1km网格的空间数据; (4)雷达信息转换为分布式水文模型所用网格的空间数据。

5.2 空间插值方法 空间插值方法的主要思想是:由分布的流域上的各个测站(xi, yi, zi )(x, y 为坐标值,z 为雨量值),拟合出该时段降雨量在流域上的分布函数f (x, y),进而求得在该函数在计算网格上的积分: ()??=dA y x f P , 5-1 则网格上的面平均雨量为: A P P = 5-2 在实际操作时,分布函数的拟合是采用加权的最小二乘拟合得出,但是对于复杂的空间分布函数,其求解并不是简单的问题。一般情况下多选用多项式函数来作为数学表达式,另外还要求解上的可行性和便利性,目前趋势面的求解均采用最小二乘法,一般来说只有线性表达式以及可转化为线性的表达式方可求解。 目前流行较多的方法有:算术平均、距离反比加权平均、最短距离法、空间函数拟合插值等。算术平均方法比较简单,如果网格内有雨量站点,则该网格内的平均雨量为网格内站点雨量的平均值,但是小花间网格要4万多个,而雨量站点165个,该方法不能适用。以下重点介绍距离反比加权平均、最短距离法、克里格法和空间函数拟合插值方法。

空间插值

EX07:空间插值 本实验包含3个任务,任务1是进行趋势面分析(Trend surface analysis);任务2使用IDW方法进行局部插值;任务3使用普通克里格(Ordinary kriging)方法进行插值。上述任务都可以在地统计分析(Geostatistical analyst)中进行空间插值,此时可以使用交叉有效性统计(如均方根统计)进行模型比较。地统计分析提供了比空间分析(Spatial Analyst)及ArcToolbox中插值工具更多信息及更好的用户界面。 任务1:趋势面模型用于插值 所需数据:stations.shp,包含Idaho州内及附近175个气象站的shapefile;idoutlgd,Idaho 州边界栅格文件。 在任务1中,在进行趋势面分析之前,首先查看stations.shp中的平均年度降水量数据。本任务中7、8、9等步骤涉及到栅格数据运算,为选作内容。 1.运行ArcCatalog,连接到EX07文件夹。运行ArcMap,将数据框架命名为Task1,将 stations.shp和idoutlgd添加到Task1。确保Geostatistical analyst和Spatial Analyst在Tools 菜单下的Extensions中的复选框被设置,且相应的工具条在程序中显示出来。 2.单击Geostatistical analyst中的下拉键头,指向Explorer Data,选择Trend Analysis。在 Trend Analysis对话框的底部,选择数据源的Layer为stations.shp,Attribute为ANN_PREC。 3.将Trend Analysis对话框最大化。对话框中的3D图表达了两种趋势信息:在YZ平面 中由北向南倾斜,在XZ平面中先表现为由西向东倾斜,而后些微上升。南北方向的趋势比东西方向趋势更为明显,即Idaho州降水量由北向南递减。关闭对话框。 4.单击Geostatistical analyst中的下拉键头,选择Geostatistical Wizard。在第1页中进行输 入数据和地统计方法的选择。单击Input Data下拉键头,选择stations。将Attribute选择为ANN_PREC。在Methods框架中,选择Global Polynomial Interpolation。 5.在下一页可以选择趋势面模型采用的阶数(Power)。在Power列表中提供了1-10的选 择。选择1作为阶数。下一页绘制了预测值与观测值、误差与观测值之间的分布图及一次趋势面模型相关统计。RMS是对趋势面模型综合符合度的一种衡量,在此起数值为 6.073。按Back返回且将阶数设置为2,此时RMS变为6.085。重复调整阶数,选择具 有最小RMS数值的趋势面模型即为本本任务最佳综合模型。对于ANN_PREC,最佳阶数设置为5。将阶数设置为5后单击Finish。在Output Layer Information对话框单击OK。Q1:当阶数为5时,RMS统计值是多少? 6.Geostatistical analyst(GA)的输出为Global Polynomial Interpolation Prediction Map,与 stations具有相同的范围。在Global Polynomial Interpolation Prediction Map上单击右键选择Properties,在Symbology页包含4个显示选项:山体阴影(Hillshade)、等高线(Contours)、栅格(Grid)和填充等高线(Filled Contours),选择Filled Contours后单击分类(Classify)。在分类对话框中,选择手工分类,将其分为7类并将分类线设置为 10、15、20、25、30和35。单击OK关闭对话框。等高线(等雨量线)用不同色彩作 分类。 7.要将Global Polynomial Interpolation Prediction Map裁剪至与Idaho州边界相符,首先将 GA数据转化为栅格数据。在Global Polynomial Interpolation Prediction Map上单击右键,指向Data,选择Export to Raster,在弹出的对话框中,设置单元大小为200(米),并将输出命名为trend5_temp。单击OK进行数据输出。将trend5_temp添加到地图,检查trend5_temp中位于州边界外部的数值。

空间内插方法分析

摘要 本文首先对空间插值的的理论基础包括空间插值的必要性以及目标等几个方面进行了介绍;在此基础上,对空间插值的几种方法包括反距离加权法、克里格法、泰森多边形法、样条函数法等进行了探讨和研究,对方法的适用范围、优缺点、插值精度等方面进行了总结;对反距离加权法和克里格法等的实现方法进行了研究;论文最后对空间内插的方法选择进行了归纳总结,并对空间内插今后有待进一步研究的方面以及发展应用方向进行了展望。 关键词:空间内插克里格反距离加权 Abstract Firstly,theoretical basis,including the necessity of spatial interpolation, aim etc., is specifically introduced in this paper. Beside this, we have done studies and researches on several methods of spatial interpolation, e.g.Inverse Distance Weighted、Kriging、Thiesen、Spline, concluded on the range、merit and shortcoming,interpolation accuracy and so on. The thesis it makes research on the programming process of Inverse Distance Weighted and Kriging etc, The end of the paper gives a summary to the methods selection of spatial interpolation, and outlooks the further research and probable application to be developed in spatial interpolation. Keywords:Spatial Interpolation Kriging Inverse Distance Weighted 0 前言:在地理信息系统(GlS)中,我们获得的空间数据往往是离散点的形式,或者是分区数据的形式。由于观测到的数据往往不能满足要求,最理想的方法就是调查地理空间所有样本的信息,以穷尽样本属性值的方式来获得详尽的地理信息。但这种方法从时间、经济角度上来说是行不通的,也是不现实的。我们可以从离散分布的数据开始来构造一个连续的表面,但是问题在于如何构建一个连续的数据表面。GIS空间内插方法为实现这个目的提供了有效的手段,它利用有限的观测数据,估计合理的空间分布、提高数据密度,获得完整空间信息分布,以填补缺失的数据,得到密集的数据分布。此外,由于数据集的来源、采样点的数据类型不同,如何选择适当的内插方法成为迫切需要解决的问题,如若选择了不适当的内插方法将会直接导致对数据的错误内插,从而造成了对实际情况错误的认识。每种内插方法都有各自的应用范围和优缺点,它们很大程度上依赖于采样数据原始的数学特征,不同的研究目的对内插都有特殊的要求。针对某一特定的数据集,如何来选择最有效的内插方法,是一个重要的、极富挑战性的任务。 本文试图从GIS空间内插方法的理论基础、实际效果两个方面比较几种常用的内插方法的实现原理及其基本的适用条件,并对空间内插今后有待进一步研究的方面进行了展望。 1空间内插方法的划分和分析 空间插值方法可以分为全局方法和局部方法两类。全局方法用研究区每个可利用的控制点来构建一个方程或一个模型,而后该模型可用于估算未知点的数值;局部方法是用控制点的样本来估计未知点的值。

空间插值方法

7.空间插值 7.1空间插值的概念和理论 空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较,它包括了空间内插和外推两种算法。空间内插算法是一种通过已知点的数据推求同一区域其它未知点数据的计算方法;空间外推算法则是通过已知区域的数据,推求其它区域数据的方法。在以下几种情况下必须作空间插值: 1)现有的离散曲面的分辨率,象元大小或方向与所要求的不符,需要重新插值。例如将一个扫描影象(航空像片、遥感影象)从一种分辨率或方向转换到另一种分辨率或方向的影象。 2)现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值。如将一个连续的曲面从一种空间切分方式变为另一种空间切分方式,从TIN到栅格、栅格到TIN或矢量多边形到栅格。 3)现有的数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内插为连续的数据表面。 空间插值的理论假设是空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。然而,还有另外一种特殊的插值方法——分类,它不考虑不同类别测量值之间的空间联系,只考虑分类意义上的平均值或中值,为同类地物赋属性值。它主要用于地质、土壤、植被或土地利用的等值区域图或专题地图的处理,在“景观单元”或图斑内部是均匀和同质的,通常被赋给一个均一的属性值,变化发生在边界上。 7.2空间插值的数据源 连续表面空间插值的数据源包括: ●摄影测量得到的正射航片或卫星影象; ●卫星或航天飞机的扫描影象; ●野外测量采样数据,采样点随机分布或有规律的线性分布(沿剖面线或沿等高线); ●数字化的多边形图、等值线图; 空间插值的数据通常是复杂空间变化有限的采样点的测量数据,这些已知的测量数据称

常见插值方法及其的介绍

常见插值方法及其介绍 Inverse Distance to a Power(反距离加权 插值法)”、 “Kriging(克里金插值法)”、 “Minimum Curvature(最小曲率)”、 “Modified Shepard's Method(改进别德法)”、 “Natural Neighbor(自然邻点插值法)”、 “Nearest Neighbor(最近邻点插值法)”、 “Polynomial Regression(多元回归法)”、 “Radial Basis Function(径向基函数法)”、 “Triangulation with Linear Interpolation(线性插值三角网法)”、 “Moving Average(移动平均法)”、 “Local Polynomial(局部多项式法)” 1、距离倒数乘方法 距离倒数乘方格网化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。方次参数 控制着权系数如何随着离开一个格网结点距离的增加而下降。对于一个较大的方次,较近的数据点被 给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。 计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距 离倒数成比例。当计算一个格网结点时,配给的权重是一个分数,所有权重的总和等于1.0。当一个 观测点与一个格网结点重合时,该观测点被给予一个实际为 1.0 的权重,所有其它观测点

被给予一 个几乎为0.0 的权重。换言之,该结点被赋给与观测点一致的值。这就是一个准确插值。 距离倒数法的特征之一是要在格网区域产生围绕观测点位置的"牛眼"。用距离倒数格网化时可 以指定一个圆滑参数。大于零的圆滑参数保证,对于一个特定的结点,没有哪个观测点被赋予全部的 权值,即使观测点与该结点重合也是如此。圆滑参数通过修匀已被插值的格网来降低"牛眼"影响。 2、克里金法 克里金法是一种在许多领域都很有用的地质统计格网化方法。克里金法试图那样表示隐含在你的数 据中的趋势,例如,高点会是沿一个脊连接,而不是被牛眼形等值线所孤立。 克里金法中包含了几个因子:变化图模型,漂移类型和矿块效应。 3、最小曲率法 最小曲率法广泛用于地球科学。用最小曲率法生成的插值面类似于一个通过各个数据值的,具有最 小弯曲量的长条形薄弹性片。最小曲率法,试图在尽可能严格地尊重数据的同时,生成尽可能圆滑的 曲面。 使用最小曲率法时要涉及到两个参数:最大残差参数和最大循环次数参数来控制最小曲率的收敛 标准。 4、多元回归法 多元回归被用来确定你的数据的大规模的趋势和图案。你可以用几个选项来确定你需要的趋势面类 型。多元回归实际上不是插值器,因为它并不试图预测未知的Z 值。它实际上是一个趋势面分析作

Chapter03第三章 空间平滑和空间插值

35 第三章空间平滑和空间插值 本章介绍基于GIS的空间分析中两个常用操作:空间平滑和空间插值。空间平滑和空间插 值关系密切,它们都可以用于显示空间分布态式及空间分布趋势,二者还共享某些算法(如核 密度估计法Find/Replace All)。空间平滑和空间插值的方法有很多种,本章只介绍其中最常用 的几种。 空间平滑与移动平均在概念上类似(移动平均是求一个时间段内的均值),而空间平滑术 是一个空间窗口内计算平均值。第 3.1节介绍空间平滑的概念和方法,第3.2节是案例分析 3A,用空间平滑法研究中国南方/泰语地名(Find/Replace all)分布。空间插值是用某些点的已知 数值来估算其他点的未知数值。第3.3节介绍了基于点的空间插值,第3.4节为案例3B,演示 了一些常用的点插值法。案例3B所用数据与3A相同,是案例3A工作的延伸。第3.5节介绍 基于面的空间插值,用一套面域数值(一般面单元较小)来估算另一个面域的数值(范围较大)。面插值可用于数据融合以及不同面域单元的数据整合。第3.6节为案例3C,介绍两种 简单的面插值法。第3.7节为小结。 3.1空间平滑 与移动平均法计算一个时间段的平均值(例如:五日平均温度)相似,空间平滑是将某点 周围地区(定义为一个空间窗口)的平均值作为该点的平滑值,以此减少空间变异。空间平滑 适用面很广。其中一种应用是处理小样本问题,我们在第八章会详细讨论。对于那些人口较少 的地区,由于小样本事件中随机误差的影响,癌症或谋杀等稀有事件发生率的估算不够可靠。 对于某些地区,这样的事情发生一次就可导致一个高发生率,而对于另外许多地区,没有发生 这种事情的结果是零发生率。另外一种应用是将离散的点数据转化为连续的密度图,从而考察 点数据的空间分布模式,可参见下面的第3.2节。本节介绍两种空间平滑方法(移动搜索法及 核密度估计法),附录3介绍经验贝叶斯估计。

空间插值方法

空间插值方法 1.反距离权重插值:通过与样本点距离大小赋予权重,距离近的样本点被赋予较大的权重, 受该样本点的影响越大,同时可以限制插值点的个数、范围,通过幂值来决定样本点对插值点的影响程度,灵活性大,准确性高,但不太适用规则排列的插值点 2.克里金插值:克里金插值与IDW插值的区别在于权重的选择,IDW仅仅将距离的倒数 作为权重,而克里金考虑到了空间相关性的问题。它首先将每两个点进行配对,这样就能产生一个自变量为两点之间距离的函数。使用克里金插值需确定半变异函数的类型、步长、步数。对于这种方法,原始的输入点可能会发生变化。在数据点多时,结果更加可靠。该插值方法对规则排列、较密集的点插值较适用,而离散的插值点则需进行多次调试才可达到较为理想的效果 3.自然邻域插值:原理是构建voronoi多边形,也就是泰森多边形。首先将所有的空间点 构建成voronoi多边形,然后将待求点也构建一个voronoi多边形,这样就与圆多边形有很多相交的地方,根据每一块的面积按比例设置权重,这样就能够求得待求点的值了。 该方法不是通过数据模型来进行插值,不需要设置多于的参数,简便但不灵活,不适合离散点进行插值,因为会形成不规则插值边界,但插值结果相对符合实际数值、准确,适合规则排列、较密集的点插值。 4.样条函数插值:这种方法使用样条函数来对空间点进行插值,它有两个基本条件:1.表 面必须完全通过样本点2.表面的二阶曲率是最小的。插值主要受插值类型(Regularized 或Tension)和weight值的影响,一般Regularize 插值结果比Tension插值结果光滑,在Regularized Spline 插值中,weight 值越高生成的表面越光滑,Tension Spline 插值则相反;适合那些空间连续变化且光滑的表面的生成。该方法虽可生成平滑的插值结果,但其结果会在原有样点值进行数值延伸,产生于实际不符的结果,不建议一般插值使用。 5.径向基函数:包括:薄板样条函数、张力样条函数、规则样条函数、高次曲面函数、反 高次曲面函数。作为精确插值器,RBF方法不同于全局和局部多项式插值器,它们都不是精确插值器(不要求表面穿过测量点)。比较RBF和IDW(也是精确插值器)来看,IDW 从不预测大于最大测量值或小于最小测量值的值,RB用于根据大量数据点生成平滑表面。 这些函数可为平缓变化的表面(如高程)生成很好的结果。但在表面值在短距离内出现剧烈变化和/或怀疑样本值很可能有测量误差或不确定性时,这些方法不适用,且该方法插值过程需要一定时间,不能快速得到插值结果。

surfer插值法介绍

在科学计算领域中,空间插值是一类常用的重要算法,很多相关软件都内置该算法,其中GodenSoftware 公司的Surfer软件具有很强的代表性,内置有比较全面的空间插值算法,主要包括: Inverse Distance to a Power(反距离加权插值法) Kriging(克里金插值法) Minimum Curvature(最小曲率) Modified Shepard's Method(改进谢别德法) Natural Neighbor(自然邻点插值法) Nearest Neighbor(最近邻点插值法) Polynomial Regression(多元回归法) Radial Basis Function(径向基函数法) Triangulation with Linear Interpolation(线性插值三角网法) Moving Average(移动平均法) Local Polynomial(局部多项式法) 下面简单说明不同算法的特点。 1、距离倒数乘方法 距离倒数乘方格网化方法是一个加权平均插值法,可以进行确切的或者圆滑的方式插值。方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降。对于一个较大的方次,较近的数据点被给定一个较高的权重份额,对于一个较小的方次,权重比较均匀地分配给各数据点。计算一个格网结点时给予一个特定数据点的权值与指定方次的从结点到观测点的该结点被赋予距离倒数成比例。当计算一个格网结点时,配给的权重是一个分数,所有权重的总和等于1.0。当一个观测点与一个格网结点重合时,该观测点被给予一个实际为1.0 的权重,所有其它观测点被给予一个几乎为0.0 的权重。换言之,该结点被赋给与观测点一致的值。这就是一个准确插值。距离倒数法的特征之一是要在格网区域内产生围绕观测点位置的"牛眼"。用距离倒数格网化时可以指定一个圆滑参数。大于零的圆滑参数保证,对于一个特定的结点,没有哪个观测点被赋予全部的权值,即使观测点与该结点重合也是如此。圆滑参数通过修匀已被插值的格网来降低"牛眼"影响。 2、克里金法 克里金法是一种在许多领域都很有用的地质统计格网化方法。克里金法试图那样表示隐含在你的数据中的趋势,例如,高点会是沿一个脊连接,而不是被牛眼形等值线所孤立。克里金法中包含了几个因子:变化图模型,漂移类型和矿块效应。 3、最小曲率法 最小曲率法广泛用于地球科学。用最小曲率法生成的插值面类似于一个通过各个数据值的,具有最小弯曲量的长条形薄弹性片。最小曲率法,试图在尽可能严格地尊重数据的同时,生成尽可能圆滑的曲面。使用最小曲率法时要涉及到两个参数:最大残差参数和最大循环次数参数来控制最小曲率的收敛标准。 4、多元回归法 多元回归被用来确定你的数据的大规模的趋势和图案。你可以用几个选项来确定你需要的趋势面类型。多元回归实际上不是插值器,因为它并不试图预测未知的Z 值。它实际上是一个趋势面分析作图程序。使用多元回归法时要涉及到曲面定义和指定XY的最高方次设置,曲面定义是选择采用的数据的多项式类型,这些类型分别是简单平面、双线性鞍、二次曲面、三次曲面和用户定义的多项式。参数设置是指定多项式方程中X 和Y组元的最高方次。5、径向基本函数法 径向基本函数法是多个数据插值方法的组合。根据适应你的数据和生成一个圆滑曲面的能力,

空间插值方法大致总结

前段时间要对气象要素进行插值,翻看了多种方法,做了个PPT报告.对每个方法有简单的介绍极一些总结,不一定都是个人看法,参考了多方书面(sufer,ArcGIS应用教程)以及坛子里,百度上等搜到的资料的看后笔记,有些注了出处有些忘了.截图共享下,也不知有用没用.有错的地方请跟贴指正,谢谢啦! -------------------------------- 所谓空间数据插值,即通过探寻收集到的样点/样方数据的规律,外推/内插到整个研究区域为面数据的方法.即根据已知区域的数据求算待估区域值, 影响插值精度的主要因素就是插值法的选取 空间数据插值方法的基本原理: 任何一种空间数据插值法都是基于空间相关性的基础上进行的。即空间位臵上越靠近,则事物或现象就越相似, 空间位臵越远,则越相异或者越不相关,体现了事物/现象对空间位臵的依赖关系。(https://www.sodocs.net/doc/ad6751957.html,/dky/nb/page/2000-3-3/2000332117262480.htm,南京师范大学地理科学学院地理信息系统专业网络课程教程) 由于经典统计建模通常要求因变量是纯随机独立变量,而空间插值则要求插值变量具备某种程度的空间自相关性的具随机性和结构性的区域化变量。即区域内部是随机的,与位臵无关的,而在整体的空间分布上又是有一定的规律可循的,这也是不宜用简单的统计分析方法进行插值预估的原因。从而空间统计学应用而生。 无论用哪种插值方法,根据统计学假设可知,样本点越多越好,而样本的分布越均匀越好。常用的空间数据插值方法之一:趋势面分析 ? 趋势面分析(Trend analyst)。严格来说趋势面分析并不是在一种空间数据插值法。它是根据采样点的地理坐标X,Y值与样点的属性Z值建立多元回归模型,前提假设是,Z值是独立变量且呈正态分布,其回归误差与位臵无关。 ? 根据自行设臵的参数可建立线性、二次…或n次多项式回归模型,从而得到不同的拟合平面,可以是平面,亦可以是曲面。精度以最小二乘法进行验证。 趋势面分析中,将Z值分解成如下等式: 由于空间数据不具备重复抽样条件,所以通常将后两项合并。趋势值即回归值,而后两项将合并到拟合残差中。 在趋势面拟合中,空间位臵以平面坐标为佳,即将经纬度坐标转换为以米为单位的平面大地坐标。 通常趋势面分析用于分析趋势和异常而不追求高的拟合精度,一般达到60-80%,阶数在1-4之间即可。拟合精度按R^2系数和F值检验。 由上述可知,趋势面分析是经典统计学在点数据进行空间展面上的应用,属于全局多项式插值,即对整个研究区域用一个多项式进行拟合。 它的缺点在于:当研究区域范围较大,地形很复杂时,需要用高阶多项式拟合以提高精度,

插值方法总结

克里格插值方法:克里格法的适用条件是区域化变量存在空间相关性。考虑待估点位置与已知数据位置的相互关系,而且还考虑变量的空间相关性。 通过无偏估计和估计值和实际值的插值的方差最小这两个约束条件来求得权重,进而插值。不足:计算步骤繁琐,插值速度慢。 反距离权重法:IDW的适用于呈均匀分布且密集程度足以反映局部差异的样点数据集; 优点:简便易行;可为变量值变化很大的数据集提供一个合理的插值结果;不会出现无意义的插值结果而无法解释; 优点:综合了泰森多边形的自然邻近法和多元回归渐变法的长处,在插值时为待估点为邻近区域内所有数据点的距离加权平均值,当有各向异性时,还要考虑方向权重。是一种精确的插值法,即插值生成的表面中预测的样点值与实测样点值完全相等。 不足:对权重函数的选择十分敏感;易受数据点集群的影响,结果常出现一种孤立点数据明显高于周围数据点的“鸭蛋”分布模式; 距离反比很少有预测的特点,内插得到的插值点数据在样点数据取值范围内。 最邻近法(泰森多边形插值法): 特征:用泰森多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的。适用于较小的区域内,变量空间变异性也不很明显的情况,同时只有少数缺失值时,对缺失值进行填补。 优点:不需其他前提条件,方法简单,效率高; 缺点:受样本点的影响较大,只考虑距离因素,对其他空间因素和变量所固有的某些规律没有过多地考虑。实际应用中,效果常不十分理想。 自然邻近法: 本质上是对最邻近插值法的一种改进,它对研究区域内各点都赋予一个权重系数,插值时使用邻点的权重平均值决定待估点的权重。每完成一次估值就将新值纳入原样点数据集重新计算泰松多边形并重新赋权重,再对下一待估点进行估值运算。对于由样点数据展面生成栅格数据而言,通过设置栅格大小(cell size)来决定自然邻近插值中的泰森多边形的运行次数n,即,设整个研究区域的面积area,则有:n=area/cell size

第六讲 空间插值

第六讲空间插值 一:本节基本内容 A:空间插值:定义及应用 B:空间插值方法及特征 C:泰森多边形(V oronoi )及不规则三角网(TIN) D:距离反比加权法(IDW) E:地质统计学(Geostatistics) F:利用样条曲线优化插值结果 G:插值精度评估 H:三参数插值方法(体数据或者动态演化特征) 二:课前问题 为何进行插值? 1. i:2D离散点转化为连续面,如地表、地层界面 ①如基于空间离散点,剖面数据和等高线等来构建连续的栅格数据 ②生成更密、更光滑的TIN或者栅格单元。 ii:2D离散点向规则栅格数据的转化 2. 3D离散点转化为连续体数据,土壤属性、金属分布 3. 动态采样的2D、3D数据转化为动态演化的时空连续模型 三:空间插值的基本原理 1. 空间插值的定义 i:一般定义 ①:基于离散样品的空间和属性信息,根据预定的精度要求或确定的规则,推演出时空演化模型(函数)。 ②:利用该函数,借助或完全脱离样品数据,估算未采样位置的目标属性(属性和空间信息)的过程。 ③:利用插值结果,估算插值的精度和误差。 ii:二维解释

2.地质现象的多解性 四、空间插值方法 1. 插值条件—spatial interpolation conditions 根据不同的条件假设,可以定义如下几类插值方法 ①:定域条件(Locality Condition)插值方法: i:样品点只对其周围一定范围内的数据有影响 ii:即一给定位置的数值同其领域相似—相近者相似 ②:地质统计学方法(Geostatistical Condition) 任何地学现象都是某一随机函数的一个实现 2. 局部插值方法(Local interpolation) 在局部插值的过程中,待估点属性值得获取只需要全局样本的一部分子集。 ①:泰森多边形插值 ②:基于不规则三角网的插值 ③:距离反比加权插值 3.泰森多边形和Delaunay三角剖分 ①:Delaunay三角剖分:将样品点集投影到某一平面,根据这些点构建三角形,任何三角形的外接圆内无样本点。 ②:最近邻点法又叫泰森多边形方法。它采用一种极端的边界内插方法—只用最近的单个点进行区域插值(区域赋值)。 ③:泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其它数据点的距离,并用其内数据点进行赋值。

相关主题