克里金(Kriging)插值

本文为克里金插值的原理及推导过程的学习笔记。

反距离插值(IDW)

空间插值问题,就是在已知空间上若干离散点的某一属性的条件下,估计空间上任意一点的属性值问题。
根据地理学第一定律:
All attribute values on a geographic surface are related to each other, but closer values are more strongly related than are more distant ones.
对于空间上任意一点的属性,定义反距离插值公式:

反距离插值可以有效的基于地理学第一定律估计属性值的空间分布,但仍存在以下问题:

  1. 的值不确定
  2. 倒数函数描述空间关联程度并不准确

为此,有人提出了更为准确的克里金插值方法。

克里金插值定义

克里金插值公式与反距离插值公式相类似:

式中的为权重系数,是能够满足点处的估计值与真实值之差的方差最小的一套最优系数,即

同时满足无偏估计条件

假设条件

不同克里金插值方法的主要差异就是假设条件不同。
普通克里金插值的假设条件为:空间属性z是均一的,对于空间任意一点(x,y),都有相同的期望和方差
即对任意一点(x,y)都有

或者说:任意一点(x,y)处的空间属性值z(x,y)都是由区域平均值c和该点的随机偏差R(x,y)组成,即

其中R(x,y)表示点(x,y)处的偏差,其方差均为常数

无偏约束条件

要满足无偏估计条件,将带入则有

又因为对于任意的z都有,则

上式为的约束条件之一。

优化目标/代价函数J

令符号J表示估计误差

则有

为简化符号描述,定义,这里,即点处的属性值相对于区域平均属性值的偏差。

则上式可写为

代价函数的最优解

定义半方差函数,带入J中,有

考虑到,则

为找到使J最小的一组(J的函数),将J求导并令其为0。即

需要注意,最优解还需要满足条件,这是一个带约束条件的最优化问题
使用拉格朗日乘数法求解,首先构造一个新的目标函数:

其中是拉格朗日乘数。求解使这个代价函数最小的参数集,则能在满足约束下最小化J。即

化简得

由于,因此,同样地,那么有

将上式写为线性方程组形式:

写为矩阵形式:

求解该线性方程组即可得到所需参数集

半方差函数

因为:

于是有:

那么,计算的问题就转换为计算
根据地理学第一定律,空间上距离相近的点属性相似。表达了两点属性的相似度;空间上的距离定义为:

克里金插值假设空间距离和属性的相似度之间存在着函数关系。

为了确认这种关系,首先需要对观测数据集计算任意两点之间的距离和半方差/属性相似度。将所有的绘制成散点图,并寻找一个最优的拟合曲线来拟合d与r的关系。

得到该拟合曲线之后,对于任意两点,只要先计算得两点间的空间距离,便可得到两点的半方差

一般情况下,如果地理属性之间存在空间自相关,那么 r 会随着 d 的增大而逐渐增大,d 增大到一定程度(range)后 r 会收敛于某个值(sill),表示距离 d 超过 range 的观测值对预测值的自相关性已经可以忽略不计,只需要使用 range 范围内的观测数据来计算预测值

补充证明1

UMVUE(一致最小方差无偏估计量、最优无偏估计量)

为找到一个“最好”的无偏估计量。
对无偏估计可使用估计偏差的方差作为判据。
对有偏估计使用均方误差作为判据。

均方误差MSE由估计偏差的方差与估计偏差的平方两部分组成。
如果满足无偏估计,则,此时可用估计偏差的方差来代替均方误差;若不满足无偏估计,则需要考虑均方误差MSE。

补充证明2

期望、方差基本运算

运算1:方差基本运算

运算2:方差线性组合运算1

运算3:方差线性组合运算2

运算4:协方差基本运算1

运算5:协方差基本运算2

运算6:协方差基本运算3