Research on Surface Deformation Based on GLM-PSO-coKriging Model

  • NIU Teng , 1 ,
  • YUE Depeng , 1 ,
  • LI Qian 2 ,
  • YU Qiang 1 ,
  • YU Jiaxin 1 ,
  • FANG Minzhe 1
  • 1. Beijing Key Laboratory of Precision Forestry, Beijing Forestry University, Beijing 100083, China
  • 2. Forestry bureau of Qinhuangdao, Qinhuangdao 066004, China
*Corresponding author: YUE Depeng, E-mail:

Received date: 2018-06-15

  Request revised date: 2018-09-11

  Online published: 2018-11-20

Supported by

Special Fund for Basic Research Business Expenses of Central-level Public Welfare Research Institutes(CAFYBB2017MB026)

National Science and Technology Support Program of China, No.2012BAD16B00.


Taking the Chengguan District of Lanzhou City as a research area in the slope disaster-prone area, the surface deformation rate of surface deformation points is extracted by PS-InSAR technology, and the deformation rate can effectively reflect the distribution and uplifting of geological disasters in the spatial range. Based on the coKriging interpolation, combined with the generalized linear model (GLM) and the particle swarm optimization (PSO) algorithm, the coKrigong interpolation is optimized by fitting the linear model to construct the PSO-GLM-coKriging interpolation model to the surface deformation rate. The main variables, DEM, geotechnical porosity and NDVI fitting parameters were covariates, and spatial interpolation simulations were performed. Compared with the co-Kriging model and the GLM-co-Kriging model, the PSO-GLM-coKriging interpolation model has higher precision and better simulation effect, eliminating the complexity of multi-dimensional generation and improving the small-scale range. Interpolation effect, the error of the three models is 1.25mm/year, 0.70mm/year, 0.47mm/year. By comparison, the PSO-GLM-coKriging interpolation model has higher simulation accuracy and better simulation results. In the overall range, the interpolation results of the three models are similar in spatial distribution, in line with the actual situation of the surface. Therefore, the interpolation simulation of the blank area of ​​the deformation point is carried out by the PSO-GLM interpolation model to fill the gap that the PS-InSAR technology can not extract the surface information at the non-deformation point, and the ground subsidence and uplift with sudden degeneration and sudden landslides will be completed. Geological disasters have been effectively combined, and the coupling relationship between geological disasters with high uncertainty and the monitoring of surface deformation can be established, which provides certain data and theoretical support for the planning and construction of urbanization in Chengguan District.

NIU Teng , YUE Depeng , LI Qian , YU Qiang , YU Jiaxin , FANG Minzhe . Research on Surface Deformation Based on GLM-PSO-coKriging Model[J]. Journal of Geo-information Science, 2018 , 20(11) : 1579 -1591 . DOI: 10.12082/dqxxkx.2018.180289

1 引言


2 材料与方法

2.1 研究区概况

兰州是中国西北地区的第二大城市群中心,市区南北方向群山环抱,东西方向黄河穿城而过。城关区作为兰州市的政治、经济、文化、科研、交通中心,在兰州市范围内占据很重要的地位,城关区地理位置介于北纬35°58′~36°09′,东经103°46′~103°59′之间,位于兰州盆地东部,地形地貌复杂多样。城关区内有黄河穿城而过,城区内宽度约在0.5~0.8 km之间,黄河北岸主要是为丘陵沟壑区,海拔1600~2032 m,其中西北部由庙儿岔、大破沟至黄河沿岸一带有城区呈扇形分布。黄河南岸为山地区,海拔在1900~2171 m之间,其上为大面积黄土覆盖,厚度约200 m左右,山坡坡度较陡,一般15~25°左右,从城关区最西端至最东端,黄河南岸的城区呈纺锤型分布,城区最宽处从黄河沿岸到将军山山脚有 4 km的距离。由于黄土斜坡所特有的地形地貌、地层岩性、气象水文、植被覆盖和强烈的人类活动,导致城关区范围内地质灾害频发,如滑坡、泥石流、地面塌陷、崩塌等。地质灾害主要分布在黄河北岸的沿河沟壑地带和黄河南岸的城区与山地接触边缘,地质灾害主要沿这两条地表形变带分布。而不同的地质灾害的构成因素和易发程度与附近的地面抬升或沉降有较强的相关性。

2.2 数据来源与处理

地表形变点的形变速率是反映地表形变的重要体现。地表形变速率对于景观格局的适应性评价和规划有着重要作用,地表形变反映的是一个地区的土壤疏松性和地块活跃性。利用PS-InSAR技术提取研究区范围内的形变点和形变速率。对获取41幅欧空局2010-2016年的Envisat SAR影像数据,利用Linux系统平台下的STAMPS/MIT软件进行PS-InSAR处理,选取2014年5月17日的影像为主影像,与剩余40幅影像形成40个干涉对。将外部引入的DEM与干涉图进行差分干涉处理,对得到的差分干涉图提取PS点。在具备PS点的基础上,用DEM进行相位纠正和相位解缠,进而得到PS点的形变速率图[14,15,16,17,18,19,20,21,22,23]
兰州市城关区范围内共提取PS点8336个,研究区范围内形变点密度为37.89 PS/km²,远大于有效探测要求的4 PS/km²。由于PS点位过于密集,大部分PS点的形变速率过小,为降低插值中整体区域的误差,按照国际范例,选取地表形变大值点范围内形变速率大于2 mm/year的PS点,共108个,占形变速率大值点的40%,基本覆盖所有形变大值点所在的区域,形变速率小于2 mm/year的PS点54个,如图1,共162个形变点进行空间插值分析,形变速率在-6 ~ 5 mm/year之间,有效PS点基本覆盖研究区所有范围。
Fig. 1 Study area and PS point distribution map

图1 研究区及PS点位分布图

在地表形变PS点提取的基础上,发现地表形变点受很多因素的影响,如:地面高程(DEM),植被覆盖指数(NDVI),气候及降水,土壤岩性,人类利用等等。在这些环境因子的共同作用下,地表形变点呈一种不规则的状态分布,影响因子在区域范围内不同方向分布的不均匀的,在定量描述地表形变速率时需要通过构建一种更加有效的模型进行模拟分析。其中DEM数据来源于日本地球遥感观测数据中心下载的30 m分辨率的GEDM数据[24];土壤岩性数据来源于1:20万地质图,根据地质图进行矢量化得到研究区的岩性数据,岩性代表岩石的风化程度,决定了固体松散物的形成,岩性可通过不同的质地和强度进行分级,区分出不同的岩土疏松度;植被覆盖指数(NDVI)来源于兰州市城关区的Landsat 8影像计算结果,经过波段计算后得到同样为30 m分辨率栅格数据。

2.3 co-Kriging模型

协同区域化的协变量k所对应的影响因子数据{Zkx),k=1,2,…,k},其中k0为主变量地表形变速率。在各地表形变点上形变速率 Z k 0 ( x i ) i=1,2,3,…,n)的数学期望存在并为一个定值 m k 0
Z Vk 0 = 1 V k 0 V k 0 Z k 0 x dx (1)
Z αk = 1 V αk V k 0 Z k x dx (2)
整个区域范围内的地表形变速率估测值 Z V k 0 * k个协同区域变化量的有效数值的线性组合。 Z V k 0 * Z V k 0 的无偏估计量,是在无偏和估计方差最小的基础上,求解μαk
Z V k 0 * = k = 1 K αk nk μ αk Z αk (3)
式中: Z V k 0 * 为主变量地表形变速率的估测值;μαk为协克里金插值各因素权系数;Zαk为协同化区域变量
协同化区域变量在地表形变点{x1,x2,x3, …,xn}的范围内符合二阶平稳假设,二阶平稳假设是指区域化变量Zx)的任一n维分布函数不因空间点x发生位移而改变,具有数学期望存在且平稳,方差和协方差存在且平稳的性质。在本文中协同化区域变量为DEM,岩土疏松度和NDVI,分别用ui(i=1, 2, …, n),vj(j=1, 2, …, m),ps(q=1, 2, …, r)来表示:
Z V k 0 * = i = 1 n a i u i + j = 1 m b j v j + q = 1 r c s p s (4)

2.4 GLM-co-Kriging模型

f Y y , θ , ϕ = exp - b θ a ϕ + c y , ϕ (5)
y x = f T x β (6)
y x = g μ x (7)
f Y y , θ , ϕ = exp - b θ a ϕ + c y , ϕ (8)
L = log f = - b θ a θ + c y , ϕ (9)
式中: a ϕ , b θ , c y , ϕ 均为已知函数。θ为典范参数(Canonical Parameter),φ为离差参数(Dispersion Parameter),广义线性模型的方差为一个依赖于均值的函数。将Y地表形变速率,θ对应的DEM和NDVI, ϕ 对应的岩土疏松度代入不同的回归模型进行拟合分析。

2.5 GLM- PSO-coKriging模型

v D = a × f NDVI + b × g DEM + c × q L i + d (10)
(1) 设置粒子群计算参数;
(2) 设置适应度函数;
(3) 将第i组学习样本影响因子(DEMi,NDVIi,Lii)代入GLM拟合函数(转换成二次函数),计算适应度值;
(4) 比较粒子所经过的所有位置的适应度值,确定其最优位置;
(5) 比较所有粒子在其最优位置的适应度值,确定整个种群的最优位置;根据各粒子自身位置及最优粒子位置调整粒子的速度和位置;
(6) 达到迭代终止条件,得到函数拟合最优解vDi;
(7) 将最优解与地表形变实际值vi进行对比,通过最优解vDi与实际值vi的差值重新拟合模型参数a,b,c,d
Fig. 2 Particle swarm optimization roadmap

图2 粒子群优化技术路线图


3 结果与分析

3.1 基于co-Kriging模型的插值分析

PS-InSAR提取的地表形变数据,高精度形变点无法覆盖所有区域,因此,通过改进模型后的空间插值分析来确定未知点的地表形变速率。克里金插值是最基础的插值分析方法,现实空间上的地表形变速率不仅要通过空间距离的权重进行数值内插研究,更要充分考虑各种影响因子对于的地表形变速率的影响,对比地形地貌、气象水文、地层岩性、地质构造、人类活动等各种环境影响因子,选取其中空间相关性最大的DEM,NDVI和岩土疏松度,如图3所示。DEM主要反应地面高程信息,随着海拔的升高,地表形变速率的绝对值是降低的;相对应NDVI反应的是植被覆盖指数,植被覆盖是地表形变的一个重要影响因素,植被覆盖度越高,产生较大地面形变的概率越小;岩土疏松度越大,地表形变速率是升高的。利用协克里金插值,确定地表形变点的形变速率为主变量,将在1485~2161 m范围取值的地面高程DEM,主要区间在0.25-0.5的NDVI和量化指标的岩土疏松度作为协变量,共同模拟形变点空白地区的形变速率[44,45,46]
Fig. 3 Covariate regional distribution map

图3 协变量区域分布图

从162个地表形变点中提取135个形变点作为样本点,剩余27个点作为检验样本。在协克里金插值中选择不同插值方式和参数应用,确定最好的插值效果图像。在ArcGIS中分别选择普通克里金插值(Ordinary),简单克里金插值(Simple),泛克里金插值(Universal),和析取克里金插值(Disjunctive)进行插值比较,普通克里金插值多用于单个变量的无偏估计,泛克里金插值需要知道整个插值空间的整体变化趋势,析取克里金插值是非线性的插值模型,基于研究地表形变及其影响因子的耦合关系分析,确定简单克里金插值效果最好。通过分布直方图和正态QQ图的检验,主变量地表形变速率和 3个协变量都满足正态分布。选择不同协方差函数进行函数拟合精度分析,在环形模型(Circular),球面模型(Spherical),三球模型(Tetraspherical),五球模型(Pentaspherical),指数模型(Exponential),高斯模型(Gaussian),有理二次模型(Rational Quandratic),空穴模型(Hole Effect),K-贝塞尔模型(K-Bessal),J-贝塞尔模型(J-Bessal)和稳定模型(Stable)11个函数模型的对比中,在对协方差模型的精度验证中,选择最优模型的标准是通过标准平均值(Mean Standardized),均方根预测误差(Root Mean Square),平均标准误差(Average Standard Error)和标准均方根预测误差(Root Mean Square Standardized)4个指标来构建。当标准平均值趋近于0,均方根预测误差最小,平均标准误差趋近于均方根预测误差,标准均方根预测误差趋近于1时,说明此协方差模型是最优模型。由此判断,在11个模型中稳定模型的效果最好[47,48,49]
Fig. 4 Correlation analysis of deformation rate and covariate

图4 形变速率与协变量相关性分析

Fig. 5 Training sample distribution map

图5 训练样本分布图

27个检验样本形变速率的对比如表1所示:在整体的分布上,大部分形变点的地表形变速率预测值的绝对值相对于实际值都偏小,在协克里金插值的过程中,通过稳定协方差函数拟合3个影响因子的过程中,增加了插值的复杂度,3个影响因子的维度多样性制约了插值过程中某个方向上较大值的出现;在较小的尺度上,地面沉降较大的形变点分布在黄河南岸主城区和山地区的连接带,城关区西北部丘陵区,少部分分散于黄河北岸丘陵区,其中黄河北岸的大值点误差相对较大,南岸城区山地区连接带误差相对较小;地面抬升的形变点主要分布在黄河沿岸,少部分分布在黄河北岸丘陵区,地面抬升的形变点的形变速率预测值整体比实际值小2mm/year;绝对值较小的地面形变点相对来说误差范围很小,综合各种协变量的协克里金插值,插值范围在-2 ~2 mm/year之间。
Tab. 1 Model comparison and evaluation

表1 模型对比评价

OBJECTID 地表形变速率(实际) 地表形变速率(co-Kriging) 地表形变速率(GLM-co-Kriging) 地表形变速率(PSO-GLM-coKriging)
1 -5.6 -1.658 598 -3.746 961 -4.618 687
2 -2.3 -1.296 831 -2.134 503 -2.317 376
3 -2.4 -1.273 715 -2.093 304 -2.275 046
4 -2.7 -1.250 287 -2.051 728 -2.231 728
5 -4.3 -1.814 903 -2.879 605 -3.130 972
6 -2 -1.555 483 -1.663 416 -1.798 855
7 -2.1 -2.037 225 -2.296 454 -2.394 602
8 2.1 0.824 218 1.614 265 1.708 631
9 2 0.391 450 1.074 233 1.137 565
10 -3.1 -2.075 240 -2.734 641 -2.734 221
11 3.7 2.059 876 2.232 309 3.111 206
12 2.1 0.533 751 1.116 056 2.006 622
13 -3.5 -2.120 437 -2.331 069 -3.405 210
14 -3.6 -1.580 881 -2.870 344 -2.769 015
15 -2.2 -1.026 174 -2.185 163 -2.781 297
16 2.4 0.467 513 1.093 025 1.102 090
17 2.2 0.231 962 1.412 381 1.466 303
18 -2.1 -0.169 692 -1.212 495 -1.578 251
19 2.3 0.923 981 1.146 161 2.017 496
20 0 -0.836 368 -0.316 787 -0.462 244
21 0 -0.947 541 -0.434 894 -0.480 970
22 -1.9 -1.393 763 -1.317 613 -1.512 581
23 1.6 1.222 541 1.248 370 1.357 471
24 0.5 0.966 701 1.020 924 0.841 816
25 0.7 0.844 806 0.919 411 0.647 823
26 -1.3 -0.317 138 -0.447 999 -0.653 810
27 -0.5 -0.635 594 0.018 314 -0.247 485

3.2 基于GLM-co-Kriging模型的插值分析

通过训练样本对协克里金插值的结果验证,发现简单的协克里金插值在综合多个协变量后的结果预测值出现聚集效应,90%的预测值在 -2~2 mm/year的范围内。基于此,在协克里金插值的基础上,通过加入广义线性模型,进一步明确地面形变点形变速率的主变量效应,突出形变速率的主导性。广义线性模型对DEM,岩土疏松度和NDVI 3个协变量的拟合的优势体现在广义线性模型可以将离散变量岩土疏松度和连续变量DEM,NDVI放到同一个线性模型中进行函数拟合。再将拟合后的函数公式用来对整个研究区范围内的协变量影响因子计算,并将这个函数拟合值作为一个协变量代入到协克里金插值的运算中。
Fig. 6 Covariates and linear variables of main variables

图6 协变量与主变量线性分析

V = 0.017 F - 0.003 H - 18.833 P + 13.585 (11)
利用广义线性模型拟合出来的函数式,计算135个样本点的地表形变速率协变量拟合值,将其作为样本点的协变量,消除之前协克里金插值协变量过多引发的误差,通过协克里金插值得到城关区研究区范围内的GLM-co-Kriging模型图像。将 co-Kriging模型和GLM-co-Kriging模型的插值图像进行对比,插值的整体趋势是类似的,西北向东南地面形变速率逐渐减小再逐渐增大,由地面抬升到地面沉降。从总体来看,GLM-co-Kriging模型的插值的取值区间更大,插值结果的渐变性也更为明显,灵敏度也高于co-Kriging模型。co-Kriging模型的插值结果的渐变较为迟钝,而实际情况是临近各个形变点的形变速率数值差值和形变方向差距可能会很大,而GLM-co-Kriging模型在这方面差值效果较好,陆家沟马家沟村一带有一个地表抬升向地表塌陷的突变,徐家山国家公园和黄河改道一带也有一个地表抬升向塌陷的突变。整个研究区插值空间,尤其是这些区域,形变速率为0或者趋近于0的范围很少,更贴近实际情况。分析2种模型插值情况的具体差异,其中GLM-co-Kriging模型生成的图像在西南山区五泉山公园和兰山公园附近的形变速率趋近于0,而co-Kriging模型拟合出地面抬升;GLM-co-Kriging模型相对于co-Kriging模型在研究区在西北部到东北部福儿沟-马家沟村-台湾沟一线地面沉降的值也较大。
通过27个检验样本点对GLM-co-Kriging模 型和co-Kriging模型进行量化对比和精度验证,如图7。对误差进行统计分析,co-Kriging模型中误差大于1 mm/year的检验样本有17个点,GLM-co-Kriging模型中只有5个检验样本点的误差大于 1 mm/year,对2种模型的形变速率误差的绝对值取均值,co-Kriging模型的误差为1.25 mm/year,GLM-co-Kriging模型的误差为0.7 mm/year。在实际形变速率偏大的区域,co-Kriging模型的插值精度远小于GLM-co-Kriging模型。
Fig. 7 Comparison of error between co-Kriging model and GLM-co-Kriging model

图7 co-Kriging模型与GLM-co-Kriging模型误差对比图

3.3 基于PSO-GLM-coKriging模型的插值分析

由GLM-co-Kriging模型的插值结果与实际地表形变速率对比分析可知,这种模型还存在着一定的误差,在地表形变速率较大的形变点,依旧存在较大的误差。为了降低这种误差,将粒子群优化算法加入模型中,通过无数次的迭代运算,优化广义线性模型的拟合参数,通过统计软件MATLAB的粒子群优化算法相应工具箱,对其中一部分代码进行修正之后,在MATLAB R2014 a中设置迭代次数为2000,输入135个学习样本点和广义线性模型对应的联系函数,对其进行迭代运算。通过PSO-GLM模型拟合的插值函数为:
V = 0.0121 F - 0.0035 H - 18.754 P + 14.585 (12)
将PSO-GLM-coKriging插值模型的数据提取到27个检验样本点,在小尺度上通过检验样本量化对比3个模型的预测效果。用折线图来展示3个误差的范围和变化趋势,由图8图9表1可以明显看出,co-Kriging模型,GLM-co-Kriging模型和PSO-GLM-coKriging插值模型的预测精度是逐步提高的,3个模型的平均误差分别为1.25、0.70、0.47 mm/year,尤其是在地表形变较大的地区PSO-GLM-coKriging插值模型的预测精度远超于其他 2个模型,预测的误差大部分在1 mm/year之内。其中误差较大的形变点1,形变点5,形变点9和形变点16主要分布在研究区中部的主城区内,因主城区内地表形变量受新增建筑等多种人为因素的影响,所以预测误差在这部分范围内较大[55]
Fig. 8 Prediction map of surface deformation rate in Chengguan District

图8 城关区地表形变速率预测图

Fig. 9 Model error comparison chart

图9 模型误差对比图

PSO-GLM-coKriging插值模型对地表形变和地质灾害建立了相关联系,对具有缓变性的地面沉降和抬升与突发性的山体滑坡等地质灾害进行了有效的结合。结合近年来兰州市城关区的地质灾害发生情况,其中,地质灾害中的地面坍塌和崩塌在城关区内发生频率较小,主要分布在城关区东部老城建城区附近,属于地面沉降的集中区;另外3种地质灾害,泥石流灾害在城关区主要分布在建城区与山区的交界地带,南北两条,带状分布,较为均匀,泥石流的地表形变主要发生在地表抬升或沉降2 mm/year的范围内;滑坡灾害主要分布在城关区的西部,地表形变以地面抬升为主;不稳定斜坡在研究区范围内较为分散,没有统一的规律来体现这种灾害的分布情况。将具有高度不确定性的地质灾害与可监测的地表形变建立相关的耦合关系,通过对地表形变监测来预测各类斜坡灾害的发生情况是未来的发展方向之一,并具有重要意义。但插值方法毕竟是理论化的一种分析手段,还需要结合更多的环境影响因子合实地情况进行综合监测才能达到最好的预测效果。

4 结论

(2)在简单的协克里金插值的基础上对模型进行改进,加入广义线性模型,可以将离散型数据岩土疏松度,连续型数据DEM和NDVI拟合到同一个公式中,在普通协克里金插值中,过多的协变量制约了多维度的最大值出现,广义线性模型拟合后的公式降低的协变量的复杂度。在细节方面,通过粒子群优化算法不断对拟合系数进行迭代,使形变速率模拟值在较小的尺度上也能具备很高的精度。对比3种模型,co-Kriging模型、GLM-co-Kriging模型和PSO-GLM-coKriging插值模型的平均误差分别为1.25、0.70、0.47 mm/year。但利用改进的PSO-GLM-coKriging插值模型相较于实际的地表形变还是存在一定的误差,要达到最好的预测效果,还需要结合更多的环境因素和实地的综合监测。

The authors have declared that no competing interests exist.



