遥感科学与应用技术

黄土高原区SRTM1 DEM高程误差校正模型构建及对比分析

  • 黄帅元 ,
  • 董有福 , * ,
  • 李海鹏
展开
  • 南京工业大学测绘科学与技术学院,南京 211816
* 董有福(1976— ),男,河南信阳人,博士,副教授,主要从事数字地形分析与建模、空间分析与数据挖掘。 E-mail:

黄帅元(1998— ),男,江苏张家港人,硕士,主要从事数字地形建模与数字高程模型校正。E-mail:

收稿日期: 2022-09-09

  修回日期: 2022-11-27

  网络出版日期: 2023-04-19

基金资助

国家自然科学基金项目(41871324)

Establishment and Comparative Analysis of SRTM1 DEM Error Correction Model in the Loess Plateau

  • HUANG Shuaiyuan ,
  • DONG Youfu , * ,
  • LI Haipeng
Expand
  • School of Geomatics Science and Technology, Nanjing Tech University, Nanjing 211816, China
* DONG Youfu, E-mail:

Received date: 2022-09-09

  Revised date: 2022-11-27

  Online published: 2023-04-19

Supported by

National Natural Science Foundation of China(41871324)

摘要

对SRTM1 DEM高程误差进行校正可有效提高其应用精度。以具有典型地貌特征的黄土高原作为研究区域,以ICESat-2/ATL08陆地高程作为参考数据,引入主流机器学习算法建立SRTM1高程误差与影响因子之间的关系模型对高程值进行校正;通过分析模型性能指标、误差频数分布、校正误差空间格局以及典型剖面误差分布,以此得到不同地貌类型区的高程误差校正模型适用性。实验结果表明:在平原、风沙丘陵和黄土塬地貌区随机森林模型高程校正效果最佳,平均绝对误差分别降低0.49、0.82和1.2 m,同时校正误差在空间分布上异常值较少,低起伏度的平原和风沙丘陵地貌区典型剖面误差与原误差较为贴合;山地区支持向量机模型适用性更强,均方根误差和平均绝对误差分布降低了6.79 m和5.43 m,可大幅提升误差绝对值较小的点位频数,同时在空间格局和典型剖面验证效果最佳;黄土丘陵地貌区弹性反馈神经网络模型效果最优,均方根误差和平均绝对误差分别降低了2.3 m和2.04 m,空间分布上误差降低效果显著,典型剖面误差异常值较少;土石丘陵地貌区卷积神经网络模型效果更理想,均方根误差与平均绝对误差分别降低4.14 m和3.5 m,空间分布与地形剖面误差降低效果良好。研究结果可为该区域不同地貌类型区选用SRTM1 DEM高程校正模型提供了参考。

本文引用格式

黄帅元 , 董有福 , 李海鹏 . 黄土高原区SRTM1 DEM高程误差校正模型构建及对比分析[J]. 地球信息科学学报, 2023 , 25(3) : 669 -681 . DOI: 10.12082/dqxxkx.2023.220677

Abstract

Correcting the error of SRTM1 DEM can effectively improve its application accuracy. Taking the Loess Plateau with typical landform characteristics as the research area and using the ICESat-2/ATL08 land laser elevation point as the reference data, the mainstream machine learning algorithms are introduced to establish the relationship between SRTM1 DEM error and its influencing factors to correct the elevation value. By analyzing the model performance indicators, error frequency distribution curve, spatial pattern of correction error, and the comparison of original and corrected distributions of error in typical profile, we can obtain the applicability of elevation error correction models for different landform types. Results show that the elevation correction effect using the random forest regression model is the best in the plain landform, wind-sand landform, and loess tableland landform, and the average absolute errors are reduced by 0.49 m, 0.82 m and 1.2 m, respectively. The errors in typical profile of the low relief plain and wind-sand landforms are more consistent with the original errors. The support vector machine model in mountainous areas is more applicable, and the root mean square error and mean absolute error is reduced by 6.79 m and 5.43 m, respectively. The frequency of small absolute errors is increased in the spatial pattern and typical profile. The resilient backpropagation model is the best in the loess hilly landform area, and the root mean square error and mean absolute error are reduced by 2.3 m and 2.04 m, respectively. The error reduction effect is significant at the spatial scale, and there are few outliers of error in typical profile. The convolutional neural network model in the soil-rocky hilly landform area is more ideal compared to other models, and the root mean square error and the mean absolute error are reduced by 4.14 m and 3.5 m, respectively. The error reduction effect of terrain profile is significant. The study provides a reference for the selection of the SRTM1 DEM elevation correction model for different landform types in this region.

1 引言

航天飞机雷达地形测绘任务(Shuttle Radar Topography Mission,SRTM)获取的近全球高分辨率栅格DEM,具有覆盖均匀和精度高的特点[1],在地学相关领域获得了广泛应用[2-6],众多学者对其精度特征进行了深入研究。一些学者应用空间插值方法、神经网络算法以及对抗网络模型对SRTM空洞进行填补[7-10]并总结出相关算法适用性[11-12],取得了良好效果。在SRTM误差特征方面,相关研究利用地面控制点和高精度DEM作为参考数据,对全球不同位置的SRTM产品进行了评估[13-18],发现SRTM精度具有显著的区域差异性。
关于SRTM高程误差影响因素,一些研究讨论了误差与地形地貌[19-21]、空间分辨率[22]以及地表覆盖之间的关系[23],结果表明其与坡度、坡向等地形因子以及土地利用类型、植被覆盖率存在显著相关性[5,24-25],同时地形特征以及地表覆盖会影响传感器穿透效果和反射效果[26-27],从而影响高程误差值。在此研究基础上,Magruder等[28]通过构建误差与影响因子间的回归模型,验证了利用ICESat-2校正植被覆盖引起的误差的可行性;O'Loughlin[29]利用多数据集去除植被高度生成一幅“裸地”DEM以达到提升SRTM精度的作用;Bulatovic[30]提出了3种系统误差消除模型来校正ASTER GDEM,使其精度得到显著提高。在DEM数据融合领域,Tran等[31]根据不同地貌对GDEM和SRTM使用不同的权值进行融合,Pham等[32]根据参考数据建立坡度与权重之间的关系,然后将建立关系用于具有相似地貌的场地,秦臣臣等[33]提出了根据插值误差曲面对SRTM与ASTER GDEM进行修正,都有效提升DEM产品精度,取得了良好效果。此外,一些学者借助机器学习相关算法修正全球公共DEM取得了理想效果:Yue等[34]使用人工神经网络以ICESat/GLAS为参考数据融合ASTER GDEM和SRTM1,生成一幅无缝全球DEM数据集;张丽等[35]利用弹性反馈神经网络算法融合ASTER GDEM和SRTM1高程数据,可有效降低高程误差;Kasi等[36]利用相关人工神经网络和遗传编程等机器学习算法融合印度境内SRTM1和CARTOSAT DEM,高程精度显著提高;余婷婷等[37]利用随机森林算法校正ASTER GDEM高程误差,验证了随机森林模型预测精度优于多元回归模型。
综上所述,不同地形地貌区域SRTM DEM高程误差及其影响因素呈现出不同变化规律,现有误差校正模型较少考虑这种差异性。因此,本文选取具有多种典型地貌的黄土高原区作为研究样区,应用随机森林、支持向量、弹性反馈神经网络、卷积神经网络算法对SRTM DEM高程误差进行校正,探究不同地貌类型区适用的误差校正模型,从而为改进该区域不同地貌区SRTM DEM高程误差并提升其应用精度提供参考。

2 研究区概况、实验数据及研究方法

2.1 研究区域

黄土高原具有独特的自然地貌景观,同时是我国重要的水土流失治理区,人类改造活动具有特殊意义,因此DEM在该区域地形地貌表达以及人类活动评价中具有重要应用价值。该区域面积约63.2万km2,高程最小值为66 m,最大值为5176 m,平均高程值1380.86 m。该区域地貌类型丰富,可划分为山地、平原、黄土塬、黄土丘陵、风沙丘陵和土石丘陵6种典型地貌,样区范围以及地貌分类如图1所示,地貌分区来源于地球系统科学数据共享平台。
图1 实验样区及地貌类型

Fig. 1 Geomorphic type map of experimental sample area

2.2 实验数据与预处理

实验数据主要包括4种,表1给出数据的年份、来源、分辨率与地理坐标系等特征。本文选择SRTM GL1 v003[38]作为研究对象,这是SRTM V3的30 m产品版本,产品空洞已由ASTER GDEM 2.0、GMTED2010和国家高程数据集(NED)填补,采用EGM96高程基准,标称绝对垂直高度误差小于16 m,相对垂直高度误差小于6 m,绝对水平精度小于20 m[13,17,39];ICESat-2卫星数据Level-3A级数据产品ATL08[40]是美国国家航空航天局(NASA)于2018年9月发射的ICESat2卫星所收集地球表面的数据,基于WGS84参考椭球体(ITRF2014参考框架),其获取的全球陆地高程点是目前高程精度最高的星载激光数据[41],其地表高程精度达到厘米级,相关学者已对ALT08数据产品的准确性做出评价[42-43],因此,本文将ATL08高程数据作为参考数据;GlobeLand30[44]全球地表覆盖数据是由30 m多光谱影像生产而来,实验中用于获取土地利用类型;黄土高原地区地理地貌分区图[45]用于划分实验样区地貌类型(2000年)。
表1 实验数据主要特征

Tab. 1 Main characteristics of experimental data

数据名称 发布时间 来源 分辨率 地理坐标系
SRTM GL1 v003 2015年7月 NASA数据档案中心 https://search.earthdata.nasa.gov/ 30 m WGS84
ICESat-2/ATL08 2018年10月至2021年7月 NASA冰雪数据中心 https://nsidc.org/data/icesat-2 沿轨100 m激光高程点 WGS84
GlobeLand30全球地表覆盖数据 2020年 Globallandcover官网 http://www.globallandcover.com 30 m WGS84
黄土高原地区地理地貌分区图 2013年12月 国家地球系统科学数据中心 http://www.geodata.cn/ 矢量数据 GCS_Krasovsky_1940
考虑到SRTM DEM与ATL08光子高程基准具有差异,实验前将基于WGS84椭球体高度的ATL08光子高程添加大地水准面与椭球体高度之间的间隔高度,将其椭球体高度转换为正高从而与SRTM数据统一高程基准。实验中分别获取两个航向上能够覆盖全实验样区的111条ATL08条带强光子数据,时间跨度为2018年10月25日至2021年7月7日,共约300万条光子数据。将两个航向上的光子数据按照训练集45弧秒采样共得到108 387条光子数据,测试集按照90弧秒采样共得到52 051条光子数据,根据不同地貌所占样区面积划分出相应的训练与测试集作模型训练准备,分别得到平原17 335条,风沙丘陵24 817条,黄土塬6803条,山地26 762条,黄土丘陵28 548条与土石丘陵4092条训练数据测,测试集分别为8761、11 438、3384、12 951、13 818、1699条。
前人研究表明,坡度、坡向和土地利用类型[35]与SRTM DEM高程误差具有强相关性;地形位置指数(Topographic Position Index, TPI)反映了高程点在局部范围内相对位置关系,地形耐用指数(Terrain Ruggedness Index,TRI)反映了局部地形异质性程度,实验中发现二者对SRTM DEM高程误差具有显著影响。因此,本文选取上述5种地形因子参与构建SRTM DEM高程校正模型,各地貌类型区地形特征及训练集详细信息如表2所示。
表2 实验样区训练集地形统计信息

Tab. 2 Terrain statistics of training set in experimental sample area (m)

地形统计信息 整体 平原 风沙丘陵 黄土塬 山地 黄土丘陵 土石丘陵
样点数/个 108 387 17 335 24 817 6803 26 762 28 548 4092
高程差 4766 1719 2190 1964 4766 3602 1320
平均/最大坡度(°) 12.22/66.68 3.54/43.77 4.86/47.66 13.56/55.39 17.49/66.68 13.89/54.28 17.84/46.06
TRI范围 0~54.63 0~33.25 0~26.88 0~30.87 0~54.63 0.38~37.75 0.88~26.75
TPI范围 -26.00~30.75 -19.38~14.75 -13.25~14.50 -16.00~18.25 -26.00~30.75 -17.38~18.50 -17.88~20.00
平均绝对误差 7.70 3.49 4.37 9.65 10.96 9.58 12.89
误差标准差 10.48 4.89 5.48 12.03 13.53 11.49 13.79
误差均方根 11.65 5.55 6.46 13.65 15.04 12.89 16.59

2.3 实验流程与方法

2.3.1 实验流程

实验流程如图2所示,首先将SRTM DEM与ATL08数据高程基准进行统一配准,将数据集根据不同地貌划分为训练集、测试集和验证集;用SRTM高程值减去ATL08光子高程得到误差值作为建模因变量,基于SRTM提取的地形参数值以及土地覆盖类型作为建模变量,利用训练集寻找不同模型最优参数建立高程误差模型,利用测试集高程来测试高程误差模型校正效果,同时将测试集高程误差值进行空间插值得到测试集高程误差改正值空间分布。通过分析不同地貌高程误差校正模型效果、模型应用效果检验、高程校正误差及改正值空间分布与地形剖面高程误差得出高程校正模型在不同地貌类型区的适用性。
图2 实验流程

Fig. 2 The process of the experiment

2.3.2 高程误差模型构建

在综合对比分析目前主流机器学习算法机理及其特点的基础上,考虑到算法的代表性与适用条件,同时借鉴前人的算法应用成果,并通过前期模型效果测试,本文选取了随机森林、支持向量机、弹性反馈神经网络和卷积神经网络回归模型进行研究区域不同地貌区高程误差的校正及其适用性分析。
(1)随机森林(Random Forest Regression, RFR)是一种基于决策树的组合模型,是多棵决策树的集合,它综合所有决策树的预测结果得到一个最优的结论,在回归模型中,在每个节点随机抽取节点分割变量,重复生成大量决策树模型,最终结果为确定的各决策树的算术平均值。构建模型时,最重要的两个参数是指定节点中用于决策的特征变量(mtry)个数和决策树(ntree)的个数。通过实验调整指定节点特征变量个数,根据验证集平均均方误差、平均绝对误差越小,决定系数越大的原则,确定实验样区的特征变量;通过决策树和误差关系(ntree-error)来确定决策树数量,发现当决策树到达一定数量后,改正效果就会停滞,最终确定合适的决策树数量。
(2)支持向量回归(Support Vector Regression,SVR)算法是一种非参数有监督机器学习模型,回归的样本点只有一类,寻求一个超平面使得所有样本点距离超平面“总偏差”最小,输入样本x通过非线性映射φx),将x映射到高维特征空间,并在这个空间进行线性回归。使用径向基核函数的支持向量回归模型在构建时,影响模型性能的两个重要参数是径向基核参数gamma和惩罚因子cost,前者控制分割超平面的形状,后者控制对误差的惩罚。本文使用网格搜索来确定模型中最佳gamma-cost组合,将gamma与cost分别限制在(0,10)与(0,1000)之间,逐步缩小范围,最终获得模型最佳参数。
(3)弹性反馈神经网络算法(Resilient Backpropagation, RProp)是误差反向传播的改进算法,算法分为两步,调整步长以及根据步长调整权重,建立RProp模型最重要的是激活函数、隐藏层数和隐藏层节点数,隐藏层节点数可以通过经验公式(1)确定:
m = n + l + α
式中:m为模型隐藏层节点数;n为输入层节点个数;l为输出层节点个数;α为1~10之间的常数。
本实验分别尝试logistic和tanh两种激活函数在不同隐藏层下的模型均方根误差,以均方根误差越小模型预测越精确为原则确定最优隐藏层数;共尝试训练了单层至4层隐藏层下不同隐藏层节点数建立的神经网络模型,当设置3层与4层隐藏层时,训练效果不佳,验证集RMSE显著增大出现过拟合现象,因此本实验选择两层隐藏层。
(4)卷积神经网络(Convolutional Neural Networks, CNN)是以卷积运算为基础的具有参数共享机制的深度神经网络,其本质是通过建立多个滤波器提取输入数据的特征,在CNN模型结构与参数设置方面,没有被广泛接受的网络参数选择策略,且由于本实验数据集仅为中等规模,过深的神经网络易出现过拟合,本文将采用2至3层卷积池化层,在卷积池化提取到数据特征后加入参考高程数据,由于在全连接层添加了新的数据,为了保证新数据经过充分训练,至少设置3层全连接层将数据拉成一维向量。在模型训练和确立过程中,结合前人的模型经验与本实验的探索,对模型参数进行调整,为了提高模型训练速度,解决过拟合问题,调整L2参数、Dropout参数是常用的做法,Dropout是指训练期间从神经网络中随机丢弃一些连接[46],减弱节点之间的联合适应性,增强泛化能力。实验发现模型损失与Dropout正相关,Dropout在0.01与0.20之间取值时模型损失最低,本实验选取0.15。
在建模训练过程中,利用训练集进行参数寻优。使用10折交叉验证:对每个参数下的模型进行10次模型训练,每次训练集的随机90%进行模型参数训练,10%划分出来作为验证集,验证集用来验证训练出的模型性能指标,每次验证得到1次验证误差,将10次验证误差平均得到1个交叉验证误差,从而选择交叉验证误差最优的模型,最后将最优模型运用于测试集。

2.3.3 精度评价方法

对误差回归预测模型进行评价是模型分析过程中重要环节。本文以均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、模型决定系数(R2)和T检验(t-test)4个指标对模型预测精度进行评价,其中R2是指各模型的拟合度,取值范围为 0,1,值越接近1,代表模型的拟合效果越好。具体表达式为:
R M S E = 1 m i = 1 m y i - y ˆ i 2
M A E = 1 m i = 1 m y i - y ˆ i
式中: y i为样本真实值; y ˆ i为模型预测值;i为样本数;m为样本总数。RMSE描述了预测值与真实高程值的离散程度。MAE是误差绝对值的平均值,可以避免误差正负相互抵消,从而准确反映实际预测误差的大小。

3 结果及分析

3.1 不同地貌区高程误差校正模型构建效果分析

应用上述预测模型对测试点集高程误差进行校正,并与原始误差值进行对比,获得测试点集高程误差校正性能参数(表3表4),测试集整体为实验样区所有地貌经对应最优参数下模型输出的测试集综合所得。可以看出: ① 在平原、风沙丘陵和黄土塬地貌区,由于原始高程误差较小,地形起伏幅度小,原始误差并不显著,4种模型误差校正效果相对较差,表现在均方根误差降低较小甚至增加,RFR模型具有较好的平均绝对误差改正效果,在分别降低0.49、0.82与1.2 m; ② 在山地区,SVR模型高程误差校正性能指标最佳,均方根误差和平均绝对误差分布降低了6.79 m和5.43 m; ③ 在黄土丘陵地貌区,RProp模型效果最优,校正后高程均方根误差减小2.3 m,平均绝对误差减小2.04 m; ④ 在土石丘陵地貌区,CNN模型效果最理想,校正后均方根误差减小4.14 m,平均绝对误差减小3.5 m。
表3 高程误差校正模型整体与不同地貌区校正均方根误差表

Tab. 3 Root mean square error of correction elevation error model in different geomorphic areas (m)

模型 测试集
整体
平原 风沙丘陵 黄土塬 山地 黄土丘陵 土石丘陵
RMSE RMSE RMSE RMSE RMSE RMSE
原始 12.08 7.37 9.04 14.18 15.15 13.59 17.05
RFR 11.15 7.51 -0.14 9.24 -0.2 12.84 1.34 13.62 1.53 11.92 1.67 14.39 2.66
SVR 11.19 10.51 -3.14 10.05 -1.01 11.06 3.12 8.36 6.79 11.74 1.85 13.33 3.72
RProp 11.33 7.34 0.03 9.09 -0.05 13.73 0.45 14.46 0.69 11.29 2.3 13.19 3.86
CNN 11.37 8.48 -1.11 9.70 -0.66 12.96 1.22 13.31 1.84 11.63 1.96 12.91 4.14
表4 高程误差校正模型整体与不同地貌区平均绝对误差表

Tab. 4 Mean absolute error of correction elevation error model in different geomorphic areas (m)

模型 测试集
整体
平原 风沙丘陵 黄土塬 山地 黄土丘陵 土石丘陵
MAE MAE MAE MAE MAE MAE
原始 8.53 4.22 5.44 10.27 11.45 10.06 13.35
RFR 7.26 3.73 0.49 4.62 0.82 9.07 1.20 9.68 1.77 8.49 1.57 11.15 2.20
SVR 7.96 8.02 -3.80 7.58 -2.14 8.12 2.15 6.02 5.43 9.32 0.74 10.15 3.20
RProp 7.59 3.91 0.31 4.99 0.45 9.56 0.71 10.49 0.96 8.02 2.04 10.14 3.21
CNN 7.66 5.38 -1.16 5.68 -0.24 9.31 0.96 9.53 1.92 8.33 1.73 9.85 3.50
为进一步探究4种模型在不同地貌区的高程误差校正效果及其规律,根据测试集校正误差绘制不同地貌区高程误差分布频数(图3),可以看出: ① 在所有地貌类型区原始高程误差都存在一定程度正偏离,误差频数最高区域在0值右侧区域; ② 在平原、风沙丘陵和黄土塬区,RFR校正后误差值主要分布在0值附近,RProp改正效果相对次之;③ 在山地区SVR模型效果最佳,可大幅提升绝对值较小的误差点频数,另外SVR模型在平原、风沙丘陵和黄土塬地貌区误差校正效果都较差,具有显著的负偏离;④ 在黄土丘陵地貌区,RProp校正后误差主要集中在0值附近,效果最佳,其次是RFR与CNN模型;⑤ 在土石丘陵地貌区,CNN模型与RProp效果相近,校正后误差绝对值较高的点位频数有效减少,校正后误差值较小的点数CNN模型主要集中在0值左侧区域,而RProp模型主要集中在0值右侧。
图3 不同地貌误差校正频数分布

Fig. 3 Distribution of error correction frequency in different geomorphic areas

3.2 高程误差校正模型应用效果检验

为了进一步检验误差校正模型的应用效果,在6种地貌类型区分别寻找两块没有交集的样区分别采集训练集和测试集进行上述模型实验,单块样区面积约120 km2,为获得覆盖样区较多的数据集,不对采集的数据进行稀疏采样,最终在每个地貌类型训练样区采集的数据集在12 000条左右,测试样区数据集在4000条左右,实验结果如表5表6所示。
表5 模型应用检验样区不同地貌区校正均方根误差表

Tab. 5 Root mean square error of correction elevation error model in different geomorphic areas for model extrapolation (m)

模型 平原 风沙丘陵 黄土塬 山地 黄土丘陵 土石丘陵
RMSE 差值 RMSE 差值 RMSE 差值 RMSE 差值 RMSE 差值 RMSE 差值
原始 4.67 5.39 14.29 15.21 13.66 16.22
RFR 4.19 0.48 4.99 0.40 12.63 1.66 10.72 4.49 12.21 1.45 13.32 2.90
SVR 6.13 -1.46 6.53 -1.14 12.69 1.60 9.08 6.13 12.75 0.91 12.64 3.58
RProp 4.38 0.29 5.50 -0.11 13.17 1.12 11.92 3.29 11.03 2.63 12.57 3.65
CNN 5.79 -1.12 5.56 -0.17 13.06 1.23 12.02 3.19 11.05 2.61 12.61 3.61
表6 模型应用检验样区不同地貌区校正平均绝对误差表

Tab. 6 Mean absolute error of correction elevation error model in different geomorphic areas for model extrapolation (m)

模型 平原 风沙丘陵 黄土塬 山地 黄土丘陵 土石丘陵
RMSE 差值 RMSE 差值 RMSE 差值 RMSE 差值 RMSE 差值 RMSE 差值
原始 4.38 4.32 10.63 11.58 10.61 12.56
RFR 4.03 0.35 3.66 0.66 9.11 1.52 8.85 2.73 9.20 1.41 10.42 2.14
SVR 5.85 -1.47 5.07 -0.75 8.98 1.65 5.92 5.56 9.58 1.03 10.05 2.51
RProp 4.18 0.20 4.59 -0.27 10.21 0.42 9.95 1.63 8.09 2.52 9.76 2.80
CNN 5.61 -1.23 4.77 -0.45 9.75 0.88 10.15 1.43 8.15 2.46 9.93 2.63
由误差参数表可知,在6种地貌单独选取的训练测试样区进行实验,获得的结果基本符合上述结论,总体来看,在较小的样区经过较高的采样密度获取的数据经训练后在测试集上获得的精度更高;在不同地貌模型效果来看,与上述结论有所不同的是土石丘陵地貌区,RProp模型的校正后精度略高于CNN模型,两者都优于RFR和SVR模型。

3.3 高程校正误差及改正值空间分布特征

图4是应用4种模型对各个地貌进行校正后镶嵌得到的校正高程误差值空间分布结果,从中可以看出,在地势起伏较小的中部风沙丘陵区、中南部黄土台塬区与河谷平原区,高程误差绝对值均相对较低;在中部黄土丘陵和西南东部山地地貌区,高程误差绝对值较高;由于点位高程误差值主要受局部地形特征影响并且变化幅度较小,使得不同地貌区应用4种模型校正后高程误差值虽然存在一定差异但可视化效果并不显著,因此难以挖掘不同模型的误差改正效果及其空间分布规律,为此实验中采用simple kriging插值,对覆盖研究区域的52 052个样点原始误差以及校正误差进行插值,进一步应用校正误差绝对值减去原始误差绝对值得到不同模型的误差改正值空间分布格局(图5),其中红色代表SRTM DEM经模型校正后误差增大区域,蓝色代表校正后误差减小区域,颜色越深表示误差改正绝对值越大。
图4 研究区域模型校正误差空间分布格局

Fig. 4 Spatial distribution pattern of model correction errors in the study area

图5 测试集误差改正值空间分布格局

Fig. 5 Spatial distribution of correction elevation error of test set in the study area

从测试集误差改正空间分布可以看出:① 在地势起伏度较低的平原和风沙丘陵地貌区经RFR模型和RProp模型校正后误差绝对值有所减小,但在北部和南部部分区域存在误差异常值,经SVR模型和CNN模型校正后中部风沙丘陵与南部平原区误差绝对值增大明显;② 经RFR模型校正后南部与西南部黄土塬地貌区误差值均有所降低,而SVR、RProp和CNN模型校正后西南部黄土塬出现误差值增大现象;③ 山地地貌主要分布在研究区域的东部、南部和西南部,经4个模型校正后误差均有所降低,其中SVR模型校正后误差降低值最大,且分布均匀,效果最佳;④ 黄土丘陵地貌区经RProp模型校正后误差降低明显,CNN模型校正后中部黄土丘陵异常值较多,RFR模型和SVR模型校正后在北部与西南部误差值显著增大;⑤ 土石丘陵地貌区经RFR模型校正后部分区域误差值增加,SVR,RProp与CNN模型校正后误差整体减小,其中CNN模型校正后误差绝对值减小幅度最大,效果最佳。

3.4 地形剖面高程误差验证

地形剖面图指沿地表某一直线方向上的垂直剖面,以显示剖面线上断面地势起伏状况。通过剖面上点位的原始误差与模型校正后误差进行对比,可用来检验不同地貌类型区模型误差校正效果,如图6所示。① RFR模型在平原和风沙丘陵与原误差较为贴合,黄土塬和山地地貌有效降低高程误差,在土石丘陵和黄土丘陵地貌区误差波动较大。② SVR模型在山地和黄土丘陵地貌能够有效减小误差值,但黄土丘陵地貌校正后误差仍趋向正值幅度较大,平原和风沙丘陵地貌经校正后误差值明显增大,且平原、风沙丘陵与土石丘陵地貌整体偏向负值明显。③ RProp模型校正后高程误差整体有所降低,在黄土丘陵地貌校正后误差值降低最为显著,但是在平原地貌异常值较多。④ CNN模型整体效果不如RFR和RProp模型,在平原地貌区误差偏向负值幅度较大,黄土丘陵地貌区经校正后异常值较多,土石丘陵地貌剖面误差效果4个模型中最佳,误差有效减少。
图6 典型剖面校正误差与原始误差对比

Fig. 6 Comparison between correction error and original error in typical section

4 讨论

在研究区域不同地貌类型区构建的RFR、SVR、RProp、CNN高程误差校正模型效果具有明显差异,与模型机理、特点及地形特征存在相关性: ① RFR模型在回归过程中不用对输入的影响参数特征进行筛选,可以计算出所有参数变量对最终模型的贡献,使得影响变量识别相关性更好[47],因此RFR高程误差模型在黄土高原多数地貌类型区均能获得较好的校正效果,但由于整个回归过程不可见,即把所有特征和数据放入“黑盒子”里,误差模型最终结果精度则是由所有影响因素决策树精度决定的[48-49],RFR作为集成树模型是对多棵树的权值进行平均,而不能进行权值校正,因此,当误差模型中存在精度较差的树时,会限制模型整体精度提升效果,因此在黄土丘陵、山地和土石丘陵地貌区取得的误差校正效果不如其余模型。② 由于缺乏明确的解析表达式,SVR对影响因子欠缺解释能力,本实验选择的地形因子是经过前人研究验证过对高程误差具有显著影响[35,37],在平均绝对误差值在5 m以下,平均坡度在8°以下的平原、风沙丘陵地貌区原始高程误差值相对较小,地形因子无法对高程误差进行约束,使得一部分数据成为“噪声”数据,导致模型在黄土高原区的高程校正精度效果呈两级分化,在地形平坦、误差较低的平原和风沙丘陵高程校正效果较差,地形起伏大,原始误差较大的山地地貌区校正效果良好。③ RProp误差模型通过感知层进行自我学习,在高程误差模型训练过程中通过对影响因子权重的更新消除梯度对权值的影响[35],神经网络在输入样本的刺激下改变了网络的连接权值,使网络的输出不断接近期望的输出值,直到运算结果达到满意精度或预设学习步数为止,在这种不断“学习”的机制下,RProp模型在多种地貌类型区均取得了较好的高程误差校正效果,尤其在黄土丘陵地貌区优于另外3种模型。④ CNN误差回归模型进行卷积与池化操作提取数据特征时也对部分信息进行丢弃,这对数据形式与数据量提出了高要求[50]。本研究中所使用的高程值与参与建模的影响因素值均为二维数据,数据形式一致;在进行模型应用效果检验时对所有采样高程点进行了验证,结果在风沙丘陵、黄土塬、山地与黄土丘陵地貌区,高程校正精度略高于初始经稀疏采样后的误差回归模型,因此在CNN误差模型在优化与运用过程中,数据扩增可一定程度上提升其在上述地貌类型区的适用性。
在以往的研究中,部分学者是以不同的模型算法效果为导向,提出一种有效的高程校正模型方法[35,37];也有学者选择一种地貌样区,测试数种模型算法的效果[51],取得了有效的结论。本研究相比先前的研究有以下优势:① 研究区尺度较大,地貌类型丰富,能够有效分析出不同地形地貌区域SRTM DEM高程误差特征及其影响因素的变化规律;②对不同地貌所适用的高程校正模型给出了明确的指导,为实际应用提供了有力的支撑。
研究还需要改进和完善之处在于:① 本研究所使用的地理地貌分区图在部分地貌交界处划分不精确,会对部分地貌的模型精度产生一定的影响,在后续实际应用过程中可以考虑引入更加精确的地貌划分进一步提升精度;② 地形因子建模变量的选择对精度的影响同样重要,日后的研究中可以考虑引入新的地形因子参与建模,研究其对模型精度的影响。

5 结论

以具有典型地貌的黄土高原为研究区域,利用RFR、SVR、RProp、CNN 4种主流机器学习算法建立SRTM DEM高程误差校正模型并探讨其适用性,通过模型性能评价、模型校正效果分析,误差空间分布以及地形剖面误差图综合比较得出结论。
(1)在平原、风沙丘陵、黄土塬地貌区,由于地势起伏度低,原始高程误差较小,4种模型均方根误差改正效果不明显,相对而言RFR能够让平均绝对误差得到一定程度减小,并且使误差频数主要集中在0值附近,缩减了误差值离散幅度;同时校正误差在空间分布上异常值较少,低起伏度的平原和风沙丘陵地貌区典型剖面误差与原误差较为贴合。
(2)在山地区域, SVR模型效果最优,均方根误差和平均绝对误差降低显著,可大幅提升误差绝对值较小的点位频数,同时在空间格局和典型剖面验证效果最佳。
(3)在黄土丘陵地貌区RProp模型适用性更强,校正后误差性能指标最理想,均方根误差和平均绝对误差降幅明显,可以使误差值减小的点位频数得到有效增加,空间分布上误差降低效果显著,典型剖面误差异常值较少。
(4)在土石丘陵地貌区,CNN模型效果最佳,校正后均方根误差与平均绝对误差都能得到大幅度降低,并且一定程度减少了误差绝对值较高的点位频数,空间分布与地形剖面误差降低效果良好。
本研究可为获取黄土高原区SRTM1 DEM高程误差特征以及不同地貌区选用高程校正模型提供了参考,进而提高该区域SRTM1 DEM应用精度;后续可以通过数据融合等方式对该区域高程校正做进一步探讨。
[1]
Farr T G, Rosen P A, et al. The shuttle radar topography mission[J]. Reviews of Geophysics, 2007, 45(2): RG2004. DOI:10.1029/2005rg000183

DOI

[2]
Zandbergen P. Applications of shuttle radar topography mission elevation data[J]. Geography Compass, 2008, 2(5):1404-1431. DOI:10.1111/j.1749-8198.2008.00154.x.

DOI

[3]
Hengl T, Mendes de Jesus J, Heuvelink G B M, et al. SoilGrids250m: Global gridded soil information based on machine learning[J]. PLoS One, 2017, 12(2):e0169748. DOI: 10.1371/journal.pone.0169748

DOI

[4]
Drăguţ L, Blaschke T. Automated classification of landform elements using object-based image analysis[J]. Geomorphology, 2006, 81(3/4):330-344. DOI:10.1016/j.geomorph.2006.04.013

DOI

[5]
Sun G, Ranson K J, Kharuk V I, et al. Validation of surface height from shuttle radar topography mission using shuttle laser altimeter[J]. Remote Sensing of Environment, 2003, 88(4):401-411. DOI:10.1016/j.rse.2003.09.001

DOI

[6]
陈学兄, 常庆瑞, 郭碧云, 等. 基于SRTM DEM数据的中国地形起伏度分析研究[J]. 应用基础与工程科学学报, 2013, 21(4):670-678.

[Chen X X, Chang Q R, Guo B Y, et al. Analytical study of the relief amplitude in China based on SRTM DEM data[J]. Journal of Basic Science and Engineering, 2013, 21(4):670-678.] DOI:10.3969/j.issn.1005-0930.2013.04.009

DOI

[7]
Grohman G, Kroenung G, Strebeck J. Filling SRTM voids: The delta surface fill method[J]. Photogrammetr. Eng. Remote Sens, 2006(72):213-216.

[8]
沈焕锋, 刘露, 岳林蔚, 等. 多源DEM融合的高差拟合神经网络方法[J]. 测绘学报, 2018, 47(6):854-863.

[Shen H F, Liu L, Yue L W, et al. A multi-source DEM fusion method based on elevation difference fitting neural network[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(6):854-863.] DOI:10.11947/j.AGCS.2018.20180135

DOI

[9]
Li S J, Hu G H, Cheng X H, et al. Integrating topographic knowledge into deep learning for the void-filling of digital elevation models[J]. Remote Sensing of Environment, 2022, 269:112818. DOI:10.1016/j.rse.2021.112818

DOI

[10]
Dong G S, Chen F, Ren P. Filling SRTM void data via conditional adversarial networks[C]// IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium. IEEE, 2018:7441-7443. DOI:10.1109/IGARSS.2018.8518992

DOI

[11]
Reuter H I, Nelson A, Jarvis A. An evaluation of void-filling interpolation methods for SRTM data[J]. International Journal of Geographical Information Science, 2007, 21(9):983-1008. DOI:10.1080/13658810601169899

DOI

[12]
胡海, 游涟, 胡鹏, 等. 数字高程模型内插方法的分析和选择[J]. 武汉大学学报(信息科学版), 2011, 36(1):82-85.

[Hu H, You L, Hu P, et al. Research on the choice ofinterpolation methods for generating DEM[J]. Geomatics and Information Science of Wuhan University, 2011, 36(1):82-85.] DOI:10.13203/j.whugis2011.01.013

DOI

[13]
Rodríguez E, Morris C S, Belz J E. A global assessment of the SRTM performance[J]. Photogrammetric Engineering & Remote Sensing, 2006, 72(3):249-260. DOI: 10.14358/pers.72.3.249

DOI

[14]
Mouratidis A, Briole P, Katsambalos K. SRTM 3'' DEM (versions 1, 2, 3, 4) validation by means of extensive kinematic GPS measurements: A case study from North Greece[J]. International Journal of Remote Sensing, 2010, 31(23):6205-6222. DOI:10.1080/01431160903401403

DOI

[15]
Suwandana E, Kawamura K, Sakuno Y, et al. Evaluation of aster gdem2 in comparison with gdem1, srtm Dem and topographic-map-derived Dem using inundation area analysis and rtk-dgps data[J]. Remote Sensing, 2012, 4(8):2419-2431. DOI: 10.3390/rs4082419.

DOI

[16]
Zhao G S, Xue H, Ling F. Assessment of ASTER GDEM performance by comparing with SRTM and ICESat/GLAS data in Central China[C] // 2010 18th International Conference on Geoinformatics. IEEE, 2010:1-5. DOI: 10.1109/GEOINFORMATICS.2010.5567970

DOI

[17]
李鹏, 李振洪, 施闯, 等. 中国地区30 m分辨率SRTM质量评估[J]. 测绘通报, 2016(9):24-28.

[Li P, Li Z H, Shi C, et al. Quality evaluation of 1 arc second version SRTM DEM in China[J]. Bulletin of Surveying and Mapping, 2016(9):24-28.] DOI:10.13474/j.cnki.11-2246.2016.0285

DOI

[18]
张朝忙, 刘庆生, 刘高焕, 等. 太湖地区SRTM DEM高程精度质量评价[J]. 测绘科学, 2014, 39(3):139-142,123.

[Zhang C M, Liu Q S, Liu G H, et al. Evaluation of SRTM data elevation quality in Taihu drainage basin[J]. Science of Surveying and Mapping, 2014, 39(3):139-142.] DOI: 10.16251/j.cnki.1009-2307.2014.03.031

DOI

[19]
Grohmann C H. Evaluation of TanDEM-X DEMs on selected Brazilian sites: Comparison with SRTM, ASTER GDEM and ALOS AW3D30[J]. Remote Sensing of Environment, 2018, 212:121-133. DOI:10.1016/j.rse.2018.04.043

DOI

[20]
Graf L, Moreno-de-las-Heras M, Ruiz M, et al. Accuracy assessment of digital terrain model dataset sources for hydrogeomorphological modelling in small Mediterranean Catchments[J]. Remote Sensing, 2018, 10(12): 2014. DOI: 10.3390/rs10122014

DOI

[21]
赵尚民, 何维灿, 王莉. DEM数据在黄土高原典型地貌区的误差分布[J]. 测绘科学, 2016, 41(2):67-70.

[Zhao S M, He W C, Wang L. Error distribution analysis of SRTM3DEM V4 data in the typical geomorphologic area of Loess Plateau[J]. Science of Surveying and Mapping, 2016, 41(2):67-70,102.] DOI:10.16251/j.cnki.1009-2307.2016.02.014

DOI

[22]
Smith B. Accuracy and resolution of shuttle radar topography mission data[J]. Geophysical Research Letters, 2003, 30(9):1467. DOI:10.1029/2002gl016643

DOI

[23]
Hirt C, Filmer M S, Featherstone W E. Comparison and validation of the recent freely available ASTER-GDEM ver1, SRTM ver4.1 and GEODATA DEM-9S ver3 digital elevation models over Australia[J]. Australian Journal of Earth Sciences, 2010, 57(3):337-347. DOI:10.1080/08120091003677553

DOI

[24]
Shortridge A, Messina J. Spatial structure and landscape associations of SRTM error[J]. Remote Sensing of Environment, 2011, 115(6):1576-1587. DOI:10.1016/j.rse.2011.02.017

DOI

[25]
Miliaresis G C. The landcover impact on the aspect/slope accuracy dependence of the SRTM-1 elevation data for the Humboldt range[J]. Sensors (Basel, Switzerland), 2008, 8(5):3134-3149. DOI:10.3390/s8053134

DOI

[26]
Bhang K J, Schwartz F W, Braun A. Verification of the vertical error in C-band SRTM DEM using ICESat and landsat-7, otter tail County, MN[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(1):36-44. DOI: 10.1109/TGRS.2006.885401

DOI

[27]
Braun A, Fotopoulos G. Assessment of SRTM, ICESat, and survey control monument elevations in Canada[J]. Photogrammetric Engineering & Remote Sensing, 2007, 73(12):1333-1342. DOI:10.14358/pers.73.12.1333

DOI

[28]
Magruder L, Neuenschwander A, Klotz B. Digital terrain model elevation corrections using space-based imagery and ICESat-2 laser altimetry[J]. Remote Sensing of Environment, 2021, 264:112621. DOI: 10.1016/j.rse.2021.112621

DOI

[29]
O'Loughlin F E, Paiva R C D, Durand M, et al. A multi-sensor approach towards a global vegetation corrected SRTM DEM product[J]. Remote Sensing of Environment, 2016, 182:49-59. DOI:10.1016/j.rse.2016.04.018

DOI

[30]
Bulatović V, Sušić Z, Ninkov T. Estimate of the ASTER GDEM regional systematic errors and their removal[J]. International Journal of Remote Sensing, 2012, 33(18):5915-5926. DOI:10.1080/01431161.2012.676744

DOI

[31]
Tran T A, Raghavan V, Masumoto S, et al. A geomorphology-based approach for digital elevation model fusion - case study in Danang city, Vietnam[J]. Earth Surface Dynamics, 2014, 2(2):403-417. DOI:10.5194/esurf-2-403-2014

DOI

[32]
Pham, H T, Marshall L, Johnson F, et al. A method for combining SRTM DEM and ASTER GDEM2 to improve topography estimation in regions without reference data[J]. Remote Sensing of Environment, 2018, 210:229-241. DOI:10.1016/j.rse.2018.03.026

DOI

[33]
秦臣臣, 陈传法, 杨娜, 等. 基于ICESat/GLAS的山东省SRTM与ASTER GDEM高程精度评价与修正[J]. 地球信息科学学报, 2020, 22(3):351-360.

DOI

[Qin C C, Chen C F, Yang N, et al. Elevation accuracy evaluation and correction of SRTM and ASTER GDEM in Shandong Province based on ICESat/GLAS[J]. Journal of Geo-information Science, 2020, 22(3):351-360.] DOI:10.12082/dqxxkx.2020.190411

DOI

[34]
Yue L W, Shen H F, Zhang L P, et al. High-quality seamless DEM generation blending SRTM-1, ASTER GDEM v2 and ICESat/GLAS observations[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 123:20-34. DOI:10.1016/j.isprsjprs.2016.11.002

DOI

[35]
张丽, 董有福, 厉鸣. 利用弹性反馈神经网络融合ASTER GDEM和SRTM1高程数据[J]. 武汉大学学报·信息科学版, 2022, 47(1):1-9.

[Zhang L, Dong Y F, Li M. ASTER GDEM and SRTM1 elevation data integration with rprop neural network[J]. Geomatics and Information Science of Wuhan University, 2022, 47(1):1-9.] DOI:10.13203/j.whugis20200679

DOI

[36]
Kasi V, Yeditha P K, Rathinasamy M, et al. A novel method to improve vertical accuracy of CARTOSAT DEM using machine learning models[J]. Earth Science Informatics, 2020, 13(4):1139-1150. DOI:10.1007/s12145-020-00494-1

DOI

[37]
余婷婷, 董有福. 利用随机森林回归算法校正ASTER GDEM高程误差[J]. 武汉大学学报·信息科学版, 2021, 46(7):1098-1105.

[Yu T T, Dong Y F. Correcting elevation error of ASTER GDEM using random forest regression algorithm[J]. Geomatics and Information Science of Wuhan University, 2021, 46(7):1098-1105.] DOI:10.13203/j.whugis20190245

DOI

[38]
NASA's Distributed Active Archive Centers[DB/OL]. https://search.earthdata.nasa.gov/.

[39]
Rabus B, Eineder M, Roth A, et al. The shuttle radar topography mission—a new class of digital elevation models acquired by spaceborne radar[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2003, 57(4):241-262. DOI:10.1016/S0924-2716(02)00124-7

DOI

[40]
National Snow&Ice Data Center. Data at NSIDC[DB/OL]. https://nsidc.org/data/icesat-2/.

[41]
王密, 韦钰, 杨博, 等. ICESat-2/ATLAS全球高程控制点提取与分析[J]. 武汉大学学报·信息科学版, 2021, 46(2):184-192.

[Wang M, Wei Y, Yang B, et al. Extraction and analysis of global elevation control points from ICESat-2/ATLAS data[J]. Geomatics and Information Science of Wuhan University, 2021, 46(2):184-192.] DOI:10.13203/j.whugis20200531

DOI

[42]
Tian X X, Shan J. Comprehensive evaluation of the ICESat-2 ATL08 terrain product[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 59(10):8195-8209. DOI: 10.1109/TGRS.2021.3051086

DOI

[43]
Zhu J, Yang P F, Li Y, et al. Accuracy assessment of ICESat-2 ATL08 terrain estimates: A case study in Spain[J]. Journal of Central South University, 2022, 29(1):226-238. DOI:10.1007/s11771-022-4896-x

DOI

[44]
Globeland30官方网站,2020版30米全球土地覆盖数据集[DB/OL]. http://globallandcover.com/.

[45]
杨勤科. 黄土高原地区地理分区图(2000年). 地球系统科学数据共享平台黄土高原科学数据共享平台, 2013.

[Yang Q K. Graphs of Geographical Division on the Loess Plateau (2000). Data Sharing Infrastructure of Earth System Science_Data Sharing Infrastructure of Loess Plateau, 2013.]

[46]
Srivastava N, Hinton G E, Krizhevsky A, et al. Dropout: A simple way to prevent neural networks from overfitting[J]. Journal of Machine Learning Research, 2014, 15(1):1929-1958.

[47]
Wang Y Y, Wu G L, Deng L, et al. Prediction of aboveground grassland biomass on the Loess Plateau, China, using a random forest algorithm[J]. Scientific Reports, 2017, 7:6940. DOI:10.1038/s41598-017-07197-6

DOI PMID

[48]
邢晓语, 杨秀春, 徐斌, 等. 基于随机森林算法的草原地上生物量遥感估算方法研究[J]. 地球信息科学学报, 2021, 23(7):1312-1324.

DOI

[Xing X Y, Yang X C, Xu B, et al. Remote sensing estimation of grassland aboveground biomass based on random forest[J]. Journal of Geo-Information Science, 2021, 23(7):1312-1324.] DOI:10.12082/dqxxkx.2021.200605

DOI

[49]
毛亚萍, 房世峰. 基于机器学习的参考作物蒸散量估算研究[J]. 地球信息科学学报, 2020, 22(8):1692-1701.

DOI

[Mao Y P, Fang S F. Research of reference evapotranspiration’s simulation based on machine learning[J]. Journal of Geo-Information Science, 2020, 22(8):1692-1701.] DOI: 10.12082/dqxxkx.2020.200085

DOI

[50]
周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6):1229-1251.

[Zhou F Y, Jin L P, Dong J. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6):1229-1251.] DOI: 10.11897/SP.J.1016.2017.01229

DOI

[51]
厉鸣, 董有福, 张丽. 统计回归分析算法校正AW3D30高程误差适用性研究[J]. 测绘科学, 2022, 47(2):23-30.

[Li M, Dong Y F, Zhang L. Research on the applicability of statistical regression analysis algorithm correcting AW3D30 elevation error[J]. Science of Surveying and Mapping, 2022, 47(2):23-30,61.] DOI:10.16251/j.cnki.1009-2307.2022.02.004

DOI

文章导航

/