地球信息科学学报, 2023, 25(2): 409-420 doi:10.12082/dqxxkx.2023.220483

遥感科学与应用技术

结合ICESat-2和GEDI的中国东南丘陵地区ASTER GDEM高程精度评价与修正

焦怀瑾,1,2, 陈崇成1,2, 黄洪宇,1,2,*

1.福州大学地理空间信息技术国家地方联合工程研究中心,福州 350108

2.福州大学空间数据挖掘与信息共享教育部重点实验室,福州 350108

Elevation Accuracy Evaluation and Correction of ASTER GDEM in China Southeast Hilly Region by Combining ICESat-2 and GEDI data

JIAO Huaijin,1,2, CHEN Chongcheng1,2, HUANG Hongyu,1,2,*

1. National Engineering Research Center of Geospatial Information Technology, Fuzhou University, Fuzhou 350108, China

2. Key Lab of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350108, China

通讯作者: 黄洪宇(1971— ),男,福建莆田人,助理研究员,主要从事激光雷达和影像三维数据获取和分析研究。 E-mail: hhy1@fzu.edu.cn

收稿日期: 2022-07-6   修回日期: 2022-10-16  

基金资助: 福建省科技计划项目(2020I0008)
福建省高校产学合作项目(2022N5008)
福建省科技创新领军人才项目

Corresponding authors: HUANG Hongyu, E-mail: hhy1@fzu.edu.cn

Received: 2022-07-6   Revised: 2022-10-16  

Fund supported: Fujian Provincial Science and Technology Plan Project(2020I0008)
Fujian Provincial Univer- sity-industry Cooperation Project(2022N5008)
Fujian Provincial Leading Talents of Scientific and Technological Innovation Project

作者简介 About authors

焦怀瑾(1999— ),男,江西吉安人,硕士研究生,主要从事地学可视化与虚拟地理环境研究。E-mail: huai_jin@foxmail.com

摘要

星载激光雷达ICESat-2和GEDI可以为数字高程模型产品的精度评价与修正提供全球覆盖的、可靠的高精度参考数据源。然而,现有的DEM修正方法主要是针对DEM误差中的植被高信号且多采用线性回归模型。为此,本文分析了ASTER GDEM v3精度与土地覆盖类型、高程、坡度、起伏度及植被覆盖率的关系。在此基础上,提出了一种考虑上述多种精度影响因素并结合XGBoost和空间插值的DEM误差修正方法。结果分析表明:原始ASTER GDEM的误差整体呈正态分布,平均误差为-3.463 m,存在较大负偏差,高程精度随着高程、坡度、起伏度及植被覆盖率VCF的增大呈降低趋势;经过修正后, ASTER GDEM平均误差降低到了-0.233 m,负偏差得到有效改善,整体平均绝对误差降低了26.04%,整体均方差降低了23.56%,耕地、林地、草地、湿地、水域及人造地表的DEM平均绝对误差和均方差都有不同程度的降低;本文提出的方法对多种特征要素与地形误差间的非线性关系进行拟合建模,在研究区取得了较好的修正效果。

关键词: ICESat-2; GEDI; ASTER; 高程精度评价; XGBoost; 空间插值; 土地覆盖类型; DEM修正

Abstract

Global Ecosystem Dynamics Investigation (GEDI) and Ice, Cloud, and land Elevation Satellite-2 (ICESat-2) products provide reliable global references for the accuracy evaluation and correction of Global Digital Elevation Model (GDEM). However, existing DEM correction methods mainly address the signal of vegetation in DEM errors and mostly use linear regression models. So, we first analyze the relationship between Advanced Spaceborne Thermal Emission and Reflection Radiometer (ASTER) GDEM v3 data accuracy and the land cover type, elevation, slope, relief amplitude, and vegetation coverage. Based on this, this paper proposes a Digital Elevation Model (DEM) error correction method that takes into account various influencing factors and combines Extreme Gradient Boosting (XGBoost) machine learning and spatial interpolation to model the errors. The analysis of the results shows that the overall error of the original ASTER GDEM has a normal distribution with a large negative offset (average error of -3.463 m). The Mean Absolute Error (MAE) and Root Mean Squared Error (RMSE) of original ASTER GDEM are 12.930 m and 16.695 m, respectively, and the elevation accuracy decreases with the increase of elevation, slope, relief amplitude, and vegetation coverage. After correction, the Mean Error (ME) of ASTER GDEM is reduced to -0.233 m, which means the negative deviation is effectively removed and the overall MAE and overall RMSE are reduced by 26.04% and 23.56%, respectively. The MAE and RMSE of DEM for cultivated lands, forests, grasslands, wetlands, water bodies, and man-made surfaces are all reduced by different degrees. The DEM accuracy evaluation and correction method proposed in this paper models the non-linear relationships between multiple feature elements and terrain errors and achieves better correction results in the study area.

Keywords: ICESat-2; GEDI; ASTER; elevation accuracy evaluation; XGBoost; spatial interpolation; land cover type; DEM correction

PDF (13759KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

焦怀瑾, 陈崇成, 黄洪宇. 结合ICESat-2和GEDI的中国东南丘陵地区ASTER GDEM高程精度评价与修正[J]. 地球信息科学学报, 2023, 25(2): 409-420 doi:10.12082/dqxxkx.2023.220483

JIAO Huaijin, CHEN Chongcheng, HUANG Hongyu. Elevation Accuracy Evaluation and Correction of ASTER GDEM in China Southeast Hilly Region by Combining ICESat-2 and GEDI data[J]. Geo-Information Science, 2023, 25(2): 409-420 doi:10.12082/dqxxkx.2023.220483

1 引言

数字高程模型(Digital Elevation Model,DEM)作为最基础的地理信息产品之一[1],在基础工程建设、灾害监测、资源调查等领域发挥着重要作用[2]。传统光学遥感和干涉合成孔径雷达(Interferometric Synthetic Aperture Radar,InSAR)是目前全球尺度DEM数据获取的重要手段[3],然而由于对地观测技术的局限性,获取的全球尺度DEM数据中不可避免地包含植被、建筑物等信息,这将影响DEM对实际地形的表达精度。科学研究中所使用数据的精度将直接影响研究结果的可靠性,因此充分了解所使用的全球尺度DEM数据的误差情况并利用可靠手段提高其精度至关重要。

ASTER GDEM是一款通过光学立体摄影测量得到的全球尺度DEM产品,自ASTER GDEM发布以来,许多学者都聚焦于对其精度的评价。目前常用的精度评价方法是选择高精度的DTM或GNSS测量点作为参考数据,然而这两种数据采集成本高、工作量大。ICESat(Ice, Cloud, and land Elevation Satellite)卫星自2003年发射以来获取了大量全球尺度的高精度高程数据,ICESat-2于2018年发射,它是对ICESat工作的延续与改进, ICESat-2获取的数据在数据密度和精度相较于ICESat都得到较大提升[4]。ICESat-2发射同年,美国发射了全球生态系统动力学调查雷达(GEDI),其主要用于全球尺度的森林冠层高度、垂直结构以及地表高程的精准测量[5-6]。二者能够在大范围区域内迅速地获取大量的高精度高程点[7]。研究表明,ICESat-2数据产品的地表高程精度优于0.8 m[8-9],GEDI数据产品的地表高程精度优于1.8 m[10-11],精度远远高于ASTER GDEM。这些星载激光雷达高程数据为DEM精度评价提供了一种新途径。

随着DEM应用的日益广泛,DEM误差修正成为学者们关注的研究热点。如Gallant等[12]利用Landsat TM数据识别出植被覆盖地块,通过估算每个地块的植被高从而移除SRTM(Shuttle Radar Topography Mission) DEM中的植被高信号;Baugh等[13]利用ICESat数据在林区的测量结果估算SAR(Synthetic Aperture Radar)信号对植被的穿透深度从而移除SRTM DEM中的植被高信号;Tan等[14]以GEDI冠层高度为参考,利用InSAR相干散射模式估算森林高度,在此基础上建立了基于森林高度和植被覆盖度的线性回归模型,并利用该模型移除TanDEM-X(TerraSAR-X add-on for Digital Elevation Measurements)DEM中的植被高信号;张晨等[15]基于ICESat-2数据使用随机森林算法反演得到植被高从而扣除TanDEM-X DEM中的植被高信号。上述研究主要是针对DEM误差中的植被高信号,没有考虑其他地物信号及地形地貌因素,这限制了方法在多种土地覆盖类型下的应用。考虑各种影响因素的线性回归方法也常用于DEM误差修正。如杜小平等[16]通过建立ICESat数据与ASTER GDEM的一元线性回归模型实现对DEM的修正;Su等[17]通过建立DEM误差随树高、植被覆盖率和地形坡度变化的线性回归模型修正SRTM DEM。此外,秦臣臣等[18]采用反距离加权、普通克里金、地形转栅格和自然邻域4种空间插值方法构建误差曲面从而修正SRTM DEM和ASTER GDEM。然而,单纯地使用空间插值或线性回归模型并不足以挖掘各种影响因素与DEM误差的关系从而限制了误差修正的效果。

XGBoost机器学习模型于2016年由Chen等[19]提出,该模型是在梯度提升树模型(Gradient Boosting Decision Tree)的基础上进行优化而得到的一种高效模型,强大的数据拟合能力使得它能够把大量非线性关系的特征要素拟合在一起,具有精度高、模型简单、支持并行化以及能有效防止过拟合等优势,并且借鉴了随机森林算法,支持列抽样,训练速度快。单个星载激光雷达足迹通常沿地面轨道均匀分布而不是随机分布,这会产生强烈的条带效应,结合ICESat-2和GEDI两种不同的星载激光雷达数据不仅可以缓解条带效应还可以提高高精度参考高程点的地面覆盖程度及数量[6]。为此,本文以ICESat-2及GEDI数据为参考,评价ASTER GDEM的精度,并分析了土地覆盖类型、高程、坡度、起伏度及植被覆盖率与ASTER GDEM精度的关系。在此基础上,提出了一种结合XGBoost与空间插值的DEM修正方法。

2 研究区概况与数据来源

2.1 研究区概况

本文以福建泰宁为研究区对ASTER GDEM进行精度评价和修正。福建泰宁位于我国东南部地区武夷山脉中段的东南侧,26.5°N—27.5°N,116.5°E—117.5°E,占地总面积1539.38 km2图1)。

图1

图1   研究区ICESat-2及GEDI数据覆盖以及基于ASTER GDEM的地形分布情况

Fig. 1   ICESat-2 and GEDI data coverage and ASTER GDEM in the study area


泰宁涵盖多种土地覆盖类型,地形以山地和丘陵为主,海拔差异较大,山地多平原少,河流众多,水系发达,植被以中南亚热带常绿阔叶林为主,山地占38.7%,丘陵占59.9%,河谷盆地占1.4%,复杂的地形地貌和茂密的植被覆盖为本文的研究提供了一个良好的实验案例。

2.2 DEM数据来源

ASTER GDEM是由日本和美国联合研制并免费公开的全球数字高程产品,该产品是通过光学立体摄影测量的手段获取,由于包含地表建筑物及植被信息,严格意义上ASTER GDEM属于DSM产品[20]。ASTER GDEM有v1、v2、v3共3个版本,覆盖了全球83°S—83°N范围内的所有陆地区域,分辨率为1″(约30 m),数据的获取时间均为2000—2009年。GDEM v1是在无控制点的情况下利用全球范围光学立体像对全自动生产完成,GDEM v2较v1采用了更加先进的算法,提高了高程精度和空间分辨率精度,GDEM v3在v2的基础上新增了大量光学立体像对,覆盖范围及高程精度得到一定提升。本文采用ASTER GDEM v3数据[21]https://earthdata.nasa.gov/),垂直标称精度为±20 m,参考椭球体为WGS84。

2.3 ICESat-2及GEDI星载激光雷达数据来源

ICESat-2卫星搭载了光子计数激光测高仪(Advanced Topographic Laser Altimeter System,ATLAS),ATLAS首次在卫星平台应用了微脉冲多波束光子计数激光雷达技术,新技术的应用使得ICESat-2在林下地形及冠层高度测绘方面具有巨大优势[4,22]。每次脉冲ATLAS产生6个独立光束,每条独立光束可以沿轨道获取间隔约0.7 m、直径约 17 m 的重叠光斑。6个独立光束沿轨排列成平行的3对进行对地观测,每对又分为能量功率比为4:1的强弱光束。ICESat-2/ATLAS包括22种标准数据产品,本文主要采用ATL03及ATL08数据产品[23-24],ATL03 提供了接收光子的经纬度、椭球高度(以WGS84为参考椭球体)及光子分类等基础信息,是生成其他产品的基础数据,而ATL08数据是在ATL03数据的基础上处理得到的每100m统计单元的陆地及植被参数(https://nsidc.org/data/icesat-2/)。

GEDI搭载了一种全波形多光束激光高度计(Full-waveform, Multibeam Laser Altimeter),该高度计共携带3个激光发射器,产生沿轨共8条平行光束(4条覆盖光束、4条全功率光束)[10]。每条独立光束可以沿轨道获取间隔约60 m、直径约25 m 的光斑。GEDI的数据产品分为4个级别,本文主要采用GEDI的二级数据产品L2A[25],该产品提供了沿轨60 m每个光斑中心位置的地表高程和冠层分位数高度指数[26]https://lpdaac.usgs.gov/products/gedi02_av001/)。

本文获取了覆盖研究区全域的ICESat-2及GEDI数据(图1),共包含研究区12个条带的ATL03及ATL08数据产品及9个条带的L2A数据产品。

2.4 其他相关数据来源

30 m全球地表覆盖数据(GlobeLand30)是我国自主研发的30 m空间分辨率全球土地覆盖数据[27]。Globleland30共有3个版本,对应不同年份的全球土地覆盖类型。GlobeLand30数据研制所使用的分类影像主要是30 m多光谱影像,包括Landsat-5专题制图仪、Landsat-7增强型专题制图仪、OLI多光谱影像和中国环境减灾卫星(HJ-1)多光谱影像,2020版数据还使用了16 m分辨率高分一号(GF-1)多光谱影像。GlobeLand30数据共包括10个一级类型,分别是:耕地、林地、草地、灌木地、湿地、水域、苔原、人造地表、裸地、冰川和永久积雪,总体分类精度为85.72%,本文使用的是Globleland30的2020版本(图2(a))。

图2

图2   研究区土地覆盖类型及植被覆盖率

Fig. 2   Land cover types and vegetative cover fraction of Taining County


植被连续场(Vegetation Continuous Field,VCF)提供地表固定空间分辨率内的植被覆盖率数据[28]。为匹配ASTER GDEM的空间分辨率和时间尺度, 本文使用的VCF是由2000—2009年的Landsat VCF经过中值合成得到(图2(b))。Landsat VCF由Landsat-5专题制图仪和Landsat-7增强型专题制图仪获取的所有波段数据处理得到,包含30 m×30 m像素内高度大于5 m植被的植被覆盖率[29-30]

3 研究方法

3.1 数据预处理

坡度和起伏度使用ArcGIS软件对ASTER GDEM进行处理得到,其中起伏度是通过计算ASTER GDEM九宫格像素内最大高程值与最小高程值的差值获得。栅格数据(ASTER GDEM、GlobeLand30、Landsat VCF、坡度、起伏度)的空间分辨率是30 m,存在着空间坐标系不同以及像素位置不匹配的可能性。为此,本文将上述栅格数据转换到ASTER GDEM空间坐标系中,并以ASTER GDEM像素为准采用双线性插值方法匹配所有栅格数据的像素位置。

ATL08数据产品提供了ICESat-2卫星沿轨100 m采样间隔的地表高程值,而ASTER GDEM的空间分辨率为30 m。为匹配二者的分辨率,使用开源工具Phoreal(Photon Research and Engineering Analysis Library, https://github.com/icesat-2UT/PhoREAL)将ATL08光子分类索引与ATL03数据关联并对ATL03光子进行标记从而建立ATL08与ATL03间的联系,通过计算ATL03数据沿轨每30 m步长范围内地表光子的高程平均值对ATL03光子进行重采样,得到ICESat-2沿轨每30 m步长中心点的地表高程,这种平均值更能反应沿轨每30 m内的地 表高程以匹配ASTER GDEM的空间分辨率。 GEDI_L2A数据集中提供的quality_flag和 degrade_flag 分别表示数据质量标志和卫星指向及定位状态降级标志,通过筛选出quality_flag参数等于1以及 degrade_flag参数等于0的光斑得到高质量GEDI高程点。最终得到了研究区内ICESat-2及GEDI高程点共计34 269个。为了消除噪声高程点的影响,首先根据Huang等[31]的方法删除高差绝对值大于100 m的高程点,再根据拉依达准则进一步删除高程点。此外,由于2种星载激光雷达高程点在研究区有交叠,对落到同一个像素中的多个高程点取平均值。最终剩余33 882个高程样本点。本文计算了每个ICESat-2及GEDI高程点与ASTER GDEM高程的差值。

3.2 精度评价方法

通过统计分析所有高程点位置处的DEM误差评价原始ASTER GDEM的整体高程精度。此外,本文提取了所有高程点位置的土地覆盖类型、高程、坡度、起伏度及植被覆盖率,通过分带误差统计分析ASTER GDEM精度与上述影响因素的关系。

为了有效地评价修正方法的效果,本文随机 将ICESat-2及GEDI高程点分成75%、20%及5% 3份数据集,其中75%的高程点用于建立研究区的DEM绝对误差曲面及DEM误差正负权重曲面,5%的高程点用于建立多元非线性回归方程,20%的高程点将作为检验数据集用于评价修正后ASTER GDEM的高程精度。

本文采用平均误差(ME)、平均绝对误差(MAE)、均方差(RMSE)以及决定系数(R2) 4种分析指标评价原始ASTER GDEM的精度及DEM修正方法的效果,其中前3个指标是广泛使用的参数,其定义在此不再赘述。决定系数(R2)也称为拟合优度,在文中仅用于修正后的数据精度评价,它反映了2种数据的接近程度[32]R2越接近1,2种数据的相关性越高,计算公式如下:

R2=1-iHi,ICESat-2&GEDI-Hi,Corrected ASTER GDEM2iHi,ICESat-2&GEDI-H-i,ICESat-2&GEDI2

式中:Hi,ICESat-2&GEDI表示第i个高程点的地表高程值;Hi,Corrected ASTER GDEM表示修正后的ASTER GDEM在第i个高程点对应位置的高程值;H-i,ICESat-2&GEDI表示检验数据集中所有高程点的平均值;n表示检验数据集中高程点的总数。

3.3 DEM修正方法及流程

地表覆盖物及地形地貌是研究区ASTER GDEM误差的主要来源。本文基于高程、坡度、起伏度、植被覆盖率及地理位置(经纬度)这5种因素与DEM误差之间的关系建模,来实现对DEM的修正。在上述各种影响因素的交互影响下,DEM在不同环境下的误差正负较为随机,特别在样本点较少的小范围研究区,很难寻找上述影响因素与误差正负的相关性。本文利用Spearman相关系数评估了上述影响因素与DEM误差及DEM绝对误差的相关性,Spearman相关系数是衡量2个变量的依赖性的非参数指标,它利用单调方程评价2个统计变量的相关性,计算公式如下:

ρ=ixi-x-yi-y-ixi-x-2iyi-y-2

式中:xi为第i个高程样本点位置处的精度影响因素(如高程)数值;yi为第i个高程样本点位置处的DEM误差或DEM绝对误差;x-表示所有高程样本点位置处精度影响因素数值的平均值;y-表示所有高程样本点位置处DEM误差或DEM绝对误差的平均值。

从计算的Spearman相关系数(表1)可见,除了经纬度之外,其他因素与DEM绝对误差的相关性均高于其与DEM误差的相关性,因此本文选择将DEM绝对误差作为XGBoost模型的目标值,高程、坡度、起伏度、植被覆盖率及地理位置(经纬度)作为输入值,借助XGBoost模型对研究区的DEM绝对误差进行回归预测,从而得到研究区的DEM绝对误差曲面。

表1   DEM误差及DEM绝对误差与各影响因素的Spearman相关系数

Tab. 1  Spearman correlation coefficients of DEM error and absolute DEM error with each influencing factor

经度纬度高程坡度起伏度VCF
DEM误差0.0700.055-0.106-0.080-0.089-0.098
DEM绝对误差-0.059-0.0130.1700.2120.2280.210

新窗口打开| 下载CSV


选择DEM绝对误差作为XGBoost模型的目标值,其中一个关键性问题即如何确定误差的正负。根据地理学第一定律,误差为负的高程样本点附近DEM误差大概率为负值,同理误差为正的高程样本点附近的DEM误差大概率为正值。基于上述思想,本文利用一定数量的高程样本点插值出研究区的DEM误差正负权重曲面,首先将正误差样本点的DEM误差值标准化到范围0~1,负误差样本点的DEM误差值标准化到-1~0,再根据每个样本点经过标准化后的DEM误差正负权重利用反距离加权法插值出研究区的DEM误差正负权重曲面,这个权重曲面将用于有效评估研究区DEM误差正负情况。

通过建立DEM绝对误差预测值及DEM正负误差权重值与DEM误差值之间的多元非线性回归方程得到研究区DEM误差曲面,叠加原始ASTER GDEM和DEM误差曲面消除DEM误差实现DEM修正。图3为ASTER GDEM修正及精度评价流程。

图3

图3   DEM精度评价及修正流程

Fig. 3   Flow chart of accuracy evaluation and correction of ASTER GDEM


4 实验结果及分析

4.1 ASTER GDEM高程精度分析

本文以ICESat-2及GEDI高程点作为参考数据对ASTER GDEM高程误差进行统计分析(图4),误差通过计算ICESat-2及GEDI高程点与ASTER GDEM高程值的差值求得。ASTER GDEM的误差整体呈正态分布,平均误差为-3.463 m,平均绝对误差为12.930 m,均方差为16.695 m。

图4

图4   ASTER GDEM误差分布直方图

Fig. 4   Histogram of ASTER GDEM error distribution


不同土地覆盖类型下的ASTER GDEM误差统计情况表明(表2):不同土地覆盖类型下的ASTER GDEM高程精度存在显著差异,不同土地覆盖类型下的MAERMSE由大到小依次是:林地、草地、耕地、水域、人造地表和湿地,这种精度差异产生的原因主要是不同土地覆盖类型的地表覆盖物及地形地貌。除人造地表外,其他土地覆盖类型下的DEM平均误差均为负值,这是由于ASTER GDEM光学摄影测量的数据采集手段对地表地物没有穿透性导致ASTER GDEM包含了地表各种地物信息。人造地表的ME为正的原因是ASTER GDEM与星载激光雷达数据的采集时间不同,这段时间内人造地表区域内建筑物的变化导致的。

表2   不同土地覆盖类型下的ASTER GDEM误差

Tab. 2  Error of ASTER GDEM for different land cover types

土地覆盖类型ME/mMAE/mRMSE/m
耕地-0.4359.74812.820
林地-4.34414.07717.866
草地-2.46412.83716.510
湿地-4.2326.2757.728
水域-3.5608.09511.023
人造地表0.7388.44510.973

新窗口打开| 下载CSV


基于高程、坡度、起伏度及土地覆盖率(VCF)对ASTER GDEM进行分带精度统计情况如图5所示。从坡度分带及起伏度分带对应的DEM平均误差及平均绝对误差的变化情况可以看出,ME随着坡度及起伏度的增加而减小,MAE随着坡度及起伏度的增加而增大,这说明随着坡度及起伏度的增加,DEM误差越来越大且越来越高估地表高程。

图5

图5   ASTER GDEM平均误差及平均绝对误差随4种影响因素的变化

Fig. 5   Variation of ASTER GDEM mean error and mean absolute error with four influencing factors


根据VCF分带的DEM平均误差及平均绝对误差的变化情况可看出,MAE随着VCF的增加而增大,ME随着VCF的增加先增大后减小再增大。ME从VCF 0~10%至10%~20%迅速增大,之后随着VCF的增加缓慢减小,但当VCF大于60%~70%后又开始增大。

根据高程分带的DEM平均误差及平均绝对误差的变化情况可以看出,MAE从高程200~300 m至300~400 m迅速增大,从高程300~400 至600~700 m缓慢增大,从高程600~700 m至800~900 m基本不变,但从高程大于800~900 m后又开始增大。ME随着高程的增加先减小后增大,增大的临界值在高程700~800 m之间,这是由于随着高程的增加地表地形地貌及植被覆盖复杂度增加导致DEM越来越高估地表高程,但当高程达到一个阈值之后,温度气压的降低导致地表植被覆盖率的下降,这使得植被对DEM高估地表高程的影响降低。

4.2 ASTER GDEM地形修正结果

利用XGBoost模型回归预测得到的DEM绝对误差曲面在空间分布上有明显的条带性(图6)。通过对检验数据集高程点提取得到的DEM绝对误差曲面值与实际DEM绝对误差的差值进行统计分析,评价XGBoost对绝对误差的回归预测精度(表3)。

图6

图6   XGBoost反演得到的研究区DEM绝对误差曲面

Fig. 6   Absolute error surface of DEM in the study area obtained by XGBoost inversion


表3   DEM绝对误差曲面精度评价

Tab. 3  Accuracy evaluation of DEM absolute error surface

ME/mMAE/mRMSE/m
DEM绝对误差曲面0.0947.4289.649

新窗口打开| 下载CSV


利用多元非线性回归的方式建立本文3.2节提出的方法插值得到的DEM误差正负权重及DEM绝对误差与DEM实际误差之间的方程:

σz=-0.167x+49.656y+0.231xy-0.903

式中:x为每个对应位置处的DEM绝对误差曲面值;y为每个对应位置处的DEM误差正负权重曲面值;σz为每个对应位置处最终回归得到的DEM修正值。

利用上述方程得到DEM误差曲面,通过叠加DEM误差曲面与原始ASTER GDEM得到修正后的DEM。为了更直观地展示修正前后的DEM 变化,本文对修正前后的DEM进行了剖面分析 (图7)。图7是ICESat-2经过研究区的一条轨迹的剖面,叠加了修正前后的ASTER GDEM。其中不同颜色的点表示不同分类标签的ICESat-2光子点(地面(棕色)、冠层(绿色)和噪声(灰色),紫色和红色数据分别为ASTER GDEM未修正高程和修正高程),可以看出修正后的ASTER GDEM更加贴近真实地表,对地表高程的低估和高估都得到一定修正。在图7所示样带轨迹中,原始ASTER GDEM经过修正后的平均误差由-1.152 m降低到了-0.047 m,平均绝对误差由8.707 m降低到了3.994 m,均方差由10.769 m降低到了5.383 m。

图7

图7   研究区ICESat-2样带轨迹剖面图

Fig. 7   Cross-section of some ICESat-2 data strips over the study area


图8(a)为ASTER GDEM在修正前后的整体误差分布情况。修正前,ASTER GDEM的平均误差为-3.463 m,说明ASTER GEDM在研究区有较大的负偏差且普遍高估地表高程。修正后,ASTER GDEM的平均误差降低到-0.233 m,负偏差显著降低,平均绝对误差和均方差分别由12.930 m和16.695 m降低到了9.564 m和12.762 m,数据精度得到了有效改善。此外,修正后DEM误差更加集中地分布在0 m附近,说明地表覆盖物对DEM的影响得到降低。图8(b)和图8(c)为ASTER GDEM在修正前后的精度验证散点图,R2由0.995提高到了0.999。

图8

图8   ASTER GDEM修正前后误差分布直方图和散点图

Fig. 8   Histogram and scatter plot of error distribution before and after ASTER GDEM correction


修正前后不同土地覆盖类型下的ASTER GDEM精度变化情况如表4所示。修正前,ASTER GDEM的平均误差在林地最大(-4.491 m),在人 造地表最小(0.522 m)。经过修正后,耕地、林地、 草地、湿地、水域及人造地表的平均误差都得到 显著降低,分别由-0.435、-4.344、-2.464、-4.232、 -3.560、0.738 m降低到了-0.333、-0.349、0.956、 -1.147、-0.223及-0.124 m。修正前,林地ASTER GDEM的平均绝对误差和均方差最大,分别为14.077 m和17.866 m,湿地ASTER GDEM的平均绝对误差和均方差最小,分别为6.275 m和7.728 m。经过修正后,不同土地覆盖类型下的ASTER GDEM平均绝对误差及均方差都得到一定改善,耕地、林地、草地、湿地、水域及人造地表的平均绝对误差分别降低了29.96%、24.73%、20.79%、58.02%、62.41%、31.47%,均方差分别降低了27.30%、23.25%、17.69%、43.96%、53.02%、30.41%。消除地表覆盖物及地形地貌对DEM的影响是DEM修正的本质,因此耕地、林地、草地、人造地表这种地表覆盖物复杂且地形地貌变化大的地方修正效果较差,湿地和水域这种地表覆盖物简单且地形平坦的地方修正效果较好。

表4   不同土地覆盖类型下的DEM数据在修正前后的精度

Tab. 4  Accuracy of DEM data under different land cover types before and after correction

土地覆盖类型ME/mMAE/mRMSE/m
修正前修正后修正前修正后修正前修正后
耕地-0.435-0.3339.7486.82712.8209.320
林地-4.344-0.34914.07710.59717.86613.712
草地-2.4640.95612.83710.16716.51013.590
湿地-4.232-1.1476.2752.6347.7284.331
水域-3.560-0.2238.0953.04311.0235.179
人造地表0.738-0.1248.4455.77810.9737.636

新窗口打开| 下载CSV


5 讨论与结论

5.1 讨论

(1)已有的DEM修正方法多采用线性回归模型或空间插值并且多数研究仅考虑了植被高信号,没有将地形因子及土地覆盖类型综合考虑进去。本文提出的DEM修正方法不仅考虑了多种影响因素,并且结合了XGBoost和空间插值,能够更深入地挖掘DEM误差与多种影响因素的关系。此外,已有研究使用的数据多为单一类型的星载激光雷达且以ICESat为主,而本研究结合了2种不同类型的星载激光雷达数据,有效提高了地表高程参考点的空间覆盖范围和数量。

(2)本研究目前涉及的实验区域面积相对较小,地形地貌和植被覆盖特征样本数量可能存在不足,本文提出方法的普适性和可推广性尚不明确(如:修正方法能否直接应用或移植到其他类似的区域)。为此,后续我们将在范围更大的区域中开展研究,并利用实地采集的高精度地形数据(如:通过地面和无人机激光雷达获取的高密度点云)对修正方法的效果做进一步的验证分析。

(3)我国于2022年8月4日成功发射首颗陆地生态系统碳监测卫星“句芒号”,搭载包括了星载激光雷达在内的多种遥感传感器,本文提出的DEM精度评价及修正方法,将来也可以应用在国产星载激光雷达生产的数据产品上。

5.2 结论

本研究基于ICESat-2及GEDI评估了ASTER GDEM v3的高程精度并分析了其精度与土地覆盖类型、高程、坡度、起伏度及植被覆盖度VCF之间的关系。在此基础上提出一种结合XGBoost和空间插值的ASTER GDEM修正方法。结果分析表明:

(1)本文提出的DEM精度评价及修正方法使用了新型星载激光雷达ICESat-2及GEDI数据,对地形误差与多种影响因素之间的非线性关系进行拟合、建模,得到了较为精准的修正结果。

(2)研究区原始ASTER GDEM高程误差整体呈正态分布,平均误差为-3.463 m,平均绝对误 差和均方差分别为12.930 m和16.695 m。原始 ASTER GDEM高程精度随着高程、坡度、起伏度及VCF的增大呈现下降趋势,且不同土地覆盖类型下的高程精度存在显著差异。

(3)本文提出的DEM修正方法实现了对ASTER GDEM精度的有效改善。修正后,ASTER GDEM的平均误差由-3.463m降低到了-0.233 m。DEM的整体平均绝对误差降低到了9.564 m,修正了26.04%,整体均方差降低到了12.762 m,修正了23.56%。耕地、林地、草地、湿地、水域及人造地表的DEM平均绝对误差分别降低了29.96%、24.73%、20.79%、58.02%、62.41%、31.47%,DEM均方差分别降低了27.30%、23.25%、17.69%、43.96%、53.02%、30.41%。

参考文献

汤国安, 那嘉明, 程维明.

我国区域地貌数字地形分析研究进展

[J]. 测绘学报, 2017, 46(10):1570-1591.

[本文引用: 1]

[ Tang G A, Na J M, Cheng W M.

Progress of digital terrain analysis on regional geomorphology in China

[J]. Acta Geodaetica et Cartographica Sinica, 2017, 46(10):1570-1591. ] DOI:10.11947/j.AGCS.2017.20170388

[本文引用: 1]

Laurence H, Peter U, Luntadila P, et al.

A 30 m global map of elevation with forests and buildings removed

[J]. Environmental Research Letters, 2022, 17(2):024016. DOI:10.1088/1748-9326/ac4d4f

[本文引用: 1]

张海平, 汤国安, 熊礼阳, .

面向地貌学本源的DEM增值理论框架与构建方法

[J]. 地理学报, 2022, 77(3):518-533.

DOI:10.11821/dlxb202203002      [本文引用: 1]

数字高程模型(DEM)在表达地貌形态、认知地表过程、揭示地学机理等研究中发挥着基础性的作用,是重要的地理空间数据模型,广泛地应用于地学分析与建模中。但是,传统DEM具有属性单一的天然缺陷,难以支撑面向地学过程与机理挖掘的地球系统科学研究。亟待在传统DEM的基础上实现其数据模型的增值,服务于新地貌学研究范式和新对地观测技术背景下的数字地形建模与分析。立足于以上问题,本文构建了DEM增值的理论框架,主要包括DEM增值的概念、内涵、内容、类别、不同增值类别之间的相互关系,以及此理论框架的研究意义和应用范畴。提出了DEM增值的构建方法,包含:① 强调地上地下一体化、时间空间相耦合的DEM空间维度和时间维度增值方法;② 重视地下、地表和地上物质构成,形态属性耦合的物质属性和形态属性增值方法;③ 顾及自然过程、人工作用的地物对象、地貌形态的地物要素和形体要素增值方法。最后,分别以数字阶地模型、数字坡地模型和数字流域模型为例,阐释DEM在面向地貌学本源问题时的不同增值方法及应用场景。期望通过对DEM进行维度、属性和要素3个层面的增值,实现现代对地观测技术背景下数字高程模型表达方法的突破,并支撑知识驱动的数字地貌问题分析。

[ Zhang H P, Tang G A, Xiong L Y, et al.

Geomorphology-oriented theoretical framework and construction method for value-added DEM

[J]. Acta Geographica Sinica, 2022, 77(3):518-533. ] DOI:10.11821/dlxb202203002

[本文引用: 1]

Digital elevation model (DEM) plays a fundamental role in the research of the earth system by expressing surface shape, understanding surface process, and revealing surface mechanism. DEM is widely used in geography and even in geological modeling and analysis. However, the existing DEM has its limitations in supporting the earth system research focused on geographical process and mechanism mining due to single attribute of the traditional DEM data model. Hence, establishing the value-added data model on the basis of traditional DEM is urgently necessary to serve digital elevation modeling and terrain analysis under the background of a new geomorphology research paradigm and earth observation technology. We construct a theoretical framework for value-added DEM that mainly includes concept, connotation, content and categories. The relationship between different types of value-added DEMs as well as the research significance and application category of this theoretical framework are also proposed. Different methods of value-added DEMs are listed below: (1) value-added methods of DEM space and time dimension that emphasize the integration of the ground and underground as well as coupling of time and space; (2) attribute-based value-added methods composed of materials (including underground, surface, and overground materials) and morphological properties; and (3) value-added methods of features and physical elements that consider geographical objects and landform features formed by natural processes and artificial effects. The digital terrace, slope, and watershed models are used as examples to illustrate application scenarios of the three value-added methods. This study aims to improve expression methods of DEM under the background of new surveying and mapping technologies by adding value to the DEM at three levels of dimensions, attributes, and elements, and support knowledge-driven digital geomorphological analysis in the era of big data.

Neumann T A, Martino A J, Markus T, et al. The Ice, Cloud, and

Land Elevation Satellite - 2 mission: A global geolocated photon product derived from the Advanced Topographic Laser Altimeter System

[J]. Remote Sensing of Environment, 2019, 233:111325. DOI:10.1016/j.rse.2019.111325

URL     [本文引用: 2]

Quirós E, Polo M E, Fragoso-Campón L.

GEDI elevation accuracy assessment: A case study of southwest Spain

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 14:5285-5299. DOI:10.1109/JSTARS.2021.3080711

URL     [本文引用: 1]

Liu X Q, Su Y J, Hu T Y, et al.

Neural network guided interpolation for mapping canopy height of China's forests by integrating GEDI and ICESat-2 data

[J]. Remote Sensing of Environment, 2022, 269:112844. DOI:10.1016/j.rse.2021.112844

URL     [本文引用: 2]

Neuenschwander A, Guenther E, White J C, et al.

Validation of ICESat-2 terrain and canopy heights in boreal forests

[J]. Remote Sensing of Environment, 2020, 251:112110. DOI:10.1016/j.rse.2020.112110

URL     [本文引用: 1]

郑迎辉, 张艳, 王涛, .

基于ICESat-2数据的高程控制点提取和精度验证

[J]. 地球信息科学学报, 2022, 24(7):1234-1244.

DOI:10.12082/dqxxkx.2022.210667      [本文引用: 1]

ICESat-2(Ice, Cloud and land Elevation Satellite-2)数据的平面定位精度达到米级,高程定位精度达到亚米级,但受各种外界因素的影响,部分激光足印点的高程精度较差,不能用作高程控制点。针对上述问题,本文提出一种适用于ICESat-2数据的多参数联合的高程控制点提取方法。该方法首先利用内置参数辅助检查激光足印点数据质量,滤除异常激光足印点,然后参考内置DEM(Digital Elevation Model)数据进行高程粗差剔除,最后结合云量标记、坡度参数以及时间标记属性参数设置阈值精细筛选,保留满足质量检查、坡度小、云量少的激光足印点作为最终高程控制点,并利用高精度参考高程数据进行精度验证。为验证本文方法的有效性,选取郑州西部、北科达他州西南部、印第安纳州北部地区的ICESat-2激光数据(高程平均绝对误差分别为3.711、0.582、0.333 m)进行高程控制点提取实验,实验结果表明,筛选后的激光足印点平均绝对误差分别达到0.827、0.393、0.131 m,该提取方法在多种地形场景下均能够提取出一定数量且精度较高的高程控制点,不仅能为1:50 000以及1:10 000立体测图提供数据支撑,还能为全国甚至是全球高程控制点提取和高程控制点库建设提供参考。

[ Zheng Y H, Zhang Y, Wang T, et al.

Elevation control points extraction and accuracy validation based on ICESat-2 data

[J]. Journal of Geo-information Science, 2022, 24(7):1234-1244. ] DOI:10.12082/dqxxkx.2022.210667

[本文引用: 1]

Tian X X, Shan J.

Comprehensive evaluation of the ICESat-2 ATL08 terrain product

[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 59(10):8195-8209. DOI:10.1109/TGRS.2021.3051086

URL     [本文引用: 1]

Liu A B, Cheng X, Chen Z Q.

Performance evaluation of GEDI and ICESat-2 laser altimeter data for terrain and canopy height retrievals

[J]. Remote Sensing of Environment, 2021, 264:112571. DOI:10.1016/j.rse.2021.112571

URL     [本文引用: 2]

Adam M, Urbazaev M, Dubois C, et al.

Accuracy assessment of GEDI terrain elevation and canopy height estimates in European temperate forests: Influence of environmental and acquisition parameters

[J]. Remote Sensing, 2020, 12(23):3948. DOI:10.3390/rs12233948

URL     [本文引用: 1]

Gallant J C, Read A M, Dowling T I.

Removal of tree offsets from srtm and other digital surface models

[J]. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2012, XXXIX-B4:275-280. DOI:10.5194/isprsarchives-xxxix-b4-275-2012

URL     [本文引用: 1]

Baugh C A, Bates P D, Schumann G, et al.

SRTM vegetation removal and hydrodynamic modeling accuracy

[J]. Water Resources Research, 2013, 49(9):5276-5289. DOI:10.1002/wrcr.20412

URL     [本文引用: 1]

Tan P Y, Zhu J J, Fu H Q, et al.

Sub-canopy topography estimation from TanDEM-X DEM by fusing ALOS-2 PARSAR-2 InSAR coherence and GEDI data

[J]. Sensors (Basel, Switzerland), 2020, 20(24): 7304. DOI:10.3390/s20247304

[本文引用: 1]

张晨, 朱建军, 付海强.

基于ICESat-2数据及TanDEM-X DEM的林下地形反演

[J]. 测绘工程, 2021, 30(1):60-65.

[本文引用: 1]

[ Zhang C, Zhu J J, Fu H Q.

Sub-canopy topography inversion based on ICESat-2 and TanDEM-X DEM

[J]. Engineering of Surveying and Mapping, 2021, 30(1):60-65. ] DOI:10.19349/j.cnki.issn1006-7949.2021.01.010

[本文引用: 1]

杜小平, 郭华东, 范湘涛, .

基于ICESat/GLAS数据的中国典型区域SRTM与ASTER GDEM高程精度评价

[J]. 地球科学, 2013, 38(4):887-897.

[本文引用: 1]

[ Du X P, Guo H D, Fan X T, et al.

Vertical accuracy assessment of SRTM and ASTER GDEM over typical regions of China using ICESat/GLAS

[J]. Earth Science, 2013, 38(4):887-897. ] DOI:10.3799/dqkx.2013.087

[本文引用: 1]

Su Y J, Guo Q H, Ma Q, et al.

SRTM DEM correction in vegetated mountain areas through the integration of spaceborne LiDAR, airborne LiDAR, and optical imagery

[J]. Remote Sensing, 2015, 7(9):11202-11225. DOI:10.3390/rs70911202

URL     [本文引用: 1]

秦臣臣, 陈传法, 杨娜, .

基于ICESat/GLAS的山东省SRTM与ASTER GDEM高程精度评价与修正

[J]. 地球信息科学学报, 2020, 22(3):351-360.

DOI:10.12082/dqxxkx.2020.190411      [本文引用: 1]

SRTM3和ASTER GDEM V2数据具有较高的空间分辨率和广泛的覆盖范围,对于地学研究具有重要意义;但在不同地形复杂度和地面覆盖物区域,两类数据的误差分布并不均匀。SRTM3和ASTER GDEM V2 数据自公布以来,其精度修正一直是研究热点。然而大范围区域精度验证缺乏有效手段,传统方法可靠性差且数据获取成本较高。自ICESat-1数据公开以来,它们已成为SRTM3和ASTER GDEM V2精度评定的主要检核点。为此,本文以山东省为研究区域,借助ICESat-1评估了SRTM3和ASTER GDEM V2的高程精度,并根据插值误差曲面对两种DEM进行了修正。分析表明,原始SRTM和ASTER高程中误差分别为5.57 m和7.20 m,均高于标称精度;随着坡度的增大,高程精度呈降低的趋势。通过分析土地覆盖类型与误差分布关系表明:农田、灌丛土地类型精度较高;森林、湿地精度较低。分别采用反距离加权、普通克里金、地形转栅格和自然邻域插值方法构建误差曲面。结果表明:不同的插值方法构建的误差曲面的特征和精度也不同。其中,反距离加权修正的效果最佳,其次是地形转栅格和自然邻域,而普通克里金修正的效果最差。

[ Qin C C, Chen C F, Yang N, et al.

Elevation accuracy evaluation and correction of SRTM and ASTER GDEM in Shandong Province based on ICESat/GLAS

[J]. Journal of Geo-Information Science, 2020, 22(3):351-360. ] DOI:10.12082/dqxxkx.2020.190411

[本文引用: 1]

Chen T Q, Guestrin C.

XGBoost: A scalable tree boosting system

[C]// Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA. New York: ACM, 2016:785-794. DOI:10.1145/2939672.2939785

[本文引用: 1]

唐新明, 李世金, 李涛, .

全球数字高程产品概述

[J]. 遥感学报, 2021, 25(1):167-181.

[本文引用: 1]

[ Tang X M, Li S J, Li T, et al.

Review on global digital elevation products

[J]. National Remote Sensing Bulletin, 2021, 25(1):167-181. ] DOI:10.11834/jrs.20210210

[本文引用: 1]

NASA/METI/AIST/Japan Spacesystems and U.S./Japan ASTER science team.

ASTER global digital elevation model v003

[DB/OL]. https://lpdaac.usgs.gov/products/ast gtmv003,2019.

URL     [本文引用: 1]

朱笑笑, 王成, 习晓环, .

ICESat-2星载光子计数激光雷达数据处理与应用研究进展

[J]. 红外与激光工程, 2020, 49(11):76-85.

[本文引用: 1]

Wang C, Xi X H, et al.

Research progress of ICESat-2/ATLAS data processing and applications

[J]. Infrared and Laser Engineering, 2020, 49(11):76-85. ] DOI:10.3788/IRLA20200259

[本文引用: 1]

Neuenschwander A L, Pitts K L, Jelley B P, et al.

ATLAS/ICESat-2 L3A land and vegetation height, version 4

[DB/OL]. https://nsidc.org/data/atl08/versions/4, 2021.

URL     [本文引用: 1]

Neumann T A, Brenner A, Hancock D, Robbins J, et al.

ATLAS/ICESat-2 L2A global geolocated photon data, version 4

[DB/OL]. https://nsidc.org/data/atl03/versions/4, 2021.

URL     [本文引用: 1]

Dubayah R, Hofton M, Blair J, Armston J, et al.

GEDI L2A elevation and height metrics data global footprint Level v001

[DB/OL]. https://lpdaac.usgs.gov/products/gedi02_av001, 2020.

URL     [本文引用: 1]

林晓娟. 基于ICESat-2和GEDI森林冠层高度和森林地上生物量遥感诊断[D]. 北京: 中国科学院大学(中国科学院空天信息创新研究院), 2021.

[本文引用: 1]

[ Lin X J, Remote sensing diagnosis of forest canopy height and forest aboveground biomass based on ICESat-2 and GEDI[D]. Beijing: Aerospace Information Research Institute, Chinese Academy of Sciences, 2021. ]

[本文引用: 1]

Chen J, Ban Y F, Li S N.

China: Open access to earth land-cover map

[J]. Nature, 2014, 514(7523):434-434. DOI:10.1038/514434c

[本文引用: 1]

Townshend J.

Global Forest Cover Change (GFCC) tree cover multi-year global 30 m v003

[DB/OL]. https://lpdaac.usgs.gov/products/gfcc30tcv003, 2016.

URL     [本文引用: 1]

Sexton J O, Song X P, Feng M, et al.

Global, 30-m resolution continuous fields of tree cover: Landsat-based rescaling of MODIS vegetation continuous fields with lidar-based estimates of error

[J]. International Journal of Digital Earth, 2013, 6(5):427-448. DOI:10.1080/17538947.2013.786146

URL     [本文引用: 1]

Magruder L, Neuenschwander A, Klotz B.

Digital terrain model elevation corrections using space-based imagery and ICESat-2 laser altimetry

[J]. Remote Sensing of Environment, 2021, 264:112621. DOI:10.1016/j.rse.2021.112621

URL     [本文引用: 1]

Huang X D, Xie H J, Liang T G, et al.

Estimating vertical error of SRTM and map-based DEMs using ICESat altimetry data in the eastern Tibetan Plateau

[J]. International Journal of Remote Sensing, 2011, 32(18):5177-5196. DOI:10.1080/01431161.2010.495092

URL     [本文引用: 1]

Zhang H, Bauters M, Boeckx P, et al.

Mapping canopy heights in dense tropical forests using low-cost UAV-derived photogrammetric point clouds and machine learning approaches

[J]. Remote Sensing, 2021, 13(18):3777. DOI:10.3390/rs13183777

URL     [本文引用: 1]

/