基于信息损失量的坡度精度分析

  • 陈楠 , *
展开
  • 福州大学福建省空间信息工程研究中心,福州大学空间数据挖掘与信息共享教育部重点实验室,福州 350002

作者简介:陈楠(1975-),男,博士,副研究员,主要从事数字地形分析方面研究。E-mail:

收稿日期: 2014-02-10

  要求修回日期: 2014-04-02

  网络出版日期: 2014-11-01

基金资助

国家自然科学基金重点项目“基于DEM的黄土高原地貌形态空间格局研究”(40930531)

国家自然科学基金项目“基于信息论的地形因子精度研究”(41001254)

国家支撑计划子课题“南方红壤水土保持评估与决策”(2013BAC08B02)

福建省自然科学基金项目“信号处理理论在地形因子精度研究中的应用”(2014J01155)

Study on Slope Accuracy Based on Information Loss

  • CHEN Nan , *
Expand
  • Spatial Information Research Center, Fuzhou University, Key Lab for Spatial Data Mining and Information Sharing of Education Ministry, Fuzhou University, Fuzhou 350002, China.

*The author: CHEN Nan, E-mail:

Received date: 2014-02-10

  Request revised date: 2014-04-02

  Online published: 2014-11-01

Copyright

《地球信息科学学报》编辑部 所有

摘要

从DEM中可获取众多地形因子。其中,坡度作为基本的地形因子,其精度对于退耕还林、水土流失评估等研究具有重要影响。但是,由于DEM只能是真实地表形态的近似表达。如何模拟坡度误差的规律成为研究的热点。本文在黄土高原地区选取代表不同地貌类型的神木、绥德、延川、富县和宜君5个研究样区,以1:1万地形图为基本数据源,建立不同分辨率的DEM,用以分析坡度信息损失量随DEM分辨率变化的规律。故此,提出了基于单个栅格方式的坡度信息量损失指标,并在每一样区随机选取的20个子实验样区得到了其与DEM分辨率的函数关系,以及相关的经验公式,据此求得所需的最适宜DEM分辨率,并在每一样区随机地选取16个子样区进行了检验。

本文引用格式

陈楠 . 基于信息损失量的坡度精度分析[J]. 地球信息科学学报, 2014 , 16(6) : 852 -858 . DOI: 10.3724/SP.J.1047.2014.00852

Abstract

As a fundamental form of spatial data, Digital Elevation Model (DEM) plays a considerable role in many fields, such as surveying and mapping, territorial planning, and national defense. DEM is usually discrete in data structure and is an approximation of the real terrain. Though the technology of obtaining the elevations of sampling points has been improved, the real surface can only be represented by discrete grids. This means that the slope can only be computed by using the elevations of discrete grids. Therefore, the derived slope will have an unavoidable error. However, it is the slope that determines the transfer of matters and energy on the terrain surface and its accuracy exerts a great influence on the related researches and applications. 5 areas of Shenmu, Suide, Yanchuan, Fuxian and Yijun in Loess Plateau that represent the typical geomorphology are chosen as the sample areas, in which the DEMs with resolutions of 5 m, 15 m, 25 m, 35 m, 45 m, 55 m, 65 m and 75m are established according to the topographic map scaled at 1:10000. The slope is derived by using the algorithm of the third-order finite difference weighted by the reciprocal of squared distance. The slope derived from DEM with a resolution of 5 m is assumed to be the true value, and the slopes derived from other DEMs are taken as the investigated subjects. Each area is divided into 36 subareas. The relationship between the index and the resolutions of DEMs is investigated in 20 subareas selected randomly from the 36 subareas. We proposed an index for the slope information loss based on the single grid, and obtained empirical equations to describe the relationship between the resolutions of DEM and the values of the index. The equations are tested in the other16 subareas and proved to be effective. Using the equations, we can get the most suitable resolution for DEM when the index is known. The users, who want to select proper resolutions for DEM to minimize the amount of data and reduce the cost while ensuring the accuracy of the slope information of DEM, will benefit from the empirical equations.

Key words: DEM; slope; entropy; resolution

1 引言

地面坡度及坡度的精度对退耕还林、水土流失评估、滑坡预测等相关的研究和应用具有重要意义。目前,坡度一般从数字高程模型(Digital Elevation Model,DEM)中提取,而DEM精度通常从插值方法和插值模型截断误差[1-3]的角度开展研究。研究发现,DEM栅格大小和自身精度对地形分析结果存在影响[4-9],并提出了地形描述误差的指标[10-12]。同时,一些学者开始关注从DEM中获得地形因子的精度问题[13-18]。实验表明,DEM的插值算法[19-20],坡度的计算算法[21],DEM的水平分辨率(以下简称为分辨率)会对坡度的精度产生不同的影响[22-23]。一般认为,随着分辨率粗略化,DEM对地形的描述趋于简化,地形信息损失增加,平均坡度降低。但目前对于坡度信息损失与分辨率的量化模拟还很少[23-25]。本文选取黄土高原为研究样区,通过定量分析方法,找到了坡度信息的变化规律。并以熵的概念为基础,提出不同分辨率DEM提取的坡度之间信息损失量的计算方法,分析了该信息损失量与DEM分辨率之间的定量关系。

2 研究区的地理背景与基本数据分析

黄土高原区的地貌类型具有典型性和多样性。因此,在该区域选取5个样区,每个样区面积约为100 km2,其基本情况见表1,样区的空间分布情况见图1(图1中编号与表1对应)。
Tab. 1 The basic information of the sample testing areas

表1 实验样区基本情况表

样区编号 样区所在县名称 地貌类型区 平均高度(m) 平均坡度(°)
1 神木县 长城沿线风沙-黄土过渡区 1198 9
2 绥德县 黄土丘陵沟壑区 995 29
3 延川县 黄土梁峁状丘陵沟壑区 1089 31
4 富县 黄土高原沟壑区和丘陵沟壑区交错过渡地带 1299 27
5 宜君县 黄土长梁残塬沟壑区 986 19
Fig. 1 The sketch map of the sample areas

图1 研究样区示意图

在每个样区,以国家测绘部门提供的1:1万地形图为基础,依照国家标准制作分辨率为5 m的DEM。随后使用重采样方法,得到了分辨率依次为15、25、35、…,75 m的DEM。研究采用文献[26]所推荐的三阶反距离平方权差分算法提取坡度,并将所提取的坡度分级。坡度的分级是以临界坡度分级标准(被水土保持部门广泛使用)为基础,并依据研究特点进行分级延伸得到的,共有9个级别,其坡度分级别的阈值依次为:0、3、5、8、15、25、35、45,60和90°。
DEM分辨率与所提取坡度的不确定性关系,如图2所示。假设图2(a)表示3行3列的分辨率均为5 m的一组栅格,而图2(b)表示1个分辨率为15 m的栅格,若2幅图都对应同一地面区域(纵横均为15 m)。则使用常用的离散坡度计算算法,图2(b)对应的坡度为一个确定的数值,此时坡度的信息不确定性程度为0 bit,即信息量为0 bit。而图2(a)有9个栅格,此时坡度的不确定性程度取决于这9个栅格的坡度数值情况。如果定义图2(b)与图2(a)对应的坡度的信息量之差为坡度信息损失量。根据信息论[27],该差值应该小于或等于0。且由常理推知,该差值的绝对值越大,粗略栅格的坡度信息损失越大,此时坡度精度越低。
Fig. 2 The grids of DEMs with different resolutions

图2 不同分辨率的DEM对应的栅格图

3 基于信息损失量的坡度精度分析

3.1 坡度信息损失量

3.1.1 坡度信息损失量指标q
文中,设r表示DEM分辨率,单位为m(r=5,15,…,75 m),分辨率为r的DEM所得到的坡度矩阵为Mr。定义将Mr中的坡度数值分级后得到的矩阵为Cr,则Cr矩阵每个元素(栅格,下文中两词同义)均表示对应位置的坡度分级编号。那么,C15每个元素对应9个C5的元素。而此时C15坡度的信息量为0 bit,C5的坡度信息量为 - k = 1 9 P k lo g 2 P k bit,k(k=1,2,…9)为坡度分级编号;PkC5中坡度为第k级别栅格个数与栅格总个数9的比值,由此C15的1个栅格损失的坡度信息信息量为: 0 - - k = 1 9 P k lo g 2 P k = k = 1 9 P k lo g 2 P k 。对C15中全部栅格的坡度信息损失量取平均值,记为指标q。类似地,可以得到对于其余分辨率DEM的指标q的定义。
3.1.2 指标q的理论极值分析
随机变量等概率分布时,其系统的信息量(熵)达到最大[27]。所以,对于图2(a)中的9个栅格,若每个栅格各自具不同的坡度分级编号,坡度信息量最大,为 - k = 1 9 1 9 lo g 2 1 9 = 3.1699 bit 。此时指标q为0-3.1699=-0.31699 bit,达到其极值。同理计算出当r依次为25、35、45、…,75时,指标q的极值分别为:-3.1525、-3.1639、-3.1699、-3.1689,-3.1696 和-3.1699 bit。值得注意的是,在某些分辨率条件下(如25 m),由于一个粗略栅格所对应的精细栅格的数量(此时为25个)不是坡度分级数9的整数倍,只能尽可能使得坡度分布接近等概率分布,以计算坡度信息量的极值。
文献[24]使用互信息概念提出了指标m衡量坡度的精度,但是,指标m存在一些不足:(1)互信息没有方向性,即随机变量A和B之间的互信息 I ( A ; B ) = I ( B ; A ) ,不能完全反映分辨率粗略化过程中坡度信息的损失;(2)指标m计算时,需要将粗略的栅格剖分,剖分后的分辨率为5 m才可计算指标m。这种剖分的地学意义需要进一步加强。而本文提出的指标q在以上2方面更具有优势。另外,坡向信息损失量[25]是否能适用于坡度,其地学意义何在,目前还没有进一步的探讨。同时针对坡向的评价指标,在评价时除平坦区域,其余坡向聚合为8个,其聚合的阈值是均匀分布的,而本文对于坡度进行聚合时,聚合的阈值是根据水土保持行业标准进行,其分布并不均匀。

3.2 指标q的变化规律

为了得到足够的样本,研究中各个样区都等分成36个子样区,且每一子样区有足够的面积以代表相应的地形特征。通过随机选择将子样区分成2类:实验样区(20个),检验样区(16个)。子实验区和检验样区的选取是随机的,以保证实验结果的代表性。图2中,若定义用图2(b)坡度数值减去图2(a)中某一个栅格的坡度数值为该栅格的坡度误差,则可根据中误差的定义计算出坡度的中误差。在各样区的子样区中计算坡度的中误差和指标q的相关系数,其统计结果如表2所示。可见,指标q和中误差相关性明显,这表明指标q用于表示坡度的精度是可靠的。同时,相关系数均为负,表明坡度精度的高低与指标q的绝对值反向相关。
Tab. 2 Statistical parameters of coefficients between the index q and RMSE

表2 指标q与中误差相关系数统计表

样区名称 相关系数最小值 相关系数最大值
富县 -0.99970 -0.99213
神木 -0.99985 -0.98091
绥德 -0.99902 -0.99218
延川 -0.99830 -0.98826
宜君 -0.99990 -0.99578
3.2.1 5样区中实验样区坡度信息指标q变化规律
图3、4分别为神木和富县样区的20个实验子样区指标q计算结果图,限于篇幅略去其余样区的曲线图。由图3、4可知,指标q都为负数,分布于区间(-2,0)中,其数值均随分辨率粗略化而减小,且减小的“速率”在降低。说明DEM分辨率精细时,指标q更为敏感,对于坡度信息量变化表示更为明显。其他样区实验子样区的q具有相同规律,因在黄土高原在某种程度上,地形地貌特征具有相似性,当对局部栅格的坡度信息量取平均值时,这种相似性就会被揭示出来。所不同的是相对于神木样区,富县样区各子样区的q数值更为接近和集中。在每个样区中20个实验样区的q(指标q的数值,下同)都可以写成 q = sln ( r ) + k 的形式。其中,sk为方程的参数,其取值范围见表3,表中sig.f为F检验统计值(以下同)。
Fig. 3 The relation of the index q and the resolutions in 20 experimental sample subareas of the Shenmu sample area

图3 神木样区中20个实验样区分辨率与指标q关系图

Fig. 4 The relation of the index q and the resolutions in 20 experimental sample subareas of the Fuxian sample area

图4 富县样区中20个实验样区分辨率与指标q关系图

Tab. 3 The parameters of the regression equations between q and r in experimental sample subareas of the five sample areas

表3 5个样区实验子区q关于r回归方程的参数表

样区名称 s值范围 k值范围 相关系数范围 sig.f范围
神木 -1.714-0.762 -1.683-0.686 0.995-1.000 0.000-0.001
绥德 -2.040-0.896 -2.069-0.960 0.989-0.998 0.000-0.002
延川 -1.838-0.906 -1.874-0.897 0.989-0.995 0.001-0.002
富县 -1.654-0.667 -1.631-0.675 0.997-1.000 0.000-0.000
宜君 -1.786-0.809 -1.697-0.754 0.996-1.000 0.000-0.001
通过回归分析可获得据指标q数值计算对应分辨率方程,见表4表3、4中的公式均通过了F检验(显著性水平为0.05)。
Tab. 4 The calculation formulas of the resolution according to the q in experimental sample subareas of the five sample areas

表4 5个样区实验子区中根据q计算分辨率公式表

样区名称 分辨率的计算公式 相关系数 sig.f
神木 exp(-1.7048q+1.4643) 0.732 0.036
绥德 exp(-1.4635q+1.2608) 0.978 0.003
延川 exp(-1.6521q+1.1118) 0.980 0.002
富县 exp(-1.6694q+1.5935) 0.974 0.003
宜君 exp(-1.8079q+1.4786) 0.737 0.031

3.2.2 5个样区检验子区中指标q与分辨率关系

在5个样区中的16个检验子区,同理获得了依据q计算所需分辨率的方程(记作φ),φ都通过了F检验(显著性水平为0.05)。由于目前无法用φ直接对表4中公式进行检验,本研究需将q离散化,根据φ得到一系列的r数值(记作rr),随后将q代入表4中公式可得到一系列的r数值(记作rc)。若rrrc在统计学上没有显著区别,则认为表4中公式通过了验证。在每个样区,参照常用的十进制计数习惯,将检验样区的指标q所在的数值区间进行等分,得到10个q数值,这样做:(1)使得相邻q间距约为0.2bit,平均每个组距q值增加20%,确保系列q值互相的区分;(2)得到10组qr的数值,便于后继的q关于r的回归分析(若参与回归分析的数值对太少回归结果的可靠性会较低)。图5给出神木样区的计算结果(限于篇幅其余样区结果略去)。
Fig. 5 The resolutions computed by using q in the testing areas of the Shenmu sample area

图5 神木样区的检验样区中由q求分辨率的结果图

图5表明:当 q 相等时,rr均围绕rc分布;当q绝对值越小即坡度精度要求越高时,计算所得到的rr范围越窄,这是符合实际需要的。且在每个样区的16个检验样区,rcrr可以通过T检验(显著性水平为0.05)。这说明当指标q相同时rcrr的差别不明显,即在检验样区表4中的公式通过了统计检验,可使用。
3.2.3 分辨率计算公式的应用案例
选取的工作区域(面积约为19.45 km2)位于陕西省延安市。由于该区域距延川样区相对最近,并且两区都属于黄土梁峁状丘陵沟壑区,故采用表4中延川样区的计算公式。另外,根据实际工作可能,指标q依次取值为-2,-1.8,-1.6,…,-1 bit,则由表4公式计算出的分辨率依次为82.77、59.48、42.74、30.72,22.07和15.86 m。在该样区制作分辨率为80、55、40、30,20和15 m的DEM,计算出相应的指标q分别为:-1.80、-1.58、-1.40、-1.23,-0.99和 -0.83 bit。统计分析显示,设定的q与后者计算出的q通过了T检验(显著性水平为0.05),认为两者无明显差别,即由表4公式计算出的分辨率的DEM所对应的坡度的精度可得到保证。
研究中,制作样区DEM时,其分辨率的选择遵循以下原则(以对应分辨率(55 m)和推算出的分辨率(如59.48 m)为例进行说明):对应分辨率都小于推算出的分辨率,并是5 m的倍数(保证图1中的对应可以存在)。按照常理并结合q变化规律,如果55 mDEM与59.48 mDEM对应的q无明显差别,那么60 m DEM应该与59.48 m的q差别也不明显。因此在进行分辨率计算公式检验时,选用的DEM分辨率为55 m。

3.3 指标q的实验结果分析

在各样区,将全部子样区的指标q的平均值与对应的理论极值相比,得到图6。可见,随着分辨率粗略化,该比值均逐步增高,且发现可使用对数函数以较高的精度拟合以上曲线(回归方程的R2≥0.99)。这说明坡度信息损失量在逐步趋近其理论极值,在分辨率较精细时,该比值增加较快,此时分辨率粗略化对坡度信息损失量影响较明显,而分辨率较粗略时,情况相反。因此,在分辨率精细时,需更加关注坡度信息量的损失。另外,该比值均小于0.65,并顾及指标q的计算方法可以得到结论:虽然在我国黄土高原区域,地貌类型多样,地形变化复杂,但是坡度分布的不确定性程度(或熵值)均低于其理论熵值,并未进行等概率分布,坡度分布在某些级别上会表现出集中,坡度组合依然具有一定的规律,这正是本研究可以发现表4中公式的基础。
Fig. 6 The ratio of the average q and its theoretical extreme value in the five sample areas

图6 5样区中指标q平均值与理论极值的比值曲线图

图7给出了各个样区全部子样区的指标q的变异系数绝对值(取绝对值是为了便于分析总体趋势)的变化曲线。由图7可见,随分辨率粗略化,该绝对值逐步减小,说明相对于平均值,其系统熵值趋于集中,坡度分布组合的在一定程度上趋于稳定,表现出更大地表范围内的坡度分布,而小范围内的坡度组合的波动逐渐减少。
Fig. 7 The absolute values of variation coefficient in the five areas

图7 各样区指标q变异系数绝对值变化曲线图

从地学分析可知,指标q的变化规律揭示了随着分辨率粗略化,DEM对地形的概括和简化增强,从DEM中所提取的坡度也逐渐表现出更大范围的坡度分布和组合,同时坡度的信息量会逐渐损失。

4 结论

本文从信息传递的角度分析了不同分辨率DEM所提取的坡度信息的变化规律,提出了指标q来描述坡度信息损失量。指标q可用来衡量不同分辨率DEM所提取的坡度分布组合相对于假定真值的偏离程度,可以作为一种衡量坡度的精度指标,指标q随分辨率粗略化,其变化速率降低。
在黄土高原,存在由指标q数值计算DEM分辨率的通用公式。该公式可在坡度精度确定的条件下,计算DEM的适宜分辨率。
在黄土高原,坡度分布的不确定性程度(或熵值)均低于其理论熵值,两者比值小于0.65。坡度组合的分布具有一定的规律,这是前述通用公式存在的基础。随着DEM分辨率粗略化,坡度分布组合在一定程度上趋于稳定。

The authors have declared that no competing interests exist.

[1]
汤国安,刘学军,闾国年.数字高程模型及地学分析的原理与方法[M].北京:科学出版社,2005:182-206.

[2]
Shi W, Yue T.A hybrid interpolation method for the refinement of a regular grid digital elevation model[J]. International Journal of Geographical Information Science, 2006,20(1):53-67.

[3]
胡鹏. 新数字高程模型:理论、方法、标准和应用[M].北京:测绘出版社,2007:46-64.

[4]
李志林,朱庆.数字高程模型[M].武汉:武汉测绘科技大学出版社,2000:60-72.

[5]
周启明,刘学军.数字地形分析[M].北京:科学出版社,2006:270-272.

[6]
Fei LF, He J.A three-dimensional Douglas-Peucker algorithm and its application to automated generalization of DEMs[J].International Journal of Geographical Information Science, 2009,23(6):703-718.

[7]
Zhou Q, Chen Y.Generalization of DEM for terrain analysis using a compound method[J]. Journal of Photogrammetry and Remote Sensing, 2011,66(1):38-45.

[8]
Livne E, Svoray T.Components of uncertainty in primary production model: The study of DEM, classification and location error[J]. International Journal of Geographical Information Science,2011,25(3):473-488.

[9]
Erskine P H, Green T R, Ramirez J A, et al.Digital elevation accuracy and grid cell size: Effects on estimated terrain attributes[J]. Soil & Water Management & Conservation, 2007,71(4):1371-1380.

[10]
Jai V, Jin T, Georgina S.Impact of DEM accuracy and resolution on topographic indices[J]. Environmental Modeling & Software, 2010,25(10):1086-1098.

[11]
王光霞,朱长青,史文中,等.数字高程模型地形描述精度的研究[J].测绘学报,2004,33(2):168-173.

[12]
邓仕虎,杨勤科.DEM采样间隔对地形描述精度的影响研究[J].地理与地理信息科学,2010,26(2):23-26.

[13]
Zhang J X, Chang K T, Wu J Q.Effects of DEM resolution and source on soil erosion modeling: Acase study using the WEPP model[J]. International Journal of Geographical Information Science, 2008,22(8):925-942.

[14]
Livnea E,Svoraya T.Components of uncertainty in primary production model: The study of DEM, classification and location error[J]. International Journal of Geographical Information Science, 2011,25(3):473-488.

[15]
汤国安,赵牡丹,李天文,等.DEM提取黄土高原地面坡度的不确定性[J].地理学报,2003,58(6):824-830.

[16]
Tang G A, Li F Y, Liu X J, et al.Research on the slope spectrum of the Loess Plateau[J]. Science in China(E),2008,51(1):175-185.

[17]
刘学军,张平.DEM坡度、坡向的有效尺度范围[J].武汉大学学报(信息科学版),2008,33(12):1254-1258.

[18]
汤国安,刘学军,房亮,等.DEM及数字地形分析中尺度问题研究综述[J].武汉大学学报(信息科学版),2006,31(12):1059-1066.

[19]
贾旖旎,汤国安,刘学军.高程内插方法对DEM所提取坡度、坡向精度的影响[J].地球信息科学学报, 2009,11(1):36-42.

[20]
卢华兴,刘学军,王永君,等.插值条件下格网DEM 坡度计算模型的噪声误差分析[J].测绘学报, 2012,41(6):926-932.

[21]
赵明伟,汤国安,张磊,等.基于DEM的5节点二阶差分坡度算法模型与实验分析[J].地球信息科学学报, 2012,14(3):286-291.

[22]
Gao J, James E, Zhu A X.Neighborhood size and spatial scale in raster-based slope calculations[J]. International Journal of Geographical Information Science, 2012,26(10):1959-1978.

[23]
陈楠,王钦敏,汤国安.基于单个栅格的DEM坡度与分辨率关系研究[J].中国矿业大学学报(自然科学版),2007,36(4):499-504.

[24]
陈楠,王钦敏.基于地形因子信息量的数字高程模型分辨率的选择[J].武汉大学学报(信息科学版),2009,34(6):692-695,705.

[25]
陈楠,王钦敏,汤国安.黄土高原坡向信息量变化与DEM分辨率关系[J].高技术通讯,2008,18(5):525-530.

[26]
陈楠,王钦敏,汤国安.黄土高原丘坡信息DEM 提取算法的应用[J].地球信息科学,2006,8(3):69-75.

[27]
朱雪龙. 应用信息论基础[M].北京:清华大学出版社,2001:22-23.

文章导航

/