遥感科学与应用技术

基于空间抽样的区域地表覆盖遥感制图产品精度评估——以中国陕西省为例

  • 孟雯 1 ,
  • 童小华 , 1, * ,
  • 谢欢 1 ,
  • 王振华 2
展开
  • 1. 同济大学测绘与地理信息学院,上海 200092
  • 2. 上海海洋大学信息学院,上海 201306
*通讯作者:童小华(1971-),男,江西人,博士,教授,博士生导师,研究方向为空间数据处理与质量控制、遥感与地理信息系统集成的理论方法与研究。E-mail:

作者简介:孟 雯(1989-),女,上海人,硕士生,研究方向为空间数据质量控制与抽样检验研究。E-mail:

收稿日期: 2015-01-04

  要求修回日期: 2015-03-11

  网络出版日期: 2015-06-10

基金资助

国家自然科学基金项目(41171352)

Accuracy Assessment for Regional Land Cover Remote Sensing Mapping Product Based on Spatial Sampling: A Case Study of Shaanxi Province, China

  • MENG Wen 1 ,
  • TONG Xiaohua , 1, * ,
  • XIE Huan 1 ,
  • WANG Zhenhua 2
Expand
  • 1. College of Surveying and Geo-Informatics, Tongji University, Shanghai 200092, China
  • 2. College of Information and Technology, Shanghai Ocean University, Shanghai 201306, China
*Corresponding author: TONG Xiaohua, E-mail:

Received date: 2015-01-04

  Request revised date: 2015-03-11

  Online published: 2015-06-10

Copyright

《地球信息科学学报》编辑部 所有

摘要

地表覆盖数据是研究气候变化、生态环境、地理国情和人文经济等方面不可或缺的基础信息,因此其质量的优劣将直接影响相关决策的可靠性。本文针对我国研制的首套30 m分辨率全球地表覆盖数据产品,通过分析其海量、多维、非均质等空间特点,对传统的制图产品精度评估方法提出了改进:以地表类型进行分层抽样,样本量的计算采用优化模型并以地类所占面积比为权重逐层分配,样本的布设则考虑层内对象之间的空间相关性,在地表数据自然分布的基础上,通过分析空间相关性指数来提高样本的代表性和精度评估结果的可靠性。因此,本文提出针对区域地表覆盖遥感制图产品的空间分层抽样方法,其将精度评估分成抽样方案(样本的定量估计)和布设方案(样本的空间布设)2个部分,并以中国陕西省地表覆盖产品为例进行区域精度评估实验分析,从全区7大类地表类型数据中抽取1467个样本,经过样本检验与精度计算,该区域产品的总体精度为79.96%,Kappa系数为0.74。实验结果表明,本文提出的基于空间抽样的精度评估方法可行可靠,实验区域产品质量较好,并为后续针对全球范围的地表覆盖产品精度评估方法提供了参考。

本文引用格式

孟雯 , 童小华 , 谢欢 , 王振华 . 基于空间抽样的区域地表覆盖遥感制图产品精度评估——以中国陕西省为例[J]. 地球信息科学学报, 2015 , 17(6) : 742 -749 . DOI: 10.3724/SP.J.1047.2015.00742

Abstract

Land cover refers to the complex of various materials of the earth's surface and its natural attributes and characteristics. Land cover data at global scale is fundamental and indispensable for global change studies, and its data quality has been the focus of a variety of international communities. In 2010, China launched the project of 30 m Global Land Cover remotely sensed products with 10 classifications for the base years of 2000 and 2010, which takes a four year period to complete, and the data quality issue will affect its subsequent applications. This paper mainly studies the accuracy assessment method for regional land cover data, as a preliminary of global validation. First, the spatial characteristics of land cover data are discussed, such as being massive, multi-dimensional, and heterogeneous. Then, a general approach based on spatial stratified sampling method for the accuracy assessment of regional land cover product is proposed to improve the traditional sampling method. Considering the spatial characteristics, this article presents the method of spatial stratified sampling: stratified sampling is conducted according to land cover type, the total sample size is calculated using probability and statistics optimal model, and the sample size of each layer is allocated according to the area ratio; while in the sample spatial allocation process, the representative of sample, which implies that the spatial correlation between samples should be low, needed to be considered. In each layer, each sample's spatial correlation is calculated by Moran's I index, and by setting a threshold value, the representative samples are chosen. The final sample set of each layer is randomly selected based on spatial analysis. The spatial sampling scheme is divided into three parts: sampling method, determination of sample size and the sample allocation. We have made an improvement in this paper, by designing a two-step scheme, which are quantitative estimation of sample size and spatial allocation. A case study of Shaanxi Province of China shows the method and process of accuracy assessment for regional land cover product. 1467 samples are selected by spatial stratified sampling in 7 strata. According to the confusion matrix, the overall accuracy is 79.96% and kappa index is 0.74. User's accuracies of all land cover types are more than 75%, while producer's accuracies fluctuate due to the low sample size caused by the low area ratio, which have little impact on the overall accuracy. Experimental results show that the proposed method is applicable to accuracy assessment of regional land cover product. Study on global land cover product will be performed as a main research direction in future.

1 引言

地表覆盖(Land Cover)是地球表面各种物质类型及其自然属性与特征的综合体。地表覆盖的空间分布反映着人类社会经济活动过程,地表的水热和物质平衡,生物地球化学循环和气候变化[1]。地表覆盖数据是气候变化研究、生态评估、地理国情监测、宏观调控等方面不可或缺的重要基础信息[2]。近年来,全球极端天气和各类灾害频繁出现,对世界各国带来了巨大的危害。因此,准确可信的地表覆盖数据质量,对充分发挥其作用,提高相关决策的科学性,推动地球空间信息应用有重要的意义[3]
国际上现有5套全球地表覆盖数据产品,其空间分辨率分别为1 km或300 m,均采用2010年前遥感数据作为数据源,分类系统各不相同,缺乏数据兼容性与现势性[2]。为满足全球变化研究与地球模式模拟的需求,我国研制了2000年和2010年2个基准年的全球30 m地表覆盖数据产品,具有较高时空分辨率,更符合全球变化需要[4-5]
然而,在地表覆盖遥感制图整个过程中,面临着数据质量问题,如卫星影像的质量不确定性(大气和辐射校正、空间和光谱分辨率、光谱范围、地理精度等)[6]、分类方法的不确定性、制图技术的不确定性等[7],这些不确定性都会导致地表覆盖遥感制图产品的质量问题,在相关应用中造成严重的损失。因此,制定合理的精度评估方法进行数据的质量控制,是保证地表覆盖遥感制图精度的关键。
抽样检验可对产品的质量管理提供可靠的信息,是质量控制的基本手段[8]。传统的抽样方法有简单随机抽样、分层抽样、系统抽样和集群抽样[9]。现有的全球地表覆盖产品或区域产品,主要以简单随机或分层的传统抽样方法,如美国地质调查局(USGS)研制的DISCover产品、马里兰大学研制的UMd产品、欧空局研制的Globcover 2005等[10-11]。对于地表覆盖数据,其具有海量、多维、非均质的空间数据特点,不同地表类型有不同的自然分布,相同的地类之间又存在自相关。因此,传统的抽样方法已无法描述样本的空间信息,需采用针对空间数据的抽样方法(即考虑对象的空间相关性和异质性[12])来更合理地确定样本的空间位置;在样本量方面,已有产品主要以专家经验或者固定值来确定样本量,缺乏合理有效的估计模型,使样本量普遍偏低,如DISCover全球样本量为379个。
本文针对地表覆盖遥感制图产品数据的特点,以及已有区域地表覆盖产品中抽样方法的缺陷,在类型分层抽样的基础上,考虑对象的空间相关性来布设样本,提出了空间分层抽样方法;同时,采用混淆矩阵的方法来计算总体精度和kappa系数作为精度评价指标,以我国2010年全球30 m地表覆盖产品的陕西省为例进行区域产品精度评估分析,并探讨针对全球范围的地表覆盖产品的精度评估方法。

2 基于空间抽样的精度评估方法

2.1 抽样原则

地表覆盖遥感制图是通过定义分类系统和不同的分类方法将地球表面各种物质类型进行归类制图。其特点比较明显,即多样的地表类型、每个地类在空间上有其自身的分布模式、同一个地类的数据之间存在相关性。因此,对地表覆盖遥感制图产品的精度评估,需考虑到以下几点原则:
(1)类型代表性:对于地表覆盖数据的精度评估,每个类型都应该被抽到并且参与到最终的精度评估中。综合所有类型样本的精度结果才能体现总体精度的无偏。
(2)样本代表性:根据地理学第一定律[13]可知空间上的每个物体是存在空间相关性。样本的空间分布应该尽量避免聚集分布,聚集样本的空间相关性较强,会造成最终精度的高估或低估。
(3)样本量合理:样本量的计算需要有科学的依据,需考虑每个类型总量之间的关系。若出现总量大、样本量小或相反情况都是不合理的,会造成结果的偏差。
根据上述的3个原则,空间抽样需要从3个方面考虑:抽样方法、样本量确定和布样方法。

2.2 抽样方法

地表覆盖数据具有空间属性和自然属性,可采用按空间地理区域分层抽样和按类型分层抽样方法。然而,作为区域地表覆盖产品,进行区域的细分会面临2个问题:(1)无法明确区域细分的尺度;(2)区域划分也会涉及类型自然属性,如生态区域等。因此,按地理区域分层抽样的方法比较困难。相比而言,按地表类型分层抽样可明确层的定义,并且避免层间的混淆,层内差异小,层间差异大,达到分层的效果;同时,还可避免因简单随机抽样而使某些稀有地类无法被抽到的情况,符合类型代表性原则。

2.3 样本量确定

在精度评估中,以往对样本量的确定主要依据经验值或固定值,缺乏合理的样本量估计模型。根据传统的概率统计理论,通过控制抽样误差,给定允许的最大误差,推导出一套严密的样本量计算公式如式(1)所示[9,14]
n = μ 1 - α / 2 2 ( 1 - p ) r 2 p 1 + 1 N μ 1 - α / 2 2 ( 1 - p ) r 2 p - 1 (1)
式中,n表示所要计算的样本量;μ1-α/2表示置信度取 1 - α / 2 时的标准正态分布临界值;α取5%;p表示预估错误精度;r为抽样误差;N为样本总量。在计算样本量时,只需给定抽样误差和预估误差精度即可。

2.4 布样方法

空间抽样的空间性质主要体现在布样方法中。遵循样本代表性原则,将总体按类型分层抽样的基础上,分析每个层内的空间相关性,通过局部Moran's I指数计算每一个空间单元与邻近单元就某一属性的相关程度[15]来进行样本布设,通过设定阈值进行筛选,尽量降低样本之间的空间相关性,避免空间对象的聚集分布。

3 区域地表覆盖遥感制图产品精度 评估实验分析

精度评估方法主要是通过样本的分类结果和真实结果的交叉制表,即混淆矩阵,来获取其精度信息。通过混淆矩阵,可计算用户精度(错分率)、制图精度(漏分率)、总体精度和Kappa系数等精度指标。Kappa系数将运用在区域地表覆盖数据的精度评估中,从另一个角度来描述数据的质量情况。
Kappa系数属于比较特殊的精度评价指标,用来表示2个地图之间的一致程度。Kappa系数的公式如式(2)所示[16]
k = p o - p c 1 - p c (2)
式中,po为观测数据的一致率;pc为期望一致率;Kappa取值范围为[-1,1],越接近1说明一致性较好。

3.1 精度评价实验数据

实验数据采用2010年全球30 m地表覆盖遥感制图产品的中国陕西省区域(图1)。陕西省含有7个一级类:耕地、森林、草地、水体、人造覆盖、裸地和灌木。分辨率为30 m每个类型的名称和分类系统(表1)源自全球地表覆盖数据产品手册,表1中的预计分类精度是结合前期实验和专家经验获得的参考值,用于计算样本量。
Fig. 1 Geographical location and content of experimental data

图1 实验数据的地理位置和数据内容

Tab. 1 Classification system of Shaanxi Province's data and the corresponding expected classification accuracy

表1 中国陕西省地表类型分类系统及对应的预计分类精度表

序号 一级类名称 内容 预计分类精度(%)
1 耕地 (雨养旱地、灌溉间作)、稻田、温室菜地、土地、人工牧草地、农田、种植经济作物或灌木草本作物的耕地、土地复垦废弃 80
2 森林 落叶阔叶林、常绿阔叶林、落叶针叶林、针叶林、针阔混交林 85
3 草地 典型草原、草甸草原、高寒草原、荒漠草原、草 70
4 水体 湖泊、水库、鱼塘、河流 85
5 人造覆盖 居民地、工业用地或矿区、交通设施 80
6 裸地 盐碱地、沙、砾石、岩石、生物土壤结皮 85
7 灌木 沙漠灌丛、高山灌丛、落叶和常绿灌木 70

3.2 精度评估实验流程

实验目的是对中国陕西省2010年7类地表覆盖数据,采用本文提出的方法进行精度评估,包含抽样方法、样本量确定和布样方法的具体实施过程(图2)。
Fig. 2 The flow chart of accuracy assessment on theland-cover data of Shaanxi Province

图2 中国陕西省地表数据精度评估流程图

具体实验步骤如下:
(1)确定区域总体样本量
以陕西省作为整体,通过式(3)计算7个地表类型的综合预计错误率p,再将其代入式(1)计算陕西省实验区总体样本量。
p = i = 1 m p i × w i (3)
式中,i表示第i个类型;m表示类型总数; p i 表示第i个类型的预计错误率; w i 表示第i个类型的面积权重。
将计算得到的p值(p=20.75%)代入式(1),式中N取陕西省像元总数;抽样误差取0.1,计算得到陕西省总体样本量为1467个,样本尺寸为单个像元(表2)。
Tab. 2 Calculation of sample size of Shaanxi Province

表2 陕西省样本总量计算过程

序号 类型 像元数(个) 预计分类精度(%) 面积比(%) p值(%) 样本总量
1 耕地 60 126 746 80 26
2 森林 91 027 419 85 39
3 草地 38 528 577 70 16
4 水体 1 124 905 85 2
5 人造覆盖 3 494 298 80 2
6 裸地 3 964 620 85 2
7 灌木 30 053 218 70 13
计算结果 20.75 1467

注:面积比是类型像元数与像元总量的比值

(2)分层抽样
抽样方法根据上述讨论结果为按类型分层抽样,陕西省包含7类地表覆盖,每个类型为1层,共分7层。陕西省总的样本量为1467个,通过每个类型面积权重将样本分配到每层:
通过样本量优化模型计算公式和按面积比权重的分配方式,解决了样本量的定量问题,避免了随意定值出现的抽样强度的不同问题,并且保证每个类型都有样本,使精度评价结果更加科学合理。
(3)空间相关性分析
样本的相似性与样本的代表性成反比,相似性较高的样本会降低样本的代表性和抽样效率,并且造成精度评估结果有偏。因此,逐层进行空间相关性分析,即对每层数据计算Local Moran's I指数,该指数可定量表示相同类型在空间上的相似程度,并且通过设置合理的阈值筛选样本。
以陕西省人造覆盖类型数据为例,空间相关性计算采用ArcGIS软件空间分析模块进行计算。图3(a)表示经过空间分析后的人造覆盖样本,其中红色的图斑表示空间相关性低的样本,黑色表示空间相关性高的样本。人造覆盖类型主要由人类生产生活形成的,其本身也存在较明显的自然分布。图3(b)表示呈现离散的人造覆盖空间相关性分布局部放大图,其相关性也呈现相同的离散性;图3(c)表示呈现聚集的人造覆盖空间相关性分布局部放大图,符合要求的低空间相关性样本并没有聚集分布,满足样本布设原则。
Fig. 3 Spatial correlation analysis of artificial surface layer

图3 人造覆盖分层的样本空间相关性分析

空间分析后根据空间Moran's I指数筛选空间相关性低的样本,并在此基础上按照第(2)步中计算得到的人造覆盖样本量,随机抽取30个样本,布样结果如图4所示。逐层进行空间分析后布设样本,其余6个分层的样本布设结果如图5所示。
Fig. 4 The allocation of artificial surface samples

图4 人造覆盖层样本布设结果

Fig. 5 The sample allocationfor each layer

图5 各分层的样本布设

(4)样本检验
样本尺寸为像元大小,即30 m×30 m,参考数据采用Google Earth的相同时期的高分影像。由于参考数据的分辨率高于产品数据,因此会存在单个像元样本区域内(即900 m2范围内),高分影像包含多个地表类型。因此,采用多数判断原则来判断每个样本:即每个样本由3个专家独立判断给出结果,2个或以上的结果认为该样本分类结果与高分影像的真实类型一致则判断为正确,否则为错误。其中,错误样本的真实类型采用面积占优原则确定,即样本像元范围内对应的高分影像中面积占比最大的地表类型就是该像元的真实类型。
(5)精度评估
根据样本检验的结果建立混淆矩阵,通过计算一系列精度指标来进行精度评估。
Tab. 3 The distribution of sample size in each layer

表3 分层抽样样本量分配

类型 面积比(%) 每层样本量
1 耕地 26 381
2 森林 39 572
3 草地 16 234
4 水体 2 30
5 人造覆盖 2 30
6 裸地 2 30
7 灌木 13 190

3.3 实验结果分析

通过整个抽样、布样、检验过程,建立样本的混
淆矩阵,如表4所示。在混淆矩阵的基础上计算每个地类的制图精度和用户精度,如表5所示。
Tab. 4 Confusion matrix of all samples in Shaanxi Province

表4 陕西省所有类型样本的混淆矩阵




分类类型
类型 耕地 森林 草地 水体 人造覆盖 裸地 灌木 真实总量
耕地 304 31 26 2 5 1 16 385
森林 14 468 0 0 0 0 4 486
草地 27 18 176 0 1 3 13 238
水体 7 10 3 25 1 0 0 46
人造覆盖 8 10 5 3 23 0 0 49
裸地 14 10 18 0 0 26 6 74
灌木 7 25 6 0 0 0 151 189
分类总量 381 572 234 30 30 30 190 1467
Tab. 5 Producer's accuracy and user's accuracy for each layer

表5 各地表类型的制图精度和用户精度

类型 制图精度(%) 用户精度(%)
耕地 78.96 79.79
森林 96.30 81.82
草地 73.95 75.21
水体 54.35 83.33
人造覆盖 46.94 76.67
裸地 35.14 86.67
灌木 79.89 79.47
Fig. 6 Producer's and user's accuracy for each layer

图6 陕西省区域地表覆盖遥感制图精度和用户精度图

从制图精度来看,森林、灌木、耕地和草地精度较高,均高于70%,而水体、人造覆盖、裸地则相对较差。原因在于水体、人造和裸地其相对的类型面积较小,所以分配的样本量相对较小,对精度的影响相对样本量大的类型会被放大,但不影响总体精度;用户精度普遍都高于75%,说明样本的正确率较高。最后,计算总体精度为79.96%,Kappa系数为0.74。
在每层样本分配时考虑了每个类型的面积占比,因此,得到的总体精度不仅仅是有限样本的总体精度,而是通过面积权重反映到了整个抽样区域,从总体精度数值上可得到印证:陕西省的耕地、森林和灌木的面积占比达到了78%,而这3类型的正确率在79%~81%之间,而总体精度正好落入该区间中。Kappa系数为0.74,接近1,说明陕西省地表覆盖数据和真实数据之间的一致性较好。

4 结语

(1)本文针对我国首套30 m全球地表覆盖数据,通过分析地表覆盖数据特点,以中国陕西省为例,考虑了空间数据特征和科学的概率统计方法,对抽样方法、布样方法和样本量确定进行了改进,提出了基于空间抽样的区域地表覆盖数据精度评估方法。
(2)中国陕西省地表覆盖数据实验结果为:从2010年中国陕西省7类数据中抽取1467个样本,总体精度为79.96%,Kappa系数为0.74,所有类型的用户精度都超过75%。结果表明,本文提出的方法适用于区域或小范围地表覆盖数据的精度评估,同时反映我国30 m地表覆盖产品的区域数据质量情况较好。
(3)进一步拓展到全球范围的地表覆盖产品,需考虑精度评估对象与尺度比例之间的关系、不同尺度下计算空间关系的方法等问题,本文提出的方法可以提供参考。结合空间抽样的方法对全球地表覆盖数据,进行精度评估是今后研究的主要方向。

The authors have declared that no competing interests exist.

[1]
廖平安,陈利军,陈军,等.全球陆表水体高分辨率遥感制图[J].中国科学:地球科学,2014,44(8):1634-1645.

[2]
陈军,陈晋,宫鹏,等.全球地表覆盖高分辨率遥感制图[J].地理信息世界,2011,2(2):12-14.

[3]
李军,姜作勤,童小华.地质数据的抽样检查方法研究[J].地理信息世界,2006,4(2):8-16.

[4]
陈军,陈晋,廖平安,等.全球30米地表覆盖遥感制图的总体技术[J].测绘学报,2014,43(6):551-557.

[5]
Chen J, Chen J, Liao A P, et al.Global land cover mapping at 30 m resolution: A POK-based operational approach[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015,103:7-27.

[6]
李晓兵,陈云浩,喻锋.基于遥感数据的全球及区域土地覆盖制图——现状、战略和趋势[J].地球科学进展,2004,19(1):71-80.

[7]
吴文斌,杨鹏,张莉,等.四类全球土地覆盖数据在中国区域的精度评价[J].农业工程学报,2009,25(12):167-173.

[8]
刘大杰,史文中,童小华,等.GIS空间数据的精度分析与质量控制[M].上海:上海科学技术文献出版社,1999:1-224.

[9]
Tong X H, Wang Z H, Xie H, et al.Designing a two-rank acceptance sampling plan for quality inspection of geospatial data products[J]. Computers and Geosciences, 2010, 37(10):1570-1583.

[10]
曹明,张友静,郑淑倩,等.MODIS土地覆盖数据产品精度分析——以黄河源区为例[J].遥感信息,2012,27(4):22-27.

[11]
Hansen M C, Reed B.A comparison of the IGBP DISCover and University of Maryland 1 km global land cover products[J]. International Journal of Remote Sensing, 2000,21(6-7):1365-1373.

[12]
王劲峰,姜成晟,李连发,等.空间抽样与统计推断[M].北京:科学出版社,2009:1-182.

[13]
Tobler W.A computer movie simulating urban growth in the detroit region[J].Economic Geographers, 1970,46(2):234-240.

[14]
王振华,童小华,梁丹,等.连续大批量空间数据质量抽样检验方法[J].同济大学学报(自然科学版), 2010,38(5):749-752.

[15]
张松林,张昆.局部空间自相关指标对比研究[J].统计研究,2007,24(7):65-67.

[16]
Cohen J.A coefficient of agreement for nominal scales[J].Educational and Psychological Measurement, 1960,20(1):37-46.

文章导航

/