遥感科学与应用技术

基于伪纯像元的精度评价策略及其应用

  • 徐肖 , 1, 2 ,
  • 李娅婷 1, 2 ,
  • 樊辉 , 1, 2, *
展开
  • 1.云南大学国际河流与生态安全研究院,昆明 650091
  • 2.云南省国际河流与跨境生态安全重点实验室,昆明 650091
*樊 辉(1972— ),男,江西修水人,博士,研究员,主要从事地理大数据挖掘研究。E-mail:

徐 肖(1998— ),女,四川南充人,硕士生,主要从事地理大数据挖掘研究。E-mail:

收稿日期: 2022-01-25

  修回日期: 2022-02-22

  网络出版日期: 2022-10-25

基金资助

第二次青藏高原综合科学考察研究(2019QZKK0402)

国家自然科学基金项目(41971239)

国家自然科学基金项目(41461017)

云南省教育厅科学研究基金项目(2022Y061)

Accuracy Assessment Strategy based on Pseudo-pure Pixels and its Application

  • XU Xiao , 1, 2 ,
  • LI Yating 1, 2 ,
  • FAN Hui , 1, 2, *
Expand
  • 1. Institute of International Rivers and Eco-Security, Yunnan University, Kunming, 650091, China
  • 2. Yunnan Key Laboratory of International Rivers and Transboundary Eco-Security, Kunming 650091, China
*FAN Hui, E-mail:

Received date: 2022-01-25

  Revised date: 2022-02-22

  Online published: 2022-10-25

Supported by

The Second Tibetan Plateau Scientific Expedition and Research Program(2019QZKK0402)

National Natural Science Foundation of China(41971239)

National Natural Science Foundation of China(41461017)

Scientific Research Foundation of Yunnan Provincial Education Department(2022Y061)

摘要

土地覆被是地球科学研究中的重要参量,评价土地覆被数据的制图精度是保障数据合理使用的前提。本文提出了一种基于伪纯像元的精度评价策略(伪纯像元策略),即当低空间分辨率栅格窗口内对应的高空间分辨率数据中优势类别(面积最大的地类)的占比高于伪纯像元纯度阈值(代表像元纯度,取值范围:35%~100%,步长为5%)时,以此栅格窗口为基准生成土地覆被类型为优势类别的伪纯像元用于精度评价。以澜沧江-湄公河(澜湄)流域为试验区,选择GlobeLand30为参考数据,并基于混淆矩阵精度评价方法对比分析了伪纯像元策略与重采样法(最近邻法和众数法)在CCI-LC(300 m)和MCD12Q1(500 m) 2套全球土地覆被数据精度评价中的差异。结果表明:① 伪纯像元策略在35%~100%纯度阈值下对CCI-LC和MCD12Q1在澜湄流域评价的精度分别为72.76%~55.26%和71.44%~45.41%,比重采样法评价的单一精度(众数法:71.21%和70.54%、最近邻法:71.48和69.87%)能更好地反映像元纯度对土地覆被数据精度的影响;② CCI-LC的总体精度高于MCD12Q1,且2套数据的精度差随纯度阈值的增大而增加,CCI-LC和MCD12Q1在35%、100%纯度阈值下的精度差分别为1.32%和9.85%;③ 2套数据中耕地、有林地、草地和水体的分类精度均相对较高,而灌木林地(精度接近0)和裸地的分类精度均较低;④ 2套数据与GlobeLand30的空间不一致区域多出现在土地覆被类型高度异质化的混合像元区域,且随纯度阈值的增大,评价样本栅格更趋均质,混合像元对评价精度的影响也会递减。伪纯像元精度评价策略适用于跨空间分辨率土地覆被数据的精度对比,为评价全球土地覆被产品在区域尺度的适用性及适用范围提供了新的检验策略。

本文引用格式

徐肖 , 李娅婷 , 樊辉 . 基于伪纯像元的精度评价策略及其应用[J]. 地球信息科学学报, 2022 , 24(8) : 1617 -1630 . DOI: 10.12082/dqxxkx.2022.220048

Abstract

Land cover is an important parameter in geoscience research, and the accuracy assessment of land cover products is a prerequisite to ensure reasonable application of land cover products. In this study, an accuracy assessment strategy based on pseudo-pure pixels (i.e., pseudo-pure pixel strategy) is proposed. That is, calculating the area of land cover types of the high-resolution pixels within a pixel window of coarse spatial resolution data and defining the land cover type with the largest area as the advantage type, and then generating pseudo-pure pixels of advantage type based on the pixel window when the area proportion of the advantage type is higher than a pseudo-pure pixel purity threshold (ranging from 35% to 100%, with a step length of 5%). We take the Lancang-Mekong (Lanmei) basin as the study area and select the GlobeLand30 as the reference data. The confusion matrix accuracy assessment method was used to compare the difference in the accuracy of two sets of global land cover data, i.e., CCI-LC (300 m) and MCD12Q1 (500 m), using different assessment methods, i.e., the pseudo-pure pixel strategy and the resampling method (Nearest and Majority). Our results show that: (1) The accuracy using the pseudo-pure pixel strategy for CCI-LC and MCD12Q1 in the Lanmei Basin under the purity thresholds of 35%~100% are 72.76%~55.26% and 71.44%~45.41%, respectively, and it can better reflect the influence of pixel purity on the accuracy of land cover data than the single accuracy obtained by resampling method (Nearest: 71.21% and 70.54%; Majority: 71.48 and 69.87%); (2) The overall accuracy of CCI-LC is higher than that of MCD12Q1. The accuracy difference of the two datasets increases with the increase of purity threshold, and it is 1.32% and 9.85% respectively for purity threshold of 35% and 100%, respectively; (3) In both datasets, the classification accuracy of cropland, forest, grassland, and water is relatively high, and the classification accuracy of shrub land and bare land is relatively low; (4) The spatial inconsistency between the two datasets and the GlobeLand30 mainly occur in mixed pixel regions with highly heterogeneous land cover types. And the assessment sample grids are purer with the increase of pseudo-pure pixel threshold, which reduces the effects of mixed pixels on accuracy assessment. The pseudo-pure pixel strategy has the potential to compare the mapping accuracy of land cover data with different spatial resolutions, and provides a promising validation method for determining the applicability and application scope of global land cover products at regional scales.

1 引言

高精度土地覆被数据产品是研究区域及全球尺度陆地表层系统和生态系统变化的重要数据基础。目前,全球免费共享土地覆被数据集已达10余套[1],并广泛应用于全球气候变化监测、生物多样性研究等方面[2-3]。但因遥感平台、分类系统、分类方法以及空间分辨率等方面的不同,全球土地覆被产品在反映地表实际状况时存在着明显差异[4-5]。因此,具体应用时,针对特定研究区域开展全球土地覆被数据的精度评估尤显重要。
土地覆被数据的精度可通过参考数据和实地调查的样本进行评估[6-9]。就常用的实地调查样本点评估方法而言,高质量样本是数据精度评价的关键[10],但大范围区域内获取实地样本成本高昂,可用样本量受限,通常难以满足正常的精度评价需求。而相对评价法,即对比分析多种不同空间分辨率土地覆被数据一致性与差异性的方法则被广泛使用[11-12]。应用高空间分辨率和高分类精度的土地覆被数据作为参考数据评价低空间分辨率土地覆被数据的精度和空间一致性已逐渐成为跨空间尺度数据精度评价的替代选择[13]
采用相对评价法进行数据精度评价的前提是统一参考数据与待评数据的空间尺度。现有研究多集中于参考数据选择、样本数量确定以及精度评价方法选取等[14-16],而对如何统一不同空间分辨率数据的尺度缺乏量化研究。重采样法是最为常用的尺度统一方法[17-18],离散数据的重采样规则常分为最近邻法和众数法,但它们无法量化低空间分辨率数据像元纯度差异对精度评价的影响,且易引入不确定性[19]
为此,本文提出了一种不仅能利用中高分辨率土地覆被数据对低空间分辨率数据进行精度评价,还能反映混合像元对数据精度影响的伪纯像元精度评价策略。以纵跨6个国家,涵盖高原、山地、盆地、平原等多种地形的澜沧江-湄公河(澜湄)流域为例,选择中空间分辨率的GlobeLand30为参考数据,基于混淆矩阵精度评价方法评价了2套不同空间分辨率全球土地覆被数据(CCI-LC和MCD12Q1)的区域精度差异和空间不一致性,并与重采样法(最近邻法和众数法)精度评定结果进行对比分析,以检验伪纯像元精度评价策略的适用性,为认识CCI-LC和MCD12Q1在流域或区域尺度地表过程研究中的适用性及适用范围提供精度参考。

2 研究方法

2.1 参考数据升尺度

参考数据与待评数据尺度统一是相对精度评价的基本前提。一般参考数据的空间分辨率较高,需通过升尺度方法将其提升至与待评数据同一尺度水平。本文提出伪纯像元精度评价策略来实现这一转换过程,与常规升尺度法——重采样法中的最近邻法和众数法进行对比。

2.1.1 基于伪纯像元的升尺度策略

土地覆被数据中每个像元对应着一种土地覆被类型。对于低空间分辨率数据,每个像元内通常存在一种或多种覆被类型,因此将仅含一种覆被类型的像元称为纯像元,而包含多种覆被类型的像元则视为混合像元[20]。计算混合像元中涵盖的高空间分辨率土地覆被数据内各土地覆被类型面积占比,若优势(面积最大)地类的占比大于伪纯像元纯度阈值(阈值范围为35%~100%,步长为5%),则判定该混合像元是属性为优势地类的伪纯像元,以此实现低尺度(高空间分辨率)向高尺度(低空间分辨率)数据转换。如图1(a)所示,基于升尺度思想和像元内土地覆被类型面积占比 最大原则,分别计算了300 m和 500 m栅格窗口 内30 m空间分辨率的GlobeLand 30数据土地覆被类型像元占比,以伪纯像元纯度阈值50%为例,有林地的占比最高(84.00%),且大于50%,则判定该栅格窗口的属性为有林地;若其占比小于50%,则该栅格判定为无法归类的混合像元,即赋值为0,在计算数据精度时归为错分像元,纳入精度评价系统。
图1 3种升尺度法示意图

注:图1(a)中的百分比数值代表各土地覆被类型在栅格窗口中的占比,参考数据中的黑色像元代表未满足升尺度要求的像元,不被赋予任何一种土地覆被属性;图1(b)表示将输入栅格中距离投影点最近的像元中心(灰色点)属性赋予输出像元;图1(c)中右侧数字代表4×4窗口(红色四边形)内各属性的像元数,拥有最高像元数的黄色被赋予输出栅格像元。

Fig. 1 Sketch maps of three upscaling methods

2.1.2 基于栅格重采样的升尺度策略

栅格重采样可将不同分辨率的栅格数据统一为指定分辨率,实现不同空间尺度数据之间的转换。最近邻重采样法是以输出栅格像元中心点做垂直投影线,投影线与输入栅格的交点称为投影点,离投影点最近的输入栅格中心点所属土地覆被类型即为输出栅格对应像元的覆被类型(图1(b))。众数重采样法亦以输出栅格像元中心点做垂直投影线,以投影点为中心从输入栅格中选取一个4×4窗口,统计窗口中各土地覆被类型像元数量,数量最多的土地覆被类型即为输出栅格对应像元的土地覆被类型(图1(c))。

2.2 精度评价

精度评价的目的是提供一个有效的指标,以反映专题土地覆被数据中各土地覆被类型与现实覆被类型之间的匹配程度[15]。混淆矩阵是分类结果精度评价的常用方法,其主要指标包括:总体精度(Overall Accuracy,OA)、用户精度(User's Accuracy,UA)和制图精度(Producer's Accuracy,PA)[21]。各指标的具体公式如下:
O A = i = 1 m K i i Z
U A i = K i i K · i i [ 1 , m ]
P A i = K i i K i · i [ 1 , m ]
式中: O A代表总体精度; i代表土地覆被类型编号; m代表土地覆被类型数; K i i代表编号 i代表的土地覆被类型被正确分类的像元数; Z代表被正确分类的像元总数; K · i K i ·分别代表分类数据和参考数据中编号 i代表的土地覆被类型的像元数; U A i P A i分别代表编号 i代表的土地覆被类型的用户精度和制图精度。

2.3 空间不一致性分析

空间不一致性分析能更具体清晰地展示不同数据之间的空间差异。为准确显示两套数据的空间差异,本文采用逐像元对比叠加法来表征不同伪纯像元纯度阈值下土地覆被数据空间不一致。若CCI-LC和MCD12Q1数据中土地覆被类型与基于伪纯像元精度评价策略提取的参考数据中土地覆被类型不一致,则判定该像元为空间不一致像元,类型一致的则判定为空间一致像元。

3 试验区概况与数据预处理

3.1 试验区概况

澜湄流域是典型的南北向跨境流域(图2),流经中国、缅甸、老挝、泰国、柬埔寨以及越南6个国家[22]。流域总面积约为81×104 km2[23],地形复杂,流域内地貌差异较大,形成了高海拔积雪区、山地、盆地、平原等特殊地貌格局[24],孕育了类别多样的土地覆被类型,包括永久冰雪、草原、灌木林地、有林地、耕地和湿地等[25],涵盖了除沙漠和苔原以外的所有土地覆被类型,具有很强的代表性。
图2 澜沧江-湄公河流域区位及地形

注:水文流域边界来源于HydroSHEDS数据集,由FAO GeoNetwork(http://www.fao.org/geonetwork)提供;数字高程模型数据来源于SRTM 90 m数据库(http://srtm.csi.cgiar.org);本图基于自然资源部标准地图服务网站中审图号为GS(2021)5443号的标准地图绘制,底图无修改。

Fig. 2 Location and topography of the Lancang-Mekong River Basin

3.2 土地覆被数据

3.2.1 待评价数据

CCI-LC数据集(1992—2020年)基于300 m空间分辨率的ENVISAT MERIS卫星影像制作生成。该数据制作时,将全球划分为22个气候区,每个气候区均采用LCCS(Land Cover Classification System)分类系统,利用非监督分类方法对MERIS影像进行分类,其在全球范围的分类精度(总体精度)约为74.40%[26]。MCD12Q1数据集(2001—2015年)为500 m空间分辨率的MODIS土地覆被类型产品,基于IGBP(International Geosphere-Biosphere Programme)分类系统,采用监督分类方法,对每年预处理后的Terra MODIS传感器数据进行分类,其在全球范围的总体精度约为75.00%[27]表1)。
表1 3套全球土地覆被产品参数

Tab. 1 Product parameters of three global land cover datasets

数据集 GlobleLand30 CCI-LC MCD12Q1
传感器 Landsat TM5/ETM+、HJ-1 ENVISAT MERIS、SPOT Terra MODIS
分类方法 像元-对象-知识(POK方法) 非监督分类 监督分类/决策树/神经网络
分辨率/m 30 300 500
时相 2000年、2010年 1992—2020年 2001—2015年
分类体系 自分类体系 (10类) LCCS (22类) IGBP (17类)
总体精度/% 83.50 74.40 75.00
验证方法 交叉验证 样本验证 交叉验证

3.2.2 参考数据

GlobleLand30数据集(表1)是以Landsat TM和Landsat ETM+影像为主要数据源,辅以中国环境减灾卫星(HJ-1)影像数据,基于“像元—对象—知识”(Pixel-Object-Knowledge)分层分类方法(POK方法)制作的全球首套30 m空间分辨率土地覆被数据集。该数据包括耕地、有林地、草地等10种土地覆被类型,仅涉及2000年和2010年 2个基准年份,其总体精度为83.50%[28-29],适用于大区域低空间分辨率土地覆被数据的精度验证[30]
为确保数据的时间一致性,仅选取2010年GlobleLand30数据作为参考数据对2010年的CCI-LC和MCD12Q1数据进行精度评价。

3.3 数据预处理

由于待评价数据和参考数据的空间分辨率及其制作所采用的分类系统、分类方法等均有所差异,无法直接对比。因此,需对3套全球土地覆被数据进行预处理,包括投影坐标系转换以及分类体系调整等。为减少土地覆被类型细分所带来的不确定性[31],以GlobleLand30的分类系统和类别的定义为基准,根据澜湄流域不同数据间土地覆 被类型的对应关系(表2),将土地覆被类别归整 为耕地、有林地、草地、灌木林地、湿地、水体、建设用地、裸地和永久冰雪9类,无苔原土地覆被类型(图3),3套规整后的数据中各土地覆被类型面积占比如图4所示。
表2 不同土地覆被分类系统间的类别对应关系

Tab. 2 Corresponding relationship of land cover classes among the three global land cover datasets

编号 类别 GlobleLand30 CCI-LC MCD12Q1
1 耕地 10用于种植农作物的土地,包括水田、灌溉旱地、大棚用地,以及果园茶园等灌木类经济作物种植地 10/11/12农田旱地/草本覆被的耕地/树或灌丛覆被的耕地
20灌溉旱地或洪泛耕地
30耕地(>50%)与树、灌、草等自然植被(<50%)的混交地
12农用地
14农用地与自然植被混合:40%~60%为天然乔木、灌木林地或草本植被
2 有林地 20树冠覆被度>30%的土地,包括落叶阔叶林、常绿阔叶林、落叶针叶林、常绿针叶林、混交林,以及树冠覆被度为10%~30%的疏林地 50常绿阔叶林(>15%)
60/61/62落叶阔叶林(>15%)/(>40%)/(15%~40%)
70/71/72常绿针叶林(>15%)/(>40%)/(15%~40%)
80/81/82落叶针叶林(>15%)/(>40%)/(15%~40%)
90针阔混交林
100乔木和灌木林地(>50%)与草本植物(<50%)的混交地
1常绿针叶林:冠幅>4 m2,覆被度>60%
2常绿阔叶林:冠幅>4 m2,覆被度>60%
3落叶针叶林:冠幅>4 m2,覆被度>60%
4落叶阔叶林:冠幅>4 m2,覆被度>60%
5针阔混交林:落叶常绿为主,冠幅>4 m2,覆被度>60%
8木本稀树草原:冠幅>4 m2,覆被度30%~60%
3 草地 30天然草本覆被度>10%的土地,包括草原、草甸、稀疏草原、荒漠草原、人工草地 110草本植被(>50%)与树(<50%)的混交地
130草地
10草地:以年生草本植物为主,高度<2 m
4 灌木林地 40灌木覆被度>30%的土地,包括山地灌丛、落叶和常绿灌丛,以及荒漠地区覆被度>10%的荒漠灌丛 120/121/122灌木林地/常绿灌木林地/落叶灌木林地
40树、灌、草等自然植被(>50%)与耕地(<50%)的混交地
6稠密灌丛:以木本多年生植物为主,高度1~2 m,覆被度>60%
7稀疏灌丛:以木本多年生植物为主,高度1~2 m,覆被度10%~60%
9稀树草原:树木覆被度10-30%,冠幅>4 m2
5 湿地 50有浅层积水或土壤过湿的土地,包括内陆沼泽、湖泊沼泽、河流洪泛湿地、森林/灌木湿地、泥炭沼泽、盐沼等 160被水淹没的有林地(淡水或咸水)
170被水淹没的有林地(海水)
180被水淹没的灌木林地和草本植物(淡水、海水或咸水)
11永久湿地:永久淹水面积30%~60%,植被覆被度>10%的土地
6 水体 60 陆地范围液态水覆被的区域 210水体 17水体:至少60%的区域被永久水体覆被
7 建设用地 80由人工建造活动形成的地表 190城镇地区 13城市和建筑区:至少30%的不透水表面,包括建筑材料、沥青道路
8 裸地 90植被覆被度<10%的自然覆被土地,包括荒漠、沙地、砾石地、裸岩、盐碱地等 200/201/202裸地/坚固的裸地/松散的裸地
150/152/153树、灌、草等稀疏植被(<15%)
16裸地:至少60%的区域是没有植被覆被的裸露地区(沙、岩石、土壤),植被覆被<10%
9 永久冰雪 100由永久积雪、冰川和冰盖覆被的土地 220 永久冰雪 15雪和冰:全年至少有60%的地区被冰雪覆被10个月
图3 分类系统规整后的3套澜湄流域土地覆被图

Fig. 3 Maps of land covers in the Lancang-Mekong River basin extracted by the three global land cover datasets with a unified land cover classification system

图4 3套土地覆被图中各土地覆被类型面积占比统计

注:图中括号内数值代表各土地覆被类型占比。

Fig. 4 Statistics on the proportion of area of each land cover type in three sets of land cover maps

4 结果与分析

4.1 伪纯像元策略与重采样精度评价结果

图5(a)可知,随伪纯像元纯度阈值的增大,CCI-LC和MCD12Q1数据的总体精度均呈下降趋势,MCD12Q1下降趋势更显著;同一纯度阈值下,CCI-LC数据的总体精度相较于MCD12Q1数据更高;当阈值增至100%时,CCI-LC和MCD12Q1数据的总体精度分别下降至55.26%和45.41%。而重采样针对每套数据只能得到一个恒定的总体精度,且相较于最近邻重采样,众数重采样法所得总体精度更高;众数和最近邻重采样法所得评价精度分别与伪纯像元纯度阈值50%~55%和55%~60%时伪纯像元策略所得精度相近。
图5 数据总体精度与伪纯像元随纯度阈值的变化情况

注:300 m与500 m分别代表伪纯像元策略获取的300 m与500 m参考数据;图(a)中的数值代表总体精度。

Fig. 5 The variation of the OA of data and pseudo-pure pixels with different pseudo-pure pixel purity thresholds

图5(b)表明,伪纯像元数与伪纯像元纯度阈值呈负相关,且伪纯像元数的下降速率随阈值单调增加。尽管500 m参考数据的伪纯像元数低于300 m参考数据,但纯度阈值为35%~45%时,2套参考数据的伪纯像元面积接近;2套参考数据的伪纯像元面积均与纯度阈值呈负相关,且500 m参考数据的下降速率更快(图5(c))。

4.2 土地覆被类型精度评价结果

图6表明,不同伪纯像元纯度阈值下CCI-LC和MCD12Q1数据中各土地覆被类型的用户精度和制图精度变化趋势大致相同。2套数据中9种土地覆被类型的用户精度均随伪纯像元纯度阈值增大呈下降趋势,其中草地、裸地和湿地的用户精度下降较缓,灌木林地的用户精度接近0。2套数据中耕地、有林地、草地、水体以及建筑用地的制图精度均随伪纯像元纯度阈值增大呈单调上升趋势,CCI-LC中这5种地类的制图精度分别为:85.78%~89.95%、66.70%~75.84%、66.04%~83.20%、79.90%~89.69%、21.13%~41.13%,MCD12Q1中为:62.30%~71.80%、78.96%~89.05%、79.64%~96.01%、54.09%~85.49%、20.14%~54.29%;而裸地和永久冰雪的制图精度在2套数据中则较为平稳,在CCI-LC中的制图精度分别为:6.17%~7.81%、16.92%~17.61%,MCD12Q1中为21.95%~22.92%、6.44%~7.38%。2套数据间各土地覆被类型的用户精度和制图精度差异也较大。就用户精度而言,MCD12Q1数据中耕地、水体和永久冰雪的用户精度高于CCI-LC数据,而有林地、灌木林地、湿地、建设用地和裸地的用户精度却低于CCI-LC数据;就制图精度而言,CCI-LC数据中耕地和水体的制图精度高于MCD12Q1数据,而有林地、草地和建设用地的制图精度却低于MCD12Q1数据。
图6 CCI-LC和MCD12Q1中各土地覆被类型的用户精度(UA)和制图精度(PA)随伪纯像元纯度阈值变化趋势

Fig. 6 Variations of user's accuracy (UA) and producer's accuracy (PA) of different land cover classes in the CCI-LC and MCD12Q1 with different pseudo-pure pixel purity thresholds

总体上,CCI-LC和MCD12Q1数据中耕地、有林地、草地以及水体的用户精度和制图精度均相对较高,而灌木林地和裸地的精度均较低;永久冰雪的用户精度相对较高,但制图精度却较低;CCI-LC数据中的湿地精度远高于MCD12Q1数据,其他土地覆被类型在CCI-LC中的精度略高于MCD12Q1。
图7可知,3种升尺度法构建的混淆矩阵差异较小,MCD12Q1和CCI-LC数据错分类别有相似之处。CCI-LC数据中耕地、有林地、草地、湿地和水体的分类正确率较高,灌木林地、建设用地、裸地和永久冰雪的分类正确率较低;约56%的灌木林地像元和76%的建设用地像元分别被误分为有林地和耕地,77%的裸地和58%的永久冰雪像元被误分为草地。MCD12Q1数据中耕地、有林地、草地和水体的分类正确率相对较高,灌木林地、湿地、建设用地、裸地以及永久冰雪的分类正确率较低;约65%的灌木林地和44%的湿地像元被分为有林地,65%的建设用地像元被误分为耕地,69%的裸地和64%的永久冰雪像元被误分为草地。总体上,采用伪纯像元策略与重采样法得到的混淆矩阵在数值上差异细微,土地覆被类型的转换结果较为一致;MCD12Q1数据中湿地、水体以及永久冰雪的正确率低于CCI-LC数据,而裸地的分类正确率却更高;MCD12Q1和CCI-LC数据均多将其它土地覆被类型误分为耕地、有林地和草地。
图7 3种升尺度法获取的参考数据(横坐标)与2套待评数据(纵坐标)间的混淆矩阵结果

注:因图中数字保留2位小数,所以部分列之和不为1。

Fig. 7 Confusion matrices between the reference data (Abscissa) obtained by three upscaling methods and the two datasets to be evaluated (Ordinate)

4.3 土地覆被不一致性评价结果

CCI-LC和MCD12Q1数据中不一致区域分布存在明显差异,前者主要聚集在澜湄流域的中部地区,而后者则集中分布于澜湄流域中上部的狭长地区和东南部地区(图8);空间不一致像元多与非均质像元重叠,且重叠程度与伪纯像元纯度阈值区间呈正相关(图3图8)。
图8 不同伪纯像元纯度阈值区间下参考数据(基于伪纯像元策略升尺度GlobeLand30)与待评数据(CCI-LC和MCD12Q1)间空间不一致性区域分布

Fig. 8 Spatially inconsistent areas between land cover data(CCI-LC/MCD12Q1) and the reference data upscaled from GlobeLand30 with different purity threshold ranges of pseudo-pure pixels

2套数据中空间不一致的伪纯像元数量与伪纯像元纯度阈值同步增加,其趋势为:由单调递增至基本平稳,其后再快速增加(图9(a))。就空间不一致像元数而言,CCI-LC数据明显多于MCD12Q1数据,但其所占面积却更小(图9(b));空间不一致的像元数占比与纯度阈值呈负相关,且MCD12Q1数据的下降斜率更大(图9(c))。
图9 空间不一致像元数、像元面积以及像元数占比随伪纯像元纯度阈值的变化趋势

Fig. 9 The statistics of amount, areas and proportion of spatially inconsistent pixels under different purity threshold ranges of pseudo-pure pixels

5 讨论

5.1 伪纯像元策略的适用性

为解决高精度样本缺乏对精度评价造成的困难,本文提出了一种基于伪纯像元的精度评价策略,其实质是一种栅格数据升尺度方法,即通过设置不同伪纯像元纯度阈值,计算低空间分辨率窗口内高空间分辨率数据土地覆被类型面积占比,并聚合为低空间分辨率的参考数据。升尺度法常应用于地理、生态学以及遥感等学科领域[32-33],主要归为2大类:① 由高分辨率遥感信息转换为低空间分辨率遥感信息的“面-面升尺度转换”;② 由点尺度数据转换为卫星遥感尺度的“点-面升尺度转换”[34]。“点-面升尺度转换”的典型代表是将野外采样点数据转换为遥感栅格数据,但面对大型区域,野外数据缺失严重,难以支撑精度评定[35]。本文提出的伪纯像元策略以及与之对比的重采样法均属于“面-面升尺度转换”,直接避免了对高精度样本的需求,是样本缺乏时进行精度评价的更优选择。且已有研究证明,以精度相对较高的高空间分辨率数据为参考评价低空间分辨率数据是可行的替代方法[13]
但相较于仅能产生唯一精度值的重采样法,伪纯像元策略可依据像元纯度阈值产生连续的精度评价结果,更能满足多样化用户需求,更具参考意义。就澜湄流域尺度的CCI-LC和MCD12Q1数据而言,伪纯像元策略评价的精度结果分别是55.26%~72.76%和45.41%~71.44%,而众数重采样法的精度结果为72.21%和70.54%,最近邻重采样法为71.48%和69.87%(图5)。重采样法虽为图像处理中经典的尺度转换方法[36],但其评定的精度结果仅为单一恒定值,且不同重采样方法所得精度结果也不同,用户难以判断何者更优。此外,已有研究表明,重采样会损失部分地面信息,影响土地覆被数据精度评价结果的准确性[37]。伪纯像元策略能通过不同伪纯像元纯度阈值解释不同程度混合像元对土地覆被数据精度的影响,避免了重采样法空间尺度转换引入的误差,从而满足多样化用户需求。在伪纯像元策略中,当栅格窗口内单一优势(面积最大)地类占比低于50%纯度阈值时,即混合像元纯度低于50%,表明该窗口内土地覆被类型多样且各类型占比差异较小,任何单一类型均无法代表地表真实地类,故该情形下精度评价结果的可信度较低;若单一优势类型占比高于50%,其余类型面积占比相对较小,则以优势类型代表地面真实地类,其评价结果可信度较高;当阈值升至100%时,理论上不存在混合像元影响,为最严格的精度评价结果。此外,试验区地形复杂、地貌差异较大,且土地覆被类型多样、空间异质性高,伪纯像元策略精度评价结果仍表现良好,表明该策略具有很强的稳健性,亦可适应于其它区域的精度评价。但像元真正纯度取决于高空间分辨率数据的分类精度,未来高空间分辨率数据分类精度和时间频度的提升可更好地支撑伪纯像元精度评价策略的应用[38]

5.2 基于伪纯像元精度评价策略的2套数据精度对比

区域尺度气候和水文模型等预测能力的提升很大程度上依赖于长时序地表覆被数据的精度和质量[39],认识和理解全球土地覆被数据在区域尺度的应用潜力是当前全球变化和可持续发展科学等领域关注的核心问题。基于伪纯像元精度评价策略对澜湄流域CCI-LC和MCD12Q1数据产品的评价结果表明,CCI-LC数据精度略高于MCD12Q1,且当伪纯像元纯度阈值为100%时,2套数据的总体精度分别为55.26%和45.41%。Yang等[7]通过目视解译获取验证样本,建立混淆矩阵评估了全中国范围CCI-LC和MCD12Q1数据的总体精度,其值分别为58.65%和56.04%;Kuenzer等[40]通过构建MCD12Q1与多套全球覆被数据的交叉验证表评价了澜湄流域MCD12Q1数据的总体精度,其值也仅为50%。由此可见,全球土地覆被数据在区域和流域尺度的总体精度明显低于其全球范围的名义精度,此与前人的相关研究一致[7,41]。但相较于MCD12Q1数据,CCI-LC数据产品具有更高的土地覆被分类精度,且在澜湄流域其优势更为明显。就单个土地覆被类别而言,CCI-LC数据中耕地、有林地、草地以及水体的精度比MCD12Q1数据中相应类型精度更高,而灌木林地和裸地却反之。这可能是因为GlobeLand30数据中灌木林地和裸地的面积占比相较于耕地、有林地、草地以及水体等类型偏低(图4),伪纯像元数量偏少,从而评价精度较低。此外,由于3种数据产品所采用的分类原则和覆被类型定义不同一定程度上也会影响评价结果[42]
除精度评价结果不同,CCI-LC和MCD12Q1数据与参考数据GlobeLand30在空间上的不一致区域亦存在明显差异。混合像元纯度是影响空间不一致性的主要因素之一。2套数据的空间不一致伪纯像元数和面积均随纯度阈值的增大呈上升趋势,而空间不一致伪纯像元数占比却在减小,且CCI-LC数据的下降斜率明显低于MCD12Q1数据(图9)。这说明两套数据中纯度较高的混合像元占比较高、空间异质性高的区域较少,且混合像元纯度越高数据的空间不一致性越低。从下降趋势上看,CCI-LC数据比MCD12Q1数据的空间不一致性更低。此外,空间不一致像元与非均质像元(混合像元)的叠合程度随伪纯像元纯度阈值增加而变大。由此可推断,区域景观异质性越高,空间不一致像元就越多,评价精度就会相应降低,与前人研究结论一致[40,43]。Latifovic和Olthof[44]的研究也表明,土地覆被制图精度会随空间不一致像元的增加而下降;Wang等[45]也指出,遥感分类误差与区域内土地覆被类型数量相关,高异质区域的土地覆被类型分类误差相对较大。因此,从空间一致性来看,CCI-LC数据较MCD12Q1对伪纯像元纯度阈值增加的响应更为稳健。

6 结论

为解决全球土地覆被数据在大型区域进行精度验证时实地样本缺乏无法支撑精度评价结果的问题,本文提出了基于伪纯像元的精度评价策略,以澜湄流域为实例,选择GlobleLand30作为参考数据,与2种重采样法进行对比,并对CCI-LC和MCD12Q1数据精度进行了评价。主要结论如下:
(1)基于伪纯像元的精度评价策略无需收集大量实地样本,操作简单便捷,原理简单易懂,且其精度评价结果摒弃了传统的单一精度评价结果,以精度范围形式呈现,相比重采样法更能满足多样化的用户需求,可信度更高,且伪纯像元策略的精度评价结果与覆被类型空间差异相结合,弥补了常规精度评价对空间差异考虑的不足,适用于其他地区。
(2)采用伪纯像元策略评价了CCI-LC和MCD12Q1数据在澜湄流域的精度,其值分别为55.26%~72.76%和45.41%~71.44%,且与伪纯像元纯度阈值呈负相关;最近邻法精度评价结果为71.48%和69.87%,众数法精度评价结果为72.21%和70.54%,表明不同升尺度方法产生的参考数据覆被类型分布差异对待评数据的精度评价结果存在一定影响。
(3)CCI-LC数据在澜湄流域的总体精度高于MCD12Q1数据,不同土地覆被类型在两套数据中的精度差异相似,耕地、有林地、草地、水体、永久冰雪等5个类型的精度均相对较高,而灌木林地(接近于0)和裸地的精度较低,空间异质性较高的区域精度也相对较低。
(4)35%~100%的伪纯像元纯度阈值可适用于比较不同空间分辨率土地覆被数据间的精度,但纯度阈值大于50%时所得评定精度可信度更高,纯度阈值为100%时所得评价精度实为数据的理论最低精度。
[1]
Grekousis G, Mountrakis G, Kavouras M. An overview of 21 global and 43 regional land-cover mapping products[J]. International Journal of Remote Sensing, 2015, 36(21):5309-5335. DOI: 10.1080/01431161.2015.1093195

DOI

[2]
Singh D, McDermid S P, Cook B I, et al. Distinct influences of land cover and land management on seasonal climate[J]. Journal of Geophysical Research: Atmospheres, 2018, 123(21):12017-12039. DOI: 10.1029/2018JD028874

DOI

[3]
吴英迪, 蒙吉军. 中国自然资源生态服务重要性评价与空间格局分析[J]. 自然资源学报, 2022, 37(1):17-33.

[ Wu Y D, Meng J J. Importance assessment and spatial pattern analysis of natural resources ecological services in China[J]. Journal of Natural Resources, 2022, 37(1):17-33. ] DOI: 10.31497/zrzyxb.20220102

DOI

[4]
Manakos I, Tomaszewska M, Gkinis I, et al. Comparison of global and continental land cover products for selected study areas in south central and eastern European region[J]. Remote Sensing, 2018, 10(12):1967-1988. DOI: 10.3390/rs10121967

DOI

[5]
Zhao Y Y, Gong P, Yu L, et al. Towards a common validation sample set for global land-cover mapping[J]. International Journal of Remote Sensing, 2014, 35(13):4795-4814. DOI: 10.1080/01431161.2014.930202

DOI

[6]
Bai Y, Feng M, Jiang H, et al. Assessing consistency of five global land cover data sets in China[J]. Remote Sensing, 2014, 6(9):8739-8759. DOI: 10.3390/rs6098739

DOI

[7]
Yang Y K, Xiao P F, Feng X Z, et al. Accuracy assessment of seven global land cover datasets over China[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 125(3):156-173. DOI: 10.1016/j.isprsjprs.2017.01.016

DOI

[8]
刘琼欢, 张镱锂, 刘林山, 等. 七套土地覆被数据在羌塘高原的精度评价[J]. 地理研究, 2017, 36(11):2061-2074.

DOI

[ Liu Q H, Zhang Y L, Liu L S, et al. Accuracy evaluation of the seven land cover datasets in the Qiangtang Plateau[J]. Geographical Research, 2017, 36(11):2061-2074. ] DOI: 10.11821/dlyj201711003

DOI

[9]
Bai Y, Feng M, Jiang H, et al. Validation of land cover maps in China using a sampling-based labeling approach[J]. Remote Sensing, 2015, 7(8):10589-10606. DOI: 10.3390/rs70810589

DOI

[10]
Stehman S V, Foody G M. Key issues in rigorous accuracy assessment of land cover products[J]. Remote Sensing of Environment, 2019, 231(9):111199. DOI: 10.1016/j.rse.2019.05.018

DOI

[11]
Liang D, Zuo Y, Huang L S, et al. Evaluation of the consistency of MODIS land cover product (MCD12Q1) based on Chinese 30 m GlobeLand30 datasets: a case study in Anhui Province, China[J]. ISPRS International Journal of Geo-Information, 2015, 4(4): 2519-2541. DOI: 10.3390/ijgi4042519

DOI

[12]
马京振, 孙群, 肖强, 等. 河南省GlobeLand30数据精度评价及对比分析[J]. 地球信息科学学报, 2016, 18(11):1563-1572.

DOI

[ Ma J Z, Sun Q, Xiao Q, et al. Accuracy assessment and comparative analysis of GlobeLand30 dataset in Henan Province[J]. Journal of Geo-information Science, 2016, 18(11):1563-1572. ] DOI: 10.3724/SP.J.1047.2016.01563

DOI

[13]
Schultz M, Tsendbazar N E, Herold M, et al. Utilizing the Global Land Cover 2000 reference dataset for a comparative accuracy assessment of 1 km global land cover maps[C]. ISPRS Archives, 2015, XL-7/W3:503-510. DOI: 10.5194/isprsarchives-XL-7-W3-503-2015

DOI

[14]
Zhang X, Liu L Y, Chen X D, et al. GLC_FCS30: Global land-cover product with fine classification system at 30 m using time-series Landsat imagery[J]. Earth System Science Data, 2021, 13(6):2753-2776. DOI: 10.5194/essd-13-2753-2021

DOI

[15]
Chen J, Chen L J, Chen F, et al. Collaborative validation of GlobeLand30: Methodology and practices[J]. Geo-Spatial Information Science, 2021, 24(1):134-144. DOI: 10.1080/10095020.2021.1894906

DOI

[16]
陈逸聪, 邵华, 李杨. 多源土地覆被产品在长三角地区的一致性分析与精度评价[J]. 农业工程学报, 2021, 37(6):142-150.

[ Chen Y C, Shao H, Li Y. Consistency analysis and accuracy assessment of multi-source land cover products in the Yangtze River Delta[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(6):142-150. ] DOI: 10.11975/j.issn.1002-6819.2021.06.018

DOI

[17]
Hu J W, Xia G S, Sun H. An SRTM-aided epipolar resampling method for multi-Source high-resolution satellite stereo observation[J]. Remote Sensing, 2019, 11(6):678-696. DOI: 10.3390/rs11060678

DOI

[18]
张永梅, 滑瑞敏, 马健喆, 等. 基于深度学习与超分辨率重建的遥感高时空融合方法[J]. 计算机工程与科学, 2020, 42(9):1578-1586.

[ Zhang Y M, Hua R M, Ma J J, et al. A high spatial temporal fusion method based on deep learning and super resolution reconstruction[J]. Computer Engineering & Science, 2020, 42(9):1578-1586. ] DOI: 10.3969/j.issn.1007-130X.2020.09.008

DOI

[19]
张周威, 余涛, 孟庆岩, 等. 空间重采样方法对遥感影像信息影响研究[J]. 华中师范大学学报(自然科学版), 2013, 47(3):426-430.

[ Zhang Z W, Yu T, Meng Q Y, et al. Influence of spatial resampling method on remote sensing image information[J]. Journal of Central China Normal University (Natural Sciences), 2013, 47(3):426-430. ] DOI: 10.19603/j.cnki.1000-1190.2013.03.028

DOI

[20]
赵英时. 遥感应用分析原理与方法[M]. 北京: 科学出版社, 2003:34-35.

[ Zhao Y H. Principle and method of remote sensing application analysis[M]. Beijing: Science Press, 2003:34-35. ]

[21]
Liu C R, Frazier P, Kumar L. Comparative assessment of the measures of thematic classification accuracy[J]. Remote Sensing of Environment, 2007, 107(4):606-616. DOI: 10.1016/j.rse.2006.10.010

DOI

[22]
MRC. Overview of the hydrology of the Mekong Basin[R]. Vientiane: Mekong River commission, 2005:73-75.

[23]
何大明. 澜沧江──湄公河水文特征分析[J]. 云南地理环境研究, 1995,(1):58-74.

[ He D M. Hydrological characteristics of Lancang-Mekong River[J]. Yunnan Geographical Environment Research, 1995,(1):58-74. ]

[24]
陈丽晖, 曾尊固, 何大明. 国际河流流域开发中的利益冲突及其关系协调——以澜沧江-湄公河为例[J]. 世界地理研究, 2003, 12(1):71-78.

[ Chen L H, Zeng Z G, He D M. Interest conflict and relationship coordination in international river basin development: A case study of Lancang-Mekong River[J]. World Regional Studies, 2003, 12(1):71-78. ]

[25]
Rundel P W. Chapter 7 Chapter 7 - Vegetation in the Mekong Basin[M]. The Mekong. San Diego; Academic Press. 2009:143-160. DOI: 10.1016/B978-0-12-374026-7.00007-3

DOI

[26]
ESA. Land Cover CCI: Product User Guide Version 2 (2017). Available online: https://www.esa-landcover-cci.org/?q=webfm_send/84.

[27]
Friedl M A, Sulla-Menashe D, Tan B, et al. MODIS Collection 5 global land cover: Algorithm refinements and characterization of new datasets[J]. Remote Sensing of Environment, 2010, 114(1):168-182. DOI: 10.1016/j.rse.2009.08.016

DOI

[28]
Chen J, Chen J, Liao A P, et al. Global land cover mapping at 30 m resolution: A POK-based operational approach[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 103(5):7-27. DOI: 10.1016/j.isprsjprs.2014.09.002

DOI

[29]
陈军, 廖安平, 陈晋, 等. 全球30m地表覆盖遥感数据产品-Globe Land30[J]. 地理信息世界, 2017, 24(1):1-8.

[ Chen J, Liao A P, Chen J, et al. 30 m Global land cover data product- GlobeLand30[J]. Geographic Information World, 2017, 24(1):1-8. ] DOI: 10.3969/j.issn.1672-1586.2017.01.002

DOI

[30]
黄亚博, 廖顺宝. 首套全球30m分辨率土地覆被产品区域尺度精度评价——以河南省为例[J]. 地理研究, 2016, 35(8):1433-1446.

DOI

[ Huang Y B, Liao S B. Regional accuracy assessments of the first global land cover dataset at 30-meter resolution: A case study of Henan province[J]. Geographical Research, 2016, 35(8):1433-1446. ] DOI: 10.11821/dlyj201608003

DOI

[31]
Xu Y D, Yu L, Feng D L, et al. Comparisons of three recent moderate resolution African land cover datasets: CGLS-LC100, ESA-S2-LC20, and FROM-GLC-Africa30[J]. International Journal of Remote Sensing, 2019, 40(16):6185-6202. DOI: 10.1080/01431161.2019.1587207

DOI

[32]
姚远, 陈曦, 钱静. 定量遥感尺度转换方法研究进展[J]. 地理科学, 2019, 39(3):367-376.

DOI

[ Yao Y, Chen X, Qian J. A review on the methodology of scale issues in quantitative remote sensing[J]. Scientia Geographica Sinica, 2019, 39(3):367-376. ] DOI: 10.13249/j.cnki.sgs.2019.03.002

DOI

[33]
栾海军, 田庆久, 章欣欣, 等. 定量遥感地表参数尺度转换研究趋势探讨[J]. 地球科学进展, 2018, 33(5):483-492.

DOI

[ Nuan H J, Tian Q J, Zang X X, et al. Trends on scaling research for land surface parameters in quantitative remote sensing[J]. Advances in Earth Science, 2018, 33(5):483-492. ] DOI: 10.11867/j.issn.1001-8166.2018.05.0483

DOI

[34]
郝大磊, 肖青, 闻建光, 等. 定量遥感升尺度转换方法研究进展[J]. 遥感学报, 2018, 22(3):408-423.

[ Hao D L, Xiao Q, Wen J G, et al. Advances in upscaling methods of quantitative remote sensing[J]. Journal of Remote Sensing, 2018, 22(3):408-423. ] DOI: 10.11834/jrs.20187070

DOI

[35]
Li Y, Chen J, Rao Y H. A practical sampling method for assessing accuracy of detected land cover/land use change: Theoretical analysis and simulation experiments[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2018, 144(10):379-389. DOI: 10.1016/j.isprsjprs.2018.08.006

DOI

[36]
周觅, 张杰林. 遥感影像尺度转换及最优尺度选择探讨[J]. 世界核地质科学, 2011, 28(2):94-98.

[ Zhou M, Zhang J L. Scale transformation and optimal scale selection of remote sensing images[J]. World Nuclear Geoscience, 2011, 28(2):94-98. ] DOI: 10.3969/j.issn.1672-0636.2011.02.006

DOI

[37]
郭紫甜, 王春梅, 刘欣, 等. 基于小流域抽样单元的中国FROM-GLC30数据精度评价[J]. 地球信息科学学报, 2021, 23(3):524-535.

DOI

[ Guo Z T, Wang C M, Liu X, et al. Accuracy evaluation of FROM-GLC30 data in China based on small watershed sampling unit[J]. Journal of Geo-information Science, 2021, 23(3):524-535. ] DOI: 10.12082/dqxxkx.2021.200100

DOI

[38]
廖顺宝, 葛乐玮, 王艳萍, 等. 利用地形参数提高土地覆被分类精度方法的改进[J]. 遥感信息, 2021, 36(3):10-16.

[ Liao S B, Ge L W, Wang Y P, et al. An improved method to improve the accuracy of land cover classification using topographic parameters[J]. Remote Sensing Information, 2021, 36(3):10-16. ] DOI: 10.3969/j.issn.1000-3177.2021.03.002

DOI

[39]
Reid W V, Chen D, Goldfarb L, et al. Earth system science for global sustainability: Grand challenges[J]. Science, 2010, 330(6006):916-917. DOI: 10.1126/science.1196263

DOI PMID

[40]
Kuenzer C, Leinenkugel P, Vollmuth M, et al. Comparing global land-cover products - implications for geoscience applications: an investigation for the trans-boundary Mekong Basin[J]. International Journal of Remote Sensing, 2014, 35(8):2752-2779. DOI: 10.1080/01431161.2014.890305

DOI

[41]
许光明, 杨雅萍, 杨飞, 等. 多分辨率遥感土地覆被数据质量综合评价——以湖南省桃源县为例[J]. 地球信息科学学报, 2016, 18(4):553-563.

DOI

[ Xu G M, Yang Y P, Yang F, et al. Quality assessment of multi-resolution remote sensing land cover data: a case study in Taoyuan county of Hunan province[J]. Journal of Geo-information Science, 2016, 18(4):553-563. ] DOI: 10.3724/SP.J.1047.2016.00553

DOI

[42]
Zhang M, Ma M G, De Maeyer P, et al. Uncertainties in classification system conversion and an analysis of inconsistencies in global land cover products[J]. ISPRS International Journal of Geo-Information, 2017, 6(4):112-129. DOI: 10.3390/ijgi6040112

DOI

[43]
Hua T, Zhao W W, Liu Y X, et al. Spatial consistency assessments for global land-cover datasets: A comparison among GLC2000, CCI-LC, MCD12, GLOBCOVER and GLCNMO[J]. Remote Sensing, 2018, 10(11):1846-1864. DOI: 10.3390/rs10111846

DOI

[44]
Latifovic R, Olthof I. Accuracy assessment using sub-pixel fractional error matrices of global land cover products derived from satellite data[J]. Remote Sensing of Environment, 2004, 90(2):153-165. DOI: 10.1016/j.rse.2003.11.016

DOI

[45]
Wang L B, Bartlett P, Pouliot D, et al. Comparison and assessment of regional and global land cover datasets for use in CLASS over Canada[J]. Remote Sensing, 2019, 11(19):2286-2301. DOI: 10.3390/rs11192286

DOI

文章导航

/