遥感科学与应用技术

基于小流域抽样单元的中国FROM-GLC30数据精度评价

  • 郭紫甜 , 1, 2 ,
  • 王春梅 , 1, 2, 3, * ,
  • 刘欣 1, 2 ,
  • 庞国伟 1, 2, 3 ,
  • 朱梦阳 1, 2 ,
  • 王晋卿 2
展开
  • 1.陕西省地表与环境承载力重点实验室,西北大学,西安 710127
  • 2.西北大学 城市与环境学院,西安 710127
  • 3.旱区生态水文与灾害防治国家林业和草原局重点实验室,西安 710048
*王春梅(1983- ),女,山东临邑人,副教授,硕士生导师,主要从事区域土壤侵蚀评价研究。 E-mail:

郭紫甜(1995- ),女,江苏江阴人,硕士生,主要从事遥感和GIS在土壤侵蚀中的应用研究。E-mail:

收稿日期: 2020-03-03

  要求修回日期: 2020-07-06

  网络出版日期: 2021-05-25

基金资助

中国科学院战略性先导科技专项(A类)(XDA20040202)

国家自然科学基金项目(41977062)

国家自然科学基金项目(441601290)

国家大学生创新创业训练计划项目(201910697042)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

Accuracy Assessment of FROM-GLC30 Dataset based on Small Watershed Sampling Units in China

  • GUO Zitian , 1, 2 ,
  • WANG Chunmei , 1, 2, 3, * ,
  • LIU Xin 1, 2 ,
  • PANG Guowei 1, 2, 3 ,
  • ZHU Mengyang 1, 2 ,
  • WANG Jinqing 2
Expand
  • 1. Shaanxi Key Laboratory of Earth Surface System and Environmental Carrying Capacity, Northwest University, Xi'an 710127, China
  • 2 College of Urban and Environmental Sciences, Northwest University, Xi'an 710127, China
  • 3 Key Laboratory of National Forestry and Grassland Administration on Ecological Hydrology and Disaster Prevention in Arid Regions, Xi'an 710048, China
*WANG Chunmei,E-mail:

Received date: 2020-03-03

  Request revised date: 2020-07-06

  Online published: 2021-05-25

Supported by

The Strategic Priority Research Program of Chinese Academy of Sciences(XDA20040202)

National Natural Science Foundation of China(41977062)

National Natural Science Foundation of China(441601290)

National College Student Innovation and Entrepreneurship Training Program(201910697042)

Copyright

Copyright reserved © 2021

摘要

土地覆盖数据是全球环境变化相关研究和应用的重要数据基础,在诸多领域中被广泛运用。FROM-GLC30 2017数据是最新的全球高分辨率(30 m)公开土地覆盖数据集之一。土地覆盖数据集的精度是其在不同领域应用中的重要问题。本研究旨在探讨FROM-GLC30 2017数据集精度在全国范围内的空间分布,并比较不同土地覆盖类型精度的区域差异。本研究以亚米级高分辨率遥感影像为基础,对布设在中国范围内的6434个小流域抽样单元进行了人工目视解译,获得了土地覆盖参考数据。通过野外实地调查验证了参考数据,在此基础上对FROM-GLC30 2017数据集进行了精度评价。研究结果表明: ① FROM-GLC30 2017数据集中各土地覆盖类型的面积比例基本符合我国的实际情况;② 数据集在中国的总体精度为75.39%,在7大地理分区中,华东地区的总体精度最高,华南地区的总体精度最低;③ 在7种土地覆盖类型中,裸地、森林以及农田的精度相对较高,灌丛的精度最低。研究结果可为大区域土地覆盖数据精度评价研究提供理论支持,促进公开土地覆盖数据集的有效应用。

本文引用格式

郭紫甜 , 王春梅 , 刘欣 , 庞国伟 , 朱梦阳 , 王晋卿 . 基于小流域抽样单元的中国FROM-GLC30数据精度评价[J]. 地球信息科学学报, 2021 , 23(3) : 524 -535 . DOI: 10.12082/dqxxkx.2021.200100

Abstract

Land cover data play an important role in global environment change studies and applications and are widely used in many fields. The FROM-GLC30 2017 dataset is one of the latest global high-resolution (30-meter) land cover datasets. The accuracy of this land cover dataset is of great interest and important for its application in other fields. The aim of this study was to evaluate the spatial accuracy of the FROM-GLC30 2017 dataset at the national scale and analyze the spatial variation of its accuracy for different land cover types. In our study, the reference land cover data were obtained through visual interpretation based on sub-meter high-resolution remote sensing images collected from 6434 small watersheds in China. The reference dataset was validated by field survey. Based on this, the accuracy of the FROM-GLC30 2017 dataset was further assessed. Our results show that: (1) the area proportion of each land cover type of the FROM-GLC30 2017 dataset generally matched the real field condition in China; (2) the overall accuracy of this dataset in China was 75.39%. Among the seven geographical divisions, the overall accuracy in east China was the highest, and the south China has the lowest accuracy; and (3) the accuracy of the bare land, forest, and cropland was relatively high, and the accuracy of the shrubland was the lowest among the seven land cover types. Our results provide theoretical support for large-scale land cover data accuracy assessment and promote the application of free land cover datasets.

1 引言

土地覆盖信息在地表过程研究以及全球变化相关研究中发挥着较为重要的作用[1,2,3],其精度直接影响了诸多地表过程模拟结果[4,5,6,7]。随着遥感技术手段的发展,多分辨率的全球土地覆盖及土地利用数据相继发布[8,9,10,11]。其中,2013年由清华大学宫鹏团队发布的FROM-GLC数据(Finer Resolution Observation and Monitoring of Global Land Cover)是利用Landsat TM和 ETM+数据得到的30 m分辨率的全球土地覆盖图[12]。为进一步优化数据,解决数据单时相问题、提高数据产品精度,FROM-GLC-seg、FROM-GLC-agg以及FROM-GLC-Hierarchy等系列产品相继出现,目前包括了2010年和2015年2个时相的数据[13,14]。2018年,FROM-GLC30数据系列的最新产品FROM-GLC30 2017发布,该数据产品以Landsat 8影像为基础,运用了全季节样本进行土地覆盖分类[15],降低了季节问题的影响。FROM-GLC30数据集系列产品自发布以来在多领域被广泛应用[16,17,18],其精度问题也受到广泛关注。Lu等[19]对FROM-GLC30等5种常用土地覆盖数据在中国的耕地精度进行评价得出中国FROM-GLC耕地总体精度达76.23%;Chen等[20]对FROM-GLC30等4种土地利用/覆盖数据在陕西省范围内耕地精度进行评价得出中国FROM-GLC耕地总体精度达77.67%;邹佳楠等[21]对比了FROM-GLC30与其他已有数据集指出,耕地、森林、灌木、水体和人造地表的相关性较高在0.9以上,草地、湿地和裸地的相关性较低且存在明显的地域差异。
由于发布时间较短,目前针对FROM-GLC30 2017数据集的精度评价尚不足,亟需基于统一的参考数据、抽样方案,对这一最新系列30 m分辨率公开土地覆盖数据集精度进行各地类、大范围的综合评价,从而提高对该数据集质量的认识,服务地表过程研究;同时以往研究多基于单个栅格像元对FROM-GLC精度进行评价的方法,有可能增大由于数据间配准等造成的误差,降低对区域精度分布特征的表达能力。因此,本研究从土壤侵蚀领域对土地利用精度的实际需求出发,参考全国土壤侵蚀普查抽样方案[22,23],在中国范围内布设6434个小流域抽样单元,基于Google Earth遥感影像进行人工目视解译,得到更接近地表真实土地覆盖状况的土地覆盖参考数据,基于此对FROM-GLC30 2017数据集进行精度评价。基于统一的抽样方案、数据基础,以小流域为抽样单元,以期为FROM-GLC30 2017数据集在中国范围内土壤侵蚀领域的适用性提供参考。研究结果对于完善大尺度土地利用精度评价研究、促进土地覆盖数据集在各领域的有效应用具有一定理论与实践意义。

2 研究区概况、数据来源与研究方法

2.1 研究区概况

研究区为中国,根据国家行政区划原则,将研究区划分为七大地理分区(表1),七大分区分别为东北地区、华北地区、华东地区、华南地区、华中地区、西北地区以及西南地区。
表1 七大地理分区

Tab. 1 Range of seven geographical divisions

七大地理分区 包含省、直辖市及自治区
东北 黑龙江省、吉林省、辽宁省
华北 北京市、天津市、山西省、河北省、内蒙古自治区
华东 上海市、江苏省、浙江省、安徽省、福建省、江西省、山东省、台湾省
华南 广东省、海南省、广西壮族自治区、香港特别行政区、澳门特别行政区
华中 河南省、湖北省、湖南省
西北 陕西省、甘肃省、青海省、宁夏回族自治区、新疆维吾尔自治区
西南 重庆市、四川省、贵州省、云南省、西藏自治区

2.2 基础数据

基础数据包括了待评价数据和参考数据,待评价数据为FROM-GLC30 2017数据集,参考数据为6434个小流域抽样单元的高分辨率遥感影像人工目视解译结果。本研究的精度评价基于小流域单元展开,并按上述地理分区进行了区域统计。
2.2.1 抽样单元布设与参考数据
参考中国土壤侵蚀普查抽样方案[22,23],在研究区范围内,基于分层不等概系统抽样的方法布设了6434个抽样单元,布设原则如下:北纬40°-60°之间,按纬度间隔0.5°、经度间隔0.75°布设抽样单元;北纬40°以下的范围内,按纬度间隔为0.5°、经度间隔0.5°布设抽样单元;在青藏高原地区,按纬度间隔0.25°、经度间隔0.25°布设抽样单元。每个抽样单元为一个0.2~3 km2的完整小流域,在地形平坦地区选取1 km×1 km的正方形区域。
已有的相关研究表明,Google Earth高分辨率遥感影像已经成为了评价土地覆盖产品精度的一个重要数据源[24,25]。本研究中参考数据为基于Google Earth高分辨遥感影像的6434个抽样单元人工目视解译结果,图1为本文参考数据的具体处理流程,包括了遥感影像解译、投影及数据格式转换、栅格数据尺度变换以及数据质量检查4个步骤。研究区内70%以上的抽样单元处有亚米级遥感影像,其余抽样单元处遥感影像的空间分辨率也能够达到米级水平。为与FROM-GLC30 2017数据保持影像时间的一致性,参考数据的解译多基于2015年前后的Google Earth 影像。对于具有时相敏感性的地物(如水体、冰川和永久积雪等),在解译过程中参考了多期不同年份不同季节的Google Earth 影像,从而最大程度减少了时相因素对地类判别的影响,提高了这类地物参考数据解译结果的准确性。目视解译的精度要求按1:10 000解译要求进行,参考数据经格式转换最终统一为1 m分辨率栅格数据。一般来说,数据精度评价需要参考数据与待评价数据在尺度上保持一致,本研究中通过尺度变换将参考数据栅格尺寸由1 m转换到30 m,重采样方法选择Majority,重采样后每个30 m×30 m栅格单元的地类属性值与900个1 m×1 m的栅格单元中数量最多的地类属性一致。
图1 参考数据处理流程

Fig. 1 Processing of reference data

西藏和新疆地区由于其地理特殊性,土地利用的把握最为困难,为验证参考数据的准确性并提高解译精度,在中国西藏和新疆共组织了2次抽样单元土地利用野外实地考察来评价参考数据质量。现场调查了53个抽样小流域真实地表土地覆盖情况,对参考数据进行了逐图斑核实,进行精度计算,并根据野外考察的结果对参考数据遥感解译结果进行了系统的修正。图2所示为参考数据遥感解译结果的实地调查验证,示意了2次考察的线路以及验证抽样单元的位置,并以其中一个小流域单元为例展示了参考数据与真实地表的对应情况及考察后的数据修正结果。野外验证结果表明:与真实地表土地覆盖情况相比,西藏和新疆地区考察抽样单元的参考数据精度分别为80.1%和81.9%,参考数据的土地覆盖信息采集精度达到了80%以上,研究团队之前对于该参考土地覆盖数据的精度分析也支持这一结论[26]。这一精度结果表明,本研究参考数据较接近真实地表情况,以此作为FROM-GLC30 2017数据集精度评价的参考是可行的。
图2 参考数据遥感解译结果的实地调查验证

Fig. 2 Validation of remote sensing interpretation results for reference dataset based on field survey

2.2.2 FROM-GLC30 2017
FROM-GLC30数据集为本研究待评价数据,是目前常用的30 m分辨率地表覆盖公开数据,为不同尺度下的土地覆盖与土地利用相关研究提供了新的数据源,在气候变化、区域发展、区域土壤侵蚀等相关研究中得到了广泛的应用。2018年底,FROM-GLC30 2017数据集发布,该数据集是FROM-GLC30系列的最新数据产品。本研究中数据来源于国家科技基础条件平台-国家地球系统科学数据中心(http://www.geodata.cn)。
FROM-GLC30 2017数据集由监督分类方法生成,以Landsat 8影像为主要数据源,结合了部分中国高分卫星数据、高分辨率的SRTM DEM和ASTER DEM高程数据以及NASA公布的2016年全球500 m空间分辨率的夜间灯光数据。
由于参考数据集分类体系主要考虑了区域土壤侵蚀应用角度,因此与FROM-GLC30 2017数据集分类体系下的土地覆盖类型略有不同,需对FROM-GLC30 2017数据集进行部分地类的合并及类别对应。统一类别后的分类体系中包括了农田、森林、灌丛、草地、不透水层、水域以及裸地7种土地覆盖类型。表2表现了FROM-GLC30 2017数据与参考数据的分类体系对应情况并对7种土地覆盖类型的含义进行了描述。
表2 FROM-GLC30 2017数据与参考数据分类代码对应关系

Tab. 2 Land cover classification code correspondence between the FROM-GLC30 2017 dataset and the reference data

统一代码 统一地类名称 参考数据 FROM-GLC30 2017数据 含义
1 农田 1 农田 1 农田 指用于种植农作物、经济作物的土地
2 森林 2 森林 2 森林 乔木覆盖且覆盖度超过30%的土地,以及树冠盖度为10%~30%的疏林地
3 灌丛 3 灌丛 4 灌丛 灌木覆盖且灌丛覆盖度高于30%的土地,以及荒漠地区覆盖度高于10%的荒漠灌丛
4 草地 4 草地 3 草地,7 苔原 指以草本植被为主且植被覆盖度在10%以上,包括高寒地区被苔藓、地衣以及耐寒草本、灌木植被覆盖的土地
5 不透水层 5 不透水层 8 不透水层 包括人工建造的城镇用地、工矿用地、商服用地、仓储用地以及交通设施用地等
6 水域 6 水域 5 湿地,6 水体,10 冰雪 包括陆地范围内液态水、冰川及永久积雪等覆盖的区域,以及水陆交界处有浅层积水或土壤过湿的土地
7 裸地 7 裸地 9 裸地 包括裸土、裸岩、荒漠、沙地、砾石地、盐碱地等在内的植被覆盖度低于10%的自然覆盖土地

2.3 数据预处理

数据预处理部分主要包括2个步骤:① 抽样单元数据整理:首先对FROM-GLC30 2017数据集进行裁剪和拼接处理,裁剪出每个抽样单元所在小流域或矩形范围内FROM-GLC30 2017数据。对各抽样单元参考数据进行格式转换,转为栅格数据,栅格单元尺寸为1 m,并以图1所示方式综合为30 m;② 坐标系转换及空间配准:将2个数据集的投影统一为UTM投影,并以FROM-GLC30 2017数据集为基础对参考数据进行空间配准。

2.4 精度评价指标

总体精度、用户精度和制图精度是评价土地覆盖/土地利用数据精度的常见指标[27,28]。总体精度是对数据精度的宏观描述,表现了所有土地覆盖类型中正确类型的面积占比情况;用户精度与制图精度从不同地类的角度表现数据精度。本研究评价了每个小流域单元的以上3种精度,其计算公式分别为:
OA = X / N × 100 %
U A i = X i / N i × 100 %
P A i = X i / N ' i × 100 %
式中:OA为总体精度;UAi为第i类土地覆盖类型用户精度;PAi为第i类土地覆盖类型制图精度;N为小流域栅格总数;X为小流域内FROM-GLC30 2017数据集与参考数据集一致的栅格数目;Xi为第i类土地覆盖类型中两数据集属性一致的栅格数;Ni为FROM-GLC30 2017数据集中第i类土地覆盖类型的栅格数;N′i为参考数据中第i类土地覆盖类型的栅格数。

3 结果与分析

3.1 不同土地覆盖类型面积占比分析

本研究对不同土地覆盖类型在FROM-GLC30 2017数据与参考数据中的面积占比进行了对比与分析(表3),结果表明:研究区范围内,2个数据集的统计分布基本一致,均以裸地和草地为主,森林、农田以及水域次之。但不同土地覆盖类型的面积所占比例在两数据集中存在一定差异,其中,裸地和草地所占比例的差异相对较大,FROM-GLC30 2017中草地所占比例较参考数据高8.63%,而裸地较参考数据低了8.05%。
表3 不同土地覆盖类型的总面积占比

Tab. 3 Proportions of total area of different land cover types (%)

基础数据 面积占比
农田 森林 灌丛 草地 不透水层 水域 裸地
FROM-GLC30 2017 6.31 14.23 0.36 23.96 0.95 5.93 48.26
参考数据 6.87 13.44 1.81 15.33 1.14 5.11 56.31

3.2 FROM-GLC30 2017数据集总体精度区域差异

基于参考数据,中国范围内6434个抽样单元处FROM-GLC30 2017的总体精度为75.39%。各抽样单元的总体精度计算结果表明(图3):79.79%的抽样单元总体精度在50%以上,其中,56.62%的抽样单元总体精度在80%以上。
图3 抽样单元总体精度分布

Fig. 3 Overall accuracy distribution of sampling units

在七大地理分区中,华东地区的总体精度最高为80.59%,华南地区的总体精度最低为64.90%,其他地区的总体精度依次为东北地区80.29%、华中地区77.50%、西南地区75.99%、西北地区75.57%以及华北地区68.10%。
图4中的箱式图来看,东北、华东以及华中的箱体较短,这些区域的抽样单元总体精度分布较为集中且都处于较高的精度水平上,精度总体控制在80%以上,而华北、华南、西北以及西南的箱体较长,说明这4个区域内各抽样单元的总体精度差异较大;东北地区数据精度中位数较高且数据分布最为均匀,该区域数据精度较高,而华南和华北地区数据中位数较低且数据分布不均匀,在各区域中数据精度相对较差;各分区的中位数出现偏态现象且都偏向上四分位数,说明数据总体精度较高。
图4 七大地理分区总体精度箱线图

Fig. 4 Box-plot of overall accuracy of seven geographical divisions

从各抽样单元总体精度结果的空间分布上看(图5),总体精度较高的抽样单元(总体精度>85%)主要集中分布在西北的中部及北部地区、西南的西部地区、华北的西部地区以及东北地区。总体精度较低的抽样单元(总体精度<30%)主要集中在华北的中部地区、西北的北部及东南部地区、西南的中部地区以及华南的东部地区。
图5 抽样单元总体精度空间分布

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2016)2921号的标准地图制作,底图无修改。

Fig. 5 Spatial distribution of overall accuracy of all the sampling units

3.3 FROM-GLC30 2017数据集不同土地覆盖类型 精度区域差异

表4反映了不同土地覆盖类型的用户精度与制图精度情况。其中,裸地的用户精度最高,为91.76%,森林(81.74%)和农田(75.10%)次之,灌丛的用户精度最低。从制图精度上来看,精度较高的3种土地覆盖类型分别为森林(86.83%)、裸地(78.90%)和水域(70.90%),制图精度最低的地类为灌丛。比较同种土地覆盖类型的用户精度与制图精度结果可知:草地的用户精度与制图精度差值的绝对值最大,达25.31%,裸地次之,为12.86%,这也说明草地与裸地这2种地类在FROM-GLC30 2017数据与参考数据中的面积差异较大。
表4 不同土地覆盖类型用户精度与制图精度

Tab. 4 User's accuracy and producer's accuracy of different land cover types (%)

代码 地类名称 用户精度 制图精度
1 农田 75.10 69.14
2 森林 81.74 86.83
3 灌丛 9.47 1.87
4 草地 44.51 69.82
5 不透水层 49.33 41.39
6 水域 60.90 70.90
7 裸地 91.76 78.90
图6显示不同分区不同土地覆盖类型的用户精度和制图精度,结果表明:① 在用户精度方面,不同分区农田、森林和水域的用户精度均值较高,平均为75%,其中森林较大为80%,而灌丛最小仅为5%;灌丛、草地和裸地在各分区中用户精度差异较大且达到显著差异水平(p<0.05),尤其是裸地在西北、西南用户精度达92%,但在华中地区为0,而农田、森林、水域和不透水层在不同分区用户精度差异较小,但其中一些分区亦达到差异显著水平(p<0.05);不同土地覆盖类型下不同分区用户精度均值在华北地区较大为61%,东北、华南和华中较小约为46%。② 在制图精度方面,不同分区森林的制图精度均值较大为87%,而灌木地最小仅为2%左右;除森林外,其余土地覆盖类型在不同分区差异显著(p<0.05),东北、华北、华东地区农田、森林和不透水层制图精度较高,西北、西南地区草地、水域和裸地的制图精度较高;不同土地覆盖类型下不同分区制图精度均值在华北、西北和西南地区较大约为55%,在华南地区较小为32%。③ 对比用户精度和制图精度,不同分区不同土地覆盖类型的用户精度平均为52%,而制图精度平均为45%,其中农田和森林在不同区域用户和制图精度均较高,且相对其他土地覆盖类型变化相对较小;不透水层在东北、华北、华东和华南地区用户精度一般变化不大(p>0.05),但制图精度差异达到显著差异水平(p<0.05);水域在东北、华北、华东、华南和华中用户精度较大而制图精度较小,但在西北和西南地区呈现出相反趋势,除不透水层和水域外,其他不同土地覆盖类型在不同分区的用户精度和制图精度变化趋势相同。
图6 七大分区不同土地覆盖类型的用户精度与制图精度

注:C:农田;F:森林;S:灌丛;G:草地;R:不透水层;W:水域;N:裸地;不同小写字母表示相同土地覆盖类型不同分区间差异显著(P<0.05)。

Fig. 6 User's accuracy and producer's accuracy of different land cover types in seven divisions

4 讨论

4.1 以小流域和栅格单元为抽样单元对土地覆盖精度评价的影响

已有土地覆盖数据精度评价研究中的抽样单元多为栅格单元[29,30],而本研究中以小流域为抽样单元。小流域是能综合表达地表各要素特征的基本单元,理论上来说,以小流域为单元的方法有可能给出更为可靠的结论,这是本研究以小流域为单元进行评价的重要原因。
图7表现了基于小流域单元和基于栅格单元得到的黄土高原总体精度空间插值结果,图7(a)中插值点的值为所在栅格单元的精度,取值为0(不正确)或100%(正确);图7(b)中插值点的值为所在小流域抽样单元的平均精度,取值可为0~100%之间任意值(小流域范围内总体精度按式(1)计算得到)。通过在黄土高原的对比发现,以同样的采样方案,在整个区域范围内基于栅格单元和基于小流域单元的方法得到的FROM-GLC30 2017数据集的总体精度计算结果分别为58.16%和59.05%,在数值上两者较为接近,但各抽样单元的总体精度空间插值结果表现出较大的空间格局差异。基于小流域的各抽样单元总体精度插值结果更具空间连续性,更能表达区域的整体特征;而基于栅格单元的总体精度插值结果在格局上较为破碎,且各抽样单元的总体精度计算结果存在较大偶然性。
图7 黄土高原抽样单元总体精度插值结果空间分布

Fig. 7 Spatial distribution of overall accuracy interpolation results of sampling units in the Loess Plateau

为了进一步说明基于小流域抽样单元和单个栅格抽样单元对区域土地覆盖精度空间差异性的表达能力,本研究在黄土高原区域进行了验证实验:随机抽取85%的抽样单元作为样本集(250个)用于黄土高原总体精度插值,其余15%的抽样单元作为验证样本(44个),用于计算与抽样单元精度插值结果之间的差异,比较基于小流域单元和基于栅格单元两种方法得到的抽样单元精度与插值结果间的RMSE(Root Mean Square Error)。RMSE越小,代表该方法对于精度空间差异性的表达越准确。基于小流域单元得到的RMSE为25.8%,基于栅格单元的RMSE为50.9%。因此,以小流域为抽样单元的方式在较大范围内总体精度平均值虽与以单个栅格为抽样单元的方式基本一致,但能更好地反映分类精度在不同地区的差异。

4.2 FROM-GLC30 2017数据集精度空间分异的地理解释

由各抽样单元总体精度结果的空间分布可知,不同地区的FROM-GLC30 2017数据集精度存在较大差异。其中,西北的中部及北部地区、西南的西部地区、华北的西部地区以及东北地区处抽样单元总体精度较高,多在85%以上。这些地区普遍具有地广人稀的特点,土地覆盖类型单一且大规模、集中连片式分布,多为沙漠、裸地、林区、草地以及农田。这些土地覆盖类型在遥感影像中具有独特的色彩、形状及纹理特征,容易辨别与区分,且在这些区域广泛分布,因此这些地区的总体精度较高(图8(b))。
图8 典型抽样单元处参考数据和FROM-GCL30 2017数据的土地覆盖组成情况

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2016)2921号的标准地图制作,底图无修改。

Fig. 8 Land cover composition of the reference data and the FROM-GLC30 2017 dataset in typical sampling units

总体精度较低的地区(<30%)主要位于华北的中部地区、西北的北部及东南部地区、西南的中部地区以及华南的东部地区。这些地区人群的聚集程度相对较高但城市化水平不高,土地覆盖类型复杂且同种地类的聚集程度不高,不同土地覆盖类型的地块零散分布且各地块面积不大(图8(c)),这些区域的总体精度不高。且已有研究证实这种空间配准误差对精度造成的影响与地类组成的复杂程度有关,土地覆盖类型组成越复杂,在空间上越破碎,其土地覆盖精度往往越低[11]

4.3 不同地类精度差异的解释

7种土地覆盖类型中裸地、森林和农田的精度相对较高,主要原因在于这几种地类在空间分布上常呈现出大规模聚集性,且在遥感影像中具有相对特殊的纹理、色彩,易于识别。已有的中国范围内对FROM-GLC30数据产品的精度评价研究也支持上述结论,有研究表明中国范围内农田的精度较高达到76.23%[19],FROM-GLC30数据产品精度中也指出森林的精度达到80%以上[13]
不透水层的精度相对较低,主要是因为该土地覆盖类型的分布并不集中,尤其是在非城镇地区,当聚集程度较低时,在FROM-GLC30 2017数据集中在很大程度上对其进行了尺度综合,因此精度较低。灌丛在整个研究区所占的面积比例最小,不到总面积的2%,且灌丛的分布较为零散,又常与草地、森林同时存在,这3种土地覆盖类型在影像纹理和光谱特征上也都具有一定的相似性,因此无论是参考数据还是FROM-GLC30 2017数据在解译过程中对灌丛做到准确的区分都较为困难。这一结果与已有研究结果也基本一致[31]
从各个分区不同土地覆盖类型的用户精度与制图精度差异来看,农田、森林由于地理分布上的聚集性以及遥感影像解译中的易于判别性,在不同的分区间都具有相对较高的用户精度与制图精度,且各分区间的差异程度不大。其余的地类中,草地以及裸地的精度在各分区间的差异较大,华北、西北以及西南地区精度相对较高,可能的原因在于:该区域内草地、裸地集中分布且范围广阔,中国最为著名的四大草原、八大沙漠以及四大沙地皆位于该区域内,抽样单元的地类组成情况较为单一且易于判别,因此精度较高。而剩余分区中草地与裸地的分布通常较为分散,精度受制图综合的影响更大。此外,地理环境因子,如坡度、坡向、地形起伏度等,对土地覆盖的分类精度也存在不同程度的影响,这有可能导致同类地物分类精度的空间差异性,这一问题值得在进一步研究中深入探讨。

4.4 尺度效应对参考数据的影响

本研究中为保证参考数据与待评价数据空间尺度上的一致性,将参考数据栅格尺寸由1 m综合到30 m。这一综合过程对参考数据反映真实土地覆盖能力有一定影响。图9以2个小流域抽样单元为例,对1 m以及30 m尺度下的参考数据进行了比较。局部放大图中1 m尺度下的参考数据能表现出的地物信息相对更为详细、连续,随着参考数据尺度变换,在30 m的尺度下部分地物信息丢失,尤其是分布较为零散的地类图斑以及不规则的地类边界受影响程度较大。图9中抽样单元1的水域随尺度变换而变得间断,变换前后水域的面积占比虽未发生明显变化(占比减少了0.01%),但水域所在位置的变化对水域精度结果可能造成一定影响;抽样单元2的森林边界较为复杂,当尺度由1 m变为 30 m时边界形状发生变化,此类复杂边界两侧的地物精度可能也会受到影响。在下一步研究中,应对土地覆盖数据精度受尺度效应的影响机制进行更进一步探讨。
图9 尺度变换对参考数据的影响

注:图中1 m和30 m分别代表参考数据的栅格尺寸为1 m和30 m。

Fig. 9 The influence of scale transformation on reference data

5 结论

本文以米级/亚米级遥感影像为参考数据基础,基于小流域抽样单元,对FROM-GLC30 2017数据集在中国的精度问题进行研究。主要结论如下:
(1)中国范围内FROM-GLC30 2017数据集各土地覆盖类型面积占比与实地情况较为符合,其中草地和裸地的面积比例存在8%左右偏差,其他地类的面积比例与实地差异较小。
(2)研究区范围内FROM-GLC30 2017数据集的总精度为75.39%,总精度在50%以上的抽样单元占了抽样单元总数的79.79%,总精度在80%~100%间的抽样单元占了抽样单元总数的56.62%。总精度在空间呈现较明显的地理规律性,最高和最低的区域分别位于华东地区和华南地区。
(3)裸地、森林和农田的用户精度相对较高,均超过75%,森林、裸地和水域的制图精度相对较高,均在70%以上。灌丛的用户精度和制图精度值均较低。

北京师范大学刘宝元教授及章文波教授、中国科学院水利部水土保持研究所张晓萍研究员、西北农林科技大学常庆瑞教授以及宁夏大学石云教授团队成员参与了参考数据集土地利用解译工作,国家科技基础条件平台-国家地球系统科学数据中心(http://www.geodata.cn)提供了FROM-GLC30 2017数据支撑,在此一并致谢。

[1]
Hailu B T, Fekadu M, Nauss T. Availability of global and national scale land cover products and their accuracy in mountainous areas of Ethiopia: A review[J]. Journal of Applied Remote Sensing, 2018,12(4):041502.

[2]
Liang D, Zuo Y, Huang L, et al. Evaluation of the consistency of MODIS land cover product (MCD12Q1) based on Chinese 30 m GlobeLand30 datasets: A case study in Anhui Province, China[J]. Isprs International Journal of Geo-Information, 2015,4(4):2519-2541.

[3]
Son S, Kim J. Accuracy assessment of global land cover datasets in South Korea[J]. Korean Journal of Remote Sensing, 2018,34(4):601-610.

[4]
Chen J, Cao X, Peng S, et al. Analysis and applications of GlobeLand30: A review[J]. Isprs International Journal of Geo-Information, 2017,6(8):230-246.

[5]
Kim D, Lim C H, Song C, et al. Estimation of future carbon budget with climate change and reforestation scenario in North Korea[J]. Advances in Space Research, 2016,58(6):1002-1016.

[6]
Li S J, Cui Y, Liu M, et al. Integrating global open geo-information for major disaster assessment: A case study of the myanmar flood[J]. Isprs International Journal of Geo-Information, 2017,6(7):201-219.

[7]
Lu X H, Jiang H, Zhang X Y, et al. Relationship between nitrogen deposition and LUCC and its impact on terrestrial ecosystem carbon budgets in China[J]. Science China-Earth Sciences, 2016,59(12):2285-2294.

[8]
Bartholome E, Belward A S. GLC2000: A new approach to global land cover mapping from earth observation data[J]. International Journal of Remote Sensing, 2005,26(9):1959-1977.

[9]
Congalton R G, Gu J Y, Yadav K, et al. Global land cover mapping: A review and uncertainty analysis[J]. Remote Sensing, 2014,6(12):12070-12093.

[10]
Hansen M C, Defries R S, Townshend J R G, et al. Global land cover classification at 1km spatial resolution using a classification tree approach[J]. International Journal of Remote Sensing, 2000,21(6-7):1331-1364.

[11]
Loveland T R, Reed B C, Brown J F, et al. Development of a global land cover characteristics database and IGBP DISCover from 1 km AVHRR data[J]. International Journal of Remote Sensing, 2000,21(6-7):1303-1330.

[12]
Gong P, Wang J, Yu L, et al. Finer resolution observation and monitoring of global land cover: first mapping results with Landsat TM and ETM+ data[J]. International Journal of Remote Sensing, 2013,34(7-8):2607-2654.

[13]
俞乐, 王杰, 李雪草, 等. 基于多源数据集成的多分辨率全球地表覆盖制图[J]. 中国科学:地球科学, 2014,44(8):1646-1660.

[ Yu L, Wang J, Li X C, et al. A multi-resolution global land cover dataset through multisource data aggregation[J]. Science China: Earth Sciences, 2014,57:2317-2329. ]

[14]
Ji L Y, Gong P, Geng X R, et al. Improving the accuracy of the water surface cover type in the 30 m FROM-GLC product[J]. Remote Sensing, 2015,7(10):13507-13527.

[15]
Li C C, Gong P, Wang J, et al. The first all-season sample set for mapping global land cover with Landsat-8 data[J]. Science Bulletin, 2017,62(7):508-515.

[16]
侯婉, 侯西勇. 全球海岸带多源土地利用/覆盖遥感分类产品一致性分析[J]. 地球信息科学学报, 2019,21(7):1061-1073.

[ Hou W, Hou X Y. Consistency of the multiple remote sensing-based land use and land cover classification products in the global coastal zones[J]. Journal of Geo-information Science, 2019,21(7):1061-1073. ]

[17]
Liang L, Gong P. Evaluation of global land cover maps for cropland area estimation in the conterminous United States[J]. International Journal of Digital Earth, 2015,8(2):102-117.

[18]
Yu L, Wang J, Clinton N, et al. FROM-GC: 30 m global cropland extent derived through multisource data integration[J]. International Journal of Digital Earth, 2013,6(6):521-533.

[19]
Lu M, Wu W, Zhang L, et al. A comparative analysis of five global cropland datasets in China[J]. Science China-Earth Sciences, 2016,59(12):2307-2317.

[20]
Chen X Y, Lin Y, Zhang M, et al. Assessment of the cropland classifications in four global land cover datasets: A case study of Shaanxi Province, China[J]. Journal of Integrative Agriculture, 2017,16(2):298-311.

[21]
邹佳楠, 潘广磊, 张德朋, 等. 全球30 m分辨率土地覆被遥感产品精度比较分析[J]. 科技经济导刊, 2019(16):19-21.

[ Zou J N, Pan G L, Zhang D P, et al. Comparison and analysis of the accuracy of land cover remote sensing products with global resolution of 30 m[J]. Technology and Economic Guide, 2019(16):19-21. ]

[22]
Yin S Q, Zhu Z Y, Wang L, et al. Regional soil erosion assessment based on a sample survey and geostatistics[J]. Hydrology and Earth System Sciences, 2018,22(3):1695-1712.

[23]
刘宝元, 郭索彦, 李智广, 等. 中国水力侵蚀抽样调查[J]. 中国水土保持, 2013,34(10):30-38.

[ Liu B Y, Guo S Y, Li Z G, et al. China water erosion survey based on sampling stategy[J]. Soil and Water Conservation in China, 2013,34(10):30-38. ]

[24]
Clark M L, Aide T M, Grau H R, et al. A scalable approach to mapping annual land cover at 250 m using MODIS time series data: A case study in the dry chaco ecoregion of South America[J]. Remote Sensing of Environment, 2010,114(11):2816-2832.

[25]
Friedl M A, Sulla-Menashe D, Tan B, et al. MODIS collection 5 global land cover: Algorithm refinements and characterization of new datasets[J]. Remote Sensing of Environment, 2010,114(1):168-182.

[26]
朱梦阳, 杨勤科, 王春梅, 等. 区域土壤侵蚀遥感抽样调查方法[J]. 水土保持学报, 2019,33(5):64-71.

[ Zhu M Y, Yang Q K, Wang C M, et al. Sampling survey method of regional soil erosion based on remote images[J]. Journal of Soil and Water Conservation, 2019,33(5):64-71. ]

[27]
Foody G M. Status of land cover classification accuracy assessment[J]. Remote Sensing of Environment, 2002,80(1):185-201.

DOI

[28]
Herold M, Mayaux P, Woodcock C E, et al. Some challenges in global land cover mapping: An assessment of agreement and accuracy in existing 1 km datasets[J]. Remote Sensing of Environment, 2008,112(5):2538-2556.

DOI

[29]
Samasse K, Hanan N P, Tappan G, et al. Assessing cropland area in West Africa for agricultural yield analysis[J]. Remote Sensing, 2018,10(11):1785-1803.

DOI

[30]
Wang Y, Zhang J, Liu D, et al. Accuracy assessment of GlobeLand 30 2010 land cover over China based on geographically and categorically stratified validation sample data[J]. Remote Sensing, 2018,10(8):1213-1234.

[31]
Ran Y H, Li X, Lu L. Evaluation of four remote sensing based land cover products over China[J]. International Journal of Remote Sensing, 2010,31(2):391-401.

文章导航

/