地球信息科学理论与方法

GlobeLand 30和自发地理信息的对比分析研究

  • 马京振 , * ,
  • 孙群 ,
  • 徐立 ,
  • 温伯威 ,
  • 李元復
展开
  • 信息工程大学,郑州 450001

作者简介:马京振(1993-),男,博士生,研究方向为多源数据融合与处理。E-mail:

收稿日期: 2018-01-26

  要求修回日期: 2018-06-04

  网络出版日期: 2018-09-25

基金资助

国家自然科学基金项目(41571399)

Comparison Analysis of GlobeLand 30 and Volunteered Geographic Information

  • MA Jingzhen , * ,
  • SUN Qun ,
  • XU Li ,
  • WEN Bowei ,
  • LI Yuanfu
Expand
  • Information Engineering University, Zhengzhou 450001, China
*Corresponding author: MA Jingzhen, E-mail:

Received date: 2018-01-26

  Request revised date: 2018-06-04

  Online published: 2018-09-25

Supported by

National Natural Science Foundation of China, No.41571399.

Copyright

《地球信息科学学报》编辑部 所有

摘要

地表覆盖数据是关于土地利用信息的重要来源,在地理国情监测、生态环境保护等方面发挥着重要的作用,目前遥感影像解译、实地测量是该数据生产的主要手段,但是仍然存在一定的局限性。随着Web2.0、互联网技术以及各种GPS设备的快速发展传播,普通大众也可以参与公众制图,志愿者用户的参与能够有效判定地表类型的空间分布和属性特征,提高地表覆盖制图的分类精度。本文以自发地理信息中最成功的项目OpenStreetMap为例,与中国新研制的全球最高30m分辨率地表覆盖数据产品GlobeLand 30进行对比分析,首先对数据进行相应的预处理和拓扑检查,然后建立两种数据的要素对应关系,最后生成误差矩阵并分析两种数据的一致性。实验结果表明:① OpenStreetMap数据缺失的部分主要是耕地类型,其草地和水体要素比GlobeLand 30更加丰富;② 2种数据的一致性较好为75%左右,其中林地和人造地表的精度较高,耕地和水体次之,草地较差;③ 重点对不一致区域的地表类型进行判断验证,能够发现GlobeLand 30数据中的错误分类,为进一步修改和优化提供依据。本文研究表明,自发地理信息中包含丰富的地表覆盖信息,能够给地表覆盖制图及评价验证带来巨大的发展潜力。

本文引用格式

马京振 , 孙群 , 徐立 , 温伯威 , 李元復 . GlobeLand 30和自发地理信息的对比分析研究[J]. 地球信息科学学报, 2018 , 20(9) : 1225 -1234 . DOI: 10.12082/dqxxkx.2018.180077

Abstract

Land cover data, which plays a significant role in national geographical condition monitoring, ecological environmental protection and some other areas, is an important resource of the information on land use. At present, land cover data is produced mainly through the interpretation of remote sensing imagery and field measurement, and some limitations still exist to a certain extent. With the rapid development and wide spread of Web2.0, internet technology and various kinds of GPS equipment, the general public have the opportunity to participate in crowd sourced mapping. Volunteer users can identify the spatial distribution and attributive characters of the land cover effectively. Therefore, the classification accuracy of land cover map can be improved in the meantime. In this paper, OpenStreetMap, the most successful item of volunteered geographic information, was taken as an example on the comparison analysis with GlobeLand 30, the newly developed land cover data produced in China with 30m resolution. Firstly, the data was preprocessed and topologically checked, and then the feature relationship was established. Finally, a confusion matrix was built to analyze the consistency between the two kinds of data. The experimental results show that the missing part of the OpenStreetMap is mainly cultivated land, and the grassland and water elements are more abundant than those of GlobeLand 30. The consistency of OpenStreetMap and GlobeLand 30 is high with a value of 75%. Forest and artificial surface have the highest accuracy, and cultivated land and water body take the second place, while grassland possesses the worst consistency. The key point is to verify and determine the land cover type within the inconsistent areas, and try to find classification errors of GlobeLand 30 so as to provide basis for further modification and optimization. Volunteered geographic information contains abundant land cover information, so it can provide great potential for the development and evaluation of land cover maps. The research methods and conclusions of this paper can provide basis for exploring the application of OpenStreetMap data for land cover mapping, and provide support for assessment and improvement of the classification accuracy of GlobeLand 30.

1 引言

地表覆盖是指地球表面各种类型的空间分布及其属性特征的综合体,包括地表植被、土壤、冰川、湖泊以及各种建筑物等,侧重于土地的自然属性;土地利用则是人类根据土地的特点,按照一定的社会与经济目的,采取一系列生物和技术手段,对土地进行的长期性或周期性的经营活动,两者对于环境变化研究、地理国情监测和可持续发展规划等具有十分重要的意义[1,2,3]。随着卫星遥感技术的快速发展,国际上已经对全球地表覆盖/土地利用制图展开了研究并研制了相关产品,如美国的UMD、IGBP-DISCover产品,欧洲的GLC2000、GlobCover产品以及中国的GlobeLand 30等[4]。目前,地表覆盖数据产品主要是利用遥感影像分类识别研制而成,但由于地表景观在遥感影像上表现出复杂多样的光谱和纹理特征,同物异谱和异物同谱的现象较为严重,再加上影像数据质量难以保障等问题,导致单纯遥感分类的错分和漏分问题十分突出,容易出现不同要素相互混淆的情况,地表覆盖的分类精度仍需进一步提高[5,6]。因此,寻找一种新的数据来辅助地表覆盖制图并提高其分类精度具有重要的研究意义。
近年来,随着Web 2.0技术的迅速发展,互联网和移动设备的日益普及,自发地理信息(Volunteered Geographic Information, VGI)正逐渐成为地理信息的重要获取手段,VGI数据具有细节丰富、准实时更新、成本低等优点,在多个领域发挥了重要的作用[7,8]。在VGI环境下,志愿者用户可以利用普通GPS终端、开放的高分辨率遥感影像以及个人空间认知的地理知识为参考,对地理信息进行创建、编辑和管理。对于地表覆盖制图来说,志愿者用户的参与可有效判定地表类型的空间分布和属性特征,减少地表分类中的错误,而且VGI在时空上是动态变化的,因此能够给地表覆盖制图及评价验证带来巨大的发展潜力[9]
由于VGI数据的多种优势,目前已有专家学者研究将其应用于地表覆盖制图中,例如Estima等[10]利用带地理标签的Flickr图片为数据源,将其应用到土地利用数据的验证中。OpenStreetMap(简称OSM)作为VGI中最成功的项目,很多专家学者也对其进行了研究,Estima等[11]利用OSM数据中的POI兴趣点和面状要素(如buildings、natural areas等),从中提取地表覆盖信息并与CORINE数据作对比,分析认为2种数据的一致性为75%左右;Arsanjani等[12]以欧洲的大城市为研究对象,将OSM数据与GMESUA数据作对比,分析了OSM数据的完整性和土地利用分类精度;Hagenauer等[13]采用人工神经网络和遗传算法描绘了OSM数据中的城市区域;Fonte等[14]提出了一种自动将OSM数据转为土地利用/地表覆盖地图的方法,取得了较好的效果。以上研究表明自发地理信息数据,尤其是OSM数据中蕴含着丰富的地表覆盖信息,将其应用于地表覆盖数据的生产和评价验证中是完全可行的。
2014年中国国家基础地理信息中心推出了全球最高30 m分辨率的地表覆盖数据产品GlobeLand 30,目前该数据已向国际社会开放共享,并逐渐应用于土地利用与变化、城市扩张、生态多样性等诸多领域,但仍有待进一步的评价和验证。本文旨在研究OSM数据对于地表覆盖制图的应用价值,以及如何利用OSM数据辅助提高地表分类的精度。基于以上分析,本文提出了一种对GlobeLand 30和OSM数据进行对比分析的方法,并对 2种数据的一致性和差异性进行了分析,取得了较好的实验结果。

2 数据源和研究区概况

2.1 GlobeLand 30

GlobeLand 30是由中国国家基础地理信息中心牵头研制的全球首套最高30 m分辨率地表覆盖数据产品,共包含2000年和2010年2期数据,该数据覆盖南北纬80°陆地范围,包括耕地、森林、草地、灌木地、湿地、水体、苔原、人造地表、裸地、冰川和永久积雪等10种地表覆盖类型。该数据以Landsat、ETM+、HJ-1等多光谱影像为主要数据源,采用“像元-对象-知识”(POK)的方法逐类型层次提取研制而成,全球共853幅分幅数据,总体分布如图1所示[2,15]。数据生产方采用二级抽样检验模型,在全球合理布设样本,研究表明GlobeLand 30-2010的总体精度超过80%[16];还有其他一些研究将GlobeLand 30与德国、意大利等地区的权威参考数据进行比较,认为GlobeLand 30具有较高的精度,但还需要进一步评价和验证,而且部分地表覆盖要素的分类精度仍需进一步提高[17,18]
Fig. 1 The global land cover GlobeLand 30 map

图1 全球地表覆盖数据GlobeLand 30分布示意图

2.2 OpenStreetMap

OpenStreetMap是VGI项目中最成功和应用最广泛的一个,该项目于2004年由英国伦敦学院Steve Coast教授发起创立,其目标是创造一个内容自由且能让所有人员参与编辑的世界地图,截止到2017年底,其注册用户已超过300万。OSM数据来源主要包括用户自行上传的GPS轨迹记录数据、用户标注的地名信息数据、商业公司捐赠的矢量空间数据,以及免费获取的遥感影像数据和矢量化的影像数据等。OSM矢量数据模型主要由点、线和关系组成,其中,点定义了空间中点的位置,线定义了线或区域,关系定义了元素间的关系;在属性方面主要以“key”和“value”的标签形式进行标注,而且志愿者可以自由选择他们认为合适的标签[19]。OSM数据中既包含大量的兴趣点和道路等数据,也包含大量与地表覆盖相关的数据,如标签为“land use”、“buildings”、“natural”的实体可以反映地表分类的信息。本文所采用的OSM数据从http://download.geofabrik.de网站下载,数据为矢量shp格式。

2.3 研究区概况

相较于国内地区,欧洲地区的志愿者用户数量更多,OSM数据信息更加丰富,因此本文选取欧洲地区的维也纳和巴塞罗那两座城市作为研究对象。其中维也纳是奥地利首都及最大城市,位于阿尔卑斯山脉北部,多瑙河畔,同时受到温带海洋性气候和温带大陆性气候的影响,属于过渡性气候;巴塞罗那位于伊比利亚半岛东北部,濒临地中海,是西班牙第二大城市,整体处于丘陵地带,属于地中海气候。这两座城市的地表类型较为丰富,包括耕地、森林、人造地表等,GMESUA数据的土地利用分布如图2所示(注:GMESUA数据是由European Environment Agency机构提供的欧洲地区超过10万人口城市的土地利用/地表覆盖产品[12])。
Fig. 2 The land use map

图2 土地利用分布图

3 研究方法

3.1 数据处理流程

由于GlobeLand 30和OSM数据在数据来源、数据格式和分类体系等方面存在诸多差异,因此对两种数据对比分析需要进行相应的数据处理,具体的处理过程如下:①提取OSM数据中与地表覆盖相关的要素并将其合并形成新的数据集;②对合并的数据集进行拓扑检查,对要素重叠等拓扑冲突问题进行处理,得到满足逻辑一致性的数据集;③建立GlobeLand 30与OSM数据的要素对应关系,并对数据进行选取、合并、重分类等处理,得到一一对应的分类要素;④计算误差矩阵,对两种数据的一致性进行分析评价;⑤对栅格数据进行矢量化处理,利用矢量数据空间分析的方法确定两种数据一致和不一致的区域,重点对不一致的区域进行检核验证,进而提高GlobeLand 30的数据精度。本文的实验流程如图3所示。
Fig. 3 The flow chart of experimental data processing

图3 实验数据处理流程图

3.2 一致性和拓扑处理

一致性是指地理实体在几何特征、属性特征和空间关系等方面不存在任何逻辑上的矛盾,通常通过定义拓扑来表达这种内部的逻辑关系[20]。在OSM数据中,由于数据是由不同用户贡献的,不同的志愿者独立进行地理信息的编辑,而且所使用的数据来源、制图方法和空间认知能力等都存在差异,因此导致了OSM数据尺度不一致、不同要素之间互相重叠以及某些区域具有多种属性标签等问题,这种问题在面状要素数据中更为严重,如图4所示。
Fig. 4 Sliver polygons and overlapping polygons of OSM areas

图4 OSM面状要素的破碎和重叠多边形实例图

由于本文主要是对不同类别的地表要素进行研究分析,因此可定义“不同要素类的多边形不能重叠”的拓扑规则,对OSM数据进行拓扑检查,识别出不同要素类的重叠区域,然后根据要素的优先级别(如人造地表要素的优先级高于耕地),消除数据中存在的重叠区域问题,进而得到满足逻辑一致性的数据集,为进一步研究提供数据基础。

3.3 2种数据的要素对应关系

由于GlobeLand 30和OSM数据在分类体系和分类方法上存在较大差异,因此需要建立2种数据之间分类要素的对应关系,为进一步的分析提供基础。GlobeLand 30数据只有10种地表要素类型,OSM数据则包含多种要素类,分类更加精细,而且志愿者用户还可以自由创建地理属性标签,因此这些不同的要素类型中包含着丰富的地表覆盖信息。例如,在OSM数据中有“landuse”要素类,该要素类中不同的属性值可与土地利用/地表覆盖建立直接的对应关系,如“forest”、“residential”分别与森林、人造地表相对应。除此之外,其他的要素类也可以提供地表覆盖的相关信息,如“buildings”要素类、“water”要素类直接与人造地表、水体相对应。因此,根据2种数据中对不同要素类型的定义描述,本文建立2种数据面状要素的对应关系并进行重分类,如表1所示。
Tab. 1 Features corresponding relation of GlobeLand 30 and OSM

表1 GlobeLand 30和OSM的要素对应关系表

OSM GlobeLand 30 重分类
Key(要素类) Key Values(属性值)
amenity arts_center, bank, bar, café, car_rental, cinema, clinic, college, community_centre, courthouse, crematorium, crypt, dentist, embassy, fast_food, ferry_terminal, fire_station, fuel, gym, hospital, internet_cafe 80人造地表 5人造地表
building apartments, house, garage, residential, cathedral, chapel, church, civic, commercial, hangar, hospital, hotel, industrial, kiosk, mosque, office, public, retail, school, shrine, stadium, synagogue, temple, train_station, transportation, warehouse 80人造地表 5人造地表
landuse allotments, farm, farmland, orchard, vineyard 10耕地 1耕地
forest, scrub 20森林,40灌木地 2林地
grass, meadow, flowers, greenfield, plants 30草地 3草地
reservoir, pond 50湿地,60水体 4水体
residential, cemetery, commercial, industrial, military, retail, brownfield, construction, depot, quarry 80人造地表 5人造地表
natural forest, scrub, wood 20森林,40灌木地 2林地
grassland 30草地 3草地
mud, wetland, bay, water, riverbank 50湿地,60水体 4水体
heath, beach, sand, shingle, bare_rock, scree, glacier 70苔原,90裸地,100冰川和永久积雪 6其他
pofw buddhist, christian, christian_catholic, jewish, muslim 80人造地表 5人造地表
traffic dam, fuel, marina, parking, service, weir 80人造地表 5人造地表
water dock, reservoir, river, water, wetland 50湿地,60水体 4水体
本文主要是根据OSM Map Features Wiki Page上的标签及相关的要素类型定义,建立GlobeLand 30与OSM的要素对应关系。但是由于OSM中志愿者可以自由地创建标签,针对特定的研究区域和不同时间的数据,还需要对要素进行具体分析,以防遗漏额外的重要标签。另外,OSM数据中有一些描述模糊的标签,不能确定其对应的地表类型,如“field”、“not_known”等;还有一些标签会与多种地表类型相对应,如“natural_reserve”与耕地、森林、草地等均可对应。这些标签无法与GlobeLand 30中的要素建立明确的对应关系,本文将其舍弃不再进行研究。

3.4 对比分析方法

本文从栅格像元的角度出发,采用空间统计和误差矩阵两种分析方法,依据多种评价指标,对GlobeLand 30和OSM数据进行对比分析,得到两种数据中各分类要素的一致性和差异性。首先分别统计两种数据中不同土地分类的像素数,通过引入误差系数来计算不同分类要素之间的差异:
C = K i - N i max ( K i , N i ) × 100 % (1)
式中:C为误差系数;Ki为GlobeLand 30数据中第i类土地的面积;Ni为OSM数据中第i类土地的面积,计算出的误差系数越小,表明2种数据越接近,反之,表明两者之间的差异较大。
除了空间统计之外,还需要对GlobeLand 30和OSM的一致性进行评价,分析2种数据差异。因此,本文采取误差矩阵的方法进行研究,将GlobeLand 30和OSM数据以像元的方式比较得到误差矩阵,通过总体精度、kappa系数、生产者精度和使用者精度等指标进行计算。其中,总体精度表示所有类型中正确分类面积的比例;使用者精度表示某一类型中正确分类的面积占参考数据中该类型面积的比例;Kappa系数(K)是一个用来评价分类结果的精度和一致性的综合指标,这几种指标的计算公式如式(2)-(5)所示。
OA = i = 1 r n ii N (2)
P A i = n ii n + i (3)
U A i = n ii n i + (4)
K = N i = 1 r n ii - i = 1 r ( n i + n + i ) N 2 - i = 1 r ( n i + n + i ) (5)
此外,Pontius和Millones[21]提出了2个新的评价指标用来评价待评价数据和参考数据之间的不一致性:分布不一致(Allocation Disagreement, AD)和数量不一致(Quantity Disagreement, QD)。其中,分布不一致是指待评价数据与参考数据相比,在空间分布上小于最优匹配的空间类别所占的比例;数量不一致是指与参考数据相比,没有正确分类的类型数量所占的比例,计算公式如式(6)-(7)所示。
AD = i = 1 r 2 × min n + i N - n ii N , n i + N - n ii N 2 × 100 % (6)
QD = i = 1 r n + i N - n i + N 2 × 100 % (7)
式中: N 为总的像元数量; n ii 为正确分类的像元数量; n i + 为GlobeLand 30数据中某一类型的像元数量; n + i 为OSM数据中某一类型的像元数量; r 为分类数量。

4 实验与分析

4.1 空间统计分析

表2是2座城市不同要素数量及误差系数的统计情况,图5是GlobeLand 30和OSM数据不同地表要素的分布情况。经过分析发现,维也纳和巴塞罗那的土地分布主要以耕地、林地和人造地表为主, OSM数据的面积覆盖程度为70%左右,缺失的部分主要是耕地要素。具体要素类型方面,维也纳城市中,耕地和草地的误差系数分别高于60%、80%,林地、水体和人造地表要素的误差系数较低,OSM中的草地和水体要素比GlobeLand 30更加丰富;巴塞罗那城市中, OSM数据中的耕地仅占GlobeLand 30的10%,林地和人造地表的误差系数较低,草地和水体的误差系数较高,但GlobeLand 30中的草地面积更大,而OSM中的水体更加丰富。
Tab. 2 Pixel numbers and error coefficients of features

表2 要素像元数量及误差系数统计表

类型 维也纳 巴塞罗那
OSM GlobeLand 30 误差系数/% OSM GlobeLand 30 误差系数/%
1耕地 2 357 067 6 588 479 64.22 63 678 662 979 90.40
2林地 2 729 166 2 237 169 18.03 1 093 207 1 204 142 9.21
3草地 328 699 39 632 87.94 14 886 39 100 61.93
4水体 358 031 277 560 22.48 18 241 2651 85.47
5人造地表 1 292 383 1 076 367 16.71 616 343 790 409 22.02
6其他 5919 66 98.88 3369 8128 58.55
总数 7 071 265 10 219 273 30.80 1 809 724 2 707 409 33.16
Fig. 5 The land cover map of GlobeLand 30 and OSM

图5 GlobeLand 30和OSM地表覆盖分布图

4.2 不同要素的一致性评价

将GlobeLand 30与OSM数据建立误差矩阵,并计算得到相应的评价指标,具体结果如表3-5所示。其中,维也纳地区的总体精度为72.98%,Kappa系数为0.6043,巴塞罗那地区的总体精度为79.74%,Kappa系数为0.6487,两座城市的分布不一致为8%左右,维也纳地区的数量不一致要高于巴塞罗那地区,分别为18.32%、12.29%。总体来说,GlobeLand 30和OSM数据的一致性较好,林地和人造地表的精度较高,耕地和水体次之,草地和其他类型土地一致性较差。
Tab. 3 The confusion matrix of Vienna

表3 维也纳地区误差矩阵

OpenStreetMap
1耕地 2林地 3草地 4水体 5人造地表 6其他 使用者精度%
GlobeLand 30 1耕地 2 245 656 790 002 194 314 51 202 359 563 4630 61.60
2林地 35 055 1 845 935 98 264 41 782 99 355 483 87.04
3草地 302 2036 1895 4864 27 126 46 5.22
4水体 1720 6038 2708 235 316 7704 299 92.72
5人造地表 67 090 55 563 27 962 18 930 795 999 451 82.40
6其他 17 18 0 31 0 0 0
生产者精度% 95.57 68.38 0.58 66.83 61.72 0
Tab. 4 The confusion matrix of Barcelona

表4 巴塞罗那地区误差矩阵

OpenStreetMap
1耕地 2林地 3草地 4水体 5人造地表 6其他 使用者精度/%
GlobeLand 30 1耕地 52 694 154 054 6123 3901 58 607 754 19.08
2林地 3022 876 764 1259 3799 37 814 1755 94.85
3草地 982 11 976 697 3088 6365 167 2.99
4水体 42 617 9 1378 147 196 57.68
5人造地表 6933 47 673 6783 4935 510 108 486 88.42
6其他 5 2121 12 281 2434 11 0.23
生产者精度/% 82.75 80.20 4.68 7.93 82.88 0.33
Tab. 5 Comparison of assessment indicators between Vienna and Barcelona

表5 维也纳和巴塞罗那的评价指标对比

城市 OA/% AD/% QD/% Kappa系数
维也纳 72.98 8.51 18.32 0.6043
巴塞罗那 79.74 7.96 12.29 0.6487
图6是维也纳和巴塞罗那的生产者精度和使用者精度图,从图中可以看出,维也纳地区中耕地的生产者精度在90%以上,使用者精度为60%,林地、水体和人造地表的生产者精度高于60%,使用者精度均高于80%,草地的精度在10%以下;巴塞罗那地区中耕地的生产者精度高于80%,但使用者精度不足20%,林地和人造地表的2种精度均高于80%,水体的使用者精度为60%,但是生产者精度不足10%,草地的精度也在10%以下。
Fig. 6 The bar chart of producer and user accuracy

图6 生产者精度和使用者精度图

4.3 不一致区域的数据验证

将GlobeLand 30和OSM数据进行矢量化处理,采用矢量数据空间分析的方法,确定两种数据一致和不一致区域的空间分布,如图7所示,绿色区域代表2种数据具有相同的地表覆盖类型,紫色区域代表2种数据的地表覆盖类型不一致,白色为无数据区。总体来说,两种数据的一致性精度较好,不一致的区域主要是零散分布,对比图5中两种数据各地表分类的空间分布,可以判断出具体不一致的要素类型。
Fig. 7 Spatial distribution of agreement and disagreement

图7 GlobeLand 30和OSM数据一致/不一致空间分布

在以上分析的基础上,本文认为:GlobeLand 30与OSM一致的区域,地表分类是正确的;不一致的区域,地表分类则出现了问题。依据该假设,综合利用地表分布相关的遥感、地理等知识,借助遥感影像等辅助数据,重点对不一致区域的地表类型进行验证判断,发现GlobeLand 30数据中的错误分类,为进一步修改和优化提供依据。如图8是OSM水体要素与GlobeLand 30不一致的区域,分析发现GlobeLand 30数据中河流出现了断流的现象,与已有的经验知识不相符合,再经过影像判定,发现该区域的水体分类出现了错误,最后可利用相关的处理软件(如ENVI、EARDAS等),对错分/漏分的地表覆盖类型进行修改,进而提高GlobeLand 30的分类精度。
Fig. 8 The inconsistent water between OSM and GlobeLand 30

图8 OSM面状水体与GlobeLand 30不一致区域

4.4 两种数据的差异性分析

造成GlobeLand 30和OSM数据产生不一致的差异原因主要如下:
(1)2种数据的数据来源、用途不同。在数据来源上,GlobeLand 30由中国国家基础地理信息中心牵头研制,属于官方权威部门生产的专业地表覆盖数据,主要用于全球地表覆盖的空间分布及变化监测等;而OSM则是志愿者用户自发创建、维护和使用的地理空间数据,属于非官方的公众制图,数据生产和使用的门槛较低,强调大众参与和开放共享。
(2)数据分类以及生产方法差异较大。GlobeLand 30主要是利用遥感影像分类识别的方法提取不同的地表覆盖类型,只有固定的10种分类;而OSM则是由志愿者用户利用GPS数据、遥感影像等多源数据,结合自己的空间认知,自发进行创建、编辑和管理,用户也可以自己创建标签,要素非常丰富,分类更加灵活。
(3)数据时相和空间分辨率存在差异。GlobeLand 30只有2000年和2010年2期数据,采用的遥感影像也是对应这两个时间的,属于栅格数据,空间分辨率固定为30 m;OSM更新比较频繁,具有不同历史版本的数据,属于矢量数据,整体上分辨率较高,对各类要素的刻画比较详细,但也会因为不同志愿者用户空间认知的差异而有所不同。例如,对于线状水体要素来说,在GlobeLand 30中很多没有达到30 m分辨率的要求,没有表示出来或者出现断流现象,而在OSM数据中则刻画的比较详细准确。
(4)数据本身存在误差。GlobeLand 30以遥感影像作为数据源,耕地、林地和草地等几种土地类型在遥感影像上具有相似的光谱特征,容易形成同谱异物现象,造成不同土地类型之间的混淆;OSM数据大部分来自于非专业人士,数据质量没有保障,存在信息冗余、精度未知和分布不均等问题,因此OSM数据不可避免存在误差,会对实验产生一定的影响。

5 结论

本文以欧洲地区维也纳和巴塞罗那两座城市为研究区域,以全球地表覆盖数据GlobeLand 30和自发地理信息OpenStreetMap数据为研究对象,在相关数据处理的基础上,通过建立2种数据要素间的对应关系,采用空间统计和误差矩阵两种分析方法,对两种数据的一致性和差异性进行分析。研究结果表明,2种数据的一致性较好,其中林地、人造地表的精度较高,草地的精度较差,OSM数据中的水体要素信息比GlobeLand 30更加丰富。针对2种数据不一致的区域,可借助遥感影像等进行判断验证,发现错误的分类目标并进行改正,进而提高GlobeLand 30的数据精度。
自发地理信息中包含着丰富的地表覆盖信息,而且还具有细节丰富、开放共享、准实时更新等特点,因此将其应用于地表覆盖制图与评价验证中是完全可行的,本文的研究方法和结论可以为探索利用OSM数据进行地表覆盖制图提供依据,能够为辅助判断并提高GlobeLand 30的分类精度提供支持。但本文仅选取了欧洲地区的两座城市,而且只对OSM数据中的面状要素进行了研究,因此在后续的研究中应继续扩大研究范围,并且对点要素和线要素进行研究分析。同时,由于OSM数据不能完全覆盖,还应该将OSM数据与其他多源数据结合起来生成要素种类更丰富、精度更高的地表覆盖/土地利用数据,这也是今后应该重点研究的问题。

The authors have declared that no competing interests exist.

[1]
Pervez M S, Henebry G M.Assessing the impacts of climate and land use and land cover change on the freshwater availability in the Brahmaputra River basin[J]. Journal of Hydrology Regional Studies, 2015,3:285-311.

DOI

[2]
陈军,陈晋,廖安平,等.全球30m地表覆盖遥感制图的总体技术[J].测绘学报,2014,43(6):551-557.lt;p>本文针对全球30米分辨率地表覆盖遥感制图这一世界性难题,提出了以多源影像最优化处理、参考资料服务化整合、覆盖类型精细化提取、产品质量多元化检核为主线的总体研究思路,研发了影像几何与辐射重建、异质异构服务化集成、对象化分层分类、知识化检核处理等主体技术方法;用于制定了相应数据产品规范、生产技术规范,研发了多项生产型软件,用于研制了2000和2010两个基准年的全球)30米地表覆盖数据产品,将空间分辨率提高了1个数量级。</p>

DOI

[ Chen J, Chen J, Liao A P, et al.Concepts and key techniques for 30 m global land cover mapping[J]. Acta Geodaetica et Cartographica Sinica, 2014,43(6):551-557. ]

[3]
陈利军,陈军,廖安平,等. 30 m全球地表覆盖遥感分类方法初探[J].测绘通报,2012(S1):350-353.

[ Chen L J, Chen J, Liao A P, et al.A preliminary study on the method of 30m global land cover classification[J]. Bulletin of Surveying and Mapping, 2012(S1):350-353. ]

[4]
马京振,孙群,肖强,等.河南省GlobeLand 30数据精度评价及对比分析[J].地球信息科学学报,2016,18(11):1563-1572.

[ Ma J Z, Sun Q, Xiao Q, et al.Accuracy assessment and comparative analysis of GlobeLand 30 dataset in Henan province[J]. Journal of Geo-information Science, 2016,18(11):1563-1572. ]

[5]
张委伟,陈军,廖安平,等.顾及多元知识的GlobeLand 30检核优化模型[J].中国科学:地球科学,2016,46(9):1709-1719.

[ Zhang W W, Chen J, Liao A P, et al.Geospatial knowledge-based verification and improvement of GlobeLand 30[J]. Science China: Earth Sciences, 2016,46(9):1709-1719. ]

[6]
廖安平,陈利军,陈军,等.全球陆表水体高分辨率遥感制图[J].中国科学:地球科学,2014,44(8):1634-1645.

[ Liao A P, Chen L J, Chen J, et al.High-resolution remote sensing mapping of global land water[J]. Science China: Earth Sciences, 2014,44(8):1634-1645. ]

[7]
Goodchild M F.Citizens as voluntary sensors: Spatial data infrastructure in the world of web 2.0[J]. International Journal of Spatial Data Infrastructures Research, 2007(2):24-32.

[8]
马超,孙群,陈换新,等.志愿者地理信息中天桥的自动识别方法[J].测绘学报,2017,46(2):246-252.

[ Ma C, Sun Q, Chen H X, et al.The recognition of overpass in volunteered geographic information[J]. Acta Geodaetica et Cartographica Sinica, 2017,46(2):246-252. ]

[9]
Arsanjani J J, Helbich M, Bakillah M, et al.Toward mapping land-use patterns from volunteered geographic information[J]. International Journal of Geographical Information Science, 2013,27(12):2264-2278.A large number of applications have been launched to gather geo-located information from the public. This article introduces an approach toward generating land-use patterns from volunteered geographic information (VGI) without applying remote-sensing techniques and/or engaging official data. Hence, collaboratively collected OpenStreetMap (OSM) data sets are employed to map land-use patterns in Vienna, Austria. Initially the spatial pattern of the landscape was delineated and thereafter the most relevant land type was assigned to each land parcel through a hierarchical GIS-based decision tree approach. To evaluate the proposed approach, the results are compared with the Global Monitoring for Environment and Security Urban Atlas (GMESUA) data. The results are compared in two ways: first, the texture of the resulting land-use patterns is analyzed using texture-variability analysis. Second, the attributes assigned to each land segment are evaluated. The achieved land-use map shows kappa indices of 91, 79, and 76% agreement for location in comparison with the GMESUA data set at three levels of classification. Furthermore, the attributes of the two data sets match at 81, 67, and 65%. The results demonstrate that this approach opens a promising avenue to integrate freely available VGI to map land-use patterns for environmental planning purposes.

DOI

[10]
Estima J, Painho M.Flickr geotagged and publicly available photos: Preliminary study of its adequacy for helping quality control of Corine Land Cover[J]. 2013,7974:205-220.

[11]
Estima J, Painho M.Exploratory analysis of OpenStreetMap for land use classification[C]. ACM Sigspatial International Workshop on Crowdsourced and Volunteered Geographic Information, ACM, 2013:39-46.

[12]
Arsanjani J J, Vaz E.An assessment of a collaborative mapping approach for exploring land use patterns for several European metropolises[J]. International Journal of Applied Earth Observations & Geoinformation, 2015,35:329-337.

[13]
Julian H, Marco H.Mining urban land-use patterns from volunteered geographic information by means of genetic algorithms and artificial neural networks[J]. International Journal of Geographical Information Science, 2012,26(6):963-982.

DOI

[14]
Fonte C, Minghini M, Patriarca J, et al.Generating up-to-date and detailed land use and land cover maps using OpenStreetMap and GlobeLand 30[J]. ISPRS International Journal of Geo-information, 2017,6(4):125-147.

DOI

[15]
马京振,孙群,肖强,等.利用多级弦长拱高复函数进行面实体综合相似性度量研究[J].中国图象图形学报,2017,22(4):551-562.目的全球最高30m分辨率的地表覆盖数据GlobeLand30具有高分辨率、高精度等特性,为全球制图提供了重要的数据来源。如何快速准确地识别GlobeLand30与矢量数据中的同名实体,对于空间数据的更新、集成与融合具有重要的意义,针对当前该数据与矢量数据匹配识别方法存在的不足,本文提出一种新的综合相似性度量方法。方法利用面实体轮廓线的多级弦长、拱高和中心距离等特性,构造多级弦长拱高复函数对其整体和细节特征进行描述;然后对面实体轮廓线进行等间隔重采样,通过快速傅里叶变换得到傅里叶描述子对面实体间的形状相似性进行度量;最后将面实体的位置、大小、方向和形状进行加权综合,得到一种综合相似性度量模型。结果将本文综合相似性度量模型应用到GlobeLand30与矢量数据面状水体的匹配中,实验结果为查准率P为100%,查全率Q为97.1%,匹配速度和准确率优于其他文献所提出的方法,当拱高级数为4时,匹配效果达到最优;最后,将该相似性度量模型应用到GlobeLand30数据化简和光滑前后的相似性度量上,也取得了很好的应用效果。结论本文方法适用于GlobeLand30与矢量数据的相似性度量,对于GlobeLand30与矢量数据的集成与融合,对利用GlobeLand30进行矢量数据的生产与更新具有重要的意义。

[ Ma J Z, Sun Q, Xiao Q, et al.Measurement of the comprehensive similarity of area entities using a multilevel arc-height complex function[J]. Journal of Image and Graphics, 2017,22(4):551-562. ]

[16]
Chen J, Chen J, Liao A, et al.Global land cover mapping at 30 m resolution: A POK-based operational approach[J]. ISPRS Journal of Photogrammetry & Remote Sensing, 2015,103:7-27.Global Land Cover (GLC) information is fundamental for environmental change studies, land resource management, sustainable development, and many other societal benefits. Although GLC data exists at spatial resolutions of 300m and 1000m, a 30m resolution mapping approach is now a feasible option for the next generation of GLC products. Since most significant human impacts on the land system can be captured at this scale, a number of researchers are focusing on such products. This paper reports the operational approach used in such a project, which aims to deliver reliable data products. Over 10,000 Landsat-like satellite images are required to cover the entire Earth at 30m resolution. To derive a GLC map from such a large volume of data necessitates the development of effective, efficient, economic and operational approaches. Automated approaches usually provide higher efficiency and thus more economic solutions, yet existing automated classification has been deemed ineffective because of the low classification accuracy achievable (typically below 65%) at global scale at 30m resolution. As a result, an approach based on the integration of pixel- and object-based methods with knowledge (POK-based) has been developed. To handle the classification process of 10 land cover types, a split-and-merge strategy was employed, i.e. firstly each class identified in a prioritized sequence and then results are merged together. For the identification of each class, a robust integration of pixel-and object-based classification was developed. To improve the quality of the classification results, a knowledge-based interactive verification procedure was developed with the support of web service technology. The performance of the POK-based approach was tested using eight selected areas with differing landscapes from five different continents. An overall classification accuracy of over 80% was achieved. This indicates that the developed POK-based approach is effective and feasible for operational GLC mapping at 30m resolution.

DOI

[17]
Arsanjani J J, See L, Tayyebi A.Assessing the suitability of GlobeLand 30 for mapping land cover in Germany[J]. International Journal of Digital Earth, 2016,9(9):873-891.Global land cover (LC) maps have been widely employed as the base layer for a number of applications including climate change, food security, water quality, biodiversity, change detection, and environmental planning. Due to the importance of LC, there is a pressing need to increase the temporal and spatial resolution of global LC maps. A recent advance in this direction has been the GlobeLand30 dataset derived from Landsat imagery, which has been developed by the National Geomatics Center of China (NGCC). Although overall accuracy is greater than 80%, the NGCC would like help in assessing the accuracy of the product in different regions of the world. To assist in this process, this study compares the GlobeLand30 product with existing public and online datasets, that is, CORINE, Urban Atlas (UA), OpenStreetMap, and ATKIS for Germany in order to assess overall and per class agreement. The results of the analysis reveal high agreement of up to 92% between these datasets and GlobeLand30 but that large disagreements for certain classes are evident, in particular wetlands. However, overall, GlobeLand30 is shown to be a useful product for characterizing LC in Germany, and paves the way for further regional and national validation efforts.

DOI

[18]
Brovelli M, Molinari M, Hussein E, et al.The first comprehensive accuracy assessment of GlobeLand 30 at a national level: methodology and results[J]. Remote Sensing, 2015,7(4):4191-4212.

DOI

[19]
OpenStreetMap Wiki Map Features. Available online: https://www.openstreetmap.org/wiki.

[20]
朱蕊. 多源空间矢量数据一致性处理技术研究[D].郑州:解放军信息工程大学,2012.

[ Zhu R.Research on technology of consistency processing for multi-sources spatial vector data[D]. Zhengzhou: Information Engineering University, 2012. ]

[21]
Pontius Jr R G, Millones M. Death to Kappa: Birth of quantity disagreement and allocation disagreement for accuracy assessment[J]. International Journal of Remote Sensing, 2011,32(15):4407-4429.

DOI

文章导航

/