Orginal Article

Water Information Extraction of Baiyangdian Wet Land Based on the Collaborative Computing Method

  • SHEN Zhanfeng , 1, * ,
  • LI Junli 2 ,
  • YU Xinju 1
Expand
  • 1. Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100101, China
  • 2. Xinjiang Institute of Ecology and Geography, Chinese Academy of Sciences, Urumqi 830020, China
*Corresponding author: SHEN Zhanfeng, E-mail:

Received date: 2015-12-15

  Request revised date: 2016-02-22

  Online published: 2016-05-10

Copyright

《地球信息科学学报》编辑部 所有

Abstract

Baiyangdian wetland is one of the very few remaining wetlands in north China, which has the functions of improving the ecological environment, maintaining the conservation of biological diversity and so on. It has the very prominent significance to researches that are focusing on the wetland changes in this area, because these researches can provide an important information support under the assistance of remote sensing to investigate the change of landscape pattern and conduct the environmental analysis. Remote sensing big data has become a trend for the development of remote sensing technology. Based on the characteristics of remote sensing big data, this paper analyzes the big data extraction technology, which is a critical part in the remote sensing applications. In addition, starting with the calculation of remote sensing information, this paper summarizes various collaborative computing problems encountered during the process of remote sensing big data calculation. Considering the application requirements of wetland water body extraction and change analysis over a long time period in Baiyangdian, this paper proposes a method based on the collaborative computing technology to extract the water body in Baiyangdian. The method firstly computes the initial NDWI threshold in its histogram and finds the possible lakes within the region, and then it computes the suitable GNDWI for every lake to implement the precise lake extraction one by one. And at last, several typical types of collaborative computing problems are analyzed in this procedure. According to the water extraction result from our analysis on a period between 1973 and 2015, we study the historical water area changes of Baiyangdian, and the results show that the water area in this region has experienced a “decrease-increase-another decrease-another increase” changing pattern.

Cite this article

SHEN Zhanfeng , LI Junli , YU Xinju . Water Information Extraction of Baiyangdian Wet Land Based on the Collaborative Computing Method[J]. Journal of Geo-information Science, 2016 , 18(5) : 690 -698 . DOI: 10.3724/SP.J.1047.2016.00690

1 引言

随着遥感对地观测技术的发展,多源、多角度、多分辨率的传感器已构成了空天地一体化对地观测网络[1-2],使遥感数据按TB级增长并形成遥感科学中的“大数据”[3-5]。遥感大数据的主要特点是数据获取速度快、更新周期短、时效性强,以及数据量呈指数级增长[6-8]。与之相比,遥感大数据处理及获取有效信息的能力较弱,使大量的数据堆积并造成“数据灾难”[9-10]。如何对这些数据资源进行有效的信息挖掘,发现隐藏在遥感大数据背后的各种信息与知识,是遥感大数据计算及信息提取的主要任务。遥感信息提取是从一种或多种遥感影像中提取出用户所需信息的过程,是遥感影像数据的“信息深加工”过程。面向多种形式的遥感应用需求,需从不同的遥感影像中提取用户关注的多种形式的信息。未来遥感将朝后端的有效信息加工方向发展,因此,从众多的遥感大数据中挖掘出更多用户关心的、更精准的信息将是遥感信息提取与计算的一个重要发展方向。
在遥感信息协同计算过程中,不仅要有效地利用遥感影像提供的“图谱”信息,还要根据实际情况辅助一些其他的影像、先验知识等信息。在计算机领域,协同计算主要是指在计算机网络技术、通讯技术、多媒体技术和群件技术共同构成的计算环境中,使不同地域、不同时间、不同文化背景的人们能协调一致地为某项任务而共同工作;在遥感信息计算过程中,协同计算主要是指多种遥感数据、信息、特征、知识,以及计算过程中用到的算法、计算资源、计算方式等资源的协同,可更好、更快地解决遥感信息提取任务。通过多数据、知识及计算资源的协同计算,能提高遥感信息提取的精度与效率,以便更好地实现遥感信息挖掘及应用服务。
白洋淀湿地是华北平原仅存的为数极少的湖泊型湿地之一,具有改善生态环境、调节局部地区气候、补充地下水、保护生物多样性及蓄水灌溉等功能[11]。近几十年来,在人类活动和自然环境的综合作用下,白洋淀地区水量显著减少,湿地功能退却,出现水量不足、湿地面积萎缩等现象[12]。通过遥感手段回溯白洋淀几十年来的湿地变化情况,可为探索其景观格局变化、生态环境分析、环境退化原因等提供定量化的数据支撑,具有重要的现实意义。近年来,虽然越来越多的学者开始关注白洋淀地区的生态环境,并结合一定的资料对白洋淀的景观格局动态变化进行了研究[12-13],但这些研究时间大多只针对历史时期的3-5期数据进行分析,时间节点间隔较大,且缺少其精度介绍及详尽的时序分析,无法得知几十年来白洋淀详细的景观格局变化特征。因此,在分析遥感大数据信息提取过程所面临问题的基础上,本文对1973-2015年43期遥感影像数据采用协同计算方法对该研究区域的水体专题信息进行提取,制定了有效地解决大数据量信息快速提取的技术路线,并对信息提取与计算过程中的多种协同计算问题进行了剖析。

2 基于协同计算的水体提取方法

2.1 信息提取与协同计算

遥感大数据已经成为当前遥感领域发展的一项共识与趋势。由于时时刻刻都伴随有新数据更新,使得遥感应用、特别是一些较综合的遥感应用需要的数据量大及数据类型多。因此,如何对遥感大数据中的多态时空数据进行高效的分布式组织与管理、根据应用需求进行快速地智能检索[14],以及选择适当的数据模型进行分析计算和可视化等,都是目前遥感大数据应用亟需解决的问题。本文将重点讨论其在信息提取过程中的数据协同计算问题。
遥感影像信息提取是遥感信息反演的另一种说法[15],但其主要强调对从遥感影像中提取用户感兴趣的有效信息的计算,更偏重于遥感应用,其目的是通过影像的计算机解译实现用户关注信息的判别。由于遥感大数据的数据类型多,需要信息提取算法能够综合集成多种数据源并挖掘出隐藏在数据背后的价值,故采用基于多种数据、方法、知识的协同计算来实现这一过程。遥感影像分类是一种重要的信息提取过程,可通过监督分类或非监督分类方法实现计算机辅助遥感影像地表类型的判别,分类成果广泛应用于国土、农林、城建、水利、规划等部门[16-17]。根据其实现过程的不同,可分为像元级分类及对象级分类。其中,对象级分类由于综合考虑了区域斑块的光谱、纹理、形状等信息,以及同其他周边地物的空间配置关系,故能较好地避免影像分类过程中的椒盐效应,被更多地应用到中、高分辨率遥感影像的分类。专题信息提取是另一种重要的遥感信息提取方法,区别于影像分类方法,其一般仅提取用户感兴趣的一种专题信息而忽略其他地物信息,这就要求该类信息提取的精度及自动化程度高(一般为全自动算法),如冰川、湖泊、城市不透水面等专题信息提取,以及本文讨论的水体专题信息提取算法。
在遥感信息提取过程中,需综合多种数据源、多种方法及多种计算资源等,来实现信息提取与计算过程的协同计算,这些协同计算过程主要包括:
(1)图谱协同计算。遥感影像提供的图信息和谱信息是最重要的2种信息,是实现信息提取过程的重要依据。其中,图信息(空间信息)是指研究单元(像元、地块及图斑)的形状信息,以及同其他周边单元的空间关系与配置方式,是对象级影像分析中的一种重要信息。谱信息包括波谱(光谱、波段信息)、时间谱、地物属性谱、知识谱等同一单元在不同维度上的表现形式,如某一单元在多(高)光谱表现及长时相变化信息等。实现图谱信息的有效协同,综合判断地物单元及其变化规律,能综合影像所提供的多种信息并提高信息提取的精度及准确率。
(2)多分辨率协同计算,又称多尺度协同计算,是图谱协同在“图协同”上的表现形式。多分辨率协同能够增加信息提取的精准度,很多应用中需要综合考虑低、中、高分辨率卫星,以实现多数据源、多分辨率数据的协同计算[18]。高分辨率遥感影像能够提供更精准的图信息,中、低分辨率遥感影像可以提供更丰富的谱信息,而且能够快速地对专题信息进行整体控制。
(3)多时相数据协同计算,是图谱协同在“谱协同”上的一种表现形式。很多信息提取的任务需要综合多期遥感影像数据进行综合分析(如变化检测等),形成多时相数据的协同计算。成功的案例包括根据更新的影像进行城市违章建筑的提取,以及综合多时相数据进行冬小麦、多季稻的精确提取等[19]
(4)多知识协同计算。知识的融入能提高遥感信息提取的精度及效率。在进行影像信息提取过程中,需要一些先验知识的辅助,通过多种知识的协同辅助提高信息提取的精度。同时,地物在空间上的配置关系、因果关系、推演关系等知识模型的加入也会提高识别精度或降低其他干扰信息。
(5)多算法协同计算。不同算法针对同一数据可能会得到不同的信息提取结果,而综合多种算法可在一定程度上提高成果的可靠性。例如,采用多种分类器协同实现区域地物分类、采用多种指数(RVI、NDVI、SAVI、DVI)进行地物协同判别、综合像元级与对象级的地物分类分析方法等[15]
(6)多计算资源协同计算。综合应用计算机提供的计算资源能够提高信息提取与计算的效率。例如,协同应用计算机的CPU/GPU计算资源[14,20]、协同应用其多核计算能力,以及计算机领域发展的高性能集群计算/分布式计算/网格计算/云计算等计算模式,将多种计算资源协同起来共同完成一些大型计算任务。

2.2 基于协同计算的水体提取技术路线

水体信息在遥感影像上表现比较单一,是各种遥感影像信息提取中相对简单的一种,但通过计算机自动实现精确的水体提取却并不容易,这是因为水体在不同影像、不同成像时间、不同地点及不同传感器上表现出的特征并不相同。首先,水体在影像上没有特定的光谱特征,这是由影像成像条件、水体水质及污染物含量(如浑浊度、悬浮物、冰冻、植被)等多种因素造成;其次,水体在影像上也表现出不定的纹理信息,无法采用固定的纹理衡量模式或规则将水体同其他非水体进行有效区分;最后,水体在影像上也没有固定的形状特征,无法采用形状模板限制规则等方式实现水体提取。实际应用中,通常采用2种方法进行水体提取:(1)监督分类方法。这种方法不但能识别出影像中的水体,还能识别出其他地类,但这种方法需要事先选择各种类别样本,故不适合本文的应用。(2)专题信息提取方法。通过影像本身的特征建立规则并进行水体提取,本文采用该方法来实现白洋淀地区水体提取。
对于水体提取来说,一种有效的方式是采用波段组合的方式来最大化地区分影像中的水体与非水体。由于水体的反射光谱特征比较明显,而且在空间分布上表现为强的连续性和均质性,为利用遥感手段快速、准确地获取水体分布提供了可能[21]。类似于植被指数的原理,水体指数能够增加水体与非水体的可区分度。本文采用的水体指数包括归一化水体指数NDWI[22](式(1))及高斯归一化水体指数GNDWI[23](式(2))。
NDW I i , j = ρ G i , j - ρ NI R i , j ρ G i , j + ρ NI R i , j (1)
GNDW I i , j = NDW I i , j - NDWI ¯ σ (2)
式中: NDW I i , j 为研究单元 ( i , j ) 处(像元或对象)的归一化水体指数; ρ G i , j 为研究单元 ( i , j ) 处在绿波段上的光谱表现; ρ NI R i , j 为研究单元 ( i , j ) 处在近红外波段上的光谱表现; GNDW I i , j ( i , j ) 处的高斯归一化水体指数; NDWI ¯ 为影像所有研究单元的 NDWI 均值; σ 为影像所有研究单元的 NDWI 标准差。
本文采用了2种水体指数计算方法,主要是因为NDWI具有较好的全局水体特征,易于从整体上进行区分,而GNDWI更善于把握局部水体的细节信息,特别是对河流等细小水体的局部精确化提取有更高的准确性。尽管采用水体指数法提取影像中的水体原理较简单,但采用计算机自动实现影像中的水体提取必须解决2个重要问题:(1)最优阈值的选择问题(同采用NDVI法提取植被类似);(2)解决影像中其他地类的干扰问题。因此,本文采用“全局-局部”的专题信息提取的技术路线(图1)。
Fig. 1 Water extraction method for the Baiyangdian region

图1 白洋淀地区水体提取技术路线图

在多光谱影像数据经过一些基本的预处理(辐射纠正、正射纠正及多期影像间配准)之后,需要逐景计算影像数据的水体指数NDWI,再根据该景影像的直方图特征计算全局的水体初始分割阈值T0,根据该阈值即可初步分离出影像中的水体区域,并形成一系列的水体对象。在此过程中,需要由一系列的先验知识来辅助实现其他干扰信息的去除,相应的先验知识可以是该地区现有或往期的水体分布数据,以及相应的DEM数据基础上计算出的地形坡度、坡向、晕渲图、汇水区域等[24-26]。这些先验知识的融入不仅可有效地去除影像中因为山体、植被或建筑物产生的阴影(其水体指数同水体的水体指数接近),而且可在汇水分析的基础上制定规则并查找出可能漏掉的水体区域。在全局分割的基础上,进一步对提取出的各水体单元及可能漏掉的水体区域进行分析,此时采用高斯归一化水体指数GNDWI进行局部分析,从而提高局部边界的精确化。局部分析的方法是根据该单元的空间分布向外进行等面积缓冲区,再根据水体同非水体直方图双峰规则进一步修正水体区域及对应的水体指数,直到该水体指数 T 及水体面积 A 趋于稳定为止(前后2次的面积差 A i - A i - 1 小于预设的阈值 ε 1 ,并且水体指数差 T i - T i - 1 小于阈值 ε 2 ),完成该单元的迭代过程。重复该区域的所有单元的迭代修正过程并完成该影像数据的水体提取。
图1所示的白洋淀地区水体提取技术路线可分为2个主要步骤:步骤①示意了全局分割的过程,为影像图谱分析中的由谱聚图过程;步骤②为水体边界的修正过程,通过水体指数计算与迭代实现局部水体的边界逼近过程,对应图谱分析中的图谱协同过程。图1所示的技术路线几乎囊括了本文2.1节中列出的所有协同计算过程。首先,图1中需要对影像中的所有像元的NDWI值进行计算,然后在直方图阈值分割的基础上进行水体与非水体的类别归并,形成一系列全局分割的水体对象,这一过程实际上是通过像元的谱计算形成水体“特征图”。同样,在步骤②中根据相应的谱特征来对相应的特征图的类别进行判断,以决定其是否为水体对象,整个过程均属于上述2.1节所述的图谱协同计算过程。本文实例综合应用了1973-2015年的MSS、TM、ETM+、OLI等影像,在预处理实现影像配准的基础上,实现了2.1节影像间多分辨率协同计算及多时相数据协同计算。而且,在影像水体指数阈值确定的同时,还辅助其他多种知识,包括该区域的水体分布矢量图(现在或历史时期均可)、由DEM汇流分析形成的水体可能区域、由DEM生成的坡度、坡向及其晕渲等,对应了2.1节的多知识协同计算过程。本文的知识协同对于白洋淀地区水体提取的精确化过程起非常重要的作用,通过多种知识的辅助与限制,提高了水体提取的精度与计算效率。另外,在计算水体指数过程中,本文在计算全局指数时采用归一化水体指数,在局部水体分析时采用高斯归一化水体指数,以实现局部区域的细小水体的精确化提取,这一过程对应了上述2.1节所述的多算法协同计算。最后,为提高水体提取的效率,本文算法可以部署在基于Cluster模式的集群计算,由主计算机负责任务的收发,从属计算机负责算法部署与执行,算法采用进程方式启动。同时,算法内部再采用多进程(也可采用多线程)并行计算的方式来有效利用计算机的多核计算资源,各进程间的任务队列根据各节点的计算状态实时更新,从而较大程度地提高数据处理与计算的效率,形成2.1节所述的多计算资源的协同计算。

3 白洋淀湿地时序水体提取实例

3.1 时序数据源

本文选择美国地球资源卫星Landsat自1973-2015年的各种传感器数据,作为白洋淀地区湿地的水体面积遥感监测的数据源。首先,选择每年影像中4-10期质量较好的影像数据(共223景),再根据各景影像的质量状况,从中选取了数据质量较好的1973-2015年3-5月覆盖研究区的卫星影像43景,共计43期(表1)。其中,MSS影像12景,TM影像24景,ETM+影像4景,OLI影像3景。
Tab. 1 Data used for water extraction and their acquisition time

表1 白洋淀地区水体提取数据应用一览表

时间 传感器 轨道号 时间 传感器 轨道号 时间 传感器 轨道号
1973-12-08 MSS P132R033 1988-12-25 TM P123R033 2003-04-15 TM P123R033
1974-03-27 MSS P133R033 1989-02-11 TM P123R033 2004-04-01 TM P123R033
1975-03-12 MSS P132R033 1990-07-16 TM P123R033 2005-03-19 TM P123R033
1976-11-14 MSS P133R033 1991-04-30 TM P123R033 2006-04-07 TM P123R033
1977-03-02 MSS P133R033 1992-04-16 TM P123R033 2007-04-10 TM P123R033
1978-01-19 MSS P132R033 1993-03-02 TM P123R033 2008-04-04 ETM+ P123R033
1979-04-15 MSS P133R033 1994-02-01 TM P123R033 2009-03-14 TM P123R033
1980-11-10 MSS P132R033 1995-04-25 TM P123R033 2010-03-25 ETM+ P123R033
1981-02-26 MSS P132R033 1996-04-27 TM P123R033 2011-04-13 ETM+ P123R033
1982-04-08 MSS P133R033 1997-03-29 TM P123R033 2012-05-17 ETM+ P123R033
1983-04-16 MSS P123R033 1998-04-17 TM P123R033 2013-05-12 OLI P123R033
1984-05-12 TM P123R033 1999-03-03 TM P123R033 2014-05-15 OLI P123R033
1985-05-07 MSS P123R033 2000-04-23 TM P123R033 2015-05-18 OLI P123R033
1986-03-31 TM P123R033 2001-03-08 TM P123R033
1987-07-08 TM P123R033 2002-03-27 TM P123R033
根据2.2节所述的技术路线,本文对白洋淀地区1973-2015年湿地水体进行了提取。图2为几个重要时间拐点时期的水体提取结果及其面积变化示意图,其中,背景为表1中对应数据的近红、红、绿3个波段的伪彩色合成影像,绿色边界为采用本文算法实现的水体提取结果。
Fig. 2 Water extraction result during several important periods for the Baiyangdian region

图2 白洋淀地区几个重要时期的水体面积提取结果

图2可看出,不同时期影像的色调、质量均不相同。本文算法能够自适应地实现遥感影像中水体指数阈值的选择,并在此基础上实现水体边界的精确提取,如对1989年的薄云及2012年的ETM+的鲁棒性均较好。由于白洋淀地区的水体面积变化较大,即使是同一年内的不同时期,水体面积变化仍可能较大。图3为研究区在1978年内几个不同时期的水体提取面积变化图。
Fig. 3 Area change plot of different periods in 1978 using the proposed algorithm

图3 本文算法在1978年不同时期影像的提取面积曲线图

图3可看出,白洋淀地区的水体面积年度变化仍然比较剧烈,这主要是因为白洋淀地区湿地水体深度不大,水量的变化很容易造成水体面积的变化,再加上农业用地等的影响,导致夏季影像中提取的水体面积较少,因此本文主要选取3月左右的影像进行长时间序列对比分析。图3中的橙色曲线为采用目视解译的方法进行的水体面积解译,在本文中作为对比真值;绿色曲线为无知识参与下实现的水体提取结果,蓝色曲线为本文算法(知识辅助)实现的水体结果的面积统计。可以看出,本文中的多知识协同下的水体提取结果更接近于水体的真值,这是因为图中绿色曲线中由于没有DEM及先验知识的辅助,结果中混入了一些山体阴影及云影,从而导致统计的水体面积增加,而这些山体阴影的水体指数同实际水体的水体指数接近,单纯通过直方图阈值法很难将它们有效地区分。另外,尽管本文在目视解译过程尽可能地接近水体的真实边界,但在放大情况下可看出,人工目视解译的边界较本文算法提取的边界还是粗糙很多,而且其效率也远比不上计算机自动实现水体提取的计算效率。

3.2 白洋淀湿地水体变化分析

为提高水体面积提取的精度,表1列出了图4采用的每年1期的影像数据,但实际提取中每年采用的影像数据均为多景,即选择每年的3-5月的影像数据,从而更加接近水体的真实面积并反映历史时期的水体变化情况。对选择出的每年1期的影像进行水体提取并形成白洋淀地区43年来的水体面积变化曲线图,如图4所示。如果需要估算各时期的水量及变化,可以在此基础上采用林皓波提出的回归模型[18]进行水量估算。
Fig. 4 Area change plot of water in the Baiyangdian region in the past 43 years

图4 白洋淀地区43年来水体面积变化曲线

图4可看出白洋淀地区水体的几个重要拐点(从图3也可直观地得到此结论),在1978年湿地面积达到一个极大值后面积开始萎缩,直到1986年整个白洋淀地区湿地面积缩至最小,并到1989年迅速恢复到最大,之后湿地面积开始逐步缓慢变小,直到最近几年才有所缓解。1973-2015年,纯水体的变化趋势为“减少-增加-再减少-再增加”的变化过程,这与张敏等[19]的研究结果基本一致,同时也与其得出的景观格局的趋势相吻合。导致其剧烈的原因包括地下水变化、人类活动及地表降雨等原因[20]

4 结论

本文在分析遥感大数据特点的基础上,针对遥感大数据中的信息提取与数据计算任务,对其中涉及的协同计算模式进行探讨。结合白洋淀地区长时相遥感湿地监测与变化分析的应用实例,本文给出基于归一化水体指数及高斯归一化水体指数相结合的湿地水体提取的技术路线,并在先验知识辅助下,通过全局-局部的专题信息提取方法实现了白洋淀地区的湿地水体精确提取。在信息提取与计算方面,综合应用了图谱协同计算、多分辨率协同计算、多时相数据协同计算、多知识协同计算、多算法协同计算,以及多计算资源协同计算等协同计算模式,从而提高了水体信息提取的精度与效率。
通过计算白洋淀地区1973-2015年湿地水体面积及其变化可知,该地区1986年水体面积最小,1989年最大。其水体面积自1973年以来变化剧烈,先后经历了“减少-增加-再减少-再增加”的变化过程,相应的变化趋势同景观格局的变化趋势一致,而导致水体面积剧烈变化的原因包括地下水变化、人类活动及地表降雨等原因。下一步将在本文研究的基础上,加大历史时期的影像使用密度,并结合历史时期的气候、降雨等资料进行白洋淀湿地更细粒度的面积及水量分析。

The authors have declared that no competing interests exist.

[1]
杨海平,沈占锋,骆剑承,等.海量遥感数据的高性能地学计算应用与发展分析[J].地球信息科学学报. 2013,15(1):128-136.航空及航天遥感器的快速发展,使得多源、多时空分辨率的遥感数据成TB级增长,对海量遥感数据的高性能计算与处理提出了更高的要求。据此,当前的遥感应用已经吸收了新型硬件架构计算、集群计算和分布式计算等高性能计算领域的最新技术。本文针对高性能计算处理海量遥感数据的效率问题,分别从分布式并行遥感文件系统和高性能遥感地学计算模式两个方面来论述该问题的研究进展;在此基础上,列举了当前具有代表性的集群和分布式遥感计算平台/系统,并结合具体实验工作,详细阐述了遥感高性能计算平台gDos-IPM(Geospatial Data Operation System-Image Processing Machine)的设计思路;最后总结了高性能遥感地学计算的发展趋势。

DOI

[ Yang H P, Shen Z F, Luo J C, et al.Recent developments in high performance geocomputation for massive remote sensing data[J]. Journal of Geo-Informaiton Sciences, 2013,15(1):128-136. ]

[2]
李德仁. 论空天地一体化对地观测网络[J].地球信息科学学报,2012,14(4):419-425.空天地一体化对地观测网不仅是最具发展前途的高新技术领域之一,也是保障国家安全、经济社会发展的重要基础设施。本文首先全面论述了对地观测网研究的主要理论问题、关键技术、发展现状和趋势;然后,介绍了国产卫星遥感数据的一体化综合快速处理技术,在此基础上论述了广义空间信息网格的概念和内涵;最后指出,需以提供快速、精确和实时的空间信息服务为目标,加快开展对地观测网的理论与技术研究,推进数字地球走向智慧地球的转变。

DOI

[ Li D R.On space-air-ground integrated earth observation network[J]. Journal of Geo-Informaiton Sciences, 2012,14(4):419-425. ]

[3]
李德仁,张良培,夏桂松.遥感大数据自动分析与数据挖掘[J].测绘学报,2014,43(12):1211-1216.成像方式的多样化以及遥感数据获取能力的增强,导致遥感数据的多元化和海量化,这意味着遥感大数据时代已经来临.然而,现有的遥感影像分析和海量数据处理技术难以满足当前遥感大数据应用的要求.发展适用于遥感大数据的自动分析和信息挖掘理论与技术,是目前国际遥感科学技术的前沿领域之一.本文围绕遥感大数据自动分析和数据挖掘等关键问题,深入调查和分析了国内外的研究现状和进展,指出了在遥感大数据自动分析和数据挖掘的科学难题和未来发展方向.

DOI

[ Li D R, Zhang L P, Xia G S.Automatic analysis and mining of remote sensing bigdata[J]. Acta Geodaetica et Cartographica Sinica, 2014,43(12):1211-1216. ]

[4]
郭华东,王力哲,陈方,等.科学大数据与数字地球[J].科学通报,2014,59(12):1047-1054.<p>大数据研究正发展为科技、经济、社会等各领域的关注焦点,诸多国家已将大数据研究上升至国家战略层面. 本文从时空角度论述了大数据的缘起、内涵与发展势态,分析了科学大数据成为科学研究新途径的历程&mdash;&mdash;科学范式开始从模型驱动向数据驱动发生转变. 给出了科学大数据的定义及科学大数据计算的应对策略. 进一步地论述了数字地球学科的基本理论框架和数字地球中的数据系统,指出了数字地球学科具有大数据的鲜明特点. 最后以&ldquo;胡焕庸线&rdquo;形成机理的空间认知研究为例,具体阐述了数字地球学科中的大数据研究的理论和方法.</p>

DOI

[ Guo H D, Wang L Z, Chen F, et al.Scientific big data and digital Earth[J]. Chinese Science Bulletin (Chinese Version), 2014,59(12):1047-1054. ]

[5]
Tian W, Zhao Y.Big data technologies and cloud computing[J]. Optimized Cloud Resource Management and Scheduling, 2015,7:17-49.

[6]
谢榕,刘亚文,李翔翔.大数据环境下卫星对地观测数据集成系统的关键技术[J].地球科学进展,2015,30(8):855-862.<p>建立卫星对地观测数据集成系统是遥感卫星数据信息资源有效管理与应用的重要手段。从我国对地观测重大需求以及前沿科学问题入手,提出大数据环境下卫星对地观测数据集成系统建立中亟待解决的关键技术,包括大容量异构对地观测数据集成的语义技术、基于网格的遥感图像快速处理技术、遥感大数据深度分析技术、多数据中心协同处理及云平台技术,为实现集成卫星图像、地面观测数据和模拟模型的元数据管理、几何精度纠正和卫星数据质量评价、海量卫星图像数据的空间分析与知识发现、分布式高性能卫星图像数据管理和归档等基本功能,为解决海量卫星数据分布式存储与计算、数据集成与互操作、空间数据分析与地学知识发现提供新思路、新技术与新方法。</p>

DOI

[ Xie R, Liu Y W, Li X X.Key technologies of Earth observation satellite data integration system under big data environment[J]. Advances in Earth Science, 2015,30(8):855-862. ]

[7]
Ma Y, Wu H, Wang L, et al.Remote sensing big data computing: challenges and opportunities[J]. Future Generation Computer Systems, 2015,51:47-60.As we have entered an era of high resolution earth observation, the RS data are undergoing an explosive growth. The proliferation of data also give rise to the increasing complexity of RS data, like the diversity and higher dimensionality characteristic of the data. RS data are regarded as RS “Big Data”. Fortunately, we are witness the coming technological leapfrogging. In this paper, we give a brief overview on the Big Data and data-intensive problems, including the analysis of RS Big Data, Big Data challenges, current techniques and works for processing RS Big Data.

DOI

[8]
Wang P, Wang J, Chen Y, et al.Rapid processing of remote sensing images based on cloud computing[J]. Future Generation Computer Systems, 2013,29(8):1963-1968.The rapid processing of remote sensing (RS) images is essential in many large-scale real-time monitoring, such as meteorological monitoring and natural disaster warning. However, the computation cost of RS is often expensive, traditional RS processing methods cannot satisfy the time requirement of dynamic monitoring. Fortunately, cloud computing not only provides an effective service for data management, but also offers a convenient way to execute RS computing, It is necessary to integrate the rapid RS processing services in a unified cloud computing architecture. The architecture can provide users with integrated rapid RS image processing service through effective huge data management and distributed parallel processing. This paper explores rapid processing methods and strategies for RS images based on cloud computing. In order to compare with other computing paradigms, we choose the maximum likelihood classification (MLC) as our experimental algorithm and Mahalanobis distance clustering (MDC) as our verifying algorithm to execute comparing. In these experiments, we compare the computation cost of RS processing in three computing paradigms (stand-alone, MPI, and MapReduce). From the intensive experimental results, we find that the RS processing based on cloud computing performs best from the aspects of programming convenience, data management and computational efficiency simultaneously, especially when processing huge amount of data. (C) 2013 Elsevier B.V. All rights reserved.

DOI

[9]
何国金,王力哲,马艳,等.对地观测大数据处理:挑战与思考[J].科学通报,2015(60):470-478.通过航天航空飞行器搭载的传感器对地球进行观测可以获得地球全面而系统的信息.随着空间信息技术的高速发展,对地观测领域步入了大数据时代.在分析对地观测数据处理与服务的全流程及其算法的基础上,总结出“大数据时代”对地观测数据处理面临的挑战——“数据密集型计算”问题,并指出解决这一问题应该在系统平台、处理算法和服务模式3个方面开展创新性的研究工作.

DOI

[ He G J, Wang L Z, Ma Y, et al.Processing of earth observation big data: challenges and countermeasures[J]. Chinese Science Bulletin, 2015,60:470-478. ]

[10]
Assunção M, Calheiros R, Bianchi S, et al. Big data computing and clouds: Trends and future directions[J]. Journal of Parallel and Distributed Computing, 2015,79-80:3-15.

[11]
林皓波,吴新玲,刘菲,等.白洋淀湿地资源的遥感监测[J].中南林业科技大学学报,2012,32(4):127-130.白洋淀是华北地区最大的湿地生态系统,但近年来其生态环境遭到了严重破坏。利用1979年至2011年的12期Landsat MSS/TM/ETM+、CBERS CCD遥感影像对白洋淀湿地分布的现状及历史状况进行了监测,研究了湿地面积与水位的关系,并以景观生态学的方法定量分析了白洋淀湿地的退化过程。研究结果显示,1989年以来白洋淀湿地呈萎缩趋势,湿地破碎化程度逐步加深,生态环境遭破坏情况加剧。

DOI

[ Lin H B, Wu X L, Liu F, et al.Wetland resources monitoring for Baiyangdian lake by remote sensing technology[J]. Journal of Central South University of Forestry & Technology, 2012,32(4):127-130. ]

[12]
张敏,宫兆宁,赵文吉,等.近30年来白洋淀湿地景观格局变化及其驱动机制[J].生态学报,2016,36(15):1-5.

[ Zhang M, Gong Z N, Zhao W J, et al.Landscape pattern change and the driving forces in Baiyangdian wetland from 1984 to 2014[J]. Acta Ecologica Sinica, 2016,36(15):1-5. ]

[13]
庄长伟,欧阳志云,徐卫华,等.近33年朱学景观动态变化[J].生态学报,2011,31(3):839-848.湿地具有重要的生态功能,由于各种因素的影响改变了湿地水文条件,并且导致湿地退化。利用1974、1987、1996和2007年遥感影像,使用ERDAS 9.1、ARCGIS 9.2和FRAGSTATS 3.3,分析了白洋淀景观动态变化过程及其驱动力。研究结果表明:从1974至2007年,白洋淀湿地面积从249.4km<sup>2</sup>下降到182.6km<sup>2</sup>农田和居民地面积分别从70.0、2.1km<sup>2</sup>增加到126.4、12.5km<sup>2</sup>;在景观水平上,斑块密度、景观形状指数和香农多样性指数增加,蔓延度减小,景观破碎化程度增加,优势景观类型湿地对整个景观的控制作用减小;在类型水平上,明水面和沼泽的斑块密度和周长-面积分维数增加,最大斑块指数、平均斑块面积和连接度减小,居民地的斑块密度、最大斑块指数、平均斑块面积、周长-面积分维数和连接度都增加,农田的斑块密度、最大斑块指数和连接度增加,平均斑块面积和周长-面积分维数减小;水位变化是影响白洋淀景观变化的主要因素,水位升高会使湿地面积增加,反之,使湿地面积减小;流域人类活动和降水量变化是白洋淀水位和景观变化的重要驱动力。引水补淀只能暂时缓解白洋淀缺水问题,从流域角度考虑,实施有效的水资源管理方式,才能从根本上解决白洋淀湿地退化的问题。

[ Zhuang C W, Ouyang Z Y, Xu W H, et al.Landscape dynamics of Baiyangdian Lake from 1974 to 2007[J]. Acta Ecologica Sinica, 2011,31(3):839-848. ]

[14]
王强. 异构环境下的航空遥感影像协同存储及处理关键技术研究[D].武汉:武汉大学,2011.

[ Wang Q.The research on key technology of aviation remote sensing images cooperative storage and processing under heterogeneous environment[D]. Wuhan: WuHan University, 2011. ]

[15]
李渊,李云梅,吕恒,等.基于数据同化的太湖叶绿素多模型协同反演[J].环境科学,2014,35(9):3389-3396.

[ Li Y, Li Y M, Lv H, et al.Muti-model collaborative retrieval of chlorophyll a in Taihu Lake based on data assimilation[J]. Environmental Sciences, 2014,35(9):3389-3396. ]

[16]
Ma Y, Wang L, Liu P, et al.Towards building a data-intensive index for big data computing-A case study of remote sensing data processing[J]. Information Sciences, 2015,319(20):171-188.

[17]
李士进,陶剑,万定生,等.多分类器实例协同训练遥感图像检索[J].遥感学报,2010,14(3):493-506.提出一种基于多分类器协同训练的遥感图像检索方法,该方法在不同特征集上分别建立分类器,利用不同分类器的协同性自动标记未知样本,从而有效解决了小样本问题.通过与相关反馈方法进行实验比较分析,结果表明,这两种方法各有优劣,检索结果基本相当,然而多分类器协同训练方法避免了相关反馈过程中人工的多次反馈,自动化程度更高.

[ Li S J, Tao J, Wan D S, et al.Content-based remote sensing image retrieval using co-training of multiple classifiers[J]. Journal of Remote Sensing, 2010,14(3):493-506. ]

[18]
赵静,李静,柳钦火,等.联合HJ-1/CCD和Landsat 8 /OLI数据反演黑河中游叶面积指数[J].遥感学报,2015,19(5):733-749.

[ Zhao J, Li J, Liu Q H, et al.Leaf area index inversion combining with HJ-1 /CCD and Landsat 8 /OLI data in the middle reach of the Heihe River basin[J]. Journal of Remote Sensing, 2015,19(5):733-749. ]

[19]
都伟冰,李均力,包安明,等.高山冰川多时相多角度遥感信息提取方法[J].测绘学报,2015,44(1):59-66.<p>提出一种多角度遥感影像的冰川信息提取方法.通过&quot;全域&mdash;局部&quot;的阈值分割方法获取短时期内不同时相的遥感影像的冰雪边界,结合地形信息和多时相遥感影像的太阳角度信息,联合消除山体阴影对冰川的遮挡,并以多期影像的最小冰雪边界作为最佳冰川边界.以托木尔峰西侧冰川为研究对象,采用2009&mdash;2010年4个时相的遥感影像提取冰川信息.结果表明多角度遥感提取的冰川边界效果好,能有效地排除积雪与山体阴影的干扰.</p>

DOI

[ Du W B, Li J L, Bao A M, et al.Information extraction method of alpine glaciers with multi-temporal and multi-angle remote sensing[J]. Acta Geodaetica et Cartographica Sinica, 2015,44(1):59-66. ]

[20]
方留杨,王密,李德仁.CPU和GPU协同处理的光学卫星遥感影像正射校正方法[J].测绘学报,2013,42(5):668-675.本文系统地探讨了基于CPU和GPU协同处理的光学卫星遥感影像正射校正方法。首先使用“层次性分块”策略设计了基于CPU和GPU协同处理的正射校正方法,然后通过配置选择优化和存储层次性访问等手段进一步提高了方法执行效率。在Tesla M2050 GPU上对资源三号卫星下视全色影像进行正射校正的实验结果表明,本文方法大幅提高了光学卫星遥感影像正射校正效率,与传统串行正射校正算法相比,加速比最高达到110倍以上,相应的处理时间压缩至5s以内,可满足对大数据量光学卫星遥感影像进行快速正射校正的要求。

[ Fang L Y, Wang M, Li D R.A CPU-GPU co-processing orthographic rectification approach for optical satellite imagery[J]. Acta Geodaetica et Cartographica Sinica, 2013,42(5):668-675. ]

[21]
朱长明,骆剑承,沈占锋,等. DEM辅助下的河道细小线性水体自适应迭代提取[J].测绘学报,2013,42(2):277-283.提出一种河道细小线性水体自动 识别方法。首先,利用全球30 m ASTER DEM数据,生成流域的水系分布矢量图;然后,以DEM水系分布图作为先验知识,通过空间分析形成信息提取目标区,为后续信息提取提供目标靶区;再次,通 过水体光谱指数计算和NDWI全局阈值分割,得到靶区水体分布的初步信息;最后,在水体指数全域分割的基础上,通过局部水体指数物理特征分析、自适应阈值 选择和迭代计算,实现局部河道水体精确提取。试验采用ETM+数据对伊犁河上游的支流河道进行信息提取,结果表明,该方法能够快速准确地完成大流域范围内 的河道水系制图,并能够最大限度地降低细小河道水体识别中背景光谱信息混杂的干扰,提高遥感信息提取的针对性和计算的效率。

[ Zhu C M, Luo J C, Shen Z F, et al.River linear water adaptive auto-extraction on remote sensing image aided by DEM[J]. Acta Geodaetica et Cartographica Sinica, 2013,42(2):277-283. ]

[22]
Mcfeeters S.The use of Normalized Difference WaterIndex (NDWI) in the delineation of open water features[J]. International Journal of Remote Sensing, 1996,17(7):1425-1432.

[23]
沈占锋,夏列钢,李均力,等.采用高斯归一化水体指数实现遥感影像河流的精确提取[J].中国图象图形学报,2013,18(4):421-428.河流精确提取在水资源调查、利用、变化检测及大型水利设施建设评估等方面具有非常重要的意义。通常的河流信息提取方法受影像中云、冰雪、山体阴影、大型湖泊等的干扰较大,大范围的适用性有限。以Landsat卫星遥感数据为数据源,在归一化差异水指数(NDWI)计算的基础上,首次提出采用高斯归一化水体指数(GNDWI)提取河流水体的模型,使得指数能够更大程度上保证河流提取的连续性,并通过DEM的辅助实现了其他干扰信息的去除。通过对伊犁河试验区河流信息提取的实验结果表明,该方法除了能够实现对复杂多样的河流水体信息进行自动提取外,还可有效去除阴影等信息的混淆,并能够达到较高的河流提取精度。

DOI

[ Shen Z F, Xia L G, Li J L, et al.Automatic and high-precision extraction of rivers from remotely sensed images with Gaussian normalized water index[J]. Journal of Image and Graphics, 2013,18(4):421-428. ]

[24]
李均力,盛永伟,骆剑承,等.青藏高原内陆湖泊变化的遥感制图[J].湖泊科学,2011,23(3):311-320.青藏高原上的内陆湖泊群是气候变化的敏感指示器,获取近几十年来湖泊变化的动态信息对研究区域气候及环境变化具有重要的意义.本文讨论了多时相遥感湖泊变化研究中的几个关键问题--湖泊变化季节性因素、湖泊变化信息的提取以及大区域湖泊变化的分析方法,并利用Landsat长时间序列遥感数据,制作青藏高原1970s,1990s,2000s和2009年四个时段的湖泊分布图及其湖泊变化图,分析三十多年来内陆封闭流域内湖泊变化的时空特征,研究结果表明,Landsat MSS/TM/ETM+多时相数据在对0.1km2 以上湖泊进行变化分析时能取得较好的结果.湖泊在一年之内最稳定的时段为9-12月,其最大湖泊面积变化率不超过2%.从湖泊变化的时间过程来看,湖泊总面积在1970s-1990s呈萎缩趋势,在1990s-2009年剧烈扩张,1970s-2009年全时段湖泊总面积增长27.3%.从空间分布来看,湖泊变化具有明显的区域分布特性,藏北羌墉高原区湖泊出现先萎缩后扩张的变化,色林错及周边区域湖泊处于持续扩张的状态.而冈底斯山北麓的高山深谷湖泊则在近三十多年来保持相对稳定的状态.

[ Li J L, Sheng Y W, Luo J C, et al.Remotely sensed mapping of inland lake area changes in the Tibetan Plateau[J]. Journal of Lake Sciences, 2011,23(3):311-320. ]

[25]
吴田军,骆剑承,夏列钢,等.迁移学习支持下的遥感影像对象级分类样本自动选择方法[J].测绘学报,2014,43(9):908-916.lt;p>面向遥感大范围应用的目标,自动化程度仍是遥感影像分类面临的重要问题,样本的人工选择难以适应当前土地覆盖信息自动化提取的实际应用需求。为了构建一套基于先验知识的遥感影像全自动分类流程,本文将空间信息挖掘技术引入到遥感信息提取过程中,提出了一种面向遥感影像对象级分类的样本自动选择方法。该方法通过变化检测将不变地物标示在新的目标影像上,并将过去解译的地物类别知识迁移至新的影像上,建立新的特征与地物关系,从而完成历史专题数据辅助下目标影像的自动化的对象级分类。实验结果表明,在已有历史专题层的图斑知识指导下,该方法能有效地自动选择适用于新影像分类的可靠样本,获得较好的信息提取效果,提高了对象级分类的效率。</p>

DOI

[ Wu T J, Luo J C, Xia L G, et al.An automatic sample collection method for object-oriented classification of remotely sensed imageries based on transfer learning[J]. Acta Geodaetica et Cartographica Sinica, 2014,43(9):908-916. ]

[26]
O’Callaghan J F, Mark D M. The extraction of drainage networks from digital elevation data[J]. Computer Vision Graphics and Image Processing, 1984,28:323-344.The extraction of drainage networks from digital elevation data is important for quantitative studies in geomorphology and hydrology. A method is presented for extracting drainage networks from gridded elevation data. The method handles artificial pits introduced by data collection systems and extracts only the major drainage paths. Its performance appears to be consistent with the visual interpretation of drainage patterns from elevation contours.

DOI

Outlines

/