Application of Water Extraction Methods from Landsat Imagery for Different Environmental Background

  • QIAO Danyu , 1, 2 ,
  • ZHENG Jinhui 3 ,
  • LU Han , 1, 2, * ,
  • DENG Lei 1, 2, 3
Expand
  • 1. College of Resource Environment and Tourism, Capital Normal University, Beijing 100048, China
  • 2. Key Laboratory of 3D Information Acquisition and Application, Ministry of Education, Capital Normal University, Beijing 100048, China
  • 3. College of Geospatial Information Science and Technology, Capital Normal University, Beijing 100048, China
*LU Han, E-mail:

Received date: 2020-06-16

  Request revised date: 2020-10-01

  Online published: 2021-06-25

Supported by

Capacity Building for Sci-Tech Innovation-Fundamental Scientific Research Funds(20530290059)

Copyright

Copyright reserved © 2021

Abstract

Rapid and accurate extraction of water information from satellite images has been a hot issue in remote sensing applications and has important application value in water resources management, water environment monitoring, and disaster emergency management. Although there are a variety of water extraction methods for Landsat series images, the same method can generate different extraction results in different environmental backgrounds due to the influence of environmental background factors such as geographic location, topography, and water body shape. In order to study the applicability of water extraction methods under different environmental conditions, this article focuses on two typical environments: urban areas around Huairou County, Beijing with severe human influence and strong contrast between light and dark images, and non-urban areas around Beijing Miyun Reservoir with obvious topography and small water bodies. Water index method and classification method are tested based on water extraction and accuracy verification using Landsat 5 (2009) and Landsat 8 (2019) satellite images which have slightly different band settings. The water index method includes Normalized Difference Water Index (NDWI) and Modified Normalized Difference Water Index (MNDWI), while the classification method includes Support Vector Machine (SVM) and Maximum Likelihood (ML). Our results show that SVM has the highest accuracy with overall accuracy > 97% in the urban areas. By selecting training samples reasonably and delicately, the extracted spatial pattern of water results is close to the real water distribution. It applies well to multiple-scale and complex water bodies. In the non-urban areas, SVM can completely identify the fine rivers which are usually difficult to be identified by other methods. It is also suitable for judging the shape and flow direction of small rivers between mountains, though the shadow of the mountain could be easily mixed together by mistake. Due to the difference in sensor band settings, SVM has a better performance in Landsat 8 data. MNDWI can effectively reduce the error extraction rate, resulting in an overall accuracy > 95%. It is convenient to determine the threshold value of MNDWI through visual interpretation, which is more suitable for the rapid extraction of water in the non-urban areas. The environmental background may show different effects on water body extraction. The water index method and classification method have different advantages in different environmental backgrounds. The most suitable method should vary according to the actual situation. In scenarios with higher requirements for efficiency, we should focus on the use of index method, and design a new index which can make full use of the band information. In application scenarios where higher extraction accuracy is required, classification methods can improve the accuracy of water extraction. Moreover, we cannot ignore the differences between interpretation methods in data sources from different sensors. This study provides a reference for the selection of water extraction methods under different environmental backgrounds.

Cite this article

QIAO Danyu , ZHENG Jinhui , LU Han , DENG Lei . Application of Water Extraction Methods from Landsat Imagery for Different Environmental Background[J]. Journal of Geo-information Science, 2021 , 23(4) : 710 -722 . DOI: 10.12082/dqxxkx.2021.200312

1 引言

准确、快速提取水体的空间分布信息,对全面了解水体变化规律和演化趋势具有重要意义[1]。以Landsat陆地资源系列卫星为代表的卫星遥感具有宏观、可动态跟踪地表信息变化等优点,能为水体信息提取提供高质量可靠的数据,非常适合于地表水体信息的获取[2],是水资源变化监测、洪涝灾害应急监测等应用的重要手段[3]
基于Landsat卫星影像的地表水体提取方法众多,这些方法大多是根据水体光谱曲线,利用其与植被和土壤等地物的光谱特征差异较大的特点,通过设计水体光谱指数(指数法)[4]或使用影像分类技术(分类法)对水体进行提取。指数法最大的特点是算法简单,通过简单的波段运算和阈值化处理即可快速获得水体的分布范围,如归一化差异水体指数(Normalized Difference Water Index, NDWI)[5]可利用绿光波段和近红外波段做比值运算,抑制植被并突出水体;徐涵秋[6]用短波红外波段替换了NDWI中的近红外波段,构建的改进归一化差异水体指数(Modified Normalized Difference Water Index, MNDWI)极大地提升了水体与建筑物之间的区分度;此类方法也适用于高分系列[7,8]和气象卫星[9]等卫星影像,在大范围水体快速提取中的应用十分广泛[10,11]。分类法可以综合利用影像的光谱和空间等特征,在影像信息利用率方面具有明显优势[10],Sarp[12]采用支持向量机(Support Vector Machine,SVM)分类法对布尔达尔湖的多时相TM影像进行水体提取,效果优于常用的水体指数法;段号然[13]使用最大似然(Maximum Likelihood,ML)分类法提取山东微山湖水域面积,研究了近年来微山湖湖面的动态变化。还有研究将指数法和分类法进行结合,如王瑾杰等[14]提出了改进的阴影水体指数法,与单波段法构建决策树分类器,更好地分离了水体与山体阴影;郑逢斌等[15]利用最大似然分类法和水体指数法,研究了城市背景中水体和阴影的水体光谱特征的区别。近年来学者们利用新的工具和方法,在提取水体算法上进行了积极的探索,如陈前等[16]利用卷积神经网络和Deeplabv 3语义分割神经网络,探讨了深度学习在高分辨率影像中水体提取的应用能力;Chen[17]等针对复杂地区地表水的提取,提出了一种新的精细水体提取神经网络(WBE-NN),取得了良好的综合精度。这些方法能够有效提高水体提取的精度,但大多是针对于复杂或特定场景中的水体提取,算法构造也相对复杂[18]。部分研究考虑了区域和地形等环境差异带来的影响:聂欣然等[19]基于TM影像运用经验型归一化差异指数(Empirical Normalized Difference Water Index, ENDWI)对平原、盆地和高原环境背景下的水体进行提取,发现该方法在多种背景中具有较为明显的优势;毕海芸等[20]比较了3种常用提取方法在平原和山地的优势和不足,认为在实际应用中,应根据区域实际地形条件来选择最合适的水体提取方法Jiang等[21]采用多层感知器神经网络来识别八种典型区域中不同类型地表水的信息;Acharya等[22]评估了机器学习在丘陵、平原地区以及冰雪、阴影覆盖的喜马拉雅山脉地区水体提取性能。
可以发现,环境背景差异的确会对相同的水体提取方法造成影响,不同方法的适用范围也不尽相同。这是因为同种地物的光谱特性会随地理区域的变化发生空间效应[23],并且还会受到周围地物光谱的影响。由于水体对电磁波的吸收效应明显高于绝大多数其他地物,因此在遥感影像上多呈现为暗色调,在城区背景下与非水体地物形成较为鲜明色调对比,而在非城区背景下,山体阴影在影像中呈现出与水体色调相近的暗色调。以人造地物为主的城区作为一种典型的环境背景,具有人造目标多、人为干扰严重、影像明暗对比强烈等特点,与以自然地物为主的非城区具有明显的不同,但目前对于不同提取方法在这2种环境中的适用性研究并不多见;此外,传感器波段设置是指数法和分类法的根本,但此种差异对同种方法性能的影响也鲜见涉及。为此,本文基于波段设置略有差异的Landsat 8和Landsat 5影像,分析了常用的指数法(NDWI和MNDWI)和分类法(ML和SVM)在城区和非城区背景下提取水体时的结果差异及适用性。

2 研究区概况、数据来源及研究方法

2.1 研究区概况

本文选取2个研究区,分别作为城区背景和非城区背景,其分布如图1所示。其中,城区背景研究区位于北京市怀柔区境内(40°15′N—40°20′N,116°33′E—116°40′E),区域内以人造地物的城区为主,区域内以人造地物的城区为主,水体主要包括怀柔水库、怀河、雁栖河和京密引水渠。怀柔水库是南水北调的节点工程,西南部的京密引水渠与水库相连接,水库下游的怀河流经城区并与雁栖湖下游的雁栖河相交汇。除怀柔水库分布有大量水体之外,形状较为规则的线状水体散布于城区各处,且由于人工地物的遮挡等原因,造成水体形状较为细碎,连续性不强。
图1 2019年研究区Landsat OLI假彩色影像

Fig. 1 Landsat OLI false color image of study area in 2019

第2个研究区为非城区背景,位于北京市密云区的密云水库附近(40°26′N—40°41′N,116°43′E—117°7′E)。区域内以山地和水体为主,间或分布有零星的村庄。水体主要包括密云水库、白河和潮河。密云水库坐落在潮、白河中游偏下的位置,系拦蓄白河、潮河之水而成,是北京最大的饮用水源供应地。库区跨越两河,水库下游的白河呈西南走向。

2.2 数据来源

数据源为2009年9月22日的Landsat 5和2019年9月18日的Landsat 8卫星遥感影像(轨道号均为123-32)。2景影像的云量均小于10%,成像质量良好。2颗卫星虽然具有完全一致的轨道参数(重访周期16 d,轨道倾角98.2°,扫幅宽度185 km),但在传感器的波段设置方面略有差异(表1)。
表1 Landsat 5、Landsat 8传感器主要参数(多光谱)

Tab. 1 Main parameters of Landsat 5 and Landsat 8 (multispectral)

Landsat 5 TM Lansat8 OLI 地面分辨率/m
波段 波长范围/μm 波段 波长范围/μm
B1-Blue 0.45~0.52 B1-Costal aerosol 0.43~0.45 30
B2-Green 0.52~0.60 B2-Blue 0.45~0.51 30
B3-Red 0.63~0.69 B3-Green 0.53~0.59 30
B4-NIR 0.76~0.90 B4-Red 0.64~0.67 30
B5-SWIR 1.55~1.75 B5-NIR 0.85~0.88 30
B6-LWIR 10.40~12.5 B6-SWIR1 1.57~1.65 120/30
B7-SWIR 2.08~2.35 B7-SWIR2 2.11~2.29 30
表1可以发现,Landsat 8新增了对水体较为敏感的蓝色波段(B1-Coastal aerosol),且对近红外波段(B5-NIR)做出了调整,相比Landsat 5缩短了波长范围(0.85~0.88 μm),减少了0.825 μm处的水汽吸收特征。对于绿波段(Green)、红波段(Red)以及短波红外(SWIR)来说,Landsat 8的波段范围更窄,这可能会更好的区分地物。

2.3 研究方法

根据Landsat卫星遥感数据的波段设置及水体与其他地物的光谱特征差异,本文选用具有代表性的水体指数法(NDWI和MNDWI)和分类法(ML和SVM)进行水体提取的适用性研究,技术路线如图2所示。
图2 水体提取技术路线

Fig. 2 Flowchart of water extraction

首先对Landsat 8和Landsat 5影像进行辐射校正和几何校正等影像预处理,然后分别利用NDWI和MNDWI指数阈值法、ML分类法和SVM分类法进行水体的提取。通过目视解译和精度评价的方式,对比并分析不同方法在不同地区的优势与不足。
2.3.1 影像预处理
影像预处理包括辐射定标、大气校正、几何校正与裁剪等。辐射定标采用反射率法[24],将亮度灰度值(Digital Number,DN)转为大气表观反射率(Top of Atmosphere Reflectance,TOA Reflectance);大气校正采用FLAASH模型[25],大气模型设置为中纬度夏季,气溶胶模型参数设置为城市;几何校正采用二次多项式,共选取80个GCP(Ground Control Point),投影是WGS-84,重采样方式为Bilinear。最后,从处理结果中裁剪出356像元×344像元的城区和1109像元×983像元的非城区。以上过程在ENVI 5.3中完成。
2.3.2 水体指数法
(1)归一化差异水体指数(NDWI)
NDWI法利用水体在近红外波段强吸收而植被强反射的特点,采用绿波段和近红外波段的比值可以较大程度上抑制植被信息,突出水体。对预处理后的影像进行NDWI运算,计算公式如下:
NDWI = ( Green - NIR ) / Green + NIR
式中:Green为绿光波段反射率;NIR为近红外波段反射率。提取水体边界需要确定阈值,进而对指数影像进行分割,理论上,NDWI提取水体的阈值一般为0,但实际情况中也需根据场景做出适当调整。对本文中使用的Landsat 5统计NDWI影像的像元灰度值,得到的灰度分布图(图3),在城区和非城区两幅影像中,水体像元与周围背景像元的灰度值分布差异较大,有明显波峰且占比例较大的部分为非水体区域,而走势比较平缓且占比例较小的部分为水体区域,通过结合该区域的高分辨率影像等参考影像,经反复实验调整,确定最佳水体分割阈值。本文中Landsat 5城区与非城区的水体分割阈值均为-0.1,二者取≥-0.1为水体;Landsat 8城区与非城区的水体分割阈值均为0,二者取≥0为水体。
图3 Landsat 5城区与非城区NDWI灰度分布

注:-0.1代表水体分割阈值。

Fig. 3 NDWI gray distribution of Landsat 5 urban and non-urban areas

(2)改进的归一化水体指数(MNDWI)
NDWI法在一定程度上能抑制非水体因素的影响,但提取的水体常混淆建筑物和土壤信息。MNDWI利用短波红外替代近红外波段,水体与建筑物指数反差明显增加,可大大改善提取结果,更好突出水体信息,抑制其他背景的影响。对预处理后的影像进行MNDWI运算,计算公式如下:
MNDWI = ( Green - SWIR ) / Green + SWIR
式中:Green为绿光波段反射率;SWIR为短波红外波段反射率。同样的,统计Landsat 5 MNDWI影像的像元灰度值,灰度分布如图4所示,其灰度分布和走势与NDWI相似,经过反复调整,确定最佳阈值。本实验中,Landsat 5城区和非城区阈值均为0,二者取≥0为水体;同理,Landsat 8城区阈值为0.14,取≥0.14为水体,非城区阈值为0,取≥0为水体。
图4 Landsat 5城区与非城区MNDWI灰度分布

注:0代表水体分割阈值。

Fig. 4 MNDWI gray distribution of Landsat 5 urban and non-urban areas

2.3.3 分类法
利用监督分类的方法,将水体从其他地物中提取出来。本研究使用的分类方法包括最大似然法和支持向量机方法。
(1)最大似然分类法(ML)
最大似然分类法是最常用的监督分类法之一,它在地物服从正态分布的假设条件下,根据各类的已知数据,使用基于概率判别函数和贝叶斯判别规则来对影像进行判决,利用遥感数据的统计特征得到分类结果[26]。研究表明,该法对光谱特性呈正态分布的遥感影像能提供较高的分类精度,而对于呈非正态分布或偏离正态分布的光谱特性,该法的实际分类效果稍显逊色[27]
(2)支持向量机(SVM)
支持向量机法是由Vapnik[28]等提出的建立在统计学习VC维理论和结构风险最小准则基础上的一种机器学习的算法,该法在处理分类问题时,其原理是将输入向量通过某种非线性函数关系映射到一个高维空间里,进而求解最最优分类面,实现分类。SVM在应用于IKONOS,QuickBird,SPOT5等遥感影像中水体信息提取时获得了良好的效果[29,30,31]。核函数作为SVM的重要组成部分,解决了计算复杂度大的问题,常用的核函数主要有线性核函数、多项式核函数、Sigmoid核函数和径向基(RBF)核函数,本文选择局部性强[32]、具有较好的泛化推广能力的RBF核函数作为核函数(Gamma系数为0.143,惩罚系数为100,金字塔水平为0,分类可能性阈值为0)进行分类。
在遥感影像分类过程中,样本选取的准确性、典型性将直接影响分类精度[33],因此,本研究遵循样本均匀分布、样本数量满足要求、样本具有代表性、差异性等原则,进行样本选取。研究共选取水体样本1164个(城区224个,非城区940个)。由于环境背景不同,在城区影像中,受周围环境因素等影响,水体的类型较为复杂,因此将水体样本分为纯净水体、含混合像元的水、季节性水体,其中,含混合像元的水体多采样于河流、水库边缘,季节性水体常见于河水的浅滩处,水体常混有明显的泥沙和浮游植物。非水体样本分为植被、植被阴影、建筑用地、裸地和道路;在非城区中,选取纯净水体、含混合像元的水、植被、植被阴影、土石路、建筑用地、裸地和道路作为样本。2个研究区均按6:4的比例划分训练及测试样本,利用除热红外波段和全色波段之外的所有多光谱波段参与ML和SVM分类,然后进行结果类别合并和二值化处理(1代表水体,0代表非水体)。
2.3.4 精度评价
以谷歌地球中的高分辨率影像目视解译的水体边界作为真值,分别将城区背景和非城区背景中得到的二值化结果与其对比生成混淆矩阵[34],计算总体精度(OA)、Kappa系数[35]、错提率和漏提率作为精度评价指标。

3 结果与讨论

3.1 Landsat 8影像水体提取结果

3.1.1 城区结果
对Landsat 8影像城区水体信息提取结果及细节对比如图5所示。
图5 Landsat 8城区水体提取结果及细节对比

注:绿色框代表建筑区A,黄色框代表城区内怀河和雁栖河河道所在的区域B, 代表水体。

Fig. 5 Comparison of water extraction results and details in Landsat 8 urban area

在城区背景的影像中,道路、建筑物等人工地物具有较高的反射率,而由于建筑物阴影的广泛存在,以及城区中的河流包含更多的杂质等原因,造成场景中明暗对比强烈,破碎度较高。因此,需要综合考虑这些因素对水体提取结果精度的影响。由图5可知,虽然4种方法都能提取出水体主要轮廓,但仍存在较为明显的差异,主要体现在城区内的小面积水体(如窄河流)的漏提以及建筑物和建筑物阴影等的误提。2种指数法能够实现大块水体提取,如怀柔水库的大部分,但在建筑物等光谱特性与水体相近的区域混淆现象较为严重,体现为很多零散的“点”; ML法和SVM法总体来说优于指数法,且SVM法提取水体的完整度比ML法高,如仅有SVM法将京密引水渠较为完整的提取出来。
具体来说,对于区域A(图5(b)),ML法能够更好地区分水体和建筑物,而其他3种方法受建筑物及路面等高反射率人造目标的影响,均在不同程度上出现了误提,这在NDWI法中体现的尤为明显,其提取结果中存在大量的错分建筑物;MNDWI法稍微改善了这种情况,但仍有少部分混淆;对于SVM法而言,能准确识别大部分其他方法难以提取的复杂类型水体,但会提出少量的建筑物阴影。
对于区域B(图5(c)),流经城区的河流水环境复杂,漂浮在水体表面的浮游植物带来水体光谱信息的改变,导致水体被漏提,如在怀河上游(水库东南出口处),NDWI方法和MNDWI方法均未能提出水体,而分类法则由于在选择训练样本时得到了先验知识,可以较好地提取水体。另外,受混合像元的影响,河道两侧水体和细窄的河流不易被识别,虽然4种方法提取怀河河道的形状基本无差别,但ML法和SVM法提取结果更加完整,真实体现了河道的宽度。对于雁栖河河道,除SVM法以外,其他3种方法均未能提出雁栖河的支流,河流的连续性相对较差。
3.1.2 非城区结果
图6为非城区水体信息整体提取效果。由图6看出,非城区的结果与城区类似,每种方法基本能提取大面积水体。NDWI提取水体的能力相对较弱,水库边缘提取不够清晰,但该法在非城区明显降低误提水体的情况;其他3种方法在水库的边缘相差不大,SVM法在提取边缘水体的能力相对来说依旧最好,且能提出水库下游的白河,MNDWI效果次之,能提取小部分下游的白河,而ML法对小面积水体的提取效果不佳,虽然仍很好区分水体和非水体,但存在有漏提现象。
图6 Landsat 8非城区水体提取结果及细节对比

注:黄色框代表白河所在的区域A,绿色框代表水库西侧的山体B, 代表水体。

Fig. 6 Comparison of water extraction results and details in Landsat 8 non-urban area

非城区遥感影像中的场景较为简单,多为植被、山体等自然地物,与水体影像的明暗对比相对较弱,山体和茂密的植被阴影是影响水体提取的主要因素。因此,与城区背景的不同之处主要是处理好山体阴影对提取结果的影响。如图6(b),SVM法大致保持了白河的连续性,但伴随出现了山体阴影像元的错分现象,这在山体区域有十分显著的体现,说明SVM法容易受山体和茂密植被阴影等噪声信息干扰。MNDWI法和ML法能显示出零散的水体像元,只能看出部分河道的形状,而NDWI法几乎识别不到细流水体的像元。由图6(c)看出,SVM法虽然能最大程度的提取断流河流的水体,但是不能很好的区分山体阴影,而NDWI法、MNDWI法、ML法在很大程度减少与阴影混淆的情况。
3.1.3 精度评价
表2是4种方法从Landsat 8影像中的城区和非城区提取水体的精度。可以发现,无论是在城区还是非城区,4种方法总体精度由低到高依次均为NDWI法、MNDWI法、ML法和SVM法。
表2 Landsat 8城区与非城区水体提取精度验证表

Tab 2 Accuracy verification of water extraction between urban and non-urban areas in Landsat 8

方法 OA/% 错提率/% 漏提率/% Kappa系数
城区 非城区 城区 非城区 城区 非城区 城区 非城区
NDWI 76.77 90.05 38.62 1.34 32.56 18.67 0.4724 0.8012
MNDWI 88.35 95.06 17.58 1.37 20.93 8.54 0.7237 0.9013
ML 94.09 94.82 1.40 0.87 18.02 9.49 0.8545 0.8966
SVM 97.49 96.82 6.11 4.88 1.74 1.27 0.9419 0.9363
与高分辨率影像中水体提取的结果[7,8]相似,在Landsat影像中分类法的精度比水体指数法的精度要稍高一些。NDWI法的错提率和漏提率最高,这主要是由于将具有相似光谱特征的城区建筑物误提为水体。MNDWI法相比NDWI法对水池等小面积水体提取完整度高,但在城区中,它的错提率较高(17.58%),目视判读和阈值确定有一定的主观性,提取的水体中仍混有少量建筑物信息;在非城区,MNDWI法的精度提高至95.06%,与最高的SVM法(96.82%)精度相差不大,较城区提取精度提高了约7%,这可能是由于非城区茂密植被在短波红外(1.609 μm)波段呈波峰状态,具有的高反射率与在此波段强吸收的水体形成更加强烈的反差,因而相较于城区背景,进一步抑制了非水体信息。ML法在两个地区错提率均为最低,漏提率相对来说较高,在城区,受混合像元的影响而导致小型水体和细小河流信息的丢失;在非城区,该法提取的水体与山体阴影区分较好,但位于水库西南部的白河流域的提取完整度较差。对于SVM法,其在城区提取水体的总体精度和Kappa系数分别为97.49%和0.9419,漏提率为1.74%,表明SVM法能准确识别大部分水体,虽然受少量建筑物阴影影响,但总体来说提取水体最为准确;在非城区,SVM法提取水体漏提的情况较少,能识别细碎的水体,但受地形影响,提取的水体含有山体阴影。
分类法需要选取样本,并且在一定程度上受主观影响;指数阈值法也需进行多次试验,但实施起来比较简单,经过几次试验可以得出不错的效果。 总体来说,在城区,SVM法相比其他方法来说效果更好,适用性更强,该方法对于有限样本的分类表现出更加优越的性能[36],研究使用的城区背景面积相对较小,水体样本量有限,因此SVM法比较适合本文的背景设置;同时,它也对训练样本的选取提高了要求[37],特别是在复杂类型水体中应规范选择样本,对于研究区中的背景,尤其是对于城区背景下的复杂水体样本进行进一步区分,使之参与全分类过程,这在一定程度上提高了训练样本的质量[38],使城区水体样本更具代表性。在非城区,SVM法对于提取山间细小河流的形状和流向提供了参考;MNDWI指数计算及阈值的确定更为简单且便捷,总体精度在95%以上,相比SVM分类法来说效率更高,对于山区水体应急监测的情况下选择MNDWI更合适。

3.2 Landsat 5影像水体提取结果

采用Landsat 5影像加以对比分析。2种传感器用NDWI和ML法提取结果相似,限于篇幅,此处仅显示MNDWI法和SVM法的局部图。
3.2.1 城区结果
根据提取的结果,此处未将河流与建筑区分开展示,而给出包含二者区域的细节,如图7所示。
图7 Landsat 5城区水体提取细节结果对比

注:黑色框代表建筑物及阴影, 代表水体。

Fig. 7 Comparison of detailed results of water extraction in Landsat 5 urban area

与Landsat 8提取效果类似,4种方法在Landsat 5中基本能提出城区大部分水体,但水体与建筑物及阴影混淆的现象好于Landsat 8影像,如MNDWI法很大程度减少了水体与建筑物相混淆的情况,这可能与2种传感器波段设置有关,Landsat 8影像的波宽设置相比Landsat 5影像较窄,中心波长略有不同(Landsat 5:绿波段0.5613 μm;短波红外1.609 μm;Landsat 8绿波段:0.569 μm;短波红外:1.676 μm),由此可能导致了Landsat 8影像上运用MNDWI法更容易错分水体和建筑物。SVM法虽然存在少量建筑物阴影,但整体效果最佳。另外,NDWI法无法兼顾提水的完整度以及区分水和建筑物信息的差异性,ML法对区分水体和非水体更有优势。
3.2.2 非城区结果
选取与Landsat 8非城区相同的两块区域的提取结果,如图8所示。
图8 Landsat 5非城区水体提取细节结果对比

注: 代表水体。

Fig. 8 Comparison of detailed results of water extraction in Landsat 5 non-urban area

非城区中,MNDWI法与Landsat 8影像同样对水体具有良好的区分度。SVM对山间细流提取效果最好,但同样容易错提山体阴影,相比Landsat 8影像更为严重,如图中白河周围及水库西侧的山体区域;另外,由于道路、桥梁与地形起伏的综合影响(图9),SVM法将水库东侧的道路(红框)错提为水体,且错提山体阴影(黑框),而MNDWI法则未出现明显错提,这说明SVM法的错提和过提现象较为严重,由于Landsat 8增添了更多的多光谱波段设置,如蓝色波段(0.43~0.45 μm),且波长范围较窄,这可能在一定程度上影响了基于像元光谱特性的SVM法的提取结果,从而弱化了因地形起伏造成的山体阴影、山间公路对提取结果的影响。NDWI法和ML法在非城区Landsat 8基本无差别,此处不再赘述。
图9 Landsat 5非城区密云水库东侧水体提取结果对比

注:黑色框代表山体阴影,红色框代表道路, 代表水体。

Fig. 9 Comparison of water extraction results from east side of Miyun Reservoir in non-urban area of Landsat 5

3.2.3 精度评价
综合比较Landsat 5影像城区和非城区水体提取精度,如表3所示。由表3可知,4种精度大小顺序与Landsat 8影像提取精度相同。NDWI法在2个地区的总体精度相对最低。SVM在城区中是最准确的方法(OA%:98.21%),河道连续性保持最好;在非城区,SVM法的错提率(7.6%)高于其他3种方法,虽然总体精度有95.79%,但出现了大量的山体阴影,且在两种影像上出现差异:混淆现象相比Landsat 8影像的更加突出,错提率高出约2.7%。MNDWI法在城区的错提率相比Landsat 8降低7.16%,在非城区,其精度达到95%以上,错提率最低(0.17%),白河河道提取连续性一般,但基本能提出河流形状。ML法在城区中的漏提率相比较Landsat 8影像降低了9%左右,总体精度仅略低于SVM法1.44%,另外,该法在Landsat 5中的非城区基本无变化。
表3 Landsat 5城区与非城区水体提取精度验证表

Tab. 3 Accuracy verification of water extraction between urban and non-urban areas in Landsat 5

方法 OA/% 错提率/% 漏提率/% Kappa系数
城区 非城区 城区 非城区 城区 非城区 城区 非城区
NDWI 75.81 90.04 38.92 4.80 40.70 15.19 0.4281 0.8012
MNDWI 89.61 95.06 10.42 0.17 25.00 9.49 0.7447 0.9014
ML 96.77 94.57 1.88 2.68 8.72 8.07 0.9229 0.8916
SVM 98.21 95.79 5.49 7.60 0.00 0.00 0.9586 0.9156
总的来说,在Landsat 5影像上,4种方法在城区与非城区的适用性与Landsat 8影像相似。在城区,SVM法适用于对提水的完整度有较高要求的情况;另外,ML法对水的区分力较强,在城区中也具有一定的适用性,研究发现,当训练样本达到一定数量后,ML法的分类精度趋于稳定[39],非城区的样本较城区更多,ML法的精度略微降低,这可能是由于不同背景和水体样本选择数量或选择标准的差异所导致,以后的研究中可以尝试探索最佳样本数量的选择范围。在非城区,从实验效果来看,即便进行了样本的精细选取,但同时也存在着不确定性,SVM适合非城区中山体细窄水体提取,而对山体阴影的区分并不太理想,而MNDWI由于其便捷性则明显提高水体提取效率,在精度上也有所保证,适合灾害应急监测。

4 结论

本文以研究常用水体提取方法在城区背景和非城区背景中的适用性为目标,分别利用NDWI、MNDWI、ML和SVM4种方法对Landsat 5和Landsat 8卫星遥感影像进行水体提取,对比分析了不同方法在不同环境背景下的优势和不足。研究结果表明:
(1)SVM方法更适合城区背景下的水体提取,在Landsat 8(OA:97.49%)和Landsat 5(OA:98.21%)中均达到了最高的总体精度。这可能是由于在环境复杂的城区,通过合理、精细地选择训练样本,SVM方法对尺度和复杂度均有较好的适应性,因而可以综合利用光谱和空间信息,更准确地提取含有浮游植物的水、季节性出现的浅水滩和城区河道等复杂水体。反观本文使用的2种指数方法,由于指数中只涉及2个波段,无法充分利用丰富的多光谱信息,因而降低了其提取精度。
(2)MNDWI方法更适合非城区背景下的水体提取。在复杂度相对较低的场景中,该方法利用波段间的组合增加水体和非水体的对比差异,在一定程度上能够消除地形起伏的影响,提取的水体基本不受山体阴影的干扰,精度与SVM方法相当(Landsat 8:95.06%;Landsat 5:95.06%)。但需要注意的是,虽然SVM法更善于提取细小河流,但容易错提山体阴影;此外,由于MNDWI计算简单快捷,通过目视检查即可快速确定阈值,因此非常适合在对时效性要求较高的减灾应急等情景下使用。
(3)传感器波段设置的差异对结果的确有影响。在非城区背景中,SVM分类法易错提山体阴影,这在Landsat 5中体现的尤为明显,错提率为7.6%,且与山间公路信息相混淆。而该方法在Landsat 8中效果要稍好(错提率:4.88%),这可能是Landsat 8新增了蓝色波段(0.43~0.45 μm),并且对波长范围进行了调整,相比Landsat 5的波宽较窄,这种波段设置差异在一定程度上弱化了因地形起伏造成的山体阴影、山间公路等噪声信息的干扰。
总之,指数法和分类法在不同环境背景下具有不同的特点,应根据实际情况来选择最合适的方法。此外,由于水体提取的效率和精度难以兼顾,在不同的环境背景和应用场景下应选择更有针对性的方法或算法:在对效率有较高要求的场景下,应着重考虑使用指数法,并设计能够充分利用更多波段信息的新型指数,如Landsat 8新增的蓝色波段等;在更关注提取精度的应用场景下,应更多地使用分类法,通过大量高精度的训练样本和高性能的分类器,提高水体提取的精度。后续将进一步验证不同方法在高分系列卫星及无人机遥感等采用新型传感器、具有更高时空分辨率遥感影像中的适用性。
[1]
Papa F, Prigent C, Rossow W B. Monitoring flood and discharge variations in the Large Siberian Rivers from a multi-satellite technique[J]. Surveys in Geophysics, 2008,29(4-5):297-317.

[2]
Chen Q, Zhang Y, Ekroos A, et al. The role of remote sensing technology in the EU water framework directive (WFD)[J]. Environmental Science & Policy, 2004,7(4):267-276.

[3]
刘桂林, 张落成, 刘剑, 等. 基于Landsat TM影像的水体信息提取[J]. 中国科学院大学学报, 2013,30(5):644-650.

[ Liu G L, Zhang L C, Liu J, et al. Water body information extraction based on Landsat TM remote sensing imagery[J]. Journal of University of Chinese Academy of Sciences, 2013,30(5):644-650. ]

[4]
Jawak S D, Luis A J. A rapid extraction of water body features from Antarctic Coastal Oasis using very high-resolution satellite remote sensing data[J]. Aquatic Procedia, 2015(4):125-132.

[5]
McFEETERS S K. The use of the Normalized Difference Water Index (NDWI) in the delineation of open water features[J]. International Journal of Remote Sensing, 1996,17(7):1425-1432.

[6]
徐涵秋. 利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J]. 遥感学报, 2005,9(5):589-595.

[ Xu H Q. A study on information extraction of water body with the Modified Normalized Difference Water Index (MNDWI)[J]. Journal of Remote Sensing, 2005,9(5):589-595. ]

[7]
段秋亚, 孟令奎, 樊志伟, 等. GF-1卫星影像水体信息提取方法的适用性研究[J]. 国土资源遥感, 2015,27(4):79-84.

[ Duan Q Y, Meng L K, Fan Z W, et al. Applicability of the water information extraction method based on GF-1 image[J]. Remote Sensing for Land and Resource, 2015,27(4):79-84. ]

[8]
龚文峰, 王鹏, 王双宇, 等. 基于GF-2卫星遥感影像的界河水体信息提取方法[J]. 黑龙江大学工程学报, 2018,9(4):1-7.

[ Gong W F, Wang P, Wang S Y, et al. Methods of water body extraction in boundary river based on GF-2 satellite remote sensing image of high resolution[J]. Journal of Engineering of Heilongjiang University, 2018,9(4):1-7. ]

[9]
曹萌萌, 毛克彪, 严毅博, 等. 基于MODIS数据的洞庭湖水体和水华时空变化研究[J]. 中国环境科学, 2019,39(6):2523-2531.

[ Cao M M, Mao K B, Yan Y B, et al. Change of temporal and spatial characteristic of water body and algal bloom area in Dongting Lake based on MODIS data[J]. China Environmental Science, 2019,39(6):2523-2531. ]

[10]
王航, 秦奋. 遥感影像水体提取研究综述[J]. 测绘科学, 2018,43(5):23-32.

[ Wang H, Qin F. Summary of the research on water body extraction and application from remote sensing image[J]. Science of Surveying and Mapping, 2018,43(5):23-32. ]

[11]
Feyisa G L, Meilby H, Fensholt R, et al. Automated Water Extraction Index: A new technique for surface water mapping using Landsat imagery[J]. Remote Sensing of Environment, 2014,140:23-35.

[12]
Sarp G, Ozcelik M. Water body extraction and change detection using time series: A case study of Lake Burdur, Turkey[J]. Journal of Taibah University for Science, 2018,11(3):381-391.

[13]
段号然. 山东微山湖湖面面积时空变化及影响因素[D]. 太原:山西农业大学, 2019.

[ Duan H R. The spatial and temporal Dynamic changes and driving forces in the surface area of Weishan Lake of Shandong province[J]. Taiyuan: Shanxi Agricultural University, 2019. ]

[14]
王瑾杰, 丁建丽, 张成, 等. 基于GF-1卫星影像的改进SWI水体提取方法[J]. 国土资源遥感, 2017,29(1):29-35.

[ Wang J J, Ding J L, Zhang C, et al. Method of water information extraction by improved SWI based on GF-1 satellite image[J]. Remote Sensing for Land and Resources, 2017,29(1):29-35. ]

[15]
郑逢斌, 李坡涛, 韩林果. 基于高分二号影像的城区水体提取方法研究[J]. 河南大学学报(自然科学版), 2020,50(2):213-220.

[ Zheng F B, Li P T, Han L G. Study on urban water extraction based on GF-2 image[J]. Journal of Henan University (Natural Science), 2020,50(2):213-220. ]

[16]
陈前, 郑利娟, 李小娟, 等. 基于深度学习的高分遥感影像水体提取模型研究[J]. 地理与地理信息科学, 2019,35(4):43-49.

[ Chen Q, Zheng L J, Li X J, et al. Water body extraction from high-resolution satellite remote sensing images based on deep learning[J]. Geography and Geo-information Science, 2019,35(4):43-49. ]

[17]
Chen Y, Tang L, Kan Z, et al. A novel Water Body Extraction Neural Network (WBE-NN) for optical high-resolution multispectral imagery[J]. Journal of Hydrology, 2020,588:125092.

[18]
洪亮, 黄雅君, 杨昆, 等. 复杂环境下高分二号遥感影像的城市地表水体提取[J]. 遥感学报, 2019,23(5):871-882.

[ Hong L, Huang Y J, Yang K, et al. Study on urban surface water extraction from heterogeneous environments using GF-2 remotely sensed images[J]. Journal of Remote Sensing, 2019,23(5):871-882. ]

[19]
聂欣然, 刘荣, 余健, 等. 基于不同地形的TM影像水体提取方法比较和分析[J]. 江西科学, 2017,35(3):360-366.

[ Nie X R, Liu R, Yu J, et al. Comparison and analysis of water extraction methods of TM images based on different terrain[J]. Jiangxi Science, 2017,35(3):360-366. ]

[20]
毕海芸, 王思远, 曾江源, 等. 基于TM影像的几种常用水体提取方法的比较和分析[J]. 遥感信息, 2012,27(5):77-82.

[ Bi H Y, Wang S Y, Zeng J Y, et al. Comparison and analysis of several common water extraction methods based on TM image[J]. Remote Sensing Information, 2010,27(5):77-82. ]

[21]
Jiang W, He G, Long T, et al. Multilayer perceptron neural network for surface water extraction in Landsat 8 OLI satellite images[J]. Remote Sensing, 2018,10(5):755.

[22]
Acharya T D, Subedi A, Lee D H. Evaluation of machine learning algorithms for surface water extraction in a Landsat 8 scene of Nepal[J]. Sensors, 2019,19(12):2769.

[23]
许静, 陈兴伟, 陈文惠. 基于波谱特征的水体信息提取方法研究[C]. 福建省第十二届水利水电青年学术交流会, 中国福建福州, 2008:20-27.

[ Xu J, Chen X W, Chen W H. Research on water body information extraction method based on spectrum features[C]. The 12th Water Conservancy and Hydropower Youth Academic Exchange Conference in Fujian Province, Fuzhou, Fujian, China, 2008: 20-27. ]

[24]
陈正超, 张兵, 张浩, 等. 北京一号小卫星绝对辐射定标[C]// 第八届光谱技术与应用研讨会暨交叉学科论坛, 2010: 8-13.

[ Chen Z C, Zhang B, Zhang H, et al. Absolute radiometric calibration of Beijing-1 Microsatellite Sensors[C]// The 8th Imaging Spectroscopy Technology and Application Seminar and Interdisciplinary Forum , 2010: 8-13. ]

[25]
韩杰, 刘小玉, 李慧娜, 等. 基于6S和FLAASH的Landsat8卫星影像大气校正精度对比研究[J]. 许昌学院学报, 2019,38(5):49-53.

[ Han J, Liu X Y, Li H N, et al. Comparison of atmospheric correction accuracy of Landsat8 satellite image based on 6S and FLAASH[J]. Journal of Xuchang University, 2019,38(5):49-53. ]

[26]
Jensen J R. 遥感数字影像处理导论(第3版)[M]. 北京: 科学出版社, 2010.

[ Jensen J R. Introductory digital image processing a remote sensing perspective Third edition[M]. Beijing: Science Press, 2010. ]

[27]
王增林, 朱大明. 基于遥感影像的最大似然分类算法的探讨[J]. 河南科学, 2010,28(11):1458-1461.

[ Wang Z L, Zhu D M. A study of maximum likelihood classification algorithm based on remote sensing image[J]. Henan Science, 2010,28(11):1458-1461. ]

[28]
Vapnik V N. An overview of statistical learning theory[J]. IEEE Trans Neural Netw, 1999,10(5):988-999.

DOI PMID

[29]
Roli F, Fumera G. Support vector machines for remote sensing image classification[A]. Image & Signal Processing for Remote Sensing VI, 2001.

[30]
黄奇瑞. 基于粗糙集理论和SVM分类算法的遥感影像分类[D]. 昆明:昆明理工大学, 2012.

[ Huang Q R. RS image classification based on Rough Sets Theory and SVM Classification algorithm[D]. Kunming: Kunming University of Science and Technology, 2012. ]

[31]
Li M, Zhou X, Wang X, et al. Genetic algorithm optimized SVM in object-based classification of quickbird imagery[A]. IEEE International Conference on Spatial Data Mining & Geographical Knowledge Services, 2011:348-352.

[32]
樊彦丽. 基于多特征的SVM高分辨率遥感影像分类研究[D]. 北京:中国地质大学(北京), 2018.

[ Fan Y L. Study of high spatial resolution remote sensing image classification based on SVM with multi-features[D]. Beijing: China University of Geosciences (Beijing), 2018. ]

[33]
彭中, 阿如旱, 范田芳. 基于决策树分类算法的遥感影像土地利用分类[J]. 阴山学刊(自然科学版), 2018,32(2):99-103.

[ Peng Z, A R H, Fan T F. Land classification of remote sensing image based on decision tree classification algorithm[J]. Yinshan Academic Journal (Natural Science Edition), 2018,32(2):99-103. ]

[34]
王大钊, 王思梦, 黄昌. Sentinel-2和Landsat8影像的四种常用水体指数地表水体提取对比[J]. 国土资源遥感, 2019,31(3):157-165.

[ Wang D Z, Wang S M, Huang C. Comparison of Sentinel-2 imagery with Landsat8 imagery for surface water extraction using four common water indexes[J]. Remote Sensing for Land and Resources, 2019,31(3):157-165. ]

[35]
许文宁, 王鹏新, 韩萍, 等. Kappa系数在干旱预测模型精度评价中的应用——以关中平原的干旱预测为例[J]. 自然灾害学报, 2011,20(6):81-86.

[ Xu W N, Wang P X, Han P, et al. Application of Kappa coefficient to accuracy assessments of drought forecasting model: A case study of Guanzhong Plain[J]. Journal of Natural Disasters, 2011,20(6):81-86. ]

[36]
孙琳, 宋爱红, 高文秀. 基于最大似然法和SVM法的太湖流域HJ-1B影像分类[J]. 测绘地理信息, 2012,37(3):30-33.

[ Sun L, Song A H, Gao W X. Land use/cover classification in Taihu Lake basin with HJ-1B images: Comparing maximum likelihood classification and support vector machine methods[J]. Journal of Geomatics, 2012,37(3):30-33. ]

[37]
王展青, 王传廷, 张富铭, 等. 基于有效候选集的支持向量机样本选择方法[J]. 计算机工程与应用, 2008,44(23):214-216.

[ Wang Z Q, Wang C Y, Zhang F M, et al. Sample selection for support vector machines based on effective candidate set[J]. Computer Engineering and Applications, 2008,44(23):214-216. ]

[38]
潘洪涛, 王轩, 王晓飞. 训练样本对农作物遥感分类的精度影响研究[J]. 红外与激光工程, 2017,46(S1):149-156.

[ Pan H T, Wang X, Wang X F. Study on the effect of training samples on the accuracy of crop remote sensing classification[J]. Infrared and Laser Engineering, 2017,46(S1):149-156. ]

[39]
吴振彪, 沈德才, 黄练忠, 等. 训练样本数量对最大似然监督分类精度影响的研究[J]. 林业勘查设计, 2018(2):115-117.

[ Wu Z B, Shen D C, Huang L Z, et al. Study on the effect of the number of training samples on the accuracy of maximum likelihood supervision classification[J]. Forest Investigation Design, 2018(2):115-117. ]

Outlines

/