遥感科学与应用技术

基于深度卷积网络和分水岭分割的耕地地块识别方法

  • 朱昱 , 1, 2 ,
  • 潘耀忠 , 1, 2, * ,
  • 张杜娟 1, 2
展开
  • 1.北京师范大学地理科学学部,北京 100875
  • 2.北京师范大学遥感科学国家重点实验室,北京 100875
*潘耀忠(1965— ),男,内蒙古呼和浩特人,博士,教授,主要从事农业遥感等方面研究。E-mail:

朱昱(1998— ),男,浙江衢州人,硕士生,主要从事农业遥感研究。E-mail:

收稿日期: 2022-06-27

  修回日期: 2022-07-29

  网络出版日期: 2023-02-25

基金资助

国家自然科学基金项目(42192581)

An Agriculture Parcel Identification Method based on Convolutional Neural Network and Watershed Segmentation

  • ZHU Yu , 1, 2 ,
  • PAN Yaozhong , 1, 2, * ,
  • ZHANG Dujuan 1, 2
Expand
  • 1. Faculty of Geographical Science, Beijing Normal University, Beijing 100875, China
  • 2. State Key Laboratory of Remote Sensing Science, Beijing Normal University, Beijing 100875, China
*PAN Yaozhong, E-mail:

Received date: 2022-06-27

  Revised date: 2022-07-29

  Online published: 2023-02-25

Supported by

National Natural Science Foundation of China(42192581)

摘要

耕地地块作为精准农业的重要支撑,现有地块边界大多依靠人工勾绘。随着遥感技术的发展,基于遥感影像自动提取耕地地块成为研究主要方向,其中基于深度学习的方法能够克服传统检测方法难以适应复杂场景的局限而被广泛使用,但现有检测方法仍存在问题,基于深度卷积模型直接识别耕地区域会丢失内部边界、而基于边缘检测模型识别耕地边界时则会同时得到大量无关边界;此外,现有的基于阈值提取地块的策略所提取的地块不够规整,存在内陷的问题。针对上述问题,本研究提出一种基于深度卷积网络和分水岭分割的耕地地块提取方法,从信息检测和地块提取两方面进行改进:① 将耕地边界视作一种地物类别,在深度卷积网络中进行类别概率检测,帮助实现对耕地边界的语义识别。② 基于改进后的D-LinknetXt网络进行检测,其网络架构适合于对耕地边界这类线性目标的提取,同时更换原始D-Linknet网络的残差单元,帮助提高了网络的特征提取能力。③ 基于分水岭分割对耕地地块进行提取,利用了区域分割方法获取边界的封闭性,并且这种以区域为单元进行分割并合并的方式,解决了原有方法在像元尺度上基于阈值提取所遇到的提取地块存在内陷的问题,使地块更规整准确。在一景高分二号影像上进行检验,并设计两类精度指标,从全局边界精度和地块几何精度两方面进行方法性能评估。实验结果表明,本方法的精度优于3种对比方法,在代表边界精度的F1分数上达到了0.933,地块几何精度为0.829。本研究所提出的方法能够更加准确的对耕地地块进行提取,并适用于实际应用中。

本文引用格式

朱昱 , 潘耀忠 , 张杜娟 . 基于深度卷积网络和分水岭分割的耕地地块识别方法[J]. 地球信息科学学报, 2022 , 24(12) : 2389 -2403 . DOI: 10.12082/dqxxkx.2022.220447

Abstract

As an important support for precision agriculture, the acquisition of agricultural parcels mostly relies on extensive manual delineation. With the development of remote sensing technology, automatic extraction of cropland parcels based on remote sensing images has become the main research direction. In particular, the method based on deep learning has been widely used and can overcome the limitation of traditional detection methods that are difficult to adapt to complex scenes. However, there are still problems in existing deep learning methods, e.g., direct identification of cultivated areas based on deep learning models results in loss of internal boundaries, and identification of cultivated areas based on edge detection models results in inclusion of irrelevant boundaries. In addition, the extracted parcels using existing strategies based on thresholds are usually irregular and has the problem of inward trapping. To address the above problems, this study proposes a method of extracting cropland parcels based on deep convolutional neural network and watershed segmentation, which improves both information detection and parcel extraction. First, we treat cropland boundaries as a type of feature category and perform category probability detection in deep convolutional neural network to help achieve semantic recognition of cropland boundaries. Second, we perform parcel boundary detection based on the modified D-Linknet network, whose architecture is suitable for extraction of linear targets such as cropland boundaries, and the replacement of residual blocks can help improve the feature extraction capability of the network. Third, we extract agricultural parcels based on watershed segmentation, using the region segmentation method to obtain the closure of boundaries. The way of segmenting and merging parcels using region as a unit overcomes the limitation of parcel inversion in traditional methods based on thresholds at the pixel level. The performance of our proposed method is evaluated by two types of accuracy indicators: global boundary accuracy and parcel geometry accuracy. The experimental results show that the accuracy of our method is better than three comparison methods, and the F1 score representing the boundary accuracy is 0.933 and the parcel geometry accuracy is 0.829. Our proposed method can extract the agriculture parcels more accurately and is suitable for future practical applications.

1 引言

耕地地块作为农业基本单元[1],其快速准确的提取能够帮助作物类型、作物识别以及产量预测这类农业资源统计需求,实现地块尺度的精细统计[2-4],并能够帮助实现地块尺度的精细管理和政策制定,是精准农业的重要支撑[5-6]。但现有的高精度地块数据获取主要依靠人工目视勾绘生成,该方法需要耗费巨大的人力物力。近年来随着对地观测技术的发展,通过高空间分辨率遥感影像自动提取耕地地块,成为目前研究的主要方向。
传统的遥感耕地地块自动提取方法包含基于边缘检测的方法[7-10]和基于区域分割的方法[11-13]2种。其中,基于边缘检测方法通过对耕地边界进行描绘,进而连通成耕地地块,这类方法运用传统边缘检测算子(如sobel、canny等),检测像素之间的不连续性,快速将影像划分为边界和非边界,但由于边缘检测算子只考虑局部小窗口内的梯度信息,检测能力有限,得到的边界结果在地块内部会存在大量的噪点,而且难以避免检测边界不连通的情况。基于区域分割的方法,则是通过同质性标准将农田内部像素合并为地块区域,直接进行分割提取,常见的分割方法有分水岭分割[14]、多分辨率分割[15]等,这些方法,由于农田地块内部可能存在较大的差异,常会造成过度分割,并且在复杂场景下难以针对这些过度分割区域设定统一的合并准则,使其合并成一个完整的地块[16]。但耕地地块随着作物类型、地块形态、影像分辨率等因素的变化,在影像中的表现形式多样,并且耕地边界时常会受到遮挡或者出现模糊。所以只依靠梯度或相似度这样局部浅层的信息难以准确提取其特征,故而这类方法一般只适用于较为简单的小范围影像[17]
深层次的语义特征可以充分挖掘耕地边界稳定的特征,为耕地地块的准确提取提供了新思路。有研究[18]直接采用深度卷积神经网络对耕地区域进行提取,虽然达到了90%的提取精度,但由于网络执行下采样操作时会丢失部分位置信息,这种程度的位置丢失会对只有数个宽度大小的边界信息造成很大的影响,从而造成提取的耕地结果会丢失大量地块内部的边界,因而该方法无法实现耕地地块划分的目标[19-20]。因此,更多研究侧重于通过RCF[21]、HED[22]、DexiNed[23]等基于深度学习的边缘检测模型对耕地的边界进行提取。如xia[24]等在基于卷积网络检测得到耕地范围后,通过RCF[21]边缘检测模型对耕地内部的边界进行识别;李森等[25]则对RCF边缘检测模型进行改进,将网络中的部分卷积层替换为空洞卷积,通过更大的感受野,以更好地学习到多尺度、多层次的特征,并取得了较好的地块边界提取结果;Smit[7]等基于HED检测模型,对跟耕地边界进行识别,并在提取初始的边界轮廓和地块的基础上,通过设立地块形状规则对其中的噪声区域进行去除。而DexiNed作为现有最先进的边缘检测方法,减少了边界识别遗漏,生成的边界更加清晰,相比其他边缘检测模型展现了更强的边界识别性能[23]。但对于一张遥感影像来说,其中存在的边界信息并不只有耕地边界这一类,还包括了如居民地内部边界、道路河流边界等其他边界类型。而由于边缘检测模型的结构是基于检测通用边界而设计的,模型更侧重于检测影像中存在的所有潜在边界,忽略了对耕地边界的语义特征进行学习,这使得模型并不能够对不同的边界类别进行区分[26]。所以这类基于深度学习的边缘检测方法,在提取耕地边界的同时,还会提取出大量无关边界,这些无关边界会大大影响检测的精度。当前基于边缘检测模型的方法往往通过选用纯耕地区域的研究区影像,或者通过再次提取耕地范围掩膜无关边界等方法来规避该问题,但显然这一问题限制了模型的应用能力。
此外,由于地块边界检测得到的是值域连续的边界强度信息,如何将其转化为二值化的边界也是研究的重点。现有方法大多直接设定边界概率大于50%的像素点作为边界输出[27],此外也有方法通过不断手动尝试获取最优阈值[28],或计算数据集尺度最佳阈值以实现边界提取[25],但阈值的选取具有复杂性,耕地结构、类型等要素的变化都会引发最优阈值的变化,这意味同一张影像的不同区域会有不同的最优阈值。有研究针对该问题提出局部自适应阈值[29]的方法,每个像素都根据其5×5邻域窗口获取其相应的阈值,在一定程度上解决了不同区域最优阈值不一的问题,保留下部分弱强度的边界点,去除高强度的噪声点。但也要注意到的是,逐像素的窗口计算会带来极大的计算负担。此外,基于阈值对地块边界进行提取,是基于像元的判断,而位于同一条边上的像素强度不一,始终无法保证能完整提取边界上所有点,也无法保证对所有的噪点和伪边界都能进行去除,因而该方法难以获取闭合、规整的耕地地块。
针对现有研究存在的两方面问题:在信息检测层面,现有的基于深度学习的边缘检测方法难以语义识别耕地边界,在地块提取层面,现有的基于阈值提取方法难以获取闭合、规整的地块。本文提出一种将深度卷积网络和分水岭分割相结合的耕地地块提取方法:① 将耕地边界视作地物类别,通过深度卷积网络学习耕地边界的高层次语义特征,检测耕地边界的类别概率,从而实现对耕地边界的语义识别;② 采用的深度卷积网络为改进的D-Linknet模型,该模型的U-Net架构、膨胀卷积的组成适应于线性对象的检测,并且改进的特征提取模块增强了检测能力;③ 采用一种分水岭分割的方式,从得到的边界概率信息中提取地块,避免了现有基于阈值提取的方法,难以获取闭合且规整地块的缺陷。

2 研究方法

本文所提出的耕地地块自动识别方法主要分为2个部分:边界信息检测和耕地地块提取。边界信息检测部分通过深度卷积网络识别输入影像中各像素属于“耕地边界”的类别概率;而耕地地块提取部分则对边界概率通过分水岭分割并合并的方法,提取耕地地块。方法流程如图1所示。
图1 耕地地块自动识别方法流程

Fig. 1 Flow of automatic recognition method for cultivated land parcel

2.1 耕地边界检测

2.1.1 耕地边界定义

影像中存在多个种类的边界信息,而本研究中所关注和提取的只有耕地边界这一种边界类型,所以针对耕地边界的定义就尤为重要。联合国粮食及农业组织(FAO)定义耕地是一种用于农业用途,并用来种植作物的土地,一般包括水田、旱地、菜地以及水浇地等类型。而对于耕地边界,则是用来分隔各个耕地单元的分界线,本研究采用多个文献中所采用的详细定义[1,10,30],将耕地边界定义为两块相邻的种植区域被自然或人为景观破坏所分隔而形成的边界,具体包括了耕地内部较宽的道路(图2(a))或者凸起的用于行走的细田埂(图2(b))、以及耕地外围的道路或者沟渠等将耕地与外部进行分隔的景观(图2(c)和图2(d))。
图2 不同类型边界局部展示

Fig. 2 Local presentation of different types of boundaries

2.1.2 边界样本增强

针对耕地边界来说,由于存在两种类型,即耕地内部的边界(图2(a)和图2(b)),以及将耕地与非耕地进行区隔的外围边界(图2(c)和图2(d)),如果仅仅将样本分为耕地边界和非耕地边界2类,模型对耕地边界提取精度会较差。所以在本研究中,将非耕地边界这一类别进一步细化为耕地和背景,从而将样本分为3类:背景、耕地、耕地边界,通过“耕地识别”任务中的耕地特征信号帮助“耕地边界识别”任务对2种耕地边界均进行精准识别。

2.1.3 D-LinknetXt网络改进

本研究基于深度卷积网络对耕地边界进行类别概率检测,采用D-Linknet网络模型,该模型在Linknet模型基础上添加膨胀卷积层,以适应线性对象的提取,并在道路分割领域取得了极好的效果。同时本研究还将D-Linknet的Resnet残差单元替换为ResNeXt单元,从而增强网络的特征提取能力。修改后的网络,称之为D-LinknetXt,其具体结构如图3所示,该模型基于U-net网络架构,主要由3部分构成:① 编码部分,基于ResNeXt模块和下采样操作,从影像中提取耕地边界的语义特征;② 膨胀卷积层,能够在不降低特征图分辨率的情况下增大特征的感受范围;③ 解码部分,将获取的不同层次的特征上采样,从而实现对象的定位。下面结合耕地边界这一检测对象,对模型进行介绍。
图3 D-LinknetXt网络结构

Fig. 3 D-linknetXt network architecture

基于卷积网络实现耕地边界的语义检测,通过网络中的下采样操作,提取耕地边界高层次、本质的特征,从而达到对边界类型进行区分的目的,但由于恢复尺寸的上采样操作只能重建地物大致位置,会造成部分的空间信息损失。这种程度的损失对只有数个像素宽度的耕地边界类别来说会存在很大的影响。而本模型使用的U-Net网络结构,包含跨层连接,将每次下采样后的特征信号都连接到解码部分,从而使得上采样恢复的特征图中包含了更多的低层特征,这些低层特征包含了大量空间变化信息,能够帮助耕地边界的精确定位,从而避免由于定位不清造成提取的边界模糊。
而为了语义识别耕地边界,与其他类型的边界进行区分,需要更强的特征提取能力,以反映耕地边界最为本质的特征。但现有网络大多采用增加网络深度的方式提高性能,这会增加模型的复杂性,并且网络加深也会进一步造成耕地边界的模糊。故而改进模型使用ResNeXt残差单元替换原有的Resnet单元,在不增加网络深度的基础上进一步增强特征提取能力。如图4所示,ResNeXt基于Resnet进行改进,每个ResNeXt残差单元内部具有多个分支,共有32个分支,检测时会对各个分支进行分组卷积后再进行融合,从而增强了单个残差单元的检测能力。本研究意图通过对检测单元进行替换,增强模型的特征提取能力。
图4 Resnet和ResNeXt残差单元结构示意图

Fig. 4 Structure diagram of Resnet and ResNeXt residual blocks

此外耕地边界作为一种具有连通性的边界,需要更大的视野域,从边界整体的视角下进行特征提取,但由于下采样对空间信息的损失,难以通过添加池化层的方式扩大视野。而模型采用膨胀卷积层来扩充视野域的策略能在不添加池化层的条件下扩大视野,从而帮助耕地边界连通性特征的提取。

2.2 耕地地块提取

基于卷积网络模型获取的地块边界概率,如果逐像元基于阈值提取耕地边界,会出现边界断裂、存在噪声等问题,从而导致难以将边界转化为闭合、规整的耕地地块。故而本研究采用分水岭分割的方法,对地块边界概率进行分割,通过区域分割并合并的方式,直接获取耕地地块。意图利用区域分割方法所得结果的边界封闭性,来获取边界闭合的地块。
分水岭分割适用于单一梯度图像[31],该算法的目标是找到划分局部极小区域的高梯度边界(分水岭)[14]。分割方法是通过将局部最小点作为种子点,并向外扩展,直到接触另一个区域的边界后停止扩张。对检测结果直接应用分水岭分割,获取的是完全过分割的细碎区域。针对过分割区域,在耕地地块的场景下需要对这些小区域进行合并,使得其符合耕地地块的区域尺度。
研究采用基于区域邻接图的迭代合并方法,首先构建区域邻接图[32],图的结点对应所有过分割区域,相邻的区域用边连接,从而构建了是否邻接的拓扑关系,每条边都具有相应的权重值,用作控制相邻区域是否进行合并,本实验设定一种区域间相似度Zi, j作为权重,下面具体介绍相似度的计算方法。
相邻区域进行合并,是将2个原本各自均质的区域合二为一的过程,合并会增加区域的异质性。这个增加量被称作合并代价[33],记为Di, j。通过计算各个区域的方差来衡量区域的同质性,方差基于区域像素均值计算,具体计算方式如式(1)、式(2)所示,并通过计算相邻区域合并前后的方差变化作为合并代价,具体的计算方式如式(3),即将2个区域合并后的方差,减去未合并前各自的方差之和,合并造成的方差增幅越小则代表2个区域的合并倾向性越高。该式经过化简后得到式(4)[33-34]。此外,相邻区域的邻接程度也是必须要考虑的因素,如图5所示,由于地块内部像素均质性较高,分割的区域都较为大块,而地块外围的边界区域相较而言会存在大量细琐的小区域,为了使方法能够控制只有地块内部的区域才能相互合并,而不会向外合并到边界上的小区域,通过设置邻接权重Mi, j,计算2个区域邻接线段的长度占总长度的比例,并用1减去该比例,得到的权重值越大则越倾向于不进行合并,计算方式如式(5)。最终将方差权重Di, j、邻接权重Mi, j以及邻接关系Ai, j相乘,得到最终的区域间相似度Zi, j
μ i = 1 R i i = 1 R i Y ( p x , y )
E ( R i ) = i = 1 R i Y ( p x , y ) - μ i 2
D i , j = E ( R i R j ) - E ( R i ) - E ( R j )
D i , j = R i × R j R i + R j × μ i - μ j 2
M i , j = 1 - L ( R i R j ) L ( R i )
A i , j = 1 R i R j + R i R j
Z ( i , j ) = D i , j × M i , j × A i , j
图5 分割区域合并前后的局部展示

Fig. 5 Local display before and after the merging of subdivision areas

式中: D i , j M i , j A i , j分别表示合并代价、邻接权重和邻接关系,其相乘得到的 Z ( i , j )即为所求的区域相似度。此外,在计算过程中涉及的 R代表区域中像素的个数; Y ( p x , y )代表区域中各像素的值,而 μ代表区域的像素均值; E ( R )代表区域的方差; R i R j代表合并后的区域; L ( R i )表示待合并区域的周长, L ( R i R j )表示相邻区域的公共边的周长。
设定相似度阈值,并在区域邻接图中进行迭代合并,每次合并后更新邻接图的顶点和边集合,直到所有低于阈值的相邻区域得到合并,从而得到最终结果。在耕地地块合并的场景下,选择的相似度阈值应为边界区域与地块内部区域之间的相似度,这样可以将地块内部所有的过分割区域都进行合并。本实验所选取的阈值为0.2。

2.3 精度评价方法

2.3.1 全局边界精度

针对地块提取问题,地块边界的提取精度是最重要的精度指标,即需要评估影像的检测边界与参考边界的对应程度。同时考虑到地块边界的宽度较细,边界严格的对应可能难以实现,有些边界或许存在细微的偏移,但依然取得了较好的提取效果,不能简单的归为错误识别。故而将参考边界像元的八邻域范围内的点都视作松弛等值点,从而能够生成松弛参考边界,将此边界作为参考,开展精度验证。
将检测边界与松弛参考边界重合的部分作为准确识别的部分,采用基于混淆矩阵计算的F1分数,来评估方法对边界检测的质量(表1)。F1分数表示为精确度和召回率的调和平均值,精确度(precision)计算检测结果中正确识别的比例;召回率(recall)反应真实边界中得到识别的比例,F1分数作为二者的综合值,综合衡量2个指标,越大则代表越接近最优提取。具体公式如下:
F 1 = 2 × r e c a l l × p r e c i s i o n r e c a l l + p r e c i s i o n
r e c a l l = T P T P + F N
p r e c i s i o n = T P T P + F P
表1 边界检测结果的混淆矩阵

Tab. 1 obfuscation matrix

检测边界像元 检测非边界像元
实际边界像元 TP FN
实际非边界像元 FP TN
式中: T P表示正确识别的边界; F P表示检测结果的错误部分; F N表示真实边界中为识别的部分。 F 1作为全局边界精度指标。

2.3.2 地块几何精度

在地块提取问题中,除了在全局的角度对边界信息进行精度计算,还需要聚焦到对象层面,探究所检测的地块对象和参考地块在几何形状特征上是否匹配。
运用归一化周长指数(NPI)来分别定义检测地块和参考地块的形状系数,并通过二者的比值表示该精度,归一化周长指数是对象的周长与其等面积圆的周长之比。具体公式如下:
P i s h a p e = N P I E i N P I T i
N P I = P e a c P o b j e c t
P s h a p e = P i s h a p e N
式中: P i s h a p e表示第i个地块对象的地块几何精度; N P I E i N P I T i分别表示检测地块和参考地块的归一化周长指数; P o b j e c t表示对象的周长; P e a c表示该对象等面积圆的周长。

3 实验设计

3.1 研究区与数据概况

研究区为一景位于安徽省阜南县境内的遥感影像,经纬度范围为115.16 °E—115.45 °E,32.45 °N—32.69 °N,该地区地处淮北平原西南部,地势平坦,农田地块覆盖绝大部分影像区域,并且耕地地块的几何特性较为复杂,适应于研究方法的大范围检验。
研究采用国产高分二号卫星作为数据源,包含1 m分辨率的全色影像和2 m分辨率的多光谱(红、绿、蓝、近红外)影像,获取影像的时间为2021年1月29日。对高分二号影像进行了3项预处理操作:① 首先采用Pansharpen方法将影像全色影像和多光谱影像进行融合,提高多光谱影像的空间分辨率,突出纹理细节;② 将融合后的影像基于直方图统计进行辐射增强,从而提升对比度,去除薄雾的影响;③ 基于数字地面模型(DSM)对影像进行正射校正,获得研究区正射影像。
所用的耕地边界数据来源于手工勾绘,边界勾绘过程中严格按照所采用的耕地边界规范标准,同时勾绘结果经过2个人的检查复核以尽可能保证准确性。为训练网络,将影像通过5×5网格分割成25个切片,并在每行各选取一个切片,共计五块区域作为训练区域,并将对应的矢量耕地边界通过设置缓冲区多边形的方式转化为栅格边界,作为训练样本。研究区影像及训练样本如图6所示,并最终在整景影像上展开精度验证。
图6 研究区及训练区域

Fig. 6 Study area and training area

3.2 实验设置

将本文所述实验方法记为D-LinknetXt+WS,并设置3组对比实验,分别就信息检测能力和边界提取能力两方面设置对比实验进行评估。3组实验分别为DexiNed+WS、D-Linknet+WS和D-LinknetXt+LAT。
DexiNed+WS和D-Linknet+WS两组实验对检测模型进行更换,从而针对信息检测能力进行评估。其中,DexiNed模型是现有检测精度最高的边缘检测模型,该模型具有极高的边缘识别能力,并且结果边界清晰,该对比实验评估本实验采用的将耕地边界视作地物类型并检测类别概率的策略,对耕地边界是否具有更好的语义区分能力。D-Linknet模型为未作改动的原始网络结构,即使用原有的Resnet残差单元进行特征提取,主要评估改进特征提取模块的效果。2组对比实验均采用与实验方法相同的边界样本进行训练,并采用相同的分水岭分割方法(Watershed Segmentation,WS)得到地块边界。
D-LinknetXt+LAT实验则将原方法中分水岭分割的部分进行更换,从而针对边界提取能力进行评估。使用局部自适应阈值[29](Local Adaptive Threshold,LAT)的方式提取耕地结果,该方法由于对每个像素都计算独立的阈值,并判断是否保留,因而能够保留部分弱边界,去除强噪声,被应用于地块提取领域中。
实验基于Adam优化算法进行训练,其中具体参数设置如下:学习率为0.001,动量为0.9,批尺寸Batch size为8,以使用Batch size大小的数据训练一次记为一次迭代(Iteration),迭代次数设置为100 000次,每10 000次迭代学习率衰减为原来的十分之一。训练使用Nvidia GTX 1080 Ti GPU,总耗时为9 h。

4 结果与分析

4.1 方法精度评价

图7展示了基于本实验方法所得到的全图地块边界结果,整体上达到了较好的识别结果。从局部放大图中可以看出,所识别的地块边界基本符合真实情况,且形状规整;同时方法对一些位于居民地区域的小型地块也都实现了准确识别;此外,所识别的地块皆为耕地区域,说明方法实现了对耕地边界的语义识别。
图7 本方法最终地块结果

Fig. 7 The final result of our method

为了定量说明方法的优势,对4种方法分别计算精度指标并进行比较(表2)。通过精度分析可以发现:在衡量整体边界精度的F1分数上,本实验所提出的D-LinknetXt+WS方法明显优于DexiNed+WS方法和D-LinknetXt+LAT方法,并略优于未作模型修改的D-Linknet+WS方法,其中F1分数达到了0.933,证明本方法对地块边界提取具有优异能力。同时,本方法在地块几何精度上,也达到了0.829,证明方法能够高精度提取边界的同时,也能对耕地地块的几何特征很好的保持。
表2 各方法所得结果的精度比较

Tab. 2 method accuracy

方法 F1分数 地块几何精度
D-LinknetXt+WS 0.933 0.829
D-Linknet+WS 0.901 0.831
DexiNed+WS 0.763 0.766
D-LinknetXt+LAT 0.772 0.533

4.2 结果分析

4.2.1 信息检测能力分析

将本研究提出的D-LinknetXt+WS方法与D-Linknet+WS和DexiNed+WS方法进行对比,进行检测能力的分析。由图8的局部对比图可以看出,基于D-LinknetXt检测的本方法,所得到的边界结果与参考边界更加接近,并且较之基于D-Linknet模型检测结果,本方法的提取结果在一些细节信息的描述上更为精确;而基于DexiNed的方法所得到的结果中则出现了较多识别错误,整体结果较为驳杂。
图8 不同信息检测模型结果局部对比

Fig. 8 Local results of different information detection models

将使用的D-LinknetXt模型的本方法与基于D-Linknet模型的方法进行对比,2个方法在地块几何精度上几乎一致,但本方法在反映边界精度的F1分数上略高于对比方法。对原因进行分析,由图9的局部展示图可以看出,D-Linknet模型在部分区域出现了边界识别混乱的现象,将一些边界周围的像元错误识别,造成了边界部分存在模糊。而改用ResnetXt残差单元的本模型方法,在对耕地边界的检测中更具有优势,所识别的耕地边界更加清晰,使得检测的精度得到提升。本方法所采用的将ResnetXt残差单元替换Resnet单元的模型改进策略,能够帮助特征提取能力的提升,帮助网络学习到耕地边界更本质的特征,从而对耕地边界进行更准确的识别。
图9 各方法检测得到的边界概率局部展示

Fig. 9 The boundary probabilities detected by each method are shown locally

而将本方法与基于DexiNed边缘模型检测的结果相比,本方法不仅在地块几何精度上有所提升,在F1分数上更是显著优于对比方法,提升了0.17。从图9局部图上看,DexiNed模型除了能够检测出耕地边界外,同时还会对其他类型的边界信息检测出较高的值,如居民区内部边界,以及部分耕地内部的弱线性噪声等。这造成了提取结果中出现了较多的错误检测,影响了F1分数。此外,这些多余的线性信息会造成提取的地块结果更为细碎,也影响到了结果的几何精度。而本方法将耕地边界作为一种地物类型,基于深度卷积网络检测的策略,通过网络对耕地边界的语义特征进行学习,从而学习到更为本质的特征,大大增强了方法对耕地边界的语义区分能力,减少了无关边界的出现;此外,相比于DexiNed模型可以提取清晰边界的能力,采用D-LinknetXt模型的本方法,由于网络中 U-net结构的跳跃连接引入大量低层信息,从而帮助本方法能够极大避免一般卷积网络对边界位置的丢失,更好的适应耕地边界这样线性对象的提取。最终帮助本方法在增强语义区分耕地边界的能力之外,所提取的边界还能保持清晰准确,从而在信息检测能力上获得提升。

4.2.2 地块提取能力分析

将本研究使用的分水岭分割方法(WS)与局部自适应阈值方法(LAT)进行对比,进行地块提取能力的分析。由图10的局部对比图可看出,基于局部自适应阈值提取的耕地地块结果,整体上更加零碎,并且边界线条也没有基于分水岭分割的本方法规整,提取结果不尽人意。
图10 分水岭分割方法与局部自适应阈值方法提取地块的局部对比

Fig. 10 Local comparison of Watershed Segmentation method and Local Adaptive Thresholding method for extracting parcels

与基于局部自适应阈值的方法相比,基于分水岭分割提取的本实验方法在F1分数和形状精度上均有明显的提升,其中F1分数提升了0.161,地块几何精度提升了0.296。通过图11的局部放大影像进行原因分析,可以发现基于自适应阈值的方法提取的农田地块出现了大量的向内凹陷,这是由于边界检测得到部分线状的弱信号,这些弱信号经过阈值进行二值化后,会有部分保留,以至于所得到的地块边界结果存在大量向内凹陷的情况,从而大大影响了边界以及形状精度。出现这种情况是由于局部自适应阈值的方法,采用逐像元的方式区分地块边界和非地块边界属性,这种基于像元的孤立判断无法完整去除这些“伪边界”上的所有像素点。而本方法所采用的分水岭分割,并基于相邻区域相似度进行合并的方法,是在得到所有可能边界线条的基础上,再对每条边界是否保留进行判断,这种基于边界整体的判断方式会将这类“伪边界”整体去除,杜绝了此类地块“内陷”情况的发生,保证了所提取的耕地地块的规整程度,从而大大提高了方法在边界提取上的精度。此外,基于阈值逐像元提取的方式,可能存在部分边界外侧的像元未能提取,造成边界不够平整的情况,而分水岭分割这种区域生长的方式也在一定程度上克服了该问题。所以本研究基于分水岭分割提取的方法,对耕地地块的几何形状保持上具有显著优势,同时这种对边界几何信息更好的保持能力,也在很大程度上提高了最终结果的整体边界精度。
图11 局部自适应阈值局部提取效果

Fig. 11 Local adaptive threshold local extraction result.

4.3 模型应用

为了进一步验证方法在其他类型地区,尤其是在山区影像上的适用性。选取位于浙江省临安县的一景GF-2影像,并从中选取三块典型的山区耕地区域进行实验,区域的应用效果如图12所示。应用效果表明,方法能够将耕地和林地进行很好的区分,并且提取的耕地地块规整准确。通过局部放大图进一步观察耕地与林地交界的区域,可以发现方法提取的地块边界能够有效的对耕地和林地进行分隔,进一步验证了方法在山区影像上的可行性。
图12 临安县局部影像提取结果

Fig. 12 Results of local image extraction in Lin'an County

4.4 方法局限与改进

在提取的结果中现,存在部分种植同种作物的相邻地块未能被完全分割开,结合影像分析造成地块未能完全分隔主要有2类原因。① 由于部分耕地地块在影像当中的边界本就不闭合,存在断裂口(图13的局部影像1),这种自身本就存在的断裂导致了提取结果中相邻地块未能完全分隔;② 由于耕地地块的边界,在某些地方存在极度不明显的情况(影像2红圈所示),这也导致方法难以识别出这一部分的边界,从而造成地块分割不完全的情况。
图13 欠分割地块的局部展示

Fig. 13 Partial display of undivided parcels

这种影像中的耕地边界不够清晰的情况,有可能是由于相邻地块的作物在生长周期的某些阶段对地块边界造成了遮挡,导致影像上的边界出现模糊,所以利用生长季中的多幅影像共同识别可能是避免这一问题出现的一个方法[35];此外,基于这种欠分割的形状特性进行二次分割也是解决的途径,可以计算地块多边形各折点的曲率,通过曲率最大的点找到断裂边界的端点,并通过延长断裂边界的方式对欠分割地块进行二次分割[7]
而本文所提出的耕地地块识别方法基于高分辨率遥感影像进行,影像的质量直接决定了识别的质量。如果基础影像耕地边界模糊不清、包含较多噪声,或者由于成像过程中光照条件、地形以及大气影响等因素引起地物光谱特征发生变化,都会影响最终的提取结果[36]。这突出表明了在进行地块提取过程中,优选影像的重要性,而优选体现在2个层面:① 要优选影像的分辨率,即所选的影像能否将各个耕地地块及其边界清晰的显示。如果提取区域的地块细碎且面积较小,就需要选择高空间分辨率的影像以准确反映地块信息。而如果是规整的大地块,则可以选择相对较低分辨率的影像,高分辨率反而会带来不必要的噪声信息;② 要优选影像的质量。针对一个地区的影像,需要从中选择影像质量最佳、耕地边界最为清晰的一景,并且需要进行充分的预处理操作。
此外,虽然由于影像获取的限制,本实验基于单时相影像进行提取。但应该说明的是,耕地作为一种具有季节性的地物类型,由于耕种作物的变更可能使得田间管理形式发生变化,进而导致农田的田埂边界出现变化。所以在多时相影像充足的情况下,有必要对多期影像分别进行识别,从而获取该地区在不同时期下的地块信息。

5 结论

本文基于总结的现有耕地地块自动提取研究中存在的问题,提出了一种基于D-LinknetXt模型和分水岭分割的遥感影像耕地地块自动识别方法,并在安徽阜南县的一景影像上开展实验。就信息检测能力和边界提取能力两方面与现有方法分别进行对比,得出以下结论:
(1)本文将耕地边界作为地物类型,通过深度卷积网络对类别概率进行检测,增强对耕地边界的语义识别能力,相比较使用Dexined边缘检测模型对地块边界检测的方法,能够更有效地对耕地边界进行区分和检测;采用D-LinknetXt网络,其U-Net架构避免了位置信息丢失导致的边界模糊问题,并且将原始D-Linknet网络中的Resnet残差单元替换为ResnetXt单元,提升了模型的特征提取能力,实现对耕地边界更准确的识别。最终本研究方法在信息检测能力上有所提高,选用D-LinknetXt模型的方法在F1分数上达到了0.933。
(2)本文将边界检测强度与分水岭分割方法相结合,并基于相邻区域相似度对过分割区域进行合并,以此实现耕地地块的提取,方法解决了原有基于阈值提取方法存在的地块“内陷”的问题,提取的地块更加规整。与基于局部自适应阈值提取边界的方法相比,选用分水岭分割的方法对地块的形状以及边界的保持能力大幅增强,地块几何精度达到0.829。
综上结果表明,本研究所提出的耕地地块自动提取方法,在信息检测能力和地块提取能力上明显优于现有方法,并在各项精度指标上有较大的提升,同时所提出的方法还有效解决了耕地边界检测能力不足、提取地块存在内陷、边界不够平整等问题,方法具有较高的适用性,可作为一套完整的基于遥感影像准确提取耕地地块的方案。
[1]
Persello C, Tolpekin V A, Bergado J R, et al. Delineation of agricultural fields in smallholder farms from satellite images using fully convolutional networks and combinatorial grouping[J]. Remote Sensing of Environment, 2019, 231:111253. DOI:10.1016/j.rse.2019.111253

DOI

[2]
Zhao W Z, Du S H, Emery W J. Object-based convolutional neural network for high-resolution imagery classification[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(7):3386-3396. DOI:10.1109/JSTARS.2017.2680324

DOI

[3]
Blaschke T. Object based image analysis for remote sensing[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2010, 65(1):2-16. DOI:10.1016/j.isprsjprs.2009.06.004

DOI

[4]
Matton N, Canto G, Waldner F, et al. An automated method for annual cropland mapping along the season for various globally-distributed agrosystems using high spatial and temporal resolution time series[J]. Remote Sensing, 2015, 7(10):13208-13232. DOI:10.3390/rs71013208

DOI

[5]
Musat G A, Colezea M, Pop F, et al. Advanced services for efficient management of smart farms[J]. Journal of Parallel and Distributed Computing, 2018, 116:3-17. DOI:10.1016/j.jpdc.2017.10.017

DOI

[6]
Yu Q Y, Shi Y, Tang H J, et al. eFarm: A tool for better observing agricultural land systems[J]. Sensors (Basel, Switzerland), 2017, 17(3):453. DOI:10.3390/s17030453

DOI

[7]
Marvaniya S, Devi U, Hazra J, et al. Small, sparse, but substantial: Techniques for segmenting small agricultural fields using sparse ground data[J]. International Journal of Remote Sensing, 2021, 42(4):1512-1534. DOI:10.1080/01431161.2020.1834166

DOI

[8]
Turker M, Kok E H. Field-based sub-boundary extraction from remote sensing imagery using perceptual grouping[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 79:106-121. DOI:10.1016/j.isprsjprs.2013.02.009

DOI

[9]
Yan L, Roy D P. Automated crop field extraction from multi-temporal Web Enabled Landsat Data[J]. Remote Sensing of Environment, 2014, 144:42-64. DOI:10.1016/j.rse.2014.01.006

DOI

[10]
Cheng T, Ji X S, Yang G X, et al. DESTIN: A new method for delineating the boundaries of crop fields by fusing spatial and temporal information from WorldView and Planet satellite imagery[J]. Computers and Electronics in Agriculture, 2020, 178:105787. DOI:10.1016/j.compag.2020.105787

DOI

[11]
Evans C, Jones R, Svalbe I, et al. Segmenting multispectral Landsat TM images into field units[J]. IEEE Transactions on Geoscience and Remote Sensing, 2002, 40(5):1054-1064. DOI:10.1109/TGRS.2002.1010893

DOI

[12]
Watkins B, van Niekerk A. Automating field boundary delineation with multi-temporal Sentinel-2 imagery[J]. Computers and Electronics in Agriculture, 2019, 167:105078. DOI:10.1016/j.compag.2019.105078

DOI

[13]
García-Pedrero A, Gonzalo-Martín C, Lillo-Saavedra M. A machine learning approach for agricultural parcel delineation through agglomerative segmentation[J]. International Journal of Remote Sensing, 2017, 38(7):1809-1819. DOI:10.1080/01431161.2016.1278312

DOI

[14]
Salman N H, Liu C Q. Image segmentation and edge detection based on watershed techniques[J]. International Journal of Computers and Applications, 2003, 25(4):258-263. DOI:10.1080/1206212x.2003.11441713

DOI

[15]
Mueller M, Segl K, Kaufmann H. Edge- and region-based segmentation technique for the extraction of large, man-made objects in high-resolution satellite imagery[J]. Pattern Recognition, 2004, 37(8):1619-1628. DOI:10.1016/j.patcog.2004.03.001

DOI

[16]
Belgiu M, Csillik O. Sentinel-2 cropland mapping using pixel-based and object-based time-weighted dynamic time warping analysis[J]. Remote Sensing of Environment, 2018, 204:509-523. DOI:10.1016/j.rse.2017.10.005

DOI

[17]
Waldner F, Diakogiannis F I. Deep learning on edge: Extracting field boundaries from satellite images with a convolutional neural network[J]. Remote Sensing of Environment, 2020, 245:111741. DOI:10.1016/j.rse.2020.111741

DOI

[18]
Zhang D J, Pan Y Z, Zhang J S, et al. A generalized approach based on convolutional neural networks for large area cropland mapping at very high resolution[J]. Remote Sensing of Environment, 2020, 247:111912. DOI:10.1016/j.rse.2020.111912

DOI

[19]
Shelhamer E, Long J, Darrell T. Fully convolutional networks for semantic segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(4):640-651. DOI:10.1109/TPAMI.2016.2572683

DOI PMID

[20]
Chen L C, Zhu Y K, Papandreou G, et al. Encoder-decoder with atrous separable convolution for semantic image segmentation[EB/OL]. 2018: arXiv: 1802.02611. https://arxiv.org/abs/1802.02611

[21]
Liu Y, Cheng M M, Hu X W, et al. Richer convolutional features for edge detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 41(8):1939-1946. DOI:10.1109/TPAMI.2018.2878849

DOI PMID

[22]
Xie S N, Tu Z W. Holistically-nested edge detection[C]//2015 IEEE International Conference on Computer Vision. IEEE,: 1395-1403. DOI:10.1109/ICCV.2015.164

DOI

[23]
Soria X, Riba E, Sappa A. Dense extreme inception network: Towards a robust CNN model for edge detection[C]//2020 IEEE Winter Conference on Applications of Computer Vision. IEEE,: 1912-1921. DOI:10.1109/WACV45572.2020.9093290

DOI

[24]
Xia L G, Luo J C, Sun Y W, et al. Deep extraction of cropland parcels from very high-resolution remotely sensed imagery[C]//2018 7th International Conference on Agro-geoinformatics (Agro-geoinformatics). IEEE,:-5. DOI:10.1109/Agro-Geoinformatics.2018.8476002

DOI

[25]
李森, 彭玲, 胡媛, 等. 基于FD-RCF的高分辨率遥感影像耕地边缘检测[J]. 中国科学院大学学报, 2020, 37(4):483-489.

DOI

[ Li S, Peng L, Hu Y, et al. FD-RCF-based boundary delineation of agricultural fields in high resolution remote sensing images[J]. Journal of University of Chinese Academy of Sciences, 2020, 37(4):483-489. ]

DOI

[26]
周楠, 杨鹏, 魏春山, 等. 地块尺度的山区耕地精准提取方法[J]. 农业工程学报, 2021, 37(19):260-266.

[ Zhou N, Yang P, Wei C S, et al. Accurate extraction method for cropland in mountainous areas based on field parcel[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(19):260-266. ]

[27]
Xia X, Persello C, Koeva M. Deep fully convolutional networks for cadastral boundary detection from UAV images[J]. Remote Sensing, 2019, 11(14):1725. DOI:10.3390/rs11141725

DOI

[28]
Fetai B, Račič M, Lisec A. Deep learning for detection of visible land boundaries from UAV imagery[J]. Remote Sensing, 2021, 13(11):2077. DOI:10.3390/rs13112077

DOI

[29]
Graesser J, Ramankutty N. Detection of cropland field parcels from Landsat imagery[J]. Remote Sensing of Environment, 2017, 201:165-180. DOI:10.1016/j.rse.2017.08.027

DOI

[30]
Rydberg A, Borgefors G. Integrated method for boundary delineation of agricultural fields in multispectral satellite images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2001, 39(11):2514-2520. DOI:10.1109/36.964989

DOI

[31]
Li D R, Zhang G F, Wu Z C, et al. An edge embedded marker-based watershed algorithm for high spatial resolution remote sensing image segmentation[J]. IEEE Transactions on Image Processing, 2010, 19(10):2781-2787. DOI:10.1109/TIP.2010.2049528

DOI PMID

[32]
Saarinen K. Color image segmentation by a watershed algorithm and region adjacency graph processing[C]//Proceedings of 1st International Conference on Image Processing. IEEE,: 1021-1025. DOI:10.1109/ICIP.1994.413690

DOI

[33]
Beaulieu J M, Goldberg M. Hierarchy in picture segmentation: A stepwise optimization approach[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1989, 11(2):150-163. DOI:10.1109/34.16711

DOI

[34]
Haris K, Efstratiadis S N, Maglaveras N, et al. Hybrid image segmentation using watersheds and fast region merging[J]. IEEE Transactions on Image Processing, 1998, 7(12):1684-1699. DOI:10.1109/83.730380

DOI PMID

[35]
Watkins B, van Niekerk A. A comparison of object-based image analysis approaches for field boundary delineation using multi-temporal Sentinel-2 imagery[J]. Computers and Electronics in Agriculture, 2019, 158:294-302. DOI:10.1016/j.compag.2019.02.009

DOI

[36]
Hong D F, Yokoya N, Chanussot J, et al. An augmented linear mixing model to address spectral variability for hyperspectral unmixing[J]. IEEE Transactions on Image Processing, 2019, 28(4):1923-1938. DOI:10.1109/TIP.2018.2878958

DOI

文章导航

/