遥感科学与应用技术

特征优选与卷积神经网络在农作物精细分类中的应用研究

  • 刘戈 , 1, 4 ,
  • 姜小光 1, 3 ,
  • 唐伯惠 , 2, 4, *
展开
  • 1.中国科学院大学,北京 100049
  • 2.昆明理工大学国土资源工程学院,昆明 650093
  • 3.中国科学院空天信息创新研究院 定量遥感信息技术重点实验室,北京 100094
  • 4.中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室,北京 100101
*唐伯惠(1973— ),男,湖南永州人,教授,主要从事地表净辐射遥感估算、地表温度与地表发射率遥感反演与 验证研究。E-mail:

刘 戈(1994— ),女,北京人,硕士生,主要从事定量遥感研究。E-mail:

收稿日期: 2020-09-21

  要求修回日期: 2021-01-04

  网络出版日期: 2021-08-25

基金资助

中国科学院大科学项目(181811KYSB20160040)

中国科学院先导项目(XDA13030402)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

Application of Feature Optimization and Convolutional Neural Network in Crop Classification

  • LIU Ge , 1, 4 ,
  • JIANG Xiaoguang 1, 3 ,
  • TANG Bohui , 2, 4, *
Expand
  • 1. University of Chinese Academy of Sciences, Beijing 100049, China
  • 2. Faculty of Land and Resource Engineering, Kunming University of Science and Technology, Kunming 650093, China
  • 3. Key Laboratory of Quantitative Remote Sensing Information Technology, Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100094, China
  • 4. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
*TANG Bohui, E-mail:

Received date: 2020-09-21

  Request revised date: 2021-01-04

  Online published: 2021-08-25

Supported by

Bureau of International Cooperation Chinese Academy of Science(181811KYSB20160040)

Strategic Priority Research Program of The Chinese Academy of Sciences(XDA13030402)

Copyright

Copyright reserved © 2021

摘要

农作物的精细分类一直是农业遥感领域的热点,对农作物估产和种植结构监管有重要意义。深度学习的出现为农作物分类准确性的提升提供了新的思路。本文提出一种特征优选与卷积神经网络(Convolutional Neural Networks, CNN)相结合的多光谱遥感农作物分类方法,用以解决精细分类问题。实验以哨兵2号遥感影像为数据源,基于多光谱遥感影像的波段反射率与包括归一化植被指数在内的10种植被指数,利用Relief F算法进行特征增强与优选,获取最优特征集,从而设计出基于特征优选的CNN分类方法,并对河南省原阳县主要农作物水稻、玉米、花生进行分类识别与制图,分类精度达到96.39%。同时,选用支持向量机、CNN方法分别对研究区农作物进行分类识别。对比分析3种方法的分类结果,发现本文提出的基于最优特征集的CNN农作物分类方法表现最优,CNN方法次之,支持向量机方法表现最差。实验结果表明:① 利用Relief F算法能够对特征贡献度进行排序,完成特征筛选,得到包含24个特征的最优特征子集,训练精度达到99.89%;② 基于最优特征集的CNN方法能够在最大程度上提取高精度差异性特征,实现对农作物的精细分类,且相比CNN和支持向量机的农作物分类方法,本文方法表现更佳。

本文引用格式

刘戈 , 姜小光 , 唐伯惠 . 特征优选与卷积神经网络在农作物精细分类中的应用研究[J]. 地球信息科学学报, 2021 , 23(6) : 1071 -1081 . DOI: 10.12082/dqxxkx.2021.200546

Abstract

Fine-scale crop classification has always been a hot topic in the field of agricultural remote sensing, which is of great significance for crop yield estimation and planting structure supervision. The emergence of deep learning provides a new way to improve the accuracy of crop classification. Recently, the Convolutional Neural Network (CNN), a representative algorithm of deep learning, shows obvious advantages in processing high-dimensional remote sensing data. However, the application of CNN in crop classification based on multispectral data is still rare, and the classification accuracy dependent on the different feature information of crops is hard to evaluate. In this paper, a crop classification method based on feature selection and CNN for multispectral remote sensing data is proposed to improve fine crop classification. This study used Sentinel-2 remote sensing images as data source. Based on the reflectance of 13 multispectral bands and 10 vegetation indices including normalized difference vegetation index, ratio vegetation index, enhanced vegetation index, etc., the Relief F algorithm was used to rank the contribution of multidimensional features. According to the rank of feature contribution, the features with high contribution were selected and optimized by group training to obtain the best feature collection. Therefore, a CNN-based classification method based on feature selection was designed. Based on this, we classified and mapped the main crops including rice, corn, and peanut in Yuanyang County, Henan Province, with an overall classification accuracy of 96.39%. Meanwhile, the support vector machine and simple CNN were also used to classify the main crops in the research area for comparison. We found that the CNN-based classification method based on the optimal feature collection had the highest classification accuracy, followed by simple CNN, and the support vector machine had the worst performance. The main conclusions of this research are as follows: (1) The Relief F algorithm was effective to sort the contribution of different features. In total, we obtained 24 optimal feature subsets, with a training accuracy of 99.89%; (2) The CNN-based classification method using the optimal feature collection can extract the high-precision difference in features to the greatest extent and realize the fine-scale classification of crops. Compared with simple CNN and support vector machine, the CNN method based on the optimal feature collection has obvious advantages.

1 引言

农作物种植面积与空间分布的准确获取是农业监测与管理的基础,对农作物估产、种植结构管理与优化有着重要意义。快速、准确的农作物的分类与识别尤为重要,遥感技术因其覆盖面广、时效性强、经济便捷等特性,被广泛应用于农业监测与管理,成为农作物分类的重要手段,并在几十年来演变出多种分类方式。农作物遥感分类方式按照数据源的不同,可概括为利用单一影像源、时间序列影像源、遥感影像与统计数据融合3种方式;按选用特征量的区别,又可归纳为基于单一特征参量、基于多特征参量、基于特征量的统计模型法等。
农作物遥感分类的常见分类器有最大似然法、支持向量机(Support Vector Machine,SVM)、随机森林等。最大似然法是依靠已知类别作训练样本,计算得出决策值,以构建相应判别函数与准则,从而进行分类。郭交等[1]将哨兵1号雷达影像与哨兵2号光学影像相融合,利用最大似然法将有云条件下陕西省渭南市大荔县研究区内主要农作物小麦、玉米、苜蓿等的分类精度和Kappa系数分别提高2%和4%。支持向量机方法以统计学习理论中VC维理论和结构风险最小化理论为基础,利用核函数将输入向量映射到高维特征空间,建立最优超平面,达到目标识别与分类的目标。史飞飞等[2]以HJ-1A HSI高光谱影像和GF-1 WFV高分辨率影像为数据源,应用支持向量机对湟水流域油菜、青稞和春小麦等典型农作物进行分类识别,精度最高达88.8%。吴静等[3]选用多时相Sentinel-2A遥感影像,利用随机森林法,将分类特征设定为5种特征参数,对甘肃省景泰县水稻、玉米、春小麦、胡麻等9种农作物进行了分类,其中以归一化植被指数(Normalized Difference Vegetation Index,NDVI)和红边归一化植被指数作为特征组合的分类获得了最优精度86.2%。然而随着遥感技术的发展和对作物分类精度要求的不断提升,常规分类器暴露出难以提取作物本质、抽象的可区分性特征的弱点。
深度学习的出现为农作物的精确分类提供了新的思路,基于深度学习的农作物遥感分类特征提取分类过程不需要或仅需少量人为参与,能够提取目标本质、抽象特征,具有面向大数据处理的计算能力等优势。其中,卷积神经网络在处理高维遥感影像数据时展现出明显优势。李昌俊[4]利用Landsat-8遥感影像,基于CNN的方法,对江苏省仪征市进行了土地利用分类和耕地提取,其中休耕地的分类准确率达到了88.08%,在耕地的分类准确率达到86.79%。Shunping[5]等提出了一种基于三维卷积神经网络的作物自动分类方法,利用高分二号多光谱数据,将2D-CNN和3D-CNN方法分别应用于2015年影像,成功分类提取了玉米、大米、大豆等农作物,2种方法的分类精度分别达到93.5%和93.9%,应用于2016年影像则分别达到90.0%和95.9%。但同时,利用CNN进行作物分类仍存在一些问题。CNN在针对多光谱数据进行农作物分类上的应用较少,且分类精度依赖不同农作物特征信息本身的差异性。同时,CNN这种端到端的分类方式缺乏对农作物特征的分析与理解。
为解决上述问题,本文提出基于特征优选与深度学习的多光谱遥感农作物分类方法。利用哨兵2号(Sentinel-2)遥感影像数据,基于多光谱遥感影像的波段反射率数据集,设计构建CNN模型进行光谱特征提取与农作物分类,并利用SVM方法进行对比实验。进一步,在波段反射率的基础上,利用特征增强与优选获取最优光谱特征集,结合CNN进行特征提取与农作物分类制图,最后对3种方法的分类结果进行对比分析。

2 研究方法

本文以CNN算法作为分类器,基于多光谱遥感影像的波段反射率数据集,提取光谱特征,从而对原阳县主要农作物进行识别与分类,并将分类结果与SVM方法得到的农作物分类结果进行对比;之后在波段反射率基础上,通过Relief F算法[6]对波段及植被指数进行特征贡献排序,获取最优光谱特征集,基于此利用CNN进行特征提取与农作物分类,完成对农作物的精细分类,最后分析对比3种分类方式的结果。图1为实验总体技术路线图。
图1 基于特征优选与卷积神经网络的农作物分类总体技术路线

Fig. 1 General technical route of crop classification based on feature optimization and convolution neural network

2.1 构建数据集

传统的农作物遥感分类识别主要依靠光谱特征、地物空间特征与植物光谱反射特性,结合农作物物候期实现对不同种类作物的区分[7]。随着高分辨率与多光谱影像的不断发展,更多的地物细节得以展现在遥感影像上,为充分利用影像信息,提升分类准确性,结合多类型特征进行农作物分类是一种有效手段[8]
实验以哨兵二号13个波段的反射率为基础,结合植被指数构建多维数据集。与单一光谱波段相比,以一定形式将不同波段的植被与土壤系统反射率因子组合形成植被指数,能够反映出农作物更稳定、可靠的特征与信息,以此增强农作物信息的特征表达。如引入土壤调节因子,能够突出植被信息,从而减少背景中土壤的干扰;引入大气调节因子,同样能够突出植被信息,减少大气气溶胶的影响。引入多维特征并借助植被指数有助于增强遥感图像的细节表达能力,对提升农作物分类的精度具有重要意义。本实验选用10种植被指数,包括比值植被指数(RVI)、绿度指数(GI)、归一化植被指数(NDVI)、重归一化植被指数(RDVI)、绿光归一化差值植被指数(GNDVI)、绿度植被指数(GVI)、转换型植被指数(TVI)、叶绿素吸收比植被指数(MCARI)、增强型植被指数(EVI)、改进红边比值植被指数(MSR)(计算方式如表1所示)。
表1 相关植被指数计算公式[9,10]

Tab. 1 Related vegetation index formulas

植被指数 计算公式 公式编号 说明
RVI RVI=Bnir/Bred (1) Bnir为近红外波段反射率;Bred为红光波段反射率
GI GI=Bgreen/Bred (2) Bgreen为绿光波段反射率;Bred为红光波段反射率
NDVI NDVI=(Bnir-Bred)/(Bnir+Bred) (3) Bnir为近红外波段反射率;Bred为红光波段反射率
RDVI RDVI=(Bnir-Bred)/(Bnir+Bred) (4) Bnir为近红外波段反射率;Bred为红光波段反射率
GNDVI GNDVI=(Bnir-Bgreen)/(Bnir+Bgreen) (5) Bnir为近红外波段反射率;Bgreen为绿光波段反射率
GVI GVI=(Bgreen-Bred)/(Bgreen+Bred) (6) Bgreen为绿光波段反射率;Bred为红光波段反射率
TVI TVI=0.5×(120×(Bnir-Bgreen)-200×(Bred-Bgreen))
(7) Bnir为近红外波段反射率;Bgreen为绿光波段反射率;Bred为红光波段反射率
MCARI MCARI=((Bnir-Bred)-0.2×(Bnir-Bgreen))×(Bnir/Bred) (8) Bnir为近红外波段反射率;Bred为红光波段反射率;Bgreen为绿光波段反射率
EVI EVI=2.5×(Bnir-Bred)Bnir+6×Bred-7.5×Bblue+1 (9) Bnir为近红外波段反射率;Bred为红光波段反射率;Bblue为蓝光波段反射率
MSR MSR=(Bnir/Bred)-1(Bnir+Bred+1 (10) Bnir为近红外波段反射率;Bred为红光波段反射率
构建特征数据集的过程如图2所示,首先利用波段反射率与植被指数进行特征堆叠,再利用地面实测数据结合目视解译的方式筛选出标签数据,从而建立包含所有确定农作物类别的地块的样本标签数据集。
图2 特征数据集构建过程

Fig. 2 Construction process of feature data sets

2.2 基于Relief F算法的特征优选

综合利用多类特征进行农作物分类能够丰富遥感数据的信息量,在一定程度上提升分类精度,但过多的特征并不总能给分类带来正向提升。在分类器的训练与学习过程中,特征维数的增大意味着与分类相关性较弱的特征的加入,并难以避免地存在一些互相关性较高的冗余特征[11]。鉴于此,在分类时对已有特征进行筛选,取得最优特征子集,能够通过特征降维提升分类精度。
Relief F是一种多类别特征选择算法,于1994年由Kononenko提出[12],是基于Relief的延伸算法。相比于Relief算法只能应用于2类数据的特征选择,Relief F将多类数据的问题转化为多个一对多问题[13],从而将可研究对象扩展到多类问题。此算法基于特征对近距离样本的区分能力计算样本和特征的相关性,依据各个特征与类别的相关性赋予每个特征权重。特征的权重大小代表了该特征分类能力的强弱,权重越大意味着分类能力越强,权重越小则分类能力越弱。RelifF算法在处理多类问题时,每一次从训练样本集中随机抽取一个样本N,先从N的同类样本集中选择a个近邻样本,再从每个N的不同类样本集中选择a个近邻样本,从而将每个特征的权重更新。权重计算公式如下:
W ( A ) = W ( A ) - j = 1 n diff ( A , N , H j ) / ( M × a ) + C class ( N ) [ p ( C ) 1 - p ( class ( N ) ) J = 1 a diff ( A , N , M j ( C ) ) ] / ( m × A )
式中: diff ( A , N , H j ) 表示样本N H j 在特征 A 上的差; diff ( A , N , M j ( C ) ) 表示样本 N M j ( C ) 在特征 A 上的差; M j ( C ) 表示类 C class ( N ) 中第 j 个最近邻样本。
Relief F算法
输入:样本特征集S、标签类别C
输出:权重向量W
设置特征1至d的权重W(A)为0;
for i= 1 to m do
随机选择样本Ni;
选取同类样本中a个最近邻Ni;
在所有与样本N不同的类别C中选择a个非同类最近邻mj(C);
for A= 1 to d do
利用式(1)对特征权重向量W赋值;
End

2.3 基于CNN的农作物遥感分类方法

卷积神经网络最早出现于1989年,是由Lecun[14]提出的一种有卷积结构的深度神经网络,它用卷积运算取代了常规全连接神经网络的矩阵乘法运算,在GPU并行计算能力支持下,达到了优秀的计算效率,能够训练深层次、复杂结构的神经网络。CNN具有神经元局部连接、权重共享、池化等特性,在处理包括图像在内的二维结构数据时快速、高效,表现出一定优势[15]
具有代表性的CNN结构包括输入层、卷积层、池化层、全连接层及输出层等。多个卷积层与全连接层内含在CNN中,以逐层提取特征,被提取的特征随着层级深入从浅层的具体、细节变得越发抽象、概括。图3为CNN模型处理流程。
图3 CNN模型处理流程

Fig. 3 Processing flow of CNN model

CNN结构中,卷积层与池化层在对图像特征提取过程中起到决定性作用。经卷积运算,能够初步提取图像特征。对于卷积核维度为 n 的图像,将上一层网络 f - 1 的输出 z f - 1 输入到下一个卷积层 f 中,此次运算生成特征图的过程为:
z n f = g ( w n f z f - 1 + b n f )
期中: z n f 代表经上一卷积层的 n 维特征图; w n f 代表第 f 层第 n 维卷积核的权重向量, b n f 代表第 f 层第 n 维卷积核的偏置项;运算符号 表示卷积运算操作; g ( x ) 为非线性的激励函数。
池化层通常位于卷积层之后,特征图片经池化操作能够对卷积特征降维处理。通过缩小特征图尺寸,简化卷积运算的复杂性,并对特征的表达进一步压缩,以提取出更典型特征。池化运算过程如下:
z f = g ( β f down ( z f - 1 ) + b f )
式中: β f 代表第 f 层的采样系数; down ( x ) 代表池化函数; b f 代表第 f 层的偏置项。
本实验设计的CNN网络结构分为8层(图4)。首层为输入层,实验输入1×48维的图像;在第一个卷积(Convolution)层中,此图像被6个1×5尺寸的卷积核滤波处理,步长为1,从而产生1×44的特征图;接下来的池化(Pooling)层中,对C1进行下采样处理,生成6个1×22的特征图;第二个卷积层,使用16个1×5的卷积核对S2继续进行卷积处理,步长同样为1,并生成16个1×20的特征图;第二个池化层,对C3进行采样,获得16个1×10的特征图;接下来通过全连接(Full Connection)层,生成120个神经元,再经ReLu非线性激活函数;之后通过第二个全连接层,生成84个神经元,再一次经过ReLu函数;最后经过Softmax层,得到4类概率结果并输出。
图4 实验所用CNN网络结构

Fig. 4 Network structure of CNN in the experiment

3 实验区概况与数据来源

3.1 研究区概况

本实验研究区为河南省原阳县,隶属新乡市,地理位置处于113.36°E—114.15°E,34.55°N—35.11°N之间,总面积1339 km²。原阳县西南部地势最高,自西南至东北,海拔从93.5 m逐步下降到70.3 m;有黄河、海河两水系流经县内,水量充沛。原阳县耕地面积6.7万hm2,占全省土地面积的57%[16],四季分明,日照条件极佳,粮食产量居新乡市首位。县内秋收农作物为单季作物,主要作物包括玉米、水稻、花生,物候期如下:玉米在6月上旬播种,在9月中下旬收获;水稻于5月中下旬播种,10月中旬收割;花生于6月上旬播种,9月下旬收获。

3.2 遥感影像数据

哨兵2号卫星是由2枚卫星哨兵2A与哨兵2B组成的多光谱遥感影像数据卫星,2A发射于2015年6月23日,2B发射于2017年3月7日。哨兵2号原本单颗卫星重访周期为10 d,2颗卫星进入运行状态后在时间上互补,重访周期变至5 d。哨兵2号包含13个光谱波段(表2),覆盖可见光、近红外与短波红外波段,幅宽为290 km,空间分辨率随波段的不同而不同,分为10、20和60 m。
表2 哨兵2号数据参数

Tab. 2 Data parameter of Sentinel-2

波段编号 波段名称 中心波长/μm 空间分辨率/m
1 海岸气溶胶 0.443 60
2 蓝光 0.490 10
3 绿光 0.560 10
4 红光 0.665 10
5 植物红边 0.705 20
6 植物红边 0.740 20
7 植物红边 0.783 20
8 近红外 0.842 10
8A 植物红边 0.865 20
9 水蒸气 0.945 60
10 短波红外 1.375 60
11 短波红外 1.610 20
12 短波红外 2.190 20
本实验数据获取自欧洲航天局哥白尼计划网站(https://scihub.copernicus.eu/dhus/#/home)。选用2景哨兵2号多光谱影像(图5),成像日期分别为2017年6月27日和2017年8月6日(表3),正值玉米、水稻、花生等农作物生长关键期。在下载到官方提供的经过几何精校正L1C级数据后,利用SNAP平台[17]和欧洲航天局发布的Sen2cor插件[18]对L1C级多光谱数据进行预处理,具体包括辐射定标、大气校正、几何校正等,后续通过ENVI软件对影像的所有波段进行空间重采样处理,统一至10 m分辨率,并进行适应性剪裁处理。
图5 不同时相哨兵2号标准假彩色影像图

注: R: 近红外; G: 红; B: 绿。

Fig. 5 Images of sentinel-2 in different time phases

表3 实验影像数据信息

Tab. 3 Data information of experimental images

影像编号 时相 传感器 空间分辨率/m 云量/%
1 2017-06-27 MSI 10 3.9
2 2017-08-06 MSI 10 0.4

3.3 野外实测数据

为获取可靠样本信息,以验证实验结果,获取了在影像相近时期(2017年7月25—31日)的野外实测数据。采样地区包含原阳县13个农作物种植结构较为稳定的村庄,采样点远离居民点,排除了可能的干扰。
实测数据记录了水稻、玉米、花生等主要农作物的位置信息(图6),结合对遥感图像的目视解译,构建出样本数据集。地物种类为水稻、玉米、花生和其他地物(建筑、道路和水体等)共4类。为后续算法模型能够饱和训练,并客观验证各类算法的精度表现,本文以像元作为标注单位,以保证样本的数据量满足算法需求。标注数据集包含13 423个像元,为进一步消除样本在空间分布可能存在的集聚效应,数据集被随机打乱并划分为训练集(30%)、验证集(10%)和测试集(60%)3部分(表4),分别用于模型的拟合、确定网络结构并调整模型的参数,和对最终分类结果的精度检验。
图6 研究区地面采样点示意

Fig. 6 Schematic diagram of ground sampling points in the study area

表4 样本数据集

Tab. 4 Sample data set

编号 类别 训练集像元
数/个
验证集像元
数/个
测试集像元
数/个
总像元
数/个
1 水稻 1068 356 2136 3560
2 玉米 1004 335 2008 3347
3 花生 727 242 1454 2423
4 其它 1228 409 2456 4093

4 实验与结果分析

4.1 特征优选

Relief F算法基于特征对近距离样本的区分能力计算样本和特征的相关性。依据各个特征与类别的相关性对特征权重赋值,特征的权重大小代表了该特征分类能力的强弱,权重高意味着分类能力强,权重低则意味着分类能力弱,以此来优选出对训练贡献度高的关键特征。
实验利用Relief F算法对波段及植被指数共46维特征进行特征贡献值计算。其中,46维特征包含2景哨兵二号影像13个波段的光谱反射率与10种植被指数((13+10)×2=46)。根据特征贡献值对46维特征进行排序,部分统计结果见表5,其中统计表左侧为排序靠前的10个特征,右侧为排序靠后的10个特征。从表5可知,贡献值较大的特征主要为NDVI、RVI、EVI等植被指数,以及植被红边等光谱波段,并且相关特征在不同时相的分类贡献总体上具有一致性,说明上述特征在农作物的不同物候阶段均为分类的关键特征。其中,8月时相对应的植被指数在贡献程度表现更好。分析原因在于,6月27日影像对应水稻为秧苗期,玉米为出苗期,花生为下针期,该时期对应的3类作物均为生长初期,对应为叶片增长期;8月6日影像对应的水稻为长穗期,玉米为开花期,花生为结荚期,该时期的农作物均处于或接近生长的最盛期,叶片面积等生长指标为峰值。农作物处于初期生长阶段时,影像包含较多的土壤背景信息,而当农作物生长至繁茂期,土壤背景的干扰减弱。因此相比6月,8月时相对应的植被指数在农作物分类的特征贡献度上表现更好。
表5 特征贡献值排序(左侧为前十,右侧为后十)

Tab. 5 Sorting of feature contribution value (the top ten are on the left and the last ten on the right)

类别 特征名称 特征贡献值 类别 特征名称 特征贡献值
8月植被指数 NDVI 0.2318 6月光谱波段 短波红外2 0.0738
8月植被指数 RVI 0.2242 8月光谱波段 短波红外2 0.0737
8月植被指数 EVI 0.2144 6月植被指数 TVI 0.0488
6月光谱波段 植被红边4 0.2112 6月光谱波段 短波红外1 0.0471
8月光谱波段 植被红边4 0.2074 6月光谱波段 水蒸气 0.0462
6月植被指数 NDVI 0.2043 6月光谱波段 沿海气溶胶 0.0353
6月植被指数 RVI 0.1954 8月光谱波段 沿海气溶胶 0.0351
8月光谱波段 植被红边3 0.1943 6月光谱波段 近红 0.0334
6月光谱波段 植被红边3 0.1906 8月光谱波段 短波红外3 0.0331
6月植被指数 EVI 0.1888 8月光谱波段 短波红外1 0.0224
除植被红边外,其他波段反射率贡献值均弱于植被指数,这是因为植被指数通过综合不同的波段反射率信息,能有效地描述绿色植物长势和生物量信息,减少土壤背景与大气气溶胶的影响,突出农作物的信息表达,因此其特征贡献也更大。植被红边反映的是植被反射率在近红外线波段接近与红光交界处快速变化的区域,相比较其他常规波段,红边与植被的各种理化参数关系更紧密,能够作为描述农作物色素状态和健康状况的指示波段,因此对农作物的分类贡献也较大。
沿海气溶胶、短波红外等波段的特征贡献较低,对于其波段机理特性,沿海气溶胶波段对于作物与植被的反馈主要体现在宏观上,如能够反映植被覆盖疏密程度,而对于不同种类的作物类型细分并无过多正向作用。短波红外波段主要受到作物细胞水分含量的影响,对其生化结构的组成和水分含量的变化较为敏感,但对于不同种类的绿色作物植株带来的反射差异较小;此外,以可视化对比结果图7为例,相比较NDVI能够直观地反映不同地物空间分布差异,沿海气溶胶波段则无法提供分类相关的有效信息。波段机理特性分析、可视化分析等与经Relief F计算的特征贡献值结果表现相吻合,说明本文选取Relief F算法作为特征优选方法具有可靠性,可筛选出农作物分类的有效特征。
图7 对分类不同贡献度特征的对比

Fig. 7 Comparison of features of different contributions to classification

之后根据贡献值的排序情况设置分组(表6),特征的五类分组情况分别为:贡献值大于0.2的6个特征、贡献值大于0.15的14个特征、贡献值大于0.1的24个特征、贡献值大于0.05的38个特征和贡献值大于0的46个特征。基于相同的样本与模型架构,完成10次训练,每次迭代训练10 000次,取10次训练结果的平均精度。第1—第5组特征的平均训练精度分别为97.55%、98.81%、99.89%、99.71%和99.62%,也就是说平均训练精度随特征数量的增加首先呈上升趋势,在到达精度峰值后开始下降。最优训练精度出现在第3个分组,包含24个特征。
表6 特征分组与训练精度

Tab. 6 Grouping and training accuracy of feature

分组编号 分类阈值 特征数/个 特征 平均训练精度/%
1 贡献值>0.2 6 NDVI_8/RVI_8/EVI_8/VRE4_6/VRE_8/NDVI_6 97.55
2 贡献值>0.15 14 RVI_6/VRE3_6/VRE3_8/EVI_6/VRE2_8等 98.81
3 贡献值>0.1 24 NIR_8/GNDVI_6/MSR_8/NIR_6等 99.89
4 贡献值>0.05 38 TVI_6/R_6/G_6/B_6等 99.71
5 贡献值>0 46 SWIR1_6/SWIR2_8 /CA_6等 99.62
由此可见,最优特征集是由特定数量的特征组成的。在特征量过少时,高精度的差异性特征难以被提取。同时,并非所用特征越多,训练精度越高。在一定的样本数量下,特征冗余会导致低相关性特征的掺杂,影响训练精度,同时分类器性能会受到影响,引起分类速度的降低与准确性的下降。

4.2 分类结果与对比分析

实验利用Caffe平台作为深度学习的框架平台,服务器配置为Intel Core i7-6700,CPU主频为2.5 GHz,显卡为NVIDIA Titan RTX GPU。
为验证基于特征集的CNN分类方法的分类效果,应用同样遥感数据及训练集、验证集、测试集,分别利用基于波段反射率的SVM、基于波段反射率的CNN和基于最优特征集的CNN 3种分类方法对原阳县农作物进行分类提取,结果分别如图8所示。
图8 3种方法农作物遥感分类结果的对比

Fig. 8 Comparison of crop remote sensing classification results of three methods

从空间分布上来看,3种方法分类结果大体相似。玉米作为县内重要农作物,分布范围最为广阔,种植面积也最大,水稻种植区域较为集中,主要分布在东部太平镇、中西部师寨镇和西部卞庄村;花生种植土地较为分散,中部极少,多占据县境边缘地带,以南部居多。原阳县中心地区为县城,存在密集建筑物群,故在分类结果中均显示为非耕地。于视觉效果而言,3种方法分类结果在宏观上呈现出一致性,从一定程度上肯定了此次农作物分类结果的可靠性,也证明了3种方式均达到了一定的分类精度。但对于南部管厂镇农作物较稀疏地区而言,玉米、花生和非农作物的划分在3种分类方法的结果图上呈现出差异。基于最优特征集的CNN方法在区分镶嵌于南部大面积花生耕作区内的小地块的玉米耕作区时,实现了更为精准的区分。在面对水系、公路相对于农作物的区分,基于最优特征集的CNN方法下的识别更为细致、清晰,能识别出更细化的水系,受相似像元的干扰较小。可以看到,基于最优特征集的CNN方法在对较小地块、混合多种类型的农作物分类识别,和非农作物与农作物混合像元的辨别上,相较于基于SVM的方法与基于波段反射率的CNN方法显现出明显优势。
根据3种分类方式结果的混淆矩阵(表7表9)可以看出,原阳县内不同种类农作物的分类精度存在差异与规律。从基于最优特征集的CNN农作物分类结果来看,水稻、玉米、花生和非农作物的生产者精度分别为96.96%、96.31%、95.08%和96.74%。3种农作物中,水稻在各项精度上都优于其余两种农作物玉米、花生,主要原因是水稻种植区域聚集性强,并受种植条件约束,耕地中含水量较高,光谱信息明显区别于其他两种农作物,受相似作物像元影响较小;且水稻训练样本较多,可提取特征信息质量更优;花生植株分布较为稀疏,与种植范围极广的玉米地互相掺杂,复杂度高,易错分为其他类别,识别难度高于水稻;玉米因其广阔的种植范围,与其他农作物和地物像元混合程度更高,故在3种农作物的分类精度排序中排名最后。
表7 基于波段反射率的SVM分类结果的混淆矩阵

Tab. 7 Confusion matrix of classification results based on SVM with band reflectivity

类别 水稻 玉米 花生 其他 PA/%
水稻 2011 42 31 52 94.15
玉米 19 1893 54 42 94.27
花生 22 81 1323 38 90.37
其他 53 37 45 2321 94.50
UA/% 95.53 92.21 91.05 94.62
OA/% 93.60
Kappa 0.91
表8 基于波段反射率的CNN分类结果的混淆矩阵

Tab. 8 Confusion matrix of classification results based on CNN with band reflectivity

类别 水稻 玉米 花生 其他 PA/%
水稻 2032 34 25 37 95.49
玉米 16 1905 49 38 94.87
花生 18 72 1351 23 92.28
其他 47 29 26 2354 95.85
UA/% 96.17 93.38 93.11 96.00
OA/% 94.86
Kappa 0.93
表9 基于最优特征集的CNN分类结果的混淆矩阵

Tab. 9 Confusion matrix of classification results based on CNN with optimal feature collection

类别 水稻 玉米 花生 其他 PA/%
水稻 2071 23 14 28 96.96
玉米 8 1934 31 35 96.31
花生 16 44 1392 12 95.08
其他 42 21 17 2376 96.74
UA/% 96.91 95.65 95.74 96.94
OA/% 96.39
Kappa 0.95
通过精度评价表(表10)可以明晰,基于SVM的方法、基于波段反射率的CNN和基于最优特征集的CNN方法总体分类精度分别为93.60%、94.86%和96.39%,Kappa系数分别为0.91、0.93和0.95,均呈上升趋势。基于最优特征集的CNN方法的农作物分类在包括Kappa系数、生产者精度和总体分类精度在内的各项指标上,都达到了最佳的数值。
表10 3种分类方式精度评价

Tab. 10 Accuracy evaluation table of three classification methods

分类方式 总体精度/% Kappa系数
基于波段反射率的SVM分类 93.60 0.91
基于波段反射率的CNN分类 94.86 0.93
基于最优特征集的CNN分类 96.39 0.95
进一步分析,一方面,在仅利用波段反射率信息的情况下,CNN的分类效果优于SVM。传统的SVM作为一类以监督学习方式对数据进行二元分类的分类器,以核函数的方法对农作物进行分类识别[19],其性能不会在数据量大量增多的情况下显著提升;而CNN分类方式虽在数据量较小时与SVM性能相当,但是随数据量扩增,它能够在更高层面上提取农作物本质特征,基于非线性变换的多层结构利用光谱信息,在分类的性能与精度上大幅上涨;另一方面,基于最优特征集的CNN分类结果优于基于波段反射率的CNN分类结果,能够说明对特征的优选提升了训练精度,实现对农作物更准确的分类。

5 结论与讨论

本文构建了一种基于特征优选的卷积神经网络农作物分类方法,在哨兵2号多时相多光谱遥感影像波段反射率数据集的基础上,提取光谱特征,利用Relief F算法对波段及植被指数进行特征贡献排序,获取最优光谱特征集,完成对原阳县主要农作物玉米、水稻、花生等的精细分类与制图,最后将此方法与基于波段反射率的CNN方法和基于波段反射率的SVM方法的作物分类结果分析对比。实验结果表明:
(1)基于波段反射率信息的CNN农作物遥感分类方式分类效果优于SVM,而基于最优特征集的CNN农作物遥感分类方式分类效果又优于基于波段反射率信息的CNN方法。其中,基于最优特征集的CNN农作物分类达到最优精度96.39%,展现出较好的分类能力。CNN凭借多层卷积的特点和多层非线性变换的组合方式,通过提取农作物特征以识别影像中不同种类农作物的差异,从而快速、精准地实现农作物分类。在经过特征筛选后,基于优选特征集的CNN分类方法更有效地利用图像信息,对“同谱异物”和“同物异谱”的现象有所缓解,实现了更精准的农作物分类识别。
(2)植被指数可强化不同作物差异性的特征表达,从而有效提升基于CNN方法的农作物分类效果。对不同波段反射率按照一定的组合方式构建植被指数,从而减少土壤背景、大气气溶胶的影响。增强植被信息,可强化不同作物间的差异性,辅助波段反射率信息并结合CNN特征提取优势,可有效提升农作物遥感分类效果。
(3)NDVI/EVI/RVI/植被红边等信息为农作物分类的关键特征。基于Relief F算法对植被指数、波段反射率等特征进行农作物分类贡献度计算,不同时相影像对应的关键特征具有相似性,NDVI/EVI/RVI等植被指数及植被红边波段对作物分类贡献度较大,而沿海气溶胶、短波红外等波段特征则对农作物分类贡献度低。
(4)基于CNN的农作物遥感分类存在最优特征子集。利用Relief F算法进行特征筛选,以贡献度排序进行特征数量的逐级增加,基于CNN的训练精度呈先增加后降低的变化趋势,说明基于CNN的农作物分类存在最优特征子集。即特征量过少时,难以提取高精度的差异性特征,特征过多时,对分类贡献较低的冗余特征会降低训练效果。
结合特征优选与深度学习的农作物分类方法展现出较好的分类效果,对比传统方法及卷积神经网络方法在准确性上有较大优势。鉴于实验所构建方法在处理海量数据上的潜力,期待能够在更丰富、复杂研究区域验证本算法的性能。此外,本实验对特征子集进行筛选时,特征贡献的分组只选取了5类组合,在应用于更复杂地形区域时可能存在不足,有待在今后的研究中不断改进优化。
[1]
郭交, 朱琳, 靳标. 基于Sentinel-1和Sentinel-2数据融合的农作物分类[J]. 农业机械学报, 2018,49(4):192-198.

[ Guo J, Zhu L, Jin B. Crop classification based on data fusion of Sentinel-1 and Sentinel-2[J]. Transactions of The Chinese Society of Agricultural Machinery, 2018,49(4):192-198. ]

[2]
史飞飞, 高小红, 杨灵玉, 等. 基于HJ-1A高光谱遥感数据的湟水流域典型农作物分类研究[J]. 遥感技术与应用, 2017,32(2):206-217.

[ Shi F F, Gao X H, Yang L Y, et al. Research on typical crop classification based on HJ-1A hyperspectral data in the Huangshui River basin[J]. Remote Sensing Technology and Application, 2017,32(2):206-217. ]

[3]
吴静, 吕玉娜, 李纯斌, 等. 基于多时相Sentinel-2A的县域农作物分类[J]. 农业机械学报, 2019,50(9):194-200.

[ Wu J, Lv Y N, Li C B, et al. Fine classification of county crops based on multi-temporal images of Sentinel-2A[J]. Transactions of The Chinese Society of Agricultural Machinery, 2019,50(9):194-200. ]

[4]
李昌俊. 基于深度学习的农业遥感图像耕地提取技术研究[D]. 合肥:中国科学技术大学, 2018.

[ Li C J. Research on cultivated land extraction technology of agricultural remote sensing images based on deep learning[D]. Hefei: University of Science and Technology of China, 2018. ]

[5]
Ji S P, Zhang C, Xu A J, et al. 3D convolutional neural networks for crop classification with multi-temporal remote sensing images[J]. Remote Sensing, 2018,10(1):75.

DOI

[6]
Jia J H, Yang N, Zhang C, et al. Object-oriented feature selection of high spatial resolution images using an improved Relief algorithm[J]. Mathematical and Computer Modelling, 2013,58(3-4):619-626.

DOI

[7]
周成虎, 骆剑承, 杨晓梅. 遥感影像地学理解与分析[M]. 北京: 科学出版社, 1999.

[ Zhou C H, Luo J C, Yang X M. Geological understanding and analysis of remote sensing images[M]. Beijing: Science Press, 1999. ]

[8]
Wang D, Lin H, Chen J S, et al. Application of multi-temporal ENVISAT ASAR data to agricultural area mapping in the Pearl River Delta[J]. International Journal of Remote Sensing, 2010,31(6):1555-1572.

DOI

[9]
陈拉, 黄敬峰, 王秀珍. 不同传感器的模拟植被指数对水稻叶面积指数的估测精度和敏感性分析[J]. 遥感学报, 2008,12(1):143-151.

[ Chen L, Huang J F, Wang X Z. Estimating accuracies and sensitivity analysis of regression models fitted by simulated vegetation indices of different sensors to rice LAI[J]. Journal of Remote Sensing, 2008,12(1):143-151. ]

[10]
郭铌. 植被指数及其研究进展[J]. 干旱气象, 2003,21(4):71-75.

[ Guo N. Vegetation index and its advances[J]. Arid Meteorology, 2003,21(4):71-75. ]

[11]
Liu H, Yu L. Toward integrating feature selection algorithms for classification and clustering[J]. IEEE Transactions on Knowledge and Data Engineering, 2005,17(4):491-502.

DOI

[12]
Robnik-Ikonja M, Kononenko I. Theoretical and empirical analysis of Relief F and RRelief F[J]. Machine Learning, 2003,53(1/2):23-69.

DOI

[13]
肖艳, 姜琦刚, 王斌, 等. 基于Relief F和PSO混合特征选择的面向对象土地利用分类[J]. 农业工程学报, 2016,32(4):211-216.

[ Xiao Y, Jiang Q G, Wang B, et al. Object based land-use classification based on hybrid feature selection method of combining Relief F and PSO[J]. Transactions of The Chinese Society of Agricultural Engineering, 2016,32(4):211-216. ]

[14]
周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017,40(6):1229-1251.

[ Zhou F Y, Jin L P, Dong J. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017,40(6):1229-1251. ]

[15]
Li E Z, Xia J S, Du P J, et al. Integrating multilayer features of convolutional neural networks for remote sensing scene classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017,55(10):5653-5665.

DOI

[16]
刘玮敏, 李曼, 张彦利. 原阳县农业气候特征分析[J]. 乡村科技, 2018(9):106-108.

[ Liu W M, Li M, Zhang Y L. Analysis of agricultural climate characteristics in Yuanyang County[J]. Rural Science and Technology, 2018(9):106-108. ]

[17]
Padró J, Xavier P, Aragonés D, et al. Radiometric correction of simultaneously acquired Landsat-7/Landsat-8 and Sentinel-2A imagery using Pseudoinvariant Areas (PIA): contributing to the Landsat time series legacy[J]. Remote Sensing, 2017,9(12):1319.

DOI

[18]
Main-Knorn M, Pflug B, Louis J, et al. Sen2Cor for Sentinel-2[C]. Image and Signal Processing for Remote Sensing, 2017.

[19]
Sun Z H, Di L P, Fang H. Using long short-term memory recurrent neural network in land cover classification on Landsat and cropland data layer time series[J]. International Journal of Remote Sensing, 2018,40(1):1-22.

DOI

文章导航

/