Mapping the Spatial Distribution of Tea Plantations with 10 m Resolution in Fujian Province Using Google Earth Engine

  • XIONG Haoli ,
  • ZHOU Xiaocheng , * ,
  • WANG Xiaoqin ,
  • CUI Yajun
Expand
  • Key Laboratory of Spatial Data Mining and Information Sharing of Ministry of Education,National & Local Joint Engineering Research Center of Satellite Geospatial Information Technology, The Academy of Digital China (Fu Jian), Fuzhou University 350108, China
* ZHOU Xiaocheng, E-mail:

Received date: 2020-10-08

  Request revised date: 2021-01-31

  Online published: 2021-09-25

Supported by

Subproject of Strategic Priority Research Program of the Chinese Academy of Sciences(XDA23100504)

Key Project of Production, Education and Research of Universities in Fujian Province(2017Y4010)

Copyright

Copyright reserved © 2021

Abstract

As a major tea-producing province in China, Fujian has a long history of tea culture. According to the National Bureau of Statistics in recent 10 years, the total planting area of tea in Fujian ranked the fifth among all the provinces in China. Rapid and accurate acquisition of tea plantation spatial distribution has important decision-making significance for agricultural economic development and ecological environment protection in Fujian province. However, it is difficult to obtain the spatial distribution of tea plantation in large areas accurately by traditional methods. Based on the GEE cloud platform, we firstly obtained Sentinel-1、Sentinel-2, and terrain data covering the whole province, and then extracted a total of 98 features including spectral features, texture features, and terrain features. Secondly, the Support Vector Machine-recursive Feature Elimination (SVM_RFE) was used to select features. Four groups of experiments were constructed according to different features and optimized feature subsets. Finally, the Support Vector Machine classifier (SVM) was used to extract tea plantation and obtain the spatial distribution map of tea plantation with a resolution of 10 m in Fujian province in 2019. The results show that: (1) Spectral features play an important role in tea plantation information extraction, followed by texture and terrain features. (2) It can improve the extraction accuracy by using SVM_RFE to select some features, that are useful to tea plantation extraction, from a large number of spectral, textural and topographic features. The overall accuracy is 94.65% while the kappa coefficient is 0.93. The producer accuracy and user accuracy of the tea plantation are 91.64% and 92.91%, respectively. (3) In 2019, the tea plantation area in Fujian province was 1913 km2. Tea plantations were mainly distributed in Anxi County, Fuding City, Fuan City, Wuyishan City, and Shouning County, with a total area of 910 km2, accounting for ~48% of the entire tea plantation area in Fujian province. The cloud computing technology based on GEE platform can overcome the problem of lacking computing power for large-scale tea plantation monitoring. This research can extract tea plantation distribution in Fujian province accurately, which has reference value for tea plantation and other crop extraction in hilly and mountainous areas of South China, and provides support for the government and related departments to manage tea plantation.

Cite this article

XIONG Haoli , ZHOU Xiaocheng , WANG Xiaoqin , CUI Yajun . Mapping the Spatial Distribution of Tea Plantations with 10 m Resolution in Fujian Province Using Google Earth Engine[J]. Journal of Geo-information Science, 2021 , 23(7) : 1325 -1337 . DOI: 10.12082/dqxxkx.2021.200583

1 引言

福建省作为我国的产茶大省,拥有1600多年的产茶史,茶文化源远流长,据国家统计局近10年统计,福建省茶园面积及茶叶产量居于全国第五[1],茶叶的种植对于农业经济和农村发展具有重要意义。准确地获取茶树种植区分布,适度的把控茶业种植面积,因地制宜发展,对政府部门进行茶园规划管理、茶叶估产及灾害预防处理具有重要的意义[2]
传统的茶园监测方法主要是通过统计上报和野外实测完成的,这种方法效率低、精度差、成本高,且无法做到持续性的监测[3]。遥感技术具有大范围、长时间对地观测等特征,被广泛用于土地分类、植被监测等研究,也为高效提取茶园提供了可能。茶叶是多年生的木质常绿植物,其光谱特征容易与果园、幼林地、梯田等类似植被混淆,因此仅用光谱特征进行茶园识别很难达到理想的准确性。Dihkan等[4]利用光谱特征来区别植被和非植被,利用MNDVI指数和Gabor纹理特征来区分易于茶园混淆的灌木及果园等。Xu等[5]结合雷达特征、植被指数及地形特征提取云南勐海县西双版纳茶园,结果表明,PALSAR与光学数据结合进行茶园制图取得精度较高。Akar等[6]利用随机森林分类算法对茶园和榛子进行分类,结果表明相比于单一的使用光谱特征进行分类,将灰度共生矩阵(GLCM)和Gabor滤波等纹理特征与NDVI光谱特征组合进行分类,分类准确度显著提高。
多源特征结合使用为茶园提取提供思路,但随着高维特征的引入,分类效率和分类精度均受到不同程度的影响,不同特征选择算法的引入成为研究重点之一。如王娜等[7]在进行苏北地区主要农作物识别时利用单变量特征选择算法进行特征选择。Wang等[8]利用随机森林特征选择方法筛选特征,结果表明基于特征选择后的特征子集提取茶园的精度最高。Wu等[9]在进行森林树种识别时分别使用随机森林和递归消除支持向量机(SVM_RFE)进行特征选择,结果表明递归消除支持向量机特征选择优于随机森林特征选择。因此综合多源特征利用适当的特征选择算法,筛选出对茶园提取有益的特征,可为茶园提取研究提供参考借鉴。
目前国内外研究主要使用Landsat中等分辨率[8,10]或高等分辨率光学影像[6,11]进行茶园识别,前者的识别精度较低,后者的识别精度虽有显著提高但因高分辨率影像价格昂贵,无法提供高时间分辨率等问题,很难应用于大范围的茶园识别和监测。在这种情况下,Sentinel-2光学影像凭借其高空间、光谱和时间分辨率,被广泛应用于农作物和其他植被的提取中[12,13]。但由于光学影像易受云层及阴雨天气影响,容易形成无效观测,而Sentinel-1雷达影像对云层有着极强的穿透能力,可以获取云覆盖下的图像信息,获取的图像具有较好的纹理信息,可以弥补光学影像的不足[14,15]。同时考虑到以上研究大多都是基于单机分类,分类速度慢、效率低,难以满足大面积提取地物的要求。Google Earth Engine(GEE)云平台借助于谷歌公司强大的计算能力和海量的在线数据,为大规模遥感数据处理和挖掘分析提供可能[16]。用户通过调用GEE平台发布的大量地理数据产品,结合自身需求,实现在线计算运行、大大减轻数据获取和处理的工作量[12]
本研究借助于GEE云平台,结合Sentinel-1和Sentinel-2影像首次获得了10 m分辨率的福建省茶园空间分布信息,综合多源特征构建分类方案结合递归消除支持向量机(SVM_RFE)特征选择算法,使用支持向量机分类器进行福建省茶园分布制图。克服了大尺度茶园监测运算能力不足等问题,在准确提取茶园信息的同时提高了运算效率、降低成本,为福建省茶叶产业发展和预测,为生态环境的评价可提供重要的决策支持。

2 研究区概况与数据源

2.1 研究区概况

福建省地处中国东南部(115°50′E—120°40′E,23°33′N—28°20′N),下辖福州、厦门、泉州、漳州、莆田、龙岩、三明、南平、宁德9个地级市(图1)。福建省山地、丘陵占全省总面积的80%以上,森林资源丰富,森林覆盖率居于全国首位。福建省属于亚热带海洋性季风气候,温暖湿润,雨水充沛,光照充足,其独特的气候条件和地形十分适合茶树生长,2019年全省茶园面积达到2100 km2,居于全国第五,其中以安溪县、福鼎市、武夷山市为代表的安溪铁观音、福鼎白茶、武夷山大红袍是福建乃至全国的名牌。
图1 福建省地理位置

Fig. 1 Location of the study area in Fujian province

2.2 数据源与预处理

2.2.1 遥感数据
在本研究中,所有遥感数据均通过GEE平台在线编写代码实现调用、处理,包括:Sentinel-1(S1)雷达数据和Sentinel-2(S2)多光谱数据。S1数据为干涉模式(IW)影像产品,极化方式为VV+VH双极化,该数据集已经使用Sentinel-1工具箱完成预处理,即标定轨道参数、边界噪音去除、去除热噪声、辐射定标、地形校正等[17],最终得到数据产品的空间分辨率为10 m。S2采用的数据是经过辐射定标和几何校正的Level-1C产品,其包含13个光谱波段,3个QA波段,其中QA60波段包含云掩膜信息。相关研究表明[10]:10月各地物间的差异最大,能更好的区分茶园和其他地物(如:果园、耕地等)。因此,为了获得无云覆盖全省且适合茶园提取的影像数据,设置S1和S2影像获取时间为2019年9月10日到2019年11月10日,共获得S1影像64景并计算后向散射系数VV和VH的均值得到S1合成影像,以供后续进一步研究。针对S2影像利用CLOUDY_PIXEL_PERCENTAGE筛选云量像素百分比小于5%的影像,并设置QA60的Bit10和Bit11的值均小于0去除卷云和厚云,最终得到112景S2无云影像并计算其平均值,得到S2合成影像。
2.2.2 地形数据
本文使用的是航天飞机雷达地形任务(The Shuttle Radar Topography Mission, SRTM[18])获得近全球规模的数字高程模型SRTMGL1_003产品,空间分辨率为30 m。在GEE中使用 resample(mode)和reproject(crs, crsTransform, scale)函数将其转换为10 m空间分辨率,并按照福建省行政边界进行裁剪。
2.2.3 样本数据
本研究根据实际的地类分布情况,将研究区土地覆盖类型分为人工地表(建筑物、道路、裸地等)、耕地、林地、茶园和水体(水体、湖泊、水库等)5类。基于福建省矢量边界随机生成样本点数据7046个,将选择的样本点数据导入到Google Earth平台,根据S1和S2影像数据的获取时间,在对应的Google Earth历史影像中对所获得的样本点逐点进行目视判读。此外,通过野外GPS实地采集2018—2019年的武夷山市、福安市和安溪县的样本点数据1062个。以上,共获得样本点数8108个,其中人工地表1120个(包含134个实地样点)、耕地1030个(包含157个实地样点)、林地3509个(包含315个实地样点)、茶园1953个(包含406个实地样点)、水体496个(包含47个实地样点)。具体各类样本数据及分布如图2所示。本文将样本点数据按照70%的训练样本和30%的验证样本参与分类。
图2 野外验证样本点和目视解译样本点空间分布

Fig. 2 Spatial distribution of field validation sample points and visual interpretation sample points

3 研究方法

本文通过GEE云平台,快速获取并处理了覆盖福建省的S1、S2数据和地形数据,在此基础上提取光谱特征、纹理特征及地形特征。利用SVM_RFE进行特征优化,根据选取的特征变量设置4组实验,使用支持向量机分类器进行分类,以获得最佳的茶园提取方案,最终得到福建省2019年茶园专题空间分布图,并以福建省2019年的统计年鉴为参考,利用该数据与本文提取的茶园面积进行比较分析。总体技术流程图如图3所示。
图3 总体技术流程

Fig. 3 Technical flowchart

3.1 特征提取

特征提取是影像分类的重要步骤之一,由于茶园与果园、幼林地、梯田等有着相似的光谱特征,容易出现错分漏分现象,仅利用S2影像的光谱特征难以获得较为准确的茶园分布信息,因此本文通过分析不同的数据源构建了3种不同的特征变量。
(1)光谱特征。基于预处理后的S2光学影像集合,提取原始13个波段、5个植被指数和8个红边指数,包括:归一化植被指数NDVI[19]、归一化水体指数NDWI[20]、地表水分指数LSWI[21]、归一化差异耕作指数NDTI[22]、修正型归一化植被指数MNDVI[4]和对植被非常敏感的8个红边指数[23]。本文计算每景影像的13个植被指数,将其作为独立的光谱波段加入原始影像中参与分类,所用植被指数见表1
表1 本文所用的植被指数

Tab. 1 Vegetation indices used in this research

植被指数简称 植被指数说明 计算公式 公式编号 参考文献
NDVI 归一化植被指数 NDVI = (B8 - B4)/(B8 + B4) (1) Tucker[19]
NDWI 归一化水体指数 NDWI= (B3 - B8)/(B3 + B8) (2) Gao[20]
LSWI 地表水分指数 LSWI = (B8 - B11)/(B8 + B11) (3) Xiao等[21]
NDTI 归一化差异耕作指数 NDTI = (B11 - B12)/(B11 + B12) (4) Deventer等[22]
MNDVI 修正型归一化植被指数 MNDVI = (B4 - B3)/(B4 + B3) (5) Dihkan等[4]
IRECI 新型倒红边叶绿素指数 IRECI = (B7 - B4)/(B5/B6) (6) Frampton等[24]
MTCI 地面叶绿素指数 MTCI= (B6 - B5)/(B5 - B4) (7) Dash等[25]
NDVIre1 归一化植被指数红边1 NDVIre1 = (B8A - B5)/(B8A + B5) (8) Gitelson等[26]
NDVIre2 归一化植被指数红边2 NDVIre2 = (B8A - B6)/(B8A + B6) (9) 张磊等[27]
NDVIre3 归一化植被指数红边3 NDVIre3 = (B8A - B7)/(B8A + B7) (10) 张磊等[27]
NDre1 归一化差异红边1 NDre1 = (B6 - B5)/(B6 + B5) (11) Gitelson等[28]
NDre2 归一化差异红边2 NDre2 = (B7 - B5)/(B7 + B5) (12) Merzlyak等[29]
CIre 红边叶绿素指数 CIre = B7/B5 - 1 (13) Gitelson等[28]

注:B3、B4、B5、B6、B7、B8、B8A、B11和B12分别为蓝波段、绿波段、红波段、植被红边波段1、植被红边波段2、植被红边波段3、宽带近红外波段、窄带近红外波段、短波红外波段1和短波红外波段2的反射率。

(2)纹理特征。Haralick等提出的灰度共生矩阵(GLCM)原理简单,易于实现,具有较强的适应能力和鲁棒性,在遥感影像纹理提取中有广泛的应用[30]。地表纹理对雷达后向散射具有很强的影响[31],基于雷达影像的纹理信息结合光学数据可以提高植被的分类精度[32]。因此,本文基于GEE提供的GLCM纹理特征函数glcmTexture,分别计算核大小为3×3的S2近红外波段、NDTI指数、S1后向散射系数的纹理特征,共68个[33,34]表2)。
表2 计算的GLCM纹理特征

Tab. 2 GLCM texture measures

波段 描述 波段 描述
asm 角二阶矩 var 方差
corr 相关性 savg 和平均
idm 逆差矩 sent 和熵
savr 和方差 davr 差方差
ent imcorr1/imcorr2 相关信息测度1/2
dent 差熵 inertia 惯性矩
diss 差异性 shade 聚类萌
contrast 对比度 prom 聚类突
(3)地形特征。考虑到茶树种植对地形有一定要求,本研究基于GEE平台,在线调用SRTMGL1_003数据,计算4种常用的地形特征,包括坡度(Slope)、坡向(Aspect)、海拔高度(Elevation)及山体阴影(Hillshade),将其作为4个独立波段参与特征构建。以上在GEE平台中计算的特征共有98个(表3)。
表3 本文涉及的特征信息汇总

Tab. 3 Summary of feature information used in this research

数据源 特征名称 特征说明或介绍 特征数目
S2 原始光谱特征 B1, B2, B3, B4, B5, B6, B7, B8, B8A, B9, B10, B11, B12 13
植被指数特征 NDVI, NDWI,LSWI, NDTI, MNDVI 5
红边指数特征 IRECI, MTCI, NDVIre1, NDVIre2, NDVIre3, NDre1, NDre2, CIre 8
B8波段纹理特征 NIR近红外波段的17个纹理特征 17
NDTI指数纹理特征 NDTI指数的17个纹理特征 17
S1 雷达纹理特征 VVVH的17个纹理特征 34
SRTM 地形特征 Elevation, Slope, Aspect, Hillshade 4
合计 98

3.2 实验方案说明

为了得到茶园提取的最佳方案,本文共设计了4种实验方案(表4),主要有以下2个目的:① 通过不同实验方案之间的对比,探索茶园提取的最佳方法;② 利用SVM_RFE特征选择算法提取较为重要的特征变量,实现对高维数据降维处理,选择出对茶园提取最为重要的特征变量。
表4 实验方案信息表

Tab. 4 The information table of experimental programs

实验方案 特征组合
1 光谱特征
2 光谱特征+纹理特征
3 光谱特征+纹理特征+地形特征
4 SVM_RFE特征优选

3.3 支持向量机分类算法

支持向量机(SVM)是20世纪70年代发展起来的一种监督的、非参数的统计学习技术,20世纪90年代作为一种基于非概率二元函数的机器学习方法被引入[35,36]。由于支持向量机具有很高的泛化能力且仅需要小数量的样本,可以支持高维特征空间的分类,能够在高维特征空间中获得较高的精度,在遥感研究中得到了广泛的应用[37,38]。Mountrakis等[39]总结了100多篇使用SVM进行图像分类的文献,指出尽管支持向量机在参数选择和计算要求方面存在局限性,但在训练样本有限的情况下,支持向量机的性能要优于大多数其他分类器。本文利用SVM进行分类,其关键是核函数类型及其参数的选取[40]。常用的核函数类型有线性函数、多项式函数、RBF函数和Sigmoid函数,其中RBF核函数应用较为广泛[41],因此本文选择RBF作为基函数,gamma参数设置为0.5,cost设置为50。

3.4 特征优选方法

本文利用递归消除支持向量机算法进行特征选择,递归消除算法(Recursive feature elimination, RFE)是一种集成方法,将SVM分类算法和RFE结合使用,可以达到较优的结果。SVM_RFE特征选择算法的具体流程如图4所示,首先利用全部的特征作为初始特征,利用SVM计算特征权重,根据权重的大小进行特征排序,每次去除一个特征权重最小的特征,同时使用SVM进行分类,使用总体精度和Kappa系数作为精度评价标准,如此迭代直到特征集为空为止,输出精度评价最高的特征组合[33]
图4 递归消除支持向量机流程

Fig. 4 Feature selection using support vector machine-recursive feature elimination(SVM_RFE)

3.5 精度评价方法

本文主要利用混淆矩阵进行精度评价,分别计算4种分类方案的生产者精度(Producer's Accuracy, PA)、用户精度(User's Accuracy, UA)、总体精度(Overall Accuracy, OA)和Kappa系数。其中OA和Kappa系数用来评价总体的分类精度,PA和UA用来衡量各类的漏分和错分误差。

4 结果与分析

4.1 特征选择

本文共选择98个特征参与茶园提取,SVM_RFE特征选择算法得出的结果如图5所示,其中总体精度和Kappa系数均采用十折交叉验证的均值。
图5 使用递归消除支持向量机特征选择结果

Fig. 5 Feature selection using support vector machine-recursive feature elimination(SVM-RFE)

图5中可以直观地看出,当参与分类特征的从1增加到5时,分类的总体精度和Kappa系数呈现一个快速上升的趋势,前5个特征分别为NDTI、SLOPE、B12、NDTI_savg和NDVIre1。当特征数从6增加到18,分类的总体精度和Kappa系数平稳增长,其特征按重要性递减排列为NDWI、VH_diss、B5、VV_savg、B6、NDre1、B8、B11、NDVI、B4、NDVIre2、LSWI、VH_ent。特征数在18之后,随着特征数目的增加,分类精度趋于稳定,因此,本文选择前18个特征变量为最优特征变量,组成方案4中的特征组合,其中包括光谱特征13个,纹理特征4个,地形特征1个。从特征优选的结果来看,光谱特征在茶园提取中占据着比较重要的位置,这与实际相符,Sentinel-2遥感影像具有10 m分辨率,其光谱特征对于作物提取以及分类具有重要意义。基于随机选取的70%训练样本点统计各地物光谱均值及方差可知(图6),茶园在红边1波段B5、近红外波段B8以及短波红外2波段B12与其他地物具有一定的可分性,因此这3个波段及其构建的相关植被指数在特征优选中均被选出。有研究表明[42],茶园种植对地形有着一定的要求,种植坡度范围为5~25°,坡度太小的平坦区域往往种植水稻、烟叶等经济作物,坡度太高,不利于茶园人工护养及耕作,因此坡度作为第二个重要的特征被选择。此外,茶园主要分布在景观复杂的丘陵山区地带,其内部杂乱无序,呈现出茶树与裸地、灌木、人造地物等其他地物相互交错的情况,因此描述纹理规则程度的相关纹理特征和平均、熵及差异性被选出。
图6 地物光谱曲线均值和方差

Fig. 6 Mean and variance of ground feature spectral curves

4.2 茶园提取精度对比分析

不同实验方案所得到的分类结果各不相同,利用支持向量机分类器,对上述的4个实验方案进行分类,由精度验证表5可知,单独利用光谱特征进行茶园提取,就能取得较高的分类精度,其总体精度达89.42%,Kappa系数为0.85。这说明Sentinel-2数据的光谱特征在地物分类方面具有显著优势,同时也进一步佐证特征选择结果。但耕地和茶园的PAUA均不到85%,说明仅使用光谱特征不能有效提取茶园和耕地。在方案1的基础之上加上纹理特征,其总体精度和Kappa系数均有明显的提高,其中总体精度提高3.62%,Kappa系数提高5%,其中茶园和耕地的PAUA提高程度最大,茶园的PA提升6.82%,UA提高5.81%,耕地的PA提升4.26%,UA提高了9.82%,说明纹理特征能够有效的减少茶园和耕地的漏提和误提现象。方案3在方案2的基础上加入地形特征,其总体精度提高0.83%,Kappa系数提高2%,地形特征的加入使耕地的PAUA有了进一步的提高,均达到了90%以上。此外,地形特征的加入也进一步减少了茶园的错分现象,茶园的UA提高了1.4%。特征优选后的方案4,其提取精度最高,总体精度为94.65%,Kappa系数为0.93,较方案3的精度有所提高,这表明利用SVM_RFE特征选择算法筛选特征后,虽然分类参数的维度大幅度降低(从98维减少到18维),但能有效的保留地物最重要的特征变量,在降低数据维度的同时,仍能保持较高的精度,避免了交叉冗余信息对分类结果的影响,缩短运行的时间提高分类精度和效率。
表5 不同实验方案的分类精度统计

Tab. 5 The statistics of classification accuracy for different classification experiments

实验方案 OA/% Kappa系数 人工地表 耕地 林地 茶园 水体
PA/% UA/% PA/% UA/% PA/% UA/% PA/% UA/% PA/% UA/%
1 89.42 0.85 93.70 96.07 83.28 80.38 92.28 91.74 83.45 84.31 95.33 96.62
2 93.04 0.90 94.79 96.11 87.54 90.20 95.11 94.01 90.27 90.12 96.67 96.03
3 93.87 0.92 94.79 96.11 91.15 91.45 96.09 94.70 90.27 91.52 96.00 96.64
4 94.65 0.93 95.62 96.14 93.11 92.51 96.19 95.44 91.64 92.91 96.67 96.67

注:表中OA、PA和UA分别代表总体精度、生产者精度和用户精度。

表6为茶园提取总体精度最高(方案4)的混淆矩阵,从表中可以看出,与茶园混淆最多的是林地,加入纹理特征和地形特征后,茶园提取精度有一定的提高,虽然茶园与林地仍有部分混淆,但其分类总体精度达94.65%,Kappa系数达0.93,茶园提取的用户精度和生产者精度均在90%以上,总体上满足茶园专题信息提取的要求。
表6 最高总体精度的混淆矩阵

Tab. 6 Confusion matrix of highest overall accuracy classification

类别 人工地表 耕地 林地 茶园 水体 总计 用户精度/%
人工地表 349 8 2 4 0 363 96.14
耕地 5 284 8 7 3 307 92.51
林地 6 2 984 37 2 1031 95.44
茶园 2 10 29 537 0 578 92.91
水体 3 1 0 1 145 150 96.67
总计 365 305 1023 586 150 2429
生产者精度/% 95.62 93.12 96.19 91.64 96.67
总体精度(OA):94.65% Kappa系数:0.93
为了进一步验证不同方案识别茶园的效果,首先对分类结果进行二值化处理[41],其中1表示茶园,2表示非茶园,其次对本文的4组分类方案得到的分类结果做显著性分析(McNemar检验[43])。方案4与其他3种方案的检验统计量均大于1.96(表7),说明在95%的置信水平上方案4分类结果与其他3种方案的分类结果之间存在比较显著的差异。
表7 不同分类方案结果的差异显著性

Tab. 7 McNemar test for different classification experiments

实验方案 方案1(光谱) 方案2(光谱+纹理) 方案3(光谱+纹理+地形)
方案2(光谱+纹理) 7.63*
方案3(光谱+纹理+地形) 7.30* 0.90
方案4(SVM_RFE特征优选) 9.04* 3.09* 4.16*

注:* 表示置信度小于0. 05。

4.3 茶园空间分布及面积统计

本文基于GEE平台,利用SVM_RFE从多源特征中选出最优分类特征,完成福建省2019年10 m分辨率茶园的分布制图。随机抽取茶园提取结果进行细节展示(图7(b)),可以看出,基于本文方法提取的茶园地块边界与谷歌影像较为吻合,有较高的准确性。从福建省茶园空间分布图(图7(a))中可以看出,福建省茶园种植区主要分布在闽南、闽东北和闽中,按市级划分主要可以划分为3个等级:厦门市、莆田市和三明市茶园分布相对较少;龙岩市、福州市和漳州市次之;宁德市、泉州市和南平市茶园分布较多。从县域分析可知,福建省除平潭县、东山县、石狮市和晋江市以外的其他80个县市区均有茶叶种植,且呈现聚集性生产趋势,主要以安溪县、福安市、福鼎市及武夷山市为中心向外扩散。以安溪县为中心,向四周扩散种植,形成了以安溪县为中心,永春县、漳平市、华安县等为扩散的茶园种植趋势;以福安市和福鼎市为中心,连接寿宁县、蕉城区、柘荣县等为一体的空间格局;以武夷山市为中心,辐射建阳区、建瓯市及松溪县等县。
图7 2019年福建茶园空间分布

注:左侧放大图为仅显示排名前25县域的茶园范围,右侧为茶园局部放大图。图中绿色实线为茶园边界范围。

Fig. 7 Spatial distribution of tea plantation in Fujian in 2019

对福建省茶园分布的高程和坡度特征进一步分析:① 以100 m为单位设置11个高程区间(图8(a)),福建省茶园在海拔高度上呈现先上升后下降的趋势,在200~300 m的高程带内分布18%的茶园,是所有区间中占比最大的,55%的茶园分布于100~500 m范围内;② 以5°为1个区间范围,共设置11个坡度范围(图8(b)),分析可知福建省茶园主要集中在5~20°范围内,占比68%,92%的茶园分布在25°以下的缓坡地带。这与茶园生长的环境要求有关,坡度较大的区域土层厚度薄、保水保肥能力差,不利于茶树生长。
图8 2019年福建茶园在不同高程和坡度上的面积统计

Fig. 8 The area statistics of Fujian tea plantation at different elevation and slope in 2019

根据2019年福建省统计年鉴可知,福建全省茶园种植面积为2100 km2,本文提取的茶园种植面积为1913 km2,相对误差为9%。常规的茶园统计方法是人工抽样统计,本文通过遥感监测方法提取的结果,二者存在的误差在合理范围内。统计福建省各县域的茶园提取面积及累计占比,选择茶园面积排名前25的县市进行显示,如图9所示。排名前25的茶叶生产县茶园总面积高达1744 km2,占据全省茶园面积的91%。全省排名前五的产茶县为:安溪县、福鼎市、福安市、武夷山市、寿宁县,总面积达910 km2,约占据全省茶园面积的48%,其中安溪县茶园面积高达387 km2,占全省茶园面积的20%。福建省茶业发展快速,茶业也逐渐成为部分县市的农业主导经济,茶产业的发展给当地居民带来收益,促进当地经济发展的同时,也会导致大面积林地、耕地被开采为茶园。茶树种植规模的扩大对生物多样性及生态环境保护等具有重大影响,因此合理有序的发展茶业,对于可持续发展和生态环境保护至关重要。本文获得2019年福建省茶园分布信息,其结果可为政府及相关部门监测茶园提供支持和参考。
图9 2019年福建省县域茶园面积统计及累积占比

Fig. 9 Statistics of tea plantation area and its cumulative proportion in Fujian province in 2019

5 结论与讨论

5.1 结论

本文基于GEE云平台,通过在线编程调用S1、S2及地形数据,从中提取光谱特征、纹理特征及地形特征,运用SVM_RFE特征选择算法进行特征优化,设计4种不同的实验方案,对研究区进行地物分类和茶园信息提取,通过对不同分类方案的分析,选择精度最高的方案完成福建省2019年10 m分辨率茶园的空间分布制图。主要结论如下:
(1)在茶园信息提取中,光谱特征占据重要地位,纹理特征和地形特征次之。利用SVM_RFE选择特征时,前5名的特征为NDTI、SLOPE、B12、NDTI_savg、NDVIre1。说明植被指数NDTI、红边指数NDVIre1、短波红外波段B12、地形特征Slope及纹理特征NDTI_savg等对茶园信息提取具有重要作用。
(2)支持向量机递归消除算法(SVM_RFE)在特征优化方面具有很好的效果。与常规人工主观特征组合比较,基于SVM_RFE特征优选后特征子集的分类获得了最高分类精度,总体精度为94.65%,Kappa系数为0.93,这说明利用SVM_RFE特征选择算法能有效的保留地物最重要的特征变量,在降低数据维度的同时,仍能保持较高的精度,避免了交叉冗余信息对分类结果的影响。
(3)福建省茶园呈现聚集性生产趋势,主要以安溪县、福安市、福鼎市及武夷山市为中心向外扩散。2019年福建省茶园面积为1913 km2,其中55%的茶园分布于100~500 m范围内,92%的茶园分布在25°以下的缓坡地带。全省排名前5的产茶县有安溪县、福鼎市、福安市、武夷山市和寿宁县,总面积达910 km2,约占据全省茶园面积的48%。

5.2 讨论

目前利用遥感影像进行茶园提取的研究非常有限,主要有以下原因:① 茶树的种植往往是一行行的,而且每一行之间相隔一定的距离,从影像上看呈现出茶树与裸土相交错的情形;② 茶园并不仅仅只有茶树这一种地物,还存在有裸土、树木、人造地物等其它地物,在影像上呈现复杂的影像特征,这为茶园种植区的准确提取带来了困难。现有的少量文献主要可以分为2个方面:① 利用高分辨率遥感影像进行的茶园提取,如文献[4][6][11]等,这些研究主要是提取高分辨率遥感影像的各种纹理特征参与分类,其计算量大、分类过程较繁琐,虽然在小区域内获取的精度较高,但难以在大区域展开研究。② 利用Landsat和Sentinel影像等中等分辨率遥感影像进行的茶园提取研究,如文献[5][8]等。这些研究往往是利用中等分辨率遥感影像丰富的光谱特征结合其他多种特征进行茶园提取研究,文献[5]中利用Landsat影像光谱特征、PALSAR雷达影像特征以减少云雨天气对光学影像产生的影响,从而实现茶园的提取;文献[8]主要利用Landsat-8影像的多季节光谱特征、GLCM纹理特征参与茶园提取。这些研究的精度往往不是很高且大都集中在较小区域,尚未应用到省级及以上范围,其方法的适用性还有待研究。基于此,本研究提出一套适用于大范围茶园提取研究的方法,针对福建省多云多雨的天气条件,本研究将S1雷达影像和S2光学影像结合使用,以减少云雨天气的影响;在特征选择方面,研究综合多源特征辅以合适的特征选择算法,发现归一化差异耕作指数NDTI及其纹理特征在茶园提取方面效果显著;在数据处理方面,研究使用目前流行的云计算技术,借助GEE云平台大大减轻了数据获取、预处理的工作量,为今后省级乃至更大尺度范围的专题制图提供途径。
本文的优势在于基于GEE云平台首次完成10 m分辨率福建省的茶园信息提取工作,克服大尺度茶园监测运算能力不足的问题,并验证了SVM_REF特征选择算法和SVM分类器联合使用在地物分类以及茶园提取方面的适用性。提取结果可为福建省茶叶产业发展和预测,为生态环境的评价可提供重要的决策支持。后续研究可以从以下2个方面进行:① 本文得到的分类结果是基于像素提取的,必不可少地产生了“椒盐现象”,后续研究可以通过将面向对象与GEE结合的方法提取大面积作物;② 由于Sentinel-2影像缺乏历史影像,本文仅基于单期影像进行茶园提取,后续研究可以考虑利用Landsat数据对茶园进行长时间序列监测。
[1]
国家统计局. 分省年度数据,2008-2017[EB/OL]. https://data.stats.gov.cn/easyquery.htm?cn=C01.

[State Statistics Bureau. Provincial annual data, 2008- 2017[EB/OL]. http://data.stats.gov.cn/easyquery.htm?cn=C01.]

[2]
Singh A, Dutta R, Stein A, et al. A wavelet-based approach for monitoring plantation crops (tea: Camellia sinensis) in North East India[J]. International Journal of Remote Sensing, 2012, 33(16):4982-5008.

DOI

[3]
Qin Y W, Xiao X M, Dong J W, et al. Mapping paddy rice planting area in cold temperate climate region through analysis of time series Landsat 8(OLI), Landsat 7 (ETM+) and MODIS imagery[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 105:220-233.

DOI

[4]
Dihkan M, Guneroglu N, Karsli F, et al. Remote sensing of tea plantations using an SVM classifier and pattern-based accuracy assessment technique[J]. International Journal of Remote Sensing, 2013, 34(23):8549-8565.

DOI

[5]
Xu W H, Qin Y W, Xiao X M, et al. Quantifying spatial-temporal changes of tea plantations in complex landscapes through integrative analyses of optical and microwave imagery[J]. International Journal of Applied Earth Observation and Geoinformation, 2018, 73:697-711.

DOI

[6]
Akar Ö, Güngör O. Integrating multiple texture methods and NDVI to the random forest classification algorithm to detect tea and hazelnut plantation areas in northeast Turkey[J]. International Journal of Remote Sensing, 2015, 36(2):442-464.

DOI

[7]
王娜, 李强子, 杜鑫, 等. 单变量特征选择的苏北地区主要农作物遥感识别[J]. 遥感学报, 2017, 21(4):519-530.

[ Wang N, Li Q Z, Du X, et al. Identification of main crops based on the univariate feature selection in Subei[J]. Journal of Remote Sensing, 2017, 21(4):519-530. ]

[8]
Wang B, Li J, Jin X F, et al. Mapping tea plantations from multi-seasonal Landsat-8 OLI imageries using a random forest classifier[J]. Journal of the Indian Society of Remote Sensing, 2019, 47(8):1315-1329.

DOI

[9]
Wu Y S, Zhang X L. Object-based tree species classification using airborne hyperspectral images and lidar data[J]. Forests, 2019, 11(1):32.

DOI

[10]
马超, 杨飞, 王学成. 基于中尺度光谱和时序物候特征提取南方丘陵山区茶园[J]. 国土资源遥感, 2019, 31(1):141-148.

[ Ma C, Yang F, Wang X C. Extracting tea plantations in southern hilly and mountainous region based on mesoscale spectrum and temporal phenological features[J]. Remote Sensing for Land & Resources, 2019, 31(1):141-148. ]

[11]
徐伟燕, 孙睿, 金志凤. 基于资源三号卫星影像的茶树种植区提取[J]. 农业工程学报, 2016, 32(z1):161-168.

[ Xu W Y, Sun R, Jin Z F. Extracting tea plantations based on ZY-3 satellite data[J]. Transactions of the Chinese Society of Agricultural Engineering, 2016, 32(z1):161-168. ]

[12]
Xu F, Li Z F, Zhang S Y, et al. Mapping winter wheat with combinations of temporally aggregated Sentinel-2 and Landsat-8 data in Shandong Province, China[J]. Remote Sensing, 2020, 12(12):2065.

DOI

[13]
郭交, 朱琳, 靳标. 基于Sentinel-1和Sentinel-2数据融合的农作物分类[J]. 农业机械学报, 2018, 49(4):192-198.

[ Guo J, Zhu L, Jin B. Crop classification based on data fusion of Sentinel-1 and Sentinel-2[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(4):192-198. ]

[14]
谭深, 吴炳方, 张鑫. 基于Google Earth Engine与多源遥感数据的海南水稻分类研究[J]. 地球信息科学学报, 2019, 21(6):937-947.

DOI

[ Tan S, Wu B F, Zhang X. Mapping paddy rice in the Hainan Province using both Google Earth Engine and remote sensing images[J]. Journal of Geo-information Science, 2019, 21(6):937-947. ]

[15]
常文涛, 王浩, 宁晓刚, 等. 融合Sentinel-2红边波段和Sentinel-1雷达波段影像的扎龙湿地信息提取[J]. 湿地科学, 2020, 18(1):10-19.

[ Chang W T, Wang H, Ning X G, et al. Extraction of Zhalong wetlands information based on images of Sentinel-2 red-edge bands and Sentinel-1 radar bands[J]. Wetland Science, 2020, 18(1):10-19. ]

[16]
徐晗泽宇, 刘冲, 王军邦, 等. Google Earth Engine平台支持下的赣南柑橘果园遥感提取研究[J]. 地球信息科学学报, 2018, 20(3):396-404.

DOI

[ Xu H, Liu C, Wang J B, et al. Study on extraction of citrus orchard in Gannan region based on Google Earth Engine platform[J]. Journal of Geo-information Science, 2018, 20(3):396-404. ]

[17]
Gulácsi A, Kovács F. Sentinel-1-imagery-based high-resolution water cover detection on wetlands, aided by Google Earth Engine[J]. Remote Sensing, 2020, 12(10):1614.

DOI

[18]
Farr T G, Rosen P A, Caro E, et al. The shuttle radar topography mission[J]. Reviews of Geophysics, 2007, 45(2):361.

[19]
Tucker C J. Red and photographic infrared linear combinations for monitoring vegetation[J]. Remote Sensing of Environment, 1979, 8(2):127-150.

DOI

[20]
Gao B C. NDWI: A normalized difference water index for remote sensing of vegetation liquid water from space[J]. Remote Sensing of Environment, 1996, 58(3):257-266.

DOI

[21]
Xiao X M, Boles S, Liu J Y, et al. Mapping paddy rice agriculture in Southern China using multi-temporal MODIS images[J]. Remote Sensing of Environment, 2005, 95(4):480-492.

DOI

[22]
Deventer V, Ward A D, Gowda P H, et al. Using thematic mapper data to identify contrasting soil plains and tillage practices[J]. Photogrammetric Engineering & Remote Sensing, 1997, 63(1):87-93.

[23]
方灿莹, 王琳, 徐涵秋. 不同植被红边指数在城市草地健康判别中的对比研究[J]. 地球信息科学学报, 2017, 19(10):1382-1392.

DOI

[ Fang C Y, Wang L, Xu H Q. A comparative study of different red edge indices for remote sensing detection of urban grassland health status[J]. Journal of Geo-information Science, 2017, 19(10):1382-1392. ]

[24]
Frampton W J, Dash J, Watmough G, et al. Evaluating the capabilities of Sentinel-2 for quantitative estimation of biophysical variables in vegetation[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 82:83-92.

DOI

[25]
Dash J, Curran P J. The MERIS terrestrial chlorophyll index[J]. International Journal of Remote Sensing, 2004, 25(23):5403-5413.

DOI

[26]
Gitelson A A, Merzlyak M N. Remote estimation of chlorophyll content in higher plant leaves[J]. International Journal of Remote Sensing, 1997, 18(12):2691-2697.

DOI

[27]
张磊, 宫兆宁, 王启为, 等. Sentinel-2影像多特征优选的黄河三角洲湿地信息提取[J]. 遥感学报, 2019, 23(2):313-326.

[ Zhang L, Gong Z N, Wang Q W, et al. Wetland mapping of Yellow River Delta wetlands based on multi-feature optimization of Sentinel-2 images[J]. Journal of Remote Sensing, 2019, 23(2):313-326. ]

[28]
Gitelson A A, Gritz Y, Merzlyak M N. Relationships between leaf chlorophyll content and spectral reflectance and algorithms for non-destructive chlorophyll assessment in higher plant leaves[J]. Journal of Plant Physiology, 2003, 160(3):271-282.

DOI

[29]
Merzlyak M N, Gitelson A A, Chivkunova O B, et al. Non-destructive optical detection of pigment changes during leaf senescence and fruit ripening[J]. Physiologia Plantarum, 1999, 106(1):135-141.

DOI

[30]
Pu R L, Landry S. A comparative analysis of high spatial resolution IKONOS and WorldView-2 imagery for mapping urban tree species[J]. Remote Sensing of Environment, 2012, 124:516-533.

DOI

[31]
Herold M, Woodcock C E, Gregorio A D, et al. A joint initiative for harmonization and validation of land cover datasets[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(7):1719-1727.

DOI

[32]
Erasmi S, Twele A. Regional land cover mapping in the humid tropics using combined optical and SAR satellite data: A case study from Central Sulawesi, Indonesia[J]. International Journal of Remote Sensing, 2009, 30(10):2465-2478.

DOI

[33]
Cheng K, Wang J L. Forest type classification based on integrated spectral-spatial-temporal features and random forest algorithm: A case study in the Qinling mountains[J]. Forests, 2019, 10(7):559.

DOI

[34]
Stromann O, Nascetti A, Yousif O, et al. Dimensionality reduction and feature selection for object-based land cover classification based on Sentinel-1 and Sentinel-2 time series using Google Earth Engine[J]. Remote Sensing, 2019, 12(1):76.

DOI

[35]
Cortes C, Vapnik V. Support-vector networks[J]. Machine Learning, 1995, 20(3):273-297.

[36]
Shao Y, Lunetta R S. Comparison of support vector machine, neural network, and CART algorithms for the land-cover classification using limited training data points[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2012, 70:78-87.

DOI

[37]
Huang X, Zhang L P. An SVM ensemble approach combining spectral, structural, and semantic features for the classification of high-resolution remotely sensed imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(1):257-272.

DOI

[38]
Li L, Dong J W, Njeudeng Tenku S, et al. Mapping oil palm plantations in Cameroon using PALSAR 50-m orthorectified mosaic images[J]. Remote Sensing, 2015, 7(2):1206-1224.

DOI

[39]
Mountrakis G, Im J, Ogole C. Support vector machines in remote sensing: a review[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011, 66(3):247-259.

DOI

[40]
Zhang C, Wang T J, Atkinson P M, et al. A novel multi-parameter support vector machine for image classification[J]. International Journal of Remote Sensing, 2015, 36(7):1890-1906.

DOI

[41]
宋荣杰, 宁纪锋, 刘秀英, 等. 基于纹理特征和SVM的QuickBird影像苹果园提取[J]. 农业机械学报, 2017, 48(3):188-197.

[ Song R J, Ning J F, Liu X Y, et al. Apple orchard extraction with QuickBird imagery based on texture features and support vector machine[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(3):188-197. ]

[42]
李龙伟, 李楠, 陆灯盛. 多时相Sentinel-2影像在浙西北茶园信息提取中的应用[J]. 浙江农林大学学报, 2019, 36(5):841-848.

[ Li L W, Li N, Lu D S. Mapping tea gardens spatial distribution in northwestern Zhejiang Province using multi-temporal Sentinel-2 imagery[J]. Journal of Zhejiang A&F University, 2019, 36(5):841-848. ]

[43]
Foody G M. Thematic map comparison[J]. Photogrammetric Engineering & Remote Sensing, 2004, 70(5):627-633.

Outlines

/