地球信息科学学报  2019 , 21 (5): 752-766 https://doi.org/10.12082/dqxxkx.2019.180420

遥感科学与应用技术

Google Earth Engine支持下的江苏省夏收作物遥感提取

何昭欣12, 张淼1, 吴炳方12*, 邢强1

1. 中国科学院遥感与数字地球研究所 遥感科学国家重点实验室,北京 100101
2. 中国科学院大学,北京 100049

Extraction of Summer Crop in Jiangsu based on Google Earth Engine

HE Zhaoxin12, ZHANG Miao1, WU Bingfang12*, XING Qiang1

1. State Key Laboratory of Remote Sensing Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100101, China
2. University of Chinese Academy of Sciences, Beijing 100049, China

通讯作者:  *通讯作者:吴炳方(1962-),男,江西玉山人,博士,研究员,主要研究领域为农业遥感与粮食安全、水资源遥感与耗水管理、生态遥感等。E-mail: wubf@radi.ac.cn

收稿日期: 2018-08-29

修回日期:  2019-01-11

网络出版日期:  2019-05-25

版权声明:  2019 《地球信息科学学报》编辑部 《地球信息科学学报》编辑部 所有

基金资助:  国家重点研发计划项目(2016YFD0300608)中国科学院科技服务网络计划(STS计划)项目(KFJ-STS-ZDTP-009)国家自然科学基金项目(41561144013、41861144019、41701496)

作者简介:

作者简介:何昭欣(1991-),男,山东莒县人,硕士,主要从事农作物与果园遥感分类研究。E-mail: hezx@radi.ac.cn

展开

摘要

江苏省是农作物种植大省,国家统计局统计数据显示,江苏省近10年冬小麦、冬油菜的总播种面积分列全国第五、第七,快速准确地获取冬小麦和冬油菜的空间分布对于该省的农业发展具有重意义。基于单机的传统遥感分类能够准确获取农作物的空间分布信息,但是耗时较长。随着地理大数据与云平台、云计算的发展,Google Earth Engine(GEE)作为一个基于云平台的全球尺度地理空间分析平台,为快速遥感分类带来了新的机遇。本文基于GEE,使用Sentinel-2数据快速提取了江苏省2017年冬小麦与冬油菜的空间分布。首先,利用GEE获得覆盖江苏省119景无云质优的Sentinel-2影像;其次,在此基础上分别计算了遥感指数、纹理特征、地形特征,并完成原始特征的构建与优化;最后,分别试验了朴素贝叶斯、支持向量机、分类回归树和随机森林4种分类器,比较了各分类器的分类精度,并提取了冬小麦与冬油菜的空间分布信息。得出以下结论:①GEE能够快速完成覆盖江苏省影像数据的去云、镶嵌、裁剪及特征构建等预处理,较本地处理具有明显优势;②J-M距离值位于前两位且大于1将特征数量从28个压缩到11个,有效压缩了原始特征空间;③光谱+纹理+地形特征组合训练,朴素贝叶斯、支持向量机、分类回归树、随机森林的平均验证精度分别为61%、87%、89%、92%。

关键词: GEE云平台 ; Sentinel-2 ; 特征优选 ; 作物识别 ; 江苏省

Abstract

Jiangsu province, with 13 municipalities and located in the east of China, is an important part of the Yangtze river delta economy belt. The temperature is appropriate and the rainfall is moderate. Jiangsu province enjoys a moderate climate, which is suitable for the agricultural development. Winter wheat is distributed throughout the whole province, whereas the planting structure of winter rapeseed is complex and mainly scattered in Southern Jiangsu. As reported by the State Statistics Bureau, the total planting area of winter wheat and winter rapeseed in Jiangsu ranked the fifth and seventh in China, respectively, during the last 10 years. Fast obtaining the precise planting area of these two crops in Jiangsu is crucial for the agricultural development. Remote sensing classification based on local host can obtain spatial distribution of crops with high accuracy, but is time-consuming. With the development of geographical big data, cloud platform, and cloud computation, the Google Earth Engine (GEE), a global scale geospatial analysis platform based on the cloud platform, has brought new opportunities for rapid remote sensing classification. Based on the GEE cloud platform, a time-saving method of obtaining the spatial distribution of winter wheat and winter rapeseed by use of sentinel-2 data in Jiangsu was proposed. First, 119 sentinel-2 images without cloud were obtained using the GEE in Jiangsu. The time interval was set from March 1 to June 1, 2017, and the space area was Jiangsu province. Based on the spatio-temporal information, the 119 remote sensing images were mosaicked and clipped. Secondly, remote sensing indices, texture, and terrain features were calculated respectively, and the original features were extracted. The original feature space was optimized by an algorithm named Separability and Thresholds (SEaTH algorithm). Finally, four classifiers including naive Bayes, support vector machine, classification regression tree, and random forest were tested and evaluated by the average assessment accuracy. The spatial distribution information of winter wheat and winter rapeseed were obtained quickly. The following conclusions are drawn: (1) the GEE can quickly complete pre-processing of cloud-masking, image-mosaicking, image-clipping, and feature extraction, which is superior to the local processing. (2) The distance values of J-M that are higher than 1 and rank top two highest can reduce the number of features from 28 to 11 and effectively compress the original feature space. (3) With the combined training of spectral, texture and terrain features, the average assessment accuracy of naive Bayes, support vector machine, classification regression tree, and random forest was 61%, 87%, 89% and 92%, respectively.

Keywords: GEE cloud platform ; Sentinel-2 ; feature optimization ; crop identification ; Jiangsu Province

0

PDF (14005KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

何昭欣, 张淼, 吴炳方, 邢强. Google Earth Engine支持下的江苏省夏收作物遥感提取[J]. 地球信息科学学报, 2019, 21(5): 752-766 https://doi.org/10.12082/dqxxkx.2019.180420

HE Zhaoxin, ZHANG Miao, WU Bingfang, XING Qiang. Extraction of Summer Crop in Jiangsu based on Google Earth Engine[J]. Journal of Geo-information Science, 2019, 21(5): 752-766 https://doi.org/10.12082/dqxxkx.2019.180420

1 引言

江苏省是我国冬小麦和冬油菜种植大省,据国家统计局最近10年统计,江苏省冬小麦播种面积在全国各省份中居第五,冬油菜播种面积居第七[1]。利用遥感技术快速提取全省冬小麦与冬油菜,具有重要的现实意义。

由于受到时间、空间及影像质量等因素的影响,应用于某一研究区的遥感数据量受到限制,仅仅依靠少量的数据不能满足大面积农作物调查[2,3,4,5]。各种遥感分类器,诸如最大似然、支持向量机、随机森林等已被实践证明,能够有效地提取某一农作物或同时提取多种农作物,但是大多都是基于单机分类,分类速度较慢[6,7,8]

Google Earth Engine(GEE)是一个基于云的行星尺度地理空间分析平台,它将谷歌最先进的云计算和存储能力用于处理各种热点社会问题,包括森林砍伐、干旱、灾害、疾病、粮食安全、水资源管理、气候监测和环境保护[9]。作为一个集成世界各地数百万台服务器的云平台,它不仅为传统的遥感科学工作者提供支持,而且还为更广泛的公众用户提供支持。例如,在遥感分类方面,用户利用GEE可以方便快速地提取农作物或其他地类[10,11,12,13,14]

本研究从遥感数据的使用到分类的实现,全部基于GEE云平台,主要工作包括:① 遥感影像数据的使用。根据江苏省冬小麦及冬油菜的生长期、影像质量、研究区范围,利用GEE挑选了共119景Sentinel-2影像数据,并快速完成影像的镶嵌与裁剪;② 特征构建。在原始Sentinel-2影像数据所有的波段基础上,通过GEE及遥感指数公式,编码实现NDVI、EVI、NDBI、NDWI、LSWI遥感指数的构建,通过GEE函数库自带的纹理特征计算函数,计算了Sentinel-2影像数据的纹理,完成纹理特征的构建,通过GEE自带的地形函数与DEM数据,计算了海拔高度、坡度、坡向及山体阴影,完成地形特征的构建;③ 特征优化。通过设定J-M距离大于1且位于前两位,完成类-类之间的最优特征筛选;④ 分类器试验。分别试验朴素贝叶斯、随机森林、支持向量机和分类回归树的分类性能,得到江苏省2017年冬小麦及冬油菜的空间分布。本论文通过GEE云平台快速完成遥感数据获取与预处理、分类器试验、作物空间分布信息提取工作,解决基于单机的传统遥感分类中,遥感数据获取困难、预处理及分类耗时的问题。

2 研究区概况与数据源

2.1 研究区概况

江苏省地处中国大陆东部,116°18′E-121°57′E,30°45′N-35°20′N,陆域内长江、淮河经过,东邻黄海,与上海市、浙江省、安徽省和山东省接壤,是长江三角洲经济带的重要组成部分。

江苏省基本上由长江和淮河下游的大片冲积平原组成。全省的地势总体上相当低平,平原面积70 000 km2左右,约占全省面积的69%;丘陵和低山零星分布于江苏省的西南部,约占全省面积的14.3%。地处亚热带向暖温带过渡区,气候温和,雨量适中,四季气候分明。以淮河、苏北灌溉总渠一线为界,以北属暖温带湿润、半湿润季风气候,以南属亚热带湿润季风气候。全省各地平均气温13~16 ℃,最冷月为1月,平均气温-1.0~3.3 ℃,最热月为7月,平均气温26.0~28.8 ℃。

江苏省是冬小麦和冬油菜种植大省,如图1所示,冬小麦一般在10月底到11月初播种,至次年 6月中上旬收获,种植区域在全省都有分布,主要集中在长江以北的地区,其中南通市、盐城市及泰州市分布较多。冬油菜主要在水稻收获之后在水稻田基础上种植,与冬小麦物候相似。冬油菜种植结构复杂,多以零星种植为主,主要分布在苏南地区。冬油菜是江苏省重要的油料作物,是仅次于小麦和水稻的第三大农作物。

图1   江苏省冬小麦、冬油菜物候历

Fig. 1   The phenology calendar of winter wheat and winter rape in Jiangsu province

2.2 数据来源与预处理

2.2.1 Sentinel-2影像数据

哨兵2A(Sentinel-2A)卫星是“全球环境与安全监测”计划的第二颗星,于2015年6月23日发射。该卫星携带一枚多光谱成像仪,覆盖13个光谱波段,幅宽290 km,空间分辨率10 m,重访周期5 d。在光学数据中,哨兵2A数据是唯一一个在红边范围含有3个波段的数据。本研究使用的是Sentinel-2数据的Level-1C产品,该级别产品已经过数字高程模型校正,每个像元的值由大气顶部反射率(Top of Atmosphere, TOA)计算得到,包含13个无符号整型光谱波段,此外,还有3个QA波段,其中QA60波段包含云掩膜信息,可以用来去除影像中的卷云和厚云。有关该产品的详细波段信息见表1

表1   Sentinel-2波段参数

Tab. 1   The waveband parameters of Sentinel-2

序号波段名称中心波长/nm空间分辨率/m属性
01B144360气溶胶
02B249010
03B356010绿
04B466510
05B570520红边1
06B674020红边2
07B778320红边3
08B884210近红外
09B8A86520红边4
10B994060水蒸气
11B10137560卷云
12B11161020短波红外1
13B12219020短波红外2
14QA1010
15QA2020
16QA6060云掩膜

新窗口打开

本研究使用的Sentinel-2数据存储在GEE云盘中,数据的处理全部通过在线编写代码实现。时相、轨道号挑选:根据研究区范围和冬小麦、冬油菜的物候(图1),挑选关键时相、关键位置的影像。相关研究表明,在油菜开花时期,冬小麦正处于拔节期,此时两者的光谱信息差异较大,是区分油菜和冬小麦的最佳时相[15]。为了获得无云且包含油菜开花期的影像数据,本研究在设置影像时相上扩大了时间跨度,设置时间区间为2017年3月1日至2017年6月1日,此区间不仅包含了2种作物光谱差异最大的信息,而且保证了影像的完整性。影像去云:计算云信息波段QA60的Bit10和Bit11的值,设置二者的值均为0得到云掩膜,使用云掩膜去除影像中的云信息,得到无云影像。通过以上两步,得到相应时间区间内、相应研究区的覆盖影像共119景,待后续进一步处理。

2.2.2 SRTMGL1_003数据

航天飞机雷达地形任务(The Shuttle Radar Topography Mission,SRTM[16]),生产的数字高程数据简称SRTMGL1_003,空间分辨率为30 m,由NASA JPL提供。通过GEE中的重采样函数将其转换为与Sentinel-2数据相同的空间分辨率,并按照江苏省行政边界进行裁剪。

2.2.3 样本数据

本研究分类系统包括冬小麦、冬油菜、其他植被、水体、人工地表5类,样本的获得综合使用线上选取与线下检验2种方法。在各地类样点的选取过程中,本着随机、均匀的原则,尽量做到全省范围都有采集。由于江苏省中南部地区(如泰州市)分布有较多的冬油菜,因此在该区域选取了较多的冬油菜样点。由于冬小麦在全省范围几乎都有分布,因此在全省范围内选取了冬小麦样点。其他植被样点包含森林、草地及其他作物等。水体样点包含河流、湖泊。人工地表样点包含道路、房屋等。样本选取具体流程为:① 在GEE预处理生成的Sentinel-2数据(2017年3月1日至2017年6月1日合成图)上进行各地类样点的在线选取;② 将样点导出为KML格式,然后导入到Google Earth平台,使用同期高清底图对样点的正确性进行检查。同时,本研究使用样点中也包含了2017年实地采集到的样点。各地类样点的选取数量如表2所示。

表2   样本数据

Tab. 2   Sample data

地类代码地类名称样本数量/个
0冬小麦615
1冬油菜546
2其他植被610
3水体653
4人工地表666
总计3090

新窗口打开

3 研究方法

本文通过GEE云平台,快速获取并处理了覆盖江苏省的遥感数据,在此基础上完成了光谱、纹理及地形特征的构建与优化,试验了朴素贝叶斯、支持向量机、分类回归树及随机森林算法并评价了分类精度,最终得到江苏省2017年冬小麦、冬油菜的空间分布信息,技术流程图如图2所示。

图2   夏收作物遥感提取技术流程

Fig. 2   Technical flowchart of remote sensing extraction for summer crops

3.1 特征构建

特征变量的选择是遥感分类的重要步骤,科学使用多种特征变量及特征变量组合,可以有效提高遥感分类的精度[17]。本文选择光谱特征、纹理特征及地形特征,并分别介绍如何在GEE平台上实现这3种特征的构建。

3.1.1 光谱特征

通过时相、位置、去云筛选后,共得到119景影像,每景影像包含13个原始光谱波段(表1),根据遥感专题指数计算公式编写代码,通过GEE平台计算每景影像的归一化植被指数NDVI、增强型植被指数EVI、地表水分指数LSWI[10]、归一化水体指数NDWI[18]、归一化建筑指数NDBI[19]。并将每种指数作为一个独立的光谱波段添加到原始影像中。各专题指数计算公式如下:

NDVI=ρNIR-ρREDρNIR+ρRED(1)

EVI=2.5×ρNIR-ρREDρNIR+6×ρRED-7.5×ρBLUE+1(2)

LSWI=ρNIR-ρSWIRρNIR+ρSWIR(3)

NDWI=ρGREEN-ρNIRρGREEN+ρNIR(4)

NDBI=ρMIR-ρNIRρMIR+ρNIR(5)

式中:ρMIRρSWIRρNIRρREDρGREENρBLUE分别代表中红外、短波红外、近红外、绿、蓝波段的反射率值。

3.1.2 纹理特征

仅仅依靠光谱特征的农作物遥感分类效果并不理想,各类之间较容易出现混分、漏分及错分,这是因为在遥感影像上存在着“同物异谱、异物同谱”的现象[17]

纹理是图像的一个重要属性,是图像灰度在空间上以一定形式变化而产生的图案。灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)是一种被广泛应用的纹理统计分析方法[20,21,22],其简单定义为图像上具有某种空间位置关系的两个像素灰度的联合概率分布。由于纹理特征是一种结构特征,使用不同波段的影像得到的纹理特征差别不大,另外由于近红外波段对植被更有效,因此本文使用sentinel-2影像的近红外波段B8计算纹理特征。GEE提供了快速计算基于GLCM纹理特征的函数glcmTexture(size, kernel, average),用时仅需大约10 s便可以计算出角二阶矩(B8_asm)、对比度(B8_contrast)、相关性(B8_corr)、方差(B8_var)、逆差矩(B8_idm)、和平均(B8_savg)、和方差(B8_svar)、和熵(B8_sent)、熵(B8_ent)、差方差(B8_dvar)、差熵(B8_dent)、相关信息测度1(B8_imcorr1)、相关信息测度2(B8_imcorr2)、最大相关系数(B8_maxcorr)、差异性(B8_diss)、惯性矩(B8_inertia)、聚类萌(B8_shade)、聚类突(B8_prom)[23,24]。这18个纹理特征全部用来训练分类器必然会产生冗余,因此原始纹理特征空间构建共选取了最常用的6个特征:B8_asm、B8_contrast、B8_corr、B8_var、B8_idm、B8_ent[25,26]

3.1.3 地形特征

遥感识别农作物,加入与地形相关的参数,能够提高分类精度。除了上述用到的纹理特征以外,本研究使用SRTMGL1_003数据构建海拔高度(elevation)、坡度(slope)、坡向(aspect)及山体阴影(hillshade)特征。通过函数ee.Terrain.products(input) 计算得到,作为4个独立的波段参与到原始特征的构建。

3.2 特征优化方法

可用于遥感图像分类的特征数十种甚至数百种,如果将如此多的特征全部输送到分类器去训练,不仅使运算变得复杂,处理速度大大下降,而且在有限样本的情况下,过多的特征可能会导致分类精度降低,这就是所谓的“维数灾难”[27,28]

通过原始特征构建,共得到光谱特征18个,纹理特征6个,地形特征4个,总共28个原始特征。本文使用的特征优化方法为SEaTH算法(Separability and Thresholds),SEaTH算法的基本思想是:在特征符合正态分布的前提下(如果对象特征不符合正态分布规律,说明该特征分离性差,不考虑用于分类),利用Jeffries-Matusita距离(简称J-M距离,本文用J表示)来衡量类间可分性。对于类C1C2类来说,其J距离表示为:

J=21-e-B(6)

B=18m1-m222σ12+σ22+12lnσ12+σ222σ1σ2(7)

式中:B表示巴氏距离,miσi2,i=1,2,分别代表类C1和类C2某个特征的均值和方差。J的取值范围是[0,2],0表示2个类别在某一特征上几乎完全混淆,2表示2个类别在某一特征上能够完全分开。然而,J = 2的情况在实际操作中是不存在的,因为各类之间总会存在一些交叠。考虑到分类模型的可移植性,通常只保留J值靠前的2位特征参与训练与分类[29,30]。本文的研究在此基础上提出J值位于前两位且J值大于1的的特征才选用,这样做主要基于二点,一方面进一步压缩了特征数量,另一方面J值大于1(或者可以说J值越接近2)的特征能够使类别之间的可分性最大。

3.3 分类方法

本研究采用4种不同的分类器进行训练和分类,这4种分类器分别是朴素贝叶斯(Naive Bayes)、分类回归树(Classification and Regression Tree)、支持向量机(Support Vector Machine)和随机森林(Random Forest)。

3.3.1 朴素贝叶斯(NB)

朴素贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,选择具有最大后验概率的类作为该对象所属的类[31,32]

贝叶斯分类是一种简单有效的遥感影像分类算法,它只需要少量的训练数据就可完成学习,在分类中并不是把某一个实例绝对地归并为某一类,而是通过计算该实例属于某一类的概率,具有最大概率的类就是该实例所属的类。

贝叶斯分类不仅能够使测试样本的所有属性参与到分类中,而且对样本的属性分布适用范围较广,样本属性可以是离散的、连续的或是混合的。

3.3.2 分类回归树(CART)

CART决策树算法[33]由Breiman提出,该算法既可以用于分类[34,35],又可用于连续变量的预测,它的基本原理是:将训练样本划分为测试变量(特征向量)和目标变量(实际地物类型),通过对这两变量的循环分析形成二叉决策树。CART算法采用经济学中的基尼系数(Gini Index)作为选择最佳测试变量和分割阈值的准则。基尼系数的定义如下:

GI=1-j=1Jp2jh(8)

pjh=njhnh(9)

j=1Jpjh=1(10)

式中: pjh是从训练样本集中随机抽取一个样本,当它的某一测试变量值为h时属于第j类的概率;nj(h)为训练样本集中测试变量值为h时属于第j类的样本个数;n(h)为训练样本集中测试变量值为h的样本个数;j为类别个数。

完整的决策树生成后并不是直接就可以用于分类,因为它对训练样本特征的描述过于精确,很大程度上失去了一般性,造成“过度拟合”,因此需要对决策树进行修剪。CART算法采用交叉验证法进行修剪,最终分析结果是一棵兼顾复杂度和错误率的最优二叉树。

3.3.3 支持向量机(SVM)

支持向量机是一种重要的统计学习算法,是基于结构风险最小化、优化和核函数的线性分类器。SVM是非参数方法,数据即使不满足标准概率密度分布,该方法一样可以工作。SVM样本分类的基本原理主要包括:① 对于非线性可分的数据,SVM通过算法将该数据映射到高维空间,实现数据的线性可分; ② 在样本特征空间中通过核函数引导,寻找分离超平面,最大化样本中不同类别的距离。SVM分类器具有很高的泛化能力,且仅仅需要数量不多的样本数据,特别适用于遥感图像的分类[36,37]

3.3.4 随机森林(RF)

随机森林是分类树的集合[38]。构建每棵分类树是随机森林算法的关键,主要包括两个随机选择的步骤:采用bootstrap抽样策略从原始数据集中创建约2/3的训练样本,并为每个训练样本分别生成决策树,剩余约1/3的训练样本作为Out-of-bag数据用于内部交叉检验,评估随机森林的分类精度;使用Gini系数确定决策树中每个节点的分裂条件,集合每棵决策树,完成随机森林的构建。

随机森林算法既能处理离散型数据,也能处理连续型数据,数据集无需规范化。两个随机性的引入,使得随机森林不容易出现决策树的过拟合,同时也省去了决策树的修剪,计算负担较小。RF的优点使得它能够处理较为复杂遥感图像分类,适用于多类别与多特征[39,40,41]

3.4 精度评价方法

混淆矩阵(confusion matrix)也称误差矩阵,是表示精度评价的一种标准格式,用nn列的矩阵形式来表示。具体评价指标有总体精度(Overall Accuracy,OA)、制图精度(Producer's Accuracy, PA)、用户精度(User's Accuracy,UA)及Kappa系数(Kappa Coefficient,KC)等,这些精度指标从不同的侧面反映了图像分类的精度[42,43]

4 结果与分析

4.1 特征优化结果

将5类地物进行两两组合,共有10种组合情况。在18个光谱特征、6个纹理特征、4个地形特征中,计算每一种组合、每一种特征的J-M距离(表3),以J-M距离大于1且位于前两位的特征为选择原则,最终得到最优特征11个(表4)。

表3   J-M距离

Tab. 3   J-m distance

0-10-20-30-41-21-31-42-32-43-4
B10.26800.18990.34510.86640.35410.28600.99740.06990.46450.5532
B100.10860.05100.26550.46850.27860.23670.74390.40250.30230.6612
B110.03450.20591.78590.85970.36671.77250.97421.79060.51361.5788
B120.09860.11340.90061.00670.30451.19161.21271.24050.80511.4930
B20.44400.13230.43481.00420.42180.44151.17200.11880.70530.6220
B30.59950.10260.29940.88870.29380.16480.79160.06230.61610.4861
B40.16890.08090.18941.11740.08060.07211.03400.02650.88920.8105
B50.88430.13680.05260.88740.42931.13820.85450.25670.57710.9491
B60.31520.26851.99480.49210.51031.99850.69671.68210.06081.3003
B70.00680.45681.99620.85420.46531.99800.86561.69880.10471.3183
B80.03030.37851.99810.88380.54341.99991.06671.79310.15111.4576
B8A0.01260.43491.99840.91050.40101.99890.87511.80370.13971.4569
B90.42720.61791.93240.62220.02461.53260.06621.38210.02651.1396
EVI0.08900.42871.98081.93020.43441.99701.98511.82621.53740.8268
LSWI0.05130.46620.02491.79870.77530.13161.92340.31061.24241.6268
NDBI0.05130.46620.02491.79870.77530.13161.92340.31061.24241.6268
NDVI0.17010.29721.94921.94320.33851.97261.98921.76931.60420.8157
NDWI0.33760.43121.98381.68110.43691.99191.76711.91341.00921.4172
B8_asm0.07500.03021.44390.01030.17301.52010.12501.37450.00551.4037
B8_contrast0.89850.31950.23730.56060.35010.45610.10510.07770.12470.1443
B8_corr0.10560.03120.16530.04260.18770.39610.22880.06390.00400.0458
B8_ent0.05520.02961.15390.00990.14881.25920.10351.05240.00541.0964
B8_idm0.13980.01831.09540.01270.17801.26190.13101.01070.00451.0511
B8_var0.85350.36830.36890.65620.22880.29180.06210.05590.13810.1123
aspect0.00470.00840.13360.01360.01420.11590.03160.20220.03170.1383
elevation0.19880.73770.02490.02981.01750.24760.32390.61900.59910.0141
hillshade0.00980.41000.08470.12920.46650.13600.17140.18810.11970.0228
slope0.00950.80640.35980.18960.86900.42550.25690.23860.41860.0585

注:0:冬小麦;1:冬油菜;2:其他植被;3:水体;4:人工地表。

新窗口打开

表4   原始特征空间与优化

Tab. 4   Original features space and optimization

特征种类原始特征数量/个优化后特征数量/个
光谱特征B1、B2、B3、B4、B5、B6、B7、B8、B8A、B9、B10、B11、B12、EVILSWINDBINDVINDWI18B8、B8A、EVILSWINDBINDVINDWI7
纹理特征B8_asmB8_contrastB8_corrB8_varB8_idmB8_ent6B8_asmB8_idmB8_ent3
地形特征elevationslopeaspecthillshade4elevation1
总计2811

新窗口打开

4.2 分类特征与分类器组合精度

本文使用朴素贝叶斯、支持向量机、分类回归树及随机森林4种分类器,在GEE中各分类器参数设置如表5所示。将4种分类器与3种特征组合,在江苏省夏收作物分类中进行了试验,验证精度采取交叉验证策略(表6),具体流程为:① 在3090个样本点中独立生成10次随机数,每次生成的随机数不重复,保证样本选取的随机性;② 将所有样本进行划分,约70%的样本用来训练,剩余约30%的样本用来验证,分别得到10次验证精度;③ 对10次验证精度求平均,作为最终的平均验证精度(表6图3)。

表5   分类器参数

Tab. 5   Parameters of classifiers

分类器参数
朴素贝叶斯Lambda:0.000 000 1
支持向量机kernelType:RBF; gamma:0.5; cost:50
分类回归树crossvalidationFactor:10; maxDepth:10
随机森林NumberOfTrees:200; variablesPerSplit:0

新窗口打开

表6   不同特征、不同分类器组合的平均验证精度分布

Tab. 6   Average verification precisions of different combinations of features and classifiers

分类器特征
光谱纹理地形光谱+纹理光谱+地形纹理+地形光谱+纹理+地形
朴素贝叶斯00.490.370.210.490.590.290.59
10.500.210.210.500.600.210.60
20.510.210.210.510.610.210.65
30.510.200.200.510.600.200.60
40.490.210.210.490.600.210.60
50.490.210.210.490.590.210.65
60.510.210.210.510.600.210.61
70.490.210.210.490.580.210.60
80.500.190.190.500.610.190.61
90.500.200.200.500.580.200.58
均值0.500.220.210.510.600.210.61
支持向量机00.850.230.380.860.850.380.86
10.870.210.380.870.840.370.87
20.860.210.400.880.880.410.88
30.850.200.420.850.860.410.86
40.840.210.410.860.850.410.86
50.850.210.400.870.860.380.89
60.860.210.400.880.850.380.89
70.850.210.380.840.840.400.86
80.850.190.380.850.870.370.84
90.860.200.400.880.850.400.88
均值0.850.210.390.860.860.390.87
分类回归树00.820.390.380.820.890.470.89
10.840.400.370.840.860.490.88
20.860.410.390.850.900.480.91
30.820.400.400.820.880.510.91
40.840.410.390.830.880.510.89
50.840.390.400.860.880.480.90
分类器特征
光谱纹理地形光谱+纹理光谱+地形纹理+地形光谱+纹理+地形
分类回归树60.840.390.380.840.860.490.86
70.830.390.370.840.880.490.89
80.820.370.380.820.870.500.87
90.840.410.400.850.870.500.88
均值0.830.400.390.840.880.490.89
随机森林00.870.390.370.870.900.510.90
10.880.400.380.890.910.550.92
20.890.390.400.890.930.540.93
30.880.390.390.890.900.520.91
40.880.410.390.880.890.540.90
50.900.430.380.900.910.530.92
60.870.410.370.880.900.520.91
70.880.390.460.880.910.550.92
80.860.410.370.880.890.540.92
90.880.370.380.880.900.520.91
均值0.880.400.390.890.900.530.92
分类器特征
光谱纹理地形光谱+纹理光谱+地形纹理+地形光谱+纹理+地形
分类回归树60.840.390.380.840.860.490.86
70.830.390.370.840.880.490.89
80.820.370.380.820.870.500.87
90.840.410.400.850.870.500.88
均值0.830.400.390.840.880.490.89
随机森林00.870.390.370.870.900.510.90
10.880.400.380.890.910.550.92
20.890.390.400.890.930.540.93
30.880.390.390.890.900.520.91
40.880.410.390.880.890.540.90
50.900.430.380.900.910.530.92
60.870.410.370.880.900.520.91
70.880.390.460.880.910.550.92
80.860.410.370.880.890.540.92
90.880.370.380.880.900.520.91
均值0.880.400.390.890.900.530.92

新窗口打开

图3   不同特征、分类器组合的平均验证精度雷达分布

Fig. 3   Average verification precision radar distribution map with different combinations of features and classifiers

4.3 冬小麦、冬油菜遥感提取与精度验证

图4为遥感提取的2017年江苏省冬小麦、冬油菜、水体、其他(其他植被、人工地表),由于本论文的主要目的是提取冬小麦和冬油菜,为了突出这两类,故只保留了水体,其他植被和人工地表显示为其他。可以看出江苏省的冬小麦和冬油菜主要分布在长江以北的城市,包括徐州市、连云港市、宿迁市、淮安市、盐城市、扬州市、泰州市和南通市,位于长江以南的南京市、镇江市、常州市、无锡市和苏州市零星分布有少量的冬小麦和冬油菜。

图4   2017年江苏省冬小麦和冬油菜空间分布

Fig. 4   Spatial distribution of winter wheat and winter rape in Jiangsu province in 2017

使用光谱+纹理+地形这3种特征组合,以随机森林算法为例,将第三次的精度验证以混淆矩阵的形式显示(表7),冬小麦的制图精度为83%,冬小麦真实样本共187个,其中155个被正确分类,32个被错分成其他类别。冬油菜的制图精度为94%,冬油菜真实样本共171个,其中160个被正确分类,11个被错分成其他类别。总体验证精度为93%,kappa系数为0.92。

表7   随机森林算法精度评价混淆矩阵

Tab. 7   Precision evaluation confusion matrix of Random Forest algorithm

混淆矩阵真实类别
冬小麦冬油菜其他植被水体人工地表总计用户精度
预测类别冬小麦15572011650.94
冬油菜101602001720.93
其他植被183168011900.88
水体20020342090.97
人工地表21811922040.94
总计187171180204198940
制图精度0.830.940.931.000.97
总体精度0.93
Kappa系数0.92

新窗口打开

5 讨论

5.1 GEE云计算

GEE不仅存储了大量的地理空间数据,而且开发集成了许多处理这些数据的程序。GEE凭借其强大的云计算平台,能够高效处理地理空间数据。

以往分类所用遥感数据量有限[44,45,46,47],想要获得同时满足空间及时间要求的影像往往不能做到。如果研究区的范围足够大,单景影像不能完全覆盖,就需要进行镶嵌,而影像镶嵌又可能会造成色彩分布不均匀的问题。本研究凭借GEE存储大量遥感数据的优势,聚合了2017年3月1日至6月1日覆盖江苏省的119景Sentinel-2数据影像,数据量大。通过影像头文件自带的云信息,挑选无云清晰的高质量影像,同时实现了影像镶嵌、裁剪等一系列预处理,有效避免了影像镶嵌带来的色差问题,得到全省Sentinel-2影像(图5),保证了分类数据源的纯洁度与质量。

图5   江苏GEE影像处理

Fig. 5   The GEE image processing for Jiangsu

5.2分类结果的不确定性分析

本研究使用的是Sentinel-2影像,影像空间分辨率10 m。江苏省地处江淮平原、江湖较多,在省北部和西南部分布着低山丘陵,特殊的地形造成江苏省的耕地地块比较破碎,有可能造成影像上1个像元内覆盖有多种农作物,加大了分类难度,造成分类误差。

(1)在地类采样过程中,由于人为因素的存在,加之受自然环境的影响,不可能保证采到的样本完全准确,而且样本如果分布不均匀,对分类器也会造成一定的干扰,影响训练精度。

(2)卫星在获取地面影像时,也受到诸多因素的影响,既有来自本身的影响,例如传感器参数、卫星运行轨迹、影像处理误差等,也有来自外部因素的影响,例如气象条件。以上内外因都会对最终的分类影像造成不可避免的几何及辐射误差。

(3)“同物异谱”和“异物同谱”现象的存在是影响分类精度最重要的原因。如图6所示,有些冬小麦被错分成了冬油菜,而有些冬油菜被错分成了冬小麦,另外其他植被也容易和冬小麦及冬油菜混分,水体和人工地表的混分最不明显。

图6   Sentinel-2影像随机森林分类结果(左图)与原始影像(右图)的对比

Fig. 6   Random forest classification results of Sentinel-2 image compared with the original image

通过计算每种地类的特征均值,得到每种地类的特征曲线。冬小麦、冬油菜的光谱特征较为接近,导致二者容易混分。冬小麦、冬油菜与其他类别的特征差别较为明显,尤其是在B8、B8A、NDVI等光谱特征上的差异性较大,可以利用这些特征对地类进行区分(图7)。5种地类的角二阶矩(B8_asm)、相关性(B8_corr)、熵(B8_ent)、逆差矩(B8_idm)较为接近,这些特征的相似性使得地类区分难度上升(图8)。5种地类在海拔高度(elevation)和坡向(aspect)之间的差异较为明显,可以用这两个特征来区分不同地类(图9)。

图7   不同类别的光谱特征曲线

Fig. 7   Spectral feature graph of different classes

图8   不同类别的纹理特征曲线

Fig. 8   Texture feature graph of different classes

图9   不同类别的地形特征曲线

Fig. 9   Topographic feature graph of different classes

5.3 特征对精度的影响分析

本文基于GEE云平台,使用朴素贝叶斯、支持向量机、分类回归树、随机森林,及光谱特征、纹理特征、地形特征,在江苏省夏粮作物提取中进行了分类试验。总体来看,在四种分类器中,纹理、地形、纹理+地形这3种特征参与分类的平均验证精度不高,而光谱、光谱+纹理、光谱+地形、光谱+纹理+地形这四种特征参与分类的平均验证精度较高。以随机森林算法为例,纹理、地形、纹理+地形3种特征的平均验证精度分别为40%、39%、53%。光谱、光谱+纹理、光谱+地形、光谱+纹理+地形四种特征分别取得了88%、89%、90%、92%的平均验证精度(表6)。以上结果说明,光谱特征在分类中起着决定性作用,而仅仅使用单一纹理或者地形特征不能取得较高的验证精度。

另外,虽然江苏省大部分地区都是平原,但是海拔高度特征的加入使得平均验证精度得以提升。以随机森林算法为例,仅使用光谱特征,平均验证精度为88%,加入海拔高度特征后,精度提升了2%;使用光谱+纹理特征的平均验证精度为89%,加入海拔高度特征后使得精度提升了3%。从图10看出,江苏省内,冬小麦、冬油菜、其他植被、水体、人工地表的平均海拔高度不一,其他植被(森林、草地等)的海拔高度最大,这也与实际情况相符合。正是由于各地类的海拔高度不一,所以海拔高度这一地形特征的加入,有利于区分不同地类。

图10   不同类别的平均海拔高度

Fig. 10   Average altitude of different classes

6 结论

本研究基于Google Earth Engine云平台,快速得到覆盖江苏省的2017年3月1日至2017年6月1日期间的Sentinel-2遥感影像并完成数据的预处理,构建了光谱、纹理、地形特征并采取SEaTH算法优化了特征,试验了朴素贝叶斯、支持向量机、分类回归树、随机森林4种算法并比较了分类精度,快速提取了江苏省2017年冬小麦与冬油菜的空间位置分布信息。主要结论如下:

(1) GEE可以方便地访问海量遥感图像及其他数据资源,并能以其高性能的云计算能力处理这些数据。GEE能够快速完成覆盖江苏省影像数据的去云、镶嵌、裁剪及特征构建等预处理,较本地处理具有明显优势。

(2) 江苏省冬小麦和冬油菜遥感提取实验证明,J-M距离大于1且位于前两位可以有效地筛选最优特征及特征组合,将特征数量从28个压缩到11个,在降低分类器负荷的同时,提高了分类精度。

(3) 光谱特征作为分类的重要特征,对分类精度起着决定性作用,加入适当的纹理或者地形特征能提高仅使用光谱特征分类的精度,而仅使用纹理特征或者地形特征,不能取得理想的分类精度。使用光谱+纹理+地形特征的组合,朴素贝叶斯、支持向量机、分类回归树、随机森林的平均验证精度分别为61%、87%、89%、92%。

然而,基于像元进行分类将不可避免地出现了“椒盐现象”,下一步研究重点将放在面向对象分类与GEE云计算平台的结合上,通过借鉴一些优秀成熟的分割算法,实现江苏省乃至其他省份或地区的作物快速提取。

The authors have declared that no competing interests exist.


参考文献

[1]

国家统计局.分省年度数据,2008-2017

[EB/OL]..

URL      [本文引用: 1]     

[

State Statistics Bureau. Provincial annual data, 2008-2017

[EB/OL]. . ]

URL      [本文引用: 1]     

[2] 郭交,朱琳,靳标.

基于Sentinel-1和Sentinel-2数据融合的农作物分类

[J].农业机械学报,2018,49(4):192-198.

https://doi.org/10.6041/j.issn.1000-1298.2018.04.022      [本文引用: 1]      摘要

基于光学影像的遥感技术受云雨、昼夜影响较大,导致获取连续的作物时序生长曲线较困难,而雷达影像作为主动式成像,能够很好地克服这一缺陷。本文以陕西省渭南市大荔县某农场为研究区域,分别采用最大似然法(Maximum likelihood,ML)和支持向量机(Support vector machine,SVM)2种方法,融合Sentinel-1雷达影像和Sentinel-2光学影像,提高农作物的分类精度。研究结果表明,融合数据的农作物分类精度相比光学数据分类精度有所提高。在无云层覆盖的情况下,利用SVM方法融合Sentinel-2的红、绿、蓝、近红外4个波段数据与Sentinel-1数据,总体分类精度提高了2个百分点,Kappa系数提高了5个百分点;在有少量云层覆盖情况下,利用ML处理融合数据的分类结果精度和Kappa系数分别提高2个百分点和4个百分点,SVM方法下的分类精度提高了6个百分点,Kappa系数提高了8个百分点。

[ Guo J, Zhu L, Jin B.

Crop classification based on data fusion of Sentinel-1 and Sentinel-2

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018,49(4):192-198. ]

https://doi.org/10.6041/j.issn.1000-1298.2018.04.022      [本文引用: 1]      摘要

基于光学影像的遥感技术受云雨、昼夜影响较大,导致获取连续的作物时序生长曲线较困难,而雷达影像作为主动式成像,能够很好地克服这一缺陷。本文以陕西省渭南市大荔县某农场为研究区域,分别采用最大似然法(Maximum likelihood,ML)和支持向量机(Support vector machine,SVM)2种方法,融合Sentinel-1雷达影像和Sentinel-2光学影像,提高农作物的分类精度。研究结果表明,融合数据的农作物分类精度相比光学数据分类精度有所提高。在无云层覆盖的情况下,利用SVM方法融合Sentinel-2的红、绿、蓝、近红外4个波段数据与Sentinel-1数据,总体分类精度提高了2个百分点,Kappa系数提高了5个百分点;在有少量云层覆盖情况下,利用ML处理融合数据的分类结果精度和Kappa系数分别提高2个百分点和4个百分点,SVM方法下的分类精度提高了6个百分点,Kappa系数提高了8个百分点。
[3] 史飞飞,高小红,杨灵玉,.

基于HJ-1A高光谱遥感数据的湟水流域典型农作物分类研究

[J].遥感技术与应用,2017,32(2):206-217.

[本文引用: 1]     

[ Shi F F, Gao X H, Yang L Y, et al.

Research on typical crop classification based on HJ-1A hyperspectral data in the Huangshui river basin

[J]. Remote Sensing Technology & Application, 2017,32(2):206-217. ]

[本文引用: 1]     

[4] 班松涛.

县域农作物分类类型遥感识别与提取

[D].西安:西北农林科技大学,2014.

[本文引用: 1]     

[ Ban S T.

Remote sensing identification and extraction of county crop classification types

[D]. Xi'an: Northwest A&F University, 2014. ]

[本文引用: 1]     

[5] 程彬.

基于支持向量机的乾安县土地利用遥感分类研究

[J].长春师范大学学报,2017,36(12):86-88.

[本文引用: 1]     

[ Cheng B.

Land use information extraction based on support vector machine using multitemporal remote sensing in Qian'an county

[J]. Journal of Changchun Normal University, 2017,36(12):86-88. ]

[本文引用: 1]     

[6] 关舒婧,韩鹏鹏,王月如,.

华南地区典型种植园地遥感分类研究

[J].地球信息科学学报,2017,19(11):1538-1546.

https://doi.org/10.3724/SP.J.1047.2017.01538      URL      [本文引用: 1]      摘要

华南地区种植园地广泛分布,类型混杂多样,导致园地分布信息难以正确获取,为农业管理造成了较大困难。本研究基于Landsat8 OLI数据,通过数据融合、特征优化,应用随机森林算法构建面向对象的种植园地分类规则集,对华南地区典型经济作物香蕉、柑橘、葡萄、蒲葵、海枣、番木瓜和火龙果等进行类别识别,同时对比贝叶斯分类法、K最邻近分类法、支持向量机法、决策树分类法的分类效果。结果表明:数据融合会在一定程度上影响分类结果精度;植株形态、光谱特征接近,种植期交错是影响华南地区典型园地分类精度的重要原因;以中分辨率影像为数据源,面向对象的随机森林算法应用于种植园地分类研究总体精度可达88.05%,Kappa系数0.87,可以有效区分华南地区典型种植园地类别;相比于其他算法,随机森林算法在分类精度、可靠性和稳定性上具有一定优势,可为园地作物生长监测和种植管理提供科学依据。

[ Guan S J, Han P P, Wang Y R, et al.

Study on the classification of typical plantations in south China

[J]. Journal of Geo-information Science, 2017,19(11):1538-1546. ]

https://doi.org/10.3724/SP.J.1047.2017.01538      URL      [本文引用: 1]      摘要

华南地区种植园地广泛分布,类型混杂多样,导致园地分布信息难以正确获取,为农业管理造成了较大困难。本研究基于Landsat8 OLI数据,通过数据融合、特征优化,应用随机森林算法构建面向对象的种植园地分类规则集,对华南地区典型经济作物香蕉、柑橘、葡萄、蒲葵、海枣、番木瓜和火龙果等进行类别识别,同时对比贝叶斯分类法、K最邻近分类法、支持向量机法、决策树分类法的分类效果。结果表明:数据融合会在一定程度上影响分类结果精度;植株形态、光谱特征接近,种植期交错是影响华南地区典型园地分类精度的重要原因;以中分辨率影像为数据源,面向对象的随机森林算法应用于种植园地分类研究总体精度可达88.05%,Kappa系数0.87,可以有效区分华南地区典型种植园地类别;相比于其他算法,随机森林算法在分类精度、可靠性和稳定性上具有一定优势,可为园地作物生长监测和种植管理提供科学依据。
[7] 张静,张翔,田龙,.

西北旱区遥感影像分类的支持向量机法

[J].测绘科学,2017,42(1):49-52.

[本文引用: 1]     

[ Zhang J, Zhang X, Tian L, et al.

The support vector machine method for RS images' classification in northwest arid area

[J]. Science of Surveying and Mapping, 2017,42(1):49-52. ]

[本文引用: 1]     

[8] 杨屹鹍,蒋平安,武红旗,.

基于高分一号与Landsat 8卫星影像的库尔勒市香梨种植面积识别研究

[J].山东农业科学,2018,50(1):153-157.

[本文引用: 1]     

[ Yang Y K, Jiang P A, Wu H Q, et al.

Recognition research of Korla fragrant pear planting area based on satellite images of GF-1 and Landsat 8

[J]. Shandong Agricultural Sciences, 2018,50(1):153-157. ]

[本文引用: 1]     

[9] Gorelick N, Hancher M, Dixon M, et al.

Google earth engine: planetary-scale geospatial analysis for everyone

[J]. Remote Sensing of Environment, 2017,202:18-27.

[本文引用: 1]     

[10] Dong J, Xiao X, Menarguez MA, et al.

Mapping paddy rice planting area in northeastern Asia with Landsat 8 images, phenology-based algorithm and google earth engine

[J]. Remote Sensing of Environment, 2016,185:142-154.

[本文引用: 2]     

[11] 徐晗泽宇,刘冲,王军邦,.

Google Earth Engine平台支持下的赣南柑橘果园遥感提取研究

[J].地球信息科学学报, 2018,20(3):396-404.

[本文引用: 1]     

[ Xu H Z Y, Liu C, Wang J B, et al.

Study on extraction of citrus orchard in Gannan region based on google earth engine platform

[J]. Journal of Geo-Information Science, 2018,20(3):396-404. ]

[本文引用: 1]     

[12] Shelestov A, Lavreniuk M, Kussul N, et al.

Exploring google earth engine platform for big data processing: classification of multi-temporal satellite imagery for cop mapping

[J]. Frontiers in Earth Science, 2017,5(5):1-10.

https://doi.org/10.3389/feart.2017.00017      URL      [本文引用: 1]      摘要

Many applied problems arising in agricultural monitoring and food security require reliable crop maps at national or global scale. Large scale crop mapping requires processing and management of large amount of heterogeneous satellite imagery acquired by various sensors that consequently leads to a 鈥淏ig Data鈥 problem. The main objective of this study is to explore efficiency of using the Google Earth Engine (GEE) platform when classifying multi-temporal satellite imagery with potential to apply the platform for a larger scale (e.g. country level) and multiple sensors (e.g. Landsat-8 and Sentinel-2). In particular, multiple state-of-the-art classifiers available in the GEE platform are compared to produce a high resolution (30 m) crop classification map for a large territory ( 28,100 km2 and 1.0 M ha of cropland). Though this study does not involve large volumes of data, it does address efficiency of the GEE platform to effectively execute complex workflows of satellite data processing required with large scale applications such as crop mapping. The study discusses strengths and weaknesses of classifiers, assesses accuracies that can be achieved with different classifiers for the Ukrainian landscape, and compares them to the benchmark classifier using a neural network approach that was developed in our previous studies. The study is carried out for the Joint Experiment of Crop Assessment and Monitoring (JECAM) test site in Ukraine covering the Kyiv region (North of Ukraine) in 2013. We found that Google Earth Engine (GEE) provides very good performance in terms of enabling access to the remote sensing products through the cloud platform and providing pre-processing; however, in terms of classification accuracy, the neural network based approach outperformed support vector machine (SVM), decision tree and random forest classifiers available in GEE.
[13] 胡云锋,商令杰,王召海,.

GEE平台和CART方法的北京市土地解译

[J].测绘科学,2018,43(4):87-93.

URL      [本文引用: 1]      摘要

针对传统遥感影像解译效率较低、人力物力需求量大等问题,该文以谷歌地球引擎为依托平台,利用Landsat5TM影像,采用分类回归树算法对2010年北京市土地覆被/土地利用类型开展了解译研究,并从类型构成、类型混淆和空间一致性3个方面将解译所得LUC-2010产品与Globeland30-2010产品进行空间一致性分析。研究表明,谷歌地球引擎(GEE)平台通过编程运算,数据处理速度极快,大幅提高工作效率。解译产品与训练样本交叉验证的学习精度为94.2%。两套产品总体对比发现,林地、水体和耕地的空间一致性比率分别为84.28%、74.75%和73.56%;林地、水体和人工地表的地类纯净度分别为87.23%、77.04%和72.97%;总体分布空间一致性为74.0%。两套产品局部对比发现,LUC-2010产品分类结果更准确和精细,精度更高。

[ Hu Y F, Shang L J, Wang Z H, et al.

Land-cover and land-use classification in Beijing based on cart and gee

[J]. Science of Surveying and Mapping, 2018,43(4):87-93. ]

URL      [本文引用: 1]      摘要

针对传统遥感影像解译效率较低、人力物力需求量大等问题,该文以谷歌地球引擎为依托平台,利用Landsat5TM影像,采用分类回归树算法对2010年北京市土地覆被/土地利用类型开展了解译研究,并从类型构成、类型混淆和空间一致性3个方面将解译所得LUC-2010产品与Globeland30-2010产品进行空间一致性分析。研究表明,谷歌地球引擎(GEE)平台通过编程运算,数据处理速度极快,大幅提高工作效率。解译产品与训练样本交叉验证的学习精度为94.2%。两套产品总体对比发现,林地、水体和耕地的空间一致性比率分别为84.28%、74.75%和73.56%;林地、水体和人工地表的地类纯净度分别为87.23%、77.04%和72.97%;总体分布空间一致性为74.0%。两套产品局部对比发现,LUC-2010产品分类结果更准确和精细,精度更高。
[14] Xiong J, Thenkabail P S, Gumma M K, et al.

Automated cropland mapping of continental Africa using google earth engine cloud computing

[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2017,126:225-244.

https://doi.org/10.1016/j.isprsjprs.2017.01.019      URL      [本文引用: 1]      摘要

The automation of agricultural mapping using satellite-derived remotely sensed data remains a challenge in Africa because of the heterogeneous and fragmental landscape, complex crop cycles, and limited access to local knowledge. Currently, consistent, continent-wide routine cropland mapping of Africa does not exist, with most studies focused either on certain portions of the continent or at most a one-time effort at mapping the continent at coarse resolution remote sensing. In this research, we addressed these limitations by applying an automated cropland mapping algorithm (ACMA) that captures extensive knowledge on the croplands of Africa available through: (a) ground-based training samples, (b) very high (sub-meter to five-meter) resolution imagery (VHRI), and (c) local knowledge captured during field visits and/or sourced from country reports and literature. The study used 16-day time-series of Moderate Resolution Imaging Spectroradiometer (MODIS) normalized difference vegetation index (NDVI) composited data at 250-m resolution for the entire African continent. Based on these data, the study first produced accurate reference cropland layers or RCLs (cropland extent/areas, irrigation versus rainfed, cropping intensities, crop dominance, and croplands versus cropland fallows) for the year 2014 that provided an overall accuracy of around 90% for crop extent in different agro-ecological zones (AEZs). The RCLs for the year 2014 (RCL2014) were then used in the development of the ACMA algorithm to create ACMA-derived cropland layers for 2014 (ACL2014). ACL2014 when compared pixel-by-pixel with the RCL2014 had an overall similarity greater than 95%. Based on the ACL2014, the African continent had 29602Mha of net cropland areas (26002Mha cultivated plus 3602Mha fallows) and 33002Mha of gross cropland areas. Of the 26002Mha of net cropland areas cultivated during 2014, 90.6% (23602Mha) was rainfed and just 9.4% (2402Mha) was irrigated. Africa has about 15% of the world’s population, but only about 6% of world’s irrigation. Net cropland area distribution was 9502Mha during season 1, 11702Mha during season 2, and 8402Mha continuous. About 58% of the rainfed and 39% of the irrigated were single crops (net cropland area without cropland fallows) cropped during either season 1 (January-May) or season 2 (June-September). The ACMA algorithm was deployed on Google Earth Engine (GEE) cloud computing platform and applied on MODIS time-series data from 2003 through 2014 to obtain ACMA-derived cropland layers for these years (ACL2003 to ACL2014). The results indicated that over these twelve years, on average: (a) croplands increased by 102Mha/yr, and (b) cropland fallows decreased by 102Mha/year. Cropland areas computed from ACL2014 for the 55 African countries were largely underestimated when compared with an independent source of census-based cropland data, with a root-mean-square error (RMSE) of 3.502Mha. ACMA demonstrated the ability to hind-cast (past years), now-cast (present year), and forecast (future years) cropland products using MODIS 250-m time-series data rapidly, but currently, insufficient reference data exist to rigorously report trends from these results.
[15] 王松林.

基于多源遥感的江苏省油菜及其同物候期主要作物面积提取

[D].武汉:长江大学,2015.

[本文引用: 1]     

[ Wang S L.

Extraction of main crop areas in rapeseed and its phenological period in Jiangsu province based on multi-source remote sensing

[D]. Wuhan: Yangtze University, 2015. ]

[本文引用: 1]     

[16] Farr T G, Rosen P A, Caro E, et al.

The shuttle radar topography mission

[J]. Reviews of Geophysics, 2007,45(2):361.

[本文引用: 1]     

[17] 贾坤,李强子.

农作物遥感分类特征变量选择研究现状与展望

[J].资源科学,2013,35(12):2507-2516.

[本文引用: 2]     

[ Jia K, Li Q Z.

Review of features selection in crop classification using remote sensing data

[J]. Resources Science, 2013,35(12):2507-2516. ]

[本文引用: 2]     

[18] Yang X, Zhao S, Qin X, et al.

Mapping of urban surface water bodies from Sentinel-2 msi imagery at 10 m resolution via ndwi-based image sharpening

[J]. Remote Sensing, 2017,9(6):596-614.

[本文引用: 1]     

[19] Li K, Chen Y.

A genetic algorithm-based urban cluster automatic threshold method by combining viirs dnb, ndvi, and ndbi to monitor urbanization

[J]. Remote Sensing, 2018,10(2):277-297.

[本文引用: 1]     

[20] 裴欢,孙天娇,王晓妍.

基于Landsat 8 OLI影像纹理特征的面向对象土地利用/覆盖分类

[J].农业工程学报,2018,34(2):248-255.

[本文引用: 1]     

[ Pei H, Sun T J, Wang X Y.

Object-oriented land use/cover classification based on texture features of Landsat 8 OLI image

[J]. Transactions of the Chinese Society of Agricultural Engineering, 2018,34(2):248-255. ]

[本文引用: 1]     

[21] 张博.

基于灰度共生矩阵的遥感影像纹理特征提取分析

[J].城市地理,2017(22):190-200.

[本文引用: 1]     

[ Zhang B.

Texture feature extraction analysis of remote sensing image based on gray level co-occurrence matrix

[J]. Cultural Geography, 2017(22):190-200. ]

[本文引用: 1]     

[22] 林雪,彭道黎,黄国胜,.

结合多尺度纹理特征的遥感影像面向对象分类

[J].测绘工程,2016,25(7):22-27.

[本文引用: 1]     

[ Lin X, Peng D L, Huang G S, et al.

Object-oriented classification with multi-scale texture feature based on remote sensing image

[J]. Engineering of Surveying and Mapping, 2016,25(7):22-27. ]

[本文引用: 1]     

[23] Haralick R M, Shanmugam K, Dinstein I.

Textural features for image classification

[J]. IEEE Transactions on systems, man, and cybernetics, 1973,3(6):610-621.

[本文引用: 1]     

[24] 方天红,陈庆虎,鄢煜尘,.

基于统计纹理特征的打印文档认证

[J].武汉大学学报(工学版),2016,49(1):154-160.

[本文引用: 1]     

[ Fang T H, Chen Q H, Yan Y C.et al.

Print document identification based on statistical texture feature

[J]. Engineering Journal of Wuhan University, 2016,49(1):154-160. ]

[本文引用: 1]     

[25] 冯建辉,杨玉静.

基于灰度共生矩阵提取纹理特征图像的研究

[J].北京测绘,2007,84(3):19-22.

[本文引用: 1]     

[ Feng J H, Yang Y J.

Study of texture images extraction based on gray level co-occurrence matrix

[J]. Beijing Surveying and Mapping, 2007,84(3):19-22. ]

[本文引用: 1]     

[26] 焦蓬蓬,郭依正,刘丽娟,.

灰度共生矩阵纹理特征提取的Matlab实现

[J].计算机技术与发展,2012,22(11):169-171.

[本文引用: 1]     

[ Jiao P P, Guo Y Z, Liu L J, et al.

Implementation of gray level co-occurrence matrix texture feature extraction using matlab

[J]. Computer Technology and Development, 2012,22(11):169-171. ]

[本文引用: 1]     

[27] 张秀英,冯学智,江洪.

面向对象分类的特征空间优化

[J].遥感学报,2009,13(4):659-669.

Magsci      [本文引用: 1]      摘要

为提高图像处理效率,探讨了面向对象分类的特征空间优化方法.以区域增长算法获得的对象为处理单元,根据植被在IKONOS影像上的表征,初步选择了6个形状、2个位置、17个光谱和6个纹理特征,共计31个作为初始特征空间.首先根据每组中特征所代表的信息量和特征之间的相关性,去掉与其他特征相关性强而方差较小的特征,将特征空间维降到23;以识别城区植被为目标,根据220个植被样本计算2-23维特征空间的类间J-M距离,以最小J-M和平均J-M距离为依据选择最优特征空间,将特征空间维降到14;最后利用类间离差矩阵代替协方差矩阵的K-L变换对特征空间进行压缩,分组压缩后将维数降低到7,而对整个特征空间压缩将维数降低到4.为验证特征空间优化对识别结果的影响,采用CART分类方法对城市植被进行了识别.构建的决策树表明,利用分组K-L变换后的特征空间比利用整体K-L变换获得的训练精度高12%;与K-L压缩前的特征空间获得的决策树相比,结构复杂程度相当(前者包含14个结点,后者包含12个结点),训练精度仅低1%.分类结果也表明,利用分组K-L变换的特征空间比利用不进行K-L变换的特征空间分类,总精度和Kappa系数分别降低了1.5%和2.3%,但是特征空间却压缩了50%,提高了面向对象分类方法的处理效率.

[ Zhang X Y, Feng X Z, Jiang H.

Feature set optimization in object-oriented methodology

[J]. Journal of Remote Sensing, 2009,13(4):659-669. ]

Magsci      [本文引用: 1]      摘要

为提高图像处理效率,探讨了面向对象分类的特征空间优化方法.以区域增长算法获得的对象为处理单元,根据植被在IKONOS影像上的表征,初步选择了6个形状、2个位置、17个光谱和6个纹理特征,共计31个作为初始特征空间.首先根据每组中特征所代表的信息量和特征之间的相关性,去掉与其他特征相关性强而方差较小的特征,将特征空间维降到23;以识别城区植被为目标,根据220个植被样本计算2-23维特征空间的类间J-M距离,以最小J-M和平均J-M距离为依据选择最优特征空间,将特征空间维降到14;最后利用类间离差矩阵代替协方差矩阵的K-L变换对特征空间进行压缩,分组压缩后将维数降低到7,而对整个特征空间压缩将维数降低到4.为验证特征空间优化对识别结果的影响,采用CART分类方法对城市植被进行了识别.构建的决策树表明,利用分组K-L变换后的特征空间比利用整体K-L变换获得的训练精度高12%;与K-L压缩前的特征空间获得的决策树相比,结构复杂程度相当(前者包含14个结点,后者包含12个结点),训练精度仅低1%.分类结果也表明,利用分组K-L变换的特征空间比利用不进行K-L变换的特征空间分类,总精度和Kappa系数分别降低了1.5%和2.3%,但是特征空间却压缩了50%,提高了面向对象分类方法的处理效率.
[28] De Sa J P M.

Pattern recognition: Concepts, methods and applications

[M]. Berlin: Springer Science & Business Media, 2012.

[本文引用: 1]     

[29] Nussbaum S, Niemeyer I, Canty M J.

Seath-a new tool for automated feature extraction in the context of object-based image analysis

[C]//1st International Conference on Object-based Image Analysis, Salzburg: Austria. 2006.

[本文引用: 1]     

[30] 余晓敏,湛飞并,廖明生,.

利用改进SEaTH算法的面向对象分类特征选择方法

[J].武汉大学学报·信息科学版,2012,37(8):921-924.

[本文引用: 1]     

[ Yu X M, Zhan F B, Liao M S, et al.

Object-oriented feature selection algorithms based on improved Seath algorithms

[J]. Geomatics and Information Science of Wuhan University, 2012,37(8):921-924. ]

[本文引用: 1]     

[31] Bruzzone L.

An approach to feature selection and classification of remote sensing images based on the bayes rule for minimum cost

[J]. IEEE Transactions on Geoscience & Remote Sensing, 2000,38(1):429-438.

[本文引用: 1]     

[32] Yang J, Ye Z, Zhang X, et al.

Attribute weighted naive bayes for remote sensing image classification based on cuckoo search algorithm

[C]//International Conference on Security, Pattern Analysis, and Cybernetics. IEEE, 2017:169-174.

[本文引用: 1]     

[33] Breiman L, Friedman J H, Olshen R, et al.

Classification and regression trees

[J]. Encyclopedia of Ecology, 1984,40(3):582-588.

[本文引用: 1]     

[34] Bittencourt H R, Clarke R T.

Use of classification and regression trees (cart) to classify remotely-sensed digital images

[C]//Geoscience and Remote Sensing Symposium, 2003. Igarss '03. Proceedings. 2003 IEEE International. IEEE, 2003,6:3751-3753.

[本文引用: 1]     

[35] Zhou W, Song Y Q, Pan Z K, et al.

Classification of urban construction land with worldview-2 remote sensing image based on classification and regression tree algorithm

[C]// Computational Science and Engineering (CSE) and Embedded and Ubiquitous Computing (EUC), 2017 IEEE International Conference on. IEEE, 2017,2:277-283.

[本文引用: 1]     

[36] Mallet C, Bretar F, Roux M, et al.

Relevance assessment of full-waveform lidar data for urban area classification

[J]. Isprs Journal of Photogrammetry & Remote Sensing, 2011,66(6):S71-S84.

[本文引用: 1]     

[37] Gulnaz A, Sun T L, Liang Y, et al.

A new technique for remote sensing image classification based on combinatorial algorithm of svm and knn

[J]. International Journal of Pattern Recognition & Artificial Intelligence, 2018,32(7):1-23.

[本文引用: 1]     

[38] Breiman L.

Random forests

[J]. Machine Learning, 2001,45(1):5-32.

[本文引用: 1]     

[39] Feng Q, Liu J, Gong J.

Uav remote sensing for urban vegetation mapping using random forest and texture analysis

[J]. Remote Sensing, 2015,7(1):1074-1094.

[本文引用: 1]     

[40] 马玥,姜琦刚,孟治国,.

基于随机森林算法的农耕区土地利用分类研究

[J].农业机械学报,2016,47(1):297-303.

[本文引用: 1]     

[ Ma Y, Jiang Q G, Meng Z G, et al.

Classification of land use in farming area based on random forest algorithm

[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016,47(1):297-303. ]

[本文引用: 1]     

[41] Rodriguez-galiano V F, Chica-olmo M, Abarca-hernandez F, et al.

Random forest classification of Mediterranean land cover using multi-seasonal imagery and multi-seasonal texture

[J]. Remote Sensing of Environment, 2012,121(138):93-107.

[本文引用: 1]     

[42] 侯西勇,邸向红,侯婉,.

中国海岸带土地利用遥感制图及精度评价

[J].地球信息科学学报,2018,20(10):1478-1488.

[本文引用: 1]     

[ Hou X Y, Di X H, Hou W, et al.

Accuracy evaluation of land use mapping using remote sensing techniques in coastal zone of China

[J]. Journal of Geo-information Science, 2018,20(10):1478-1488. ]

[本文引用: 1]     

[43] Huang D, Xu S, Sun J, et al.

Accuracy assessment model for classification result of remote sensing image based on spatial sampling

[J]. Journal of Applied Remote Sensing, 2017,11(4):1-13.

[本文引用: 1]     

[44] Melville B, Lucieer A, Aryal J.

Object-based random forest classification of Landsat etm+ and Worldview-2 satellite imagery for mapping lowland native grassland communities in Tasmania, Australia

[J]. International Journal of Applied Earth Observation & Geoinformation, 2018,66:46-55.

[本文引用: 1]     

[45] 杨文杰.

基于Landsat 8生长时序遥感信息的玉米干旱监测研究

[D].石河子:石河子大学,2017.

[本文引用: 1]     

[ Yang W J.

Maize drought monitoring based on Landsat 8 growth time series remote sensing information

[D]. Shihezi: Shihezi University, 2017. ]

[本文引用: 1]     

[46] 陈威.

基于Hadoop的K-means遥感影像分类算法的研究

[D].赣州:江西理工大学,2017.

[本文引用: 1]     

[ Chen W.

Research on k-means remote sensing image classification algorithm based on hadoop

[D]. Ganzhou: Jiangxi University of Science and Technology, 2017. ]

[本文引用: 1]     

[47] 乌兰,乌兰吐雅,包珺玮.

基于Landsat 8 OLI影像的大兴安岭西麓春小麦识别方法的比较研究

[J].北方农业学报,2017,45(2):109-112.

[本文引用: 1]     

[ Wu L,

Wu L T Y, Bao J W. Study on comparison of identification methods for spring wheat at Great Khingan western slope based on Landsat 8 OLI

[J]. Journal of Northern Agriculture, 2017,45(2):109-112. ]

[本文引用: 1]     

/