基于独立成分分析和随机森林算法的城镇用地提取研究

蒲东川; 王桂周; 张兆明; 牛雪峰; 何国金; 龙腾飞; 尹然宇; 江威; 孙嘉悦

doi:10.12082/dqxxkx.2020.190385

地球信息科学学报 >

2020 , Vol. 22 >Issue 8: 1597 - 1606

DOI: https://doi.org/10.12082/dqxxkx.2020.190385

地球信息科学理论与方法

基于独立成分分析和随机森林算法的城镇用地提取研究

蒲东川 ^,¹^,² ,
王桂周 ¹^,³^,⁴ ,
张兆明 ^,¹^,³^,⁴^,^* ,
牛雪峰 ² ,
何国金 ¹^,³^,⁴ ,
龙腾飞 ¹^,³^,⁴ ,
尹然宇 ¹^,³^,⁴ ,
江威 ¹^,³^,⁴ ,
孙嘉悦 ²

展开

1.中国科学院空天信息创新研究院, 北京 100094
2.吉林大学地球探测科学与技术学院, 长春 130026
3.海南省地球观测重点实验室, 三亚 572029
4.三亚中科遥感研究所, 三亚 572029

*张兆明（1980— ）,男,河南郑州人,副研究员,主要从事全球变化、地表覆盖分类、地表温度反演研究。 E-mail: zhangzm@radi.ac.cn

蒲东川（1995— ）,男,重庆奉节人,硕士生,主要从事地表覆盖分类、城市遥感等研究。 E-mail:pudc17@mails.jlu.edu.cn

收稿日期: 2019-07-19

要求修回日期: 2019-11-25

网络出版日期: 2020-10-25

基金资助

国家自然科学基金重点项目(61731022)

中科院A类先导专项(XDA19090300)

国家重点研发计划课题(2016YFA0600302)

国家重点研发计划课题(2016YFB0501502)

版权

收起

Urban Area Extraction based on Independent Component Analysis and Random Forest Algorithm

PU Dongchuan ^,¹^,² ,
WANG Guizhou ¹^,³^,⁴ ,
ZHANG Zhaoming ^,¹^,³^,⁴^,^* ,
NIU Xuefeng ² ,
HE Guojin ¹^,³^,⁴ ,
LONG Tengfei ¹^,³^,⁴ ,
YIN Ranyu ¹^,³^,⁴ ,
JIANG Wei ¹^,³^,⁴ ,
SUN Jiayue ²

Expand

1. Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100094, China
2. College of Geo-exploration Science and Technology, Jilin University, Changchun 130026, China
3. Key Laboratory of Earth Observation Hainan Province, Sanya 572029, China
4. Sanya Institute of Remote Sensing, Sanya 572029, China

*ZHANG Zhaoming, E-mail: zhangzm@radi.ac.cn

Received date: 2019-07-19

Request revised date: 2019-11-25

Online published: 2020-10-25

Supported by

National Natural Science Foundation of China(61731022)

Strategic Priority Research Program of the Chinese Academy of Sciences(XDA19090300)

National Key Research and Development Project(2016YFA0600302)

National Key Research and Development Project(2016YFB0501502)

Copyright

Fold

摘要

城镇用地信息是联合国2030年可持续发展议程关注的重点之一。城市在世界范围内迅速扩张,快速准确地获取城镇用地信息对于政府决策具有重要作用。城镇土地覆盖信息非常复杂,包括人工建筑、树木、草地、水体等多种地表覆盖类型。基于传统人工测绘获取城镇用地信息费时费力并且难于及时更新。Landsat等遥感卫星数据为城镇用地信息提取提供了丰富的数据源。基于卫星遥感数据提取的城镇用地信息可以为未来城市的建设和管理提供基础的科学决策数据。基于监督分类方法和卫星遥感数据可快速地提取城镇用地信息,然而特征变量的选择对于高精度城镇用地信息提取尤为重要。为研究不同特征变量组合对于城镇用地信息提取的影响,以北京市为研究区,以2017年7月10日获取的Landsat 8 OLI影像为数据源,通过数据预处理、纹理提取、独立成分分析、主成分分析等得到4个维度的29个特征,选取了7种特征组合方案进行城镇用地提取。考虑随机森林算法性能稳定,分类精度高和可以方便进行特征重要性评价等优点,选择其作为监督分类算法以提取城镇用地信息,并进行了精度评定,以确定最优的城镇用地提取特征组合。研究发现：综合利用光谱特征和独立成分分析后的影像特征,提取城镇用地的总体精度为93.1%,Kappa系数为0.86,优于利用其他特征的提取结果;基于随机森林算法对数据进行训练后输出的各变量的归一化变量重要性与特征均值的标准差结果存在相似性,利用随机森林算法的变量重要性估计与特征均值折线图都可以进行变量重要性评价。

关键词： 随机森林; 独立成分分析; 主成分分析; 灰度共生矩阵; 卫星遥感; 城镇用地; Landsat 8; 特征重要性

本文引用格式

蒲东川 , 王桂周 , 张兆明 , 牛雪峰 , 何国金 , 龙腾飞 , 尹然宇 , 江威 , 孙嘉悦 . 基于独立成分分析和随机森林算法的城镇用地提取研究[J]. 地球信息科学学报, 2020 , 22(8) : 1597 -1606 . DOI: 10.12082/dqxxkx.2020.190385

Abstract

Urban area information is of great significance for human development, in the 2030 United Nations (UN) Sustainable Development Agenda. Urban area expanded rapidly in many places of the world. Accurate and timely urban area information is very important for decision makers. However, land cover in urban area is highly complex, including artificial buildings, trees, grasslands, water bodies, etc. Extraction of urban land cover information based on traditional manual survey is time-consuming and difficult to update in time. Free access to remote sensing satellite data such as Landsat provides a rich source of data for urban area extraction. Urban area information extracted from space borne remote sensing images can provide basic scientific data for decision-making and city construction and management. Based on supervised classification method and satellite remote sensing data, it is possible to extract urban areas fast. However, choosing appropriate feature variables is very important for obtaining accurate urban area extraction result, especially linear correlations between different features has a significant impact on the extraction accuracy. After implementing independent component analysis (ICA) transformation to satellite remote sensing image data, linearly independent feature variables can be obtained, therefore accuracy of urban area extraction can be effectively improved. Taking Beijing city as the study area and Landsat 8 Operational Land Imager (OLI) imagery (path/row: 123/32) acquired on July 10^th, 2017 as the experimental data, preprocessing, texture extraction, independent component analysis, and principal component analysis were performed, 29 features in 4 dimensions and 7 feature variable combinations were selected. Then, Random Forest (RF) algorithm was chosen for urban area extraction owing to its stable performance, high classification accuracy and feature importance evaluation capability. Based on the random forest algorithm, feature importance evaluation, urban area extraction, and accuracy assessment were carried out to determine the optimal feature combination for urban area extraction. It was found that: (1) the overall accuracy of urban area extraction with spectral and ICA transformed features is 93.1% and the Kappa coefficient is 0.86, which is superior to the results with other features; (2) Based on the random forest algorithm, the data is trained to obtain normalized importance of each feature. There is a similarity between the normalized importance of features and the standard deviation of mean values of the features, indicating that the importance estimate of features has a close relationship with the standard deviation of mean values of the features and both can be used to estimate importance of the variables.

Key words： random forest; independent component analysis; principal component analysis; gray level co-occurrence matrix; satellite remote sensing; urban area; Landsat 8; feature importance

1 引言

在过去几十年中,城市在世界范围内迅速扩张。特别是在中国,北京、上海等城市的人口和经济快速增长,人们的生活水平得到显著提高。但在城市迅速蔓延到周围环境的过程中,产生了一系列的社会和环境问题,如公共卫生、城市气候等方面^[1]。为了应对这一系列问题,需要为决策者提供可靠的区域甚至全球的城镇用地信息^[2]。

传统获取城镇用地信息的手段主要采用人工测绘,它耗资巨大、实效性差、数据难以及时更新^[3]。现在,主要基于遥感数据和监督分类方法进行城镇用地提取,可以明显地提高城镇用地提取的效率^[4]。常用的分类器有最大似然估计、支持向量机（Support Vector Machines, SVM）、决策树（Decision Tree, DT）、随机森林（Random Forest, RF）等^[5]。从2001年以来,因为其分类效果稳定和处理速度快^[6],随机森林分类器^[7]的使用越来越广泛,并且该分类器还可以有效地用于选择和排序特征变量。这一重要特性对于处理高维度和线性相关性的遥感数据十分有价值^[8],是其他许多分类器不具有的特性^[9]。许多学者利用随机森林算法进行了特征重要性评价或城镇用地提取的研究。如Masoumi等^[10]基于随机森林评估了ASTER数据的光谱,热学和纹理特征对岩性测绘的影响,Huang等^[11]利用随机森林算法对北京城镇用地进行了长时间变化检测研究。

研究表明,可以通过稳定的分类器和具有代表性的训练样本来有效提高分类精度。但为了进一步提高分类精度和稳定性,还需要研究特征变量的选择^[12]。如Zhu等^[13]基于随机森林算法评估了Landsat和SAR数据的光谱、纹理等特征对美国马萨诸塞州城镇用地提取的影响;詹国旗等^[14]基于随机森林算法进行特征空间优化对吉林省白城市的湿地信息进行提取;温小乐等^[15]基于随机森林进行特征选择开展福建省福州市的城市绿化乔木树种分类。但是这些研究都没考虑到特征变量间的线性相关性。特征变量间的线性相关性可显著影响地物间可区分程度。Landsat 8 OLI等数据的光谱特征并非完全线性无关,使得其对地物的分离能力较低,容易造成错分和漏分情况。通过独立成分分析（Independent Component Analysis,ICA）可以得到线性无关的特征变量。如吴一全等^[17]研究了结合多尺度分析和ICA的遥感图像变换检测算法^[16];常睿春等研究了Fast ICA变换在高光谱遥感矿物信息提取中的应用;曹晶晶等^[18]基于ICA进行高光谱混合像元的分解。这些研究均表明了利用ICA有助于提高遥感信息提取的精度,而通常基于随机森林算法进行特征选择和遥感信息提取的研究并没有考虑ICA变换特征。

综上,本研究将随机森林算法和ICA变换相结合进行城镇用地信息提取实验,以北京市的Landsat8 OLI影像为数据源,首先对Landsat 8 OLI影像进行数据预处理、纹理提取、独立成分分析、主成分分析,然后基于随机森林算法进行特征重要性评价、城镇用地提取,并进行精度评定,以确定最优的城镇用地信息提取方案。

2 研究方法与实验数据

2.1 技术路线

遥感数据采集方式多样,数据特征非常丰富。通过借鉴国内外城镇用地遥感信息提取的研究经验,综合选择光谱、纹理、主成分特征及独立成分特征等多源特征作为输入。光谱特征是遥感数据的最基本特征,主成分分析可以突出遥感数据的主要信息,减少噪声影响,有利于城镇用地的提取。通过独立成分分析可以得到线性无关的特征变量从而抑制线性相关性对分类提取结果的影响。研究通过美国地质调查局官方网站下载所需的Landsat 8 OLI数据,利用ENVI软件进行辐射定标和大气校正等数据预处理,获得地表反射率数据作为光谱维度特征数据。对地表反射率数据分别进行独立成分分析、主成分分析并利用灰度共生矩阵提取纹理特征。然后选取训练样本,先由特征均值折线图评定各特征的可分性,基于随机森林算法的袋外估计误差（Out of bag error rate, OOB error rate）和变量重要性进一步评定各特征维度的可分性。最后进行城镇用地提取,并评定其分类精度。实验采用的处理器为Intel（R）Core（TM）i7-6700CPU@3.40GHz。实验流程见图1。

显示原图|下载原图ZIP|生成PPT

图1 城镇用地提取技术路线

Fig. 1 Experimental flow for urban area extraction

2.2 研究方法

2.2.1 主成分分析

主成分分析,对一景n波段的遥感影像施加一个线性变换,即对该图像原始空间乘以一个线性变换矩阵后,产生新空间的过程。公式为：

（1）

Y = AX

式中：X表示图像的原始空间;A表示线性变换;Y为变换后的新图像空间。

主成分分析一般将多波段的图像信息压缩到比原始波段更少的几个波段上面,第一主成分包含最大的信息量,往后依次减小。主成分分析大量地压缩了数据,减少了数据量,突出了主要信息,同时抑制了噪声,达到了图像增强的目的,有利于特征选择,但是也存在着一定的信息丢失。

2.2.2 独立成分分析

多光谱图像的各波段之间的数据具有一定的相关性,如果某2类地物具有相似的光谱特性,在监督分类时易产生错分的情况。独立成分分析在保留图像原始信息的基础上,将原始几个波段变换为相同数量的线性无关的特征波段,增加了地物的可区分性^[19]。

基于主成分分析和独立成分分析的原理,绘制了图2主成分分析和独立成分分析关系图。可以看出,主成分分析是沿原始数据方差最大方向建立正交变换,而独立成分分析不限制这些特征是否正交,它的主方向为最大统计相关方向。因此,其变换后的特征之间更加线性无关。在遥感影像监督分类中,许多重要的信息都包含在高阶统计量中。如果只采用主成分分析对图像进行处理,可能会丢失很多关键信息,而独立成分分析为基于高阶统计量去除相关性的多元数据处理方法,可以有效获取线性无关的数据特征。

显示原图|下载原图ZIP|生成PPT

图2 主成分分析（PCA）和独立成分分析（ICA）关系

Fig. 2 Principal Component Analysis （PCA） and Independent Component Analysis （ICA）

2.2.3 灰度共生矩阵

灰度共生矩阵（Gray Level Co-occurrence Matrix,GLCM）反映遥感图像的灰度值在空间上的分布,是遥感图像纹理分析领域中经常采用的方法之一^[20,21,22]。GLCM以像素的灰度和位置为研究对象,反映像素灰度关于方向、相邻间隔、变化幅度等多方面信息,是分析图像局部模式和它们排列规则的基础。在遥感图像的基于灰度共生矩阵的纹理分析中,通常选用的统计量有中值（Mean）、协方差（Variance）、同质性/逆差距（Homogeneity）、反差（Contrast）、差异性（Dissimilarity）、熵（Entropy）、二阶距（Angular Second Moment）和自相关（Correlation）等。

2.2.4 随机森林算法

随机森林算法是由伯克利大学教授Breiman综合了决策树,Bagging集成方法,以及随机子空间理论,提出的一种集成学习（Ensemble Learning, EL）方法。随机森林算法通过构造多个训练集得到决策树序列,即通过k轮训练,得到一个分类器序列{ h₁（x）, h₂（x）, …, h_k（x） },构成一个多决策树的分类器组合,最后通过投票产生输出结果^[23],即：

（2）

H (x) = argma x y ∑ i = 1 k I (h i (x) = Y)

式中：H(x)表示输出的分类结果;h_i为单个决策树分类器;Y为输出变量;I(·)为指示函数。其泛化误差上界为：

（3）

P E * ≤ ρ ̅ (1 - S 2) S 2

式中：PE^*为泛化误差上界;

ρ ̅

为决策树间的相关性;S为决策树的分类强度。

式（3）表明,RF的泛化误差上界与单个决策树的分类强度S负相关,与决策树间的相关性

ρ ̅

正相关。

随机森林算法的优点包括：① 由于随机森林的基学习器是决策树,故随机森林学习器可以进行分类,也可以进行回归,故在最终的分类时,可以输出概率;② 随机森林的袋外无偏估计可以有效估计分类器的泛化误差;③ 变量重要性估计也是随机森林算法的重要优点之一,被广泛应用于特征筛选之中。

2.3 实验区及数据来源

研究区选择北京市,北京市位于华北平原西北边缘,市域总面积16 410.54 km²,近年来,北京市经历了快速的城市化过程,城市范围不断扩大。研究使用2017年7月10日过境的北京市的Landsat 8 OLI影像（轨道号：123/032）,影像质量良好,几乎无云的影响。研究区Landsat8 OLI影像（RGB:654）如图3所示,数据来源于美国地质调查局（http://glovis.usgs.gov）。

显示原图|下载原图ZIP|生成PPT

图3 研究区域2017年7月10日Landsat 8影像

Fig. 3 Landsat 8 image of the study area on July 10, 2017

3 实验结果及分析

3.1 样本分析

北京市主要土地覆盖类型包括森林、农田、水体、城镇用地等。在本研究中,参考Schneider和Mertes对于城镇用地的定义^[20]：以人工构造物（例如道路和建筑物）为主导的像素即为城镇用地,其中“主导”表示每个像素内人工构造物的覆盖率大于50%。由于高反照率建筑物（例如机场）与低反照率建筑物存在明显的光谱差异^[24],所以将城镇用地分为高反照率与低反照率建筑物两类,余下的地物分为水体,林地和其他,一共选取了5类样本。通过Landsat 8图像目视解译,并辅以Google Earth高分辨率图像收集空间分布均匀且稳定的训练样本点,对于每类地物分别采集了300个训练样本点。数据在光谱、纹理、PCA和ICA等维度下的特征如表1所示。

表1 实验选取的4个特征维度及其对应的特征

Tab. 1 4 feature dimensions selected by experiments and their corresponding features

序号		特征名称
a	光谱维度	Coastal、Blue、Green、Red、NIR、SWIR1、SWIR2
b	ICA维度	ICA1、ICA2、ICA3、ICA4、ICA5、ICA6、ICA7
c	PCA维度	PCA1、PCA2、PCA3、PCA4、PCA5、PCA6、PCA7
d	纹理维度	Mean.(Mean)、Var.(Variance)、Hom.(Homogeneity)、Con.(Contrast)、Dis.(Dissimilarity)、Ent.(Entropy)、ASM.(Angular Second Moment)、Cor.(Correlation)

训练样本在不同维度下的特征均值折线图是最为简单直观地评价各类训练样本相关性和可分离性的图表。在光谱、纹理、PCA、ICA各维度下,分别统计训练样本点的各特征的均值和标准差,得到5类训练样本在不同维度下的各特征均值折线图（图4）,图4下方的柱状图表示5类样本特征均值的标准差。可以看出,各类样本在光谱维度整体上具有较好的可分离性,NIR、SWIR1和SWIR2的特征均值标准差较大,可能为比较重要的特征变量;在ICA维度,ICA2和ICA5的特征均值标准差较大;在PCA维度,前2个主成分的特征均值标准差较大;在纹理维度,Mean的特征均值标准差最大。

显示原图|下载原图ZIP|生成PPT

图4 4个特征维度的特征均值（折线图）及标准差（柱状图）

Fig. 4 Mean （Polyline） and standard deviation （histogram） value of 4 characteristic dimensions

3.2 特征重要性评价

随机森林算法的重要参数之一就是决策树个数^[25]（n_estimators）。它利用bagging方法生成训练集,每次产生训练集时会留下约1/3数据作为验证集,得到袋外估计误差率（OOB error rate）。以此,设计实验,依次增加随机森林算法的决策树个数,得到在光谱、纹理、PCA、ICA维度的袋外估计误差率,如图5。可以看出,在各特征维度下,当算法的n_estimators到达100时,模型的误差已经较低,并且随后趋于稳定。所以一般将随机森林算法的n_estimators设置为100是可靠的。ICA特征下,具有最低的袋外估计误差率,说明ICA一定程度上确实增强了数据的线性无关性,提高了训练精度。光谱特征和PCA特征具有相似的袋外估计误差率,但明显高于纹理特征。可以看出,在曲线趋于稳定之后,纹理特征的精度是最低的。

显示原图|下载原图ZIP|生成PPT

图5 袋外误差估计与决策树个数关系

Fig. 5 OOB error rate and n_estimators

变量重要性估计是随机森林算法的重要特点之一。数据训练完成后可以输出各变量的归一化变量重要性^[26],各特征的变量重要性和为1,特征越重要,变量重要性的值就越大。输出随机森林的决策树为100时的特征重要性的均值及变异性,如图6。对于光谱特征重要性,SWIR1特征最重要,与通过特征均值折线图得到的最重要特征一致,并且各个特征重要性的变异性较大。对于ICA特征,ICA5的特征重要性最高,与特征均值折线图结果一致,各个特征重要性的变异性较小。PCA特征,PCA1,PCA2和PCA3为重要特征,往后迅速降低,与特征均值图结果较为吻合。而在纹理特征中,对于各类样本,Mean特征最为重要。可以发现,基于随机森林算法对数据进行训练后得到各特征的变量重要性,输出的各变量的归一化变量重要性与特征均值的标准差结果存在相似性,这应该是由于特征变量均值的标准差可体现地物的可分离性,标准差越大可分离性越好,也就很可能为重要特征。

显示原图|下载原图ZIP|生成PPT

图6 4个特征维度的特征重要性

Fig. 6 Feature importance of 4 characteristic dimensions

3.3 分类结果及精度评定

利用训练完成的分类器进行北京市土地覆盖分类,分类结果见图7。从图7可看出,仅利用光谱特征,出现大量的错分情况,在对图像做ICA和PCA之后可以减少这种错误。而仅基于纹理特征分类,分类精度很低。可以发现,基于4个特征维度分别得到的城镇用地信息存在很大的差异,说明输入特征对提取结果有显著的影响。

显示原图|下载原图ZIP|生成PPT

图7 2017年北京市城镇用地提取结果

Fig. 7 Urban area extraction results in Beijing in 2017

通过Landsat 8图像目视解译,并结合Google Earth高分辨率图像选择500个验证点（图8）对基于单个特征维度和特征组合的7个分类方案得到的提取结果进行精度验证,验证精度的对比分析如表2所示。其中,运行时间表示训练和分类的总时间,错分率和漏分率都是针对城镇用地而言。对于光谱特征,分类的总体精度为84.3%,发生一定程度的错分和漏分的情况,分类准确度一般。对于纹理特征,其错分率和漏分率分别高达75.6%和33.3%,发生大量的错分和漏分的情况,分类精度最差,而且运行时间最长。对于PCA特征,分类的总体精度为81.9%,分类精度较低。光谱特征结合ICA特征的分类总体精度和Kappa系数分别为93.1%和0.86,高于其他分类方案,错分率也是最低的,分类效果总体最佳。

显示原图|下载原图ZIP|生成PPT

图8 2017年北京市城镇用地提取结果验证点的空间分布

Fig. 8 Distribution map of validation points for urban area extraction results in Beijing in 2017

表2 7种分类方案提取城镇用地结果的精度对比

Tab. 2 Comparison of the accuracy of 7 classification schemes for extracting urban area

序号	特征数量	特征名称	总体精度/%	Kappa系数	错分率/%	漏分率/%	运行时间/s
1	7	光谱特征	84.3	0.71	29.2	19.6	101.1
2	8	纹理特征	39.5	0.27	75.6	33.3	132.3
3	7	PCA特征	81.9	0.62	25.3	23.9	97.5
4	7	ICA特征	87.1	0.78	20.8	20.2	103.7
5	15	光谱+纹理	86.3	0.69	30.5	28.3	197.8
6	14	光谱+PCA	89.2	0.79	23.3	31.5	164.2
7	14	光谱+ICA	93.1	0.86	17.5	18.4	157.1

4 结论与讨论

4.1 结论

对北京市Landsat 8 OLI影像进行ICA变换后,利用随机森林算法进行了北京市城镇用地信息提取的研究,同时,还评估和对比了Landsat 8 OLI影像的光谱、纹理等维度的特征,进行了特征重要性评价、城镇用地提取和精度评价等,研究发现：

（1）训练样本在不同维度下的特征均值折线图可以最为简单直观地评价各类训练样本相关性和可分离性。基于随机森林算法对数据进行训练后也可以得到各特征的变量重要性。研究发现随机森林算法输出的的归一化变量重要性与特征均值的标准差结果存在相似性,表明变量重要性估计与特征均值折线图存在一定关系,都可以进行变量重要性估计。

（2）独立成分分析去除了各类变量的线性相关性,可以有效获取线性无关的数据特征。研究设计了7种城镇用地的提取方案,并进行了精度验证,对比分析后发现综合利用光谱特征和独立成分分析后的影像特征,提取城镇用地的总体精度为93.1%,Kappa系数为0.86,优于利用其他特征的城镇用地信息提取结果,说明独立成分分析可以显著提高城镇用地信息的提取精度。

4.2 讨论

从Landsat等卫星遥感数据中提取的城镇用地等信息为建设和运营未来城市提供了基础的科学决策数据。Landsat系列卫星数据于2009年可以公开和免费的访问,这对于农业、环境监测、土地制图和变化检测等领域非常重要。现在,Landsat系列卫星数据是时间跨度最长的遥感卫星数据之一,是城市遥感的研究宝贵的数据源。因此,基于Landsat系列卫星数据的城镇用地提取研究还需要寻找更加高效率和高精度的技术方案。

本研究仅讨论了基于单一时相Landsat 8 OLI数据的城镇用地提取研究,现在正处于遥感大数据时代,给我们提供了丰富的数据源以进行城镇用地的提取,特别是基于长时间序列或者多时相的卫星遥感数据可以提取更高精度的城镇用地信息。大多数城镇用地信息提取研究都是基于日间的光学和热传感器的数据,但还有其他一些传感器（LiDAR、RADAR和夜光传感器等）也可以提供对城镇用地特征的独特描述,如2018年6月新一代夜光遥感卫星珞珈1-01（LJ1-01）发射升空,它已经免费提供了高空间分辨率的夜光数据。如果与多源遥感数据结合使用进行城镇用地的提取,则可以进一步提高提取的准确性。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

[1]	Gong P, Liang S, Carlton E J. Urbanisation and health in China[J]. The Lancet, 2012,379(9818):843-852. DOI

[2]	Weng Q. Remote sensing of impervious surfaces in the urban areas: Requirements, methods, and trends[J]. Remote Sensing of Environment, 2012,117:34-49. DOI

[3]	徐涵秋, 王美雅. 地表不透水面信息遥感的主要方法分析[J]. 遥感学报, 2016,20(5):1270-1289. [ Xu H Q, Wang M Y. Remote sensing-based retrieval of ground impervious surfaces[J]. Journal of Remote Sensing, 2016,20(5):1270-1289. ]

[4]	Belgiu M, Dr Gut L. Comparing supervised and unsupervised multiresolution segmentation approaches for extracting buildings from very high resolution imagery[J]. ISPRS J Photogramm Remote Sens, 2014,96:67-75. DOI PMID

[5]	Lu D, Weng Q. Use of impervious surface in urban land-use classification[J]. Remote Sensing of Environment, 2006,102(1-2):146-160. DOI

[6]	Belgiu M, Drăguţ L. Random forest in remote sensing: A review of applications and future directions[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016,114:24-31. DOI

[7]	Breiman L. Random forests[J]. Machine Learning, 2001,45(1):5-32. DOI

[8]	Körting T S, Garcia Fonseca L M, Câmara G. GeoDMA-geographic data mining analyst[J]. Computers & Geosciences, 2013,57:133-145.

[9]	Belgiu M, Dr Gut L, Strobl J. Quantitative evaluation of variations in rule-based classifications of land cover in urban neighbourhoods using WorldView-2 imagery[J]. ISPRS J Photogramm Remote Sens, 2014,87(100):205-215. DOI PMID

[10]	Masoumi F, Eslamkish T, Abkar A A. Integration of spectral, thermal, and textural features of ASTER data using Random Forests classification for lithological mapping[J]. Journal of African Earth Sciences, 2017,129:445-457. DOI

[11]	Huang H, Chen Y, Clinton N. Mapping major land cover dynamics in Beijing using all Landsat images in Google Earth Engine[J]. Remote Sensing of Environment, 2017,202:166-176. DOI

[12]	宫鹏, 张伟, 俞乐. 全球地表覆盖制图研究新范式[J]. 遥感学报, 2016,20(5):1002-1016. [ Gong P, Zhang W, Yu L. New research paradigm for global land cover mapping[J]. Journal of Remote Sensing, 2016,20(5):1002-1016. ]

[13]	Zhu Z, Woodcock C E, Rogan J. Assessment of spectral, polarimetric, temporal, and spatial dimensions for urban and peri-urban land cover classification using Landsat and SAR data[J]. Remote Sensing of Environment, 2012,117:72-82. DOI

[14]	詹国旗, 杨国东, 王凤艳, 等. 基于特征空间优化的随机森林算法在GF-2影像湿地分类中的研究[J]. 地球信息科学学报, 2018,20(10):1520-1528. DOI [ Zhan G Q, Yang G D, Wang F Y, et al. The random forest classification of wetland from GF-2 imagery based on the optimized feature space[J]. Journal of Geo-information Science, 2018,20(10):1520-1528. ]

[15]	温小乐, 钟奥, 胡秀娟. 基于随机森林特征选择的城市绿化乔木树种分类[J]. 地球信息科学学报, 2018,20(12):1777-1786. DOI [ Wen X L, Zhong A, Hu X J. The classification of urban greening tree species based on feature selection of random forest[J]. Journal of Geo-information Science, 2018,20(12):1777-1786. ]

[16]	吴一全, 曹照清, 陶飞翔. 结合多尺度几何分析和KICA 的遥感图像变化检测[J]. 遥感学报, 2015,19(1):126-133. [ Wu Y Q, Cao Z Q, Tao F X. Change detection of remote sensing images by multi-scale geometric analysis and KICA[J]. Journal of Remote Sensing, 2015,19(1):127-133. ]

[17]	常睿春, 王璐, 王茂芝. FastICA在高光谱遥感矿物信息提取中的应用[J]. 国土资源遥感, 2013,25(4):129-132. DOI [ Chang R C, Wang L, Wang M Z, Application of FastICA in mineral information extraction from hyperspectral remote sensing data[J]. Remote Sensing for Land and Resources, 2013,25(4):129-132.]

[18]	曹晶晶, 卓莉, 王芳. 盲信号分离技术在高光谱混合像元分解中的应用[J]. 遥感技术与应用, 2013,28(3):488-495. [ Cao J J, Zhuo L, Wang F. Researchon applications of blind source separation tech-niquesin hyperspectral unmixing[J]. Remote Sensing Technology and Application, 2013,28(3):488-495. ]

[19]	Hyvärinen A, Oja E. Independent component analysis: Algorithms and applications[J]. Neural Networks, 2000,13(4-5):411-430. DOI PMID

[20]	Schneider A, Mertes C M. Expansion and growth in Chinese cities, 1978-2010[J]. Environmental Research Letters, 2014,9(2):024008. DOI

[21]	Gounaridis D, Chorianopoulos I, Symeonakis E. A random forest-cellular automata modelling approach to explore future land use/cover change in Attica (Greece), under different socio-economic realities and scales[J]. Sci Total Environ, 2019,646:320-335. DOI PMID

[22]	Li X, Gong P, Liang L. A 30-year (1984-2013) record of annual urban dynamics of Beijing City derived from Landsat data[J]. Remote Sensing of Environment, 2015,166:78-90. DOI

[23]	Paul A, Mukherjee D P, Das P. Improved random forest for classification[J]. IEEE Trans Image Process, 2018,15(6):36-45.

[24]	Qihao W, Xuefei H. Medium spatial resolution satellite imagery for estimating and mapping urban impervious surfaces using LSMA and ANN[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008,46(8):2397-2406. DOI

[25]	Teluguntla P. A 30-m landsat-derived cropland extent product of Australia and China using random forest machine learning algorithm on Google Earth Engine cloud computing platform[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2018,17(3):273-289.

[26]	Xu Z, Chen J, Xia J. Multisource earth observation data for land-cover classification using random forest[J]. IEEE Geoscience and Remote Sensing Letters, 2018,15(5):789-793. DOI

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

1 引言

2 研究方法与实验数据

2.1 技术路线

图1 城镇用地提取技术路线

2.2 研究方法

图2 主成分分析（PCA）和独立成分分析（ICA）关系

2.3 实验区及数据来源

图3 研究区域2017年7月10日Landsat 8影像

3 实验结果及分析

3.1 样本分析

表1 实验选取的4个特征维度及其对应的特征

图4 4个特征维度的特征均值（折线图）及标准差（柱状图）

3.2 特征重要性评价

图5 袋外误差估计与决策树个数关系

图6 4个特征维度的特征重要性

3.3 分类结果及精度评定

图7 2017年北京市城镇用地提取结果

图8 2017年北京市城镇用地提取结果验证点的空间分布

表2 7种分类方案提取城镇用地结果的精度对比

4 结论与讨论

4.1 结论

4.2 讨论

参考文献