Automatic Change Detection Approach for High-Resolution Remotely Sensed Images Based on Adaboost Algorithm

  • CHEN Weifeng , 1, 2, 3 ,
  • MAO Zhengyuan , 1, 2, 3, * ,
  • XU Weiming 1, 2, 3 ,
  • XU Rui 1, 2, 3, 4
  • 1. Provincial Spatial Information Engineering Research Center, Fuzhou University, Fuzhou 350002, China
  • 2. Key Laboratory of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350002, China
  • 3. National Engineering Research Centre of Geospatial Space Information Technology, Fuzhou University, Fuzhou 350002, China
  • 4. School of Information Science and Engineering, Fujian University of Technology, Fuzhou 350188, China
*Corresponding author: MAO Zhengyuan, E-mail:

Received date: 2018-07-30

  Online published: 2018-12-20

Supported by

National Natural Science Foundation of China, No.41701491;Project of Science and Technology of Fujian Province, No.2018J01619.


Human annotation is a massive labor cost for the training sample selection process when applying any kind of supervised learning algorithm for change detection based on high-resolution remotely sensed satellite images. It is limited and unreasonable to use just one single sort of classifier generated from a supervised algorithm to extract change information of variety from the time-series images both in completeness and accuracy, let alone the inevitable salt-and-pepper noise and tiny patches falsely detected which turn out to be ubiquitous in and out of geographical entities. To tackle with problems mentioned above, a change detection approach based on a new automatic training sample annotation strategy and an improved Adaboost ensemble learning algorithm was proposed. At first, the unsupervised change detection algorithm CVA was applied to generate a low-level change detection result as referencing labels for further annotation, then the low-level result was divided into several parts with different intervals to ensure the automatic acquisition of the evenly distributed training samples with confidence. Furthermore, decision stump, logistic regression and kNN were employed as the weak classifiers to construct a hybrid multi-classifiers ensemble system with the help of the improved Adaboost algorithm, which would effectively promote the classification accuracy and generalization capacity of weak classifiers by sufficiently mining and making use of the spatial information with potential values. Finally, the SLIC segmentation algorithm was implemented in the difference image, and the segmentation border information was combined with spatial contextual information to build up a dual-filter for spatial constraint aiming at decreasing the omission rate and the false alarm rate of the detection results. To verify the validity of the proposed method, we conducted experiments using two datasets of multispectral images collected by SPOT-5 and WorldView-2. Experimental results indicated that the proposed method would significantly lower the labor costs of training sample annotation and demonstrated superiority compared with four other methods in accuracy.

CHEN Weifeng , MAO Zhengyuan , XU Weiming , XU Rui . Automatic Change Detection Approach for High-Resolution Remotely Sensed Images Based on Adaboost Algorithm[J]. Journal of Geo-information Science, 2018 , 20(12) : 1756 -1767 . DOI: 10.12082/dqxxkx.2018.180353

1 引言

由于集成学习较单一分类器具备更强的泛化能力,因此它更适用于提取高分影像中复杂多变的地表信息,近年来许多学者利用Adaboost算法提取高分影像土地利用/覆盖信息[10-12,16],均取得了较高的分类精度。Adaboost是一种经典的集成学习算法,它采用boosting[9]策略集中关注被已训练的分类器误分类的数据,加权组合多个弱分类器输出强分类结果。Discrete Adaboost[13,14,15]是Adaboost算法的一种经典集成策略,它将每个弱分类器的输出结果分布在实数域中,使分类器表现出更强泛化能力,并能输出二分类结果[13],因此非常适用于变化检测工作。

2 研究方法

本研究首先利用CVA算法和阈值自适应确定方法完成初级变化检测,进而通过“非等距”区间采样的策略自动选择监督分类算法的训练样本;然 后以Adaboost算法为集成框架,选择决策树桩、 Logistic回归作为弱分类器进行同质集成,同时异质集成kNN算法构建混合分类器集成系统,以提升变化检测精度和分类器的泛化能力;最后利用SLIC算法分割差异影像获取边缘特征较完好的超像素块,结合空间邻域信息对检测结果进行空间约束,降低误检率和漏检率。具体流程如图1所示。
Fig. 1 Flowchart of the proposed change detection method

图1 本文变化检测方法流程

2.1 基于CVA的变化检测训练样本自动选择方法

C ts = α 1 0,1 m = fix C mean + CS × V max - T CS C 1 = T + CS , T + 1 × CS × 1 + α 1 m C 2 = T + 2 × CS , T + 2 × CS × 1 + α 1 m C m = T + m × CS , V max (1)
U ts = α 2 = α 1 × R n = fix U mean + US × T - V min US U 1 = T - US , T - 1 × US × 1 - α 2 n U 2 = T - 2 × US , T - 2 × US × 1 - α 2 n U n = V min , T - n × US (2)

2.2 基于Adaboost的混合分类器集成系统

决策树是Adaboost同质集成中广泛使用的弱分类器,文献[16]采用Adaboost集成CART决策树进行道路变化检测,有效抑制了道路变化检测结果中容易出现的边缘破碎和道路断裂现象。文献[17]基于Harr-like特征和GLCM纹理特征,运用Adaboost集成策略进行城市地形变化检测,结果优于BP神经网络。文献[12]基于Adabbost异质集成C4.5决策树、SVM和ANN进行土地利用信息提取,检测结果总体精度优于单分类器,但提升幅度不显著,个别地类精度退化。文献[18]指出,简单的弱分类器被Adaboost集成后效果更好,文献[12]由于选用了SVM、ANN等复杂度较高的强分类器,集成后的算法运行效率低,并存在过拟合现象。此外,现有基于Adaboost的变化检测研究主要面向中低分影像,并且未充分考虑分类器的异质集成以及基分类器的复杂度。区别于传统Discrete Adaboost的直接二类输出策略,本文提出一种改进的Adaboost算法,该方法顾及传统Adaboost的分类模糊度,将输出结果调整为正样本、负样本和待确定样本,同时将简单分类器进行同/异质集成并分层输出分类结果,单层Adaboost同质集成策略过程如下:
(1) 将训练集(N)中的每个样本赋予相同的权重 w i = 1 N , i 1,2 , , N ,构成训练样本权重向量W。训练样本的标签为yi, i 1,2 , , N
(2)迭代训练生成M个弱分类器,对于每个弱分类器 C j , j 1,2 , , M ,重复下述计算:
① 基于加权训练样本学习生成弱分类器 C j ,其分类标签向量为 D ji , i 1,2 , , N ,计算该弱分类器在加权训练数据集上的分类错误率 ε j ,其中 ε j = P D ji y i = w i ,且 ε j 0,1
② 计算弱分类器 C j 的权重 α j = 1 2 ln 1 - ε j ε j , α j R
③ 更新训练样本权重向量W并进行权重的重归一化处理。基于boosting策略的思想,若某个样本被弱分类器 C j 正确分类,则将其权重降低为 w i j + 1 = w i j × e - α j Sum ( W ) ,反之,若样本被错误分类,则将其权重增加为 w i j + 1 = w i j × e α j Sum ( W ) ,增加对错分样本的关注度。
(3)对测试样本集进行分类,对于每个测试样本,输出M个分类器对其的独立分类结果并相加构成结果累计值,然后通过 sign 函数确定该测试样本类别,计算公式为 sign j = 1 M α j × D j 。本文按下述方式处理分类结果累计值:当某个样本的结果累计值大于1时,将其判定为变化像元,累计值小于-1时判定为未变化像元,累计值落于[-1, 1]时判定为待确定像元,这样处理的目的是初步确定分类模糊度较小的样本标签,同时挑选出分类模糊度较大的样本进行后续分类处理。
(1)选择逻辑斯蒂回归为弱分类器,通过上述Discrete Adaboost集成策略迭代训练生成M个弱分类器(Ada-LR)并对影像中的每个像元进行分类,确定部分像元的标签,筛选出分类模糊度较大的待确定像元转入步骤(2)处理。考虑到算法的运行效率,采用随机梯度上升法更新回归系数进行优化。
(3)对步骤(2)剩余的待确定像元进行如下处理:获取剩余像元在步骤(1)中的分类结果累计值(Ada-LR),通过 sign 函数将累计值落于[0, 1]内的像元设置为变化像元,落于[-1, 0)内的设置为未变化像元,组合构成这些剩余像元的第一组标签向量A;同理利用步骤(2)的分类器(Ada-DS)获取剩余像元的第二组标签向量B;利用kNN算法对剩余像元进行分类,构成第三组标签向量C;最后通过多数投票法对三组标签向量进行投票确定剩余像元的最终类别。由于训练样本集的数据量较大,将k值设置在[10, 20]范围内,通过多次实验确定2个数据集的最佳k值分别为11和17。考虑到算法的复杂度,采用k-d树对kNN算法进行优化。

2.3 空间约束处理

SLIC[19,20]是一种针对K-means的改进算法,该算法仅需输入一个参数K,用于指定生成的超像元块数。设原始影像的像元个数为N,则影像分割后形成的每个超像元块内部大约有N/K个像元,边长约为 S = N K 。算法首先每隔S个像元选取一个聚类中心作为超像元块的种子点,为了避免将影像边界点或噪声点设置为聚类中心,算法在3×3的邻域内计算梯度值最小的像元点,将其作为聚类中心;然后通过距离D确定每个像素的最近聚类中心,聚类中心的搜索邻域范围为2S×2S,当迭代搜索完成后即形成边缘保持度较高、分割形状不规则的超像元块。D采用式(3)计算,式中 N c 代表紧致度系数,一般默认设为10。对于CIELab色彩空间中的图像,像元五维特征表示形式为 P i = [ l i a i b i x i j i ] T ,其中 l a b 分别代表图像的颜色信息, d c 为像元之间的颜色距离,xy则代表图像的位置信息, d s 为像元之间的欧氏距离。
D = d c N c 2 + d s S 2 (3)
d c = l j - l i 2 + a j - a i 2 + b j - b i 2 (4)
d s = x j - x i 2 + y j - y i 2 (5)

3 实验流程与结果分析

3.1 数据源

为了验证本文方法的有效性,分别以SPOT-5(包含红、绿、蓝、近红外和全色波段,全色波段空间分辨率2.5 m)和WorldView Ⅱ(包含红、绿、蓝、近红外和全色波段,全色波段空间分辨率0.5 m)双时相多光谱遥感影像为数据源,选取两组数据区域进行实验,如图2所示,两组数据均经过辐射定标、大气校正、影像融合(采用G-S融合)、几何校正等预处理。第一组数据集[21]为SPOT-5遥感影像,成像时间分别为2006年12月和2007年12月,影像大小为512像元×512像元,影像对应的地理区域位于广东省清远市,主要变化为水体变成裸地,以及裸地变为植被。第二组数据集为WorldView Ⅱ遥感影像,成像时间分别为2012年11月和2016年10月,影像大小为1800像元×1300像元,影像对应的地理区域位于福建省福州市,主要变化是植被、裸土和建设用地三者之间的转换。
Fig. 2 Original images for change detection

图2 变化检测的原始影像

3.2 评价指标

Tab. 1 Error matrix of change detection

表1 变化误差矩阵

实际变化 实际未变化 总和
检测变化 TP FP P
检测未变化 FN TN N
总和 P′ N′ T
Precision = TP TP + FP (6)
Kappa = Po - Pc 1 - Pc (7)
Po = TP + TN TP + TN + FP + FN (8)
Pc = TN + FN × TN + FP + TP + FP × TP + FN TP + TN + FP + FN × TP + TN + FP + FN
FNR = FN TP + FN (10)
FPR = FP TP + FP (11)

3.3 实验过程与结果分析

Fig. 3 Difference images

图3 差值影像

C 1 = T + CS , T + CS × 1 + α 1 m ( 12 ) C 2 = T + 2 × CS , T + CS × 2 + α 1 m , , C m - 1 (13)
Fig. 4 The number of error pixels obtained with different α1

图4 不同α1下样本选择分类精度

C 1 = C 2 = , , = C m - 1 = α 1 × CS / m ( 14 )
未变化样本采样区间Cj的长度为 α 2 × US / n 。实验结果表明,本文方法2个数据集的最佳α1值分别为0.3和0.7,“等间距”采样法的最佳α1值分别为0.4和0.2,变化强度采样法的最佳α1值分别为0.2和0.6。将2个数据集在不同的样本选择方法最优参数时的训练样本分布状况进行可视化展示,如图5所示,其中红色像元代表变化样本,绿色像元代表未变化样本,本文方法和“等间距”采样法所提取训练样本均匀分布于整景影像,而变化强度采样法由于只抽取了变化强度两极的像元,训练样本呈现出“扎堆结块”现象,并且由于变化像元过度集中而导致样本冗余。观察图4中不同方法所对应的精度评价结果可知,“区间采样法”明显优于变化强度采样法,而在“区间采样法”中,本文提出的“非等距采样法”总体优于“等距采样法”,说明本文方法能有效减少选取过多的CVA错检样本,提升自动选择的训练样本质量。
Fig. 5 Visualization images of different sample selection strategies with their optimal α1

图5 最佳α1下不同样本自动选择方法可视化结果

Fig. 6 The number of error pixels obtained with different numbers of weak classifiers

图6 不同弱分类器集成数量的变化检测精度

为减轻“椒盐现象”的影响,降低误检率和漏检率,采用SLIC分割和空间邻域信息对像元级检测结果进行双重约束,获取最终的变化检测结果。 2个数据集的超像元预期分割块数分别设置为4500和40 000,其它系数设置为算法默认值;P1设置均为0.25。SLIC分割结果如图7所示,由于综合考虑了影像的光谱特征和空间特征,分割结果与地物的实际边缘吻合度较高。
Fig. 7 The results of SLIC segmentation

图7 SLIC分割结果

本文选用的对比方法包括CVA、Logistic回归、ID3决策树、kNN、Adaboost与Logistic回归同质集成(Adaboost-LR)、Adaboost与决策树桩同质集成(Adaboost-DS)、本文构建的混合分类器集成系统(HCS)、经过空间约束的混合分类器集成系统(HCS-SC),算法检测结果和精度评价如图8图9以及表2表3所示,变化检测标准图通过目视解译并与Google Earth Pro相近时相的同区域影像对比后进行人工标注所得,如图8(i)和图9(i)所示。
Tab. 2 The change detection accuracy assessment result of dataset 1

表2 数据集1变化检测结果精度评价

Precision Kappa TPR FPR
CVA 0.5038 0.5720 0.2314 0.4962
LR 0.6685 0.7036 0.2058 0.3315
ID3 0.6313 0.6589 0.2510 0.3687
kNN 0.7207 0.7188 0.2412 0.2793
Ada-LR 0.7090 0.7530 0.1534 0.2910
Ada-DS 0.7376 0.7279 0.2431 0.2624
HCS 0.8371 0.8472 0.1197 0.1629
HCS-SC 0.8756 0.8691 0.1190 0.1244
Tab. 3 The change detection accuracy assessment result of dataset 2

表3 数据集2变化检测结果精度评价

Precision Kappa TPR FPR
CVA 0.5725 0.5428 0.3481 0.4275
LR 0.6224 0.6024 0.2968 0.3776
ID3 0.7046 0.5809 0.4260 0.2954
kNN 0.6923 0.5841 0.4108 0.3077
Ada-LR 0.7611 0.7050 0.2711 0.2389
Ada-DS 0.8044 0.6794 0.3505 0.1956
HCS 0.9013 0.8320 0.1889 0.0987
HCS-SC 0.9197 0.8383 0.1942 0.0803
Fig. 8 The change detection results and the reference image of dataset 1

图8 数据集1检测结果及标准影像

Fig. 9 The change detection results and the reference image of dataset 2

图9 数据集2检测结果及标准参考影像

变化检测结果表明:CVA针对两组数据的检测效果较差,检测结果中存在大量错检像元,数据集1主要集中于影像北侧,数据集2分散于影像各处; 3种监督分类算法针对2个数据集的分类结果均明显优于CVA,但仍存在不同的程度的漏检和误检现象;而通过Adaboost策略集成后的决策树桩和Logistic回归分类器检测效果更佳,4个类检测指标全部优于单分类器针对同一数据集的检测结果。从检测图8(e)可看出,Ada-LR的结果中存在许多“椒盐现象”的误检像元,但地理实体内部较为完整,而图8(f)即Ada-DS的检测结果中误检现象受到较好的抑制,但是对于中上部分和东北角侧人造裸地变化的检测不完整,因此Ada-LR的漏检率(0.1534)低于Ada-DS(0.2431),而后者的误检率(0.2624)低于前者(0.2910),类似地,数据集2图9(e)(Ada-LR)的检测结果比图9(f)(Ada-DS)更为完整(漏检率分别为0.2711和0.3505),但前者比后者产生出更多的误检碎斑(误检率分别为0.2389和0.1956),这说明通过Adaboost策略集成后的Logistic回归和决策树桩仍然表现出一定程度的性能互补性,因此不管是否经过空间约束处理,本文提出的2种方法的 4个检测指标结果均优于Adaboost的同质单分类器集成。数据集2中虽然本文方法对于影像中光谱特征较强的区域(屋顶颜色更替、阴影遮挡等)出现部分错检,但对于特征较弱的区域的检测效果较好(如影像西北角、北侧、东侧),不管是裸地到建筑的变化还是裸地到大型开阔人造区域的变化均能检测出较完整的边缘信息和内部信息,并且对于“椒盐噪声”的抑制效果较好,误检率(0.0987和0.0803)均低于比较方法中的最低值(0.1956),本文方法总体效果最佳。

4 结论


