The Breakpoints Detection Method Using Time Series of Vegetation Fractional Coverage

  • WANG Enlu ,
  • WANG Xiaoqin , * ,
  • CHEN Yunzhi
  • Key Laboratory of Spatial Data Mining & Information Sharing of Ministry of Education, National Engineering Research Centre of Geo-spatial Information Technology, Fuzhou University, Fuzhou 350116, China
*Corresponding author: WANG Xiaoqin, E-mail:

Received date: 2017-01-19

  Request revised date: 2017-06-14

  Online published: 2017-10-20


《地球信息科学学报》编辑部 所有


Detecting breakpoints plays an important role in plotting and analyzing time series of the changing characteristics such as firing, logging, diseases and insect pests in vegetation. It is a useful technique of extracting the significant information in time series data. We focused on the method of Detecting Breakpoints and Estimating Segments in Trend (DBEST). We studied the detection of vegetation breakpoints by using vegetation fractional coverage (VFC) data which is derived from MODIS NDVI remote sensing images ( 250 m) from 2000 to 2015 in Changting County of Fujian Province. In order to determine if the results of breakpoints detection are reasonable, the primary experiment is to test the applicability of DBEST method by using the VFC data of various changing types in time series. We select several samples of time series data which covered the key water and soil erosion conservation area. The vegetation changes more frequently in this area for conducting the break-points detection experiments. We make an accuracy evaluation of changing time and changing types by using the temporal trajectories and Landsat remote sensing images of every point. We find that DBEST is suitable for VFC time series data of Changting, by using the default first and second level-shift-thresholds (θ1 = 0.1, θ2 = 0.2) which indicated that DBEST could define the changing level of VFC, but the duration-thresholdφ should be adjusted according to the study area and the type of time series data (we setφ=3). Those parameters have weak influences on the accuracy of breakpoints positions, but have more effects on the changing types of breakpoints. On the whole, the excessive intervention is not necessary for detecting vegetation in DBEST. However, through a lot of experiments we believe that the threshold of the changing magnitude can be modified by our own need to gain a satisfying results. Finally, we set β = 0.2 to fit our own research targets. The precision of the changing time is 92%, greater than the changing types (80%), indicating that DBEST method works well in extracting the important changing information for VFC time series. Meanwhile, the experimental results are broadly consistent with the varying conditions of the local vegetation.

WANG Enlu , WANG Xiaoqin , CHEN Yunzhi . The Breakpoints Detection Method Using Time Series of Vegetation Fractional Coverage[J]. Journal of Geo-information Science, 2017 , 19(10) : 1355 -1363 . DOI: 10.3724/SP.J.1047.2017.01355

1 引言

时间序列断点检测通常被认为是一种时间序列分割和分段趋势估计的过程,其意义在于可以更细致地对数据进行研究,如时序数据的简化与存储以及分段线性表示等[1-2]。通过遥感技术获取的植被指数(Vegetation Index, VI)时间序列数据为陆地植被覆盖变化研究提供了极大的便利,在处理和研究时间序列遥感VI数据集的过程中,时序总体趋势估计能够判断一段时间内植被的变化趋势,如最常用的普通最小二乘方法(Ordinary Least Squares, OLS)将时间序列进行一元线性拟合,用线性方程的斜率描述变化趋势[3-5]。但往往时序VI数据的变化趋势并不总是平缓地、循序渐进地上升或下降,对植被而言,当受到病虫害、火烧、砍伐或雨雪冰冻等事件影响时[6-7],其VI值会产生较大波动,而断点检测方法能够提取这些重要特征为后续的研究和分析提供帮助,因此人们一直致力于研究能够有效提取时序遥感植被数据集中变化信息的方法[8-9]
针对以上断点检测方法存在的问题,有学者提出了一些专用于处理时序遥感数据的断点检测方法,如Kenndy等[20-22]提出的LandTrendr(Landsat-based detection of Trends in Disturbance and Recovery)方法和Verbesselt等[23-24]提出的BFAST(Breaks For Additive Seasonal and Trend)方法是目前时间序列遥感数据断点检测研究中较为常见的方法。LandTrendr方法是专为Landsat数据设计的森林干扰检测算法,可以较为准确地捕捉植被的突发性变化和逐步的缓慢退化,但需要调控的参数较多;BFAST是用于分析时序遥感植被专题产品数据的断点检测算法,同样可以检测植被的突变和渐变,并能够提供断点位置的估计区间,但一般适用于密集型长时间序列植被参数数据。由此可知,这些方法受限于卫星传感器、数据类型和数据长度等方面的因素,其通用性有待完善。Jamali等[25]提出了一种不限卫星传感器类型和数据长度的、用于时间序列遥感植被产品数据断点检测和分段趋势估计(Detecting Breakpoints and Estimating Segments in Trend, DBEST)的方法,可以处理周期性和非周期性时序VI数据,使用较为简便且具有较好的通用 性。目前与DBEST方法相关的应用较少,本文以福建省长汀县为例开展DBEST断点检测方法 研究。

2 实验区概况及数据

2.1 实验区概况


2.2 研究数据

研究选用2000-2015年空间分辨率为250 m、时间分辨率为16 d的MODIS NDVI产品,经过S-G滤波(Savitzky-Golay)后采取像元二分法进行植被覆盖度(VFC)的估算[26],获得值域在0到1之间的植被覆盖度时序数据,其计算如式(1)所示。
VFC = NDVI - NDV I min NDV I max - NDV I min (1)
式中: V I max 代表完全被植被覆盖的像元值; V I min 代表完全没有植被覆盖的像元值;VFC为所求植被覆盖度。计算完成后再进行年际时间序列影像最大值合成(Maximum Value Composite, MVC)处理,可以较好地避免噪声和植被生长季相等因素产生的干扰,从而准确地反映地表植被覆盖变化的情况[27-28]
Fig. 1 Location map of Changting County, Fujian Province

图1 福建省长汀县示意图

3 研究方法

3.1 断点检测方法

Fig. 2 Flowchart of DBEST

图2 DBEST模型技术流程

3.1.1 趋势估计
趋势估计过程的核心思想是首先根据第一、第二水平变化阈值和持续时长等参数(表1)估计时间序列VI数据的水平变化点(level-shift-point),所得水平变化点代表时间序列中最明显的变化特征,是估计子序列趋势的重要参考依据;然后,利用基于Loess的周期-趋势分解(Seasonal-Trend decomposition procedure based on Loess, STL)方法将原始时间序列分解为周期项、趋势项和余项,并用趋势项参与趋势分割计算。需要注意的是,如果原始数据是非周期性时间序列,则不需要STL分解过程,可直接进行水平变化点的提取和趋势分割。
Tab. 1 Thresholds used in DBEST

表1 DBEST参数

阈值 含义
第一水平变化阈值 序列中水平变化点和下一点间最小的差值绝对值
持续时长 相邻水平变化点之间的最小时间步长
第二水平变化阈值 水平变化点前后子序列均值最小的差值绝对值
距离阈值 相邻波峰、波谷之间的连线和相距最远数据点间的最小垂直距离(注:DBEST可估计的默认值)
断点数目 最主要的或最感兴趣的断点数目
变化级别 子序列的最大简化程度或认为发生变化的最小级别
压缩率 对原数据序列进行最大化压缩的比率
显著性水平 用于检验变化的显著性
3.1.2 趋势分割
f ( i ) = 1 , sign ΔV I ( i - 1 , i ) = - sign Δ V I ( i , i + 1 ) 0 , 其他 (2)
其中, ΔV I i - 1 , i ) = V I ( i ) - V I ( i - 1 3 ΔV I i , i + 1 ) = V I ( i + 1 ) - V I ( i ) 4
g ( i ) = 1 , sign ΔV I ( i - 1 , i ) = - s ign ΔV I ( i , i + 1 ) 1 , f ( i ) = 0 d ( i ) > ε 0 , f ( i ) = 0 d ( i ) < ε (5)
(3)使用h函数获取局部趋势变化(Trend Local Change,TLC)
h i = 0 , g ( i ) = 0 V I ( z ) - V I ( i ) , g ( i ) = 1 (6)
(4)根据贝叶斯信息准则(Bayesian Information Criterion, BIC)推测断点数量

3.2 断点检测实验方案设计

3.2.1 植被变化类型归类
Tab. 2 Main changing types of vegetation in Changting County, Fujian Province

表2 福建省长汀县植被变化类型

植被变化类型 突变类型 渐变类型 混合类型
举例 森林火烧、砍伐或人工种植等 自然恢复或
3.2.2 样点的选取
3.2.3 断点检测分析与评估方式
DBEST断点检测结果的分析和评估可由2部分内容组成:① 算法试验阶段,首先利用选取的样点开展断点检测实验,以时序轨迹可视化视图、长汀县水土流失重点治理区域矢量图(包含16年来的治理时间和治理措施)和Landsat影像等进行检测结果的精度评估和分析;② 在处理单个时间序列数据的基础上,逐像元获取断点的空间分布特征,同样结合辅助数据分析所得结果的准确性和植被变化的原因。

4 结果与分析

4.1 断点检测实验

DBEST算法有2种输出模式,即Generalisation和Change Detection。二者的区别在于,Generalisation模式可以按用户指定的压缩率或断点数量进行时间序列分割,并对不同分割条件下的子序列进行拟合,得到一种时序简化结果;Change Detection模式是将序列中波动较大的断点全部输出,以及关于每个断点的详细信息,如起始时刻、持续时长、终止时刻、变化类型、显著性等。但2种输出模式使用的核心算法基本一致,用户可以根据不同的需要选择合适的输出模式。本文将其输出表达方式进行改进,结合了Generalisation和Change Detection模式对检测结果进行表示和分析。
DBEST原文中利用以月为时间间隔的VI测试数据进行初始实验时,将第一水平变化阈值θ1设为0.1,第二水平变化阈值θ2设为0.2,变化持续时长 φ为24(即两年),变化级别阈值β设为0.1,收到了较好的断点检测效果,可以运用在气候干旱、植被稀少的区域(如伊拉克),对植被的任何微小变化都较为敏感。但本文的实验区长汀县植被覆盖率很高,且发现VFC在0-0.2之间的变化在原始影像上的反映不够明显,如果仍以β=0.1作为TLC的筛选条件,则会提取一些变化幅度处于0.1-0.2之间的、非感兴趣的变化信息,不利于有效检测植被发生重大变化的事件。因此,合理地使用DBEST模型开展植被断点检测,需综合考虑时序植被参数数据自身的特点和感兴趣的变化级别等,来适当地调整模型参数。
图3分为2部分,图3(a)是某单点时序数据的可视化表示结果,包括时序轨迹、断点位置、断点类型和变化幅度等信息;图3(b)-(d)是对应空间位置上的TM影像,通过观察比空间分辨率为250 m的MODIS影像更清晰的TM原始影像,有助于校验断点检测结果的准确性。此外,由于MODIS影像在长汀县范围内的地形表征不明显,因此本文不考虑MODIS VFC数据在250 m空间尺度下带来的地形效应。
Fig. 3 Examples and verification of breakpoint detection

图3 断点检测结果示例与验证

4.2 结果与分析

Tab. 3 Accuracy of breakpoints detection

表3 断点检测精度评估

变化时间(起、止和持续时长) 变化类型
合理 46 40
一处不合理 3 10
两处及以上不合理 1 0
精度/% 92 80
表3可知,DBEST检测变化时间(断点位置)的准确性要略好于变化类型,分析原因主要有如下2点:① 第一、第二水平变化阈值和持续时长等参数的初始化和植被变化幅度之间的对应关系会存在差别,如森林火烧事件造成植被覆盖度的突然降低应属于突变类型,但相同的变化类型在影像不同区域上反映出的VFC数值下降幅度和后续植被恢复速率可能存在差别,这种差别会对检测结果造成直接的影响;② 由于DBEST算法能够很好地捕捉时间序列曲线的波峰、波谷点和转折点,这种特性对于检测发生重要变化的时间点具有较大优势,但同时由于局部的变化级别由TLC决定,如果时间序列存在频繁的随机波动则会增加断点位置误检的可能性。

4.3 实验区植被变化时空表达与分析

Fig. 4 Spatial-temporal visualization of the vegetation in Changting County, Fujian Province

图4 福建省长汀县植被变化时空表达

图4(a)表示包含突变、渐变特征(单一、混合并存)、无明显变化和非植被区域的空间分布; 图4(b)表示图4(a)中存在变化的时间序列中最大的变化幅度,按设定的第二水平变化阈值(0.2)对断点的TLC值进行划分得到4个变化级别,其中TLC值处在0~0.2和-0.2~0之间的像元被归到无明显变化的类别中;图4(c)表示图4(b)中对应像元变化开始的时间;图4(d)表示图4(c)中对应像元变化持续的时长;无明显变化和非植被区域作为掩膜在图4(a)-(d)的空间范围保持一致。
图4以时间序列VFC数据中变化幅度最大的断点属性为基础,提供了包括断点类型、变化幅度和变化时间等信息的时空一体化表达和分析方式,能够直观地反映一些显著的植被变化特征,如 图4(a)中长汀县西北至东南方向的红色轨迹表示其植被覆盖度最主要的变化存在突然下降的情况,再观察图4(b)-(d)可看到下降幅度超过了0.4,且变化开始时间处于2004-2005年,持续时长为1-2年,对比查看2004-2007年的Landsat影像可知植被覆盖度下降原因应是2004-2005年开山修路等事件所致。

5 结论与讨论

本研究以福建省长汀县2000-2015年植被覆盖度数据作为实验数据,并结合长汀县2000-2010年水土流失治理矢量数据和时序Landsat影像为验证数据,开展了DBEST断点检测方法研究。主要结论如下:① DBEST算法对于长汀县年际时间序列VFC数据具有较好的适用性,变化时间和变化类型的检测精度分别达到了92%和80%,总体上效果较好;② DBEST参数设置无需过多人为干预,调节θ1、θ2和φ等参数会决定断点的变化类型(突变或渐变),但不会影响断点位置;③ 变化级别阈值β应依据感兴趣的变化幅度进行调整,本文将植被覆盖度的β值设为0.2能够得到更为合理的检测结果;④ 为降低误检机率、获取良好的实验结果,不建议使用波动过于频繁(例如无去噪处理)的年际时间序列植被参数数据。

The authors have declared that no competing interests exist.

