Orginal Article

Comparison and Analysis of Remotely Sensed Time Series of Reconstruction Models at Various Intervals

  • ZHOU Huihui , 1, 2 ,
  • WANG Nan 1 ,
  • HUANG Yao 3 ,
  • WANG Jinnian 3 ,
  • ZhANG Lifu , 1, *
  • 1. Key Laboratory of Remote Sensing Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100101, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
  • 3. China RS, Beijing, 100101
*Corresponding author: ZHANG Lifu, E-mail:

Received date: 2015-12-22

  Request revised date: 2016-04-25

  Online published: 2016-10-25


Remotely sensed time series are being widely used in land surface information detection. However, influenced by the sensors and external conditions, different levels of noises exist in the remotely sensed time series. Although reconstruction models can reduce the noises in times series effectively, different reconstruction models provide different levels of accuracy when they are used at various intervals. This study took the city of Chaoyang in Liaoning Province as a case. We utilized the time series of Normalized Difference Vegetation Index (NDVI) at intervals of 1-day, 4-day, 8-day, 16-day and 30-day, respectively, to carry out experiments of simulation and phenology observation. We also assessed the reconstruction results of the SG filter model, the DL fitting model and the HANTS model based on their capabilities of keeping waveform of time series and their accuracy of phenological date extraction. In addition, we also analyzed sensitivity of these three models to various intervals. The results showed that the SG filter model performed better at larger intervals, the DL fitting model gave better reconstruction accuracy at smaller intervals and the Hants model gave better accuracy when it is used at larger intervals. Moreover, the reasons of the different performance of the three reconstruction models were analyzed from the theories of these models. On this basis, we gave the suggestions on the choice of reconstruction models of time series at different intervals.

Cite this article

ZHOU Huihui , WANG Nan , HUANG Yao , WANG Jinnian , ZhANG Lifu . Comparison and Analysis of Remotely Sensed Time Series of Reconstruction Models at Various Intervals[J]. Journal of Geo-information Science, 2016 , 18(10) : 1410 -1417 . DOI: 10.3724/SP.J.1047.2016.01410

1 引言

东北地区是中国主要粮食生产基地,选择合适的模型对该地区进行农业监测尤为重要。玉米是东北地区的主要作物类型之一,而辽宁省朝阳市是玉米的主要产地。本文以辽宁省朝阳市为例,从3类遥感时间序列重构模型中各选取一种模型——SG滤波、DL拟合和HANTS谐波分析,通过玉米像元的模拟数据实验和真实物候分析,比较这3种方法对1、4、8、16和30 d时间间隔的作物MODIS NDVI时间序列的应用效果。根据实验结果,综合评价时间间隔对这3种重构模型的影响,为东北地区农业监测中时间序列重构模型的选择提供依据。

2 研究区与数据源

2.1 研究区

辽宁省朝阳市位于辽宁省西北部(图1),地理位置为40°31'45''~42°27'15''N,118°43'45''~121°22'40''E,总面积19 736 km2。地势以平原为主,属温带大陆性季风气候。该地区为东北地区主要的玉米种植地区之一,耕种作物主要为春玉米,一年一熟制。
Fig. 1 Location of the study area

图1 研究区地理位置

2.2 数据源

2.2.1 遥感数据
本文数据包括2013年全年条带号为h26v04和h27v04的MOD09GQ、MOD09A1和MOD13Q1数据产品(,覆盖整个朝阳市地区。其中,MOD09GQ和MOD09A1分别为1、8 d分辨率合成反射率产品,MOD13Q1为16 d合成植被指数NDVI产品,空间分辨率均为250 m。本文首先利用MODIS Reprojection Tool将影像投影至UTM坐标系51度带,利用ENVI、IDL工具对影像进行拼接、裁剪等操作,得到朝阳市影像数据;然后,采用最大值合成法[19],利用MOD09GQ数据合成4 d分辨率反射率数据,以及利用MOD13Q1合成30 d NDVI数据。
利用反射率数据计算归一化植被指数(Normalized Difference Vegetable Index, NDVI)并构成时间序列,NDVI计算方法如式(1)所示。
NDVI = ρ NIR - ρ red ρ NIR + ρ red (1)
式中: ρ NIR ρ red 分别为地物在近红外波段和红波段的反射率。
2.2.2 参考数据
模拟实验使用的参考数据为2013年朝阳市地理国情普查成果数据,该数据包含了耕地类型和分布情况等信息。基于该数据选取大片耕地中心的若干像元,作为典型像元进行模拟实验分析。物候实验使用的参考数据为朝阳市农业气象站点的观测数据,由中国气象数据网获取,该数据观测站点地理位置为120.45° E,41.55° N,作物类型为春玉米,记录的物候发育期名称及时间如表1所示。
Tab. 1 The phenological stages and corresponding dates recorded at observational sites

表1 地面站点记录的物候发育期及对应日期

出苗 拔节 抽穗 乳熟 成熟
日期 5月22日 6月28日 7月24日 8月26日 9月18日

3 研究方法

3.1 重构模型介绍

DL拟合利用分段的双逻辑斯蒂克函数对整个时间序列进行逼近,以获得一条光滑的曲线。由于双逻辑斯蒂克函数曲线为“S”形或倒“S”形,这与植被生长期和衰亡期的NDVI时间序列波形一致,因此,DL拟合模型能够用于模拟植被的生长变化 规律。

3.2 模拟实验

假定理想环境下,植被未发生干旱胁迫、病虫害等突变,数据获取时不受高度角、天气、云、阴影等噪声因素影响,像元NDVI值仅反映植被的理想生理状态和正常生长变化。在此环境下,模拟地物理想NDVI时间序列,模拟方法[11]为:首先,基于地理国情数据中的耕地,从影像时间序列中分别选择质量标记为“高”的时相数最多的100个典型像元;然后利用质量控制数据检测时间序列中的异常值,将其用前后时相高质量像元值平均值代替;接着,将冬季时相的所有NDVI值设定为0.1至0.2(具体值由时间序列本身决定);最后,采用大小为3的移动窗口对整条时间序列进行平滑,为得到光滑曲线,将1d和4d数据进行3次平滑,8 d数据进行二次平滑,16 d和30 d数据进行一次平滑。模拟理想时间序列完成后,利用MATLAB软件对每条时间序列随机加入10~70 db的噪声,使其具有和卫星影像相当的信噪比。
r = i = 1 N ( NDV I pi - NDV I p ¯ ) ( NDV I oi - NDV I o ¯ ) i = 1 N ( NDV I pi - NDV I p ¯ ) 2 × i = 1 N ( NDV I oi - NDV I o ¯ ) 2 (2)
RE = M i - M o i M o i (3)
式中:N为时间序列的时相总数; NDV I oi NDV I pi 分别为第i个时相理想数据和重构数据的NDVI值, NDV I o ¯ NDV I p ¯ 分别为理想数据和重构数据的NDVI平均值; M o i M i 分别为理想数据和重构数据提取的第i个指标值。对逐个像元的时间序列曲线计算相关系数和相对误差,将所有像元时间序列的相关系数和指标相对误差的平均值作为评价该模型重构效果的指标。
Tab. 2 Statistical indicators and the computing methods

表2 统计指标及其计算方法

指标名称 意义 指标名称 意义
MIN 时间序列最小值 MIN_t 时间序列最小值出现时间
MAX 时间序列最大值 MAX_t 时间序列最大值出现时间
MID 时间序列中值 MID_t 时间序列中值出现时间
MEAN 时间序列平均值

3.3 物候实验

Tab. 3 Phenological stages and the retrieval methods

表3 物候期名称及其提取方法

物候期名称 含义 计算方法
出苗 幼苗出土,NDVI开始上升 上升期曲率最大值对应时间
拔节 茎快速伸长,NDVI上升最快阶段 上升期曲线导数最大值对应时间
抽穗 发育完全,NDVI达到全年最大阶段 时间序列最大值对应时间
乳熟 NDVI开始下降 下降期曲线最大值对应时间
成熟 NDVI下降最快阶段 下降期曲率导数最大值对应时间

4 结果与分析

4.1 模拟数据实验分析

图2(a)为不同时间间隔下,利用不同模型所得重构数据与理想数据之间的相关系数;图2(b)为不同时间间隔下各模型重构数据与理想数据的统计指标平均相对误差。为方便比较,将1d和4d作为较小时间间隔,8 d和16 d作为中等时间间隔,30 d作为较大时间间隔进行分析。
Fig. 2 Correlation coefficient and relative error of statistical metrics between reconstructed and ideal data of different time interval

图2 不同时间间隔下重构数据与模拟理想数据的相关系数以及提取统计指标的相对误差

图2(a)可看出,当时间间隔为1 d时,DL拟合数据与理想数据的相关系数最高,SG滤波数据其次,HANTS数据最低;从图2(b)可看出,当时间间隔为1 d时,DL拟合数据所得统计指标相对误差最低,HANTS滤波数据相对误差最高,SG数据相对误差居于二者之间。当时间间隔为4 d时,DL拟合数据在三者中,仍能得到最高的重构精度,即相关系数最高且相对误差最低,SG滤波数据的相关系数上升至0.97以上,统计指标相对误差相比1 d间隔也有所下降,而HANTS数据的相关系数仍为最低,统计指标误差最高。图3以4 d间隔为例,展示了各模型在小时间间隔下的NDVI时间序列重构效果。图3中DL拟合结果与理想数据十分接近,甚至几乎重合,SG滤波结果能够较好地实现去噪的效果,同时还原理想数据的变化趋势,HANTS重构结果则与理想数据偏离严重。这说明当数据间隔较小时,在3种模型之中,选择DL拟合模型能够得到最好的重构效果,SG滤波在4 d间隔数据中能够得到较好的重构效果,而HANTS模型不适用于小间隔时间序列的重构。
图2显示,当时间间隔为8 d时,DL拟合数据的相关系数最高,但低于1 d间隔和4 d间隔下所得的相关系数,SG滤波数据略低于DL拟合数据,HANTS数据相关系数上升至0.9以上;从统计指标来看,DL数据的相对误差最小,SG其次,HANTS仍为三者最高。当时间间隔为16 d时,SG滤波数据的相关系数和统计指标相对误差相比8 d间隔分别有所升高和下降,且为三者中表现最佳的模型,HANTS模型重构数据也得到了比较小间隔更高的相关系数和更低的相对误差,与SG滤波和HANTS不同,DL拟合的相关系数下降,统计指标相对误差升高。图4以16 d间隔为例,展示了中等时间间隔下各模型的重构效果。图4中SG滤波模型和DL拟合模型在年中的重构结果较为相似,SG滤波结果更为接近理想数据,而DL拟合结果的年中“波峰”较宽。HANTS重构结果能够一定程度上还原理想数据的变化规律,但年中最高值以及年初和年末的变化情况与理想数据差异较大。以上结果表明,在应用于中间隔时间序列分析时,DL拟合模型的重构效果不如小间隔数据重构效果,而SG滤波模型在三者中表现最为稳定,能够得到高于小间隔数据的重构精度,HANTS模型重构精度仍低于其他模型,但高于自身用于小时间间隔数据的精度。
Fig. 3 The reconstruction results of time series at4-day-interval using the three models

图3 4 d间隔下的各模型重构结果图

Fig 4 The reconstruction results of time series at16-day-interval using the three models

图4 16 d间隔下的各模型重构结果图

图2可看出,当数据间隔达到30 d时,3种模型不再像小间隔和中间隔中表现出各异的重构效果,而是所得的相关系数和统计指标相对误差趋于接近,统计指标相对误差的差异更小,均处于0.05-0.15之间。图5展示了各模型对30 d间隔时间序列的重构效果图,从图5中可看出,3种模型均能较好还原理想数据的大致变化情况,对某些局部细节特征的重构效果各异,无法直观判断哪一种模型的重构效果较好。这说明大间隔数据不再对模型敏感,各种模型均能得到相似的重构结果,重构结果只与时间序列数据本身变化情况有关。可能的原因是30 d间隔时间序列的变化趋势十分明显,噪声量小,3种模型均能较好地还原它的变化情况。
Fig. 5 The reconstruction results of time series at30-day-interval using the three models

图5 30 d间隔下的各模型重构效果图

4.2 物候实验分析

图6(a)、(b)可看出,对于SG滤波和DL拟合2种模型来说,总体上,各项物候期误差随时间间隔的增大而增大,这说明时间间隔越小,数据越能精准捕捉到作物细微的变化信息。然而, 4 d时间间隔是一个特殊情况,即4 d间隔数据提取物候精度为5种间隔数据中最高,可能的原因是1 d间隔的时间序列包含过多噪声,这在一定程度上影响了数据重构效果,4 d合成时间序列既减少了噪声量,又不至于间隔过大导致错过某些重要转折点。因此,SG滤波数据和DL拟合数据的物候提取精度对时间间隔敏感,这种敏感性是由数据本身的信息量和噪声量决定的。5项物候指标中,拔节期、抽穗期、成熟期总体精度相对较高,这说明在任何时间间隔下,SG和DL模型对最大值和曲线变化速率特征的还原能力高于曲率特征的还原能力。
Fig. 6 The error histograms of phenological dates derived from reconstructed data by the three models

图6 3种模型重构数据所提物候期的误差直方图

图6(c)可看出,HANTS重构数据的物候提取误差较大,但8 d间隔数据的提取精度略高于其他间隔。可能的原因是:在较小时间间隔下,模拟数据实验证明了HANTS模型的重构效果不理想,重构数据存在严重失真,因而物候提取误差较大;在较大时间间隔下,虽然HANTS重构效果能够得到显著提升,但数据本身已不能精确地反映植被物候节点,因此精度较低。综上,在物候应用中,对于HANTS模型来说,8 d是一个最适用时间间隔。为评价各模型在不同时间间隔下的总体物候精度,图7展示了不同模型重构数据的5项物候期误差平均值。如图7所示,在1、4、8 d时间间隔下,DL拟合数据的物候提取精度最高,SG滤波数据其次,HANTS数据精度最低,这与模拟数据实验结果一致,说明物候提取精度与时间序列的重构效果相关。当使用8 d及以下时间间隔进行物候分析时,选择DL拟合模型对时间序列进行重构能得到理想的结果;在16 d和30 d间隔下,使用SG滤波和DL拟合模型提取的物候期精度相同,HANTS重构数据的提取精度也逐渐与另外两种模型接近,这说明模型的选择对于物候提取的重要性已不再明显,数据本身时间间隔过大成为制约物候信息提取的主要因素。此外,通过对图7进行分析可发现,4 d合成的时间序列数据能够获得最可靠的物候信息,说明时间间隔过小造成噪声量过大,或时间间隔过大造成重要信息缺失。这2种情况都不利于物候分析,且利用DL拟合模型对4 d数据进行重构能够获得最高精度。
Fig. 7 The mean of 5 phenological dates' error derivedfrom the reconstructed data of different models

图7 不同模型重构数据的5项物候期误差平均值

4.3 模型表现分析

4.3.1 SG滤波
SG滤波模型在模拟实验中相关系数和统计指标误差随时间间隔增大分别呈现升高、下降的趋势,在物候实验中,对1 d间隔数据的物候提取精度明显低于DL拟合模型,对其他间隔则表现较好。总体上,SG滤波更适用于8-30 d尺度的时间序列重构。这是因为SG滤波方法通过对曲线局部进行拟合来保留细节变化信息,而真实的细节变化信息与噪声往往难以区分,因而该模型对噪声较为敏 感[11]。时间间隔较大的时间序列数据比间隔较小的时间序列数据所含噪声更少,曲线的波动也较少,因此,SG滤波在用于较大间隔数据的重构时,能够较好地还原真实变化趋势。此外,在8-30 d间隔时间序列中,SG滤波模型的表现较为稳定,这可能是因为当数据质量满足一定条件时,SG滤波均能够通过设置合理的窗口大小,达到较好地去噪和保留细节特征的效果。
4.3.2 DL拟合
DL拟合模型的在模拟实验中的表现随时间间隔增大而逐渐变差,在物候实验中,对1-8 d间隔时间序列的应用精度优于其他模型。总体上,DL拟合更适用于1-8 d尺度的时间序列重构。这是因为DL拟合模型利用光滑的DL函数曲线来逼近时间序列,因而DL拟合模型能够最大限度地还原曲线的总体波形,具有较强的抗噪声能力。另外,DL拟合是一种针对植被物候周期的生长变化特征的拟合方法,DL函数的S形和倒S形曲线形状能够形象地反映植被物候周期的NDVI变化趋势。因此,若像元的NDVI变化能反映这种S形的物候特征,则拟合效果就越好。时间间隔较小的数据具有更大的信息量,更易捕捉植被的快速变化,有利于物候转折点的表达。而这些转折点在较大间隔的时间序列中表现为平滑缓慢的变化,因而DL拟合模型在较大间隔数据的应用中不具有优势。
4.3.3 HANTS

5 结论

本文以1、4、8、16和30 d间隔的NDVI时间序列为例,通过模拟数据实验和真实物候实验,研究了时间间隔对SG滤波、DL拟合、HANTS 3种时间序列重构模型的影响,得出以下结论:
(1)SG滤波模型对8 d及以上间隔时间序列的重构效果较好,表现最稳定。值得注意的是,该方法对噪声较为敏感,时间间隔较小的数据噪声较多,因而该方法适合用于时间间隔较大的数据滤波。
(2)DL拟合方法对于1-8 d的数据应用效果较好。这是由于DL拟合从整体上考虑时间序列的变化规律。但由于时间间隔较大的数据不能充分反映某些快速变化信息,使DL拟合不具有优势。因而,当时间间隔较小且数据符合DL函数变化规律时,选择DL拟合方法较好。

