Daily Estimate of Global 36 km Grid Soil Moisture

  JIA Yanchang
  XIE Mowen
  JIANG Hongtao
  School of civil and environmental engineering, University of Science and Technology, Beijing 100083, China
  School of Resource and Environmental Science, Wuhan University, Wuhan 430072, China
*Corresponding author: XIE Mowen

Received date: 2016-10-24

  Request revised date: 2017-02-22

  Online published: 2017-06-20


Soil moisture is one of the core variables in land surface ecosystem and energy cycle. For the strong penetration of the cloud, rain and atmosphere, microwave remote sensing has advantages of the high precision in soil moisture retrieval. Currently, there are many passive microwave sensors or satellites used for surface soil (<5 cm) moisture observations, such as NASA's AMSR-E (The Advanced Microwave Scanning Radiometer-Earth Observing System) and SMAP (the Soil Moisture Passive and Active) and the European Space Agency SMOS (The Soil Moisture and Ocean Salinity). Although the use of microwave sensor can get higher precision of soil moisture products. The errors of SMAP 36 km soil moisture products can be less than 0.04 m3/m3. The 2~3 days revisited time restricts the applications that need the soil moisture products with higher temporal resolution (1 days). Therefore, it has been drawn more and more attention to get the accurate soil moisture with higher temporal resolution for the global weather prediction. Although the SM retrieval from MODIS data has higher error than retrieval from passive microwave data, the temporal resolution of MODIS data (1 day) is higher than the passive microwave data. For the different advantages of MODIS and passive microwave data, the combination of the two data for soil moisture retrieval may get the SM products with the MODIS temporal resolution and the similar accuracy or similar spatial variation of passive microwave data. In this study, we attempt to combine SMAP 36 km soil moisture product and MODIS optical/thermal infrared data to estimate the global 36 km soil moisture. This improve the temporal resolution of SMAP soil moisture from the 2~3 days to 1 day. By using the generalized regression neural network (GRNN) method, we simulated the relationship of SMAP soil moisture with MODIS global surface temperature and the surface reflectance products. Then we estimated the global 36 km soil moisture using the GRNN simulated relationship. In order to prevent overfitting of GRNN, all sample data according to the ratio of 0.8:0.2 is divided into training dataset and validation dataset. With the increase of the spread factor, the performance of GRNN prediction of the validation dataset shows a decreasing trend after the first increase, and GRNN obtained the maximal correlation coefficient (r) and root mean square error (rmse) with 0.02 of the diffusion factor. Finally, the well trained GRNN is used to estimate the global 36 km soil moisture. The results show that the accuracy of the GRNN for soil moisture estimate has a high correlation with SMAP (r=0.7528), but it retains a high error (RMSE=0.0914 m3/m3). For the cloud contamination of MODIS data, there has a part of loss of GRNN 36 km soil moisture estimate. Nevertheless, the GRNN estimated soil moisture can be very good to maintain the overall spatial variation of SMAP soil moisture, and enhance the temporary resolution of soil moisture from 2~3 days to one day. Besides, the relationship between SMAP and MODIS data is also studied in this paper, which can provide a significant reference for SMAP 36 km soil moisture downscaling by the machine learning.

Key words: SMAP; Soil moisture; Estimate; GRNN; MODIS

JIA Yanchang , XIE Mowen , JIANG Hongtao . Daily Estimate of Global 36 km Grid Soil Moisture[J]. Journal of Geo-information Science, 2017 , 19(6) : 854 -860 . DOI: 10.3724/SP.J.1047.2017.00854

1 引言

土壤水分直接控制地表的水量、能量平衡,对气候、农业、旱情监测等实际需求具有极为重要的意义[1-2]。微波遥感在高精度土壤水分反演中具有全天时、全天候、大范围监测能力,以及对云、雨、大气的穿透能力强[3-4]。目前,已有很多被动微波传感器或卫星被用来进行表层土壤水分(<5 cm)的观测,如美国宇航局的AMSR-E[5](The Advanced Microwave Scanning Radiometer-Earth Observing System)和SMAP[6](the Soil Moisture Passive and Active)以及欧洲空间局的SMOS[7](The Soil Moisture and Ocean Salinity)等。虽然利用微波传感器能够得到较高精度的土壤水分产品,如SMAP 36 km的土壤水分产品的误差小于0.04 m3/m3[8],但是其2-3 d 的重访期制约了其更高时间分辨率(1 d)的应用。光学遥感地表反射率数据会随着土壤水分的增加而增加,但是影响地表反射率的因素多,单纯的利用地表反射率进行土壤水分的估算往往得不到理想的结果。由于地表温度在一定程度上能够表征土壤水分的分布,所以利用光学和热红外遥感协同反演土壤水分受到诸多学者的青睐[1,9]。例如,利用 MODIS NDVI和LST进行土壤水分的反演,因为二者数据构成的三角特征空间能够很好地指示地表的干湿状况[10-12]。由于MODIS数据不能穿透地表植被直达土壤表层,致使MODIS反演的土壤水分在精度上低于被动微波反演的结果,但是其较高时间和空间分辨率特征,却是被动微波土壤水分产品无法比拟的。
基于此思路,本文利用广义回归神经网络(GRNN)的方法,结合MODIS全球地表温度和地表反射率产品和SMAP L3 36 km降轨土壤水分产品,拟合SMAP 36 km土壤水分与MODIS数据之间的关系,然后利用MODIS全球数据进行全球36 km土壤水分的估算。本文尝试将SMAP设计时的全球大部分区域2-3 d的重访周期延伸至1 d的重访周期,提升SMAP 36 km 土壤水分产品的时间分辨率,这样大面积的洪水预警,大坝(如三峡大坝)周围墒情、滑坡、泥石流等监测具有重要的现实意义。但是,本文只是探讨这种可能性,所以仅用一个时刻的MODIS全球数据进行展示。此外,由于本研究利用广义回归神经网络拟合SMAP 36 km土壤水分与MODIS数据之间的关系,这对于SMAP 36 km土壤水分的降尺 度[18]、提升SMAP土壤水分空间分辨率至关重要。因此,本研究对利用机器学习的方法进行SMAP 36 km土壤水分降尺度的研究具有参考价值。

2 数据与方法

本文使用SMAP 36 km土壤水分产品及MODIS全球数据(表1),利用广义回归神经网络尝试进行全球36 km土壤水分估算,提升其时间分辨率。
Tab. 1 The SMAP soil moisture and MODIS data used in this study

表1 研究所需的遥感数据产品

数据类型 数据名称 空间分辨率 时间分辨率 产品
MODIS MOD11C1 0.05°×0.05° 每天 地表温度
MOD13C1 16 d 反射率
SMAP SMAP L3 36 km 2-3 d 土壤水分

2.1 SMAP土壤水分产品

SMAP是由NASA设计的全球第一个主被动微波(L波段)相结合的地表土壤水分(约5 cm)监测卫星,于2015年1月31日于戈达德航天飞行中心发射升空。SMAP的主要目的是为了理解区域的水、能量及碳循环的相互过程,估计全球地表的水热通量,量化北半球的净碳通量,提升气象与气候的预报能力及发展改进洪水预报和干旱监测的能力[8]。2015年7月7日,其主动雷达传感损坏,现今SMAP只能向公众发布36 km的被动微波土壤水分产品。由于降轨(上午6:00)比升轨(下午6:00)更有利于土壤水分的反演,因此NASA只发布了SMAP降轨土壤水分数据集。该产品采用单通道的V极化微波算法(SCA-V)反演得到,反演的误差在全球尺度小于0.04 m3/m3。由于其半轨数据并不能覆盖全球(图1),本文结合使用MODIS 全球数据进行36 km土壤水分的估算,提高SMAP 36 km土壤水分产品的时间分辨率。本文选用2015年5月7日的SMAP L3 36 km土壤水分数据进行具体的流程及结果展示(图1)。
Fig. 1 SMAP L3 36 km soil moisture on May 7, 2015( m3/m3)

图1 2015年5月7日的SMAP L3 36 km土壤水分(m3/m3

2.2 MODIS全球地表温度和地表反射率产品

本文选用的MODIS合成产品是全球0.05 ℃地表温度(MOD11C1)和地表反射率(MOD13C1)数据,结合使用对应日期的SMAP 36 km土壤水分产品进行36 km土壤水分的全球估算。由于二者数据存在一定的差异,首先将MODIS合成产品进行空间裁剪及重采样至36 km,将其完全匹配SMAP 36 km土壤水分的空间范围(85°S~85°N, -180°W~ 180°E )及空间分辨率。因此,本文所说的全球范围是SMAP所覆盖的空间范围,这是由于非SMAP覆盖的空间范围均为冰雪覆盖,无土壤水分反演之可能。MOD13C1是16 d合成产品,所以为了配合逐日MOD11C1合成产品的使用,地表反射率在16 d里假定是恒值。根据MOD11C1和MOD13C1,本文选取其中的地表温度及蓝光、红光、中红外和近红外波段反射率数据进行全球36 km土壤水分估算的广义回归神经网络的训练(图2)。
Fig. 2 MODIS land surface temperature and red band reflectance on May 7, 2015

图2 2015年5月7日的MODIS 地表温度及红光波段反射率

2.3 广义回归神经网络

广义回归神经网络(GRNN)是Specht于1991年提出的径向基神经网络(RBF)的一个变化形式[19]。该网络建立在非参数核回归基础上,以样本为后验条件,依据概率最大原则计算网络输出。由于其具有良好的函数逼近性能,且没有随机权重对网络产生的震荡影响,因此其网络训练更加方便,并广泛应用于各个学科和工程领域中。GRNN由4层结构组成,分别是输入层、模式层、求和层及输出层 (图3)。
Fig. 3 The network structure of GRNN

图 3 广义回归网络结构


2.4 网络的优化

本文的目的是将SMAP 36 km的土壤水分产品和MODIS地表温度和地表反射率数据结合,来估算全球36 km土壤水分,提升SMAP 36 km土壤水分的时间分辨率。GRNN的输入变量是MODIS 地表温度及蓝光、红光、中红外和近红外波段反射率数据,相应的SMAP 36 km土壤水分作为输出变量。为了防止网络的过拟合现象,将所有的样本数据按0.8:0.2的比例分为训练数据集和验证数据集,利用相关系数及均方根误差来表征GRNN的训练情况,当验证数据集的相关系数和均方根误差分别达到最大和最小时所需的扩散因子,确定为最优的GRNN的扩散因子。随着扩散因子的增加,GRNN验证集的预测性能呈现出先增加后减少的趋势,当扩散因子为0.02时,GRNN获得最大的相关系数和最低的均方差误差(图4)。
Fig. 4 Correlation coefficient (r) and root mean square error (rmse) of GRNN validation dataset with different spread factors.

图 4 不同扩散因子下的GRNN验证集的相关系数(r)及均方根误差(rmse)

3 结果分析

3.1 GRNN 36 km土壤水分的评估

在最优的扩散因子下,GRNN估算的土壤水分与SMAP 36 km土壤水分进行比较,以评估GRNN估算土壤水分的精度。由于相应遥感产品的匮乏,所以仅用相应的SMAP 36 km土壤水分进行精度的评价(表2)。评价结果显示,GRNN估算土壤水分的精度与SMAP保持了高的相关性(r = 0.7528),但同时也保留了较高的误差(rmse = 0.0914 m3/m3)。由于不同土地利用类型对土壤水分的估算有较大的影响,表3展示了不同IGBP (国际地圈生物圈计划全球植被分类方案) 土地利用类型下的GRNN 36 km土壤水分的估算误差。从表3中可知,在森林区GRNN估算的土壤水分的误差明显高于非森林区。其中,占比例最多的裸地或低植被覆盖地,由于高的相关性(0.7623)和最低的均方根误差(0.0312 m3/m3),GRNN能够很好的估算其土壤水分。
Tab. 2 The overall evaluation of GRNN estimated 36 km soil moisture against SMAP 36 km soil moisture

表2 GRNN 36 km土壤水分的总体评价

训练精度 验证精度 总体精度
r 0.7658** 0.7020** 0.7528**
rmse/ (m3/m3) 0.0890 0.1005 0.0914
样本量 18 715 4678 23 393

注:**表示通过了p-value < 0.01的显著性检验

Tab. 3 The evaluation of GRNN estimated 36 km soil moisture by IGBP land use types

表3 IGBP 土地利用类型GRNN 36 km土壤水分的评估

IGBP类型 编码 r rmse/(m3/m3) 样本量
常绿针叶林 2 0.4362** 0.1323 594
常绿阔叶林 3 0.3723** 0.1585 1128
落叶针叶林 4 -0.1001 0.0639 213
落叶阔叶林 5 0.4411** 0.1024 145
混交林 6 0.3816** 0.1250 2913
开放灌丛 8 0.6111** 0.0457 2854
多树的草原 9 0.4015** 0.1135 1232
稀树的草原 10 0.6570** 0.0801 1730
草原 11 07263** 0.0739 2703
作物 13 0.6475** 0.0848 2962
作物和自然植被的镶嵌体 15 0.5377** 0.1118 1187
裸地或低植被覆盖地 17 0.7623** 0.0312 5332

注:**表示通过了p-value < 0.01 的显著性检验

为了进一步探讨误差的来源及其空间分布,绘制了SMAP 36 km和GRNN估算数据的散点图(图5)和差值空间分布图(图6)。从图5可知,GRNN估算的土壤水分值的范围由SMAP 36 km土壤水分的0-1变成现在的0-0.5,取值范围的压缩会导致估算值与SMAP误差的增大。较小的取值范围显示了GRNN低估了原有的SMAP 36 km土壤水分。尽管这样,GRNN估算的土壤水分与SMAP 36 km土壤水分的拟合线接近于1:1,表明GRNN估算的土壤水分能够保持SMAP土壤水分的整体空间的变化。图6印证了这一结果,二者数据差值的空间变化基本上保持了相同的变化趋势,且二者数据的差值在绝大部分区域分布在-0.1 ~ 0.1 m3/m3
Fig. 5 The scatterplot between GRNN estimated soil moisture and SMAP 36 km soil moisture

图5 GRNN估算土壤水分与SMAP 36 km土壤水分的散点图

Fig. 6 Spatial distribution of the difference (GRNN-SMAP) between GRNN estimated and SMAP 36 km soil moisture (m3/m3)

图6 GRNN估算土壤水分与SMAP 36 km土壤水分的差值(GRNN-SMAP)空间分布图(m3/m3

3.2 全球36 km土壤水分的估算

根据SMAP 36 km土壤水分的评估结果显示,虽然GRNN估算的土壤水分有较高的误差,但是其与SMAP 36 km土壤水分高的相关性,以及其本身的高的时间分辨率(1 d),不仅为GRNN 估算的全球土壤水分的精度提供了一定的保证,还展示了其应用于全球36 km土壤水分估算的巨大潜力。除了部分MODIS数据受云污染的区域不能进行有效的GRNN 36 km土壤水分的估算,全球其他区域的土壤水分都得到了很好的估算。GRNN估算的全球土壤水分整体上保持了土壤水分的真实空间分布(图7)。
Fig. 7 GRNN estimated global 36 km soil moisture (m3/m3)

图7 GRNN 估算的36 km全球土壤水分(m3/m3

4 结论与讨论

为了提升SMAP 36 km土壤水分的时间分辨率,本文尝试将SMAP 与MODIS全球地表温度产品和地表反射率产品进行结合,利用广义回归神经网络进行全球36 km土壤水分的估算。利用机器学习的方式,建立了MODIS数据与SMAP土壤水分数据之间强的非线性关系,估算出了具有较好精度的全球36 km的土壤水分(r=0.7528 和rmse=0.0914 m3/m3)。机器学习缺乏对土壤水分与光学/热红外遥感数据之间物理机制的描述,然而到目前为止这种远比土壤水分与被动微波数据之间关系更为复杂的物理机制,仍没有一个精确的刻画。为了避免复杂物理关系的定量刻画,同时在很大情况下这种物理关系是未知的,因此利用简单的机器学习方法或者说更高深的深度学习的方法对这种关系的模拟是很必要的。土壤水分与光学/热红外遥感数据之间的关系不仅对于土壤水分的反演至关重要,而且对于为了获得高空间分辨率土壤水分产品而进行的被动微波土壤水分产品降尺度的研究亦是重要的、不可或缺的关键因素。本研究尝试将SMAP土壤水分的时间分辨率由原来的2-3 d提升到现在的1 d,这样具有高时间分辨率特征的全球土壤水分数据,对全球天气的预报预测具有重大的推动作用。本研究进行全球36 km土壤水分的估算仅用到了SMAP与MODIS之间的关系,由于MODIS地表温度是地表植被与土壤的混合温度,这对土壤水分的估算带来很大的影响,因此,今后尝试用全球土壤表层温度同化数据数据替换MODIS地表温度数据,来提高全球36 km土壤水分估算的精度。

