Daily Estimation of Soil Moisture over Beijing-Tianjin-Hebei Region based on General Regression Neural Network Model

  • DENG Yawen , 1 ,
  • LING Ziyan , 2, * ,
  • SUN Na 1 ,
  • LV Jinxia 1, 3
Expand
  • 1. Beijing Key Laboratory for Remote Sensing of Environment and Digital Cities, Faculty of Geographical Science, Beijing Normal University, Beijing 100875, China
  • 2. Beibu Gulf Key Laboratory of Environment Change and Resources Use, School of Geography and Planning, Nanning Normal University, Nanning 530001, China
  • 3. State Key Laboratory of Remote Sensing Science, Faculty of Geographical Science, Beijing Normal University, Beijing 100875, China
*LING Ziyan, E-mail:

Received date: 2020-03-27

  Request revised date: 2020-06-21

  Online published: 2021-06-25

Supported by

National Natural Science Foundation of China(41571077)

National Key R&D Program of China(2016YFC0503002)

Open subject of Beijing Key Laboratory for Remote Sensing of Environment and Digital Cities(12800-310430001)

Copyright

Copyright reserved © 2021

Abstract

Surface Soil Moisture (SM) plays an important role in the land-atmosphere interaction and hydrological cycle. Low spatiotemporal resolution (i.e., 25~40 km and 2~3 days) microwave-based SM products such as the Soil Moisture and Ocean Salinity (SMOS) and the Advanced Microwave Scanning Radiometer for EOS (AMSR-E) limit their application in regional scale studies. The Soil Moisture Active Passive (SMAP) and Copernicus Sentinel 1A/B microwave active-passive surface soil moisture product (L2_SM_SP) has a higher spatial resolution (3 km), but its temporal resolution is coarse from 4 to 20 days due to the narrow overlapped swath width. In this study, we developed a machine learning algorithm using the General Regression Neural Network (GRNN) to improve the spatiotemporal resolution of the L2_SM_SP product based on multi-source remote sensing data. Land Surface Temperature (LST), Multi-band Reflectance, Normalized Difference Vegetation Index (NDVI), Enhanced Vegetation Index (EVI), Elevation, Slope, Longitude (Lon), and Latitude (Lat) were selected as input variables to simulate the L2_SM_SP soil moisture in GRNN model. Results show that: (1) GRNN-estimated soil moisture and the original estimates of L2_SM_SP were strongly correlated (r=0.7392, RMSE=0.0757 cm3/cm3); (2) the correlation between GRNN estimates and original L2_SM_SP product at typical dates of different seasons varied a lot. The correlation in spring was the lowest (rSpr=0.6152, RMSESpr=0.0653 cm³/cm³). While the correlation in winter was the strongest (rWin=0.8214, and RMSEWin=0.0367 cm3/cm3). The correlation in summer and autumn was close to each other (rSum=0.6957, rAut=0.7053, RMSESum=0.0754 cm³/cm³, and RMSEAut=0.0694 cm³/cm³); and (3) in 2016, the soil moisture in summer and autumn of the study area was significantly higher than that that in other seasons. In terms of spatial distribution, the soil moisture in the Bashang plateau area was low, while the soil moisture along coastal areas was obviously higher. In this study, we successfully improved the spatiotemporal resolution of L2_SM_SP product over Beijing-Tianjin-Hebei region from 3 km, and 4~20 days to 1 km, and 1 day. Its spatial coverage was also extended. The improved soil moisture product is of great significance for future eco-hydrological assessment, climate prediction, and drought monitoring in Beijing-Tianjin-Hebei region.

Cite this article

DENG Yawen , LING Ziyan , SUN Na , LV Jinxia . Daily Estimation of Soil Moisture over Beijing-Tianjin-Hebei Region based on General Regression Neural Network Model[J]. Journal of Geo-information Science, 2021 , 23(4) : 749 -761 . DOI: 10.12082/dqxxkx.2021.200149

1 引言

土壤湿度(通常为体积含水量)是水文循环和陆地-气候相互作用过程的一个关键组成部分[1,2,3],可以通过控制渗透、地表径流及地表能量通量等途径来影响水文和气候过程[4,5,6]。因此,土壤湿度的准确测量在产流和泥沙输送计算、洪水及水文预报、干旱监测和数值天气预报等系列应用领域中具有重要意义[8,9,10]
由于土壤湿度并非常规水文和气象观测要素,因此较为缺乏有效的直接观测信息。近年来,随着遥感技术的迅速发展,获取全球范围内较高精度的土壤湿度信息成为可能[11]。其中微波遥感对土壤湿度异常敏感,且具有能穿透气、云、雨进行全天时、全天候的监测能力优势,因此被认为是测量土壤湿度空间分布的有效手段[12,13,14]。目前多套微波遥感卫星观测平台被用于获取全球土壤表层湿度信息,例如:美国航空航天局的SMAP[15]和AMSR-E[16]、日本的AMSR2[17]、欧洲空间局的SMOS[18]以及中国的风云系列卫星(FY3B和FY3C)[19]等。这些微波土壤湿度产品的共同缺点是空间分辨率(25 km左右)和时间分辨率(2~3 d或更长)较低。尽管2015年以来哨兵一号(Sentinel-1)卫星的C波段雷达传感器能够提供1 km的土壤湿度数据,但其时间分辨率为6~12 d。这些缺陷使得微波土壤湿度产品无法满足区域尺度上水文、生态等领域的应用需求[20](1~10 km空间分辨率,逐日)。
针对以上问题,为获取高时空分辨率的土壤湿度信息,近年来各种基于多种地表参量和多源遥感观测的土壤湿度产品降尺度方法被相继提出。这些方法主要可分为4类:光学/热红外与微波遥感数据融合、主被动微波数据融合、数据同化方法和地球物理参数方法[21,22]。这些方法本质上几乎都是通过建立起低分辨率微波土壤湿度数据与高分辨率光学/热红外/合成孔径雷达(SAR)数据之间的关系模型,以实现土壤湿度产品的时空降尺度。
然而,由于陆地表面系统各要素相互作用过程的复杂机制与非线性性质,微波遥感获取的土壤湿度与光学/热红外等相关地表参量数据之间的物理数学关系非常复杂,不确定性大,通过建立传统的物理模型来表征这2种类型遥感数据之间的复杂物理关系具有较大技术难度,且参数繁多,对数据的要求也更为严格,因此利用相对较为简便的机器学习方式来刻画这种关系是有必要的。其中,神经网络模型因具有较强的非线性问题学习能力和整合多源数据的灵活性,被广泛用于解决土壤湿度反演问题,例如,贾艳昌[23]等利用广义回归神经网络(GRNN)使用MODIS地表温度、反射率等数据进行全球36 km地表土壤湿度估算;Cui[20]等综合MODIS地表温度、反照率和植被指数等多源遥感数据通过GRNN模型将青藏高原地区FY-3B土壤湿度产品的时空分辨率提升至0.05°及逐日;Said[24]等使用雷达数据利用人工神经网络(ANN)模型反演裸土和植被区域的土壤湿度。众多以往研究证明了使用神经网络模型反演土壤水分的可行性与有效性,其中GRNN模型在解决土壤湿度反演问题的表现尤为突出[25]
SMAP-Sentinel主被动微波结合土壤湿度数据集(SPL2SMAP_S, SMAP L2)是一种结合哨兵一号(Sentinel-1A/Sentinel-1B)合成孔径雷达(SAR)主动微波数据与SMAP微波辐射计被动微波数据生产出的土壤湿度产品,该产品对比其他类型微波土壤湿度产品(SMOS, AMSR-E等)的优势在于它具有更为精细的空间分辨率(3 km)。已有研究对该土壤湿度产品进行精度验证,验证结果显示其精度保持在0.05~0.06 m³/m³左右[26],且经过文献调研发现对该产品使用较少,因此本研究选取SMAP L2土壤湿度产品来进行时空降尺度。同时,本研究参考已有研究[20,23]对土壤湿度估算模型的输入因子进行了完善,主要选取MODIS地表温度、不同波段反射率、植被指数遥感数据作为估算SMAP L2土壤湿度的输入变量,且MODIS产品的时间分辨率可达逐日,空间分辨率为500 m~1 km,时空尺度较为适合京津冀地区。
目前对区域尺度上的高时空分辨率(1 km,逐日)土壤湿度估算的研究相对较少,而京津冀地区一直以来是我国的重要农业区,随着全球气候变化加剧,该地区旱情问题一直备受关注,而土壤湿度能较好地表征地表干旱状态[27]
基于以上思路,本研究结合SMAP L2微波土壤湿度产品的高精度与MODIS光学/热红外遥感的高时空分辨率优势,尝试利用广义回归神经网络在产品级别上融合SMAP L2土壤湿度与MODIS相关指标,以实现京津冀地区高时空分辨率(1 km、逐日)土壤湿度的估计,同时扩展研究区土壤湿度产品的空间覆盖范围,这对京津冀地区大面积的土壤墒情、旱情预警、气候预测具有重要的现实意义。

2 数据和方法

2.1 数据来源与预处理

2.1.1 土壤湿度数据
土壤湿度主被动探测卫星(Soil Moisture Active Passive,SMAP)是美国航空航天局(NASA)于2015年1月31日发射升空的全球第一个结合主被动微波遥感传感器的地表土壤湿度监测卫星平台,SMAP的目标是获取全球范围内的高时空分辨率地表(约5 cm深)土壤湿度和景观冻融状态,它运载L波段高分辨率合成孔径雷达(主动微波,1.26 GHz)和微波辐射计(被动微波,1.41 GHz)[15]。但SMAP雷达于2015年7月7日被损坏[28],这导致SMAP高分辨率土壤湿度产品的生产受阻。研究发现欧空局的哨兵一号(Sentinel-1A/Sentinel-1B) 的SAR数据最适合与SMAP微波辐射计数据相结合来生产土壤湿度产品[26],而本研究使用的SMAP-Sentinel主被动微波结合土壤湿度数据集(SPL2SMAP_S,下文简称SMAP L2)可以从NASA的NSIDC网站免费获取(https://nsidc.org/data/SPL2SMAP_S/versions/2),该产品由SMAP L波段的亮度温度结合哨兵一号雷达C波段的后向散射系数得到,该产品土壤湿度值的分布范围为0~0.6 cm³/cm³,表征地表0~5 cm的 土壤湿度分布,空间分辨率为3 km,呈不规则条 带状,在京津冀区域的空间分布存在大量缺失 (图1),且时间上不连续(4~20 d),该数据产品的精度经过实地验证达到0.06 m3/m3,具有较高的精度与可靠性。
图1 2016年不同日期京津冀地区SMAP L2土壤湿度分布

注:底图为MODIS真彩色合成照片。

Fig. 1 Soil moisture distribution of SMAP L2 in Beijing-Tianjin-Hebei Region on different dates in 2016

京津冀地区属于温带半湿润、半干旱大陆性季风气候区,一年内四季分明[29],年内降雨量变化显著,导致该地区不同季节的土壤湿度差异较大,为探究全年的土壤湿度动态变化与不同季节GRNN模型估算土壤湿度的效果差异,研究选取不同季节的样本来构建GRNN模型。同时本研究使用的MODIS地表温度数据的缺失现象较为严重,据统计,2016年全年仅有61 d的MOD11A1地表温度遥感影像覆盖京津冀区域的面积比例达80%以上,覆盖面积比例90%以上的则有40 d,可知影响估算土壤湿度空间完整性的主要影响因素为MODIS地表温度数据。为凸显本研究的实际意义,本文选取MODIS地表温度覆盖较为完整的日期利用GRNN模型估算京津冀地区的土壤湿度来进行结果展示,试图探索这种方法的可行性。综合考虑上述因素,本文分别选取2016年各季节典型代表日期处(春季为4月7日、夏季为7月5日、秋季为9月28日、冬季为2月6日)的SMAP L2土壤湿度数据(图1)作为GRNN模型估算土壤湿度的验证数据。
本研究通过Python编程利用NASA发布的HEG(HDF-EOS to GeoTIFF Conversion Tool)工具对SMAP HDF5格式的数据先进行批量拼接,再进行投影转换至Albers等面积投影,最后使用京津冀的行政边界进行影像裁剪,预处理结果如图1所示。
2.1.2 遥感数据
研究使用的MODIS产品包括植被指数及地表反射率产品(MOD13A2)、地表温度产品(MOD11A1),其中MOD11A1包含白天和夜晚的地表温度数据。MOD13A2包括归一化植被指数(NDVI)、增强型植被指数(EVI)、红光、蓝光、近红外和中红外波段的反射率数据。DEM(高程)数据来自中国科学院资源环境科学数据中心(http://www.resdc.cn),使用ArcGIS软件基于DEM数据计算得到京津冀的坡度和坡向数据,经纬度数据由MODIS产品中影像自带的经纬度坐标信息生成。将以上遥感数据产品进行拼接、投影转换、京津冀行政边界裁剪等预处理使其分辨率分别统一为3 km和1 km,一方面和SMAP L2 3 km土壤湿度数据进行匹配来训练GRNN模型,另一方面作为GRNN估算土壤湿度的高分辨率数据源,部分MODIS遥感影像和高程数据如图2所示。
图2 京津冀地区高程与MODIS产品空间分布展示(2016年4月18日)

Fig. 2 DEM、MODIS red band reflectance、NDVI and land surface temperature distribution in study area (April 18, 2016)

为保持土壤湿度反演过程的时间一致性,将MODIS地表温度(LST)和SMAP影像获取时间间隔保持在12 h以内,由于植被指数在一定时间内变化不显著,故使用16 d合成的产品以保证数据的完整性[30],并假设DEM、坡度、经纬度数据保持恒定,研究使用的遥感数据如表1所示。
表1 研究使用的遥感数据列表

Tab. 1 Remote sensing data used in this study

数据类型 数据名称 时间分辨率/d 空间分辨率 产品类型 时间节点 数据位置
MODIS MOD13A2 16 1 km 植被指数与反射率 2016-04-07 h26v04, h26v05
MOD11A1 1 1 km 地表温度 2016-07-05 h27v04, h27v05
SMAP SPL2SMAP_S 4~20 3 km 土壤湿度 2016-09-28 116°E—118°E, 37°N—44°N
2016-02-06
高程 DEM - 30 m 高程 - -

2.2 研究方法

2.2.1 广义回归神经网络
广义回归神经网络(GRNN)由美国学者Specht于1991年提出[31],它是基于非参数核回归统计方法的一种径向基函数神经网络(RBF),也是一种典型的机器学习模型,经常被用于解决函数拟合和回归类问题。它对比于BPNN(后向传播神经网络模型)具有很多优势,除拥有很强的非线性映射能力和迅速的学习速度之外,GRNN由于是一种在隐藏层中使用高斯激活函数的单向传播神经网络,因此不需要进行后向传播或迭代过程,只有唯一一个需要调节的自由参数(被称为扩散因子),适于样本量较少的非线性问题研究,且能较好地处理输入样本的噪声,具有高度的容错性和稳健性。
GRNN模型的结构中包括4层:输入层、隐藏层、求和层和输出层,本研究中针对土壤湿度估算构建的广义回归神经网络模型结构如图3所示,其中x1~x12表示输入变量,分别代表MODIS地表温度、红、蓝、近红外、中红外波段反射率、归一化植被指数(NDVI)、增强型植被指数(EVI)、高程(DEM)、坡度、坡向、经度和纬度坐标这12个变量,输入层中的神经元的个数和变量个数相同,也为12个。本研究中输入变量的选取在已有相关研究[20,23]的基础之上进行了整合与补充,主要选取MODIS地表温度、不同波段反射率、植被指数遥感数据作为估算SMAP L2土壤湿度的输入变量。根据输入层要素的数据来源与性质特征,大体可以把这12个变量划分为4种类型:地表温度、反射率(红光、蓝光、近、中红外波段)、植被指数(NDVI, EVI)地形要素(DEM、坡度和坡向)和位置(经纬度)要素,首先将所有输入变量数据进行最大最小值归一化预处理,再输入模型中。
图3 本研究使用的广义回归神经网络结构

注: x1x12分别代表最左侧对应的输入变量, y1代表GRNN估算得到的土壤湿度。

Fig. 3 Schematic of the GRNN used for SM estimation in this study

在隐藏层中训练样本的数量决定神经元个数,样本数据经过隐藏层核函数的计算后被传递给求和层,求和层的2个神经元分别计算隐藏层各神经元输出值的加权和和输出和,最终计算得出土壤湿度估算值,图3y1表示目标SMAP土壤湿度变量。
假设xy是模型输入变量和输出变量,对应表达式如下:
x = x 1 , x 2 , x 12 T
y = y 1 T
其中目标变量y能通过GRNN模型预测得到,y由式(3)计算得到[32]
y ˆ x = i = 1 n y i exp - C i σ i = 1 n exp - C i σ
C i = j = 1 p x j - x j i
式中:n σ 表示训练样本的数量和扩散因子的值,扩散因子是影响GRNN模型的精确度的唯一一个自由参数,被用于确定高斯函数的核宽度[33]。研究使用MATLAB软件内嵌的神经网络工具箱中的GRNN模型包来搭建用于估算高时空分辨率土壤湿度的GRNN模型。
研究使用十折交叉验证[34]的方法来测试模型的预测能力,该方法经常被用于评价基于有限样本数据的机器学习模型。首先将所有训练样本数据随机打乱顺序并平均分为10组,接着分别将每一组作为验证数据集,其他9组作为训练数据集来拟合模型,最终将这10次拟合结果进行平均来表示GRNN模型的预测效果。经过计算发现春季时期样本点数目为72528个,夏季为90 375个,秋季为71 807个,冬季则为22 309个。为保证样本点分布的空间均匀性与完整性,研究采取均匀随机数的方式在春、夏、秋季时期影像中分别选取40 000个样本点,由于样本数据总量限制,在冬季只选取20 000个样本点,首先将训练样本点按照4:1的比例划分为训练样本集和验证样本集,再使用训练样本集中的数据对GRNN进行训练,使用验证样本集中的数据对模型的精度进行验证。
2.2.2 GRNN的参数优化
研究使用均方误差(Mean Squared Error,MSE)指标来表征GRNN模型的拟合效果好坏,该指标经常被用于评价机器学习模型的预测精度,MSE的值越小,说明预测模型拥有更好的精度。MSE的计算公式如式(5),其中 y p 在本研究中代表GRNN模型预测的土壤湿度值,而 y i 表示对应像元的原始SMAP L2土壤湿度值。
MSE = 1 n i = 1 n y p - y i 2
构建不同季节时间处的GRNN模型过程中,本研究使用一种“穷举”方法的来寻找扩散因子 σ 的最优值,首先对扩散因子 σ 进行初始化,使其从0.001开始以0.01为步长增长至1(扩散因子通常小于1),再将训练样本被随机划分为10份并每次去除其中一份,然后对剩下的训练样本数据遍历使用之前设置的 σ 来构建GRNN模型,最后将剩下的数据作为GRNN模型输入变量进行估计与预测,计算估算值与实际值的MSE,循环选出当MSE值最低时对应的扩散因子 σ 值作为最优值,同时保留该次的训练样本数据以构建GRNN模型。本研究中4个时间点处的MSE随扩散因子 σ 的变化情况与取值如图4所示,扩散因子从0增加到1的过程中,前期MSE下降速度很快,基本在0~0.1之间达到最低值,将MSE处于谷值时对应的扩散因子值作为GRNN模型的最优扩散因子值,从图中可以较为明显地看出不同季节典型时期的GRNN模型扩散因子取值位于0.04~0.07之间,对扩散因子进行优化取值后,将此时的GRNN模型进行保留,为之后土壤湿度估算提供优良的模型。
图4 不同扩散因子下的GRNN的相关系数(r)及均方根误差(rmse)

Fig. 4 Correlation coefficient(r) and root mean square error(rmse) of GRNN with different spread factors

2.3.3 精度评价指标
本研究选取一些典型的统计评价指标来对GRNN土壤湿度估算模型的预测效果进行精度 评价,这些指标包括:均方根误差(RMSE),偏差(bias),无偏均方根误差(ubRMSE,将RMSE中的偏差去除)和皮尔森相关系数(r)。这些指标的计算公式如下:
RMSE = 1 N i = 1 N S M g - S M o 2
bias = 1 N i = 1 N S M g - S M o
ubRMSE = RMS E 2 - bia s 2
r = n S M g S M o - S M g S M o n S M g 2 - S M g 2 n S M o 2 - S M o 2
式中: S M g 表示GRNN模型估算的土壤湿度; S M o 则为原始的SMAP L2土壤湿度数据; N 为验证样本的数量。

3 结果及分析

3.1 GRNN模型输入变量分析

基于GRNN模型输入层要素的数据来源与性质,大体可以把这12个变量划分为5种类型:地表温度、反射率(红光、蓝光、近、中红外波段)、植被指数(NDVI、EVI)、地形要素(DEM、坡度和坡向)和位置(经纬度)要素。这些地表要素和土壤湿度的关系基于不同的原理,对于地表温度,由于土壤热惯量是造成土壤表层温度发生变化的内在因素,且土壤热惯量通常随着土壤含水量的增大而增大,因此地表温度和土壤湿度具有较强的相关性;对于反射率,由于土壤含水量的变化会引起土壤颗粒物理性质和反射率也发生变化,通常随着土壤中含水量的减少,其反射率也会相应增大;而植被的生长状态能够间接反映出土壤中的水分含量,通常来说,植被密度越大,生长态势越好的地方的土壤湿度值越高;对于地形因素,主要考虑海拔(DEM)通过对气温和植被的影响来间接影响土壤水分含量,坡度则能够反映地形状态,即平原、高原、山地等,地形会影响地表径流与该地所受的太阳光照、植被生长环境等,从而对土壤水分产生影响,而选择坡向因素则是考虑阴坡和阳坡长期接受的太阳光照与土壤水分蒸发强度的差异;对于位置因素主要是考虑地理学中地物对象的空间自相关性和地理学第一定律。
对12个输入层变量进行相关性分析,通过计算所有变量两两间的斯皮尔曼相关系数,得到相关系数矩阵并以聚类热力图的方式进行可视化,如图5所示,土壤湿度其他地表要素间的相关性较弱,红光、蓝光和中红外波段的地表反射率两两之间呈显著正相关,但它们与NDVI和EVI的负相关性较高,而这2个植被指数和近红外波段呈现强烈的正相关性,这一特征和植被的光谱曲线在近红外波段的反射率快速上升的性质相吻合。地形因素中DEM和坡度纬度的正向相关性较好,这主要是因为海拔越高,地形一般越陡峭,此外京津冀地区的地形呈现西北高东南低的特征,这对DEM和纬度、坡度间相关性影响较大,LST地表温度和近红外波段的相关性较好,同时NDVI与EVI这2个植被指数间呈显著正相关,但是EVI在植被覆盖度高的区域更加敏感,反映的信息更为丰富。综上所述,这些输入变量中部分变量之间存在较为显著的线性相关关系,这对GRNN模型的反演可能会造成信息量的冗余,降低模型的训练效率,因此研究使用主成分分析(PCA)方法对GRNN模型的输入变量进行降维研究,尽可能多地保留原始信息的基础上用少数新变量(主成分)来解释原始变量,以减少GRNN的计算量,提升GRNN模型的训练效率,然而降维后的各个主成分不具有明确的物理含义。
图5 GRNN模型输入层变量相关系数矩阵聚类热力图

Fig. 5 The correlation coefficient (r) distribution between different input variables of GRNN model

对12个输入变量进行主成分分析后得到12个主成分的特征根和方差贡献率(表2),并按照方差贡献率大小进行排序,发现前7个主成分变量累计贡献率可以达到96.6%,足以代表原始输入变量的绝大部分信息,因此分别计算训练样本这7个主成分变量的的得分来作为GRNN模型的输入层变量构建模型。
表2 对模型输入变量进行主成分分析得到的特征根与方差贡献率

Tab. 2 Characteristic roots and variance contribution rates obtained by principal component analysis of model input variables

主成分 特征值 方差贡献率 累计贡献率
1 5.8544 0.488 0.488
2 1.8477 0.154 0.642
3 1.1322 0.094 0.736
4 0.9806 0.082 0.818
5 0.7982 0.067 0.884
6 0.5754 0.048 0.932
7 0.4060 0.034 0.966
8 0.2731 0.023 0.989
9 0.0982 0.008 0.997
10 0.0257 0.002 0.999
11 0.0079 0.001 1.000
12 0.0006 0.000 1.000
研究随机均匀选取4个季节代表时间节点处共计60 000个样本点(每个季节时期处选取15 000个样本),划分为训练样本集和验证样本集,训练GRNN模型并进行精度验证,研究对模型使用PCA进行输入变量降维前后的模型训练效果进行对比分析,从表3可以看出,降维前GRNN模型估算土壤湿度的RMSE为0.0736 cm³/cm³,与SMAP土壤湿度的相关系数r为0.75左右,相关关系较强,使用PCA降维后GRNN模型的RMSE为0.0784 cm³/cm³左右,r约为0.71,可见模型的精度略有所下降(RMSE增加约0.005 cm³/cm³, r减少约0.04),降维后的模型训练时间比降维前减少大概24%。
表3 GRNN模型输入层变量降维前后的表现对比

Tab. 3 Comparison of GRNN model's performance before and after input variables'dimensionality reduction

r RMSE/(cm³/cm³) bias ubRMSE 样本量/个 训练时间/s
GRNN降维前扩散因子为0.09 训练精度 0.7566 0.0736 -0.0011 0.0736 48000
验证精度 0.7322 0.0766 -0.0005 0.0765 12000 1007.75
总体精度 0.7392 0.0757 -0.0007 0.0757 60000
GRNNPCA降维后扩散因子为0.04 训练精度 0.7032 0.0777 -0.0002 0.0777 48000
验证精度 0.7140 0.0787 0.0012 0.0787 12000 768.02
总体精度 0.7110 0.0784 0.0008 0.0784 60000

3.2 不同季节GRNN 1 km土壤湿度估算精度比较

由于京津冀地区大部分为大陆性季风气候区,一年四季间的降雨量和气候差异较大,导致土壤湿度在不同季节相差显著,因此本研究分别选取不同季节的典型时间节点的MODIS和SMAP遥感影像来进行GRNN模型构建与精度验证,由表4可知,春季时期GRNN模型估算的土壤湿度与SMAP L2土壤湿度相关系数为0.6左右,呈现较弱的相关性,但其均方根误差(RMSE)较低,约为0.06 cm³/cm³,比夏季低0.01 cm³/cm³左右。夏、秋季节时期的相关系数在0.7附近,相关性中等程度偏上,其中夏季的RMSE比秋季略高,而冬季的土壤湿度估算结果与SMAP L2原始土壤湿度值相关系数高达0.83,与其他季节差异显著,且RMSE低至0.0374 cm³/cm³,该季节的模型估算效果明显好于其他季节,分析其原因发现冬季时期的土壤湿度值偏低,且异常值较少,不确定性小,从而减少了估算误差。
表4 不同季节GRNN 1 km土壤湿度的总体评价

Tab. 4 Model training accuracy in different seasons

时间 指标 训练精度 验证精度 总体精度 时间 指标 训练精度 验证精度 总体精度
春季
(2016-04-07)
r 0.6300** 0.5886** 0.6152** 秋季
(2016-09-28)
r 0.7467** 0.6900** 0.7053**
RMSE/(cm³/cm³) 0.0636 0.0669 0.0653 RMSE/(cm³/cm³) 0.0658 0.0708 0.0694
bias 0.0009 0.0003 0.0005 bias 0.0004 0.0008 0.0007
ubRMSE 0.0636 0.0659 0.0653 ubRMSE 0.0658 0.0708 0.0694
样本量/个 32 000 8000 40 000 样本量/个 32 000 8000 40 000
夏季
(2016-07-05)
r 0.7277** 0.6843** 0.6957** 冬季
(2016-12-14)
r 0.8064** 0.8308** 0.8214**
RMSE/(cm³/cm³) 0.0715 0.0769 0.0754 RMSE/(cm³/cm³) 0.0348 0.0374 0.0367
bias 0.0018 0.0013 0.0014 bias -0.0019 -0.0016 -0.0017
ubRMSE 0.0715 0.0769 0.0754 ubRMSE 0.0348 0.0374 0.0367
样本量/个 32 000 8000 40 000 样本量/个 16 000 4000 20 000

注:**表示通过p<0.01的显著性检验。

从这4个季节验证样本点的GRNN估算土壤湿度和SMAP L2原始土壤湿度值的散点拟合图(图6)可知,夏季和秋季的土壤湿度值动态分布范围大于春冬季节,且土壤湿度值在0.4~0.6 cm³ /cm³之间的相当一部分验证样本样本点明显偏离于1:1拟合线,这反映出随着土壤湿度值的增大,GRNN模型估算土壤湿度的不确定性更大,这也能部分解释冬季的较好的拟合效果,从图中可以看出冬季的土壤湿度较为集中地分布在0~0.3 cm³ /cm³之间,而其他三季的土壤湿度分布范围相对更为分散。此外这四季的拟合线均位于1:1拟合线下方,表明GRNN模型估算值比原始值偏小。
图6 不同季节GRNN估算土壤湿度与SMAP土壤湿度散点图

Fig. 6 The scatterplot of GRNN estimated soil moisture and SMAP soil moisture for 4 seasons

3.3 京津冀区域1 km逐日土壤湿度估算

不同季节代表时期京津冀SMAP L2原始土壤湿度(第一行)和GRNN模型估算湿度(第二行)分布如图7所示,对比相同日期的影像,可以直观地看出估算的土壤湿度的空间覆盖范围完整性得到极大提高,空间分辨率也由原来的3 km变为现在的 1 km,包含的土壤湿度信息更为精细、丰富。目视对比这两行土壤湿度分布,可以看出其重叠部分的土壤湿度值比较接近。
图7 京津冀SMAP L2土壤湿度和GRNN估算土壤湿度在不同时间的分布

Fig. 7 Maps 0f SMAP L2 3km soil moisture and corresponding GRNN estimated 1 km soil moisture over Beijing-Tianjin-Hebei Region

从时间上看,夏季(2016-07-05)和秋季(2016-09-28)处的土壤湿度明显高于春季和冬季,这一现象与京津冀地区的降雨时间分布也较为吻合。此外,从空间分布上来看,西北部坝上区域的土壤湿度值相对偏低,沿海地区附近的土壤湿度值也相对较高。GRNN模型反演的土壤湿度总体上较好地反映了京津冀区域土壤湿度的空间分布,且估算得到的土壤湿度空间分辨率更精细(1 km),时间分辨率提高至1 d,蕴含的土壤湿度细节信息更丰富,能对京津冀区域土壤资源评价、生态水文研究、旱情监测及气候预测提供较好的信息支持。

4 讨论

本研究主要存在以下局限性与不足:
(1)本研究选取的遥感影像获取时间范围内研究区处于晴空状态下,因此未考虑降雨条件下的GRNN模型的土壤湿度估算表现;
(2)SMAP土壤湿度数据和MODIS地表温度数据获取的时间存在12 h以内的误差,由于土壤湿度的日变化较为显著,且与地表温度密切相关,因此会导致部分估算误差;
(3)未能充分考虑其他一些因素(如反照率等)对土壤湿度反演的影响,且选取特定日期进行反演时存在着随机误差;
(4)由于数据条件限制,未能获取对应日期的京津冀区域土壤监测站点的土壤湿度数据来进行SMAPL2土壤湿度和反演土壤湿度的精度验证。
本研究也可以从以下方面进行改进与完整:
(1)选取长时间序列的SMAP L2数据(2015年3月以后)和对应的MODIS遥感数据进行反演研究,探究年、季节、月、旬尺度的土壤湿度反演效果的差异变化,并利用这种长时间的遥感大数据训练GRNN神经网络模型,以加强其泛化性与稳健性。再者可以探究长时间范围内年、季节、月、旬尺度京津冀的土壤湿度的动态变化特征与空间分布差异,为京津冀地区的旱情检测等领域应用提供帮助;
(2)充分考虑土壤湿度的日变化特征,特别是降雨时期的土壤湿度变化情况,结合气象站点数据筛选降雨时期的样本数据来构建GRNN模型,以提升该模型在不同天气或气候条件下的适用性;
(3)选取更多与土壤湿度相关关系较为显著的因素(如多种植被指数、反照率等)来构建GRNN模型,同时考虑研究区内的地表覆被类型差异对模型进行优化,以取得更好的估算效果。

5 结论

本文采用广义回归神经网络(GRNN)的方法拟合MODIS地表温度、反射率、植被指数光学/热红外遥感等相关关联数据与SMAP L2土壤湿度之间的关系,利用京津冀局部样区数据建立起全局区域土壤湿度估算模型,将SMAPL2土壤湿度数据的时间分辨率由不连续(4~20 d)提升至1 d,空间分辨率由3 km提升至1 km,实现京津冀高时空分辨率土壤湿度遥感估算,并扩展其空间覆盖范围,研究结果如下:
(1)通过选取地表温度、反射率、植被指数、地形要素(DEM、坡度和坡向)和位置因素(经纬度)作为输入变量来构建GRNN模型实现京津冀土壤湿度估算,总体验证结果表明相关系数为0.7566,均方根误差为0.0736 cm³/cm³,精度与已有研究[23]相比较高(RMSE减少了0.0178 cm³/cm³);
(2)利用主成分分析对GRNN模型输入变量进行降维后发现模型的精度略微有所下降(RMSE增加约0.002 cm³/cm³, r减少约0.03),但训练效率提升约23.8%,较为明显;
(3)不同季节典型日期的GRNN模型估算效果相差较大,春季处的精度相比其他季节r最低(r=0.6152),秋季和夏季精度较为接近,冬季的估算效果最好,相关性很强(r=0.8214),且误差较低(RMSE=0.0367 cm³/cm³),这主要是由于冬季土壤湿度值的分布范围较其他季节更为集中。2016年京津冀夏季和秋季的土壤湿度显著高于其他季节,空间上坝上高原区域土壤湿度较低,而沿海地区的土壤湿度明显较高。
本研究结合SMAP L2微波土壤湿度产品的高精度与MODIS光学/热红外遥感的高时空分辨率优势,估算出具有较好精度的京津冀地区高时空分辨率土壤湿度,对京津冀地区大面积的土壤墒情、旱情预警、气候预测等应用具有重要的现实意义。
[1]
Koster R D, Dirmeyer P A, Guo Z, et al. Regions of strong coupling between soil moisture and precipitation[J]. Science, 2004,305(5687):1138-1140.

DOI PMID

[2]
Chen F, Crow W T, Starks P J, et al. Improving hydrologic predictions of a catchment model via assimilation of surface soil moisture[J]. Advances in Water Resources, 2011,34(4):526-536.

DOI

[3]
Li Y, Grimaldi S, Pauwels V R N, et al. Hydrologic model calibration using remotely sensed soil moisture and discharge measurements: The impact on predictions at gauged and ungauged locations[J]. Journal of Hydrology, 2018,557:897-909.

DOI

[4]
Das K, Paul P K, Dobesova Z. Present status of soil moisture estimation by microwave remote sensing[J]. Cogent Geoscience. 2015,1(1):1084669.

DOI

[5]
Gallego Elvira B, Taylor C M, Harris P P, et al. Global observational diagnosis of soil moisture control on the land surface energy balance[J]. Geophysical Research Letters, 2016,43(6):2623-2631.

DOI

[6]
丁旭, 赖欣, 范广洲, 等. 中国不同气候区土壤湿度特征及其气候响应[J]. 高原山地气象研究, 2016,36(4):28-35.

[ Ding X, Lai X, Fan G Z, et al. Soil moisture characteristics and climate response of different climatic regional in China[J]. Plateau and Mountain Meteorology Research, 2016,36(4):28-35.]

[7]
Engda T A, Kelleners T J. Soil moisture-based drought monitoring at different time scales: A case study for the U.S. Great Plains[J]. Jawra Journal of the American Water Resources Association, 2016,52(1):77-88.

DOI

[8]
Kim S, Paik K, Johnson, et al. Building a flood-warning framework for ungauged locations using low resolution, open-access remotely sensed surface soil moisture, precipitation, soil, and topographic information[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018,11(2):375-387.

DOI

[9]
韩帅, 师春香, 林泓锦, 等. CLDAS土壤湿度业务产品的干旱监测应用[J]. 冰川冻土, 2015,37(2):446-453.

DOI

[ Han S, ShiC X, LinH J, et al. The CLDAS soil moisture operation products applied to monitor soil drought[J]. Journal of Glaciology and Geocryology, 2015,37(2):446-453. ]

[10]
习阿幸, 刘志辉, 卢文君. 干旱区季节性冻土冻融状况及对融雪径流的影响[J]. 水土保持研究, 2016,23(2):333-339.

[ Xi A X, Liu Z H, Lu W J. Processes of seasonal frozen soil freezing-thawing and impact on snowmelt runoff in arid area[J]. Research of Soil and Water Conservation, 2016,23(2):333-339. ]

[11]
刘荣华, 张珂, 晁丽君, 等. 基于多源卫星观测的中国土壤湿度时空特征分析[J]. 水科学进展, 2017,28(4):479-487.

[ Liu R H, Zhang K, Chao L J, et al. Analysis of spatiotemporal characteristics of surface soil moisture across China based on multi-satellite observations[J]. Advances in Water Science, 2017,28(4):479-487. ]

[12]
孔金玲, 李菁菁, 甄珮珮, 等. 微波与光学遥感协同反演旱区地表土壤湿度研究[J]. 地球信息科学学报, 2016,18(6):857-863.

DOI

[ Kong J L, Li J J, Zhen P P, et al. Inversion of soil moisture in arid area based on microwave and optical remote sensing data[J]. Journal of Geo-information Science, 2016,18(6):857-863. ]

[13]
陈书林, 刘元波, 温作民. 卫星遥感反演土壤湿度研究综述[J]. 地球科学进展, 2012(11):1192-1203.

[ Chen S L, Liu Y B, Wen Z M. Satellite retrieval of soil moisture: An overview[J]. Advances in Earth Science, 2012,27(11):1192-1203. ]

[14]
Petropoulos G P, Ireland G, Barrett B. Surface soil moisture retrievals from remote sensing: current status, products & future trends[J]. Physics and Chemistry of the Earth, Parts A/B/C. 2015,83-84:36-56.

[15]
Entekhabi D, Njoku E G, O'neil P E, et al. The Soil Moisture Active Passive (SMAP) mission[J]. Proceedings of the IEEE, 2010,98(5):704-716.

DOI

[16]
Njoku E G, Jackson T J, Lakshmi V, et al. Soil moisture retrieval from AMSR-E[J]. IEEE Transactions on Geoscience and Remote Sensing, 2003,41(2):215-229.

DOI

[17]
Wu Q, Liu H, Lei W, et al. Evaluation of AMSR2 soil moisture products over the contiguous United States using in situ data from the International Soil Moisture Network[J]. International Journal of Applied Earth Observation & Geoinformation, 2016,45(Part B):187-199.

DOI

[18]
Kerr Y H, Waldteufel P, Richaume P, et al. The SMOS soil moisture retrieval algorithm[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012,50(5):1384-1403.

DOI

[19]
贾炳浩, 师春香, 孙帅, 等. 基于风云卫星的土壤湿度数据同化研究:第35届中国气象学会年会[ C].中国安徽合肥, 2018.

[ Jia B H, Shi C X, Sun S, et al. Study on soil moisture data assimilation based on FY satellite: The 35th annual meeting of Chinese Meteorological Society[C]. Hefei, Anhui, China, 2018. ]

[20]
Cui Y, Chen X, Xiong W, et al. A soil moisture spatial and temporal resolution improving algorithm based on multi-Source remote sensing data and GRNN model[J]. Remote Sensing, 2020,12(3):455.

DOI

[21]
Merlin O, Chehbouni A G, Kerr Y H, et al. A combined modeling and multispectral/multiresolution remote sensing approach for disaggregation of surface soil moisture: application to SMOS configuration[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005,43(9):2036-2050.

DOI

[22]
Wagner W, Dorigo W, De Jeu R, et al. Fusion of active and passive microwave observations to create an essential climate variable data record on soil moisture[J]. ISPRS Annals of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2012,7:315-321.

[23]
贾艳昌, 谢谟文, 姜红涛. 全球36 km格网土壤湿度逐日估算[J]. 地球信息科学学报, 2017,19(6):854-860.

DOI

[ Jia Y C, Xie M W, Jiang H T. Daily estimate of global 36 km grid soil moisture[J]. Journal of Geo-information Science, 2017,19(6):854-860. ]

[24]
Said S, Kothyari U C, Arora M K. ANN-based soil moisture retrieval over bare and vegetated areas using ERS-2 SAR data[J]. Journal of Hydrologic Engineering, 2008,13(6):461-475.

DOI

[25]
Yuan Q, Xu H, Li T, et al. Estimating surface soil moisture from satellite observations using a generalized regression neural network trained on sparse ground-based measurements in the continental U.S[J]. Journal of Hydrology, 2020,580:124351.

DOI

[26]
Das N N, Entekhabi D, Dunbar R S, et al. The SMAP and Copernicus Sentinel 1A/B microwave active-passive high resolution surface soil moisture product[J]. Remote Sensing of Environment, 2019,233:111380.

DOI

[27]
于占江, 杨鹏. 近50年京津冀气候变化及其对土壤湿度的影响[J]. 贵州农业科学, 2019,47(2):144-149.

[ Yu Z J, Yang P. Effect of climatic change on soil moisture in Beijing-Tianjin-Hebei region in nearly 50 years[J]. Guizhou Agricultural Sciences, 2019,47(2):144-149. ]

[28]
Chan S K, Bindlish R, E. O'neill P, et al. Assessment of the SMAP passive soil moisture product[J]. IEEE Transactionson Geoscience and Remote Sensing, 2016,54(8):4994-5007.

[29]
李鹏飞, 刘文军, 赵昕奕, 等. 京津冀区域近50年气温、降水与潜在蒸散量变化分析[J]. 干旱区资源与环境, 2015,29(3):137-143.

[ Li P F, Liu W J, Zhao X Y, et al. The changes of atmospheric temperature,precipitation and potential evapotranspiration in Beijing -Tianjin-Hebei region in recent 50 years[J]. Journal of Arid Land Resources and Environment, 2015,29(3):137-143. ]

[30]
张悦, 沈润平, 彭露露, 等. 基于重建MODIS无云数据反演京津冀地区土壤湿度[J]. 江苏农业科学, 2016,44(12):375-378.

[ Zhang Yue, Shen R P, Peng L L, et al. Soil moisture monitoring based on reconstruction of MODIS data in Beijing-Tianjin-Hebei region[J]. Jiangsu Agricultural Sciences, 2016,44(12):375-378. ]

[31]
Specht D F. A general regression neural network[J]. IEEE Transactions on Neural Networks, 1991,2(6):568-576.

DOI PMID

[32]
Ali I, Greifeneder F, Stamenkovic J, et al. Review of machine learning approaches for biomass and soil moisture retrievals from remote sensing data[J]. Remote Sensing, 2015,7(12):16398-16421.

DOI

[33]
Li W, Yang X, Li H, et al. Hybrid forecasting approach based on GRNN neural network and SVR machine for electricity demand forecasting[J]. Energies, 2017,10(1):44.

DOI

[34]
Rodriguez J D, Perez A, Lozano J A. Sensitivity analysis of k-fold cross validation in prediction error estimation[J]. IEEE Trans Pattern Anal Mach Intell, 2010,32(3):569-575.

DOI PMID

Outlines

/