Downscaling of CCI Soil Moisture in the Xiliaohe River Basin based on Random Forest

  • CAO Yu ,
  • FANG Xiuqin , * ,
  • YANG Lulu ,
  • JIANG Xinyuan ,
  • LIAO Meiyu ,
  • REN Liliang
Expand
  • College of Hydrology and Water Resources, Hohai University, Nanjing 210098, China
*FANG Xiuqin, E-mail:

Received date: 2022-12-29

  Revised date: 2023-03-21

  Online published: 2023-07-14

Supported by

National Natural Science Foundation of China(42071040)

National Natural Science Foundation of China(U2243203)

National Key Research and Devel opment Program of China(2019YFC1510601)

Abstract

Soil moisture is a key factor in the climate system and has important application in agricultural management, water resource management, and ecosystem monitoring and assessment. Although remote sensing-derived soil moisture products can provide soil moisture distribution on a large scale, they usually have coarse spatial resolution, making it difficult to meet the requirements of practical applications. Thus, downscaling of remote sensing-derived soil moisture products has become one of the hot topics recently. In this paper, the ESA CCI daily soil moisture at 0.25°resolution is used as the main data source, combined with the MODIS underlying surface data, topographic data, meteorological data, and other environmental factors at 1 km resolution. A random forest downscaling model is constructed to generate downscaled CCI daily soil moisture products at 1 km resolution in the Xiliaohe River Basin of China from 2013 to 2020. Results show that: (1) The analysis of the importance score of environmental factors shows that relative humidity and daytime surface temperature are the two most important factors influencing soil moisture, followed by topography and location factors; (2) The performance of the random forest downscaling model is verified by using the measured data of 22 stations within the study area, and the results show that the downscaled results considering multiple environmental factors (underlying surface, topography, and meteorology) are more accurate than that considering only surface elements. The RMSE of each site is below 0.048 8 m3/m3, the average correlation coefficient is 0.497 3, the absolute value of BIAS is 0.003 0~0.033 3 m3/m3, and the R2 of soil moisture after downscaling is 0.52~0.84 compared with the original CCI remote sensing soil moisture; (3) The downscaled soil moisture has similar temporal trends with the site-level measured soil moisture with less fluctuation in values. The downscaling method proposed in this study improves the spatial resolution of remote sensing-derived soil moisture data while preserving the spatial pattern of the original data set, which can meet the demand for high-resolution soil moisture data in practical applications and provide a reference for the selection of environmental factors in soil moisture downscaling studies.

Cite this article

CAO Yu , FANG Xiuqin , YANG Lulu , JIANG Xinyuan , LIAO Meiyu , REN Liliang . Downscaling of CCI Soil Moisture in the Xiliaohe River Basin based on Random Forest[J]. Journal of Geo-information Science, 2023 , 25(8) : 1669 -1681 . DOI: 10.12082/dqxxkx.2023.221013

1 引言

土壤湿度将大气过程与地表状态联系起来是衡量陆地干湿状况的重要指标[1],土壤湿度的时空动态对于农业管理、洪水和干旱预测、水资源管理和自然保护均具有重要的应用价值[2-4]。传统站点观测土壤湿度精度较高,但站点空间分布不均且数量有限,观测耗时耗资,致使不能高效获取大范围数据。卫星遥感成为获取大尺度土壤湿度信息的主要途径。欧空局(European Space Agency,ESA)对现有的主动和被动微波土壤湿度产品进行融合,最新的融合产品(CCI_SM v04.7)从1978至今有40余年的记录,是对于水文和气象研究来说非常有价值的数据。尽管ESA CCI_SM是日尺度上的多卫星融合的长时间序列数据产品,能满足高时间分辨率应用的需求,但其0.25°的空间分辨率较低,不能充分满足水文及干旱监测等研究的需求。因此,对其进行降尺度研究以获取高空间分辨率的土壤湿度数据,对于改善水文、气象等领域的科学研究和灾害监测等实践业务具有重要意义。
土壤水分降尺度研究是当前土壤水分研究的一个热点方向,国内外学者对遥感土壤湿度数据的降尺度研究开展了广泛的探索。研究的关键点在于应用适宜的降尺度方法和合理选取环境变量。
降尺度方法主要可以归纳为空间插值法、统计回归法、物理模型法、权重分解法以及数据同化法这几类[5-6]。Kim等[7]基于空间分形插值方法将土壤湿度数据从10 km降尺度至1 km;Ray等[8]构建了土壤湿度与植被指数、地表温度、地表反照率的回归模型,获取1 km空间分辨率的土壤湿度数据;Merlin[9-10]基于陆表-大气交互模型,输入气象参数、光学和热红外遥感数据估算得土壤温度,进而获取到被动微波像元内1 km空间分辨率的土壤湿度信息;Bindlish[11]利用后向散射系数对亮温进行权重分解,确定像元内土壤水分的干湿分布,进行土壤水分的反演,实现降尺度。Pellenq等[12]将低分辨率的遥感数据同化到水分模型中,计算流域尺度上的水热平衡方程,再利用降雨、地形和土壤深度信息将低分辨率的土壤水分分解到高分辨率下。在这几类方法中,统计回归法操作简单,但缺少物理基础,简单的经验性关系模型不能准确表达降尺度因子与土壤水分之间复杂的作用机制,物理模型法总体精度较高,但所需辅助数据较多且难以大范围获取,权重分解法只适用于和土壤水分线性相关的因子分解,数据同化和插值方法的计算过程复杂且适用性较差,因而无法大范围推广。相较于上述降尺度方法,采用机器学习方法构建降尺度模型是较好的选择,它可以在数据不连续的情况下学习并探求土壤水分和降尺度因子之间的非线性关系,以求在缺乏物理机理的情况下表达土壤水分与降尺度因子之间的关系机制,并为不同数据源的信息整合和海量数据处理提供了便利。相关研究显示随机森林(Random Forest,RF)在土壤水分降尺度中展现出优于其他多种机器学习方法的性能。盛佳慧和饶鹏[13]采用RF、多项式拟合及DISPATCH方法进行FY-3B微波土壤湿度数据降尺度研究,结果显示RF是3种方法中最为可靠的方法。Im等[14]比较了RF、BoRT和Cubist这3种机器学习算法,发现RF在AMSR-E被动微波土壤水分空间降尺度中优于BoRT和Cubist,验证结果显示RF算法作为机器学习降尺度方法具有显著的优越性。
在环境变量的选取中,NDVI和地表温度(Land Surface Temperature, LST)是目前土壤湿度降尺度研究中最常用的地表变量,主要原因在于地表温度和植被指数构成的特征空间可以用来解释陆表水热交换过程的差异。Carlson等[15]对土壤水分、地表温度、植被指数进行数据分析发现三者存在多元回归关系,可以用于估算土壤水分,故Piles等[16]建立LST、NDVI与SMOS土壤水分产品的统计回归关系进行降尺度。Sandholt[17]基于地表温度-植被指数特征空间,提出温度植被干旱指数(TVDI)的概念,曹永攀等[18]和辛强[19]等均利用TVDI和土壤水分之间的关系式对AMSR-E被动微波土壤水分进行降尺度,而王安琪等[20]基于特征空间定义了变温植被指数TVVI,利用土壤水分与TVVI之间的幂函数关系实现土壤水分的降尺度。除地表温度、植被指数外,也可将地表反照率加入进行多元统计回归,进一步增强降尺度因子与土壤水分之间的关系表达。Chauhan[21]将25 km的土壤水分产品与1 km分辨率的LST、NDVI、反照率数据建立统计回归实现将土壤水分空间分辨率降尺度至1 km。Sun H和Cui Y[22]的研究表明降尺度因子中添加表面净入辐射或地表反照率能够解决在能量有限的蒸发蒸腾条件下地表温度-植被指数特征空间失去效率的问题,同时还证明了经纬度和海拔等地理因素的加入能够显著改善降尺度的效果。此外,制约土壤水分空间分布的可能因素还有地形因子、气象因子等。在Zhao[23]的降尺度研究中就引入了地形数据以呈现其与土壤湿度的相互作用,Kovaevi等[24]认为降水作为自然水循环的一部分,与土壤湿度有着时空相关性,可将其用于粗分辨率土壤湿度降尺度过程。综合来看,以往大部分研究采用的环境变量较为局限,大多考虑的是植被和地表温度,少数研究考虑了地形和地表辐射等参量,鲜少有研究将气象要素作为降尺度因子考虑。因而为提高降尺度结果的精度,本研究将对土壤湿度影响较大的气象、地形和下垫面要素作为降尺度因子综合考虑。
基于以上思路,本文利用1 km分辨率的MODIS下垫面数据、地形数据、气象数据作为环境因子,构建随机森林降尺度模型,对西辽河流域2013—2020年日尺度上0.25°的CCI_SM土壤数据进行降尺度,得到1 km分辨率的土壤湿度日数据,最后利用站点实测土壤湿度对降尺度结果进行验证。

2 数据和方法

2.1 数据来源与处理

2.1.1 土壤湿度数据

欧空局CCI土壤湿度产品由欧洲航天局气候变化倡议项目(http://www.esasoilmosture-cci.org/)发布,基于主/被动微波传感器生产,具有长时间序列和全球尺度覆盖的优点[25],对于水文和气象研究来说是非常有价值的数据。CCI_SM产品空间分辨率为0.25°,时间分辨率为1 d,土壤湿度单位为m3/m3。西辽河流域属于中温带半干旱季风气候区,大陆性气候显著,主要气候特征为干旱少雨,近年来随社会经济的不断发展,流域内取用水量不断增强,致使径流量日益减少。因此,获得高分辨率土壤湿度数据对于深入分析西辽河流域的土壤湿度分布状况,研究该流域水资源的有效利用具有重要科学价值。为了与实测数据相匹配,本文选取西辽河流域2013—2020年的CCI_SM数据开展降尺度研究,每日一景,共2 922景数据。
本文采用的站点实测土壤数据来自国家气象科学数据中心(http://data.cma.cn/),实测土壤湿度以体积含水量/(m3/m3)为单位,在6个深度(10、20、30、40、50和60 cm)进行测定,时间分辨率为1 d,本文使用研究期内土壤顶层(0~10 cm)土壤湿度验证降尺度结果的准确性。研究区内较为均匀地分布有22个实测站点(图1)。
图1 西辽河流域地形、水系、实测站点分布

Fig. 1 Distribution map of topography, water system and measured stations in West Liaohe Basin

采用研究区内实测土壤湿度对土壤湿度产品进行验证,验证结果显示均方根误差为0.072 m3/m3,相关系数为0.542,表明CCI_SM数据产品在研究区内具有良好的适用性,可用其进行降尺度研究。

2.1.2 环境因子数据

研究使用的MODIS产品包括地表温度产品(MOD11A1)、地表反射率产品(MOD09GA)及地表覆盖类型产品(MCD12Q1),其中MOD11A1包含白天和夜晚的地表温度数据。利用MOD09GA产品计算得到研究所需的1 km日尺度的NDVI和反照度。气象因子数据包括日最高温/℃、日均气温/℃、日最低温/℃、日降水量/(mm/day)、相对湿度/%、风速/(m/s)、实际水汽压/hPa和日照时长/h,来自国家地球系统科学数据中心(http://www.geodata.cn/),时间分辨率为1 d,空间分辨率为0.083°,重采样为研究所需的0.25°和1 km分辨率。DEM数据来源于地理空间数据云(http://www.gscloud.cn/search),选用的是SRTM DEM 90 m分辨率的高程数据,在ArcGIS中重采样为研究所需的0.25°和1 km分辨率,并利用重采样后的DEM数据分别生成在这2种空间分辨率下的坡度Slope和坡向Aspect。为保持土壤湿度降尺度过程的时间一致性,环境因子数据选取的时间范围与土壤湿度产品的时间范围一致(2013—2020年)。研究使用的所有数据如表1所示。
表1 研究数据的基本信息

Tab. 1 Information of the data

数据类型 数据名称 时间分辨率 空间分辨率 时段/年 来源
土壤湿度产品 ESA CCI 1 d 0.25° 2013—2020 http://www.esasoilmosture-cci.org/
地表参数 MOD11A1 1 d 1 km 2013—2020 https://ladsweb.modaps.eosdis.nasa.gov/search/
MOD09GA 1 d 500 m
MCD12Q1 1 y 500 m
气象因子 日最高温MaxT 1 d 0.083° 2013—2020 http://www.geodata.cn/
日均气温MeanT 1 d 0.083°
日最低温MinT 1 d 0.083°
日降水量PRE 1 d 0.083°
相对湿度RH 1 d 0.083°
风速WND 1 d 0.083°
实际水汽压VAP 1 d 0.083°
日照时长SSH 1 d 0.083°
高程 DEM 90 m 2013—2020 http://www.gscloud.cn/search

2.2 研究方法

2.2.1 解释变量的选取

本研究的降尺度模型中,解释变量综合考虑了对土壤湿度影响较大的气象、地形和下垫面因素,数据时间与选取的ESA CCI_SM产品相同(2013—2020年)。变量选取依据其物理意义,土壤湿度受局地气象状况的影响,NDVI反映地表植被覆盖情况,而植被通过影响太阳入射辐射、土壤蒸散发进而影响了土壤湿度,地表温度LST越高土壤水分蒸散发效应越显著,地表越干旱,地形则通过影响LST而影响土壤湿度。
气象要素包括日最高温/℃、日均气温/℃、日最低温/℃、日降水量/(mm/day)、相对湿度/%、风速/(m/s)、实际水汽压/hPa和日照时长/h。地形要素采用的是高程、坡度和坡向。
下垫面地表变量采用是地表温度LST、植被指数NDVI、反照度ABL和土地覆盖类型LC。每日 1 km的白天地表温度LST_D、夜晚地表温度LST_N由MODIS陆地温度产品MOD11A1提供。每日1 km NDVI数据和反照度数据没有直接可用的产品,但是可以利用1 d合成的空间分辨率为500 m的MOD09GA反射率产品通过波段计算得到,NDVI和反照度的计算公式为[26-27]
N D V I = ( b 2 - b 1 ) / ( b 2 + b 1 )
    A B L = 0.160 b 1 + 0.291 b 2 + 0.243 b 3 +                               0.116 b 4 + 0.112 b 5 + 0.081 b 7 - 0.0015
式中:b1、b2、b3、b4、b5、b7分别代表MOD09GA的第1、2、3、4、5、7波段反射率,由此得到500 m空间分辨率的NDVI和反照率日数据,在ArcGIS中重采样为构建模型所需的0.25°和1 km空间分辨率。受Merlin[28]借助陆表-大气交互模型将地表蒸散效率与土壤湿度建立降尺度关系式的启发,本研究也考虑了与土壤湿度关系密切的蒸散发的影响,受限于目前并没有日尺度高空间分辨率的蒸散数据,故将与蒸散发有关的下垫面与气象环境因子[29]输入模型,借助变量间非线性关系体现蒸散发,即利用LST、NDVI和土地覆盖类型LC反映下垫面要素,降水、净辐射、气温、相对湿度、风速反映气象状况。由于气象数据集缺乏净辐射,故参考FAO公式中用于计算净辐射的环境变量,选取了日照时数、平均气温、实际水汽压[30]。另外,用于体现地理位置的经纬度也作为解释变量输入。
综上所述,本文选择了5个地表参数(白天地表温度LST_D、夜晚地表温度LST_N、归一化植被指数NDVI、反照度ABL和地表覆盖类型LC)、8个气象因子(日最高温MaxT、日均气温MeanT、日最低温MinT、日降水量PRE、相对湿度RH、风速WND、实际水汽压VAP和日照时长SSH)、3个地形因子(DEM、坡度Slope和坡向Aspect)以及2个位置因子(经度Lon,纬度Lat),共计18个环境因素作为输入变量参与随机森林的模型计算。
因前人研究大多使用地表参数作为降尺度因子,故本文另外将地表参数这类环境因素单独作为随机森林模型输入,将其结果与输入多环境要素的结果进行对比,以分析加入地表参数之外的多环境要素是否有利于提高降尺度性能。

2.2.2 随机森林模型

RF是由Breiman[31]提出的一种用途广泛的机器学习算法,其本质是一种装袋集成算法(Bagging),是对决策树算法的改进。随机森林由众多没有关联的决策树构成,每次输入新的样本后就让森林中的每一棵决策树进行判断分类[32],每个决策树会得出一个自己的分类结果,将决策树中最多分类的那个结果作为随机森林最终的分类结果。由于RF结合了森林里所有树的预测结果,因此对数据的噪声和异常值有着较好的容忍性,能有效避免过拟合,在充分反应数据多样性的同时提供精确度较高分类预测结果[33]
本文采用Matlab中的TreeBagger方法构建RF降尺度模型,选择TreeBagger中的Regression Tree功能生长单个树。随机森林降尺度模型是由数据驱动,训练样本为低空间分辨率数据,土壤湿度作为因变量,将选取的环境因素作为解释变量,解释变量集与土壤湿度训练出的某种映射关系构成了随机森林降尺度模型[34]
降尺度模型构建的具体步骤为:① 将解释变量的影像重采样为0.25°和1 km,在0.25°空间分辨率下将CCI土壤湿度数据和解释变量作为降尺度模型的训练数据进行训练;② 将CCI土壤湿度与模型得到的土壤湿度作差得到0.25°的残差,并将此残差采用双线性插值重采样为1 km;③ 将高分辨率(1 km)的解释变量数据输入到训练好的降尺度模型,得到高空间分辨率1 km的未经残差校正的土壤湿度值;④ 将1 km的预测值加上重采样后的残差项,得到最后的经残差校正的1 km的土壤湿度数据。技术路线图2所示。
图2 基于随机森林的土壤湿度降尺度技术路线

Fig. 2 Technical route of soil moisture downscaling based on random forest

模型构建过程的关键参数就是随机森林决策树的树林ntree和叶子数nleaf的确立。通过将原始样本的70%作为训练集,30%作为测试集[35],以训练集作为输入数据训练,发现当ntree=200,nleaf=5时,随机森林模型随着决策树数目的增加平均绝对误差下降至较平稳的状态,并通过五折交叉验证得到多要素输入和地表参数要素输入两种情形下的模型均方根误差RMSE分别为0.023 7、0.035 2,相关性分别为0.844 4、0.653 1,表明2种情形下模型预测效果均较好。

2.2.3 验证与评估指标

本文采用国家气象局提供的土壤湿度站点实测数据对降尺度结果进行验证,为减小实测数据与降尺度后土壤湿度数据之间存在的整体性偏差,采用累积概率分布函数(Cumulative Distribution Function, CDF)匹配法,将站点实测土壤湿度SM_O匹配到降尺度后的土壤湿度数据SM_RF,使匹配后的SM_O_bc与SM_RF具有相同的取值范围和累积概率分布状况[36]。CDF匹配是一种增强的非线性技术,调整后的土壤湿度表达式如下[37]
C D F S M _ R F ( x ' ) = C D F S M _ O ( x )
式中:CDFSM_OCDFSM_RF分别表示站点土壤湿度SM_O和降尺度后土壤湿度SM_RF的累积分布函数;x表示调整之前的站点实测土壤湿度; x '表示调整值后的站点实测土壤湿度。以国家气象局站点实测的土壤湿度数据验证降尺度后的效果。本文采用RMSECORRBIAS这3个评估指标定量评估实测数据与降尺度后数据的误差,计算公式如下:
R M S E = i = 1 n S i - R i 2 n
C O R R = i = 1 n S i - S ¯ R i - R ¯ i = 1 n S i - S ¯ 2 i = 1 n R i - R ¯ 2
B I A S = i = 1 n S i - R i n
式中:n代表样本个数;Si代表CDF偏差校正后的站点实测的数据; S ¯代表CDF偏差校正后的站点实测数据的均值;Ri代表降尺度后的数据; R ¯为降尺度后数据均值。

3 结果与分析

3.1 环境因子重要性分析

以输入变量对模型的相对重要性得分为依据,评价环境因子对土壤湿度的影响。相对重要性得分由%IncMSE和IncNodePurity来体现,%IncMSE通过对每一个预测变量随机赋值,若该预测变量重要程度大其值被随机替换后模型预测的误差会增大。IncNodePurity是通过残差平方和来度量,更有用的变量可使节点纯度的提高,即体现每个变量对节点观测值的异质性的影响。这2个值均可作为判断预测变量重要性的指标,且值越大则说明该变量的重要性越大。
基于影响土壤湿度的18个解释变量建立的随机森林模型,该模型的方差解释率为89.14%,模型具有较好的拟合优度。如图3采用%IncMSE和IncNodePurity对预测结果进行综合评价,尽管2种评价指标下的环境因子重要性排序有差异,但依然体现出一定的规律性。相对湿度RH、白天地表温度LST_D和高程DEM和经度Lon均位列2种评价指标排序的前6位,体现出这几个环境因子对表层土壤湿度变化的重要性。其中,相对湿度RH和白天地表温度在重要性排序中名列前茅,表明其对土壤湿度变化的决定性作用,是影响土壤湿度变化的最重要因素。DEM的影响不容忽视,由于地形起伏与拦截程度的差异会形成不同的产汇流路径,直接影响流域径流量,进而影响土壤水分状况。此外,在%IncMSE评价排序中,坡向的影响仅次于DEM,说明了地形因子对土壤湿度的影响不容忽视,不同的坡向对应水热条件和植被状况不同,阳坡较阴坡接受到较多的太阳辐射,温度状况较好,但水分状况较差,从而导致土壤中理化性质的差异。在两种评价指标的排序中,经纬度的影响也同样靠前,不同地理位置的土壤湿度变化特征受到大气条件和地表条件的共同影响,具体而言,西辽河流域土壤湿度呈现出总体由西向东逐渐减少的变化规律。总的来说,相对湿度和白天地表温度是影响土壤湿度变化的最重要的2个因素,地形与位置因子的影响同样不容忽视。由此说明将地形和气象要素作为环境因子加入降尺度模型具有重要意义。
图3 基于随机森林模型输入的环境因子重要性排序

Fig. 3 Ranking of environmental factors based on the input of random forest model

3.2 降尺度结果精度评估

采用地表参数作为降尺度的环境因子是现在大多数研究使用的降尺度方法,本文将仅考虑地表参数作为降尺度因子的结果与加入地形和气象要素综合考虑的降尺度结果,用不同站点的SM_O_bc进行验证,从表2中的RMSECORRBIAS中可以看出,绝大多数站点SM_O_bc与考虑多种环境因子降尺度后SM_RF的CORR(p<0.01)均比仅考虑地表参数降尺度后SM_RF大,数值在0.177 7以上,平均相关系数为0.4973,综合考虑多种环境因子降尺度后的SM_RF能显著提高与实测数据之间的相关性。SM_O_bc与考虑多种环境因子后SM_RF的RMSE均低于考虑单一环境因子降尺度后SM_RF,每个站点的RMSE都在0.048 8 m3/m3以下,平均误差在0.037 2 m3/m3。仅考虑地表参数降尺度后的SM_RF偏差有14个站点小于0,存在一定程度上的低估,综合考虑了下垫面、地形和气象要素降尺度后SM_RF虽存在一定程度的高估,但总体绝对偏差小于仅考虑地表参数降尺度后的SM_RF。精度评估结果表明综合考虑多种环境因子能够有效提高降尺度结果的精度。
表2 2种情形下土壤湿度降尺度结果的精度对比

Tab. 2 Comparison of the accuracy of soil moisture downscaling results in two conditions

站点名称 情形一:地表参数作为降尺度因子 情形二:多环境要素(地表、地形和气象)作为降尺度因子
RMSE CORR BIAS RMSE CORR BIAS
克什克腾 0.042 6 0.359 8 -0.022 9 0.035 1 0.412 8 0.009 1
林西 0.037 6 0.315 9 -0.006 7 0.035 6 0.600 5 0.018 2
岗子 0.036 9 0.581 7 0.019 8 0.031 2 0.634 1 -0.003 0
巴林右 0.034 4 0.506 6 -0.012 2 0.030 9 0.590 8 0.003 8
喀喇沁 0.035 1 0.438 1 0.006 0 0.033 2 0.514 9 0.003 2
八里罕 0.040 8 0.489 5 0.018 0 0.035 9 0.483 6 -0.005 4
赤峰 0.040 1 0.369 5 -0.008 1 0.034 5 0.439 5 0.003 6
翁牛特 0.036 5 0.523 4 0.005 9 0.036 1 0.496 9 -0.004 1
富河 0.041 0 0.180 7 -0.011 0 0.039 7 0.358 2 0.017 0
宁城 0.041 3 0.451 1 0.012 5 0.038 0 0.454 0 -0.014 9
巴林左 0.033 6 0.518 2 -0.007 1 0.031 3 0.631 8 0.004 6
霍林郭勒 0.047 9 0.217 7 -0.009 7 0.045 8 0.325 3 0.012 8
敖汉 0.040 3 0.355 9 -0.002 0 0.030 6 0.617 5 0.012 5
阿鲁科尔沁 0.040 5 0.300 5 -0.002 1 0.034 9 0.545 6 0.013 0
巴雅尔吐胡硕 0.043 1 0.319 0 -0.004 9 0.037 3 0.631 5 0.017 7
奈曼 0.040 1 0.159 6 0.007 5 0.037 0 0.427 3 0.019 7
扎鲁特 0.044 3 0.421 2 -0.017 1 0.033 3 0.667 9 0.013 8
开鲁 0.053 5 0.031 9 -0.012 5 0.048 3 0.305 1 0.031 1
舍伯吐 0.053 1 0.328 1 -0.028 7 0.040 3 0.543 2 0.018 7
通辽 0.048 9 0.258 6 -0.017 8 0.047 1 0.566 5 0.033 3
科左中 0.065 9 0.109 4 0.033 5 0.048 9 0.177 7 0.020 9
双辽 0.047 6 0.540 4 0.019 9 0.034 5 0.529 6 -0.006 1
为进一步验证基于随机森林降尺度模型的有效性,通过提取22个实测站点位置的土壤湿度数据绘制散点图(图4),显示降尺度结果与原始ESA CCI土壤湿度数据之间的分布状况。由图4可以看出,降尺度结果与原始ESA CCI土壤湿度的R2变化范围是0.52~0.84,所有站点上的数据点均匀分布于1:1直线两侧,因此二者之间具有较高的相关性,说明所构建的基于随机森林的降尺度模型在西辽河流域具有很好的适用性。
图4 随机森林降尺度的土壤湿度预测值与CCI_SM数据值的散点图

Fig. 4 The scatterplot of soil moisture prediction and CCI_SM data values of random forest downscaling

3.3 降尺度结果时空分析

选取岗子、扎鲁特和巴林左3个典型站点分析降尺度后的流域土壤湿度时空分布。图5为3个典型站点经随机森林降尺度后的土壤湿度与站点实测土壤湿度之间的时间序列,3个站点降尺度后的土壤湿度与站点实测土壤湿度均呈现出较为明显的季节性特征。本研究将一年12个月划分为4个季度,分别是春季(3—5月)、夏季(6—8月)、秋季(9—11月)、冬季(12—次年2月)。土壤湿度年内变化表现为春季数值小而平稳,夏、秋两季波动上升,在冬季会呈现出持续降低的趋势。其中土壤湿度较低的月份在12月、1月和2月,土壤湿度较高的月份在6月、7月、8月和9月。
图5 岗子站、扎鲁特站、巴林左站降尺度土壤湿度与站点实测土壤湿度时间序列

Fig. 5 Time series of downscaled soil moisture and measured soil moisture at Gangzi, Zalute and Balinzuo

图5显示了降尺度后的土壤湿度与站点实测土壤湿度的对比,可以看出降尺度后的土壤湿度比站点实测土壤湿度时间序列的数值波动小,但二者有着相近的时间变化趋势,表明随机森林模型降尺度后的土壤湿度能够较好地反映表层土壤水分的动态变化,尤其在植被生长季(5月初—10月初)降尺度后的土壤湿度与站点实测土壤湿度的时间序列更为相近。而在非生长季二者差距相对较大,这可能是因为CCI_SM数据在非生长季的部分缺失使得估算结果精度较低导致。
西辽河流域4个季节土壤湿度多年平均值的空间分布图(图6)显示降尺度土壤湿度与CCI_SM的空间分布特征一致,且对土壤湿度的表达更具有连续性,不再具有明显的马赛克现象。另外,图6也表明西辽河流域土壤水分具有显著的干湿分明和空间差异性,空间格局总体表现为土壤湿度由流域南部、西部和东北部向中部递减。在流域上游和中游土壤较为干旱,此区域包含了奈曼旗-敖汉旗-翁牛特旗-巴林右旗的沙丘地带;流域西南部山区和河流沿岸地区,植被覆盖率较高,为土壤湿润区。
图6 2013—2020年ESA CCI与降尺度后(SM_RF)的土壤湿度空间分布对比

Fig. 6 Comparison of spatial distribution of soil moisture between ESA CCI and downscaling (RF_SM) from 2013 to 2020

4 讨论

本研究尝试将多种环境要素作为降尺度因子输入到随机森林模型,对ESA CCI土壤湿度产品进行降尺度研究。国内外已有许多土壤湿度降尺度的研究,但采用的降尺度方法和选取的环境变量各有不同。在众多的降尺度方法中,机器学习方法能够在缺乏物理机理的情况下表达土壤水分与降尺度因子之间的关系机制成为构建降尺度模型的较好选择,相关研究显示[13-14]随机森林方法在土壤水分降尺度中展现出优于其他多种机器学习方法的性能。在环境变量的选取中,大多数研究考虑了地表温度和植被指数等下垫面因素,少数考虑了地形和地表辐射等参量,鲜少有研究将气象要素作为降尺度因子考虑。本研究尝试考虑加入地表参数之外的地形和气象因子作为多要素环境变量,因而选取了5个地表参数、8个气象因子、3个地形因子以及2个位置因子,共计18个环境因素作为输入变量参与随机森林的模型计算,对比分析结果也显示考虑多环境要素变量的降尺度模型精度优于仅仅考虑地表参数变量的模型。环境因子重要性程度分析也证明,气象和地形要素对于土壤湿度具有重要影响,在土壤湿度降尺度模型构建中是不容忽视的解释变量。本研究的结果可为其他降尺度研究中环境变量的选择提供参考。本研究得到西辽河流域1 km分辨率的土壤湿度时空分布数据,可为水文、气象等领域的科学研究和灾害监测等实践业务提供科学数据。
本研究提供了将常规的地表参数之外的地形和气象要素作为环境因子考虑进降尺度模型,来提高降尺度精度的思路。然而,由于不同研究区的局地气象和下垫面条件的差异,可能导致环境因子重要性排序的差异。此外,文中还存在一些需要进一步改进之处,例如由于站点观测和遥感数据的时空尺度差异,站点验证不能完全反映降尺度结果的真实情况,还需开展更有效的验证方法研究;本文构建的方法适用于植物生长季,依赖于输入的粗分辨率土壤湿度与高分辨率解释变量间的非线性关系,而在植物的非生长季CCI土壤湿度数据存在大量缺失,会导致时间序列不连续的问题,在后续的研究中,可以通过多源数据融合或数据重建的方法弥补数据缺失的不足,进一步提高遥感土壤水分数据的应用价值。

5 结论

本文基于欧空局CCI土壤湿度产品数据结合1 km分辨率的MODIS数据、地形数据、气象因子数据,构建CCI土壤湿度数据随机森林降尺度模型,对西辽河流域2013—2020年日尺度上0.25°的CCI土壤数据进行降尺度,得到1 km空间分辨率的土壤湿度数据,研究结果如下:
(1)在影响土壤湿度的环境因子重要性分析中,相对湿度RH、白天地表温度LST_D和高程DEM和经度Lon均位列2种评价指标排序的前6位,体现出对表层土壤湿度变化的重要性。相对湿度RH和白天地表温度LST_D是影响土壤湿度变化最重要的2个因素,地形与位置因子的影响次之,该结果可为土壤湿度降尺度研究的环境因子选取提供参考。
(2)利用站点实测土壤湿度分别对考虑地表参数要素的降尺度结果和考虑多要素(地表、地形和气象)的降尺度结果进行精度评估比较,结果表明,考虑多要素降尺度后的结果与站点实测数据的偏差更小,且显著提高了与实测数据间的相关性,能够有效改善降尺度结果的精度。为进一步验证基于随机森林降尺度模型的有效性,通过加入多环境要素的降尺度结果与ESA CCI土壤湿度数据的散点图分布显示R2变化范围是0.51~0.84,数据点在1:1直线两侧均匀分布,说明二者之间的相关性程度较高。
(3)降尺度后的土壤湿度与站点实测土壤湿度的对比显示,降尺度后的土壤湿度比站点实测土壤湿度时间序列的数值波动小,但二者有着相近的时间变化趋势。与ESA CCI数据进行空间分布的比较可以看出,降尺度后获得的1 km空间分辨率的土壤湿度数据总体上提高了ESA CCI土壤湿度产品数据的精度和空间分辨率的同时与ESA CCI土壤湿度数据空间分布趋势一致。
本研究利用高分辨率的多种环境因子数据采用随机森林模型对ESA CCI土壤湿度产品进行降尺度研究,得到1 km高空间分辨率的土壤湿度数据,并用站点实测数据进行验证,说明了本文构建的降尺度方法在西辽河流域具有较强的时空适用性,能够为该流域的生态监测与评估、农业、水文、旱情监测提供有效依据,并为土壤湿度降尺度研究环境因子的选择提供科学参考。
[1]
耿庆田, 刘植, 李清亮, 等. 基于一种深度学习模型的土壤湿度预测研究[J/OL]. 吉林大学学报(工学版), 2022,1-10

[Geng Q T, Liu Z, Li Q L, et al. Prediction of soil moisture based on a deep learning model[J/OL]. Journal of Jilin University (Engineering and Technology Edition), 2022,1-10.] DOI:10.13229/j.cnki.jdxbgxb20220125

DOI

[2]
Lu H, Shi J C. Reconstruction and analysis of temporal and spatial variations in surface soil moisture in China using remote sensing[J]. Chinese Science Bulletin, 2012, 57(22):2824-2834. DOI:10.1007/s11434-012-5011-8

DOI

[3]
高露, 张圣微, 赵鸿彬, 等. 退化草原土壤理化性质空间异质性及其对土壤水分的影响[J]. 干旱区研究, 2020, 37(3):607-617.

[Gao L, Zhang S W, Zhao H B, et al. Spatial heterogeneity of soil physical and chemical properties in degraded grassland and their effect on soil moisture[J]. Arid Zone Research, 2020, 37(3):607-617.] DOI:10.13866/j.azr.2020.03.08

DOI

[4]
聂艳, 马泽玥, 周逍峰, 等. 阿克苏河流域土壤湿度反演与监测研究[J]. 生态学报, 2019, 39(14):5138-5148.

[Nie Y, Ma Z Y, Zhou X F, et al. Soil moisture retrieval and monitoring in the Aksu River Basin[J]. Acta Ecological Sinica, 2019, 39(14):5138-5148.] DOI:10.5846/stxb201808151745

DOI

[5]
周壮, 赵少杰, 蒋玲梅. 被动微波遥感土壤水分产品降尺度方法研究综述[J]. 北京师范大学学报(自然科学版), 2016, 52(4):479-485.

[Zhou Z, Zhao S J, Jiang L M. Downscaling methods of passive microwave remote sensing of soil moisture[J]. Journal of Beijing Normal University (Natural Science), 2016, 52(4):479-485.] DOI:10.16360/j.cnki.jbnuns.2016.04.013

DOI

[6]
蒋玲梅, 崔慧珍, 王功雪, 等. 积雪、土壤冻融与土壤水分遥感监测研究进展[J]. 遥感技术与应用, 2020, 35(6):1237-1262.

[Jiang L M, Cui H Z, Wang G X, et al. Progress on remote sensing of snow, surface soil frozen/thaw state and soil moisture[J]. Remote Sensing Technology and Application, 2020, 35(6):1237-1262.] DOI:10.11873/j.issn.1004-0323.2020.6.1237

DOI

[7]
Kim J, Hogue T S. Improving spatial soil moisture representation through integration of AMSR-E and MODIS products[J]. IEEE Transactions on Geoscience and Remote Sensing, 2012, 50(2):446-460. DOI:10.1109/TGRS.2011.2161318

DOI

[8]
Ram L Ray. Landslide susceptibility mapping using downscaled AMSR-E soil moisture: A case study from Cleveland Corral, California, US[J]. Remote Sensing of Environment, 2010, 114(11):2624-2636. DOI:10.1016/j.rse.2010.05.033

DOI

[9]
Merlin O. A downscaling method for distributing surface soil moisture within a microwave pixel: Application to the Monsoon '90 data[J]. Remote Sensing of Environment, 2006, 101(3):379-389. DOI:10.1016/j.rse.2006.01.004

DOI

[10]
Merlin O, Chehbouni A, Walker J P, et al. A simple method to disaggregate passive microwave-based soil moisture[J]. IEEE Transactions on Geoscience and Remote Sensing, 2008, 46(3):786-796. DOI:10.1109/TGRS.2007.914807

DOI

[11]
Bindlish R, Barros A P. Sub-pixel variability of remotely sensed soil moisture: An inter-comparison study of SAR and ESTAR[C]// IEEE 1999 International Geoscience and Remote Sensing Symposium. IGARSS'99 (Cat. No.9 9CH36293). IEEE, 2002:1917-1920. DOI:10.1109/IGARSS.1999.774986

DOI

[12]
J, Pellenq. A disaggregation scheme for soil moisture based on topography and soil depth[J]. Journal of Hydrology, 2003,276(1/2/3/4):112-127. DOI:10.1016/S0022-1694(03)00066-0

DOI

[13]
盛佳慧, 饶鹏. 基于风云气象卫星的土壤湿度数据降尺度方法研究[J]. 红外与毫米波学报, 2021, 40(1):74-88.

[Sheng J H, Rao P. The research on downscaling methods based on Fengyun meteorological satellite soil moisture data[J]. Journal of Infrared and Millimeter Waves, 2021, 40(1):74-88.] DOI:10.11972/j.issn.1001-9014.2021.01.012

DOI

[14]
Im J, Park S, Rhee J, et al. Downscaling of AMSR-E soil moisture with MODIS products using machine learning approaches[J]. Environmental Earth Sciences, 2016, 75(15):1120. DOI:10.1007/s12665-016-5917-6

DOI

[15]
Toby N, Carlson. An interpretation of methodologies for indirect measurement of soil water content[J]. Agricultural and Forest Meteorology, 1995, 77(3/4):191-205. DOI:10.1016/0168-1923(95)02261-U

DOI

[16]
Piles M, Sánchez N, Vall-llossera M, et al. A downscaling approach for SMOS land observations: Evaluation of high-resolution soil moisture maps over the Iberian peninsula[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(9):3845-3857. DOI:10.1109/JSTARS.2014.2325398

DOI

[17]
Inge, Sandholt. A simple interpretation of the surface temperature/vegetation index space for assessment of surface moisture status[J]. Remote Sensing of Environment, 2002, 79(2/3):213-224. DOI:10.1016/S0034-4257(01)00274-7

DOI

[18]
曹永攀, 晋锐, 韩旭军, 等. 基于MODIS和AMSR-E遥感数据的土壤水分降尺度研究[J]. 遥感技术与应用, 2011, 26(5):590-597.

[Cao Y P, Jin R, Han X J, et al. A downscaling method for AMSR-E soil moisture using MODIS derived dryness index[J]. Remote Sensing Technology and Application, 2011, 26(5):590-597.]

[19]
辛强, 李兆富, 李瑞娟, 等. 基于温度植被干旱指数的华东地区AMSR-E土壤水分数据的空间降尺度研究[J]. 农业现代化研究, 2016, 37(5):956-963.

[Xin Q, Li Z F, Li R J, et al. Downscaling AMSR-E soil moisture data based on temperature vegetation drought index in Eastern China[J]. Research of Agricultural Modernization, 2016, 37(5):956-963.] DOI:10.13872/j.1000-0275.2016.0099

DOI

[20]
王安琪, 解超, 施建成, 等. MODIS温度变化率与AMSR-E土壤水分的关系的提出与降尺度算法推广[J]. 光谱学与光谱分析, 2013, 33(3):623-627.

[Wang A Q, Xie C, Shi J C, et al. The relationship between the variation rate of MODIS land surface temperature and AMSR-E soil moisture and its application to downscaling[J]. Spectroscopy and Spectral Analysis, 2013, 33(3):623-627.] DOI:10.3964/j.issn.1000-0593(2013)03-0623-05

DOI

[21]
Chauhan N S, Miller S, Ardanuy P. Spaceborne soil moisture estimation at high resolution: A microwave-optical/IR synergistic approach[J]. International Journal of Remote Sensing, 2003, 24(22):4599-4622. DOI:10.1080/0143116031000156837

DOI

[22]
Sun H, Cui Y J. Evaluating downscaling factors of microwave satellite soil moisture based on machine learning method[J]. Remote Sensing, 2021, 13(1):133. DOI:10.3390/rs13010133

DOI

[23]
Wei, Zhao. A spatial downscaling approach for the SMAP passive surface soil moisture product using random forest regression[J]. Journal of Hydrology, 2018, 563:1009-1024. DOI:10.1016/j.jhydrol.2018.06.081

DOI

[24]
Kovačević J, Cvijetinović Ž, Stančić N, et al. New downscaling approach using ESA CCI SM products for obtaining high resolution surface soil moisture[J]. Remote Sensing, 2020, 12(7):1119. DOI:10.3390/rs12071119

DOI

[25]
Dorigo W A, Gruber A, De Jeu R A M, et al. Evaluation of the ESA CCI soil moisture product using[J]. Remote Sensing of Environment, 2015, 162:380-395. DOI:10.1016/j.rse.2014.07.023

DOI

[26]
Liang S L. Narrowband to broadband conversions of land surface albedo algorithms[J]. Remote Sensing of Environment, 2001, 76(2):213-238. DOI:10.1016/s0034-4257(00)00205-4

DOI

[27]
荀其蕾, 董乙强, 安沙舟, 等. 基于MOD 09GA数据的新疆草地生长状况遥感监测研究[J]. 草业学报, 2018, 27(4):10-26.

DOI

[Xun Q L, Dong Y Q, An S Z, et al. Monitoring of grassland herbage accumulation by remote sensing using MOD 09GA data in Xinjiang[J]. Acta Prataculturae Sinica, 2018, 27(4):10-26.] DOI:10.11686/cyxb2017232

DOI

[28]
Olivier, Merlin. Towards deterministic downscaling of SMOS soil moisture using MODIS derived soil evaporative efficiency[J]. Remote Sensing of Environment, 2008, 112(10):3935-3946. DOI:10.1016/j.rse.2008.06.012

DOI

[29]
方蓓婧. 华北平原蒸散发估算及其时空变化规律研究[D]. 北京: 清华大学, 2018.

[Fang B J. Simulating temporal and spatial variation of evapotranspiration over the North China plain[D]. Beijing: Tsinghua University, 2018.] DOI:10.27266/d.cnki.gqhau.2018.000430

DOI

[30]
童成立, 张文菊, 汤阳, 等. 逐日太阳辐射的模拟计算[J]. 中国农业气象, 2005, 26(3):165-169.

[Tong C L, Zhang W J, Tang Y, et al. Estimation of daily solar radiation in China[J]. Agricultural Meteorology, 2005, 26(3):165-169.] DOI:10.3969/j.issn.1000-6362.2005.03.006

DOI

[31]
Breiman L. Random forests[J]. Machine Learning, 2001, 45(1):5-32. DOI:10.1023/A:1010933404324

DOI

[32]
任梅芳, 庞博, 徐宗学, 等. 基于随机森林模型的雅鲁藏布江流域气温降尺度研究[J]. 高原气象, 2018, 37(5):1241-1253.

DOI

[Ren M F, Pang B, Xu Z X, et al. Downscaling of air temperature in the Yarlung Zangbo River Basin based on the random forest model[J]. Plateau Meteorology, 2018, 37(5):1241-1253.] DOI:10.7522/j.issn.1000-0534.2018.00026

DOI

[33]
李婉, 牛陆, 陈虹, 等. 基于随机森林算法的地表温度鲁棒降尺度方法[J]. 地球信息科学学报, 2020, 22(8):1666-1678.

DOI

[Li W, Niu L, Chen H, et al. Robust downscaling method of land surface temperature by using random forest algorithm[J]. Journal of Geo-Information Science, 2020, 22(8):1666-1678.] DOI:10.12082/dqxxkx.2020.190142

DOI

[34]
李建明, 马燕飞, 李仁杰, 等. 基于随机森林的海河流域地表温度降尺度[J]. 遥感信息, 2021, 36(4):151-158.

[Li J M, Ma Y F, Li R J, et al. Land surface temperature downscaling of Haihe River Basin based on random forest[J]. Remote Sensing Information, 2021, 36(4):151-158.] DOI:10.3969/j.issn.1000-3177.2021.04.020

DOI

[35]
刘长春, 刘鹏举, 季烨云. 基于视频区域动态特征的林火烟雾检测技术研究[J]. 北京林业大学学报, 2021, 43(1):10-19.

[Liu C C, Liu P J, Ji Y Y. Research on forest fire smoke detection technology based on video region dynamic features[J]. Journal of Beijing Forestry University, 2021, 43(1):10-19.] DOI: 10.12171/j.1000-1522.20200049

DOI

[36]
张玲, 安如, 王喆. 主/被动微波遥感数据融合的土壤湿度产品的CDF改进研究[J]. 科学技术与工程, 2015, 15(30):1-8.

[Zhang L, An R, Wang Z. Improvement of CCI soil moisture product based on CDF technique[J]. Science Technology and Engineering, 2015, 15(30):1-8.] DOI:10.3969/j.issn.1671-1815.2015.30.001

DOI

[37]
杜晓彤, 方秀琴, 汪伟, 等. 基于SMAR模型的半干旱区根系层土壤湿度估算[J]. 水土保持研究, 2020, 27(3):119-127,133.

[Du X T, Fang X Q, Wang W, et al. Estimation of soil moisture in root zone of semiarid area based on SMAR model[J]. Research of Soil and Water Conservation, 2020, 27(3):119-127,133.] DOI:10.13869/j.cnki.rswc.2020.03.018

DOI

Outlines

/