A Precipitation Downscaling Model: Conditional Generative Adversarial Networks under Terrain Constraints

  • DU Xiaowan , 1, 3 ,
  • CHEN Xi 1, 2 ,
  • ZHENG Hongwei , 1, 2, * ,
  • LIU Ying 1, 2 ,
  • LIU Tie 1, 2 ,
  • BAO Anming 1, 2 ,
  • HU Ping 4
Expand
  • 1. State Key Laboratory of Desert and Oasis Ecology, Xinjiang Institute of Ecology and Geography, Chinese Academy of Sciences, Urumqi 830011, China
  • 2. Research Center for Ecology and Environment of Central Asia, Chinese Academy of Sciences, Urumqi 830011, China
  • 3. College of Resources and Environment, University of Chinese Academy of Sciences, Beijing 100049, China
  • 4. School of Information Science and Engineering, Xinjiang University, Urumqi 830017, China
*ZHENG Hongwei, E-mail:

Received date: 2023-01-24

  Revised date: 2023-03-24

  Online published: 2023-07-14

Supported by

Key Program of National Natural Science Foundation of China(42230708)

Strategic Priority Research Program of the Chinese Academy of Sciences, Pan-Third Pole Environment Study for a Green Silk Road(XDA20060303)

National Natural Science Foundation of China(42071245)

Key Research and Development Program of Xinjiang Uygur Autonomous Region(2022B03001-3)

Abstract

Most of the precipitation datasets in Central Asia have problems such as data missing, geographical bias and outliers, low resolution, and so on. The normal prediction results obtained by most machine learning methods are usually hard to interpret, not only due to the uncertainties from input information but also due to the complicated global geographical environments as well as the underlying local geographical conditions. In this paper, to overcome this problem, we proposed a novel downscaling precipitation model to adjust and optimize the precipitation computation results from Conditional Generative Adversarial Networks (CGAN) using an inverse distance weighting method based on the prior information of geographical differences of local digital terrain model and multiple weather stations. In this study, the Amu Darya River Basin was selected as the research area due to its various geographical environment and complicated topographic and geographical conditions. First, the input Climate Research Units (CRU) precipitation data with 55 km resolution were spatially corrected based on the topographic map using the spatial deformation model. The spatial deformation model was extended from spatial transformation network methods. Second, we input the corrected CRU precipitation data, temperature, wind speed, humidity equivalent data, and remote sensing data to the CGAN computing framework for high-resolution precipitation reconstruction. The experiment adopted the cross-validation method, taking 80% of the data as the training set, and the remaining 20% as the verification set. The test set contained 20 raster maps of annual precipitation from 2000 to 2019. The model was built based on pytorch 1.10.0, the batch size was 16, and the learning rate was 0.000 3. The epoch was 8 000 iterations in the Adam optimizer for gradient descent. Finally, the precipitation data of meteorological stations were used as the true values for analyzing the geographical differences of inverse distance weights and the accuracy of the corrected precipitation grid data. The results show that the proposed method can improve the resolution and accuracy of precipitation data,especially for the complex terrain and mountainous area. And Experiments on the Amu Darya in Central Asia show that the Root Mean Square Error (RMSE) of the downscaling result within the watershed was 15.96 mm, the Mean Absolute Error (MAE) was 11.82 mm, the R2 value was 0.83, and the deviation was 0.08. This study provides a robust, accurate method for improving the spatial resolution of precipitation data in complex geographical areas.

Cite this article

DU Xiaowan , CHEN Xi , ZHENG Hongwei , LIU Ying , LIU Tie , BAO Anming , HU Ping . A Precipitation Downscaling Model: Conditional Generative Adversarial Networks under Terrain Constraints[J]. Journal of Geo-information Science, 2023 , 25(8) : 1586 -1600 . DOI: 10.12082/dqxxkx.2023.230033

1 引言

作为水循环中的关键要素之一,高分辨率和高精度的降水数据是指导流域水资源利用和管理的重要指标[1]。因此,快速获取大范围高精度的流域降水信息对跨境水资源的科学利用以及可持续发展具有重要意义。
遥感技术和大尺度再分析数据集的迅速发展,为区域降水降尺度研究提供了必要的数据基础。如MODIS遥感影像[2],TRMM 雷达影像[3-5],CMIP5/CMIP6[6-8],再分析数据[9]等均被广泛应用于降尺度研究。目前降水降尺度的方法基本可分为2大类:统计降尺度和动力降尺度[10-11]。与动力降尺度方法相比,统计降尺度虽然缺少物理机理,受观测资料影响较大,但其具有计算量小、时效性高、构建简单、可选方法多等优点,现已被广泛用于降水的降尺度研究。传统的统计降尺度方法包括转换函数、天气模态或分型和天气发生器[12],然而,统计降尺度方法主要适用于时空连续、分布均匀的数据。对于空间异质性较大的降水数据,仅采取统计降尺度的效果往往较差,尤其当区域内站点密度不均且地形地势较为复杂时,上述方法难以提升降水格网数据精度。
深度学习是实现复杂函数逼近的一种有效手段[13-14],具有有效学习先验知识和优化模型计算性能的优势。因此,深度学习能够更加有效地替代传统统计插值及回归方法,在降尺度研究中得到了发展,特别是基于生成式对抗网络(Generative Adversarial Network, GAN)的超分辨率(Super Resolution, SR)方法[15-17]。GAN采用2个网络对抗训练的方式,相较其他模型,能够产生更加清晰真实的样本[14]。例如,Vandal[18], Geiss and Hardin[19]采用基于GAN的超分辨率方法结合多种气候环境因素计算出超分辨率降水格网数据。Wang等[2]提出了多分辨率动态降尺度方法来提升空间分辨率,此方法在未预先设定输入数据的任何稳定性假设基础上,相对高效地生成了高精度格网数据。虽然这些神经网络方法能够提升数据分辨率,但是系统性偏差问题没有得到完善解决。并且这些方法忽视了地面站点真值数据的校验作用,对于地形和地理特性较为复杂的环境,其生成高分辨率数据的精度难以保证。
区域降水的空间分布受到多方面因素影响,比如地理变量、大气环流和天气系统等[20]。这些因素具有单个因素随机性、因素间近邻相关性、多因素的空间异质性和多尺度性等特点[21]。因此单一的神经网络模型往往不能得到较为精准和鲁棒的降水降尺度结果。阿姆河作为中亚最大水量的内陆河,其流域横跨约3 000 km,地形地势差异大,地理环境复杂,是典型的研究区域。其上游和中游气候复杂多变,在气象站点架设维护难、数量稀少的情况下,如何有效利用低分辨率气候数据和稀疏气象站点数据获取高分辨率降水降尺度格网数据? 虽然已有类似研究[21-23]尝试解决此问题,但均忽视了复杂地形导致的误差[24]
在此基础上,本文提出了基于条件生成式对抗网络(Conditional Generative Adversarial Networks, CGAN)的集成方法(Spatial Encoded-CGAN-Geographic Differences Analysis, SE-CGAN-GDA)。本方法分步集成了空间偏差校正,条件生成式对抗网络和基于气象站点数据的地理差异分析,构建了一种适用于复杂地理山区的降水降尺度模型,提高了复杂山区站点稀疏区域降水数据的分辨率和精度。

2 研究区概况和数据来源

2.1 研究区概况

作为中亚干旱/半干旱区最长的河流之一,阿姆河全长约2.54×103 km,发源于天山西部和帕米尔—阿莱高原地区的山地冰川,是中亚地区重要的跨界河流,流经阿富汗北部地区,塔吉克斯坦,土库曼斯坦和乌兹别克斯坦[25-28],最终汇入咸海。该河流流域范围介于34°30′ N—43°45′ N,58°15′ E—75°07′ E,面积约为4.65×105 km2,其地理及地形地质条件复杂且气候多变。流域上游多分布东西走向的高山,下游则以地势低平的荒漠和绿洲为主[29],流域内地势高度差较大,最大可达6 100 m之高,海拔自西向东逐渐抬升。因此,由于西部高山区的降水拦截作用,流域内降水分布不均匀,年内降水量稀少。流域高寒山区降水量相对丰富,年平均降水量超过 1 000 mm,而山麓及平原的年平均降水量却不足100 mm,是形成了典型的干旱或半干旱气候区,80%的降水多见于春季和冬季[30]。流域内Kerki站点以上的部分为上游,Kerki站点到Tuyanuyun水库的部分为中游,Tuyamuyun水库到咸海的部分为下游[31]。在此基础上,本文将研究区划分为5个地区,如图1所示,即上游东部地区(UE)、上游西部地区(UW)、中游地区(DM)、下游东部地区(DE)、下游西部地区(DW)。
图1 阿姆河流域及气象站点及流域上中下游区域分布

Fig. 1 Amu Darya River basin and the distribution of meteorological sites in different climate regions along the Amu Darya River

2.2 数据及其来源

依据上文分区标准,实验得到了5组数据集用于训练SE-CGAN-GDA模型,每组数据均包含该地区2000—2019年用于降水降尺度的全部数据。本文采用的数据包括:① CRU TS第五版数据集中的月降水总量栅格数据;② 遥感数据和陆地同化产品;③ 阿姆河流域内的气象站点实测数据。其介绍和来源如下:
(1)CRU TS是CRU数据集中的一部分,其空间分辨率为0.5°×0.5°,覆盖了全球除南极洲外的主要大陆[32],为研究中亚的主要降水数据。本实验中采用的是CRU TS月降水总量作为初始数据,该数据集通过角距离加权对气象观测站插值,利用插值形成的网络校准气象异常值,从而得到月气象数据。由于该数据的空间分辨率较低,对于局部区域尺度的研究,存在较大偏差,因此,本研究以CRU TS数据为主要输入数据进行降水降尺度研究,以提升其空间分辨率和精度。
(2)遥感数据和陆地同化数据如表1所示。其中,NDVI和NDWI均使用MODIS数据产品MCD43A4计算得到,陆地同化数据选取FLDAS中的风速、气温、蒸散以及湿度数据集,并将表1中的数据按照研究区范围裁剪后统一空间分辨率至0.1°,得到SE-CGAN-GDA计算所需的输入数据。
表1 遥感与同化数据及其来源

Tab. 1 Sources of remote sensing data and assimilation data

数据类型 数据名称 时间分辨率 空间分辨率 数据来源/方法
遥感数据 TRMM数据[33] 2000—2019年 0.25° http://pmm.nasa.gov/data-acces/downloads/
trmm
NDVI数据[34] 月平均 1 km https://lpdaac.usgs.gov/resources/data-action/aster-ultimate-2018-winter-olympics-observer/
NDWI数据[34]
SRTM数据[35] 2000-02-11—2000-02-21 90 m http://www.gscloud.cn/
陆地同化数据[36]
FLDAS
风速(WS) 2000—2019年 0.25° https://disc.gsfc.nasa.gov/
气温(Ta)
蒸散(ET)
湿度(Hum)
(3)地面气象站点数据下载于国家环境信息中心(NCEI)(https://www.ncei.noaa.gov/data/global-summary-of-the-day/access/)。本文从中获取了阿姆河流域2000年1月—2019年12月共48个站点的日降水记录,并以各月降水总量缺失值不超过5%为标准,筛选出42个有效站点,用于地理差异分析和独立校验。

3 研究方法

本文针对阿姆河流域区域跨度大、气候迥异、地形复杂的环境状况,构建了一种利用稀疏站点观测真值校验的SE-CGAN-GDA降水降尺度模型。本文的技术路线如图2所示。
图2 地理差异约束条件生成式对抗网络的降水降尺度模型框架

Fig. 2 Schematic of integration of geographic different analysis and conditional generative adversarial network for modeling downscaling precipitation (SE-CGAN-GDA)

实验对阿姆河流域2000—2019年的CRU TS降水数据进行降尺度,并利用区域内的地面观测数据进行校正。其实验流程主要包括以下3步:① 输入独立高程数据,校正CRU TS降水数据集的空间地形偏差;② 将校正后的CRU TS降水数据、同化数据和提取的遥感参数作为CGAN的输入数据进行模型训练;③ 基于地面气象站点真值降水数据,对第②步输出的降水降尺度结果进行地理差异分析。通过迭代进一步约束和校正降水的计算结果,生成最优的高分辨率降水数据集,并使用时间交叉验证的方式检验数据有效性。

3.1 改进的条件生成式对抗网络模型

3.1.1 空间变形模块

考虑到降水数据的空间异质性,本文引入空间变形模块(Spatial Distortion Module, SDM)[37],结合DEM数据对CRU TS降水数据进行预处理。通过输入低分辨率的降水数据和地形格网特征,得到比例因子 α和位移因子 β,输出地形校正后的降水格网数据,作为编码CGAN的输入数据(图2(b))。本方法首先定义了一个损失函数 L,给定低分辨率的降水格网数据 X i L R R m × n作为输入数据,其中 m n是相应格网数据的宽度和高度。降尺度旨在重建一个相对高分辨率的降水格网 Y i ^ R r m × r n,使得 Y i ^ X i L R尽可能相似。其中, r是降尺度的比例因子,则可得:
θ = a r g m i n θ i = 1 k L G θ X i L R , r , Y i ^
式中: θ表示生成器的可训练参数(即权值); G θ θ参数化的深度神经网络; i为第 i幅图像; k为批大小。其中,预处理模块包含5个ReLU激活的卷积层,核大小和隐藏通道分别设置为3和64,LeakyReLU的斜率设为-0.1。其公式如下:
X i S D M = α X i L R + β X i S D M = α X i S D M + β
式中: X i S D M R m × n G S D M的输出数据。 α β均根据地形因子 X t获得:
α , β = G S D M l e a k y R e L U C o n v X t × 5

3.1.2 编码条件生成式对抗网络

实验以生成式对抗网络(Generative Adversarial Network, GAN)为原始框架构建,GAN作为一类机器学习框架,包含生成器G和判别器D 2个神经网络,二者相互竞争以产生预测结果[38]。其中,生成器G通过卷积捕捉降水数据与其他参数间的非线性关系,将其映射到对应的高分辨率图像中。
本实验使用条件变量作为输入,如图2(c)所示,形成CGAN框架来训练生成器[39]GD同时进行训练,其中G使用 L 1范数和对抗损失的加权平均值作为其损失函数L,定义为:
L θ = - w a k i = 1 k D G θ v 1 , v 2 , + w c k Y i - Y - 1
式中: w a w c分别设置为1和5,为对抗性损失的权值; k为批大小; v 1 ,   v 2 , 是条件变量,包括WS、Ta、ET、Hum、NDVI、NDWI、TRMM降水数据。D用于判别由 G θ产生的数据是否为真值,其损失函数为二值交叉熵; Y i i时刻网格单元的降水量; Y -是区域平均降水。
本实验将先前选定的所有变量进行编码叠加,作为模型的输入(图2(a))。实验使用1×1、3×3和 5×5的卷积核来构建inception模块。此外,引入注意力机制(Convolution Block Attention Module, CBAM)[40]使模型能更加关注降水数据在空间格网上的稀疏性。故本实验将CGAN与Encoded-Simple组合得到Encoded-CGAN。

3.1.3 高分辨率重建模块

高分辨率重建(High Resolution Reconstruction Module, HR-RM)(图2(d))是将SDM和Encoded-CGAN输出的降水格网数据 X i S D M X i E n c o d e d - C G A N融合后作为输入参与计算,公式如下:
Y i ^ = X i S E - C G A N = G H R - R M X i S D M + X i E n c o d e d - C G A N
式中:图2(d)中inception层的设置与上文相同采用inception-V1结构,卷积核大小分别1、3和5,步长设置均为1。
本文提出的SE-CGAN-GDA模型中的SE-CGAN由SDM、Encoded-CGAN和HR-RM共3个部分组成,SDM模块同时将1 200幅低分辨率CRU月降水总量数据与SRTM高程数据作为输入,输出具有地形先验的低分辨率校正降水特征图。Encoded-CGAN中各变量均包含1 200幅栅格图像,经过预处理,将图像由TIFF格式转换为HDF5文件输入编码条件生成式对抗网络的G中,D的输入数据包括 11 km的GPM月降水总量栅格图1 200张,通过卷积提取具有每个变量的相似性特征,将其堆叠后辅助引导对抗学习,实现精准降尺度。最后,实验将SDM与Encoded-CGAN融合作为HR-RM的输入。
实验采用时间交叉验证的方式,取80%的数据作为训练集,剩余20%则为验证集,测试集包含2000—2019年逐年降水总量栅格图,共20 幅。SE-CGAN-GDA模型基于pytorch1.10.0搭建,batch size为16,学习率为0.000 3,epoch为8 000,训练时长 42 min,输入CRU TS降水图像大小为28×45,输出高分辨率降水图像大小为144×225。且实验使用Adam优化器进行梯度下降。

3.2 基于气象站点真值的降水格网校正

由于地形差异,降水在空间分布上表现出各向异性,即各方向上差异明显(图3(a))。为了进一步校准降尺度结果,减少模型计算中产生的偏差[41],实验基于站点实测数据(图3(b)),结合Cheema 和Bastiaanssen[42]于2012年提出的地理差异分析(Geographical Difference Analysis, GDA),对重构后的高分辨率降水图像进行了校正。其中,站点数据包含2000—2019年逐月实测降水真值,共10 080条数据,以随机的方式,将其中80%用于降尺度后的降水数据的校正,剩余20%用于最终的数据精度评估。因此本研究使用GDA校准方法校正降尺度后的结果,以保证其与气象站点测得的雨量差距最小。其具体实现步骤如下:
图3 中间过程的三维视图

Fig. 3 3D views of processing

(1)提取降尺度后的降水数据至对应站点,即 Y c r u u n c a l - 11 k m与实测站点降水值 Y p o i n t作差:
Y e r r o r p o i n t = Y c r u u n c a l - 11 k m - Y p o i n t
(2)对站点进行插值,通过反距离权重法 (Inverse Distance Weight, IDW)将其插值为11 km(图3(c))。由于点数据间隔呈现不规则排列,且随机分布的特性,依据学者对于降水数据插值的研究[43-44],证实了IDW在插值降水中的适用性且相较其他地统计方法更为简单。因此,在本研究中选用IDW将流域内气象站点插值到11 km得到误差图。
(3)将误差图 Y e r r o r 11 k m与降尺度后的结果 Y c r u u n c a l - 11 k m融合,以获得最终的校准降水 Y c a l - G D A
在对随机分布的气象站点进行空间插值获取全局数据时,降水空间尺度研究指出IDW插值方法对山地复杂区域较为适应[45-46]

3.3 性能验证

为评估阿姆河流域的CRU TS降水数据和SE-CGAN-GDA降尺度结果的有效性,本文采用4个指标用于评估数据质量,即决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)、偏差(Bias[42]
(1)决定系数R2R2表示降水观测站测得的降水量与栅格数据间的相关性程度,其数值越接近1时表示二者关系越密切,表明栅格数据与真值间的差距越小,模型模拟效果越好。
R 2 = i = 1 n S i - S ¯ i = 1 n S i - S 2 P i - P ¯ 2 2
(2)均方根误差RMSERMSE是将降水观测站测得的降水量与栅格数据间做差后平方,对其期望值求算术平方根,RMSE的值越小,代表栅格图像的精确度越高。
R M S E = i = 1 n S i - P i 2 n
(3)平均绝对误差MAEMAE表示降水观测站测得的降水量与栅格数据间做差后求绝对值的平均值,该指标反映了模型预测误差,其值越大,表示误差越大。
M A E = i = 1 n S i - P i n
(4)偏差BiasBias表示降水观测站测得的降水量与栅格数据间的偏差,期望Bias的值越小越好。
B i a s = i = 1 n P i i = 1 n S i - 1
式中: S i为第 i个观测站的降水量实测值; S ¯为观测站实测降水量的平均值; P i为第 i个观测站的降水量模拟值; P ¯为模拟降水量的平均值; n为用于模型验证的观测站数量。
此外,为对比其他算法与本文提出的SE-CGAN-GDA模拟得到的阿姆河流域内各地区降水预报准确率,本文选取了漏报率(PO)空报率(FAR)和晴雨准确率(PC)3个降水预报准确率评估指标[47],用于评价不同算法降尺度后的降水预报情况。其计算公式如下:
P O = N C N A + N C × 100 %
F A R = N B N A + N B × 100 %
P C = N A + N D N A + N B + N C + N D × 100 %
式中:NA为预报结果为雨天且预报正确的次数;NB为预报结果为雨天但实际为晴天即空报站次数;NC为下雨但漏报的次数;ND为预报晴天且预报正确的次数。上述指标的值均分布在[0,1]区间。PC与预报效果成正比,而POFAR与预报效果成反比。式(11)—式(13)中的NANBNCND的含义与混淆矩阵的指标类似,如表2所示。
表2 混淆矩阵中的指标

Tab. 2 The confusion matrix corresponding to the four indicators

混淆矩阵 预报
正确 错误
真实 正确 NA NC
错误 NB ND

4 结果及分析

4.1 基于SE-CGAN-GDA的降水降尺度空间分布格局

由于稀疏站点观测范围的降水数据表现出在平原的各向同性和在上游山区的各向异性,本文将IDW 插值结果与降水降尺度结果投影至三维地形图,进行GDA校正(图4)。结果表明,降水多集中在中游艾达尔库湖和下游西部萨雷卡梅什湖(图4(a))。此外,在地形地势陡峭的上游区域,站点的观测范围所覆盖的缓冲区由圆形转变成不规则形状,其控制的插值范围也随之发生改变(图4(b)图4(c))。因此,结合稀疏站点观测真值进一步校准和验证模型,能够使降水降尺度结果更符合真实地理环境。
图4 降水降尺度的三维视图

Fig. 4 3D views of SE-CGAN-GDA precipitation downscaling map

在研究中,实验建立了降水与4个遥感数据和4个陆地同化数据,共8个变量的SE-CGAN-GDA模型,得到2000—2019年阿姆河月、年尺度的降水数据,空间分辨率为11 km。其中,以2019年月降水模拟结果为例(图5),降水表现出自东向西,自北向南逐渐减少的趋势,在空间上具有明显的变异性。在时间上,阿姆河流域地处温带大陆性气候区,全年少雨,其中,3、4、5月降水相对较多,受季风影响,随着大陆辐射,阿姆河流域温度升高,空气密度变小,此时大西洋和北冰洋辐射增温慢,气压低,风从海洋吹向陆地,伴随水汽。
图5 2019年1—12月降水空间分布

Fig. 5 Spatial distribution of monthly precipitation

基于SE-CGAN-GDA模型对CRU TS降水数据降尺度,使其空间分辨率从 0.5°(55 km)提升到0.1°(11 km)。年降水降尺度前后结果对比及局部图如图6所示,阿姆河流域经SE-CGAN-GDA降尺度后的年降水量(图6(a))与原始CRU TS数据(图6(b))在空间分布上基本一致,但细节更清晰。年降水量空间分布在流域内表现出自上游向下游逐渐下降的趋势,总体表现为上游高山多雨,中游相对多雨,及下游地势平缓且少雨的空间格局,这与阿姆河流域实际环境状况表现一致[25]。根据进一步观察,结合土地利用类型分析,由于流域中部多城市绿洲,相较于荒漠区域,植被覆盖较多,降水也相对充沛。
图6 CRU TS与SE-CGAN-GDA模型降尺度后的年降水及局部对比

Fig.6 Comparison of annual precipitation between CRU TS and SE-CGAN-GDA models, and locally enlarged view

4.2 模型精度评价

为了验证本文提出的SE-CGAN-GDA模型中每个模块的效果,实验分别评估了Encoded-CGAN、Encoded-CGAN-GDA、SE-CGAN和SE-CGAN-GDA的模拟结果(表3),并比较了它们的区别。实验表明,仅增加SDM时,降水降尺度后的R2增加了0.19,RMSE减少了9.39 mm,MAE减少了4.29 mm,Bias减少了0.06。仅增加GDA使得校正后降水数据的R2提高了0.14,且RMSEMAEBias均有所下降,证明了GDA在地理偏差校正方面具有优越性[3,42]。若同时进行SDM和GDA,数据质量大幅提高,R2增加0.25,RMSEMAEBias分别减少了13.77 mm、9.3 mm和0.16。
表3 2000—2019年模型消融实验及精度评估

Tab. 3 Model ablation experiment and accuracy evaluation from 2000 to 2019

检验指标 Encoded-CGAN SE-CGAN Encoded-CGAN-GDA SE-CGAN-GDA
R2 0.58 0.77 0.72 0.83
RMSE 29.73 20.34 25.26 15.96
MAE 19.51 15.22 18.90 11.82
Bias 0.24 0.18 0.19 0.08
图7(a)图7(c)表明大部分的地面气象站点观测值与GPM、CRU TS和SE-CGAN-GDA降水降尺度结果之间存在较高的决定系数。SE-CGAN-GDA在旱季与雨季降水的决定系数明显高于CRU TS与GPM,三者均表现出对实际降水的高估,除9月CRU TS与实测月降水的偏差与SE-CGAN-GDA相比更小以外,其他月份SE-CGAN-GDA的高估程度都小于CRU TS和GPM,说明在阿姆河流域SE-CGAN-GDA模拟降水明显优于CRU TS与GPM。图7(d)图7(g)显示了4个评价指标在2000—2019年的月变化情况。R2在春末夏初及秋季数值较大,大致在0.8附近分布。3种降水数据的RMSEMAE变化规律基本一致,呈现先增大后减小的趋势。夏末初秋偏差值较大,雨季相对于旱季误差小,这是由于模型中的注意力机制,将计算重点放在降水量较多的区域所致,流域内冬季的偏差明显增大。与CRU TS和GPM降水相比,本文提出的SE-CGAN-GDA可以显著提高阿姆河流域降水格网数据精度,降低了全年降水的偏差,有利于提高阿姆河流域干旱半干旱区降水模拟精度。
图7 模型精度评价结果比较

Fig. 7 Comparison of model accuracy evaluation results

根据图7(e)图7(f)可看出,在夏秋两季RMSEMAE在校准后其数值明显变小,因此分别对各个站点进行了精度评价,以探究位于不同地理位置和所处土地类型的各站点在校正过程中对结果的影响,其结果如图8所示,由于站点数量过多,本文仅展示影响较大的站点。通过比较发现,中上游沿河分布的站点,在校正过程中对结果的影响较大,而其他站点几乎没有影响。
图8 对校正过程影响较大的站点精度评价图

Fig. 8 The diagrams of accuracy evaluation based on meteorological sites

此外,实验以降水预报准确率评估指标对原始CRU TS降水数据及双线性插值、超分辨率对抗神经网络(SR-GAN)、带编码的条件对抗网络(Encoded-CGAN)和本文提出的SE-CGAN-GDA降尺度后的数据进行分区域比较,模拟得到的降水结果在阿姆河上游区域的漏报率和空报率均高于中下游,晴雨准确率大多低于流域中下游地区。由表4可知,本文提出的SE-CGAN-GDA模型在阿姆河流域降水预报的准确度明显高于原始粗分辨率(55 km)降水数据及其他降尺度算法模拟出的11 km分辨率降水结果。
表4 各类算法在不同地区的降水预报准确率评估

Tab. 4 Evaluation of precipitation forecast accuracy of various algorithms in different regions

算法 分辨率/km 区域 漏报率/% 空报率/% 晴雨准确率/%
CRU TS原始输入数据 55 UE 10.2 11.1 87.7
UW 9.6 9.8 84.7
MD 8.9 9.2 90.3
DE 7.7 7.9 89.9
DW 7.9 8.5 90.1
双线性插值 11 UE 9.2 8.9 94.6
UW 9.0 9.0 90.6
MD 8.5 8.1 92.5
DE 7.9 7.8 91.1
DW 7.9 8.1 90.2
Encoded-CGAN 11 UE 5.5 6.1 94.1
UW 6.1 6.3 93.2
MD 4.0 5.3 94.3
DE 4.2 4.8 95.5
DW 3.9 4.2 95.3
SR-GAN 11 UE 8.1 7.8 90.0
UW 8.6 7.2 90.8
MD 7.7 6.8 92.4
DE 6.2 6.5 93.3
DW 6.6 6.8 93.5
SE-CGAN-GDA 11 UE 5.2 5.8 93.9
UW 4.9 5.6 94.4
MD 3.0 4.8 97.6
DE 3.4 4.2 96.8
DW 3.5 4.2 96.6

4.3 不确定性及讨论

本文提出了SE-CGAN-GDA降水降尺度模型,该模型在空间偏差校正数据基础上,利用地理差异分析方法约束条件生成式对抗网络,有效提高了阿姆河流域降水格网数据的空间分辨率。本方法与传统的CGAN神经网络方法比较,其优势体现在以下2个方面。① 阿姆河流域上、中、下游具有空间异质性,地形地貌复杂。通过引入高程数据校正低分辨率降水数据的空间偏差,并使用地理差异分析进行约束,使模型在极端情况下表现出适应性和普适性,从而有效提高降水降尺度数据集的精度。 ② 本方法有效包含了极端情况数据,兼容了尽可能多的地形地貌和生态地理气候的先验信息和极端情况,在一定程度上有效消除了站点稀疏、样本少以及环境复杂带来的不确定性。
然而,本方法依然存在一些亟待解决的问题。首先,本文提出的SE-CGAN-GDA降水降尺度模型输出数据的空间分辨率依赖于输入数据(陆地同化数据)的空间分辨率,而实验中使用的FLDAS数据集是当前所能获得的最高分辨率(11 km)大尺度陆地同化数据。空间分辨率的高低会影响格网数据信息量的大小,从而影响降水降尺度结果的精度。其次,为了更好地学习低分辨率的输入图像和高分辨率的输出图像之间的映射关系,后续工作可以结合模型加速方法,提高学习效率,如特定尺度的多路径学习[48],实现模型跨尺度协同使用[49]。此外,级联残差网络和渐进式超分辨率网络[49]也采用了针对特定尺度的多路径学习来提高方法的计算效率和鲁棒性。

5 结论

本研究通过集成空间变形模块,编码条件生成式对抗网络和基于气象站点真值的地理差异分析方法,构建了一种新的SE-CGAN-GDA降水降尺度模型。该模型以CGAN为主体,用于提高阿姆河流域复杂环境下降水数据的空间分辨率和精度。由于地形是影响降水的关键要素,故实验引入SDM预先对CRU TS降水数据进行基于地形的空间校正。此外,考虑到降水呈现各向异性,该模型基于稀疏气象站点的真值,结合GDA进一步校正了降水降尺度的结果。研究表明,SE-CGAN-GDA模型能够将CRU TS降水数据集的分辨率由55 km提升至11 km。并且较单独使用Encoded-CGAN,增加了SDM和GDA后的降水降尺度数据质量明显提高。其中,R2增加0.25,RMSEMAEBias分别减少了13.77 mm、9.3 mm和0.16,且降水数据预报准确率明显高于其他降尺度算法。
综上所述,该模型不仅利用了条件生成式对抗网络非线性关系拟合的优势,同时结合了高程数据和气象站点真值,用于约束和校正模型的输出结果。并通过纳入尽可能多的地球地貌和生态地理气候方面的多源数据,一定程度消除了站点稀疏、样本少及环境复杂带来的不确定性。结果表明,SE-CGAN-GDA降水降尺度模型能够快速获取高分辨率区域降水格网数据,为当地水资源管理决策提供依据。
[1]
Jiang Y Z. A downscaling approach for constructing high-resolution precipitation dataset over the Tibetan Plateau from ERA5 reanalysis[J]. Atmospheric Research, 2021, 256:105574. DOI:10.1016/j.atmosres.2021.105574

DOI

[2]
Wang J L, Liu Z C, Foster I, et al. Fast and accurate learned multiresolution dynamical downscaling for precipitation[J]. Geoscientific Model Development, 2021, 14(10):6355-6372. DOI:10.5194/gmd-14-6355-2021

DOI

[3]
Duan Z, Bastiaanssen W G M. First results from Version 7 TRMM 3B43 precipitation product in combination with a new downscaling-calibration procedure[J]. Remote Sensing of Environment, 2013, 131:1-13. DOI:10.1016/j.rse.2012.12.002

DOI

[4]
Ezzine H, Bouziane A, Ouazar D, et al. Downscaling of TRMM3B43 product through spatial and statistical analysis based on normalized difference water index, elevation, and distance from sea[J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(9):1449-1453. DOI:10.1109/LGRS.2017.2705430.

DOI

[5]
Zhang Y Y, Li Y G, Ji X, et al. Fine-resolution precipitation mapping in a mountainous watershed: Geostatistical downscaling of TRMM products based on environmental variables[J]. Remote Sensing, 2018, 10(1):119. DOI:10.3390/rs10010119

DOI

[6]
Zhang Q. A new statistical downscaling approach for global evaluation of the CMIP5 precipitation outputs: Model development and application[J]. Science of the Total Environment, 2019, 690:1048-1067. DOI:10.1016/j.scitotenv.2019.06.310

DOI

[7]
Wang D, Liu J H, Shao W W, et al. Comparison of CMIP5 and CMIP6 multi-model ensemble for precipitation downscaling results and observational data: The case of Hanjiang River Basin[J]. Atmosphere, 2021, 12(7):867. DOI:10.3390/atmos12070867

DOI

[8]
李克诚, 陆建忠, 张可睿, 等. 基于改进U-Net的CMIP5全球气候模式降尺度方法及其在鄱阳湖流域的应用[J]. 湖泊科学, 2022, 34(1):320-333.

[Li K C, Lu J Z, Zhang K R, et al. Spatial downscaling method and application of CMIP5 global climate models based on improved U-Net in Lake Poyang Basin[J]. Journal of Lake Sciences, 2022, 34(1):320-333.] DOI:10.18307/2022.0126

DOI

[9]
Wu S G, Li Z, Li H P, et al. Application of an improved clustering approach on GPS height time series at CMONOC stations in Southwestern China[J]. Earth, Planets and Space, 2021, 73(1):233. DOI:10.1186/s40623-021-01559-1

DOI

[10]
范丽军, 符淙斌, 陈德亮. 统计降尺度法对未来区域气候变化情景预估的研究进展[J]. 地球科学进展, 2005, 20(3):320-329.

DOI

[Fan L J, Fu C B, Chen D L. Review on creating future climate change scenarios by statistical downscaling techniques[J]. Advance in Earth Sciences, 2005, 20(3):320-329.] DOI:10.3321/j.issn:1001-8166.2005.03.009

DOI

[11]
顾伟宗, 陈丽娟, 李维京, 等. 降尺度方法在中国不同区域夏季降水预测中的应用[J]. 气象学报, 2012, 70(2):202-212.

[Gu W Z, Chen L J, Li W J, et al. Development of a downscaling method in China regional summer precipitation prediction[J]. Acta Meteorologica Sinica, 2012, 70(2):202-212.]

[12]
范丽军. 统计降尺度方法的研究及其对中国未来区域气候情景的预估[D]. 北京: 中国科学院研究生院(大气物理研究所), 2006.

[Fan L J. Statistical downscaling of local and regional climate scenarios over China[D]. Beijing: Institute of Atmospheric Physics,Chinese Academy of Sciences, 2006.]

[13]
LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436-444. DOI:10.1038/nature14539

DOI

[14]
Schmidhuber J. Deep learning in neural networks: An overview[J]. Neural Networks, 2015, 61:85-117. DOI: 10.1016/j.neunet.2014.09.003

DOI PMID

[15]
陈文兵, 管正雄, 陈允杰. 基于条件生成式对抗网络的数据增强方法[J]. 计算机应用, 2018, 38(11):3305-3311.

DOI

[Chen W B, Guan Z X, Chen Y J. Data augmentation method based on conditional generative adversarial net model[J]. Journal of Computer Applications, 2018, 38(11):3305-3311.] DOI:10.11772/j.issn.1001-9081.2018051008

DOI

[16]
Yu T Z, Kuang Q M, Zheng J P, et al. Deep precipitation downscaling[J]. IEEE Geoscience and Remote Sensing Letters, 2022, 19:1-5. DOI:10.1109/LGRS.2021.3049673

DOI

[17]
陈凯, 雷少华, 代文, 等. 基于开源数据和条件生成对抗网络的地形重建方法[J]. 地球信息科学学报, 2023, 25(2):252-264.

DOI

[Chen K, Lei S H, Dai W, et al. Terrain rebuilding method based on open source data and conditional generative adversarial networks[J]. Journal of Geo-information Science, 2023, 25(2):252-264.] DOI:10.12082/dqxxkx.2023.220701

DOI

[18]
Vandal T, Kodra E, Ganguly S, et al. DeepSD: Generating high resolution climate change projections through single image super-resolution[C]// Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2017:1663-1672. DOI:10.1145/3097983.3098004

DOI

[19]
Geiss A, Hardin J C. Radar super resolution using a deep convolutional neural network[J]. Journal of Atmospheric and Oceanic Technology, 2020, 37(12):2197-2207. DOI:10.1175/JTECH-D-20-0074.1

DOI

[20]
张涛, 李宝林, 袁烨城, 等. 横断山区降水时空分布数据集(1998-2012)[J]. 全球变化数据学报(中英文), 2019, 3(2):168-174,215-221.

[Zhang T, Li B L, Yuan Y C, et al. Spatio-temporal precipitation Dataset in Hengduan Mountains(1998-2012)[J]. Journal of Global Change Data & Discovery, 2019, 3(2):168-174,215-221.] DOI:10.3974/geodp.2019.02.07

DOI

[21]
高歆, 袁胜元, 李京忠, 等. 面向稀疏降水站点的套合各向异性贝叶斯地统计估计研究[J]. 地球信息科学学报, 2022, 24(8):1445-1458.

DOI

[Gao X, Yuan S Y, Li J Z, et al. Bayesian geostatistical modelling for precipitation data with nested anisotropy measured at sparse reference stations[J]. Journal of Geo-information Science, 2022, 24(8):1445-1458.] DOI:10.12082/dqxxkx.2022.210729

DOI

[22]
Shen H F. Deep learning-based air temperature mapping by fusing remote sensing, station, simulation and socioeconomic data[J]. Remote Sensing of Environment, 2020, 240:111692. DOI:10.1016/j.rse.2020.111692

DOI

[23]
Chen F R, Gao Y Q, Wang Y G, et al. Downscaling satellite-derived daily precipitation products with an integrated framework[J]. International Journal of Climatology, 2019, 39(3):1287-1304. DOI:10.1002/joc.5879

DOI

[24]
Daly C, Neilson R P, Phillips D L. A statistical-topographic model for mapping climatological precipitation over mountainous terrain[J]. Journal of Applied Meteorology, 1994, 33(2):140-158. DOI:10.1175/1520-0450(1994)033<0140:astmfm>2.0.co;2

DOI

[25]
White C J, Tanton T W, Rycroft D W. The impact of climate change on the water resources of the amu darya basin in central Asia[J]. Water Resources Management, 2014, 28(15):5267-5281. DOI:10.1007/s11269-014-0716-x

DOI

[26]
Nezlin N P, Kostianoy A G, Lebedev S A. Interannual variations of the discharge of Amu Darya and Syr Darya estimated from global atmospheric precipitation[J]. Journal of Marine Systems, 2004, 47(1/2/3/4):67-75. DOI:10.1016/j.jmarsys.2003.12.009

DOI

[27]
Salehie O, Ismail T, Shahid S, et al. Ranking of gridded precipitation datasets by merging compromise programming and global performance index: A case study of the Amu Darya basin[J]. Theoretical and Applied Climatology, 2021, 144(3-4):985-99. DOI:10.1007/s00704-021-03 582-4

DOI

[28]
Su Y Y, Li Y P, Liu Y R, et al. An integrated multi-GCMs Bayesian-neural-network hydrological analysis method for quantifying climate change impact on runoff of the Amu Darya River Basin[J]. International Journal of Climatology, 2021, 41(5):3411-3424. DOI:10.1002/joc.7026

DOI

[29]
高胖胖. 阿姆河流域径流变化分析与水资源优化配置[D]. 北京: 华北电力大学(北京), 2021.

[Gao P P. Analysis of runoff variation and optimal allocation of water resources in the amu darya basin[D]. Beijing: North China Electric Power University, 2021.]

[30]
陈桃, 包安明, 郭浩, 等. 中亚跨境流域生态脆弱性评价及其时空特征分析——以阿姆河流域为例[J]. 自然资源学报, 2019, 34(12):2643-2657.

DOI

[Chen T, Bao A M, Guo H, et al. Ecological vulnerability assessment for a transboundary basin in Central Asia and its spatiotemporal characteristics analysis: Taking Amu Darya River Basin as an example[J]. Journal of Natural Resources, 2019, 34(12):2643-2657.]

DOI

[31]
阿也提古丽·斯迪克. 气候变化与人类活动对阿姆河流域水资源及咸海退缩的影响研究[D]. 北京: 中国科学院大学, 2017.

[Sidike A. Impacts of climate change and human activities on water resources of the Amu Darya River Basin and the shrinkage of the Aral Sea[D]. Beijing: University of Chinese Academy of Sciences, 2017.]

[32]
Harris I, Osborn T J, Jones P, et al. Version 4 of the CRU TS monthly high-resolution gridded multivariate climate dataset[J]. Scientific Data, 2020, 7:109. DOI:10.1038/s41597-020-0453-3

DOI PMID

[33]
Huffman G J, Adler R F, Bolvin D T, et al. The TRMM Multi-Satellite Precipitation Analysis (TMPA)[M]. Dordrecht: Springer Netherlands, 2010. DOI:10.1007/978-90-481-2915-7_1

DOI

[34]
Schaaf C, Wang Z. MCD43D62 MODIS/Terra+Aqua BRDF/albedo nadir BRDF-adjusted reflectance band1 daily L3 global 30arcsec CMG[J]. NASA GSFC and MODAPS SIPS-NASA, 2015. DOI:10.5067/MODIS/MCD43D62.006

DOI

[35]
Jarvis A, Reuter H I, Nelson A, et al. Hole- filled SRTM for the globe version 4[J/OL]. CGIAR Consortium for Spatial Information, 2008. http://srtm.csi.cgiar.org/

[36]
McNally A, Arsenault K, Kumar S, et al. A land data assimilation system for sub-Saharan Africa food and water security applications[J]. Scientific Data, 2017, 4:1-19. DOI:10.1038/sdata.2017.12

DOI

[37]
Jaderberg M, Simonyan K, Zisserman A, et al. Spatial transformer networks[C]. Proceedings of the 28th International Conference on Neural Information Processing Systems - Volume 2. New York:ACM, 2015:2017- 2025. DOI:10.5555/2969442.2969465

DOI

[38]
Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial networks[J]. Communications of the ACM, 2020, 63(11):139-144. DOI:10.1145/3422622.

DOI

[39]
Wang T C, Liu M Y, Zhu J Y, et al. High-resolution image synthesis and semantic manipulation with conditional GANs[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition. IEEE, 2018:8798-8807. DOI:10.1109/CVPR.2018.00917

DOI

[40]
Woo S, Park J, Lee J Y, et al. CBAM: convolutional block attention module[M]. Computer Vision-ECCV. Cham: Springer International Publishing, 2018:3-19. DOI:10.1007/978-3-030-01234-2_1

DOI

[41]
叶柏生, 杨大庆, 丁永建, 等. 中国降水观测误差分析及其修正[J]. 地理学报, 2007, 62(1):3-13.

[Ye B S, Yang D Q, Ding Y J, et al. A bias-corrected precipitation climatology for China[J]. Acta Geographica Sinica, 2007, 62(1):3-13.] DOI:10.3321/j.issn:0375-5444.2007.01.001

DOI

[42]
Cheema M J M, Bastiaanssen W G M. Local calibration of remotely sensed rainfall from the TRMM satellite for different periods and spatial scales in the Indus Basin[J]. International Journal of Remote Sensing, 2012, 33(8):2603-2627. DOI:10.1080/01431161.2011.617397

DOI

[43]
Lamichhane G R. Statistical assessment of performance of integrated multi-satellite retrievals for GPM (IMERG) to estimate monthly precipitation[D]. Southern Illinois University at Carbondale, 2019.

[44]
Chen F W, Liu C W. Estimation of the spatial rainfall distribution using Inverse Distance Weighting (IDW) in the middle of Taiwan[J]. Paddy and Water Environment, 2012, 10(3):209-222. DOI:10.1007/s10333-012-0319-1

DOI

[45]
Cui G T, Anderson M, Bales R. Mapping of snow water equivalent by a deep-learning model assimilating snow observations[J]. Journal of Hydrology, 2023, 616:128835. DOI:10.1016/j.jhydrol.2022.128835

DOI

[46]
Omid Z, Banafsheh Z, Mohsen N, et al. Stacking machine learning models versus a locally weighted linear model to generate high-resolution monthly precipitation over a topographically complex area[J]. Atmospheric Research, 2022, 272. DOI:10.1016/j.atmosres.2022.106159

DOI

[47]
Wang W C, Sun L, Cai Y P, et al. Evaluation ofmulti-source precipitation data in a watershed with complex topography based on distributed hydrological modeling[J]. River Research and Applications, 2021, 37(8):1115-1133. DOI:10.1002/rra.3681

DOI

[48]
Zhang H R, Xiao J, Jin Z. Multi-scale image super-resolution via a single extendable deep network[J]. IEEE Journal of Selected Topics in Signal Processing, 2021, 15(2):253-263. DOI:10.1109/jstsp.2020.3045282

DOI

[49]
Wan J, Yin H, Chong A X, et al. Progressive residual networks for image super-resolution[J]. Applied Intelligence, 2020, 50(5):1620-1632. DOI:10.1007/s10489-019-01548-8

DOI

Outlines

/