Orginal Article

Spatial Downscaling of TRMM Precipitation Data Based on GWR Model in Northeast China

  • LIU Xiaochan ,
  • ZHANG Hongyan , * ,
  • ZHAO Jianjun ,
  • GUO Xiaoyi ,
  • ZHANG Zhengxiang ,
  • PIAO Meihua
Expand
  • School of Geographical Science, Northeast Normal University, Changchun 130024, China
*Corresponding author: ZHANG Hongyan, E-mail:

Received date: 2014-09-04

  Request revised date: 2015-06-15

  Online published: 2015-09-07

Copyright

《地球信息科学学报》编辑部 所有

Abstract

The availability of precipitation data with high spatial resolution is critical for several applications, such as hydrology, meteorology and ecology. The Tropical Rainfall Measuring Mission (TRMM) data sets can provide effective precipitation information, but at a coarse resolution (0.25°). Therefore, it is very necessary to improve its resolution. The existing TRMM-downscaling methods tend to use ordinary linear regression (OLS), which is known as a global model. However, it ignores the local characteristics. In this paper, the relationship between TRMM and Normalized Difference Vegetation Index (NDVI) was explored by using a local regression analysis approach that is known as geographically weighted regression (GWR). The relationship was used to construct the precipitation downscaling model, which then produces 1 km downscaled precipitation data. The OLS model and GWR model were tested for the data of Northeast China from 2000 to 2010. The accuracy of the downscaled data was validated by the observed precipitation data from 93 meteorological stations located in the study area. Some conclusions can be drawn from our study: (1) there is a strong correlation between TRMM data and the observation data obtained from meteorological stations (R = 0.9172). Overall, the TRMM precipitation is higher than the observed data at all stations. (2) Two downscaling methods were applied in this study, and the results show that the downscaled precipitation based on GWR model produces better results. It produces better R values and the reduced RMSE. Thus, the GWR model is more suitable for the spatial downscaling of TRMM. (3) The correlation coefficient between the downscaled precipitation based on GWR model and the observed data is ranging between 0.44 and 0.97, and its spatial distribution is disperse. (4) The downscaled precipitation data improves the spatial resolution (from 0.25° to 1 km), which can better reflect the characteristics of the precipitation in the study area. It could provide more accurate and realistic precipitation data for the studies at small scales.

Cite this article

LIU Xiaochan , ZHANG Hongyan , ZHAO Jianjun , GUO Xiaoyi , ZHANG Zhengxiang , PIAO Meihua . Spatial Downscaling of TRMM Precipitation Data Based on GWR Model in Northeast China[J]. Journal of Geo-information Science, 2015 , 17(9) : 1054 -1062 . DOI: 10.3724/SP.J.1047.2015.01055

1 引言

降水是水文、气象及气候等领域研究的重要参数[1-4]。传统的区域降水数据大多是气象观测站点资料数据,借助不同的空间插值方法获取。由于站点的数量、分布位置、地形因素及观测数据连续性的影响,存在以点代面的问题。基于卫星的降水数据具有覆盖面积广、观测较为连续、时间和空间分辨率较高的优势[5]
近几十年来,利用遥感对降水进行探测,已成为空间化降水数据的重要来源[6]。特别是1997年由美国国家宇航局和日本国家空间发展局共同研制的热带测雨卫星(Tropical Rainfall Measuring Mission,TRMM)的成功发射,为与降水有关的研究提供数据支持[5],国内外学者借助其开展了一系列的研究,如精度验证[5-12]、潜热分析[13],应用多样化。相比于其他降水产品而言,如GPCP(Global Precipitation Climatology Project)[14-16]、GSMaP(Global Satellite Mapping of Precipitation)Project[17],TRMM数据的空间分辨率已相对较高。但当用于区域的水文、生态、气候等研究,该分辨率还不能满足需要,有必要对TRMM降水数据进行降尺度研究。
利用降尺度技术实现遥感降水数据的尺度转换,有助于推进区域降水的时空变异特征研究。近年来,关于TRMM降水数据的降尺度研究逐渐成为研究热点。研究学者根据降水与环境变量(如植被、地形)的关系,建立TRMM降水数据与NDVI(Normalized Difference Vegetation Index)或DEM(Digital Elevation Model)的经验方程,获得了较高空间分辨率的降水数据[18-20]
然而,这些研究大多是全局回归模型,从全局的角度对数据进行降尺度,忽略了数据的局部特性。经典统计学理论的最小二乘法(Ordinary Least Squares,OLS)由于具有完备的理论体系和统计推断方法被广泛应用,但在分析前就假定变量间关系具有空间一致性而掩盖了其局部特性[21]。地理加权回归(Geographically Weighted Regression,GWR)模型是传统回归模型的扩展,强调局部特性,回归结果更加可信[22]。基于GWR模型进行降尺度,能对局部细化,使降水估计的空间尺度更精细化,以便揭示地表的空间异质性,对区域水文、水资源管理等具有重要意义。由于目前输出数据的空间分辨率有限,要提高区域气象要素的空间分辨率,计算量大、投入高,为此有必要进行降尺度研究。本文以东北地区为研究区域,采用GWR模型对TRMM数据进行降尺度研究,并与全局OLS回归模型对比,旨在为更高分辨率的降水数据应用于该地区的降水分布研究。

2 研究区特征与数据

(1)本文研究区域为东北地区,其地处欧亚大陆的东岸,属东亚季风气候区,是我国重要的商品粮基地之一。该区气候年际变率大,属气候脆弱带,且降水的局域性和突发性很强[23]。区域降水分布不均匀,总体趋势为从东南向西北递减。研究表明该地区受干旱和暴雨洪涝等气候灾害影响严重。干旱和洪涝与降水有关,因此,对东北地区降水进行研究很有必要[24]。TRMM降水数据受其区域范围的限制,研究区包括辽宁省、吉林省、黑龙江省(除黑龙江北部)和内蒙古自治区东部的部分区域,位于115°05′~135°02′E,38°40′~50°00′N。
(2)本文使用的TRMM数据为TRMM卫星第7版本3级产品(3B43 Version7)的月降水资料,数据来自NASA(http://mirador.gsfc.nasa.gov/),空间分辨率为0.25°×0.25°,时间分辨率为1个月,数据覆盖全球50°S~50°N范围的地区,时段为2000-2010年。地面气象资料来源于中国气象科学数据共享服务网(http://cdc.cma.gov.cn/home.do),考虑资料的完整性,最终选取东北地区93个站点2000-2010年中国地面气候资料日值数据集(图1)。NDVI数据来自NASA(http://reverb.echo.nasa.gov/)的MOD13A3植被指数数据,该数据为月合成数据,空间分辨率为1 km。DEM数据由NASA提供(http://srtm.csi.cgiar.org/SELECTION/inputCoord.asp),空间分辨率为90 m。
Fig. 1 Study area and rain gauge stations

图1 研究区位置及气象站点分布

对数据进行拼接、投影变换、裁剪,得到研究区2000-2010年TRMM月数据、月NDVI数据及DEM数据;将TRMM的月数据进行求和,获得TRMM的年数据;对一年12期的NDVI数据求平均,获取年NDVI数据;利用DEM数据,基于ArcGIS的分析模块提取坡度、坡向数据。

3 GWR模型的降尺度分析

本研究中,采用相关系数R(Correlation Coefficient)、相对误差BIAS和均方根误差RMSE(Root Mean Square Error)指标,对降水数据进行评判。其中,相关系数R表示2个数据之间的线性相关程度;相对误差BIAS反映降尺度数据对实测数据高估或低估的程度;RMSE用来评估误差的整体水平。指标对应的公式如式(1)-(3)所示。
R = i = 1 n x i - x ̅ y i - y ̅ i = 1 n x i - x ̅ 2 i = 1 n y i - y ̅ 2 (1)
RMSE = i = 1 n x i - y i 2 n (2)
BIAS = i = 1 n x i i = 1 n y i - 1 (3)
式中, x i y i 分别对应遥感降水数据和气象站观测数据; x ̅ 为遥感降水平均值; y ̅ 为气象站观测平均值;n为气象站点个数。

3.1 地理加权回归模型(GWR)

GWR模型是1996年由Brunsdon等提出[22],最近被广泛用于空间异质性研究[25-26],其基本思想是变量间的关系,随着空间位置的变化而变化,通过估算研究区内每一给定位置的相关变量与解释变量的参数建立回归模型[27-33]。本研究利用NDVI与TRMM降水数据,建立GWR回归模型(式(4))。
y i = β 0 i u + β 1 i u x 1 i + ε i u (4)
式中, y i 为第i个点的降水量; x 1 i 为第i个点的NDVI值; β 为相应的系数项; u 为某一个空间坐标; ε i 为残差; i = 1 , , n ,表示样本点的个数。当在空间任何位置, β 的值保持不变,则GWR退化为全局回归模型。

3.2 降尺度技术

本研究用GWR模型,通过在不同影像之间建立某一特征量(如NDVI)的函数关系,实现尺度转换,其步骤为:(1)将1 km的NDVI数据重采样成0.25°,建立0.25°TRMM与0.25°NDVI的地理加权回归(GWR)模型,得到常数项、NDVI对应系数及残差结果;(2)将0.25°模型对应的常数项、系数项矢量数据栅格化,并采用最邻近法重采样成1 km;(3)将1 km的NDVI数据与对应的1 km系数相乘,并加上1 km的常数项,得到1 km的模型预测降水值;(4)将0.25°残差值插值成1 km的残差数据;(5)将1 km的模型预测降水值加上1 km的残差数据,最终得到1 km的降尺度降水数据。

3.3 TRMM数据降尺度的GWR模型分析

3.3.1 TRMM数据精度分析
以研究区2000-2010年93个气象站点的年观测数据为自变量,其对应年尺度的TRMM降水数据为因变量,做一元线性回归分析,对东北地区TRMM降水数据的精度进行验证(图2)。经检验,TRMM降水数据与气象站点观测数据之间的相关系数R = 0.9172,决定系数R2 = 0.8413,K = 0.9104(P<0.001)。这说明TRMM降水数据与观测数据之间具有明显的线性相关性与一致性,且TRMM数据的降水量比实测数据降水量偏大。
Fig. 2 Precipitation scatter diagram between TRMM and rain gauges in Northeast China during 2000-2010

图2 2000-2010年东北地区TRMM降水数据与实测降水数据散点图

检验结果表明,TRMM降水数据与观测站实测数据在整体上有较好的精度,但是整体检验掩盖了单个站点数据与对应格网的TRMM数据之间的差异。由于地形、地势、经纬度、海拔等因素的影响,降水在空间上呈现差异性,仅对数据精度进行整体验证还不够。为进一步分析TRMM数据在东北地区的精度,计算93个气象站点2000-2010年的月降水量数据与其对应格网的TRMM降水数据的相关系数。从所有站点相关系数R雷达图可看出(图3),东北地区大部分站点TRMM数据与观测数据之间呈较强的线性相关。
Fig. 3 Radar chart of the correlation coefficient R

图3 相关系数R雷达图

3.3.2 多年平均降水降尺度结果与验证
(1)多年平均降水降尺度结果
将2000-2010年的TRMM降水数据求平均,得到TRMM多年平均降水数据;将对应年份的NDVI数据求平均,得到NDVI多年平均数据。建立0.25°尺度下多年平均TRMM降水与多年平均NDVI的GWR模型(图4(a))。将NDVI对应系数与常数项重采样成1 km,并引入1 km的NDVI数据,获得1 km的GWR模型预测降水数据(图4(b));借助普通克里金插值方法将GWR模型0.25°尺度下的残差插值成1 km的残差数据(图4(c));将1 km的残差数据与1 km的预测降水数据进行求和,即获得1 km的GWR模型多年平均降尺度降水数据(图4(d))。对比原始的0.25°TRMM多年平均降水数据(图4(a))与GWR模型的多年平均降尺度降水数据(图4(d))可发现,二者的降水空间分布趋于一致;原始TRMM降水值在193~1116 mm之间,而GWR模型的降尺度降水值在57~1358 mm之间,后者的值区间略大;在空间分辨率方面,相对于原始的TRMM降水数据,降尺度降水数据有很大的提高,达到1 km。
Fig. 4 TRMM precipitation data, the predictive precipitation, the residual data and the downscaling results

图4 TRMM降水数据、模型预测降水、残差数据及降尺度结果

GWR模型的降尺度降水数据的可靠性,还需进一步进行检验。本研究引入经度、纬度、坡度、坡向、DEM、NDVI 6个因子,以OLS模型构建TRMM降水数据与6个因子数据的一元线性回归模型,并获得1 km的OLS模型的预测降水数据(图4(e))和多年平均降尺度降水数据(图4(f))。分别做原始TRMM数据、OLS的降尺度降水数据、GWR降尺度降水数据与站点数据的线性回归分析(图5),并计算二者的RBIASRMSE 3个评价指标(表1)。
Tab. 1 Validation results of downsacling precipitation

表1 降尺度结果验证

评价指标 TRMM OLS降尺度 GWR降尺度
R 0.9595 0.9049 0.9412
BIAS 0.1240 0.0455 0.0904
RMSE 85.514 83.431 80.283
(2)降水降尺度结果与观测数据的比较
将研究区内93个观测站点的实测数据作为“真实值”对降尺度结果数据进行验证。从验证的结果(表1)来看,相比原始的TRMM数据,2种回归模型多年平均降尺度结果的判定系数R均有所降低,相对误差BIAS均有减小。GWR模型降尺度结果的R指标值为0.9412,更接近于0.9595,且其结果的BIAS值减少了0.0336,RMSE指标值降低了5.231,而传统的回归模型对应的BIAS值减少了0.0785,RMSE指标值降低了2.083。整体来看,相对于全局OLS回归模型,GWR模型的降尺度结果精度更高,可用于获取更高分辨率的降水数据。
Fig. 5 Scatter diagram of the annual mean TRMM, the downscaling precipitation based on OLS and the downscaling precipitation based on GWR versus meteorological station data

图5 多年平均TRMM数据、OLS降尺度数据、GWR降尺度数据与观测数据的散点图

Fig. 6 Downscaling precipitation based on GWR model and OLS model with resolution of 1 km in 2001 and 2010

图6 2001年和2010年GWR模型与OLS模型的降尺度结果

3.3.3 典型年降水降尺度结果与验证
(1)典型年降水降尺度结果
对多年平均降水数据进行降尺度操作,在保证数据准确性的同时,空间分辨率有很大的提高。由于降水存在时间上的不连续性和高度非线性特征,还需对单个典型年份进行降尺度操作。本研究选取2000-2010年中2001年作为干旱年,2010年作为湿润年。其中,11年的降水均值为556.55 mm,2001年为452.08 mm,2010年670.43 mm。采用同样的降尺度方法,对2001年、2010年进行GWR模型、OLS模型降尺度操作,得到2001、2010年1 km的GWR模型、OLS模型降尺度结果(图6)。
图6可看出,典型年份(2001、2010年)的降水量空间分布趋势与多年年均降水十分接近。其中,干旱年份(2001年)中,研究区的东南部降水量减少最明显;而2010年中,研究区的降水量整体提高,且东南部增加最明显。由此可见,东北地区的东南部对降水量变化的反应最敏感。
(2)降水降尺度结果与观测数据的比较
利用研究区2001、2010年93个站点对应的观测数据对降尺度结果进行验证。从表2可看出,2个年份的OLS模型和GWR模型的降尺度结果与原始TRMM数据相比,相关系数均有所减低,且GWR模型的降尺度结果的相关系数更接近。其中,2001年的2种降尺度结果对应的BIAS值降低,RMSE值减少;2010年的GWR模型降尺度结果对应BIAS值降低了0.0297,RMSE值减少了6.618,而OLS模型的BIAS值和RMSE值均有所增多。整体来看,GWR模型更适用于东北地区的降尺度研究。
Tab. 2 Validation results of downsacling precipitation

表2 降尺度结果验证

年份 评价指标 TRMM OLS降尺度 GWR降尺度
2001 R 0.9428 0.8887 0.9187
BIAS 0.1245 0.1048 0.1038
RMSE 86.271 80.495 81.152
2010 R 0.9422 0.9084 0.9400
BIAS 0.0978 0.1004 0.0681
RMSE 131.827 140.287 125.209

3.3.4 降尺度数据相关系数空间分布

上述研究表明,GWR模型可获得更好的降尺度结果。将研究区内93个站点2000-2010年间的观测数据与GWR模型的降尺度结果做一元线性回归分析,计算所有站点降尺度结果与观测数据之间的相关系数,并利用Thiessen多边形对研究区进行剖分,得到相关系数的空间分布(图7)。
Fig. 7 Spatial distribution of R between downscaling precipitation based on GWR model and the observed data

图7 东北地区的GWR模型降尺度结果与观测数据的相关系数空间分布

图7可看出,东北地区GWR模型降尺度结果与观测数据之间的相关系数在0.44-0.97之间,且分布较分散。高值较多的主要分布在研究区的中北部及东南部的部分区域,包括博克图、小二沟、伊春、齐齐哈尔、泰来等站点,主要在黑龙江、辽宁地区;最低值的区域较少,主要包括新巴尔虎左旗、扎兰屯、绥化、哈尔滨4个站点。整体来看,东北地区大多数地区降尺度结果与观测数据的相关系数在0.75以上。

4 结论

本文以GWR模型对TRMM降水数据进行降尺度研究,充分发挥GWR模型在揭示局部特性上的优势,进一步提高TRMM数据的空间分辨率。对东北地区验证发现,研究区2000-2010年的TRMM降水数据与观测数据之间具有明显的线性关系(R = 0.9172),且TRMM降水数据数值略大于观测值。利用TRMM与NDVI数据之间的关系进行降尺度研究,最终获得2000-2010年东北地区1 km的降尺度降水数据,并与全局OLS回归模型进行比较。主要结论如下:
(1)经过对多年平均、2001、2010年数据的OLS模型与GWR模型降尺度操作,并利用93个站点的观测数据,对降尺度结果验证表明,相关系数R指标值均有所降低,且GWR模型降尺度结果的相关系数R与均方根误差RMSE结果更好。降尺度结果能很好地反映研究区内的降水空间分布。从整体看,局部GWR模型比全局OLS回归模型,更适用于东北地区的TRMM降水数据降尺度研究。
(2)东北地区GWR模型的降尺度结果与观测数据之间的相关系数在0.44-0.97之间,且分布较分散。整体来看,东北地区大多数地区降尺度结果与观测数据的相关系数在0.75以上。
(3)经过降尺度的降水数据在空间分辨率上有较大提高(从0.25°到1 km),能更真实地反映研究区的降水特征。通过降尺度转换,降低了降水数值精度,提高了数据空间分辨率,为TRMM数据在小尺度的应用研究奠定基础。

The authors have declared that no competing interests exist.

[1]
Goovaerts P.Geostatistical approaches for incorporating elevation into the spatial interpolation of rainfall[J]. Journal of hydrology, 2000,228(1):113-129.

[2]
Langella G, Basile A, Bonfante A, et al.High-resolution space-time rainfall analysis using integrated ANN inference systems[J]. Journal of hydrology, 2010,387(3):328-342.

[3]
Li M, Shao Q.An improved statistical approach to merge satellite rainfall estimates and raingauge data[J]. Journal of Hydrology, 2010,385(1):51-64.

[4]
Bhattacharya A, Adhikari A, Maitra A.Multi-technique observations on precipitation and other related phenomena during cyclone Aila at a tropical location[J]. International Journal of Remote Sensing, 2013,34(6):1965-1980.

[5]
郝振纯,童凯,张磊磊,等.TRMM降水资料在青藏高原的适用性分析[J].水文,2011,31(5):18-23.

[6]
吕洋,董国涛,杨胜天,等.雅鲁藏布江流域NDVI时空变化及其与降水和高程的关系[J].资源科学,2014,36(4):603-611.

[7]
刘俊峰,陈仁升,韩春坛,等.多卫星遥感降雨数据精度评价[J].水科学进展,2010,21(3):343-348.

[8]
Islam M N, Uyeda H.Use of TRMM in determining the climatic characteristics of rainfall over Bangladesh[J]. Remote Sensing of Environmen, 2007,108(3):264-276.

[9]
Su F, Hong Y, Lettenmaier D P.Evaluation of TRMM Multisatellite Precipitation Analysis (TMPA) and its utility in hydrologic prediction in the La Plata Basin[J]. Journal of Hydrometeorology, 2008,9(4):622-640.

[10]
Huffman G J, Adler R F, Bolvin D T, et al.The TRMM Multisatellite Precipitation Analysis (TMPA): Quasi-global, multiyear, combined-sensor precipitation estimates at fine scales[J]. Journal of Hydrometeorology, 2007,8(1):38-55.

[11]
曾红伟,李丽娟.澜沧江及周边流域TRMM 3B43数据精度检验[J].地理学报,2011,66(7):994-1004.

[12]
李相虎,张奇,邵敏.基于TRMM数据的鄱阳湖流域降水时空分布特征及其精度评价[J].地理科学进展,2012,31(9):1164-1170.

[13]
傅云飞,刘奇,自勇,等.基于TRMM卫星探测的夏季青藏高原降水和潜热分析[J].高原山地气象研究,2008,28(1):8-18.

[14]
Huffman G J, Adler R F, Arkin P, et al.The global precipitation climatology project (GPCP) combined precipitation dataset[J]. Bulletin of the American Meteorological Society, 1997,78(1):5-20.

[15]
Huffman G J, Adler R F, Morrissey M M, et al.Global precipitation at one-degree daily resolution from multisatellite observations[J]. Journal of Hydrometeorology, 2001,2(1):36-50.

[16]
Huffman G J, Adler R F, Bolvin D T, et al.Improving the global precipitation record: GPCP version 2.1[J]. Geophysical Research Letters, 2009,36(17):153-159.

[17]
Kubota T, Shige S, Hashizume H, et al.Global precipitation map using satellite-borne microwave radiometers by the GSMaP Project: Production and validation[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007,45(7):2259-2275.

[18]
Immerzeel W W, Rutten M M, Droogers P.Spatial downscaling of TRMM precipitation using vegetative response on the Iberian Peninsula[J]. Remote Sensing of Environment, 2009,113(2):362-370.

[19]
Jia S, Zhu W, A, et al.A statistical spatial downscaling algorithm of TRMM precipitation based on NDVI and DEM in the Qaidam Basin of China[J]. Remote sensing of Environment, 2011,115(12):3069-3079.

[20]
Duan Z, Bastiaanssen W G M. First results from Version 7 TRMM 3B43 precipitation product in combination with a new downscaling-calibration procedure[J]. Remote Sensing of Environment, 2013,131:1-13.

[21]
魏传华,胡晶,吴喜之.空间自相关地理加权模型的估计[J].数学的实践与认知,2010,40(22):126-134.

[22]
Fotheringham A S, Brunsdon C, Charlton M.Geographically weighted regression[M]. New York: Wiley, 2002.

[23]
汪秀清,陈长胜,张智勇,等.东北地区夏季旱涝的区域特征及水汽异常输送[J].自然灾害学报,2006,15(4):53-58.

[24]
张运福,胡春丽,赵春雨,等.东北地区降水年内分配的不均匀性[J].自然灾害学报,2009,18(2):89-94.

[25]
Brunsdon C, Fotheringham A S, Charlton M E.Geographically weighted regression: A method for exploring spatial nonstationarity[J]. Geographical analysis, 1996,28(4):281-298.

[26]
Propastin P, Kappas M, Erasmi S.Application of geographically weighted regression to investigate the impact of scale on prediction uncertainty by modelling relationship between vegetation and climate[J]. International Journal of Spatial Data Infrastructures Research, 2008,3:73-94.

[27]
姚永慧,张百平.基于MODIS数据的青藏高原气温与增温效应估算[J].地理学报,2013,68(1):95-107.

[28]
邵一希,李满春,陈振杰,等.地理加权回归在区域土地利用格局模拟中的应用——以常州市孟河镇为例[J].地理科学,2010,30(1):92-97.

[29]
吴玉鸣,李建霞.基于地理加权回归模型的省域工业全要素生产率分析[J].经济地理,2006,26(5):748-752.

[30]
吕萍,甄辉.基于GWR模型的北京市住宅用地价格影响因素及其空间规律研究[J].经济地理,2010,30(3):472-478.

[31]
玄海燕,黎锁平,刘树群.区域降水量与经纬度及海拔关系的分析[J].甘肃科学学报,2006,18(4):26-28.

[32]
肖雄,杨长虹,谭柯,等.地理加权回归模型在传染病空间分析中的应用[J].中国卫生统计,2013,30(6):833-836,841.

[33]
周海峰. 基于GIS的手足口病扩散模型与空间分布研究[D].宁波:宁波大学,2010.

Outlines

/