专辑:地理智能

基于地理神经网络加权回归的中国PM2.5浓度空间分布估算方法

  • 杜震洪 , 1, 2, * ,
  • 吴森森 1, 2 ,
  • 王中一 1 ,
  • 汪愿愿 1, 2 ,
  • 张丰 1, 2 ,
  • 刘仁义 1, 2
展开
  • 1. 浙江大学地球科学学院,地理与空间信息研究所,杭州 310027
  • 2. 浙江省资源与环境信息系统重点实验室,杭州 310028
* 杜震洪(1981— ),男,浙江衢州人,博士,教授,主要从事遥感与地理信息系统,时空大数据与人工智能等研究。E-mail:

收稿日期: 2019-09-22

  要求修回日期: 2019-10-27

  网络出版日期: 2020-04-08

基金资助

国家自然科学基金项目(41871287)

国家自然科学基金项目(41701436)

国家重点研发计划项目(2018YFB0505000)

中央高校基本科研业务费专项资金(2019QNA3013)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

Estimating Ground-Level PM2.5 Concentrations Across China Using Geographically Neural Network Weighted Regression

  • DU Zhenhong , 1, 2, * ,
  • WU Sensen 1, 2 ,
  • WANG Zhongyi 1 ,
  • WANG Yuanyuan 1, 2 ,
  • ZHANG Feng 1, 2 ,
  • LIU Renyi 1, 2
Expand
  • 1. School of Earth Sciences, Zhejiang University, Hangzhou 310027, China
  • 2. Zhejiang Provincial Key Laboratory of Geographic Information Science, Hangzhou 310028, China
* DU Zhenhong, E-mail:

Received date: 2019-09-22

  Request revised date: 2019-10-27

  Online published: 2020-04-08

Supported by

National Natural Science Foundation of China(41871287)

National Natural Science Foundation of China(41701436)

National Key Research and Development Program of China(2018YFB0505000)

Fundamental Research Funds for the Central Universities(2019QNA3013)

Copyright

Copyright reserved © 2020

摘要

中国空气污染问题日益严重,为获得连续的PM2.5浓度空间分布,现有研究建立了多种基于统计回归的PM2.5估算模型。然而,由于PM2.5回归关系显著的空间非平稳性和复杂的非线性特征,如何实现高精度、高合理性的PM2.5浓度空间大面估计仍然面临挑战,尤其在地形变化复杂、覆盖范围广阔的中国地区更为突出。本文引入了一种将普通线性回归(OLR)和神经网络结合的地理神经网络加权回归(GNNWR)模型,通过集成遥感数据、气象数据和地理信息数据建立了基于GNNWR的PM2.5浓度空间估算方法。文章以中国2017年PM2.5年平均浓度估算为例,开展了该模型与OLR、地理加权回归(GWR)的比较实验。实验结果表明,基于GNNWR的PM2.浓度估算性能指标均明显优于OLR和GWR,且预测精度显著高于GWR。此外,GNNWR获得的PM2.5浓度空间分布也更为合理,较为细致地刻画了中国地区PM2.5浓度的局部空间变化和细节层次。

本文引用格式

杜震洪 , 吴森森 , 王中一 , 汪愿愿 , 张丰 , 刘仁义 . 基于地理神经网络加权回归的中国PM2.5浓度空间分布估算方法[J]. 地球信息科学学报, 2020 , 22(1) : 122 -135 . DOI: 10.12082/dqxxkx.2020.190533

Abstract

China is becoming one of the most air-polluted countries and is experiencing severe PM2.5 pollution. To acquire spatially continuous PM2.5 estimates, numerous statistical methods have been developed through the integration of ground-level measurements and satellite-based observations. The estimation of PM2.5 concentrations in China is characterized by significant spatial nonstationarity and complex nonlinearity due to the complicated terrain variability and wide geographical scope. Mapping the PM2.5 distributions across China with high accuracy and reasonable details is still challenging. Superior satellite-based PM2.5 estimation models need to be developed. Taking advantage of a newly proposed Geographically Neural Network Weighted Regression (GNNWR) model that simultaneously accounts for spatial nonstationarity and complex nonlinearity, we developed a satellite-based GNNWR model to obtain spatially continuous PM2.5 estimates in China. To comprehensively assess the predictive power of the GNNWR model, the widely used Ordinary Linear Regression (OLR) and Geographically Weighted Regression (GWR) models were also carried out for performance comparison. Experimental results demonstrated that the GNNWR model performed considerably better than the OLR and GWR models in terms of multiple statistical indicators, including coefficient of determination (R 2), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), and Mean Absolute Percentage Error (MAPE). Most notably, the fitting accuracy of GNNWR was slightly better than GWR, but its prediction ability was much superior to GWR since the predictive R 2of GWR was significantly improved from 0.683 to 0.831 and the RMSE value was considerably reduced from 9.359 to 6.837. Moreover, the mapped PM2.5 distributions derived from the GNNWR model presented more reasonable and finer details at a higher accuracy than the other models. Although the spatial trends estimated by GWR and GNNWR models were quite consistent, the estimates of the GNNWR model were more accurate and reasonable since its values were much closer to the ground monitoring observations than those of the GWR model, especially for areas with high PM2.5 concentrations, such as Hebei Province and southern Shaanxi Province. In addition, thanks to the excellent learning ability of the neural network, the spatial variations in GNNWR estimates were more sophisticated and displayed a richer hierarchical structure of local changes than that of GWR estimates, which better described the varying details of the PM2.5 across China. In summary, the GNNWR model is a reliable method to effectively estimate PM2.5 concentrations and can also be used to model various air pollution parameters.

1 引言

中国作为世界上最大的发展中国家,伴随着工业化和城市化的不断推进,空气质量问题日益严重。生态环境部发布的《2017中国生态环境状况公报》[1]指出,全国338个地级及以上城市中239个城市的环境空气质量超标,占比超过70%。空气质量问题已严重影响人们的日常出行与身体健康,制约着经济的可持续发展,成为了公众及政府部门的关注热点。
PM2.5是指在空气动力学领域中直径不大于2.5微米的可吸入颗粒物,是空气质量评价的主要指标之一[2]。全面掌握PM2.5浓度的空间分布规律,表征大气污染的空间过程和环境行为,对于支撑大气污染监测预警与综合治理、保护人类健康与社会可持续发展,具有重大的现实意义和指导价值。截至2017年底,中国环境监测总站已建成超过1400个地面空气质量监测站点,并对外发布包括PM2.5在内的每小时空气质量监测数据,提供了高精度、高可靠的实时监测结果。然而,由于地面监测站点空间分布不均、覆盖程度不高,现有研究难以对其监测数据进行有效地时空分析与深度挖掘[3,4,5]。与地面监测不同,基于卫星的遥感观测可获取高覆盖的大气环境空间数据集,例如大气气溶胶光学厚度(Aerosol Optical Depth,AOD)数据。大量研究表明,AOD与PM2.5浓度具有较强的相关性[6,7]。研究PM2.5浓度与基于遥感反演的AOD等相关因子之间的空间回归关系,能为获得整个研究区域的PM2.5浓度分布提供有效解决方案。
诸多学者建立了统计回归模型来表征PM2.5和AOD等因子的内在联系,并通过将地面监测和遥感观测数据进行结合获得了与传统模拟方法相当或更高精度的PM2.5浓度空间分布。例如,Wang和Christopher[8]采用普通线性回归模型建立了美国阿拉巴马州杰斐逊县的MODIS AOD数据与PM2.5浓度的相关关系,结果表明二者日均尺度的线性相关系数可达到0.7。考虑到PM2.5浓度的复杂影响效应,一些学者逐渐将气象要素等影响因子纳入回归模型[9,10,11]。例如,Liu等[9]利用AOD、季节因子、相对湿度等因子构建了广义线性模型对美国东部地区PM2.5浓度进行空间估算,较大提升了PM2.5浓度的反演精度。李啸天等[10]基于AOD数据、气象数 据和植被覆盖数据,采用普通线性回归(Ordinary Linear Regression,OLR)模型进行了江苏省PM2.5浓度的反演,其结果能较好地揭示PM2.5浓度的时空分布规律。
顾及到PM2.5与AOD等因子关系的固有空间异质特征,许多学者引入了地理加权回归(Geographically Weighted Regression,GWR)模型[12,13],来细化表征PM2.5浓度的局部空间变化,并获得了比全局回归模型更为合理的空间分布结果[14,15,16,17,18,19,20,21]。然而,GWR模型通常只能刻画较为简单的非线性空间关系[22],而PM2.5空间估算则逐渐被认为是一种更为复杂的多变量非线性问题[23,24]。由此,许多学者引入了以神经网络为代表的人工智能方法,利用其对非线性关系的超强拟合能力,实现了PM2.5浓度更高精度的空间估算[22,23,24,25,26,27,28,29]。虽然神经网络模型的估算性能通常比GWR模型更为优秀,但由于这些模型忽略了PM2.5回归关系的固有空间特性,其获得的空间分布存在一定不合理性,并且构建的回归关系在空间上难以解释。为获得具有高精度和高合理性的PM2.5浓度空间分布,还需进一步研究更为有效的PM2.5空间估算模型。此外,由于中国区域地形变化复杂、覆盖范围广阔,PM2.5空间关系具有更为显著的空间异质性和复杂非线性[22,23]。如何获取中国地区高精度PM2.5浓度的合理空间分布依然面临着严峻挑战。
近期,基于GWR的地理加权思想,吴森森[30]将OLR和神经网络模型结合提出了一种地理神经网络加权回归(Geographically Neural Network Weighted Regression,GNNWR)模型。该模型通过利用神经网络的学习能力,能够处理回归关系的空间异质性和复杂非线性特征,比OLR、GWR等模型具有更好的拟合精度和更优的预测性能,并在近岸海域生态环境建模中表现出了优越的解释能力。理论上,GNNWR模型具有解决众多领域复杂空间关系的潜在可能,可为提升PM2.5浓度空间估算精度提供新的解决思路,但其对PM2.5与AOD等因子空间关系的表征能力还有待验证。
为此,论文旨在建立一种基于GNNWR的PM2.5浓度空间估算模型,实现PM2.5回归关系中空间异质与非线性特征的精准拟合,进而获得中国高精度、高合理性的PM2.5浓度空间分布,为解释中国PM2.5浓度空间分布规律,制定空气污染治理意见提供借鉴与参考依据。

2 研究区概况、数据源与研究方法

2.1 研究区域

针对中国PM2.5污染较为严重的现状,本文选取中国PM2.5浓度的空间估算为研究内容,研究区域范围为中国地区。研究区域中共设有1431个有效监测站点,在空间上呈现出东多西少的特点,在西藏、青海、新疆等地站点较少。其中,所有站位以70%、15%和15%的比例随机划分为训练集、验证集和测试集,其空间分布如图1所示。
图1 中国2017年PM2.5监测站点空间分布及数据集划分

注:该图基于自然资源部标准地图服务网站下载的审图号GS(2019)1697号的标准地图制作,底图无修改。

Fig. 1 Spatial distribution of the PM2.5 monitoring stations of China in 2017 and the spatial partitions of the training, validation, and testing datasets

2.2 实验数据

许多研究表明融合气象条件、地表高程等因子能进一步提高PM2.5空间估算精度。文章在选取AOD数据作为辅助因子的基础上,进一步增加了温度(TEMP)、降水量(TP)、风速(WS)、风向(WD)等气象因子以及地表高程(DEM)因子作为模型的自变量输入,研究时间尺度为2017年平均。实验数据情况如表1所示,主要包含数据类型、数据名称、变量名称、时间分辨率、空间分辨率、数据来源等信息。
表1 实验数据信息与来源

Tab. 1 Data sources and description

数据类型 数据名称 变量名称 时间分辨率 空间分辨率 数据来源
站点 PM2.5监测站点 PM2.5 h - 中国国家气象局
遥感 气溶胶 AOD d 3 km、10 km LAADS
气象 2 m温度 TEMP h 0.5° ERA5 hourly data
降水量 TP h 0.5° ERA5 hourly data
10 m风速 WS h 0.5° ERA5 hourly data
10 m风向 WD h 0.5° ERA5 hourly data
地理 地形 DEM - 1弧分 NOAA
(1)PM2.5监测站点数据。2017年1月1日至2017年12月31日的每小时PM2.5浓度观测值来自中国环境监测总站[31]。PM2.5浓度采用锥形元件振荡微量天平或β衰减法测量,校准和质量控制符合国家标准GB3095-2012。PM2.5数据按照年尺度进行平均。
(2)气溶胶数据。气溶胶(AOD)数据来自LAADS网站[32],包括Terra和Aqua两种采用暗像元法反演的3 km分辨率气溶胶数据产品(MOD04_3K和MYD04_3k),以及采用深蓝算法反演的10 km分辨率气溶胶数据产品(MOD04_L2和MYD04_L2)。在文章中,3 km分辨率AOD产品是PM2.5估算的主要数据来源。当3 km分辨率数据缺失时,则尽可能采用10 km分辨率数据进行重采样替代。为保证AOD数据的可靠性,本文将一年中AOD数值缺失天数超过20%的区域进行剔除,即采用无值表示。
(3)DEM数据。DEM数据来自NOAA的ETOPO1全球地表高程模型[33],分辨率为1弧分。
(4)温度、降水量、风速、风向数据。来自于ECMWF全球气候再分析模式ERA5的数据产品[34],提供0.5度分辨率的小时级格网数据。
基于以上数据,论文旨在获得3 km×3 km空间分辨率的年平均PM2.5浓度估算。然而,由于上述数据来源不一,导致数据格式不统一、投影信息不一致、空间分辨率不相同的问题。文章对原始数据进行了抽取整理,统一转为同一投影坐标系(WGS_1984_UTM_Zone_48N),以 3 km 格网为空间分辨率,以年平均为时间分辨率,进行数据匹配和重采样,采用空间连接方法将各项数据进行整合至相同格网单元,形成了以规格网格为单元的自变量组。数据预处理过程如图2所示。
图2 数据预处理流程

Fig. 2 Pre-processing of the experimental dataset

2.3 研究方法

2.3.1 地理神经网络加权回归
基于类似于GWR的地理加权思想,GNNWR模型认为回归关系的空间差异性可视为空间非平稳性在不同位置对“OLR回归关系”的波动水平变化。因此,在本文PM2.5浓度空间估算实验中,GNNWR模型结构定义如下:
P M 2.5 i = w 0 u i , v i × β 0 + w 1 u i , v i × β 1 × AO D i + w 2 u i , v i × β 2 × DE M i + w 3 u i , v i × β 3 × TEM P i + w 4 u i , v i × β 4 × T P i + w 5 u i , v i × β 5 × W S i + w 6 u i , v i × β 6 × W D i + ε i ( i = 1,2 , , n )
式中: u i , v i 是第 i 个样本点的空间坐标, β = ( β 0 , β 1 , , β 6 ) 是OLR模型的回归系数,反映了整个区域PM2.5回归关系的平均水平。OLR系数的估计矩阵表示如下:
β ˆ = X T X - 1 X T P M 2.5
其中,
P M 2.5 = P M 2.5 1 P M 2.5 2 P M 2.5 n , X = 1 AO D 1 DE M 1 W D 1 1 AO D 2 DE M 2 W D 2 1 AO D n DE M n W D n n × 7
于是,将OLR估计 β ˆ k 代入式(1),可得 PM ˆ 2.5 i 为:
PM ˆ 2.5 i = k = 0 6 w k u i , v i × β ˆ k OLR × x ik = x i T W u i , v i X T X - 1 X T P M 2.5
式中: W u i , v i 1 + p × 1 + p 的权重对角矩阵,即:
W u i , v i = w 0 u i , v i 0 0 0 0 w 1 u i , v i 0 0 0 0 0 0 0 0 w p u i , v i
为准确拟合空间距离与空间权重的复杂关系,GNNWR设计了一种空间加权神经网络(SWNN)实现权重核函数的神经网络表达。具体而言,SWNN以待估计点与所有建模样本点的空间距离作为输入层,空间权重矩阵作为输出层,并根据建模需要选取适当的隐藏层数量。估计点 i 的空间权重计算如下:
W i = W u i , v i = SWNN d i 1 s , d i 2 s , , d in s T
式中: d i 1 s , d i 2 s , , d in s 是从点 i 到样本集的空间距离。于是,文章基于GNNWR的PM2.5浓度空间估算模型定义如图3所示。
图3 基于GNNWR的PM2.5浓度空间估算模型定义

Fig. 3 Definition of the GNNWR model for PM2.5 estimation

在应用GWR和GNNWR等模型时,通常需要通过诊断分析检验所拟合的过程是否具有显著的空间非平稳性。论文采用由Leung等[35]和吴森森[30]提出的一种基于残差平方和(RSS)及其近似分布的零假设检验方法进行GNNWR和GWR建模结果的显著性检验,表示如下:
F 1 = RS S GNNWRorGWR / δ 1 RS S OLR / ( n - p - 1 )
F 1 的分布可近似为 F 分布,分子的自由度为 δ 1 2 δ 2 , δ i = tr I - S T I - S i , i = 1,2 ,分母的自由度为 n - p - 1 。给定一个显著性水平 α ,如果 F 1 < F 1 - α ( δ 1 2 δ 2 , n - p - 1 ) ,则可得出拟合的回归关系具有显著的空间非平稳性,否则空间非平稳性不显著。
此外,在构建最终模型之后,还应进一步检验每个自变量回归系数是否也具有显著的非平稳性。根据Leung等[34]的理论,文章基于第k个参数 β ik ( i = 1,2 , , n ) 估计值的样本方差 V k 2 构建统计检验量:
F 2 ( k ) = V k 2 / γ 1 σ ˆ 2
F 2 ( k ) 的分布也可以近似为 F 分布,分子的自由度为 γ 1 2 γ 2 , γ i = tr 1 n B T I - 1 n J B i , i = 1,2 ,分母的自由度为 δ 1 2 / δ 2 。其中,B表示帽子矩阵与单位列向量的乘积;J表示所有值均为1的矩阵,具体计算方式可以参考Leung等的方法[35]。那么给定一个显著性水平 α ,如果 F 2 > F α ( γ 1 2 / γ 2 , δ 1 2 δ 2 ) ,则指定自变量在空间上具有显著非平稳性。
2.3.2 地理加权回归
为充分评估GNNWR的建模性能,本文采用GWR模型进行对比分析,其结构定义如下:
P M 2.5 i = β 0 u i , v i + β 1 u i , v i × AO D i + β 2 u i , v i × DE M i + β 3 u i , v i × TEM P i + β 4 u i , v i × T P i + β 5 u i , v i × W S i + β 6 u i , v i × W D i + ε i ( i = 1,2 , , n )
式中: β k u i , v i 是样本点 i 的第 k 个自变量回归系数,与空间位置 u i , v i 有关,其估计 β ˆ u i , v i 表示如下:
β ˆ ( u i , v i ) = ( X T W ( u i , v i ) X ) - 1 X T W ( u i , v i ) P M 2.5
式中: W u i , v i n×n的空间权重矩阵,其对角元素表示地理权重,非对角元素均为零值。GWR的权重矩阵通常由权重核函数计算所得,每种核函数根据带宽类型分为固定型和适应型。例如,固定型的高斯核函数表示如下:
w ij = exp - d ij s 2 b 2
式中: b 称为带宽,是表征权重与距离 d ij s 衰减关系的参数。当样本分布过于密集或稀疏时,通常构造适应型核函数来保证足够样本数量进行局部建模[11]。例如,适应型的bi-square核函数的表达如下:
w ij = 1 - d ij s b i 2 2 d ij s < b i 0 其他
式中: b i 表示样本 i 到第 q 个邻近样本的距离。因而适应型核函数的待估计参数 q
2.3.3 模型性能检验指标
论文采用如下检验指标评价模型性能:决定系数( R 2 )、均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分误差(MAPE),和校正的Akaike信息标准(AICc)。各评价指标的公式如下:
R 2 = 1 - i = 1 n y i - y ˆ i 2 i = 1 n y i - y ̅ i 2
RMSE = i = 1 n y i - y ˆ i 2 n
MAE = i = 1 n y i - y ˆ i n
MAPE = 1 n i = 1 n y i - y ˆ i y i × 100 %
AI C c = n lo g e σ ˆ 2 + n lo g e 2 π + n n + tr S n - 2 - tr S
式中: y ̅ 表示观测值的平均值; σ ˆ 2 是模型的均方误差。

2.4 模型设计与实现

在模型设计方面,本文选取GWR和GNNWR进行比较,并将OLR作为基准模型。其中OLR、GWR基于Matlab 2013a构建,GNNWR则采用TensorFlow 1.5.0和Python 3.6实现。为充分比较GWR和GNNWR的模型性能,文章选取了常用的固定型(Fixed)高斯(Gaussian)函数和适应型(Adaptive)bi-square函数进行GWR的空间权重解算;在优化准则选取方面,选取最为常用的AICc准则法,GWR模型设置如表2所示。
表2 GWR模型设置

Tab. 2 Settings of GWR models

模型
名称
带宽优化
准则
核函数
类型 结构
GWR-AFG AICc 固定型 Gaussian
GWR-AAB AICc 适应型 Bi-square
为提高GNNWR模型空间加权神经网络的优化效率与求解能力,论文设计了如图4所示的神经网络架构和实现策略。空间加权神经网络各层之间均采用全连接网络,并运用Srivastava等[36]提出的Dropout技术提高模型泛化能力。另外,每个隐藏层均使用He等[37]提出的参数初始化方法和参数整流线性单元(PReLU)激活函数以提高模型优化效率。同时,为了减少内部协变量转变问题的影响,隐含层还引入批归一化(Batch Normalization)技术进一步提高GNNWR模型的计算能力[38]。综合考虑输入层和输出层的神经元数量,文章采用5层神经网络结构,包含1个输入层、3个隐含层、1个输出层,神经元个数分别设置为[1004,512,256,128,7],初始学习率设为0.2,epoch最大迭代数为20 000,批处理大小为64,Dropout层的丢失比例为0.2,具体设置如表3所示。
图4 空间加权神经网络结构设计

Fig. 4 Structure design of the spatial weighted neural network

表3 GNNWR模型网络架构与超参数设置

Tab. 3 Settings of architectures and hyper-parameters for the GNNWR model

输入层 隐含层1 隐含层2 隐含层3 输出层
1004 512 256 128 7
学习率 epoch最大值 批处理大小 Dropout
0.2 20 000 64 0.8
GNNWR模型的训练和验证过程如图5所示。首先,数据集被随机划分为训练集、验证集和测试集3个部分。为保证模型构建的鲁棒性和可靠性,数据随机划分还应使3个数据子集在空间分布上均能较好的覆盖整个研究区域,进而降低因样本选择差异而导致的估算偏差。需要注意的是,表示平均关系的OLR回归系数由训练集计算所得。在模型训练中,训练集主要用于优化SWNN的网络权值和偏差值,验证集则在每个训练周期后用于判断模型是否过拟合。当训练过程完成后,再使用测试集评估模型的预测能力。因此,验证集和测试集不参与模型网络的训练过程。
图5 GNNWR模型训练与验证过程

Fig. 5 Training and validation procedures of the GNNWR model

论文采用小批量随机梯度下降算法进行网络训练,均方误差(MSE)作为GNNWR模型的训练损失函数,验证集的MSE作为过拟合评价指标。如果过拟合指标呈连续上升或持平趋势,并超过预先设定的容忍值,则认为模型过拟合,即停止训练。图6为GNNWR性能指标的迭代变化情况。由图可知,训练集的MSER2总体上不断优化,表明模型对训练集的拟合精度持续提升。然而,验证集的MSE值在持续下降了13 176个epoch后转而持续上升或持平超过了2000次连续迭代,表明GNNWR模型已出现过拟合问题。因而,GNNWR在epoch等于13 176时达到最优。
图6 GNNWR模型训练集和验证集的性能变化

Fig. 6 Performance variations for the training and validation datasets of the GNNWR model

2.5 实验结果

2.5.1 相关分析与描述统计2017年中国年平均PM2.5与各自变量因子的相关性分析与描述性统计结果如表4所示。由表可知AODDEM、温度、降水量、风速、风向等自变量参数与PM2.5之间均具有较强的相关性,显著性水平达到了0.001。其中,AOD表现出与PM2.5最强的相关性,相关系数达到了0.564。另外,AOD和温度对PM2.5呈现出正向影响,DEM、降水量、风速和风向则对PM2.5产生负向作用。从描述性统计结果来看,2017年地面PM2.5年平均浓度波动范围为8.34至103.89 μg/m3,均值为46.07 μg/m3,标准差为15.56 μg/m3。各个自变量参数总体上均表现出一定的空间分异性,例如AOD年平均值的空间分布范围为0.07至1.14,空间平均水平在0.54左右;DEM具有最大方差,较为真实地反映了我国地势差异较大的空间特征。
表4 2017年中国年平均PM2.5与自变量因子的相关性分析与描述性统计分析

Tab. 4 Exploratory analysis and descriptive statistics of the experimental dataset across China in 2017

变量 PM2.5/(μg/m3) AOD DEM/m 温度/K 降水量/m 风速/(m/s) 风向/°
相关系数 - 0.564 -0.345 0.135 -0.234 -0.373 -0.461
显著性水平 - 0.001 0.001 0.001 0.001 0.001 0.001
方差膨胀因子 - 3.005 1.636 4.639 2.107 2.357 4.184
平均值 46.07 0.540 393.460 288.000 8.95E-05 7.080 147.990
标准差 15.56 0.180 658.460 5.170 4.82E-05 0.940 43.150
最小值 8.34 0.070 -5.250 271.810 1.06E-06 4.430 80.110
最大值 103.89 1.140 4539.960 297.720 2.34E-04 11.500 236.040
2.5.2 PM2.5浓度空间估算性能
PM2.5浓度空间估算性能及其回归关系的建模水平主要通过训练集的拟合精度以及测试集的预测效果两方面进行综合评价。OLR、GWR和GNNWR模型建模结果如表5所示,评价指标主要包括决定系数(R2)、均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、AICc、F1统计量和显著性检验水平等。
表5 OLR,GWR和GNNWR模型的PM2.5拟合和预测结果

Tab. 5 Fitting and prediction performances of the PM2.5 estimates for the OLR, GWR, and GNNWR models

模型 训练集(拟合精度) 测试集(预测精度)
R2 RMSE MAE MAPE/% AICc F1 p-value R2 RMSE MAE MAPE/%
OLR 0.517 10.578 8.132 20.2 7579.202 - - 0.477 12.023 8.838 19.7
GWR-AFG 0.759 7.478 5.797 14.5 6999.491 0.538 0.010 0.683 9.359 6.963 16.1
GWR-AAB 0.898 4.860 3.478 8.7 6673.537 0.297 0.010 0.675 9.484 5.423 12.6
GNNWR 0.914 4.452 3.235 7.9 5833.002 0.137 0.010 0.831 6.837 4.688 11.0
就各模型对于训练集的拟合精度而言,不难看出,OLR模型表现最差,训练集的拟合R2仅为0.517,远低于GWR和GNNWR模型,并且RMSEMAEMAPE等指标也均为最大。这说明由于PM2.5回归关系较强的空间非平稳性,导致OLR难以有效拟合其内在联系。比较2个GWR模型的拟合结果,发现两者表现出了一定的性能差异,虽然GWR-AFG的R2从OLR的0.517显著提升到了0.759,但GWR-AAB则进一步将其提升到0.898,RMSE指标降幅甚至超过了50%,取得了较为优异的拟合效果。关于GWR-AFG和GWR-AAB两者性能差异的潜在原因,我们分析认为很可能是由于监测站点分布的空间不均匀性,导致固定型核函数进行局部建模时存在拟合不充分的问题[39]。此外,GWR和GNNWR模型的F1检验结果表明显著性检验水平均达到了0.01,进一步证明了PM2.5回归关系具有显著的空间异质性。值得注意的是,GNNWR模型充分利用神经网络的非线性学习能力,拟合性能稍优于GWR-AAB模型,R2从0.898提升到0.914,RMSEAICc分别从4.860 μg / m 3 和6673.537降至4.452 μg / m 3 和5833.002。
从测试集的预测效果来看,预测性能在趋势上与训练集拟合结果较为一致,但预测精度相较于拟合精度均稍有下降。OLR模型预测结果与拟合结果较为接近,预测R2为0.48,依然是所有模型中最差的。值得注意的是,虽然GWR-AAB模型的拟合精度要明显优于GWR-AFG模型,但是其预测效果却与GWR-AFG相差无几,甚至在R2RMSE指标方面还处于劣势,这表明GWR-AAB可能存在过拟合问题。值得一提的是,GNNWR模型的拟合精度虽然仅稍优于GWR模型,但其预测能力要远高于GWR模型,其R2从GWR-AFG的0.683显著提升至0.831,RMSE从9.359降低至6.837。这说明GNNWR模型利用优异的非线性拟合能力,较好地捕捉到PM2.5回归关系的复杂空间异质特征,也表明空间加权神经网络比传统权重核函数具有更优越的空间非平稳权重计算能力。
2.5.3 PM2.5回归关系空间非平稳性诊断
GNNWR、GWR和OLR模型的建模性能比较以及表5的F1检验结果,表明PM2.5浓度与AODDEM、温度、降水量、风速、风向等因子的回归关系总体上具有显著的空间非平稳性。下面进一步分析各自变量回归系数是否均具有显著的空间变化,本文对GWR和GNNWR模型自变量系数进行了F2检验,结果如表6所示。从F2检验结果可以看出,GWR和GNNWR模型的每个自变量的显著性水平均达到了0.001,充分说明各自变量因子都具有显著的空间非平稳特性。我们还观察到GWR模型的F2检验值明显大于GNNWR。结合之前的分析结果,我们认为GWR模型可能过高估计了各个自变量的空间非平稳变化,也正因如此导致了其在PM2.5浓度预测时表现较差。
表6 GNNWR模型自变量回归系数的空间非平稳性检验

Tab. 6 Spatial nonstationarity diagnosis of each variable in the GNNWR model

变量 GWR-AFG GWR-AAB GNNWR
F2 p-value F2 p-value F2 p-value
常量项 2407.9 0.001 1269.1 0.001 590.5 0.001
AOD 1379.7 0.001 1199.4 0.001 243.7 0.001
DEM 1983.9 0.001 1272.2 0.001 146.7 0.001
温度 3783.7 0.001 1229.6 0.001 127.7 0.001
降水量 1237.4 0.001 1170.1 0.001 214.7 0.001
风速 1626.0 0.001 1016.2 0.001 159.0 0.001
风向 2379.8 0.001 1081.6 0.001 73.6 0.001

3 PM2.5浓度空间估算效果分析

3.1 2017年PM2.5年平均浓度空间分布

为进一步分析各模型PM2.5浓度空间估算的合理性及表现差异,本文利用各模型建立的PM2.5回归关系以及空间连续的自变量数据集,分别获得了各模型2017年中国的PM2.5年平均浓度空间分布,如图7所示。其中GWR采用估算性能更优的GWR-AAB为代表。另外,由于AOD数据在新疆、内蒙古等地存在数据缺失情况,导致这些地区难以获得空间连续的PM2.5浓度估算分布,空缺部分以白色表示。
图7 2017年中国PM2.5年平均浓度空间估算结果

注:该图基于自然资源部标准地图服务网站下载的审图号GS(2019)1697号的标准地图制作,底图无修改。

Fig. 7 Estimates of the annual mean PM2.5 across China in 2017

图7中可以看出,基于OLR、GWR、GNNWR 3个模型的PM2.5浓度估算结果整体上空间分布趋势较为一致,与实际监测趋势相符。其中,2017年中国PM2.5浓度高值区域主要分布在华北平原、长江中下游平原,其中又以河北省、河南省北部、山东省西部最为严重,平均浓度在80 μg / m 3 以上。四川盆地、关中平原是另2个PM2.5浓度较高的地区,平均浓度达到70 μg / m 3 以上。此外,GWR和GNNWR模型的估算结果中在新疆、西藏等地也聚集了相当高的PM2.5浓度。总体上,海南、台湾、云南以及内蒙古自治区北部是我国PM2.5浓度较低的地区,2017年年均PM2.5浓度在30 μg / m 3 以下。

3.2 PM2.5浓度空间估算效果比较

通过比较图7中PM2.5浓度实测值与各模型估算值的空间分布,我们可以观察到由于缺乏对空间异质性的考虑,OLR估计值表现出空间均匀化趋势,导致高值低估和低值高估的现象较为严重,特别在华北平原和新疆省等2个高值区域表现尤为明显,难以有效反映PM2.5浓度的实际空间变化规律。从图中易知,GWR和GNNWR模型的估计值与PM2.5实测值较为接近,且空间变化趋势基本一致,呈现出较为合理的PM2.5浓度空间分布格局。进一步观察,可以看到GNNWR的估算值更为准确,比GWR更接近地面监测值,特别是在京津冀、河北、陕西等高值地区。
为进一步比较GWR和GNNWR的PM2.5浓度估算空间分布的细致差异,本文将2017年PM2.5重度污染地区进行了放大比较,如图8所示。通过将实测点与模型估计值进行叠加显示,我们可以明显看出GNNWR模型的估算结果与实际值更为贴合。虽然GWR模型也较好拟合了空间变化趋势,但其对河北省和陕西省南部等地的高值点无法准确估算,高值低估的现象依然明显。此外,利用神经网络的学习能力,GNNWR估算结果的空间变化更为细致,表现出比GWR模型更为丰富的局部变化和层次信息,更好地刻画了PM2.5浓度的空间细节变化。
图8 GWR和GNNWR模型PM2.5浓度空间估算效果局部细节比较

注:该图基于自然资源部标准地图服务网站下载的审图号GS(2019)1697号的标准地图制作,底图无修改。

Fig. 8 Details comparison of the annual mean PM2.5 estimates between the GWR and GNNWR models

3.3 PM2.5浓度空间估算误差比较

为更好地评估OLR、GWR和GNNWR模型的PM2.5浓度估算效果以及分析其估计误差的空间分布规律,各模型估计值绝对误差的空间分布如图9所示,其中训练集、验证集和测试集采用不同颜色表示,绝对误差大小与形状大小成正比。从图中我们可以看到,OLR模型的估计误差总体最大,与前面的分析结果较为一致,同时其在训练集、验证集和测试集上的误差表现基本相近,说明该模型没有过拟合问题。从GWR和GNNWR模型绝对误差的空间分布来看,其表现较OLR模型具有明显提升,特别是对训练集的拟合精度均较高,基本没有较大的误差点。此外,GWR和GNNWR模型对验证集和测试集的拟合误差明显大于训练集,其中GWR模型表现尤为突出,出现了不少误差较大的异常估计点。这表明GWR和GNNWR模型均存在一定的过拟合问题,且GWR模型更为严重。同时,就各模型绝对误差的空间分布来看,西部地区的估计误差较大,这主要是由于中国西部地区监测站位较少而难以充分建模导致的。值得注意的是,新疆地区的估计误差较其他地区更为突出,这是由于新疆地区PM2.5浓度高值较多且变化剧烈,拟合难度相对较大,且GWR和GNNWR模型对于高值点的拟合精度通常较低,进而导致了该地区的估算误差较大。此外,从图中可知GNNWR模型估计值的绝对误差明显低于GWR模型,进一步验证了GNNWR模型对于PM2.5浓度空间估算的优异性能。
图9 OLR、GWR和GNNWR模型2017年中国地区PM2.5年平均浓度估算绝对误差空间分布

注:该图基于自然资源部标准地图服务网站下载的审图号GS(2019)1697号的标准地图制作,底图无修改。

Fig. 9 Spatial distribution of absolute estimation errors of the annual mean PM2.5 of China in 2017 for the OLR, GWR, and GNNWR models

4 结论与讨论

为获得具有高精度、高合理性的PM2.5浓度空间分布,本文集成卫星遥感数据、气象数据和地理信息数据,建立了一种基于GNNWR的PM2.5浓度空间估算模型。该模型能够高效处理PM2.5回归关系的空间异质和复杂非线性特征,有效克服了传统GWR模型难以处理复杂非线性特征的缺陷[22],使得神经网络模型能够精确拟合PM2.5回归关系的空间非平稳特性。
以中国2017年PM2.5年平均浓度空间估算为例,本文将GNNWR与OLR、GWR进行了充分比较。实验结果表明,基于GNNWR的PM2.5建模结果的R2RMSEMAEMAPEAICc等指标均明显优于OLR和GWR。同时,GNNWR能够更好地捕获PM2.5回归关系的空间非平稳特征进而获得了更优的预测能力,而GWR模型则可能遭遇较严重的过拟合问题[22,39]。此外,GNNWR的PM2.5浓度空间估算结果也更为合理,表现出比GWR更丰富的局部变化和细节层次。
GNNWR获得的PM2.5年平均浓度空间分布结果表明中国地区2017年PM2.5的重污染区域主要分布在华北平原、长江中下游平原,又以河北省、河南省北部、山东省西部最为严重,这与前人研究结果较为一致[4,14-15,21]。分析原因可知,这些地区的高污染与其社会经济的快速发展和城市化进程的高速推进密切相关[4],而且位于河北省的太行山脉还在一定程度上阻碍了这些地区PM2.5浓度的扩散,则进一步加剧了其空气污染状况[21]。四川盆地、关中平原是另2个PM2.5浓度较高的地区,新疆、西藏等地也聚集了相当高的PM2.5浓度,这与其空气中含有大量沙尘密切相关[40,41]
综上,论文构建了一种基于地理神经网络加权回归的PM2.5浓度空间估算方法,实验结果表明该方法较为有效且可靠,未来可推广应用于其他空气质量指标的空间估算研究。然而,论文仍存在一些不足需要继续研究。例如,由于遥感数据本身存在一定缺失,即使通过GNNWR建模也难以获得这些区域的PM2.5浓度信息,后续需要将空间插值方法与GNNWR模型结合来获得全覆盖的PM2.5浓度空间分布。针对数据集的空间划分,可采用n-fold交叉验证方式对训练集和验证集进行划分来进一步提高模型构建的鲁棒性。另外,后续还将进一步考虑时间信息,并将其集成到GNNWR模型,以获得PM2.5浓度的时空连续分布。
[1]
中华人民共和国生态环境部. 2017中国生态环境状况公报[P]. 北京: 2018.

[ Ministry of Ecological Environment of the People's Republic of China, Ecological Environment Bulletin of China in 2017[P]. Beijing: 2018. ]

[2]
Pope III C A, Burnett R T, Thun M J , et al. Lung cancer, cardiopulmonary mortality, and long-term exposure to fine particulate air pollution[J]. Jama, 2002,287(9):1132-1141.

[3]
You W, Zang Z, Zhang L , et al. Estimating national-scale ground-level PM2.5 concentration in China using geographically weighted regression based on MODIS and MISR AOD[J]. Environmental Science and Pollution Research, 2016,23(9):8327-8338.

[4]
Ma Z, Hu X, Huang L , et al. Estimating ground-level PM2.5 in China using satellite remote sensing[J]. Environmental Science & Technology, 2014,48(13):7436-7444.

[5]
蒲强, 邹滨, 翟亮 , 等. 集成多源遥感数据的PM2.5浓度空间分布制图[J]. 地球信息科学学报, 2016,18(12):1717-1724.

[ Pu Q, Zou B, Zhai L , et al. Mapping of PM2.5 fine particulates using multi-source remote sensing data. Journal of Geo-information Science, 2016,18(12):1717-1724. ]

[6]
Gupta P, Christopher S A . Particulate matter air quality assessment using integrated surface, satellite, and meteorological products: Multiple regression approach[J]. Journal of Geophysical Research: Atmospheres, 2009,114(D14).

[7]
Chu D A, Kaufman Y J, Zibordi G , et al. Global monitoring of air pollution over land from the earth observing system-Terra Moderate Resolution Imaging Spectroradiometer (MODIS)[J]. Journal of Geophysical Research: Atmospheres, 2003,108(D21).

[8]
Wang J, Christopher S A . Intercomparison between satellite-derived aerosol optical thickness and PM2.5 mass: Implications for air quality studies[J]. Geophysical Research Letters, 2003,30(21).

[9]
Liu Y, Sarnat J A, Kilaru V , et al. Estimating ground-level PM2.5 in the eastern United States using satellite remote sensing[J]. Environmental Science & Technology, 2005,39(9):3269-3278.

[10]
李啸天, 吴绍华, 徐于月 , 等. 江苏省PM2.5质量浓度的时空变化格局模拟[J]. 环境监测管理与技术, 2017,29(2):16-20.

[ Li X T, Wu S H, Xu Y Y , et al. Temporal and spatial variation pattern of PM2.5 mass concentration in Jiangsu[J]. The Administration and Technique of Environmental Monitoring, 2017,29(2):16-20. ]

[11]
邹雨轩, 吴志峰, 曹峥 . 耦合土地利用回归与人口加权模型的PM2.5暴露风险评估[J]. 地球信息科学学报, 2019,21(7):1018-1028.

[ Zou Y X, Wu Z F, Cao Z . Assessing PM2.5 exposure risk by coupling land use regression model and population weighted model[J]. Journal of Geo-information Science, 2019,21(7):1018-1028. ]

[12]
Fotheringham A S, Brunsdon C, Charlton M . Geographically weighted regression: The analysis of spatially varying relationships[M]. UK: John Wiley & Sons, 2002.

[13]
Brunsdon C, Fotheringham A S, Charlton M E . Geographically weighted regression: A method for exploring spatial nonstationarity[J]. Geographical Analysis, 1996,28(4):281-298.

[14]
Xiao L, Lang Y, Christakos G . High-resolution spatiotemporal mapping of PM2.5 concentrations at Mainland China using a combined BME-GWR technique[J]. Atmospheric Environment, 2018,173:295-305.

[15]
You W, Zang Z, Zhang L , et al. National-scale estimates of ground-level PM2.5 concentration in China using geographically weighted regression based on 3 km resolution MODIS AOD[J]. Remote Sensing, 2016,8(3):184.

[16]
Song W, Jia H, Huang J , et al. A satellite-based geographically weighted regression model for regional PM2.5 estimation over the Pearl River Delta region in China[J]. Remote Sensing of Environment, 2014,154(SI):1-7.

[17]
Hu X, Waller L A, Al-Hamdan M Z , et al. Estimating ground-level PM2.5 concentrations in the southeastern US using geographically weighted regression[J]. Environmental Research, 2013,121:1-10.

[18]
Zhai L, Li S, Zou B , et al. An improved geographically weighted regression model for PM2.5 concentration estimation in large areas[J]. Atmospheric Environment, 2018,181:145-154.

[19]
赵阳阳, 刘纪平, 杨毅 , 等. 一种协同时空地理加权回归PM2.5浓度估算方法[J]. 测绘科学, 2016,41(12):172-178.

[ Zhao Y Y, Liu J P, Yang Y , et al. An approach of co-training geographically and temporally weighted regression to estimate PM2.5concentration[J]. Science of Surveying and Mapping, 2016,41(12):172-178. ]

[20]
Hajiloo F, Hamzeh S, Gheysari M . Impact assessment of meteorological and environmental parameters on PM2.5 concentrations using remote sensing data and GWR analysis (case study of Tehran)[J]. Environmental Science and Pollution Research, 2019,26(24):24331-24345.

[21]
He Q, Huang B . Satellite-based mapping of daily high-resolution ground PM2.5 in China via space-time regression modeling[J]. Remote Sensing of Environment, 2018,206:72-83.

[22]
Li J, Jin M, Li H . Exploring spatial influence of remotely sensed PM2.5 concentration using a developed deep convolutional neural network model[J]. International Journal of Environmental Research and Public Health, 2019,16(3):454.

[23]
Li T, Shen H, Zeng C , et al. Point-surface fusion of station measurements and satellite observations for mapping PM2.5 distribution in China: Methods and assessment[J]. Atmospheric Environment, 2017,152:477-489.

[24]
Memarianfard M, Hatami A M, Memarianfard M . Artificial neural network forecast application for fine particulate matter concentration using meteorological data[J]. Global Journal of Environmental Science and Management, 2017,3(3):333-340.

[25]
Shen H, Li T, Yuan Q , et al. Estimating regional ground-Level PM2.5 directly from satellite top-of-atmosphere reflectance using deep belief networks[J]. Journal of Geophysical Research: Atmospheres, 2018,123(24):13875-13886.

[26]
Chen Y . Prediction algorithm of PM2.5 mass concentration based on adaptive BP neural network[J]. Computing, 2018,100(8SI):825-838.

[27]
Ceylan Z, Bulkan S . Forecasting PM10 levels using ANN and MLR: A case study for Sakarya City[J]. Global Nest Journal, 2018,20(2):281-290.

[28]
Lyu H, Dai T, Zheng Y , et al. Estimation of PM2.5 concentrations over Beijing with MODIS AODs using an artificial neural network[J]. Sola, 2018,14:14-18.

[29]
符海月, 张祎婷 . 时间尺度重构EEMD-GRNN改进模型预测PM2.5的研究[J]. 地球信息科学学报, 2019,21(7):1132-1142.

[ Fu H Y, Zhang Y T . Improving the EEMD-GRNN model for PM2.5 prediction based on time scale reconstruction[J]. Journal of Geo-information Science, 2019,21(7):1132-1142. ]

[30]
吴森森 . 地理时空神经网络加权回归理论与方法研究[D]. 杭州:浙江大学, 2018.

[ Wu S . The theory and method of geographically and temporally neural network weighted regression[D]. Hangzhou: Zhejiang University, 2018. ]

[31]
China National Environmental Monitoring Centre[EB/OL]. http://www.cnemc.cn

[32]
LAADS DAAC[EB/OL]. https://ladsweb.modaps.eosdis.nasa.gov

[33]
ETOPO1 Global Relief Model[EB/OL]. https://www.ngdc.noaa.gov/mgg/global/global.html

[34]
ERA5 hourly data[EB/OL]. https://cds.climate.copernicus.eu

[35]
Leung Y, Mei C L, Zhang W X . Statistical tests for spatial nonstationarity based on the geographically weighted regression model[J]. Environment & Planning A, 2000,32(1):9-32.

[36]
Srivastava N, Hinton G, Krizhevsky A , et al. Dropout: A simple way to prevent neural networks from overfitting[J]. The Journal of Machine Learning Research, 2014,15(1):1929-1958.

[37]
He K, Zhang X, Ren S , et al. Delving deep into rectifiers: Surpassing human-level performance on imagenet classification: Proceedings of the IEEE international conference on computer vision, 2015[C].

[38]
Ioffe S, Szegedy C . Batch normalization: Accelerating deep network training by reducing internal covariate shift[J]. arXiv preprint arXiv:1502.03167, 2015.

[39]
Nakaya T. GWR4 user manual[J]. WWW Document. Available online: http://www.st-andrews.ac.uk/geoinformatics/wp-content/uploads/GWR4manual_201311.pdf2014.

[40]
Han Y, Fang X, Zhao T , et al. Suppression of precipitation by dust particles originated in the Tibetan Plateau[J]. Atmospheric Environment, 2009,43(3):568-574.

[41]
Wang X, Dong Z, Zhang J , et al. Modern dust storms in China: An overview[J]. Journal of Arid Environments, 2004,58(4):559-574.

文章导航

/