遥感科学与应用技术

时间尺度重构EEMD-GRNN改进模型预测PM2.5的研究

  • 符海月 , * ,
  • 张祎婷
展开
  • 南京农业大学 土地管理学院, 南京 210095

作者简介:符海月(1977-),女,甘肃陇南人,博士,副教授,主要从事土地利用变化,遥感与GIS在人口、资源与环境中的应用研究。E-mail:

收稿日期: 2018-11-22

  要求修回日期: 2019-03-06

  网络出版日期: 2019-07-25

基金资助

国家自然科学基金项目(41871319)

Improving the EEMD-GRNN Model for PM2.5 Prediction based on Time Scale Reconstruction

  • FU Haiyue , * ,
  • ZHANG Yiting
Expand
  • College of Land Management, Nanjing Agricultural University, Nanjing 210095, China
*Corresponding author: FU Haiyue, E-mail:

Received date: 2018-11-22

  Request revised date: 2019-03-06

  Online published: 2019-07-25

Supported by

Program of National Natural Science Foundation of China, No.41871319

Copyright

《地球信息科学学报》编辑部 所有

摘要

合理构建PM2.5浓度预测模型是科学、准确地预测PM2.5浓度变化的关键。传统PM2.5预测EEMD-GRNN模型具有较好的预测精度,但是存在过于关注研究数据本身而忽略其物理意义的不足。本研究基于南京市2014-2017年PM2.5浓度时间序列数据,分析PM2.5浓度多尺度变化特征及其对气象因子和大气污染因子的尺度响应,基于时间尺度重构进行EEMD-GRNN模型的改进与实证研究。南京市样本数据PM2.5浓度变化表现为明显的天际尺度和月际尺度,从重构尺度(天际、月际)构建GRNN模型更具有现实意义;同时,PM2.5对PM10、NO2、O3、RH、MinT等因子存在多尺度响应效应,以其作为GRNN模型中的输入变量更具有时间序列上的解释意义。改进后的EEMD-GRNN模型具有更高的PM2.5浓度预测精度,MAE、MAPE、RMSE和R2分别为6.17、18.41%、8.32和0.95,而传统EEMD-GRNN模型的模型有效性检验结果分别为8.37、27.56%、11.56、0.91。对于高浓度天(PM2.5浓度大于100 μg/m3)的预测,改进模型更是全面优于传统EEMD-GRNN模型,MAPE为12.02%,相较于传统模型提高了9.03%。

本文引用格式

符海月 , 张祎婷 . 时间尺度重构EEMD-GRNN改进模型预测PM2.5的研究[J]. 地球信息科学学报, 2019 , 21(7) : 1132 -1142 . DOI: 10.12082/dqxxkx.2019.180598

Abstract

Reasonable construction of PM2.5 concentration prediction models is the key to scientifically and accurately predict PM2.5 concentration dynamics. The traditional EEMD-GRNN model predicts PM2.5 concentration with good prediction accuracy, but focuses more on research data and less on its physical meaning. Based on the time series data of PM2.5 concentration in Nanjing duing 2014-2017, this study analyzed the multi-scale variations of PM2.5 concentration and its scale response to meteorological and atmospheric pollution factors. Additionally, the EEMD-GRNN model was reconstructed and validated based on time scale reconstruction. Results show that: ① based on scale reconstruction, the improved EEMD-GRNN model was scientific in predicting the PM2.5 concentration as it considered the variation of PM2.5 concentration and its multi-scale responses to atmospheric pollutants and meteorological factors. The PM2.5 concentration of Nanjing’s sample data had obvious inter-daily and inter-monthly variations. Thus, it is more practical to construct GRNN modeling at the reconstruction scales (i.e., daily and monthly). Meanwhile, PM2.5 was sensitive to factors such as PM10, NO2, O3, RH, and MinT. Thus, choosing these factors as input variables in the GRNN model can be more explanatory for time-series. ② the improved EEMD-GRNN model was more accurate in predicting PM2.5 concentration. The MAE, MAPE, RMSE, and R2 of the improved models are 6.17, 18.41%, 8.32, and 0.95, respectively, which are superior to the validity test results of the traditional EEMD-GRNN model. Furthermore, for the prediction of high-concentration days (i.e., PM2.5 concentration greater than 100 μg/m3), the improved model was more comprehensive than the traditional EEMD-GRNN model. With the new EEMD-GRNN model, the MAPE is 12.02%, 9.03% higher than the traditional model. Our findings indicate that the improved EEMD-GRNN based on scale reconstruction is an efficient method to scientifically and accurately predict PM2.5 concentration, especially in days with high PM2.5 concentration.

1 引言

随着城市化、工业化的不断发展,能源消费激增,细颗粒物已成为城市大气的首要污染物[1,2]。PM2.5作为重要的细颗粒物之一,可以吸附各种有毒污染物,包括重金属、挥发性有机化合物和含碳物质[3,4,5,6]。高浓度的该物质不仅影响大气能见度,对身体健康、社会经济、植物物种等也有严重危害[7,8,9,10]。研究细颗粒物PM2.5浓度变化规律,准确预测及高浓度天的预警对于减少大气污染对人类的负面影响、促进区域环境健康可持续发展具有重要意义,而合理构建PM2.5浓度预测模型是准确、科学预测PM2.5浓度变化的关键。
当前关于PM2.5浓度的预测模型主要有4种类型:时间序列模型、化学传输模型、线性或非线性回归模型和人工智能模型。广泛使用的时间序列模型又包括自回归(AR)、自回归滑动平均值(ARMA)和自回归综合移动平均值(ARIMA)模型[11,12]。与时间序列模型相比,化学传输模型存在精度低和计算复杂等缺点。多元线性回归(MLR)模型因其准确的解释性,仍具有广泛的使用性[13],由于PM2.5与空气质量和气象数据之间存在非线性关系,非线性预测模型也受到了学者的青睐[14,15]。人工神经网络(ANN)模型具有检测依赖变量和自变量之间复杂潜在非线性关系的能力,并且可以使用若干有效的训练算法进行训练,因此在空气质量预测界引起了广泛的关注[16,17,18,19,20]。Fernando等[20]经研究发现人工神经网络用于模拟空气质量预警系统,具有计算速度快、结果准确等优点。
上述4种类型的预测模型各有优势,为了得到更好的预测结果,学者们尝试将模型进行结合[21,22]。Zhou等[23]首次提出混合EEMD-GRNN模型(集合经验模态分解-广义回归神经网络模型)进行PM2.5预测,研究比较了混合EEMD-GRNN模型、GRNN模型、MLR模型、PCR模型和ARIMA模型的预测结果,使用平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)和一致性指数(IA)评估预测精度,发现混合EEMD-GRNN模型用于空气质量预测时结果更准确。Shadi Ausati等[24]通过比较ANFIS模型、混合EEMD-GRNN模型、PCR模型和MLR模型对PM2.5浓度的预测,结果表明混合EEMD-GRNN模型的预测精度最高。
综上所述,不同于气象[25]、土地覆被[26]等研究多从空间尺度着眼,PM2.5的预测模型多使用时间序列数据,尤其是现在广泛使用的混合模型,其中混合EEMD-GRNN模型是当前PM2.5浓度预测的高效模型之一,但该模型在构建过程中更多从数学角度出发而弱化了数据的现实意义。本研究拟通过时间尺度重构,基于PM2.5的周期变化以及对大气污染物和气象因子的响应特点,改进EEMD-GRNN模型,以期拓展PM2.5浓度预测的思路和方法。

2 EEMD-GRNN模型的改进

2.1 集合经验模态分解(EEMD)

经验模态分解(EMD)[27]方法是一种适用于非平稳、非线性数据的信号分析方法,能以自适应方式对任何类型的信号进行分解。EMD的目标是将性能欠好的原始信号分解为一组性能较好的本征模函数(IMF),以便更好地揭示信号特征。为使分解结果能够更准确地表达出信号的变化特点,IMF必须具有物理意义,因而本征模函数需满足如下要求:① 整个信号数据中的极值点个数与过零点个数相等,最多不能相差一个;② 在任何距离点处,由局部极大值点形成的上包络线和局部极小值点形成的下包络线的均值为零。
尽管EMD具有较好的自适应性,但是受原始信号频率的影响,存在模式混合的缺陷。因此在EMD的基础上Wu等[28]提出一种噪声辅助数据分析方法——集合经验模态分解(EEMD)方法,EEMD通过添加白噪声进行IMF分量筛选,有效处理了EMD中存在的模态混叠等问题。同时,EEMD还可借助于白噪声的集合扰动完成EMD所不能完成的显著性检验,从而得到每个IMF的信度[29,30]。EEMD分解的具体操作步骤如下:
(1)对原始数据序列xt)以一定的信噪比叠加上白噪声序列wt),其中t表示时间,得到一个总体信号:
X t = x t + w t (1)
(2)将新数据序列(叠加白噪声后的数据序列)进行EMD分解,其中ci表示第i个本征模函数(IMF),rn表示残差项,得到各阶IMF分量:
X t = i = 1 n c i + r n (2)
(3)重复上述步骤,每次给新数据序列加入相同振幅的新生白噪声序列wjt),其中Xjt)表示第j次加入新生白噪声的总体信号,cji表示第j次加入新生白噪声的总体信号的第i个本征模函数(IMF),rjnj次加入新生白噪声的总体信号的残差项。
X j t = i = 1 n c ji + r jn (3)
假设加入m次新生白噪声序列后,分解所得信号均满足本征模函数的两点要求,则原始信号对应的IMF分量cit)表示为:
c i t = 1 m j = 1 m c ji t (4)
同样,原始信号对应的残差项rnt)表示为:
r n t = 1 m j = 1 m r jn t (5)
则最终分解结果为:
x t = i = 1 n c i t + r n t (6)
在PM2.5浓度的预测模型研究中,EEMD方法多用于分解PM2.5浓度时间序列,其分解所得的本征模函数(IMF)反映了PM2.5浓度的时间尺度变化规律,并为GRNN预测模型的构建提供准备数据。

2.2 广义回归神经网络(GRNN)

GRNN模型[31]基于概率分布函数的估计来解决非线性近似问题。该模型多用于时间序列的学习,探索目标时间序列和一组解释变量之间的关系,可以通过分析过去的输入和输出数据构建任何函数,如式(7)所示。
y t = f y t - 1 y t - 2 y t - n 0 x 1 t - 1 x 1 t - 2 x 1 t - n 1 x 2 t - 1 x 2 t - 2 x 2 t - n 2 (7)
式中:yt表示时间t时的观测值;xit-j表示时间t-j时第i个解释变量的值;ni表示时间序列xi的滞后数。
GRNN模型一共有4层。
(1)输入层:在该层中使用历史目标时间序列(如日均PM2.5浓度历史值)和相关解释时间序列(如日均PM10、NO2浓度和相对湿度等)。输入神经元的数量是输入向量中的变量个数。
(2)模式层:输入层中输入的变量在该层中进行非线性变换。该层中的神经元能够记忆输入神经元与模式层响应之间的关系,神经元的数量是训练个案的数量。模式Pi的高斯函数如下所示:
P i = exp - X - X i T X - X i 2 σ 2 (8)
式中:i=1,2,3,…,n,σ表示平滑参数,X表示输入变量,Xi是模式层的第i个神经元的训练样本。
(3)求和层:模式层的输出被导入求和图层。在该层中计算2个和,即SsSw
模式层输出的简单总和公式如下:
S S = i = 1 n P i (9)
模式层输出的加权求和公式如下:
S W = i = 1 n W i P i (10)
式中:Wi是模式层中第i个神经元连接到求和层中的权重。
(4)输出层:求和层中的求和结果被导入输出层。输出结果由y表示:
y = S W S S (11)
在PM2.5浓度预测中,GRNN模型作为预测模型,可通过对EEMD分解所得的PM2.5浓度各IMF分量建立GRNN模型,实现准确预测提前一天的PM2.5浓度值。

2.3 改进EEMD-GRNN模型

采用传统的EEMD-GRNN混合模型预测PM2.5浓度主要通过以下步骤实现:① EEMD模型将原始PM2.5浓度时间序列分解为一组有限的IMF,假设残差项rnt)也是IMF;② 对第一步中确定的每个IMF构建GRNN预测模型,并使用各GRNN模型预测第二天相应IMF的值;③ 汇总第二步中的预测结果以获得最终PM2.5浓度的预测结果。
原始PM2.5浓度时间序列数据经EEMD分解后,所得的IMF分量较原始浓度数据更能精细的表达出时间序列本身所包含的信息,这些信息中包含有周期、频率、趋势等,反映了PM2.5浓度的变化规律。但是过于细微的波动对于构建GRNN模型而言,会影响最终的预测结果。同时,GRNN预测模型中,输入层数据的选择也是尤为重要的一环,而在采用传统EEMD-GRNN混合模型进行PM2.5浓度预测时,多以数据为基础,通过相关性检验等方式选择输入变量,这些方法都具有数据层面的考虑,但是缺乏对实际意义的考虑。在复杂的大气环境下,大气指示因子的变化往往会引起PM2.5浓度的随之变化,而不是仅仅的相关性关系。
故而本研究考虑众多研究[32,33,34,35]中所表现出的PM2.5浓度变化时间尺度,通过探索PM2.5的周期变化特点,对EEMD的分解结果进行尺度重构,采用GRNN模型对各时间尺度进行预测;通过研究PM2.5对大气污染物因子和气象因子的尺度响应,选择具有响应效应的因子作为GRNN模型的输入部分(考虑到具有响应效应的因子更具有时间序列上的解释意义)。
因此,基于以上尺度重构思路,对PM2.5浓度预测EEMD-GRNN模型进行改进,具体操作如下:首先,分析第①步中分解得到的IMFs,进而对原始PM2.5浓度时间序列分解所得的IMFs进行尺度重构。结合解释变量(如PM10浓度和相对湿度等)的变化规律(如趋势变化、尺度变化等),探究PM2.5浓度原始时间序列对其的多时间尺度响应,从而得到GRNN模型的输入变量组。然后,以确定的PM2.5浓度重构时间尺度和输入变量为基础分别构建GRNN模型,并分别预测第2天相应PM2.5浓度重构信号的值。图1为改进EEMD-GRNN模型流程图。
Fig. 1 Flowchart of the improved EEMD-GRNN model

图1 改进EEMD-GRNN模型流程

3 实验区概况与实验数据

3.1 实验区概况

研究区南京市是江苏省省会,地处江苏省西南部(31°14′N-32°37′N,118°22′E-119°14′E)(图2),属于亚热带季风气候,四季分明,中国四大园林城市之一,人均公园绿地面积达到16.01 m2,同时石化企业众多,主要位于市区周边,尽管政府采取措施 整顿和改造,但它们仍是空气污染的主要来源。与此同时,三面环山、一面临水的封闭地形也造成城区空气污染物的积聚。自2013年以来,随着经济高速发展和能源不断消耗,环境空气质量良好的未 达标率高达30.57%,空气污染问题频发[36,37],成为南京市最严峻的环境问题之一。PM2.5颗粒物已成为南京市所在的长三角地区改善空气污染的关键因素[38,39]
Fig. 2 The geographic location of the study area

图2 南京市地理位置

3.2 数据选择及来源

研究主要涉及空气质量数据与气象数据,其中空气质量数据包括南京市日平均PM2.5、PM10、SO2、NO2和CO浓度以及8 h平均O3浓度,来自中国空气质量在线监测分析平台(https://www.aqistudy.cn/);气象数据包括同时期的南京市日平均风速(WS),日平均大气压(AP),每日地表空气相对湿度(RH),每日最高温度(MaxT),每日最低温度 (MinT)和每日总降水量(PR),来自美国国家环境预测中心/国家大气研究中心(http://www.esrl.noaa.gov/)。
研究数据的时间跨度为2014年1月1日至2017年12月31日。Shadi Ausati等[24]用335 d的数据模拟、30天的数据进行测试,故而本研究将2014年1月1日至2017年9月2日(共1341 d)数据作为模型模拟样本数据;而2017年9月3日至2017年12月31日(共120 d)数据用于模型测试与验证,共120 d。
空气质量和气象数据的描述统计如表1所示,均值用于描述平均值,标准差反映数据分散程度,PM2.5浓度均值为较低的54.75 μg/m3,但其标准差较大,说明样本数据浮动较大,具有一定的研究意义。
Tab. 1 Descriptive statistics of the air quality and meteorological data of Nanjing during 2014-2017

表1 南京市2014-2017年空气质量和气象数据的描述性统计

单位 均值 标准差
PM2.5 μg/m3 54.75 36.88
PM10 μg/m3 96.36 55.21
SO2 μg/m3 19.08 10.02
CO mg/m3 0.99 0.34
NO2 μg/m3 48.07 18.72
O3 μg/m3 103.55 51.48
日平均风速(WS) m/s 2.68 1.79
日平均大气压(AP) kPa 100.60 0.88
每日地表空气相对湿度(RH) % 78.40 15.25
每日最高温度(MaxT) 20.86 8.98
每日最低温度(MinT) 13.41 8.89
每日总降水量(PR) mm 4.10 11.29

4 实验结果及分析

4.1 PM2.5浓度的尺度分析

4.1.1 PM2.5浓度的EEMD分解
EEMD方法用于非线性非平稳信号的分解,因此首先对原始PM2.5浓度数据进行线性与平稳性检验,以确保研究的有效性和准确性。分解所得的本征模函数(IMF)经分析可得到PM2.5浓度的变化规律,可便于更好的理解GRNN模型预测PM2.5浓度的过程。对本研究中的原始PM2.5浓度数据进行距平处理,结果如图3所示。图3表明,2014-2017年期间,南京市PM2.5浓度总体呈现出明显的波动性降低趋势,2015年12月是PM2.5浓度由相对较高至较低的转折点。并且由PM2.5浓度的30 d移动平均曲线可以看出,南京市PM2.5浓度的变化趋势表现为较强的非线性和非平稳的波动性特征。因此,可采用EEMD方法来进一步揭示南京市PM2.5浓度的复杂性变化过程。
Fig. 3 Change in the daily average PM2.5 concentration's absolute anomaly of Nanjing during 2014-2017

图3 2014-2017年南京市PM2.5日均浓度绝对距平变化

利用EEMD方法对南京市2014-2017年PM2.5日均浓度时间序列进行分解,结果如图4所示。 9个IMF分量反映了PM2.5浓度从高频到低频不同时间尺度(准周期)的波动状况,RES则表示PM2.5浓度随时间变化的总体趋势。对各IMF分量进行检验显著性(表2),除IMF9未通过10%的显著性水平检验外,其余各分量均通过了5%的显著性水平检验。综合图4表2可知,南京市2014-2017年PM2.5日均浓度变化具有相对稳定的准周期性,PM2.5浓度天际振荡(IMF1-IMF4)对PM2.5总体变化特征的影响程度为48.31%,月际振荡(IMF5-IMF9,RES)的影响程度为51.70%,月际振荡的贡献略高于天际振荡。因此,天际和月际尺度是南京市PM2.5浓度变化时间序列中的2个重要时间尺度,这与其他研究中发现的PM2.5浓度变化的时间尺度表现为天、月、年[32,33,34,35]相符。
Tab. 2 Period, significance, and variance contribution of each IMF component of the PM2.5 concentration

表2 PM2.5浓度各IMF分量的周期、显著性水平及其方差贡献率

IMF分量 IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 IMF8 IMF9 RES
周期/d 3 7 14 27 58 172 417 974 974
显著性检验/% >95 >95 >95 >95 >95 >95 >95 >95 <50
贡献率/% 21.46 15.06 7.85 3.94 4.75 10.57 10.18 2.58 0.01 23.61
Fig. 4 Results of EEMD decomposition of the PM2.5 daily average concentration of Nanjing from 2014 to 2017

图4 南京市2014-2017年PM2.5日均浓度EEMD分解结果

4.1.2 PM2.5浓度的尺度重构
根据以上EEMD对PM2.5浓度的分解结果,在分析大气PM2.5污染时间序列时,不能忽视天际和月际这2个非常重要的时间尺度,因此将南京市PM2.5浓度,进行天际尺度和月际尺度重构。图5为重构尺度下的PM2.5浓度与原始PM2.5浓度及趋势项变化比较图。重构的PM2.5浓度天际变化与原始序列的变化趋势基本是一致的,能很好的表现出PM2.5浓度在研究期细微的变化情况,重构的PM2.5浓度月际变化在整个研究时段上呈现出春冬高-夏秋低的波动状态,可以有效揭示南京市PM2.5浓度在不同季节出现的状态。对PM2.5污染浓度进行预测时,天际和月际的变化很好的反映了其真实的变化情况,相较于原始的EEMD分解结果,更具有现实意义。故而以天际、月际为划分尺度分别构建GRNN预测模型具备理论基础。
Fig. 5 Inter-daily and inter-monthly variations and comparisons with the original PM2.5 concentration

图5 南京市天际和月际PM2.5浓度变化与原始PM2.5浓度对比

4.2 PM2.5响应因子的选择

PM2.5与大气污染物(PM10、SO2、CO、NO2、O3)和气象因子(WS、AP、RH、MaxT、MinT、PR)有着十分紧密的联系[40]。对南京市PM2.5同期的大气污染物原始浓度及气象因子距平数据进行EEMD分解,统计其周期(表3)。南京市大气污染因子的天际变化周期与PM2.5具有高度吻合性,在月际尺度下,污染物浓度的周期变化则与PM2.5有所差异。研究期内南京市大气污染物因子变化趋势如图6,PM10、SO2、CO、NO2、O3的浓度变化趋势分别为“减-增”、“递减”、“减-增”、“减-增”、“增-减”。同样,南京市气象因子与同期PM2.5在天际尺度上的周期变化基本一致,但在月际尺度上,气象因子表现出了更大尺度的年际变化,符合气象变化的大时间尺度特征。研究期内南京市气象因子变化趋势如图7,风速、气压、相对湿度、最高气温、最低气温、降水量的变化趋势依次是“递减”、“减-增”、“增-减”、“增-减”、“增-减”、“增-减”。
Tab. 3 Period comparison of PM2.5 concentration, atmospheric pollution, and meteorological factors

表3 PM2.5浓度与大气污染因子及气象因子周期对比

周期/d PM2.5 大气污染因子 气象因子
PM10 SO2 CO NO2 O3 WS AP RH MaxT MinT PR
天际尺度 3 3* 3* 3* 3* 3* 3* 4 3* 3* 3* 3*
7 7* 7* 7* 7* 7* 7* 7* 7* 7* 7* 7*
14 13 13 14* 14* 14* 13 15 15 14* 13 12
27 27* 27* 29 26 28 26 29 32** 30 28 24
月际尺度 58 56 60 54 62 58* 54 52 60 55 56 47
172 133 122 162 162 139 112 417 162 325 417 97
417 417* 417* 325 417* 417* 195 584 417* 487 974 172
974 974* 731 584 974* 974* 417 974* 974* 1461 1461 417
2922 1461 1461 1461 1461 1461 1461 2922* 1461 1461 2922* 974

注:*表示因子周期与相应PM2.5浓度变化周期一致;**表示出现在天际尺度中的月际尺度周期。

Fig. 6 Trends of the atmospheric pollutants in Nanjing from 2014 to 2017

图6 2014-2017年南京市大气污染物因子变化趋势

Fig. 7 Trends of the meteorological factors in Nanjing from 2014 to 2017

图7 2014-2017年南京市气象因子变化趋势

PM2.5浓度的变化趋势为“减-增”,其变化转折时间点为2016年12月,对变化趋势出现转折的因子统计其转折时间点,发现PM10浓度变化的转折点是2016年8月,O3浓度变化的转折点是2016年7月,每日最低温度(MinT)变化的转折点是2016年5月,NO2浓度变化和每日相对湿度(RH)变化的转折点都是2016年4月,可见PM2.5浓度的变化较之上述因子的变化转折点略有滞后性。作为表征大气质量的重要指标,NO2、O3是PM2.5形成过程中重要的部分;PM10是粒径在10微米以下的颗粒物,PM2.5的粒径更小。众多研究表明气象环境对PM2.5的产生有影响[41]。因此,PM2.5对PM10、O3、MinT、NO2和RH存在一定响应作用,以响应因子作为GRNN预测模型构建中的输入层数据在时间序列上更具有解释意义。
为了进一步定量研究PM2.5对PM10、O3、MinT、NO2和RH的响应作用,将分解结果重构到天际和月际尺度上,对重构结果归一化处理后进行相关性分析,并对比其原始数据的相关系数(表4)。根据表4,PM2.5与PM10、O3、MinT、NO2和RH在不同的时间尺度上表现为不同程度的相关性,原始数据间的相关性均位于2种时间尺度之间。PM2.5与O3及MinT在天际尺度上表现为正相关,而在月际尺度上则表现为显著的负相关,臭氧和日最低温度在大时间尺度上对PM2.5的扩散具有一定的遏制作用。总结看来,PM2.5浓度对PM10、O3、MinT、NO2和RH的变化响应在月季尺度上表现更为强烈和明显,尽管在天际尺度上的响应较微弱,但也不能忽视,故而具有多尺度响应的作用,因此多时间尺度构建PM2.5浓度的GRNN预测模型时选择具有多尺度响应的因子作为模型输入变量具有可靠性。
Tab. 4 Multi-scale correlations between PM2.5 concentration and PM10, O3, MinT, NO2, and RH

表4 PM2.5浓度与PM10、O3、MinT、NO2和RH的多尺度相关性

PM2.5与PM10 PM2.5与O3 PM2.5与MinT PM2.5与NO2 PM2.5与RH
原始数据 0.917** -0.065* -0.343** 0.618** -0.254**
天际尺度 0.892** 0.271** 0.236** 0.529** -0.039
月季尺度 0.939** -0.431** -0.628** 0.715** -0.560**

注:**表示显著性在0.01水平; *表示显著性在0.05水平。

4.3 PM2.5浓度的模拟预测及改进模型验证

本研究以传统EEMD-GRNN模型预测所得PM2.5浓度作为对照,即对采用EEMD分解PM2.5浓度所得的各分量(IMFs)分别构建GRNN模型,最后进行各GRNN模型预测结果的综合以得到最终的PM2.5浓度预测结果。为了更直观的比较改进后EEMD-GRNN模型、改进前EEMD-GRNN模型以及直接构建GRNN模型的PM2.5浓度预测结果,将3种模型的PM2.5模拟预测结果与观测值进行比较(共计120 d),如图8。重构尺度下的PM2.5浓度预测值总体最接近原始的观测值,尤其是PM2.5浓度峰值点处,典型的日期为2017年10月22日和2017年11月13日。对PM2.5浓度的分解结果进行尺度重构后,忽略了其尺度之外的细小波动,但保留了能反应其主要规律特点的信息,并且选择时间序列上更具有解释意义的响应因子作为输入变量,使得GRNN模型的构建具有一定的理论支撑。因此,以重构时间尺度分别构建GRNN模型较之于以原始分解IMFs分别构建GRNN模型和直接构建GRNN模型在PM2.5浓度预测中表现出明显的优越性。
Fig. 8 Comparison of predicted values and observed values

图8 预测结果对比

为了进一步验证改进EEMD-GRNN模型的有效性,表5统计了直接构建GRNN模型、以原始IMFs分别构建GRNN模型和以重构时间尺度分别构建GRNN模型的PM2.5浓度预测结果精度指标,其中平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)的值越接近0,则模型预测效果越好,而决定系数的平方(R2)越接近1,则模型越佳。根据表5可看出,改进后EEMD-GRNN模型的PM2.5预测误差指数MAE、MAPE和RMSE值分别为6.17、18.41%和8.32,均小于改进前EEMD-GRNN模型的PM2.5预测误差指数值,并且远小于直接构建GRNN模型的PM2.5预测误差指数值,同时,改进后EEMD-GRNN模型的R2高达0.95,也大于改进前EEMD-GRNN模型和直接构建的GRNN模型。因此,基于重构时间尺度的改进EEMD-GRNN模型对于PM2.5浓度的预测具有模型有效性。
Table 5 Validity test of the PM2.5 concentration prediction models

表5 PM2.5浓度预测模型有效性检验

MAE MAPE/% RMSE R2
GRNN 11.00 36.94 14.05 0.87
EEMD-GRNN 8.37 27.56 11.56 0.91
改进EEMD-GRNN 6.17 18.41 8.32 0.95
高浓度的PM2.5对人们进行户外活动具有严重的负面影响,故而PM2.5高浓度天的准确预测是人们关注的重点。根据世界卫生组织所规定的标准[23],当PM2.5≥101 μg/m3时,PM2.5呈现轻度甚至更高程度的污染,故而进一步分析预测结果中PM2.5浓度大于100 μg/m3的记录,基于重构时间尺度的GRNN模型的PM2.5预测结果精度普遍高于基于原始分解IMFs的GRNN模型的PM2.5预测结果,特别是2017年12月24日当天,前者的预测误差精度达到了39.58%,而后者只有12.03%,并且改进后EEMD-GRNN模型的MAPE为12.02%,明显高于改进前模型的21.05%,基于重构时间尺度构建的PM2.5浓度GRNN预测模型对高污染天的预测具有一定的优势。

5 结论与讨论

PM2.5浓度尤其是高浓度天的准确预测对于人民身体健康及政府公共管理具有重要意义。传统EEMD-GRNN模型在预测PM2.5浓度时,缺少对PM2.5浓度EEMD分解结果的物理意义思考;在构建GRNN模型时,输入变量的选择也多从去除冗余的数学角度考虑,有一定局限性。本研究分析PM2.5浓度多尺度变化以及其对气象因子和大气污染因子的尺度响应,基于时间尺度重构进行EEMD-GRNN模型的改进研究,主要得出以下结论:
(1)基于尺度重构改进的EEMD-GRNN模型,综合考虑PM2.5浓度的变化规律及其对大气污染物和气象因子的多尺度响应,进行PM2.5浓度预测时有一定科学性。南京市样本数据PM2.5浓度的EEMD分解结果经分析表现为明显的天际尺度和月际尺度,天际尺度展现了研究期内PM2.5浓度的逐日细微变化,月际尺度则更多地包含了PM2.5季节性变化及更大尺度的变化趋势信息,因此,从重构尺度(天际、月际)构建GRNN模型更具有现实意义;同时,在PM2.5浓度响应因子的选择上,PM10、NO2、O3(气态污染物)以及RH、MinT(气象因子)存在多尺度响应效应,因此,以其作为GRNN模型中的输入变量更具有时间序列上的解释意义。
(2)改进后的EEMD-GRNN模型具有更高的PM2.5浓度预测精度。南京市PM2.5浓度EEMD-GRNN模型预测结果有效性检验表明,改进模型的MAE、MAPE、RMSE和 R2分别为6.17、18.41%、8.32 和0.95,优于传统EEMD-GRNN模型的有效性检验结果。对于高浓度天的预测,改进模型更是全面优于传统EEMD-GRNN模型,MAPE为12.02%,而传统模型的MAPE高达21.05%。
[1]
任阵海,万本太,苏福庆,等.当前我国大气环境质量的几个特征[J].环境科学研究,2004,17(1):1-6.

[ Ren Z H, Wan B T, Su F Q, et al.Several characteristics of atmospheric environment quality in China at present[J]. Research of Environment Sciences, 2004,17(1):1-6. ]

[2]
Chan C K, Yao X H.Air pollution in mega cities in China[J]. Atmospheric Environment, 2008,42(1):1-42.

DOI

[3]
Bandowe B A M, Meusel H, Huang R, et al. PM2.5-bound oxygenated PAHs, nitro-PAHs and parent-PAHs from the atmosphere of a Chinese megacity: Seasonal variation, sources and cancer risk assessment[J]. Science of The Total Environment, 2014,474(3):77-87.

[4]
Tao J, Zhang L, Ho K, et al.Impact of PM2.5 chemical compositions on aerosol light scattering in Guangzhou — the largest megacity in South China[J]. Atmospheric Research, 2014,136(1):48-58.

[5]
Hu X, Waller L A, Lyapustin A, et al.Estimating ground-level PM2.5 concentrations in the Southeastern United States using MAIAC AOD retrievals and a two-stage model[J]. Remote Sensing of Environment, 2014,140(1):220-232.

DOI

[6]
Xin J Y, Zhang Q, Wang L L, et al.The empirical relationship between the PM2.5 concentration and aerosol optical depth over the background of North China from 2009 to 2011[J]. Atmospheric Research, 2014,138(3):179-188.

DOI

[7]
Wu S W, Deng F R, Hao Y, et al.Fine particulate matter, temperature, and lung function in healthy adults: Findings from the HVNR study[J]. Chemosphere, 2014,108:168-174.

DOI

[8]
韩素芹,张裕芬,李英华,等.天津市春季气溶胶消光特征和辐射效应的数值模拟[J].中国环境科学,2011,31(1):8-12.根据GRIMM气溶胶粒谱分析仪对粒子数浓度在线观测资料,拟合了天津市春季霾日和非霾日的气溶胶粒子谱分布,结合同期气溶胶样品化学组分分析结果,利用米散射理论计算分析霾日和非霾日气溶胶消光特征.在此基础上,对辐射传输模式LOWTRAN7中气溶胶光学参量进行了修正,利用修正后的模式模拟霾日和非霾日的地面辐射通量密度.结果表明,观测期间非霾日气溶胶消光系数平均为0.253km-1,散射系数平均为0.213km-1.霾日气溶胶消光系数平均为0.767km-1,散射系数平均为0.665km-1.对比模式计算的辐射通量密度与观测值,表明短波辐射模拟效果较好.

[ Han S Q, Zhang Y F, Li Y H, et al.Simulation of extinction and radiant effect of aerosol in spring of Tianjin City[J]. China Environment Science, 2011,31(1):8-12. ]

[9]
Tie X X, Wu D, Brasseur G.Lung cancer mortality and exposure to atmospheric aerosol particles in Guangzhou[J], China Atmospheric Environment, 2009,43(14):2375-2377.

DOI

[10]
Jung J, Lee H, Kim Y J, et al.Aerosol chemistry and the effect of aerosol water content on visibility impairment and radiative forcing in Guangzhou during the 2006 Pearl River Delta campaign[J]. Journal of Environmental Management, 2009,90(11):3231-3244.

[11]
Díaz-Robles L A, Ortega J C, Fu J S, et al. A hybrid ARIMA and artificial neural networks model to forecast particulate matter in urban areas: The case of Temuco, Chile[J]. Atmospheric Environment, 2008,42(35):8331-8340.

DOI

[12]
Jian L, Zhao Y, Zhu Y P, et al.An application of ARIMA model to predict submicron particle concentrations from meteorological factors at a busy roadside in Hangzhou, China[J]. Science of The Total Environment, 2012,426(2):336-345.

DOI

[13]
Vlachogianni A, Kassomenos P, Karppinen A, et al.Evaluation of a multiple regression model for the forecasting of the concentrations of NOx and PM10 in Athens and Helsinki[J]. Science of The Total Environment, 2011,409(8):1559-1571.

DOI

[14]
Cobourn W G.An enhanced PM2.5 air quality forecast model based on nonlinear regression and back-trajectory concentrations[J]. Atmospheric Environment, 2010,44(25):3015-3023.

DOI

[15]
Baker K R, Foley K M.A nonlinear regression model estimating single source concentrations of primary and secondarily formed PM2.5[J]. Atmospheric Environment, 2011,45(22):3758-3767.

DOI

[16]
Corani G.Air quality prediction in Milan: Feed-forward neural networks, pruned neural networks and lazy learning[J]. Ecological Modelling, 2005,185(2):513-529.

DOI

[17]
Voukantsis D, Karatzas K, Kukkonen J, et al.Intercomparison of air quality data using principal component analysis, and forecasting of PM10 and PM2.5 concentrations using artificial neural networks, in Thessaloniki and Helsinki[J]. Science of The Total Environment, 2011,409(7):1266-1276.

DOI

[18]
Pérez P, Trier A, Reyes J.Prediction of PM2.5 concentrations several hours in advance using neural networks in Santiago, Chile[J]. Atmospheric Environment, 2000,34(8):1189-1196.

DOI

[19]
Sousa S, Martins F, Alvimferraz M, et al.Multiple linear regression and artificial neural networks based on principal components to predict ozone concentrations[J]. Environmental Modelling & Software, 2007,22(1):97-103.

[20]
Fernando H J S, Mammarella M C, Grandoni G, et al. Forecasting PM10 in metropolitan areas: Efficacy of neural networks[J]. Environmental Pollution, 2012,163(4):62-67.

DOI

[21]
Antanasijević D Z, Pocajt V V, Povrenović D S, et al.PM10 emission forecasting using artificial neural networks and genetic algorithm input variable optimization[J]. Science of The Total Environment, 2013,443(3):511-519.

DOI

[22]
Perez P.Combined model for PM10 forecasting in a large city[J]. Atmospheric Environment, 2012,60(60):271-276.

DOI

[23]
Zhou Q P, Jiang H Y, Wang J Z, et al.A hybrid model for PM2.5 forecasting based on ensemble empirical mode decomposition and a general regression neural network[J]. Science of the Total Environment, 2014,496(2):264-274.

DOI

[24]
Ausati S, Amanollahi J.Assessing the accuracy of ANFIS, EEMD-GRNN, PCR, and MLR models in predicting PM2.5[J]. Atmospheric Environment, 2016,142:465-474.

DOI

[25]
赵娜,焦毅蒙.基于TRMM降水数据的空间降尺度模拟[J].地球信息科学学报,2018,20(10):1388-1395.

[ Zhao N, Jiao Y M.Spatial downscaling simulation of TRMM satellite precipitation data[J]. Jouural of Geo-information Science, 2018,20(10):1388-1395. ]

[26]
徐凯健,田庆久,杨闫君,等.遥感土地覆被分类的空间尺度响应研究[J].地球信息科学学报,2018,20(2):246-253.

[ Xu K J, Tian Q J, Yang Y J, et al.Response of spatial scale for land cover classification of remote sensing[J]. Jouural of Geo-information Science, 2018,20(2):246-253. ]

[27]
Huang N E, Shen Z, Long S R, et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis. Proceedings of the Royal Society of London[J]. Series A: Mathematical, Physical and Engineering Sciences. 1998,454(1971):903-995.

DOI

[28]
Wu Z H, Huang N E.Ensemble empirical mode decomposition:A noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis, 2009,1(1):1-41.

DOI

[29]
Wu Z H, Huang N E.A study of the characteristics of white noise using the empirical mode decomposition method[J]. Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences, 2004,460(2046):1597-1611.

DOI

[30]
Wu Z H, Huang N E.Statistical significance test of intrinsic mode functions[M]. Singapore: World Scientific, 2005.

[31]
Specht D F.A general regression neural network[J]. IEEE Transactions on Neural Networks, 1991,2(6):568-576.

DOI

[32]
王占山,李云婷,陈添,等. 2013年北京市PM2.5的时空分布[J].地理学报,2015,70(1):110-120.

[ Wang Z S, Li Y T, Chen T, et al.Spatial-temporal characteristics of PM2.5 in Beijing in 2013[J]. Acta Geographica Sinica, 2015,70(1):110-120. ]

[33]
王振波,方创琳,许光,等.2014年中国城市PM2.5浓度的时空变化规律[J].地理学报,2015,70(11):1720-1734.

[ Wang Z B, Fang C L, Xv G, et al.Spatial-temporal characteristics of PM2.5 in China in 2014[J]. Acta Geographica Sinica, 2015,70(11):1720-1734. ]

[34]
宓科娜,庄汝龙,梁龙武,等.长三角PM2.5时空格局演变与特征——基于2013-2016年实时监测数据[J].地理研究,2018,37(8):1641-1654.

[ Mi K N, Zhuang R L, Liang L W, et al.Spatio-temporal evolution and characteristics of PM2.5 in the Yangtze River Delta based on real-time monitoring data during 2013-2016[J]. Geographical Research, 2018,37(8):1641-1654. ]

[35]
陈辉,厉青,李营,等.京津冀及周边地区PM2.5时空变化特征遥感监测分析[J].环境科学,2019,40(1):33-43.

[ Chen H, Li Q, Li Y, et al.Monitoring and analysis of the spatio-temporal change characteristics of PM2.5 concentration over Beijing-Tianjin-Hebei and its surrounding regions based on remote sensing[J]. Environmental Science, 2019,40(1):33-43. ]

[36]
Kang H Q, Zhu B, Su J F, et al.Analysis of a long-lasting haze episode in Nanjing, China[J]. Atmospheric Research, 2013,120:78-87.

[37]
Zu Y, Huang L, Hu J, et al.Investigation of relationships between meteorological conditions and high PM10, pollution in a megacity in the western Yangtze River Delta, China[J]. Air Quality Atmosphere & Health, 2017,10(6):713-724.

[38]
Zu Y, Huang L, Hu J, et al.Investigation of relationships between meteorological conditions and high PM10, pollution in a megacity in the western Yangtze River Delta, China[J]. Air Quality Atmosphere & Health, 2017,10(6):713-724.

[39]
Hu J L, Wang Y G, Ying Q, et al.Spatial and temporal variability of PM2.5 and PM10 over the North China Plain and the Yangtze River Delta, China[J]. Atmospheric Environment, 2014,95(1):598-609.

DOI

[40]
李宗恺,潘云仙,孙澜桥.空气污染气象学原理及应用[M].北京:气象出版社,1985.

[ Li Z K, Pan Y X, Sun L Q.Principles and applications of air pollution meteorology[M]. Beijing: China Meteorological Press, 1985. ]

[41]
周亮,周成虎,杨帆,等.2000-2011年中国PM2.5时空演化特征及驱动因素解析[J].地理学报,2017,72(11):2079-2092.

[ Zhou L, Zhou C H, Yang F, et al.Spatio-temporal evolution and the influencing factors of PM2.5 in China between 2000 and 2011[J]. Acta Geographica Sinica, 2017,72(11):2079-2092. ]

文章导航

/