Simulation and Analysis of Carbon Dioxide Concentration in the Surface Layer

  • LIU Yu , 1, 2 ,
  • GUO Jianhong , 1, * ,
  • YUE Tianxiang 1 ,
  • ZHAO Na 1
  • 1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author: GUO Jianhong, E-mail:

Received date: 2015-12-30

  Request revised date: 2016-05-11

  Online published: 2017-02-17


As an important cause of global warming, carbon dioxide concentration and its change has aroused worldwide concern. How to have an explicit understanding of the spatial and temporal distribution of carbon dioxide concentration is a crucial technical challenge for climate change research. In this paper, based on the in situ observation data set collected in the TanSat flight test area, the correlations between the carbon dioxide concentrations and the environmental variables are analyzed, and suitable environment variables can be selected to establish a regression equation, through which we obtain a preliminary trend of surface carbon dioxide concentrations. Then combining the multiple linear regression model and High Accuracy Surface Modelling (HASM), the carbon dioxide concentrations with a high accuracy in the entire test area are produced. The results indicate that the spatial distributions of the carbon dioxide concentrations in the study area are significantly different between three periods, and the short-wave radiation is an important factor for the regression equation. Because of the high temperature and drought condition, the highest concentration appears in the first period especially in the western area. The second period has a different distribution on the carbon dioxide concentration comparing with the previous period, as in this period the high value region moves eastward, and making the concentration high in the eastern area but low in the western area. Both of the second and third periods have similar characteristics except that the high value region in the eastern area is reduced in third period. Moreover, statistical analyses show that the mean absolute error and the mean relative error of the predicted value of the HASM model are 9.8 ppm and 2.48% respectively, which are both lower than the errors produced using the Kriging method, therefore the HASM model remains to have higher simulation accuracy in a condition of few sampling points and low sampling density. Therefore a combined method of multiple linear regression model and HASM model can be used as an effective method for simulating the spatial and temporal distribution of carbon dioxide concentration in the surface layer.

LIU Yu , GUO Jianhong , YUE Tianxiang , ZHAO Na . Simulation and Analysis of Carbon Dioxide Concentration in the Surface Layer[J]. Journal of Geo-information Science, 2017 , 19(2) : 197 -204 . DOI: 10.3724/SP.J.1047.2017.00197

1 引言

全球气候变暖已在国际上引起广泛关注[1-3]。CO2作为重要的温室气体,其在大气中含量的变化能够改变未来气候的发展趋势[4-6],进而影响到国家经济的可持续发展与国家安全。研究标明,与工业革命时期相比,全球大气中CO2浓度已从最初的280 μmol mol 上升到约400 μmol mol [7]。因此,为了控制CO2气体的排放,减少人为因素对气候变暖的促进作用,需要尽可能的了解和认识大气中CO2浓度的时空分布。
基于曲面论的高精度曲面建模方法HASM(High Accuracy Surface Model)是近年来发展起来的一种空间自相关模型[19-21],该方法将问题转化为等式约束的最小二乘问题,把观测值作为目标,通过迭代算法使趋势面逼近真实的曲面。HASM方法已应用于模拟人口分布、土壤信息、气温及降水等方面[22-24],并表现出良好的性能。

2 数据与方法

2.1 观测数据

Fig.1 Location of automatic weather stations

图1 自动气象站安置点分布图

Tab.1 Surrounding environment of automatic weather stations

表1 自动气象站周边环境

气象站名称 植被状况 下垫面类型
镜湖公园 位于城区内,周围是附近居民开辟的小片菜地,植被高度较低,不远处就是成片的建筑物 城市
龙华寺 在一片果园中,植被高度较高约2 m。果树间隙种植了一些玉米 果园
长山农田 在大片农田中,植被覆盖度较高,植被高度约40 cm左右 农田
长山电厂 位于发电厂东侧约600 m,植被覆盖少,地表以裸土、石块、砖块为主。自动站北侧40 m外有大片农田,东侧有些闲置的砖堆 发电厂+农田
查干湖 距离查干湖约100 m,地表植被以杂草为主,植被高度很低 水体附近
乾安 位于一沙场内,自动站一侧是植被覆盖少的沙场,另一侧是植被覆盖多的杂草,杂草高度约40 cm左右 沙地+杂草
鸿兴镇 位于菜地中,自动站南侧主要是玉米等作物,其他区域为葱等高度较低的农作物 农田
黑水镇 位于荒地中,植被很少,主要是高度很矮的小丛的杂草,地表以裸土为主 裸土
鹤岛湿地 位于湿地,植被覆盖度较高,植被高度约1 m左右 湿地+草地
利民草地 位于大片草地中,植被覆盖度很高,植被高度约30 cm左右 草地
向海渔村 位于向海边的向日葵田中,向日葵约2 m 水体附近
自动气象观测站提供CO2浓度(ppm)、地表风速(m/s)及风向(°)、2 m温度(℃)、2 m湿度(%)、土壤温度(℃)、土壤湿度(%)、降水量(mm/min)、向下短波辐射(W/m2)、向上短波辐射(W/m2)和地表气压(hPa)共11种气象要素。本文选取的观测时段为8月19日-9月17日共30 d,对每10 d做平均计算,分别得到8月19日-8月28日、8月29日-9月7日、 9月8日-9月17日共3个时段气象特征的观测数据平均值。

2.2 气象要素场模拟

WRF(Weather Research and Forecasting Model)模式是由美国国家大气中心(NCAR)、美国国家环境预报中心(NCEP)等多个部门联合开发的新一代中尺度天气数值预报模式。该模式属于完全可压缩非静力平衡模式,包含丰富的物理参数化方案选项。因预报准确度高、可移植性好、运算速度快及易于维护等特点,使得该模式广泛应用于气象科研及业务工作中[27-28]
本文使用WRFV3.5版本,对8月19日-9月17日进行模拟。每天20时(北京时)起报,每次积分30 h,初始数据来自于美国国家环境预报中心(NCEP)的FNL1°×1°再分析资料,每6 h更新边界条件。图1中黑框区域是模式设置的模拟区域,空间分辨率为1 km×1 km。物理参数化方案分别选择:YSU边界层方案、Monin-Obukhov近地层方案、WSM6微物理方案、RRTM长波辐射方案、Goddard短波辐射方案、Noah陆面过程、KFETA积云方案。参照自动气象观测站提供的气象要素类型,调整WRF模式的输出数据类型,每半小时输出一次模拟数据,并按照8月19日-8月28日、8月29日-9月7日、9月8日-9月17日做10 d平均计算,与观测数据保持一致。

2.3 模拟方案

(4)将CO2浓度观测值与步骤(3)中的趋势面相减,得到观测点处CO2浓度残差值。用空间分辨率1 km×1 km的栅格组成的矩阵覆盖航飞区,将每个观测点处的残差值输入HASM,计算得出这个矩形计算域中每个栅格处的残差,即获得一个残差面;
C O 2 = θ ols X T + HASM O k - θ ols X T (1)
式中:CO2是CO2浓度空间分布最终结果; θ ols 是步骤(1)中得到的最小二乘回归系数; X T 是步骤(2)中WRF模式输出的气象要素场; θ ols X T 表示 步骤(3)中初步的地表CO2浓度趋势面; O k 为观测点k处观测的CO2浓度值。 HASM O k - θ ols X T 表示步骤(4)HASM输出的残差面。
Fig.2 The flowchart of simulation

图2 模拟流程图

3 模拟结果及分析

3.1 相关分析及多元线性回归分析

本次试验观测数据中的环境变量共有13种,其中包括自动气象观测站提供的10种气象要素,以及观测站所在的经度、纬度和海拔高度。自动气象观测站在观测过程中,风速仪和风向标距离地表的高度约3 m,与WRF输出的地表10 m高度风速风向不符,因此下述分析中不考虑风速及风向。根据采样结果,第1时段可用的采样点数为11个,第2时段10个,第3时段9个。
Tab.2 Correlation analysis between CO2 concentration and environmental variables

表2 各时段CO2浓度与环境变量相关性分析

采样点数/个 11 10 9
纬度 0.1494 -0.0185 0.1484
经度 -0.2443 0.6686** 0.5998*
海拔 0.1884 -0.4430 -0.3562
雨量 0.0152 0.0247 0.0653
大气温度 -0.1553 -0.5578* -0.4740*
土壤温度 -0.5031 0.0370 0.0678
向下短波辐射 0.6114** -0.5739* -0.1991
向上短波辐射 0.0322 -0.6928** -0.4077*
土壤湿度 0.1407 -0.2775 -0.2722
大气湿度 0.2785 0.3789 0.2644
地表气压 -0.1090 0.4328 0.4431*
利用CO2浓度与环境变量相关性分析的结果,选择较显著相关以上的环境变量作为备选解释变量,建立各时段内CO2浓度与解释变量之间的多元线性回归方程,同时检查环境变量之间的多重共线性,并进行T检验,从中选择校正R2最大的方程,作为该时段内CO2浓度的回归方程。该部分使用 ArcGIS软件中的“探索性回归”工具进行计算。
表3列出了回归分析的结果。由于变量间的多重共线性,第2时段的经度、向下短波辐射和第3时段的经度被排除。经过回归分析之后,得到的3组回归方程均包含了向下短波辐射或向上短波辐射,说明在该观测时段内,短波辐射是影响CO2浓度空间分布的一个重要因素。第1时段和第2时段建立的回归模型达到显著水平(p≤0.05),第3时段较显著(p≤0.1)。3个时段回归方程的校正R2在0.3-0.6之间,其中9月19日-9月28日最低为0.304, 9月29日-10月7日最高为0.568,说明回归方程能够部分代表CO2浓度的变化。考虑到WRF中尺度模式输出的气象要素场相对于真实大气必然存在偏差,当使用回归方程和模拟气象要素场得到初步的CO2浓度趋势面时,二者偏差的叠加会进一步影响到趋势面的准确度。在此基础上,需要使用HASM对CO2浓度进行残差修正。
Tab.3 Regression models of CO2 concentration

表3 CO2浓度回归方程

时段 回归方程 校正R2 P
8月19日-8月28日 CO2= 327.995752+ 0.439485×向下短波辐射 0.304 0.046
8月29日-9月7日 CO2= 682.554308-12.271210×2 m温度-0.833343×向上短波辐射 0.568 0.022
9月8日-9月17日 CO2=-2714.532387-6.129403×2 m温度-0.510322×向上短波辐射+3.258770×地表气压 0.506 0.095

3.2 模拟结果分析

Fig.3 Spatial distribution of CO2 concentration from 19 August to 28 August

图3 8月19日-8月28日CO2浓度空间分布模拟图

由第1时段CO2浓度空间分布模拟图(图3)可以看出,该时段内航飞区CO2浓度大体呈现西部高东部低的特点。以123.5°E为界,航飞区西侧大片区域CO2浓度均超过405 ppm,特别是在该区域的北侧和向海以南的部分地区浓度超过410 ppm。航飞区东侧CO2浓度整体比西部偏低,其中乾安县及松原城区附近的CO2浓度在390~400 ppm之间,长山镇附近存在小片的高值区,CO2浓度超过405 ppm。
图4为第2时段CO2浓度空间分布模拟图。图中显示,与第1时段相比,该时段CO2浓度高值区东移,浓度整体分布特征与第1时段相反,呈现出西部低东部高的特点。该时段内高值区主要在松原市及以东地区,部分区域浓度超过405 ppm。从查干湖地区到松原市区能够看到明显的CO2浓度梯度带,长山镇及乾安县位于该梯度带上,CO2浓度约390~395 ppm。从查干湖地区到西部的向海一带均是低值区,浓度在385 ppm以下。
Fig.4 Spatial distribution of CO2 concentration from 29 August to 7 September

图4 8月29日-9月7日CO2浓度空间分布模拟图

图5为第3时段CO2浓度空间分布模拟图。该时段的CO2浓度分布特点与上一时段类似,整体上航飞区西部浓度偏低,东部偏高。东部400 ppm以上的高值区的范围明显缩小,高值区主要位于松原市、长山镇及东北方向的部分区域,查干湖、乾安县一带地区在395 ppm以下。乾安县西南侧存在一些零散的高浓度区,其浓度值在400 ppm以上。航飞区西部大部分地区CO2浓度小于395 ppm,仅在北侧部分区域超过395 ppm。
Fig.5 Spatial distribution of CO2 concentration from 8 September to 17 September

图5 9月8日-9月17日CO2浓度空间分布模拟图

在第3时段内,航飞区西北和东南区域存在CO2浓度显著偏小的区域,这与该时段回归方程的解释变量中包含了地表气压(PSFC)项有关。由于自动气象站的架设地点位于松嫩平原,各站点间的海拔高度差距不大,获取的地表气压数据主要代表平原地区的特点。本次试验选取的模拟区域中,西北侧为内蒙古高原的边缘,海拔超过350 m;东南为前郭尔罗斯蒙古族自治县海拔较高的洪泉乡,海拔超过250 m。与松嫩平原相比,高海拔地区模拟的地表气压会偏低,且考虑到回归方程中地表气压(PSFC)是正贡献,从而使得CO2浓度异常偏低。

3.3 模拟精度对比

Kriging插值方法又称空间自协方差最佳插值法,是一种被广泛应用的经典插值方法。将第1时段航飞区的11个观测站进行划分,抽取1个站点为验证点,剩余10个为采样点,分别利用HASM及Kriging方法进行插值试验,试验重复11次,计算 2种方法的模拟误差。第2、3时段依照可用的观测站数量进行相同的处理和计算。绝对误差MAE和相对误差MRE的表达式如式(2)、(3)所示。
MAE = 1 n k = 1 n o k - s k (2)
MRE = 1 n k = 1 n o k - s k / o k × 100 % (3)
式中: n 是验证点总数; o k 是第 k 个观测站的观测值; s k 是第 k 个观测站所在位置的模拟值。
模拟结果误差分析见表4。结果为:① Kriging方法绝对误差平均值为10.3 ppm,HASM模型模拟结果为9.8 ppm,比Kriging方法小0.5 ppm; ② HASM模型相对误差平均值为2.48%,比Kriging方法低0.12%。前人的研究结论中已经指出,在采样点数量较多,采样密度较大时,HASM模拟结果比经典插值方案有明显提高。本文实验显示在采样点较少及采样密度较低的情况下,与Kriging方法相比,HASM模型的模拟精度也有所提升。
Tab.4 Absolute error and relative error between Kriging and HASM

表4 Kriging与HASM误差分析

时段 Kringing HASM
MAE/ppm MRE/% MAE/ppm MRE/%
8月19日-8月28日 10.6 2.63 10.1 2.52
8月29日-9月7日 11.3 2.89 10.7 2.74
9月8日-9月17日 9.1 2.28 8.7 2.19
平均 10.3 2.60 9.8 2.48

4 结论

本文根据吉林省航飞区内11个自动气象观测站获取的CO2浓度(ppm)、地表风速(m/s)、风向(°)、2 m温度(℃)、2 m湿度(%)、土壤温度(℃)、土壤湿度(%)、降水量(mm/min)、向下短波辐射(W/m2)、向上短波辐射(W/m2)、地表气压(hPa)共11种气象要素及观测站经纬度、海拔高度等数据,运用多元线性回归与HASM相结的方法,对航飞区CO2浓度的空间分布进行了3个时段的模拟。结论如下:
(1)每个时段回归方程中保留的解释变量不完全相同,说明10 d尺度的CO2浓度空间分布受气象条件的影响较大,同时也体现出短波辐射是CO2浓度分布计算的重要因素。
(2)各时段CO2浓度空间分布差异明显,第1时段整体浓度最高,航飞区西部超过405 ppm。第2时段CO2浓度高值区东移,呈现西低东高的分布特点,低值区小于385 ppm,高值区在405 ppm以上。第3时段浓度空间分布与第2时段有类似的特征,但细节存在差异,405 ppm以上的高值区范围缩小。
本文使用回归方程的方法适用于少量时段模拟。若对大量时段进行模拟,每10 d天需要更换一个回归方程的方法则过于繁琐,可考虑使用大气传输模型代替回归方程,产生初步的CO2浓度趋势面。国内外CO2地面观测点数量较少且分布稀疏,即使本文中模拟区域的范围不大,但11个观测点仍然偏少,模拟结果的准确度仍需进一步提高。

