地球信息科学理论与方法

基于Argo剖面浮标观测的海洋溶解氧空间-质量迭代插值方法

  • 岳林峰 , 1, 2, 3 ,
  • 薛存金 , 1, 2, * ,
  • 王振国 1, 2, 3 ,
  • 牛超然 1, 2, 3
展开
  • 1.中国科学院空天信息创新研究院数字地球重点实验室,北京 100094
  • 2.可持续发展大数据国际研究中心,北京 100094
  • 3.中国科学院大学,北京 100049
* 薛存金(1979—),男,山东菏泽人,博士,研究员,主要研究方向为海洋地理信息系统、海洋时空分析方法。 E-mail:

岳林峰(1998—),男,河南安阳人,硕士生,研究方向为海洋时空数据挖掘分析。E-mail:

收稿日期: 2022-09-23

  修回日期: 2023-02-02

  网络出版日期: 2023-09-22

基金资助

中国科学院A类战略先导专项(XDA19060103)

可持续发展大数据国际研究中心创新研究计划项目(CBAS2022IRP05)

An Iterative Space-quality Interpolation Method for Marine Dissolved Oxygen Data Observed by Argo Floats

  • YUE Linfeng , 1, 2, 3 ,
  • XUE Cunjin , 1, 2, * ,
  • WANG Zhenguo 1, 2, 3 ,
  • NIU Chaoran 1, 2, 3
Expand
  • 1. Key Laboratory of Digital Earth Science, Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing 100094, China
  • 2. International Research Center of Big Data for Sustainable Development Goals, Beijing 100094, China
  • 3. University of Chinese Academy of Sciences, Beijing 100049, China
* XUE Cunjin, E-mail:

Received date: 2022-09-23

  Revised date: 2023-02-02

  Online published: 2023-09-22

Supported by

Strategic Priority Research Program of the Chinese Academy of Sciences(XDA19060103)

Innovative Research Program of International Research Center of Big Data for Sustainable Development Goals(CBAS2022IRP05)

摘要

溶解氧是探究海洋内部各种生物地球化学循环过程以及评估海洋健康的重要参数。目前,基于Argo剖面浮标的观测方式已经成为获取海洋溶解氧信息的主要来源之一,但是这种方式获取到的海洋溶解氧资料在空间上是离散分布的。如何利用空间插值方法将离散的Argo溶解氧剖面观测数据构建成连续的空间网格数据是当前研究关注的热点,本文提出了一种面向Argo溶解氧剖面观测数据的空间-质量特征的迭代插值方法(ASOSQIM)。针对观测样点空间上分布离散、不规则的特点,ASOSQIM首先对溶解氧观测数据进行空间初始化来构建初始背景场,然后对Argo溶解氧剖面观测样点进行空间异质性分区,采用空间-质量定权的方式赋予不同质量标示数据相应的权重系数来解决参与插值的数据量及其精度问题,最后利用迭代插值的思想并集成溶解氧空间分区特征和质量标识,实现了基于Argo剖面浮标观测的溶解氧浓度空间插值。利用交叉验证法和WOA18资料对ASOSQIM进行方法验证和对比分析,结果表明:① ASOSQIM的插值精度相比于其他空间插值方法具有大幅度的提升,与2022年同期Argo浮标溶解氧观测结果进行对比,验证了该方法的优越性和可行性; ② 利用ASOSQIM得到的溶解氧浓度插值结果与WOA18溶解氧资料具有高度一致性,溶解氧浓度绝对误差在20 μmol/kg范围内的区域占比达到85%以上,表明利用该方法得到的插值结果具有可靠性。

本文引用格式

岳林峰 , 薛存金 , 王振国 , 牛超然 . 基于Argo剖面浮标观测的海洋溶解氧空间-质量迭代插值方法[J]. 地球信息科学学报, 2023 , 25(10) : 2000 -2011 . DOI: 10.12082/dqxxkx.2023.220720

Abstract

Dissolved oxygen is an important parameter for exploring various biogeochemical cycles in the ocean interior and assessing ocean health. At present, the observation method based on Argo floats has become one of the main sources to obtain the information of Marine dissolved oxygen, but the data obtained by this method are distributed discretely in space. How to use spatial interpolation method to construct discrete dissolved oxygen profiles of Argo floats into continuous spatial grid data is the focus of current research. Therefore, an iterative interpolation method (ASOSQIM) for spatial-quality characteristics of dissolved oxygen observation data using Argo floats is proposed in this paper. It is of great significance to integrate discrete Marine dissolved oxygen data to obtain spatially distributed continuous grid data for exploring and revealing the variation law of Marine dissolved oxygen concentration and providing reliable data support and information services for related fields. In view of the discrete and irregular spatial distribution of the observed sample points, ASOSQIM carries out a series of processing on the dissolved oxygen observation data using Argo floats, such as monthly statistics, quality recontrol and standardized interpolation. Based on the processed dissolved oxygen observation data, the spatial initialization was carried out, and the dissolved oxygen concentration on the regular grid after initialization was taken as the initial value of spatial interpolation calculation. Then, the dissolved oxygen observation data using Argo floats were divided into different spatial heterogeneity zones, and the corresponding weight coefficients were assigned to data of different quality flags by using the space-quality weighting method to solve the problem of the amount of data involved in interpolation and its accuracy. Finally, the idea of iterative interpolation was used to integrate the spatial partitioning characteristics and quality flags of dissolved oxygen. The spatial interpolation of dissolved oxygen concentration based on observation data of Argo floats is realized. The cross-validation method and WOA18 data were used to verify and compare ASOSQIM. The results show that: (1) the interpolation accuracy of ASOSQIM is significantly improved compared with other spatial interpolation methods. The advantages and feasibility of this method are verified by comparing with the dissolved oxygen observation results of Argo floats in 2022. (2) The dissolved oxygen concentration interpolation results obtained by ASOSQIM are highly consistent with the dissolved oxygen data of WOA18, and the absolute error of dissolved oxygen concentration accounts for more than 85% in the range of 20μmol/kg, indicating that the spatial interpolation results of dissolved oxygen concentration obtained by this method are reliable.

1 引言

溶解氧是海洋学的基本参数,也是影响海洋健康的重要因子。海洋溶解氧的分布受生物化学和物理过程的影响[1],与海洋生产力、生物多样性以及生物地球化学循环等具有十分密切的关系[2]。溶解氧浓度对受海洋物理和生物化学驱动的局部和全球变化以及不同时空尺度的人为影响非常敏感[3-5]。目前,关于溶解氧的网格化数据产品及其趋势评估的研究[6_8]基本上是基于船载平台获取的水样数据集,其溶解氧浓度通常是用改进的“Winkler滴定法”[9-10]测量而来。尽管Winkler化学分析法一直被认为是获取溶解氧含量最准确的方式,但是船测方式必然存在着采样率过低和时空分辨率不足的缺陷[11]。这种观测能力上的缺陷不能满足在全球海洋范围内全方位,大尺度时空观测的需求,从而也制约了进一步探索海洋内部各种环境要素的变化。
Argo计划是由美国和日本等国科学家在1999年的海洋观测大会上提出并开始实施的,通过投放自由漂浮浮标来构建一个全球海洋的连续实时,垂直立体的多方位多要素综合观测平台。Argo是目前唯一立体观测全球上层海洋的实时观测系统[12],已成为全球海洋观测系统的重要组成[13],在很大程度上改善了海洋内部观测信息严重不足的状况。Argo浮标最初只携带用于物理海洋学和水文地理学研究而设计的温盐传感器,自从Gruber等[14]呼吁在Argo浮标上增加溶解氧传感器以来,Argo溶解氧剖面的采集数量大幅增加。截止到2021年为止,Argo计划已在全球累计部署可观测溶解氧的生物地球化学浮标超过1 600个,共采集溶解氧剖面信息累计超过22万条。
如何采取有效的方法将稀疏离散、分布不规则的Argo溶解氧剖面观测数据进行整合(数据拟合、插值等)得到标准化的网格资料,有助于深入了解和揭示海洋溶解氧三维结构及其时空变化规律。目前针对Argo资料的海洋要素场重构以客观分析的方法为主,客观分析法是大气和海洋科学中处理离散点数据最为常见的方法[15],其中应用最为普遍的方法是最优插值法[16-18],该方法由Eliassen在 1954年提出,Gandin[19]改进应用于客观分析中,是一种以线性最小平方估计理论为基础的统计插值法。此类方法需要大量的观测资料和数值模式的各种误差统计信息,计算量大且操作复杂[20]。随着近年来空间大数据分析与应用的快速发展,区别于传统的基于统计学的插值方法需要大量的专家经验和背景知识[15],空间插值方法通过空间影响范围内的数据采样点进行插值,可以一定程度上解决空间范围内采样点不足带来的插值精度降低的问题,一般常用的空间插值方法有反距离加权(IDW)、克里金(Kriging)、趋势面、样条函数、自然邻域法等。现有的空间插值方法对于不同领域的空间数据具有不同的适应性[21]。近年来,一些学者针对不同需求将一些空间插值方法应用到了海洋要素场重构中。例如杨胜龙等[22]采用Argo数据,将基于地统计的克里金插值方法用于太平洋温度场重构,以揭示太平洋温度场特征。张韧等[23]利用Argo温盐剖面数据,基于时空权重插值得到温度场后,采用多变量DINEOF方法弥补了时空权重插值结果中包含缺失数据的不足,实现了太平洋区域2000年1月—2008年12月的三维逐周盐度场的重构。王文娟等[24]提出基于距平分析的Argo海表温度(SST)重构方法,即在Argo浮标观测点提取温度距平值序列进行Kriging插值生成距平场,并叠加气候态SST的方法重构Argo海温场。一般的空间插值方法都是以假设空间过程的平稳性为前提[25],并没有充分考虑空间异质性在插值过程中产生的影响。
上述的插值方法面向海洋表面温度、盐度等海洋环境要素,且没有考虑海洋环境要素的空间异质性和数据分布情况。鉴于Argo溶解氧剖面在全球海洋数量有限且分布极不均匀,同时刻或时段内所能获取的数据信息较为有限,上述的空间插值方法并不适宜于直接用于分析处理Argo溶解氧剖面观测数据。因此本文提出了一种基于Argo溶解氧剖面观测数据的空间-质量特征的迭代插值方法,将离散的海洋溶解氧数据进行整合得到空间分布连续的网格资料,对探索和揭示海洋溶解氧浓度变化规律以及为相关领域提供可靠的数据支撑和信息服务具有重要意义。

2 ASOSQIM方法流程

本研究基于Argo溶解氧剖面观测数据空间特征和质量标示特征进行溶解氧浓度空间插值方法的研究,整体技术流程图如图1所示,主要包括以下4个步骤:① 对Argo溶解氧剖面观测数据进行逐月统计、质量再控制和标准化插值等一系列处理,基于处理后的溶解氧观测数据进行空间初始化,将初始化后的规则网格上的溶解氧浓度作为空间插值计算的初始值;② 基于对Argo溶解氧剖面观测数据的空间特征分析,对溶解氧观测样点采取空间位置+属性特征一体化的K-means聚类方法进行空间异质性分区,将溶解氧观测样点划分到一定数量的空间连续区域中,使得参与各区域内部空间插值的溶解氧观测样点同质;③ 通过对Argo溶解氧剖面观测数据质量标示特征的分析,针对数据的不同质量标示赋予相应的权重,融合构建最终的空间-质量权重函数,服务于下一步的迭代插值计算;④ 在上述步骤的基础上,考虑使用逐步迭代的插值思想,使得最终插值结果不断逼近溶解氧观测值,得到最终的空间插值结果。
图1 ASOSQIM方法流程

Fig. 1 The flow chart of the ASOSQIM

2.1 空间初始化

在对海洋溶解氧浓度场进行规则格网插值重构的过程中,由于Argo溶解氧剖面在空间分布上存在明显差异,因此直接利用空间关系对溶解氧浓度进行空间插值难以达到较好的插值效果。径向基函数(Radial Basis Function, RBF)插值是一种光滑插值方法,具有结构简单和维度扩展且精度较高等优点[26],RBF插值方法的基本原理是在每个插值中心处构建径向距离对称的基函数,并对其进行线性加权组合[27]。RBF插值模型能够准确逼近任意维度的数据,且不需要对空间结构进行预先估计,不需要对数据做任何统计假设[28]。与此同时,径向基函数插值模型在精确性插值的基础上能够输出光滑的插值表面[29]。本文拟通过使用局部的RBF插值方法对海洋溶解氧浓度场进行空间初始化。
假设给定一组 n个采样点 x i , f x i i = 1 n参与插值,点 x i上的测量值为 f x i,则使用RBF插值模型构建的插值函数 s x可以表示为:
s x = i = 1 n λ i ϕ x - x i 2
式中:等式左边的 s x是表达了在 x点上的插值结果; λ i为第 i个采样点对应的影响系数。本文中的采样点选择 n个最邻近点, x - x i 2是当前待插值点 x和采样点 x i的距离。 ϕ x - x i 2为径向基函数,常见的基函数包括薄板样条函数、张力样条函数、规则样条函数、高次曲面函数和反高次曲面函数等,在不同的插值应用中,每种基函数都有不同的适用情况和对应的插值结果,需要根据使用情况选择合适的基函数,本文根据溶解氧分布特点,选用高次曲面函数作为径向基函数构建插值模型。接下来需要对影响系数 λ i进行求解,式(1)使用矩阵的形式可以表示为:
ϕ λ = f
式中: f = f 1 , , f n T表示该组 n个采样点对应的溶解氧浓度观测值; λ= λ 1 , , λ n T是系数向量。矩阵 ϕ = ϕ 11 ϕ 1 n ϕ n 1 ϕ n n是一个 n × n的插值矩阵,其值由径向基函数 ϕ ( x - x i 2计算得出。由式(2)可以计算得出影响系数 λ i,再将影响系数代入式(1)即可得到待插值点的溶解氧浓度,进而实现海洋溶解氧浓度场的空间初始化。

2.2 空间异质性分区

Argo溶解氧剖面观测数据具有位置信息,空间数据具有相应的空间相关性和空间异质性的一般特性[30]。由于空间异质性的影响,研究区域不同子区域之间的属性值可能存在较大的差异,这样空间上邻近两个点的属性值也有可能相差很多[21],因此需要进行空间分区来避免不同分区之间空间异质性对插值结果带来的影响。本文通过引用空间位置与属性特征一体化的K-means聚类方法[31]对溶解氧观测数据进行空间异质性分区。空间异质性分区的基本步骤如下:① 对观测样点的经纬度坐标以及溶解氧属性值进行无量纲化处理,以消除坐标值和属性特征之间量纲和取值范围差异的影响,公式如式(1)所示。 m m i n m m a x分别为坐标值或属性值 m i的最小值和最大值,无量纲处理后的 n i介于0~1之间,这样各属性特征之间、属性特征和空间坐标之间具有横向可比性;② 从数据自身出发来确定最佳聚类数 K,轮廓系数可以评价聚类效果的好坏,轮廓系数结合了内聚度、分离度2种因素,通常数值越大,聚类效果越好[32],具体做法是是让 K从1开始取值直到取到我们认为合适的上限(选取上限为20),对每一个 K值进行聚类并且记下对应的轮廓系数,最后选取轮廓系数最大值对应的 K作为的最佳聚类数; ③ 根据坐标值和属性值制定相应的相似性度量函数,公式如式(4)所示; ④ 根据分组数据再次计算每个聚类簇的中心,以此类推,直到聚类中心不再改变或达到最大迭代次数为止。
n i = m i - m m i n m m a x - m m i n
D i s = x i - x j 2 + y i - y j 2 + k = 1 n m i k - m j k 2
式中:( x i , y i)表示观测样点的坐标,对应的属性向量为 ( m i 1 , m i 2 , , m i n )。然后计算每个观测样点到聚类中心的距离,并以最近距离为度量对数据集进行划分。
经过上述步骤,将离散的溶解氧观测数据划分为不同类别的异质性分区数据,这样在进行空间网格点插值的时候可以针对不同区域不同类别筛选参与插值的观测数据,降低空间异质数据对插值结果造成的影响。

2.3 空间-质量定权

高质量的溶解氧观测数据是保证海洋溶解氧插值结果真实可靠的基础。Argo浮标观测资料的发布需要经过全球Argo数据中心(GDACs)的实时质量控制和延时质量控制等一系列数据检验流程[33]。在对观测数据进行一系列的质量测试过程中,Argo数据中心会根据测试结果赋予数据相应的质量标示。根据Argo用户手册对观测数据质量的描述,本文使用以下2类质量标示的溶解氧剖面数据:① 质量标示为1,经过所有质量控制检验且在数据统计上是一致的高质量数据;② 质量标示为2,经过延时质量控制后评价为质量较高且可用的数据。
传统的空间插值方法一般只考虑待插值点与观测样点之间的空间相关性,即距离待插值点越近的观测样点对插值的影响越大。一般来讲,彼此距离较近的事物要比彼此距离较远的事物更相似,这也符合地理学第一定律。本文以欧氏距离作为空间距离度量,每个观测样点权重大小的确定采取反距离权重法,即邻域内每个观测样点都有一种局部影响,这种影响会随着距离的增大而减小,反距离权重以其插值原理简单、计算简便且符合地理学第一定律而被广泛使用[34],具体可表示为:
W k = 1 d k 2 k K 1 d k 2
式中: K为邻域内观测样点的数量; d k表示第 k个观测样点到待插值点的距离,幂参数值为2。考虑到Argo溶解氧剖面观测数据的实际分布情况,局部区域需要不同质量标示的溶解氧数据参与插值计算,为保证插值精度,应将参与插值的溶解氧数据的质量标示纳入考虑。理论上,当待插值点周围邻域内存在质量标示不一致的观测样点时,质量标示为1的观测样点权重应大于质量标示为2的观测样点。本文在原有权重函数式(5)的基础上引入数据质量标示加权的方式来解决这一问题。对不同质量标示的数据赋予不同的权重,根据GDACs对溶解氧浓度质量控制的具体测试和相关中间参数描述[33],本文定义不同溶解氧数据质量标示的权重分配如式(6)所示。
w q c = 0.7 ( q c = 1 ) 0.3 ( q c = 2 )
根据式(5)和式(6)确定最终的溶解氧空间-质量权重函数为:
W k = w q c × 1 d k 2 k K 1 d k 2

2.4 迭代插值模型

本文使用的迭代插值思想基于逐步订正方法。逐步订正方法早在1959年由Cressman[35] 提出,广泛应用于气象和海洋科学领域的数值资料客观分析中。该方法基于迭代的思想,利用观测数据对初始背景场逐步修正增量直至达到精度要求。
基于上述内容可知,本文首先构建了初始背景场以解决溶解氧剖面空间分布不均的问题,然后通过聚类的方法对观测样点进行空间异质性分区从而保证了参与插值计算的观测样点来源于同一分区,此外还通过质量标示加权的方式来解决不同质量标示的数据如何参与插值计算。基于此提出了一种综合Argo溶解氧剖面观测数据空间特征和质量标示的迭代插值模型,在给定初始背景场的基础上,用实际观测值不断修正背景值,使得最终的插值分析结果逼近观测值[35]。其迭代过程可以表示为:
α i n + 1 = α i n + Δ α i n
α i n = k = 1 K w k 2 D o x y k - α i n j = 1 K w k
式中: α i n表示第i个网格点上经过 n次迭代后的插值结果; n为迭代次数,当 n = 0时即为该网格点溶解氧浓度的初始背景值; D o x y k表示该网格点邻域内的第 k个观测样点; w k为第 k个观测样点的权重系数,共计有 K个溶解氧观测数据。具体的插值计算过程包括:① 选用2.1节中的初始化结果作为迭代插值的初始背景场;② 确定参与插值的观测样点,因为具有溶解氧观测值的样点分布不均匀,最初的搜索邻域为待插值点所在的1°×1°网格窗口,结合溶解氧观测样点数据空间分布特征,搜索过程中要保证至少有3个及以上来自同一类型分区的观测样点,否则搜索范围逐步扩大到3°×3°、5°×5°网格窗口,以此类推(最大搜索范围设定为9°×9°网格窗口)。③ 运用权重函数式(7)计算邻域内的每个观测样点在插值计算中所占的权重系数;④ 运用式(8)和式(9)逐步迭代计算得到插值结果,其中逐步迭代计算的过程为:若 Δ α i n < 1.00 μ m o l / k g,输出网格点插值结果,否则将插值计算得到的结果代入式(9)中继续进行迭代计算,直至满足 Δ α i n的迭代阈值。

3 方法验证与对比分析

本文使用来源于全球Argo数据中心(GDAC)(https://argo.ucsd.edu)的累计22万余条Argo浮标溶解氧剖面观测数据,空间范围为全球海域,时间范围为2010—2021年。尽管这些资料已经经过Argo数据中心的实时质量控制和延时质量控制,为确保数据质量可靠,本文对观测数据进行质量标示筛选和质量再控制,包括逻辑一致性检验,局部异常值清洗等。由于Argo浮标在工作过程中获取的单个溶解氧剖面数据在垂直方向上是离散且不统一的,需要将垂直方向上的溶解氧剖面观测值插值到统一标准层。本文采用Akima[36]插值法将不等间隔的溶解氧剖面观测数据插值到垂直方向上的标准层上,实现溶解氧剖面观测数据在垂直标准层上的统一。

3.1 方法实例验证

为了验证本文方法的可行性和优越性,选取 1月(冬季)和7月(夏季)海洋表层10 dbar处的溶解氧浓度数据,将本文提出的方法(ASOSQIM)对比未考虑Argo溶解氧剖面观测数据空间-质量特征的迭代插值方法(ASOIM)以及经典反距离权重插值法(IDW)、普通克里金插值法(KRG)、全局多项式插值法(GPI)以及Cressman插值方法,为了保证实验结果的正确性,反距离权重插值法和Cressman插值法邻域搜索方式与本文方法保持一致,径向基函数插值法、全局多项式插值法以及普通克里金插值法的参数选择使用对模型交叉验证优化后的最佳值。实验方案采用留一交叉验证法[37]进行插值精度评价,即每次移除一个Argo溶解氧剖面观测值,利用其他观测数据插值计算该点处的预测值,通过对观测值和和预测值进行误差分析来评价插值结果质量,并选取平均绝对误差(Mean Absolute Error, MAE),平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)以及均方根误差(Root Mean Square Error, RMSE)3个常用指标对实验结果进行分析。
用以上6种插值方法进行实验并对所有溶解氧观测样点进行交叉验证得到各项误差指标,其中实验方法名加数字1和7(如ASOSQIM_1)表示该方法在相应月份的溶解氧浓度数据上的应用,如表1所示。虽然1月和7月的海洋表层10dbar处的溶解氧观测数据分布不同,由表1可以发现,2次实验中不同方法的交叉验证结果具有一致性,GPI方法插值结果误差最大,其平均绝对误差达到了8.20 μmol/kg和8.69 μmol/kg,其次是Cressman插值方法,其平均绝对误差为4.0 5μmol/kg和 5.20 μmol/kg,IDW和KRG方法的插值精度相近,略好于Cressman插值方法。本文提出的ASOSQIM插值效果明显优于其他方法,平均绝对误差为2.90 μmol/kg和3.47 μmol/kg,其次是未考虑Argo溶解氧剖面观测数据空间-质量特征的迭代插值方法(ASOIM),为3.26 μmol/kg和4.08 μmol/kg。
表1 全部观测样点的交叉验证结果

Tab. 1 Cross-validation results of all observed samples

MAE/(μmol/kg) RMSE/(μmol/kg) MARE/%
ASOSQIM_1 2.90 5.94 1.06
ASOIM_1 3.26 6.18 1.06
IDW_1 4.21 7.06 1.56
KRG_1 4.12 6.85 1.53
GPI_1 8.20 12.64 3.18
Cressman_1 4.05 8.23 1.66
ASOSQIM_7 3.47 8.40 1.44
ASOIM_7 4.08 8.76 1.52
IDW_7 4.94 9.43 2.01
KRG_7 4.83 9.24 1.97
GPI_7 8.69 15.74 3.68
Cressman_7 5.20 10.17 1.88
上述的交叉验证结果是针对全球海域所有的溶解氧观测样点,为了验证本文所提出的溶解氧观测数据空间异质性分区以及空间-质量定权的有效性,我们对位于空间异质性分区边界以及数据质量标示与周围观测点不一致的部分溶解氧观测样点进行交叉验证得到各项误差指标,如表2所示。相比于表1中全部溶解氧观测样点的实验结果,针对空间异质性分区边界数据和质量标示与周围数据不一致的数据,本文所提出的ASOSQIM的插值精度具有更明显的提高。
表2 部分观测样点的交叉验证结果

Tab. 2 Cross-validation results of some observed samples

MAE/(μmol/kg) RMSE/(μmol/kg) MAPE/%
ASOSQIM_1 4.38 7.67 1.46
ASOIM_1 5.83 10.64 2.20
IDW_1 7.27 11.42 2.72
KRG_1 7.12 11.06 2.67
GPI_1 11.87 15.15 4.07
Cressman_1 8.22 13.45 3.62
ASOSQIM_7 4.39 12.23 2.65
ASOIM_7 6.04 13.84 3.48
IDW_7 8.04 16.09 3.97
KRG_7 7.98 16.00 3.91
GPI_7 13.11 24.62 6.90
Cressman_7 9.28 15.06 4.39
为了更直观地表现不同方法插值实验的误差结果,分别将表2中平均绝对百分比误差绘制成柱状图2(a)图2(b)。由图2可以发现,不同方法的平均绝对百分比误差指标在1月和7月的变化具有趋势一致性,说明实验结果在不同月份数据分布的影响下具有一定的稳定性。同时可以发现ASOSQIM插值精度相比其他插值方法具有大幅度的提高,其中本文所提出的方法插值精度最高,GPI插值精度最差,本文方法相较于ASOIM以及IDW、KRG、GPI、Cressman插值方法精度分别提高了28.5%、39.5%、38.5%、62.5%、49%。
图2 6种空间插值方法的MAPE交叉验证结果

Fig. 2 MAPE cross-validation results of six spatial interpolation methods

此外,将ASOSQIM插值结果与2022年未参与插值计算的同期实测数据进行比较,如表3所示,最大误差7.996 μmol/kg,平均绝对误差3.362 μmol/kg,平均相对误差1.37%。这充分表明ASOSQIM方法插值效果稳定性,准确性也相对更高,在海洋溶解氧空间重构应用中优势明显。原因为ASOSQIM进行了空间异质性分区并兼顾质量标示加权,降低了异质性数据在插值计算中的影响并通过减少质量标示较差数据的插值权重实现了总体插值精度的提高。同时,相比于传统的空间插值方法,本文通过对历史观测数据进行径向基函数插值构建了初始背景场,在插值计算过程中采用逐步订正的思想,利用订正值来不断迭代逼近观测值,这样减少了待插网格点周围溶解氧数据浮动较大或极端异常值带来的插值误差,从而提高了插值精度,既能保证插值得到的海洋溶解氧浓度场相对平滑稳定也能体现溶解氧浓度的细微变化和波动。
表3 ASOSQIM插值结果与实测值比较

Tab. 3 Comparison between ASOSQIM interpolation results and measured values

编号 浮标ID 周期 观测值/(μmol/kg) 插值结果/(μmol/kg) 绝对误差/(μmol/kg) 相对误差/%
1 1902381 1 210.831 211.825 0.994 0.47
2 5906035 99 240.255 241.454 1.199 0.50
3 5904844 183 215.156 216.732 1.576 0.73
4 5905103 144 325.733 327.549 1.816 0.56
5 5905138 187 298.229 293.810 4.419 1.48
6 5905986 174 195.506 197.730 2.224 1.14
7 5905109 159 223.558 221.725 1.833 0.82
8 5906208 72 251.583 256.715 5.132 2.04
9 5906218 67 252.084 254.358 2.274 0.90
10 5906221 70 313.106 318.269 5.163 1.65
11 5905974 181 200.025 195.742 4.283 2.14
12 5906035 98 246.273 249.353 3.080 1.25
13 5906303 51 194.703 195.370 0.667 0.34
14 5906310 39 229.277 234.260 4.983 2.17
15 5906343 30 201.162 209.158 7.996 3.97
16 6902981 52 294.120 295.728 1.608 0.55
17 5906475 5 203.489 201.456 2.033 1.00
18 5906503 3 199.267 202.761 3.494 1.75
19 5906624 113 320.351 326.284 5.933 1.85
20 7900566 75 288.801 295.325 6.524 2.26

3.2 空间分布对比分析

WOA18资料[1]是一个经过质量控制的海洋水下观测的同化数据集,它包含温度、盐度、溶解氧等多种水文要素。目前,WOA18资料作为国内外公认可靠的再分析产品之一,常用于海洋科学研究,作为评估ASOSQIM插值结果的重要评价标准。WOA18溶解氧资料是基于2018世界海洋数据库[38]中受科学质量控制的自1960年以来的历史溶解氧数据进行客观分析[1]得来的,空间分辨率为1°×1° ,时间分辨率为气候态的月尺度,WOA18溶解氧资料的数据源不包括本文所使用的Argo溶解氧剖面观测数据。本文在全球和区域尺度上将基于ASOSQIM的海洋溶解氧浓度插值结果与WOA18溶解氧资料在空间上进行差值对比,其中空白处表示溶解氧浓度数据缺失。
图3为1月(冬季)和7月(夏季)全球海洋范围内10dbar深度层的实验结果与相应的WOA18溶解氧资料对比图,由图可以看出,二者溶解氧空间分布整体趋势较为一致,但是存在局部差异。据统计,溶解氧浓度绝对误差在20 μmol/kg以内的区域达85%及以上,绝对误差大于50 μmol/kg的细小碎部大约占比1%~3%且分布比较杂乱。由图中可以看出,部分区域Argo浮标溶解氧观测值与WOA18溶解氧浓度存在一定差异,其中绝对误差较大的区域主要分布于海洋邻近大陆的细碎区域。从数据源上来看WOA18溶解氧资料的数据源采用多种观测手段获取但不包括Argo浮标溶解氧观测数据,其采用1960—2017年所有累积观测数据进行溶解氧客观分析的方式得到气候态溶解氧资料,本文使用全球 Argo中心提供的2010—2021年Argo溶解氧剖面观测数据,局部海域观测样点分布稀疏且获取方式有所不同。从方法角度来看,本文方法与WOA18资料所采用方法在构建流程和插值方法上有所不同,WOA18资料所采用的Barnes逐步订正法[39]直接得到月气候态溶解氧浓度,对溶解氧浓度的描述会更加平滑稳定[15]。ASOSQIM在空间初始化的基础上基于Argo溶解氧剖面观测数据的空间-质量特征进行逐步迭代插值,在溶解氧浓度变化复杂的区域,如受洋流和水团影响较多日本东南部区域以及受人类环境影响较大的陆地边缘海域,对于溶解氧浓度变化的细节刻画会更为明显,因此在数据稀疏以及溶解氧浓度变化复杂的区域会产生差异。
图3 与WOA18溶解氧资料对比

Fig. 3 Comparison with WOA18 dissolved oxygen data

在区域尺度上,本文选取了1月海洋10 dbar深度层溶解氧浓度高、中、低3个空间范围20°×20°的代表性区域进行散点图对比分析,如图4所示。根据散点图可以看出,A、B、C 3个区域的插值结果和WOA资料具有较强的线性相关性,表明基于本文方法的溶解氧浓度空间插值结果与WOA18溶解氧资料具有一致性,在区域范围内溶解氧浓度的变化趋势相近。对比结果中,ASOSQIM插值与相应WOA溶解氧浓度的最大偏差为35.2 μmol/kg,平均偏差为7.82 μmol/kg,偏差超过10 μmol/kg的网格占总网格数的9.4%。可见基于ASOSQIM对海洋溶解氧浓度的空间插值具有充分的有效性,可对全球海域内溶解氧浓度进行较好的插值重构。
图4 溶解氧浓度代表性区域散点图

Fig. 4 Scatter plot of representative area of Dissolved Oxygen concentration

4 结论与展望

本文基于对Argo溶解氧剖面观测数据空间分布特征以及质量标示特征的探究,提出了一种融合Argo溶解氧剖面观测数据空间-质量标示特征的迭代插值方法(ASOSQIM),选用2010—2021年1月和7月全球海洋表层10 dbar处的溶解氧浓度观测数据进行试验,通过与其他插值方法以及现有的溶解氧资料进行对比分析,主要结论如下:
(1)在方法上,ASOSQIM通过径向基函数插值方法对溶解氧浓度场进行空间初始化,利用离散的溶解氧观测数据得到了连续的空间格网数据,设计空间异质性分区解决了Argo溶解氧观测数据具有空间集聚性特征的情况,融合数据空间特征和质量标示加权来提高数据匮乏和数据质量参差不齐情况下的插值精度,最后利用迭代插值思想保证了最优插值精度。
(2)在方法验证上,通过留一交叉验证法与其他插值方法进行误差对比以及与未参与计算的实测数据进行比较,结果表明利用ASOSQIM插值得到的结果误差明显小于其他空间插值方法,特别是异质性分区边界区域的观测样点以及数据质量标示与周围观测点不一致的样点,而且溶解氧浓度插值结果与实际观测数据误差控制在合理的范围内,具有较高的精确度。
(3)在溶解氧浓度空间分布对比上,基于ASOSQIM的海洋溶解氧浓度插值结果与WOA18溶解氧资料具有一致性,溶解氧浓度绝对误差在20 μmol/kg范围内的区域占比达到85%以上,但也存在一定差异,这表明ASOSQIM的插值结果既描述了海洋溶解氧大体上的空间分布特征,也刻画了Argo浮标观测溶解氧浓度的差异性。
本文提出的ASOSQIM方法对于研究全球海洋溶解氧的空间分布及其变化特征具有实际的参考价值,对于补充观测样点稀疏区域的溶解氧数据也有一定的意义。然而由于Argo剖面浮标采样位置具有随机性和不确定性,不同海域的观测样点分布各异,本文方法使用反距离加权的数学模型来表达区域内溶解氧浓度的空间相关性,但是不同海域的溶解氧浓度空间变化特征和强度不一致,对于溶解氧浓度空间变化特征与海域位置之间的关联关系有待进一步挖掘。受限于Argo剖面浮标的观测机制,Argo溶解氧剖面观测数据空间上稀疏、散布、不规则和时间上不连续等问题还是在很大程度上限制了数据集的应用范围,未来随着Argo溶解氧剖面观测数据的快速增长,考虑顾及溶解氧数据时间特征的时空插值方法研究以及探索溶解氧浓度在不同海域时空变异性影响的规律是今后的研究工作。
[1]
Garcia H E, Weathers K W, Paver C R, et al. World Ocean Atlas 2018, Volume 3: Dissolved Oxygen, Apparent Oxygen Utilization, and Dissolved Oxygen Saturation[J]. NOAA Atlas NESDIS, 2019(83):38.

[2]
Breitburg D, Levin L A, Oschlies A, et al. Declining oxygen in the global ocean and coastal waters[J]. Science, 2018, 359(6371): eaam7240. DOI:10.1126/science.aam7240

[3]
Keeling R F, Garcia H E. The change in oceanic O2 inventory associated with recent global warming[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(12):7848-7853. DOI:10.1073/pnas.122154899

PMID

[4]
Matear R J, Hirst A C. Long-term changes in dissolved oxygen concentrations in the ocean caused by protracted global warming[J]. Global Biogeochemical Cycles, 2003, 17(4),1125. DOI:10.1029/2002gb001997

[5]
Stramma L, Johnson G C, Sprintall J, et al. Expanding oxygen-minimum zones in the tropical oceans[J]. Science, 2008, 320(5876):655-658. DOI:10.1126/science.1153847

PMID

[6]
Garcia H E, Boyer T P, Levitus S, et al. On the variability of dissolved oxygen and apparent oxygen utilization content for the upper world ocean: 1955 to 1998[J]. Geophysical Research Letters, 2005, 32(9):L09604. DOI:10.1029/2004gl022286

[7]
Lauvset S K, Key R M, Olsen A, et al. A new global interior ocean mapped climatology: The 1° × 1° GLODAP version 2[J]. Earth System Science Data, 2016, 8(2):325-340. DOI:10.5194/essd-8-325-2016

[8]
Schmidtko S, Stramma L, Visbeck M. Decline in global oceanic oxygen content during the past five decades[J]. Nature, 2017, 542(7641):335-339. DOI:10.1038/nature21399

[9]
Carpenter J H. The Chesapeake Bay institute technique for the winkler dissolved oxygen method[J]. Limnology and Oceanography, 1965, 10(1):141-143. DOI:10.4319/lo.1965.10.1.0141

[10]
Winkler L W. Die bestimmung des im wasser gelösten sauerstoffes[J]. Berichte Der Deutschen Chemischen Gesellschaft, 1888, 21(2):2843-2854. DOI:10.1002/cber.188802102122

[11]
刘烨, 邢小罡. Argo浮标观测溶解氧数据的原理与质量控制[J]. 海洋科学, 2019, 43(1):28-37.

[Liu Y, Xing X G. Sensor principle and quality control of the dissolved oxygen data observed using Argo floats[J]. Marine Sciences, 2019, 43(1):28-37.] DOI:10.11759/hykx20181102001

[12]
陈大可, 许建平, 马继瑞, 等. 全球实时海洋观测网(Argo)与上层海洋结构、变异及预测研究[J]. 地球科学进展, 2008, 23(1):1-7.

[Chen D K, Xu J P, Ma J R, et al. Argo global observation network and studies of upper ocean structure, variability and predictability[J]. Advances in Earth Science, 2008, 23:1-7.] DOI:10.11867/j.issn.1001-8166.2008.01.0001

[13]
Riser S C, Freeland H J, Roemmich D, et al. Fifteen years of ocean observations with the global Argo array[J]. Nature Climate Change, 2016, 6(2):145-153. DOI:10.1038/nclimate2872

[14]
Gruber N, Doney S C, Emerson S R, et al. Adding Oxygen to Argo: Developing a Global In Situ Observatory for Ocean Deoxygenation and Biogeochemistry[J]. 2010. DOI:10.5270/OceanObs09.cwp.39

[15]
杨明远. 基于Argo数据的海洋要素场三维网格化技术研究[D]. 郑州: 战略支援部队信息工程大学, 2018.

[Yang M Y. Research on data griding of three-dimensional oceanic element fields based on Argo data[D]. Zhengzhou: Information Engineering University, 2018.]

[16]
李直龙, 左军成, 纪棋严, 等. 基于Argo剖面和SST以及SLA数据重构三维网格温度场[J]. 海洋预报, 2020, 37(4):66-75.

[Li Z L, Zuo J C, Ji Q Y, et al. Reconstruction of 3D sea temperature field based on Argo profile, SST and SLA data[J]. Marine Forecasts, 2020, 37(4):66-75.] DOI:10.11737/j.issn.1003-0239.2020.04.008

[17]
Guinehut S, Dhomps A L, Larnicol G, et al. High resolution 3-D temperature and salinity fields derived from in situ and satellite observations[J]. Ocean Science, 2012, 8(5):845-857. DOI:10.5194/os-8-845-2012

[18]
张春玲, 王振峰, 李宏. 基于最优插值法的Argo数据网格化实验[J]. 海洋测绘, 2012, 32(3):29-31.

[Zhang C L, Wang Z F, Li H. Argo data grid experiment based on optimal interpolation[J]. Hydrographic Surveying and Charting, 2012, 32(3):29-31.] DOI:10.3969/j.issn.1671-3044.2012.03.010

[19]
Gandin L S. Gidrometerologicheskoe izdatelstvo-objective analysis of meteorological fields[J]. Israel Program for Scientific Translations, 1963. DOI:10.1002/qj.49709239320

[20]
李宏, 许建平, 刘增宏, 等. 利用逐步订正法构建Argo网格资料集的研究[J]. 海洋通报, 2012, 31(5):502-514.

[Li H, Xu J P, Liu Z H, et al. Study on the establishment of gridded Argo data by successive correction[J]. Marine Science Bulletin, 2012, 31(5):502-514.] DOI:10.11840/j.issn.1001-6392.2012.5.004

[21]
李佳霖, 樊子德, 邓敏. 基于空间异质分区的残差IDW插值方法[J]. 地理与地理信息科学, 2015, 31(5):25-29.

[Li J L, Fan Z D, Deng M. Residual inverse distance weighting spatial interpolation method based on spatial heterogeneity sub-region[J]. Geography and Geo-Information Science, 2015, 31(5):25-29.] DOI:10.3969/j.issn.1672-0504.2015.05.006

[22]
杨胜龙, 马军杰, 伍玉梅, 等. 基于Kriging方法Argo数据重构太平洋温度场研究[J]. 海洋渔业, 2008, 30(1):13-18.

[Yang S L, Ma J J, Wu Y M, et al. Study on the reconstruction of Pacific temperature arena with Argo data based on the Kriging methods[J]. Marine Fisheries, 2008, 30(1):13-18.] DOI:10.3969/j.issn.1004-2490.2008.01.003

[23]
张韧, 黄志松, 王辉赞, 等. 基于Argo资料的三维盐度场网格化产品重构[J]. 解放军理工大学学报(自然科学版), 2012, 13(3):342-348.

[Zhang R, Huang Z S, Wang H Z, et al. Reconstruction of three-dimensional gridded salinity product based on Argo data[J]. Journal of PLA University of Science and Technology (Natural Science Edition), 2012, 13(3):342-348.] DOI:10.7666/j.issn.1009-3443.201203020

[24]
王文娟, 俞胜宾, 杨凡, 等. 基于距平分析的Argo海表温度场重构[J]. 海洋预报, 2014, 31(6):68-73.

[Wang W J, Yu S B, Yang F, et al. Reconstruction of SST with Argo data based on anomalies analysis[J]. Marine Forecasts, 2014, 31(6):68-73.] DOI:10.11737/j.issn.1003-0239.2014.06.012

[25]
樊子德, 龚健雅, 刘博, 等. 顾及时空异质性的缺失数据时空插值方法[J]. 测绘学报, 2016, 45(4):458-465.

DOI

[Fan Z D, Gong J Y, Liu B, et al. A space-time interpolation method of missing data based on spatiotemporal heterogeneity[J]. Acta Geodaetica et Cartographica Sinica, 2016, 45(4):458-465.] DOI:10.11947/j.AGCS.2016.20150123

[26]
Chen C F, Li Y Y, Zhao N, et al. Least Squares compactly supported radial basis function for digital terrain model interpolation from airborne lidar point clouds[J]. Remote Sensing, 2018, 10(4):587. DOI:10.3390/rs10040587

[27]
高原, 朱娅男, 陈传法, 等. 高精度DEM建模的加权径向基函数插值方法[J]. 武汉大学学报·信息科学版. https://kns.cnki.net/kcms2/article/abstract?v=3uoqIhG8C45S0n9fL2suRadTyEVl2pW9UrhTDCdPD67Dqpioc424yYx-DW27qisUMliCeNj_am5vsDvhqzxFIpY_OIEUWI2f&uniplatform=NZKPT.

[Gao Y, Zhu Y N, Chen C F, et al. A weighted radial basis function interpolation method for high accuracy DEM modeling[J]. Geomatics and Information Science of Wuhan University. https://kns.cnki.net/kcms2/article/abstract?v=3uoqIhG8C45S0n9fL2suRadTyEVl2pW9UrhTDCdPD67Dqpioc424yYx-DW27qisUMliCeNj_am5vsDvhqzxFIpY_OIEUWI2f&uniplatform=NZKPT.]DOI:10.13203/j.whugis20210100

[28]
吕海洋, 盛业华, 段平, 等. 局部最优形态参数的RBF分块地形插值方法与实验[J]. 地球信息科学学报, 2015, 17(3):260-267.

DOI

[Lv H Y, Sheng Y H, Duan P, et al. A hierarchical RBF interpolation method based on local optimal shape parameters[J]. Journal of Geo-Information Science, 2015, 17(3):260-267.] DOI:10.3724/SP.J.1047.2015.00260

[29]
张海平, 周星星, 代文. 空间插值方法的适用性分析初探[J]. 地理与地理信息科学, 2017, 33(6):14-18,105.

[Zhang H P, Zhou X X, Dai W. A preliminary on applicability analysis of spatial interpolation method[J]. Geography and Geo-Information Science, 2017, 33(6):14-18,105.] DOI:10.3969/j.issn.1672-0504.2017.06.003

[30]
朱会义, 刘述林, 贾绍凤. 自然地理要素空间插值的几个问题[J]. 地理研究, 2004, 23(4):425-432.

[Zhu H Y, Liu S L, Jia S F. Problems of the spatial interpolation of physical geographical elements[J]. Geographical Research, 2004, 23(4):425-432.] DOI:10.3321/j.issn:1000-0585.2004.04.001

[31]
李新运, 郑新奇, 闫弘文. 坐标与属性一体化的空间聚类方法研究[J]. 地理与地理信息科学, 2004, 20(2):38-40.

[Li X Y, Zheng X Q, Yan H W. On spatial clustering of combination of coordinate and attribute[J]. Geography and Geo-Information Science, 2004, 20(2):38-40.] DOI:10.3969/j.issn.1672-0504.2004.02.009

[32]
李亚, 刘丽平, 李柏青, 等. 基于改进K-Means聚类和BP神经网络的台区线损率计算方法[J]. 中国电机工程学报, 2016, 36(17):4543-4552.

[Li Y, Liu L P, Li B Q, et al. Calculation of line loss rate in transformer district based on improved K-means clustering algorithm and BP neural network[J]. Proceedings of the CSEE, 2016, 36(17):4543-4552.] DOI:10.13334/j.0258-8013.pcsee.160864

[33]
Thierry V, Bittig H, The Argo-Bgc Team. Argo quality control manual for dissolved oxygen concentration[J]. 2021. DOI:10.13155/46542

[34]
段平, 盛业华, 李佳, 等. 自适应的IDW插值方法及其在气温场中的应用[J]. 地理研究, 2014, 33(8):1417-1426.

DOI

[Duan P, Sheng Y H, Li J, et al. Adaptive IDW interpolation method and its application in the temperature field[J]. Geographical Research, 2014, 33(8):1417-1426.] DOI:10.11821/dlyj201408003

[35]
Cressman G P. An operational objective analysis system[J]. Monthly Weather Review, 1959, 87(10):367-374. DOI:10.1175/1520-0493(1959)087<0367:aooas>2.0.co;2

[36]
Akima H. A new method of interpolation and smooth curve fitting based on local procedures[J]. Journal of the ACM, 1970, 17(4):589-602. DOI:10.1145/321607.321609

[37]
Albert Noël Declercq F. Interpolation methods for scattered sample data: Accuracy, spatial patterns, processing time[J]. Cartography and Geographic Information Systems, 1996, 23(3):128-144. DOI:10.1559/152304096782438882

[38]
Boyer T P, Baranova O K, Coleman C, et al. World ocean database 2018[J]. NOAA Atlas NESDIS, 2018(87).

[39]
Barnes S L. A technique for maximizing details in numerical weather map analysis[J]. Journal of Applied Meteorology, 1964, 3(4):396-409. DOI:10.1175/1520-0450(1964)003<0396:atfmdi>2.0.co;2

文章导航

/