地球信息科学理论与方法

一种新的基于模糊分析观测信息的局地化方法

  • 马小艳 ,
  • 摆玉龙 , * ,
  • 唐丽红 ,
  • 王月 ,
  • 李珊珊
展开
  • 西北师范大学物理与电子工程学院,兰州 730070
摆玉龙(1973-),男,甘肃会宁人,博士,教授,主要研究方向为数据同化和参数估计。E-mail:

马小艳(1995-),女,甘肃会宁人,硕士生,主要从事数据同化观测误差方面的研究。E-mail: maxiaoyan_1995@163.com

收稿日期: 2019-05-31

  要求修回日期: 2019-10-18

  网络出版日期: 2019-12-25

基金资助

国家自然科学基金项目(41861047)

国家自然科学基金项目(41461078)

西北师范大学科研能力提升团队项目(NWNU-LKQN-1706)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

A New Localization Method based on Fuzzy Analysis of Observation Information

  • MA Xiaoyan ,
  • BAI Yulong , * ,
  • TANG Lihong ,
  • WANG Yue ,
  • LI Shanshan
Expand
  • College of Physics and Electrical Engineering, Northwest Normal University, Lanzhou 730070, China
BAI Yulong, E-mail:

Received date: 2019-05-31

  Request revised date: 2019-10-18

  Online published: 2019-12-25

Supported by

National Natural Science Foundation of China(41861047)

National Natural Science Foundation of China(41461078)

Northwest Normal University Young teachers' Scientific Research Capability Upgrading Program(NWNU-LKQN-1706)

Copyright

Copyright reserved © 2019

摘要

地球表层系统是一个极其复杂的巨系统,为了更精确地表达地球表层系统各种过程的动态演进,解决数据同化系统观测误差的估计与处理已经成为地球科学领域备受关注的问题之一。在地球科学系统数值模拟中,一般采用集合数据同化来探讨地学变量预报时的各种误差。集合类卡尔曼滤波通常会由于集合数过小而带来欠采样、协方差低估、滤波发散和远距离虚假相关等问题。针对背景误差协方差被低估问题,局地分析方法(Local Analysis, LA)在一定程度上能起到抑制作用,但无法彻底解决背景误差协方差的虚假相关问题。因此,本文在集合卡尔曼滤波的算法框架下提出了一种与模糊逻辑控制算法相耦合的局地化分析方法(Fuzzy Analysis, FA)。在强非线性Lorenz-96模型中,对不同模型误差下的LA和FA方法进行了性能优劣方面的探讨,并比较分析了2种方法在集合数、观测数和观测位置、放大因子以及强迫参数变化时的同化性能。实验采用均方根误差作为算法评判依据,同时用功率谱密度(Power Spectral Density, PSD)更直接地对2种算法性能优劣作出了评价。结果表明:在完美模型下,FA相对于LA降低了17.5%的均方根误差(Root Mean Square Error, RMSE);随着模型误差增大,RMSE减小的百分比和减小幅度都在降低;在严重模型误差下,FA降低了8.6%的RMSE。总体而言,新算法FA的有效性和鲁棒性都得到了验证,并且在EnKF同化基础下有效改进了传统的局地化分析方案,优化了观测误差处理,为今后的数据同化研究提供了一个较为全面的观测误差研究平台。

本文引用格式

马小艳 , 摆玉龙 , 唐丽红 , 王月 , 李珊珊 . 一种新的基于模糊分析观测信息的局地化方法[J]. 地球信息科学学报, 2019 , 21(12) : 1855 -1866 . DOI: 10.12082/dqxxkx.2019.190271

Abstract

In numerical simulations of the earth system, ensemble data assimilation methods are commonly used to study the various observation errors in predicting geological variables. In this regard, the widely used Ensemble Kalman Filter (EnKF) may suffer from a series of problems such as undersampling, covariance underestimation, filter divergence, and distanced spurious correlations, when the ensemble size is small. In particular, implementing the traditional Local Analysis (LA) method by the distance-based Gaspari and Cohn (GC) function can reduce the underestimation of background error covariance to some extent, but cannot completely eliminate the spurious correlation problem. In this study, a Fuzzy Analysis (FA) localization method coupled with the fuzzy logic control algorithm was proposed in the framework of the EnKF assimilation algorithm. In the design of the fuzzy logic controller, the distance between observation points and the corresponding status update points is taken as the fuzzy inputs. Through a series of fuzzy inference, more accurate fuzzy weight coefficients can be obtained as the control outputs, so as to reduce the observation error and improve the assimilation accuracy. Based on the Lorenz-96 model, the effectiveness of LA and FA under different model errors was compared; and the robustness of the two methods under ensemble numbers, observation numbers, and observation space, covariance inflation factor, and forced parameter change was discussed and analyzed. Meanwhile, Root Mean Square Error (RMSE) and Power Spectral Density (PSD) were used as performance indexes to evaluate the performance of the two algorithms. The experimental results show that the new localization method can correct the background error covariance matrix by constructing the corresponding equivalent weight of observation position to update local coefficient based on EnKF. To some extent, it can effectively eliminate the remote correlation between observations and state, and the observation data can be effectively utilized in the local scope. The FA algorithm can reduce the observation error, and the effectiveness and robustness of the new method was proved in nonlinear chaotic systems. These schemes illustrate that the new localization method based on Fuzzy Analysis of observation information can lead to a systematic improvement of the data assimilation performance. However, the determination of fuzzy distance and the calculation of fuzzy equivalent weight coefficient take extra long time; how to combine parallel computation with fuzzy control for improving assimilation efficiency remains to be further studied.

1 引言

数据同化作为地球科学领域的一种最优方法论,主要思想是将观测数据与地学模型通过数据同化算法有效地融合,进而对地学数据时空分布作较为精确的分析与预报[1,2,3]。现代数据同化算法主要包括变分类算法和顺序类算法,其中以集合类滤波[4,5]为主的顺序类算法表现最突出。它不仅克服了传统卡尔曼滤波适用性范围小的问题,而且为解决高状态维数、高分辨率下的强非线性系统中复杂的数学问题提供了途径。
集合卡尔曼滤波(Ensemble Kalman Filter, EnKF)最初是由Epstein[6]的随机动力预测理论发展而来,在同化时,最终的分析结果取决于背景误差协方差矩阵的估计。但是往往在实际数据同化中,由于观测点与状态更新点之间存在物理距离上的虚假相关,背景误差协方差被低估,随之观测权重越来越小,得到的分析值难以表示系统的真实状态,滤波发散由此产生[7]。为解决以上问题,相关学者提出了局地化方法[8]来改善同化效果。局地化方法不仅能够减小观测数据对空间区域的影响,而且可以大幅度降低集合的计算量,所以近年来基于以上一些背景,部分学者在此方面做了研究[9]。Hamill等[10]指出大气模式中的背景误差协方差和噪声有很大关系,并且进一步验证了与距离相关的假设可以通过局地化技术消除虚假相关性。Hunt等[11]在不以提高局地化方法同化精度的前提下,基于ETKF同化方案做了一系列局地化实验,验证了将实际大气数据与局地化相结合进行同化的效率和准确性。Sakov等[12]主要研究对比了集合卡尔曼滤波系统中常用的协方差局地化(Covariance Localization, CL)和局地化分析(Local Analysis, LA)之间的关系,从理论分析和实验证明得出结论,2种局地化方法在实际模拟同化系统中有着几乎一样的性能表现。韩培等[13]针对2种局地化方法在EnKF方案下的性能,主要从背景误差协方差矩阵、增益矩阵、集合转换矩阵以及同化结果方面进行探讨,证明了局地化方法确实可对背景误差协方差作更为精细的分析和估计。随后2016年又探索了协方差局地化方法在集合转换卡尔曼滤波(Ensemble Transform Kalman Filter, ETKF)同化中的适用性[14]。近年来,模糊数学因其具有鲁棒性强、响应速度快、容错性好、容易控制、掌握等优点,受到了研究人员的广泛关注。将模糊数学的思想作为一种研究手段与数据同化相结合[15],可以解决同化过程中的一系列不确定性问题,如采样误差、模式误差、观测误差等[16]。卢勇男等[17]、常明恒等[18]针对数据同化中小集合数下的虚假相关问题,采取将模糊控制算法与同化算法相结合的方案,通过模糊逻辑判断观测点与状态更新点之间的距离,构造观测位置等价权重,以此将观测数据更加有效的利用起来,改善同化效果。但是并没有将传统局地化方法与耦合模糊控制算法的局地化方法作详细比较并验证模糊控制算法在局地化方法中的有效性,只简单考察集合转换Kalman滤波模糊控制同化方案的性能优劣,对新局地化方法下观测信息如何优化处理以及经过模糊控制得到的观测权重是否有效地减小了分析误差并没有作充分的分析探讨。
本文首先介绍集合卡尔曼滤波、局地化分析方法以及模糊逻辑控制原理,提出了一种新的基于模糊分析观测信息的局地化分析方案,进而介绍模糊逻辑控制器设计及实现的具体过程,最后结合Lorenz-96高维非线性混沌模型,基于EnKF同化方案,比较分析了模糊分析局地化方法(Fuzzy Analysis, FA)和传统局地化分析方法(Local Analysis, LA)对集合数、观测数、观测位置、放大因子、强迫参数以及同化结果的影响,采用均方根误差(Root Mean Square Error, RMSE)和功率谱密度(Power Spectral Density, PSD)性能评价指标评价了算法的性能。

2 理论背景与方法框架

2.1 集合卡尔曼滤波

集合卡尔曼滤波(EnKF)经Evensen[19]提出,解决了传统卡尔曼滤波方法在计算预报误差协方差时面临的计算资源难题,现如今被广泛应于强非线性系统。集合卡尔曼滤波的状态更新公式为:
x = 1 m E 1
P = 1 m - 1 A A T
K = P f H T H P f H T + R - 1
A = E I - 1 m l l T
式中:E为模型状态的集合;x代表状态估计值;P代表状态误差协方差矩阵;A代表集合奇异值矩阵;上标f代表预测,上标T代表矩阵转置;m代表集合数大小;l代表所有元素都等于1的矢量矩阵;I代表单位矩阵;K代表Kalman增益矩阵;H代表观测矩阵,说明了观测值与状态值之间的函数关系;R代表观测误差协方差矩阵。在EnKF实际应用中,往往会出现空间观测点与状态点之间的虚假相关问题以及集合非满秩问题,所以局地化分析技术被提出来解决以上问题。

2.2 局地化分析技术(LA)

局地化分析经Anderson[8]提出,解决了对每个更新状态矢量元素的状态误差协方差无法做出准确估计的问题。在局地化分析过程中,通常会围绕需要更新的状态矢量元素去建立一个虚拟的局地化窗口,更新时只对窗口内的值做详细分析,对窗口以外的值设置集合奇异值为0,以此来提高同化精度。第i个状态变量的局地范围内的更新方程为:
x i a = x i f + K i , : l y l - H l x f l
A i a = A i f ( I + S T l S l ) - 1 / 2
K i , : l = A i , : f S T l I + S l S T l - 1 R - 1 2 l m - 1
S l R - 1 2 l H l A f l m - 1
式中:上标l代表局地范围内的变量,上标af分别代表分析和预测变量;x代表状态向量; A i 代表局地范围内的集合奇异值; K l 代表局地范围内的集合卡尔曼增益; H l 代表局地范围内的观测算子; y l 代表局地范围内的观测向量; T l 代表局地范围内的集合转换矩阵; S l 代表局地范围内的集合观测扰动; R l 代表局地范围内的观测误差协方差。

2.3 耦合模糊逻辑控制原理的局地化分析方法

在传统的局地化分析过程中,一般是取局地裁剪函数[20]作为局地化函数来求得局地化系数矩阵。局地裁剪函数是一个与长度尺度参数有关,且随距离变化而改变的五阶分段有理函数。模糊逻辑控制理论以模糊数学为基础,以模糊集、模糊关系、模糊推理来模仿人的思维进行判断、综合、推理、处理和解决常规方法难以解决的问题。在实际的数据同化过程中,因观测点与状态更新点之间存在物理距离上的虚假相关,致使观测误差增大,同化效果变差。所以本文基于模糊逻辑控制原理,提出了一种模糊局地化分析方法。模糊逻辑控制(Fuzzy Logic Control,FLC),从数学角度来看,是以基于二值的多值逻辑为基础,再借助模糊集合,以一种语言分析的数学模式对模糊思维和规律进行深入研究的一种智能控制方法[21]
文中FLC的主要思想是对模糊性的输入对象做精确性的输出处理,从而降低了因不能有效利用观测信息而产生的误差。新方法不同于传统方法之处在于,先将状态更新点与周围所有观测点之间的欧氏距离通过模糊高斯隶属度函数进行模糊量化输出,然后运用规则表模糊推断确定每个观测点更为精确的权重,最后进行状态更新得到背景集合扰动,与同化系统进行数据融合,完成同化过程。相比于传统的局地化函数,新方法得到的观测点权重系数更加精确,这也体现了模糊逻辑控制的优势。
为了完成以上工作,首先需要建立一个模糊逻辑控制器。通用模糊逻辑控制器的组成框架有数据库、规则库、模糊量化、推理机制以及模糊判 别[22,23]。每个部分在模糊控制过程中起着不同的作用。首先,数据库作为一个存储仓,包括所有输入输出模糊变量的全部子集的隶属度值;其次,规则库有提前设置好的语言形式的各种规则,用于后续的模糊推断;然后,对已经确定好的输入模糊变量经过隶属度函数做量化输出,用已建规则表完成模糊推断;最后,模糊判别主要将推断得到的模糊子集转换为能直接用于数据同化的精确权重值[24]。如图1所示详细描述了耦合模糊分析以后的数据同化工作原理。
图1 加入模糊分析的数据同化工作原理

Fig. 1 Schematic diagram of data assimilation coupled with the fuzzy analysis

图2为观测点与状态点之间通过模糊分析控制以及传统局地化分析控制的过程示意图[17],观测点离状态更新点越远,观测数据分配得到的权重就越小。
图2 观测点与状态点间的同化过程示意(改自卢勇男等[17]

Fig. 2 Schematic diagram of assimilation process between observation point and state point

耦合模糊逻辑控制原理的局地化分析方法具体实现过程如下:
(1)建立模糊逻辑数据库
本文选择单输入单输出模糊控制器,将观测位置与状态更新位置之间的欧式距离d作为输入模糊变量,观测数据的等效权系数w作为输出模糊控制量。其次根据实际经验和系统需要确定各变量的基本论域及量化论域,从而确定输入变量偏差的量化比例因子以及输出控制量的比例因子。文中输入模糊变量d基本论域取{0, 20},量化论域为[0, 1, 2, 3, …, 20],它表示{最近距离, 次近距离, 近距离, …, 远距离, 次远距离, 最远距离}, 量化比例因子Ke=0.5; 输出模糊变量w基本论域取{0, 1},量化论域为[0, 0.05, 0.1, …, 0.95, 1],它表示{最低权重,次低权重,低权重,…,高权重,次高权重,最高权重},输出控制变量的量化比例因子Ku=0.025[25]表1给出具体的输入模糊变量与输出模糊控制变量对应规则。
表1 输入模糊变量与输出模糊变量对应规则表

Tab. 1 Fuzzy control rules for input and output fuzzy variables

d 0~1.5 1.5~2.5 2.5~3.5 3.5~4.5 4.5~5.5 18.5~20.0
w 1~0.95 0.95~0.90 0.90~0.85 0.85~0.80 0.80~0.75 0.1~0
(2)进行模糊量化处理
首先,通过给定公式计算观测点与状态更新点的欧氏距离x,其中, o i o j v i v j 分别表示观测点和状态更新点的水平坐标和垂直坐标:
x = ( o i - v i ) 2 + ( o j - v j ) 2 , ( i , j = 1 , , 20 )
然后,通过定义隶属度函数对距离和权重系数进行量化和分类,最终得到的离散子集记为 { d 1 , d 2 , , d 20 } ,再通过具体的模糊规则,得到其等价权重的模糊子集记为 { w 1 , w 2 , , w 20 } [26,27]。其中输入和输出的高斯隶属度函数表达式为:
d i ( x ) = e - x 2 2 σ 2 0 < x 1 e - ( x - 1.5 ) 2 2 σ 2 1 < x 2 e - ( x - 20 ) 2 2 σ 2 19 < x 20
w i ( x ) = e - ( x - 1 ) 2 2 σ 2 0 < x 1 e - ( x - 0.95 ) 2 2 σ 2 1 < x 2 e - x 2 2 σ 2 19 < x 20
式中:σ为高斯隶属函数的标准偏差,通常是根据专家经验给出的,根据以往的实验效果,本文 σ =0.25;i=1, , 20
(3)建立模糊控制规则
何平等[24]指出了可供使用的20多条模糊控制规则,这里选用语言表示的模糊控制规则“如果有模糊集A,则有模糊集B”。文中设计的具体的模糊推理规则以语言形式描述为:If d and R then w , 即 w = d R ,其中 w = ( w 1 , w 2 , , w 20 ) 为输出权重系数模糊向量, d = ( d 1 , d 2 , , d 20 ) 为输入变量的实际值x模糊化后的模糊距离向量,模糊关系矩阵 R = ( r i ) 20 × 20 可采用量化论域中的元素分别属于模糊子集的隶属度计算得到,用式(12)表示为:
R = ( d 1 × w 1 ) U ( d 2 × w 2 ) U ( d i × w i ) U U ( d m × w m )
式中:“ × ”为模糊向量的笛卡尔积;“ ”表示集合之间的并集。规则内的模糊集操作取交集,规则间的模糊集操作取并集。
(4)建立模糊推理机制
模糊推理是模糊控制的核心,一般采用一些模糊推理算法和模糊规则结合的方式来获得最终的控制量。目前最常用的模糊推理综合规则是“极大极小”原则,其计算公式如下:
w = d R = x X ( μ d ( x ) μ R ( x ) ) / x
式中:符号“。”表示模糊向量或矩阵的模糊综合运算。将“ ”和“ ”称为Zadeh操作符,它们分别表示取大和取小, μ d ( x ) μ R ( x ) 分别为相应模糊集元素的隶属度值。根据以上模糊量化得到的数据库与规则库设定输入量与输出量所对应的具体模糊规则,随着状态更新点与观测点间物理距离越远,其等价权重越小。权重w的数目与观测点的数目理论上应该一致。
(5)进行模糊判别
根据上述规则,模糊逻辑的输出控制量w是一个模糊量,被控对象只能接受精确值的控制量,所以不能直接用于数据同化系统状态的更新。通过使用去模糊化方法将其转换为精确的执行值。由于最大隶属度方法简单易行,便于计算,所以本文选用最大隶属度法完成解模糊。应用最大隶属原则思想,选取隶属度最大的元素作为控制量u,即若满足式(14),则取 u = w i 为控制量,u即为 w i 中最大的隶属度元素值。
w i = max { w 1 , w 2 , , w 20 }
(6)进行数据融合
对上述模糊量进行去模糊处理后,得到精确的数值量,发送给执行机构对被控对象进一步控制。然后进行第二次采样,完成第二次控制步骤,以此类推,直到最终实现被控对象的整个模糊逻辑控制。在完成整个模糊逻辑控制过程后,得到一组精确的权系数,用于进行状态变量更新。通过同化系统计算在模糊控制条件下的集合均值和集合奇异值,然后再通过EnKF方案的同化步骤进一步计算状态分析值,求得这一时刻同化的分析误差。同时将这一时刻更新的状态值作为下一时刻进行同化的背景值,如此往复,直到所有同化结束。式(15)是加了模糊逻辑控制算法后修正的背景误差协方差矩阵。图3给出了基于模糊局地化分析的数据同化方法完整的算法流程。
C P f = w x 1 - x 1 p 11 w x 1 - x n p 1 n w x m - x 1 p m 1 w x m - x n p mn
图3 基于模糊局地化分析的集合卡尔曼滤波方法同化流程

Fig. 3 Illustration of assimilation process of the local fuzzy analysis in ensemble kalman, where dx denotes the ensemble mean correction

2.4 实验背景

2.4.1 模型
Lorenz-96模型是一种高维度的强非线性混沌系统,有40个状态变量,能够较真实的模拟沿着纬度圈周围的不确定的气象变量的演化过程,被众多学者用作衡量数据同化系统性能的标准[28]。一般由以下带有周期性边界条件的二阶非线性微分方程描述:
d x i dt = x i - 1 ( x i + 1 - x i - 2 ) - x i + F
式中: x i - 1 ( x i + 1 - x i - 2 ) 代表非线性平流, x i 代表阻尼, F 代表外部强迫,整个表达式也是对沿着纬度圈的不确定气象变量的一种描述。通常求解以上方程时都会用到四阶龙格库塔(Runge-Kutta)方法。对于实验中的同化步长参数统一取值为0.05,相当于实际同化情形下的6 h[28]
2.4.2 指标
模拟同化实验中,采用分析均方根误差和功率谱密度作为检验同化性能的指标。
(1)对方程式(16)求解即可得到状态变量的“真值” x i t 和“背景值” x i b ,再以分析值 x i a 相对于“真值”的均方根误差为准则,对同化方法性能作出准确的评判,计算第i时刻的分析均方根误差的具体公式为:
RMSE = 1 n x i a - x i t 2
式中:符号 表示某个向量的范数; x i a 代表状态变量的分析值; x i t 代表状态变量的真值。同化效果越好,对应的RMSE越小。
(2)功率谱密度(PSD)作为一种概率统计方法,物理意义在于对随机变量均方值进行度量。功率谱密度-频率值的关系曲线下的面积代表方差,面积越小,同化算法效果越好。

3 实验方案及结果分析

为了验证模糊局地化分析方法(FA)在实际情形的有效性,基于Lorenz96模型,在集合卡尔曼滤波算法(EnKF)下做了多组模拟实验。在实验模型中,加入模糊逻辑控制的思想,将观测位置离散化,模拟定点观测的随机性与不确定性,并与传统的局地化分析(LA)做对比,观察参数变化对同化方案的影响。为了验证新方法FA的鲁棒性,同时分别探讨了LA和FA两种算法对集合数N,观测数P、观测位置,协方差放大因子inf以及混沌模型强迫参数F的影响。最后,用功率谱密度更直接的对2种算法性能优劣作出了评价。

3.1 验证新算法在模型误差变化下的有效性

实验设置:集合数N=20,观测数P=40,放大因子inf=1.08,运行步长nstep=9855,模拟实际情形下的365 d。图4给出了模糊分析局地化方法和传统局地化分析方法在不同模型误差下的365个模拟日日平均RMSE误差比较,图4(a)是2种局地化方法在完美模型(模型误差F=8)下的RMSE比较,图4(b)是2种局地化方法在有中等模型误差(模型误差F=8.5)存在下的RMSE比较,图4(c)是2种局地化方法在有严重模型误差(模型误差F=9)存在下的RMSE比较。结果表明,这2种方法在总体RMSE误差较低的情况下都取得了较好的同化效果,但是FA方法在不同模型误差下同化期间的表现均略好于LA方法。
图4 LA和FA在不同模型误差下的365个模拟日日平均RMSE

Fig. 4 Average RMSEs of 365 simulated days for the LA and FA algorithms with the Lorenz-96 model

表2分别列出了LA和FA方法在模型误差F改变下的分析误差RMSE值以及每种情况下新算法FA相对旧算法LA的RMSE值减小的百分比。可以看出在完美模型下(F=8.0),FA相对于LA方法降低的RMSE百分比是最大的,即同化效果最好。随着模型误差增大,减小的RMSE百分比在降低,减小幅度也在降低,在严重的模型误差情况下,新算法FA降低的RMSE百分比只达到了旧算法LA的8.6%,实验效果与田向军等[29]的实验结果一致。
Tab. 2 Percentages of RMSE reduction based on the two local algorithms over 365 simulated days
模型误差(F
局地化算法 8.0 8.5 9.0
LA 0.274 0.284 0.301
FA 0.226 0.253 0.275
RMSE减小的百分比/% 17.5 10.9 8.6

3.2 验证新算法在不同参数变化下的鲁棒性

3.2.1 改变集合数
集合数的选取在数据同化过程中起着至关重要的作用,它一方面将决定实际同化系统的运行效率,另一方面将决定整个同化过程计算量的大小。
实验1中,基本的实验参数设置见表3,当其它参数给定时,集合数N在[5, 20]的范围内变化,间隔设置为1。从图5集合数变化对2种局地化方法RMSE的影响来看:① 集合数在一定范围内递增时,2种局地化方法的RMSE在递减,说明两种局地化方法在这个过程中同化的性能都在改善;② 在初始同化时,取集合数N=5,可以看到2种局地分析方法RMSE很大,不能满足同化要求,随着集合数不断增大,2种方法都在迅速收敛,但明显可以看到,FA较LA更快的达到收敛状态,LA方法略微滞后; ③ 集合数越大,算法的计算量越大,但明显FA能在较小集合数下达到比LA优的同化效果,所以模糊控制算法的鲁棒性得以验证,同化效果与于张洪芹等[30]的实验结果一致。
表3 LA与FA算法的具体实验参数设置

Tab. 3 Specific experimental parameters settings for the LA and FA algorithms

集合数
N
观测数
O
放大因子
inf
强迫参数
F
实验1 5~20 40 1.08 8
实验2 20 5~40 1.08 8
实验3 20 40 1.01~1.12 8
实验4 20 40 1.08 4~12
图5 集合数对局地化效果的影响

Fig. 5 Influence of ensemble number size on the RMSE of localization results

3.2.2 改变观测数
观测数的选择在数据同化中也是一个关键问题,一方面在于观测数据的代表性是否合理,另一方面在于观测数的有效利用。
表3给出了实验2中基本的参数设置,当其他参数给定时,观测数P在[5, 40]的区间内变化,变化间隔设置为5。从图6观测数变化对两种局地化方法RMSE的影响来看:① 观测数在一定范围内递增时对2种局地化方法的同化效果有明显的改善; ② 在同化过程中,所取观测值均为离散型,观测数据能否得到有效利用将决定了误差的大小,可以明显看出FA方法在整个同化过程中较传统LA方法均方根误差小,这说明FA方法对局地化半径范围内的观测数据利用率更高;③ 相同的观测数下FA较LA方法RMSE更小,性能表现更优,说明加了模糊控制算法的局地化方法能得到更加合理准确的观测权重,有期达到消除远距离虚假相关的目标。
图6 观测数对局地化效果的影响

Fig. 6 Influence of observation number size on the RMSE of localization results

3.2.3 改变观测位置
在数值实验模拟中,观测位置的给定可以是随机的,也可以是有规律的,主要取决于观测数据在状态空间中的可利用性。下面2组实验分别探究了在随机变换观测位置的状态下和有规律变换观测位置状态下的2种局地化算法的同化性能。如图7所示,为观测位置变化情况下FA与LA的实验效果比较图,其中random-FA为观测数据在状态空间随机分布的情况,regular-FA为观测数据在状态空间有规律分布的情况。从图7可知,在观测位置不同变化的情况下,FA都表现出较LA方法优的同化效果,进一步验证了耦合模糊逻辑控制算法的局地化分析方法的性能。
图7 观测位置变化对局地化效果的影响

Fig. 7 Influence of observation position change on the RMSE of localization results

3.2.4 改变协方差放大因子
协方差放大因子作为模型参数从某个方面反映了混沌模型随着误差变化的特性,一个合理的协方差放大因子不仅能提高同化系统的精度,而且可以使得同化效果达到最优。
表3给出了实验3中基本的参数设置。在其他参数给定的情况下,协方差放大因子在[1.00, 1.12] 区间内变化,变化间隔设置为0.01。从图8协方差放大因子变化对2种局地化方法的RMSE影响来看:① 在协方差放大因子的变化下,LA和FA性能表现各有特色;② 随着协方差放大因子的逐渐递增,可以看出LA方法波动幅度较大,而FA波动幅度较小,说明加了模糊控制算法的局地化方法对协方差放大因子变化有较强的鲁棒性。
图8 协方差放大因子对局地化效果的影响

Fig. 8 Influence of covariance inflation factor on the RMSE of assimilation results

3.2.5 改变强迫参数
Lorenz-96模型作为一个高维强迫耗散非线性模型,由强迫参数F表征模型的非线性程度。F取不同范围的值,对应系统所处的状态也不一样。当F的取值大于4时,模型的解为混沌状态[31]
表3给出了实验4中基本参数的设置,当其他参数给定时,强迫参数在区间[4, 12]内变化,变化间隔设置为1。从图9中强迫参数变化对2种局地化方法RMSE的影响来看:① 从整个强迫参数变化结果来看,LA和FA方法均方根误差变化趋势相差不大,说明两种方法有着几乎一样的稳定性;② 当强迫参数F取8时,FA和LA的RMSE均取得同化过程的最小值,此时系统状态接近完美模型;③ 在整个强迫参数变化的过程中,FA的整体表现优于LA, 即加入模糊逻辑控制以后局地化方法的性能有所改善,证明了新方法在混沌系统中的鲁棒性。
图9 强迫参数变化对局地化效果的影响

Fig. 9 Influence of forcing parameters on the RMSE of localization results

3.3 PSD效果分析

采用功率谱密度(PSD)作为评价同化性能的指标,通过对集合奇异值矩阵中的每一列元素进行快速傅里叶变换来得到对应集合数的功率谱密度值。在不同观测误差下进行了3组实验(图10),结果表明:
(1)当观测误差相对较小时(R=0.0001),可以明显看到FA对应PSD曲线下的面积要比LA对应PSD曲线下的面积小,即FA方法对应的方差小,同化效果优。
(2)随着观测误差增大,LA和FA对应PSD曲线下的面积开始慢慢变得接近,但整体来说FA对应PSD曲线所围面积较小,也间接反映了FA算法的同化精度较高。
(3)模糊控制算法FA的PSD值随着观测误差的逐渐增大而增大,当误差增大到一定程度时,对应PSD值增大幅度明显减小。可以看出FA算法随着误差变化表现出更强的鲁棒性,当误差较小时,可以显著提高同化效率。
图10 2种局地化方法的PSD比较

注:Forecast曲线代表预测值的集合奇异值傅里叶谱,LA和FA代表分析值的集合奇异值傅里叶谱,纵坐标的PSD代表总体集合均值的PSD,曲线下的面积代表方差值。

Fig. 10 PSD assimilation performance comparison of the LA and FA algorithms

4 结论与讨论

4.1 结论

本文提出了一种新的基于模糊分析观测信息的局地化方案,新的模糊分析局地化方法(FA)在观测为随机离散的情况下,先将状态更新点与周围所有观测点之间的欧氏距离通过模糊高斯隶属度函数进行量化输出,然后运用规则表模糊推断确定每个观测点的权重,最后结合EnKF方案对模糊控制得到的局地化系数进行有效更新,修正背景误差协方差矩阵。基于集合卡尔曼滤波同化方案,本文比较了在不同模型误差下模糊分析局地化(FA)和传统局地化分析方法(LA)对同化结果的影响。此外,还对比分析了2种局地化分析方法在改变集合数、观测数和观测位置、协方差放大因子以及混沌系统强迫参数时的同化性能。实验采用均方根误差和功率谱密度作为评价局地化方法性能的指标,结果表明:
(1)FA方法在不同模型误差下的同化效果优于传统LA方法。新算法能够改善同化效果,提高同化精度。但是由于非线性系统的不稳定性,也会出现部分滤波发散的现象。
(2)FA方法在不同参数改变下的鲁棒性强于传统LA方法。新算法在消除观测点与状态更新点之间的虚假相关的同时让观测数据在局地化范围内更加有效地被利用起来,从而使得观测误差处理得到优化。
(3)FA方法在不同观测误差下的PSD表现较传统LA方法好。FA方法更加适用于EnKF同化,能获得较好的同化效果。

4.2 讨论

本文提出的新方法FA在EnKF同化背景下有效地改进了传统的局地化分析方法,同时在理论上充分证明了新方法的优势,但在设计模糊逻辑控制器时,系统对于模糊距离的判断和模糊等价权重系数的计算所花费的较长的额外时间是无法避免的。所以,如何将并行计算与模糊控制相结合来提高同化效率还有待进一步研究。另外,本文采用集合数据同化方法来探讨地学变量预报时的各种误差,通过与模糊逻辑控制以及部分地学研究方法相结合,有助于描述代表性误差研究中的空间异质性,这也是接下来需要重点关注的研究方向。总之,对于高分辨率的数值天气预报,充分考虑将模糊数学的思想与多尺度局地化结合起来,以此实现观测误差的优化处理,为今后的气象数据业务化奠定了基础。
[1]
李新, 黄春林, 车涛 , 等. 中国陆面数据同化系统研究的进展与前瞻[J]. 自然科学进展, 2007,17(2):163-173.

[ Li X, Huang C L, Che T , et al. Development of a Chinese land data assimilation system: Its progress and prospects[J]. Program in Natural Science, 2007,17(2):163-173. ]

[2]
李新 . 陆地表层系统模拟和观测的不确定性及其控制[J]. 中国科学:地球科学, 2013,43:1735-1742.

[3]
Penny S G, Akella S, Buehner M , et al. Coupled data assimilation for integrated earth system analysis and prediction: Goals, challenges, and recommendations[J]. Bulletin of the American Meteorological Society, 2017,98(7):169-172.

[4]
Houtekamer P L, Mitchell H L . Data assimilation using an Ensemble Kalman Filter technique[J]. Monthly Weather Review, 1991,26:796-811.

DOI PMID

[5]
De La Chevrotière, Michèle , Harlim J . A data-driven method for improving the correlation estimation in serial ensemble kalman filters[J]. Monthly Weather Review, 2017,145(3):985-1001.

DOI

[6]
EPSTEIN E S . Stochastic dynamic prediction1[J]. Tellus, 1969,21(6):739-759.

DOI PMID

[7]
Houtekamer P, Zhang F . Review of the ensemble kalman filter for atmospheric data assimilation[J]. Monthly Weather Review, 2016,144:4489-4532.

DOI

[8]
Anderson J L . A local least squares framework for ensemble filtering[J]. Monthly Weather Review, 2003,131(4):634-642.

DOI

[9]
Luo X, Bhakta T, Naevdal G . Correlation-based adaptive localization with applications to ensemble-based 4D-seismic history matching[J]. SPE Journal, 2018,DOI: 10.2118/185936-PA.

[10]
Hamill T M, Whitaker J S, Snyder C . Distance-dependent filtering of background error covariance estimates in an ensemble Kalman filter[J]. Monthly Weather Review, 2001,129(11):2776-2790.

DOI

[11]
Hunt B R, Kostelich E J, Szunyogh I . Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter[J]. Physica D Nonlinear Phenomena, 2006,230(1):112-126.

DOI

[12]
Sakov P, Bertino L . Relation between two common localisation methods for the EnKF[J]. Computational Geosciences, 2011,15(2):225-237.

DOI

[13]
韩培, 舒红, 许剑辉 . EnKF同化的背景误差协方差矩阵局地化对比研究[J]. 地球科学进展, 2014,29(10):1175-1185.

DOI

[ Han P, Shu H, Xu J H . A comparative study of background error covariance localization in EnKF data assimilation[J]. Advances in Earth Science, 2014,29(10):1175-1185. ]

[14]
韩培, 舒红, 许剑辉 , 等. 局地化方法在集合转换卡尔曼滤波同化的适用性研究[J]. 地球信息科学学报, 2016,18(9):1184-1190.

DOI

[ Han P, Shu H, Xu J H . An applicability study of covariance localization method in ETKF data assimilation[J]. Advances in Earth Science, 2016,18(9):1184-1190. ]

[15]
韩华, 刘凤鸣, 丁永生 . 基于海洋综合观测网络平台的信息模糊融合研究[C]. 中国灾害防御协会风险分析专委会年会, 2008: 284-289.

[ Han H, Liu F M, Ding Y S . Study on information fuzzy fusion based on marine integrated observation network platform[C]. Annual meeting of risk analysis committee of China disaster prevention association, 2008: 284-289. ]

[16]
Tyrus B, Timothy S . Correlation between system and observation errors in data assimilation[J]. Monthly Weather Review, 2018,146(9):2913-2931.

DOI PMID

[17]
卢勇男, 摆玉龙, 徐宝兄 . 耦合模糊控制算法的数据同化观测误差处理方法[J]. 遥感技术与应用, 2017,32(3):459-465.

[ Lu Y N, Bai Y L, Xu B X . Observation error handling methods of data assimilation coupled with fuzzy control algorithms[J]. Remote Sensing Technology and Application, 2017,32(3):459-465. ]

[18]
常明恒, 摆玉龙, 马小艳 , 等. 一种新的耦合模糊控制局地化的同化方法[J]. 地球科学进展, 2018,33(8):874-883.

[ Chang M H, Bai Y L, Ma X Y , et al. Localization analysis of data assimilation methods coupled with fuzzy control algorithms[J]. Advances in Earth Science, 2018,33(8):874-883. ]

[19]
Evensen G . Sequential data assimilation with a nonlinear quasigeostrophic model using Monte-Carlo methods to forecast error statistics[J]. Journal of Geophysical Research, 1994,99(5):10143-10162.

DOI

[20]
Gaspari G, Cohn S E . Construction of correlation functions in two and three dimensions[J]. Quarterly Journal of the Royal Meteorological Society, 1999,125(554):723-757.

DOI PMID

[21]
陈国范 . 模糊数学与天气预报[J]. 气象, 1979,5(6):22-24.

[ Chen G F . Fuzzy mathematics and weather forecast[J]. Meteorological Journal, 1979,5(6):22-24. ]

[22]
王耀南 . 智能控制系统[M]. 长沙: 湖南大学出版社, 2006.

[ Wang Y N. Intelligent Control System[M]. Changsha: Hunan University Press, 2006. ]

[23]
贾斌, 吴东华, 胡伟 . 智能技术在电力系统自动化中的应用探讨[J]. 科技资讯, 2010(33):60-60.

[ Jia B, Wu D H, Hu W . Discussion on the application of intelligent technology in power system automation[J]. Science and Technology Information, 2010(33):60-60. ]

[24]
何平, 王鸿绪 . 模糊控制的设计及应用[M]. 北京: 科学出版社, 1997: 234-260.

[ He P, Wang H X. Design and application of the fuzzy controller[M]. Beijing: Science Press, 1997: 234-260. ]

[25]
侯志祥, 刘振闻 . 基于MATLAB的模糊控制器的设计与仿真[J]. 微计算机信息, 2001,17(9):20-21.

[ Hou Z X, Liu Z W . The designation and simulation about the fuzzy controller based on matlab[J]. Micro Computer Information, 2001,17(9):20-21. ]

[26]
刘丙杰, 胡昌华 . 基于高斯隶属函数的模糊定性仿真[J]. 系统工程与电子技术, 2006(7):161-165.

[ Liu B J, Hu C H . Fuzzy qualitative simulation with Gauss membership function[J]. Systems Engineering and Electronics, 2006(7):161-165. ]

[27]
谢季坚, 刘承平 . 模糊数学方法及其应用[M]. 武汉: 华中理工大学出版社, 2005.

[ Xie J J, Liu C P. Fuzzy mathematics method and application[M]. Wuhan: Huazhong University of Science and Technology Press, 2005. ]

[28]
Lorenz E N . Predictability: A problem partly solved[R]. United Kingdom: ECMWF, 19961-18.

[29]
Tian X J, Xie Z H, Sun Q . A POD-based ensemble fourdimensional variational assimilation method[J]. Tellus A: Dynamic Meteorology and Oceanography, 2011,63(4):805-816.

DOI

[30]
张洪芹, 田向军, 张承明 , 等. 非线性集合四维变分同化方法NLS-4DVar之局地化改进[J]. 中国海洋大学学报(自然科学版), 2016,46(10):10-15.

[ Zhang H Q, Tian X J, Zhanng C M , et al. An improved localization scheme to the NLS-4DVar method[J]. Periodical of Ocean University of China, 2016,46(10):10-15.

[31]
Lorenz E N, Emanuel K A . Optimal sites for supplementary weather observations: Simulation with a small model[J]. Journal of the Atmospheric Sciences, 1998,55(3):399-414.

DOI

文章导航

/