Modeling of Geographical Process Evolution of Spatio-temporal Objects of Multi-granularity based on Bayesian Network: A Case Study of the Xin'an Jiang Model

  • ZHANG Zhengfang , 1, 2 ,
  • YAN Zhenjun 1, 2 ,
  • WANG Zengjie 1, 2 ,
  • FU Rong 1, 2 ,
  • LUO Wen , 1, 2, 3, * ,
  • YU Zhaoyuan 1, 2, 3
Expand
  • 1. Key Laboratory of Virtual Geographic Environment of The Ministry of Education (Nanjing Normal University), Nanjing 210023, China
  • 2. Cultivation Base of State Key Laboratory of Geographical Environment Evolution, Jiangsu Province, Nanjing 210023, China
  • 3. Jiangsu Provincial Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China
*LUO Wen, E-mail:

Received date: 2020-07-31

  Revised date: 2020-12-25

  Online published: 2021-03-25

Supported by

National Key Research and Development Program of China(2016YFB0502301)

National Natural Science Foundation of China(41976186)

Copyright

Copyright reserved © 2010.

Abstract

Spatio-temporal objects of multi-granularity have the characteristics of multi-granularity, multi-type, multi-form, multi-reference system, multi-relation, multi-dimensional dynamics, and multi-energy autonomy. It can be used to directly describe the real world from micro to macro. Based on the spatio-temporal objects modeling theory, constructing the integrated expression of the coupled evolution of multi-scale geographic objects is the key to supporting geographic analysis and modeling with spatio-temporal objects of multi-granularity model. Based on spatio-temporal objects of multi-granularity modeling theory, this paper develops a Bayesian network-based geographic process evolution expression and modeling method on the basis of probability diagrams and conditional probability tables. This method uses spatio-temporal objects of multi-granularity as Bayesian network nodes, and constructs Bayesian network according to the association relationship between spatio-temporal objects of multi-granularity. It uses Bayesian probability to express the strength of the relationship between spatio-temporal objects of multi-granularity. And it describes the dynamic changes of the feature state of the elements through the update operator and the probability graph model. Based on this method, the Xin'anjiang Model is selected to conduct the modeling and simulation experiment of the geographic process of spatio-temporal objects of multi-granularity. This paper uses the hydrological data of Chengcun Village from 1989 to 1995 as training data, and the hydrological data of 1996 as simulated data. Using precipitation surface, evaporation surface, runoff surface and confluence surface to construct Bayesian network and simulate the state of runoff and sink flow. The experimental results show that the method can not only model the evolution of hydrological process, but also can simulate the changes of runoff and sink flow in the hydrological process, and the correct rate can reach 97.5% and 95.9%.

Cite this article

ZHANG Zhengfang , YAN Zhenjun , WANG Zengjie , FU Rong , LUO Wen , YU Zhaoyuan . Modeling of Geographical Process Evolution of Spatio-temporal Objects of Multi-granularity based on Bayesian Network: A Case Study of the Xin'an Jiang Model[J]. Journal of Geo-information Science, 2021 , 23(1) : 124 -133 . DOI: 10.12082/dqxxkx.2021.200426

1 引言

全空间信息系统是一种面向从微观静态世界到宏观动态世界的空间信息系统,是对传统地理信息系统(Geographical Information System, GIS)在空间范畴、属性特征、时空关系、认知能力、行为能力等方面的扩展和延拓[1]。多粒度时空对象建模理论是全空间信息系统建模的理论基础[2,3],其通过8个表达元素(时空参照、时空位置、空间形态、属性特征、组成结构、行为能力、认知能力)和5个操作集合(构造和析构、分解和组合、转化和演化、关系动态、学习和决策)实现对象建模[4]。现有多粒度时空对象建模理论的研究仍多聚焦于静态对象或简单动态对象(如移动对象),对复杂地理过程建模的研究尚不多见[1,2,3,4]。如何有效衔接多粒度时空对象的对象化表达优势,将其与地理过程模型进行有机融合就成为全空间信息系统能否高效支撑复杂地理分析的关键。
传统GIS对于地理过程的对象化表达与建模可大致分为3类[5,6,7,8,9,10,11,12,13],第1类将地理过程以地理要素的形式进行表达,将地理过程表示为多个地理要素的相互作用,以面向对象的思想对地理要素进行描述和组织[14,15]。由于缺乏对地理演变过程的表达,这类方法无法揭示潜在的地理现象或内部地理过程的机制。第2类是将地理过程以事件链的形式进行表达,将整个地理过程看作一系列事件的集合,每次事件代表着形状、属性等状态的变化[16,17],然而,以事件为中心的建模方法强调了事件的作用,注重对每次变化前后状态的描述,无法探索事件发生方式和原因,因而该类方法在对地理要素之间相互作用关系的表达上存在不足。第3类是对地理过程进行抽象,采用形式化表达的方式描述地理实体的动态变化,该类方法能够描述地理过程演化过程中,各地理要素间的相互作用关系[18,19],但由于不同模态下地理过程的机制存在较大差异,这类方法对多模态地理过程的表达与建模比较复杂且难以推广应用。
多粒度时空对象表达模型实现了不同尺度地理对象组成结构及其关联关系表达,为多尺度地理对象耦合演化的表达提供基础。但地理过程中的多粒度时空对象既有自己独特的组成部分和属性特征,又和其他多粒度对象间存在因果或相关关系。现有多粒度时空对象在表达演化过程时更关注对象间关联关系在演化前后的变化[20],缺乏对象间相互作用关系的定量化描述,难以实现多粒度时空对象地理过程耦合演化的表达,Bayes网络是一种将图论和概率理论相结合的建模方 法[21],具有将对象关系定量化和结构形式化的特征。在多粒度时空对象模型中,使用图模型表示对象之间关联关系,通过条件概率表表示对象间的关系强度,通过引入Bayes网络的图模型和条件概率表,实现地理过程中不同对象间结构关系和状态演化的形象化描述,同时以Bayes概率和更新算子表达关系作用强度与动态变化,可为多粒度时空对象间复杂关系表达、推理、分析、预测提供方法支撑。
本文通过对多粒度时空对象间的关联关系和要素特征状态变化建模,建立基于Bayes网络地理过程演化的表达方法。以新安江模型为例,实现水文过程的表达与建模,并基于Bayes条件概率表和更新算子的定义实现新安江模型地理过程要素特征(降水量、蒸发量、产流量和汇流量)状态的推理。最后以呈村1989—1995年水文数据为训练数据,1996年的水文数据为验证数据,研究了本文所提方法对地理过程演化建模和模拟的适用性。论文总体思路如图1所示。
图1 论文总体思路

注:地理过程 M t t 时刻包含多粒度时空对象 X 1 , X 2 , X 3 , X i 1 , X i 2 i = 1,2 表示 X i 的2个取值状态, P 1 , P 2 表示 X 3 的概率 P X 3

Fig. 1 Basic idea

2 多粒度时空对象地理过程的表达

在现实世界中,人类将所观察和认知的目标限定在有限的空间实体,不同空间实体具有不同的空间尺度,不仅可以分解为更小的时空实体,也可以组成更大的实体。本文实体的大小即粒度大小,由此需要不同粒度的时空实体对现实世界进行抽象和描述,构建由多粒度时空对象组成的现实世界实体描述[3]。在全空间地理信息系统中,给定任意多粒度时空对象 M = ( E , O ) , E = { R , S , D , A , , G , , F } 是表达集合。其中, R 为时空参照表达, S 为时空位置表达, D 为空间形态表达, A 为属性特征表达, 为组成结构表达, G 为关联关系表达, 为行为能力表达, F 为认知能力表达,通过对其时空基准,几何结构,关联关系的完整性描述,实现地理对象多类型、多形态、多参照系、多元关联和多能自主的动态表达。 O = { α , β , γ , δ , ε } 是操作集合,其中: α 为构造与析构操作, β 为分解与组合操作, γ 为转化与演化操作, δ 为关系动态操作, ε 为学习与决策操作[15]
在多粒度时空对象中对象变化通过演化操作来实现,演化操作是对自身集合的演化,不会产生新的对象,是一状态集合到另一状态集合的变化操作。给定任意多粒度时空对象 M = E , O 和演化操作γ,其演化过程可通过演化算子 Evolution 加以实现,其规范化定义为:
Evolution M t , γ = M t + 1 : E M t E M t + 1 t = 0,1 , , s
式中: M t M t + 1 分别表示 t 时刻和 t + 1 时刻的多粒度时空对象 M ; E M t E M t + 1 分别表示 t 时刻和 t + 1 时刻多粒度时空对象 M t 的表达集合; s 表示整个演化过程的时间长度。
地理过程由地理系统内部各要素协同演化构成。因此,地理过程各组成要素间的组合关系,表现为多粒度时空对象的嵌套结构,给定一个由 n 个多粒度时空对象 m 1 , m 2 , , m n 组成的地理过程 M
M = { m 1 , m 2 , , m n }
子对象 m 1 , m 2 , , m n 也可以通过演化γ下发生演化,用演化算子 Evolution 表达为:
Evolution m xt , γ = m xt + 1 : E m xt E m xt + 1 t = 0,1 , , s x = 1,2 , , n
上式虽然实现了多粒度时空对象各组成要素的协同演化表达,但未能体现各要素间关联关系在演化过程中的作用。需要对各组成要素的结构关系进行表达,并对要素间的耦合演化过程进行模拟与建模。为此可定义嵌入各组分间结构关系的多粒度时空对象表达为:
M t = { X m 1 , m 2 , , m n | m 1 t , m 2 t , , m nt } t = 0,1 , , s
式中: X m 1 , m 2 , , m n 表示地理过程 M 中各组成要素间的结构关系。据式(1)可进一步定义多粒度时空对象的地理过程表达为:
Evolution = M t + 1 : { E m t f X m 1 , m 2 , , m n | m 1 t , m 2 t , , m nt E m t + 1 } t = 0,1 , , s
式中 f X m 1 , m 2 , , m n | m 1 t , m 2 t , , m nt 表示地理过程在要素相互关系作用的基础上的协同演化。下面引入Bayes网络方法,实现其形式化表达与计算。

3 基于Bayes网络的多粒度时空对象 地理过程的表达方法

3.1 Bayes网络方法

Bayes网络是一种模拟人类推理过程的概率模型。Bayes网络的拓朴结构是一个有向无环图[22],其中变量为节点,变量间相关或因果关系为有向边。Bayes网络节点概率的动态演化由条件概率表Conditional Probability Table(CPT)控制,每个节点涵盖了父节点联合分布下的概率分布表[23],表示节点间的关系强度。
定义3.1 Bayes概率[24]:记 G = X 1 = x 1 , X 2 = x 2 , , X n = x n 为观测样本,其中 X 为事件变量, x 为变量值或状态,若 θ 为事件 X = x 发生的先验概率, ζ 为先验知识, P θ | ζ 为概率密度函数,Bayes概率表达为已知先验概率密度 P θ | ζ 和样本 G 条件下 n + 1 次事件 X n + 1 = x n + 1 发生的概率: P X n + 1 = x n + 1 | θ , ζ
由全概率公式可知:
P X n + 1 = x n + 1 | θ , ζ = P X n + 1 = x n + 1 | θ , G , ζ P θ | , G , ζ = θP θ | , G , ζ
定义3.2 Bayes网络[25]:Bayes网络是一个二元组 B = S , X ,其中, S 表示有向无环图, X 表示一个离散变量集合 X = x 1 , x 2 , , x n X 中的变量和 S 中的节点一一对应,节点之间用有向边 进行连接, 前的节点表示父节点, 后的节点表示子节点,有向边代表变量之间存在条件依赖关系,且 X 中的每个变量都有一个相联系的条件概率分布 P 。例如,一个包含3个节点 X 1 , X 2 , X 3 的Bayes网络,假定 X 1 X 2 , X 3 的父节点, X 2 X 3 的父节点,根据 X 1 , X 2 , X 3 的结构关系,它们的联合概率表达式为:
P X 1 , X 2 , X 3 = P X 1 P X 2 | X 1 P X 3 | X 1 , X 2
因此,每个节点发生的概率只和它的父节点有关。

3.2 基于Bayes网络的多粒度时空对象地理过程 演化表达方法

在一个地理过程中,存在着若干个多粒度时空对象,这些多粒度时空对象作为节点,对象间的关联关系通过有向边进行表示,并通过条件概率表量化描述关联关系的作用强度,建立Bayes网络。因此,可以基于Bayes网络对多粒度时空对象的地理过程演化进行表达。
定义 i 个多粒度时空对象 m 1 , m 2 , , m i 组成的地理过程: M t = X m 1 , m 2 , , m i | m 1 t , m 2 t , , m it ,它们的表达集合在 t 时刻分别为 E m 1 t , E m 2 t , , E m it ,其中, E m it = { R , S , D , A , , G , , F } ;若不同的表达集合都对应一个特征状态,多粒度时空对象 m i j 个状态,定义其状态集合为 W m i 1 , W m i 2 , , W m ij ,因此,每个时刻 m i 的表达集合都对应状态集合中的一个状态。为表达各组分间的结构关系 X m 1 , m 2 , , m i ,定义Bayes网络 B = S , X ,其中 S 表示有向无环图, X 代表图的节点集合,用来表示多粒度时空对象 m 1 , m 2 , , m i ,节点与节点间用有向边 连接,用来表示多粒度时空对象间的关联关系。其中,父节点为自变量;子节点为因变量。节点的条件概率表为父节点联合分布下的概率分布表,状态概率集合为某时刻多粒度时空对象的表达集合对应各个状态的概率分布,他们的表示分为无父节点和有父节点2种情况:
① 若多粒度时空对象 m i 没有父节点,它的条件概率表为
B m i = ( W m i 1 , P W m i 1 ) , ( W m i 2 , P W m i 2 ) , , ( W m ij , P W m ij )
式中: B m i 表示多粒度时空对象 m i 的条件概率表, W m ij 表示 m i 的第 j 个特征状态, P W m ij 表示 m i 的表达集合对应的状态为 W m ij 的概率,且 P W m i 1 + P W m i 2 + + P W m ij = 1 。它在 t 时刻的状态概率集合用 C m it 表示,形式化表达为:
C m it = ( W m i 1 , P W m i 1 ) , ( W m i 2 , P W m i 2 ) , , ( W m ij , P W m ij )
② 若多粒度时空对象 m i 有一个或多个父节点 m 1 , m 2 , , m e e i - 1 ,分别有 d 1 , d 2 , , d e 个状态,即 m 1 , m 2 , , m e m i ,在所有可能状态的父节点下 m i 的状态概率集合组成的条件概率表为:
B m i W m 1 r 1 , W m 2 r 2 , , W m ere = ( W m i 1 , P W m i 1 W m 1 r 1 , W m 2 r 2 , , W m ere ) , ( W m i 2 , P W m i 2 W m 1 r 1 , W m 2 r 2 , , W m ere ) , , ( W m ij , P W m ij W m 1 r 1 , W m 2 r 2 , , W m ere ) r 1 = 1,2 , , d 1 , r 2 = 1,2 , , d 2 , , re = 1,2 , , d e
式中: B m i W m 1 r 1 , W m 2 r 2 , , W m ere 表示多粒度时空对象 m i 的条件概率表, W m ij 表示 m i 的第 j 个特征状态, P W m ij W m 1 r 1 , W m 2 r 2 , , W m ere 表示在父节点 m 1 , m 2 , , m e 表达集合对应第 r 1 , r 2 , re 个状态下, m i 的表达集合对应第 j 个状态的概率。它在 t 时刻的状态概率集合用 C m it 表示,形式化表达为:
C m it = ( W m i 1 , P W m i 1 W m 1 r 1 , W m 2 r 2 , , W m ere ) , ( W m i 2 , P W m i 2 W m 1 r 1 , W m 2 r 2 , , W m ere ) , , ( W m ij , P W m ij W m 1 r 1 , W m 2 r 2 , , W m ere )
条件概率表中各状态的概率值可利用公式6通过训练数据计算得到。对于无父节点的多粒度时空对象,其条件概率表只考虑本身各个状态的概率,因此任何时刻的状态概率集合与条件概率表保持一致且不会改变。对于有父节点的多粒度时空对象,他们的状态概率集合通过条件概率表和关联节点的状态概率集合利用式(6)计算得到,状态概率集合中各状态的概率值随其他节点的变化不断更新。此时基于Bayes网络的多粒度时空对象地理过程演化的形式化表达已建立完成。

3.3 基于演化的状态更新方法

对于地理过程的演化,上述对象间的结构关系通过Bayes网络进行表达,对象间关系的量化描述通过条件概率表进行描述,当其中一个或多个节点的表达集合发生改变时,其子节点的状态概率集合中各个状态概率值发生变化,导致他们的表达集合也将会发生变化。因此需要在实现过程中,引入演化算子 Evolution 并定义更新算子 Update ,来实现对二者的同步和更新。
定义节点 m i 的入度为指向该节点的边的条数,用 K m i 表示,即 m i 的状态受到 K m i 个要素的影响。对于给定地理过程 M t = X m 1 , m 2 , , m i | m 1 t , m 2 t , , m it ,当其中 n n i 个节点由于某演化操作,他们的表达集合通过 Evolution 算子发生变化时,与这些节点有关联关系并为因变量的节点的状态概率集合将会发生变化,这些发生变化的节点可通过 Update 算子进行表达集合的更新,表达为:
Update m i t 1 = m i t 2 : E m i t 1 E m i t 2
式中:多粒度时空对象 m i t 2 时刻通过 Update 算子,它的表达集合从 E m i t 1 更新为 E m i t 2 ,与演化算子 Evolution 不同, Update 算子不需要任何操作算子就能实现表达集合的改变。更新顺序如图2所示。
图2 基于演化的状态更新流程

Fig. 2 Flow chart of status update based on evolution

图2实现了地理演化过程的状态更新。如一个包含3个多粒度时空对象地理过程 M t = { X m 1 , m 2 , m 3 | m 1 t , m 2 t , m 3 t } ,对象间的结构关系建立Bayes网络,如图3所示。在 t 1 时刻, m 1 的表达集合 E m 1 t 1 对应的状态为 W m 11 , m 2 的表达集合 E m 2 t 1 对应的状态为 W m 21 ,此时 m 3 的表达集合为 E m 3 t 1 ,在 t 2 时刻, m 1 m 2 的表达集合 E m 1 t 1 E m 2 t 1 由于自身演化 γ 通过 Evolution 算子对应的状态变为 W m 12 W m 22 ,根据 m 3 的条件概率表和状态概率集合的计算,选取状态概率集合中概率最大的状态,利用 Update 算子将 m 3 的表达集合 E m 3 t 1 更新为 E m 3 t 2 。因此,地理过程中的多粒度时空对象通过基于演化的状态更新方法,实现自身表达集合的更新。
图3 基于Bayes网络的地理过程演化的形式化模拟

注:地理过程 M t t 时刻包含多粒度时空对象 m 1 t , m 2 t , m 3 t ; W m i 1 , W m i 2 i = 1,2 m i 的2个表达集合; E m 3 t , E m 3 t 分别为 m 3 t 时刻的2个表达集合;Evolution( )和Update( )表示演化算子和更新算子。

Fig. 3 Formal simulation of geographical process evolution based on bayesian network

4 基于新安江模型的多粒度时空对象演化建模

4.1 实验数据和配置

新安江模型为面向过程的水文模型,普遍应用于湿润与半湿润地区的水文过程模拟。包括蒸散发过程计算、产流计算及汇流计算[27]。新安江模型的基本的建模和计算单元是流域单元,其中的水文过程通过动力方程加以表达。由于其动力过程不易直接表达成对象,直接以流域单元作为时空对象建模的基本单元将会导致流域过程表达上的困难。本文选取新安江模型中降水、蒸发、产流、汇流4个基本过程的交界面,将降水过程、蒸散发过程、产流过程和汇流过程聚焦至降水面、蒸发面、产流面以及汇流面的状态变化上。以上述4个面作为对象建模的基本单元,构建其多粒度时空对象描述,并利用条件概率表模拟产流量和汇流量的状态。
以呈村流域1989—1996年逐日降水量、蒸发量、产流量以及汇流量为基础数据进行模型验证[26],其中,1989—1995年为训练期,1996年为验证期。实验硬件配置为Intel(R)Core(TM)i7 8700 3.20 GHz(4核),16 G内存,操作系统为Windows 10,软件采用MATLAB R2017a 和FULLBNT包。

4.2 基于新安江模型的多粒度时空对象演化建模

新安江水文过程 M t 包括子对象降水面(Y)、蒸发面(Z)、产流面(L)以及汇流面(T)对象,表示为 M t = X Y , Z , L , T | Y t , Z t , L t , T t 。在上述多粒度时空对象中,选取流量作为属性要素特征进行对象构造。如降水面的逐日降水量、蒸发面的逐日蒸发量、产流面的逐日产流量以及汇流面的逐日总径流量,分别表示为 E Y t , E Z t , E L t , E T t
为了得到 Y , Z , L , T 的状态集合,必须对其降水量、蒸发量、产流量、汇流量的要素特征进行离散化分级处理。由于对这类要素特征分级的相关研究较少,没有较好的分级依据,为避免要素特征的分级数量对模拟结果产生较大影响,对每个节点的要素特征分为三、五、七类不同的分级状态,通过3种不同数量的分级方式验证要素特征分级数量对模拟结果的敏感性。对于要素特征的分级方法,综合考虑到状态集合的辨识度和模型的复杂程度,并根据研究数据的值的分布,采用自然间断点分级法,对每个节点变量设定阈值以划分变量的粒度等级,变量状态划分如表1所示。
表1 水文模型变量状态分级

Tab.1 Hydrological model variable state score table

状态 Y/mm Z/mm L/mm T/(m3/s)
三类分级 一级 <16.1 <1.5 <14.3 <4.3
二级 16.1~63.8 1.5~3.4 14.3~62.6 4.3~19.2
三级 >63.8 >3.4 >62.6 >19.2
五类分级 一级 <5.7 <0.8 <5.4 <1.3
二级 5.7~18.8 0.8~1.6 5.4~18.2 1.3~5.4
三级 18.8~37.7 1.6~2.8 18.2~40.5 5.4~13.9
四级 37.7~68 2.8~4.3 40.5~81.9 13.9~31.9
五级 >68 >4.3 >81.9 >31.9
七类分级 一级 <3.8 <0.5 <3.3 <0.6
二级 3.8~12.0 0.5~1.1 3.3~10.7 0.6~2.0
三级 12.0~23.7 1.1~1.7 10.7~21.7 2.0~4.2
四级 23.7~41.2 1.7~2.5 21.7~38.2 4.2~7.5
五级 41.2~68.0 2.5~3.6 38.2~65.7 7.5~13.9
六级 68.0~120.6 3.6~4.9 65.7~113.9 13.9~31.9
七级 >120.6 >4.9 >113.9 >31.9
根据本文基于Bayes网络的地理过程演化表达方法,将这4个多粒度时空对象 Y , Z , L , T 作为节点,为建立节点间的关联关系,根据新安江模型的理论假设,与降水量、蒸发量、产流量、汇流量有关的公式有:
Z = Z U + Z L + Z P
Z U = WU + Y
L = PE + W - WM
PE = Y - Z
QT = QS + QI + QG
式中: Z 为总蒸发量, Z U , Z L , Z P 分别为上层蒸发量、下层蒸发量、深层蒸发量; WU 为上层土壤含水量, Y 为降水量; L 为产流量, PE , W , WM 分别为扣除雨期蒸发后的降水量、流域平均初始土壤含水量和流域平均蓄水容量; QT 为汇流量, QS , QI , QG 分别表示地面径流、壤中流、地下径流。通过以上公式及水文过程可知,蒸发量与降水量有关,降水量和蒸发量共同决定产流量,而汇流量的多少最终取决于产流量,由此可知降水量、蒸发量和产流量都会影响汇流量。通过以上关系构建的自变量和因变量节点间的有向边为: Y Z , L , T Z L , T L T ,基于此,构建的Bayes网络结构如图4中左侧的关系结构所示。
图4 基于Bayes网络的多粒度时空对象新安江模型的表达

注:当Y, Z, L在特定取值时,T节点的取值概率,例如(Yi,Zj,Lk)表示降水面、蒸发面和产流面的状态级别分别为i, j, k时,汇流面(T)的取值概率。

Fig. 4 The expression of Xin'anjiang model of spatio-temporal objects of multi-granularity based on Bayesian network

4.3 实验结果

将T节点作为模拟对象,Y、Z、L节点作为已知对象,通过节点的关系结构和式(6)对呈村1989—1996年的数据进行训练,得到T节点的条件概率表,如图4所示。图中左上方为节点的关系结构图(带有虚线的节点代表状态为不确定值),左下方为条件概率表计算公式。右方是根据T节点的条件概率表所绘制的热力图,其中,横坐标表示T节点的等级状态,纵坐标表示T的父节点Y、Z、L分别取5种状态时的等级情况,因为每个节点都可取5种等级状态,所以一共为125种情况,纵坐标从上到下父节点取值情况依次为(Y1,Z1,L1),(Y1,Z1,L2)…(Y5,Z5,L5)。热力图中的值表示在不同父节点状态下各个T节点状态的概率值,用横细线表示,颜色越深表示概率越大,白色表示概率值为0。在图4中,白色区域(概率值为0)表示父节点状态下T节点的概率值为0或者数据中不存在相应的父节点状态的情况。从T节点每个状态下的概率分布来看,只有部分区域内概率值大于0,且在该区域白色与黑色相见分布,说明汇流量状态的概率值与降水量、蒸发量、产流量的大小有关。从整体来看,T节点的概率分布呈对角线趋势,随着T节点状态值的增加,概率值大于0的区域越来越少,且整体概率值越来越低,颜色逐渐变浅,说明当降水量、蒸发量和产流量较小时,汇流量也较小的概率会很大,汇流量较大的概率会很小;随着降水量、蒸发量和产流量越来越大,汇流量较大的概率也会越来越大,汇流量较小的概率会逐渐减小甚至概率为0。
利用1996年呈村流域降水量、蒸发量和产流量模拟产流量和汇流量的状态以验证模型的预测能力。模拟结果如图5所示,分别是变量状态级别数量为三、五、七类时模拟的汇流量状态对比图,和变量状态级别数量为三、五、七类时模拟的产流量状态对比图。使用正确率(模拟值和真实值状态级别相等的比例)作为指标来表现模拟效果的精度,对比结果显示,分类数量增多会导致正确率降低。当每个变量的状态级别分为3类时,模拟产流量和汇流量结果具有最高的正确率,分别为97.5%和95.9%。其原因可能是,当训练样本总量不变的情况下,分类级别数量的增多导致每个状态训练样本量的减少。预测结果中6—7月的汇流量的模拟值与真实值有差别,可能与6、7月是雨季,影响汇流量的因素较多有关。
图5 1996年呈村汇流量模拟结果对比

Fig. 5 Comparison of the results of the forecast of the flow of Chengcun villages in 1996

因此,基于Bayes网络的地理过程演化建模可以对新安江模型的表达进行简化,利用关系结构图和条件概率表更加具体化和形象化的描述了新安江模型过程,并通过Bayes网络的特性实现了产流量和汇流量的状态推理,有助于强化对新安江模型表达的水文过程的演化机理分析,揭示各要素耦合演化规律。

5 结论与讨论

5.1 结论

本文针对多粒度时空对象地理过程表达中,对象间相互作用关系的定量化描述不足问题,提出了基于Bayes网络地理过程演化的表达。总结来讲,本文的主要研究成果为:
(1)基于多粒度时空对象理论,利用演化算子对多粒度时空对象地理过程进行形式化表达。将地理系统内部各要素的组成关系,描述为多粒度时空对象的嵌套结构,并引入组分间的结构关系对地理过程进行表达。
(2)基于Bayes网络理论,根据多粒度时空对象间的关联关系建立Bayes网络,利用概率图模型和对象特征状态实现多粒度时空对象地理过程演化表达。并提出一种基于演化的状态更新方法,实现对象表达集合的更新。
(3)基于本文的表达方法,重构新安江模型的水文过程模型,模拟1996年呈村的产流量状态和汇流量状态。模拟正确率达97.5%和95.9%,模拟结果证实了基于Bayes网络进行地理过程演化建模和模拟的适用性。

5.2 讨论

利用本文提出的基于Bayes网络的多粒度时空对象地理过程演化表达方法可以有效地解决对象间相互作用关系的定量化描述不足问题,但是也存在着以下几点需要努力的方向:
(1)地理要素特征状态分级的科学性问题。本文根据地理要素属性数据的统计规律,采用自然间断点分级法对节点属性进行等级划分,但是这种分级方法完全从数据出发,其结果可能与实际地理现象的演化规律不一致,在后续的研究中可以引入专家经验和借鉴领域通用标准来使分级更加科学。
(2)基于Bayes网络的多粒度时空对象地理过程建模适用性问题。虽然本文通过历史数据可以训练出较为稳定的条件概率表,但是对于时间敏感的地理过程,利用静态Bayes网络训练的条件概率表无法随时间发生变化,后续研究可以将本文的静态Bayes网络改进为动态Bayes网络,以扩展本文方法的适用性。
[1]
华一新, 周成虎 . 面向全空间信息系统的多粒度时空对象数据模型描述框架[J]. 地球信息科学学报, 2017,19(9):1-4.

[ Hua Y X, Zhou C H , et al. Description frame of data model of multi-granularity spatio-temporal object for Pan-spatial Information System[J]. Journal of Geo-information Science, 2017,19(9):1-4.]

[2]
王健健, 王艳楠, 周良辰 , 等. 多粒度时空对象关联关系的分类体系与表达模型[J]. 地球信息科学学报, 2017,19(9):1164-1170.

[ Wang J J, Wang Y N, Zhou L C , et al. The classification system and expression model of the relationship of spatio-temporal object of multi-granularity[J]. Journal of Geo-information Science, 2017,19(9):1164-1170.]

[3]
华一新 . 全空间信息系统的核心问题和关键技术[J]. 测绘科学技术学报, 2016,33(4):331-335.

[ Hua Y X . The core problems and key technologies of the whole space information system[J]. Journal of Geomatics Science and Technology, 2016,33(4):331-335.]

[4]
萧声隽, 宗真, 项丽燕 , 等. 多粒度时空对象空间关系的统一表达与计算[J]. 地球信息科学学报, 2017,19(9):1178-1184.

[ Xiao S J, Zong Z, Xiang L Y , et al. The unified expression and calculation of spatial relationships of spatio-temporal object of multi-granularity[J]. Journal of Geo-information Science, 2017,19(9):1178-1184.]

[5]
Chi Y X, Li R J, Zhao S L , et al. Measuring multi-spatiotemporal scale tourist destination popularity based on text granular computing[J]. Plos One, 2020,15(4):1-33.

[6]
闾国年, 袁林旺, 俞肇元 . 地理学视角下测绘地理信息再透视[J]. 测绘学报, 2017,46(10):1549-1556.

[ Lv G N, Yuan L W, Yu Z Y . Surveying and mapping geographical information from the perspective of geography[J]. Acta Geodaetica et Cartographica Sinica, 2017,46(10):1549-1556.]

[7]
Bilichenko I N, Sedykh S A . Spatio-temporal organization of geosystems of the central part of Barguzinskii range[J]. IOP Conference Series: Earth and Environmental Science, 2019,381(1): 012013(7).

[8]
Gebbert S, Pebesma E . The GRASS GIS temporal framework[J]. International Journal of Geographical Information Systems, 2017,31(7-8):1273-1292.

[9]
Cao Y, Huang Y, Chen J , et al. Geographic process modeling based on geographic ontology[J]. Open Geosciences, 2018,10(1):782-796

[10]
Kneis D . A lightweight framework for rapid development of object-based hydrological model engines[J]. Environmental Modelling & Software, 2015,2(68):110-121.

[11]
Lü G N, Batty M, Strobl J , et al. Reflections and speculations on the progress in Geographic Information Systems (GIS): A geographic perspective[J]. International Journal of Geographical Information Science, 2018,33(3):1-22.

[12]
Xie J, Xue C . A top-down hierarchical spatio-temporal process description method and its data organization[M]. International Symposium on Spatial Analysis, Spatial-Temporal Data Modeling, and Data Mining, 2009(7492):74922P-1-10.

[13]
Xue C, Zhou C, Fenzhen S U , et al. Research on process-oriented spatio-temporal data model[J]. Acta Geodaetica Et Cartographica Sinica, 2010,39(1):95-101.

[14]
Raper J, Livingstone D . Development of a geomorphological spatial model using object-oriented design[J]. International Journal of Geographical Information Systems, 1995,9(4):359-383.

[15]
Taylor P, Grenon P . SNAP and SPAN: Towards dynamic spatial ontology[J]. Cognition, 2009,1(907681677):69-103.

[16]
Worboys, M, Hornsby, K . From objects to events: GEM, the geospatial event model. In: Egenhofer, M, Freksa, C, Miller, H (Eds). Proceeding of GIScience 2004: Lecture Notes in Computer Science, vol. 3234, Springer: Berlin, 2004: 327-343.

[17]
Galton A, Worboys M . Processes and events in dynamic geo-networks[C]. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 2005,3799LNCS:45-59.

[18]
Xie J, Xue C . A top-down hierarchical spatio-temporal process description method and its data organization[M]. Proceedings of International Society for Optical Engineering, 2009,10:7492.

[19]
Xue C, Zhou C, Fenzhen S U , et al. Research on process-oriented spatio-temporal data model[J]. Acta Geodaetica et Cartographica Sinica, 2010,39(1):95-101.

[20]
李冬双, 刘袁, 石格格 , 等. 基于时变网络的多粒度时空对象关系演化过程表达与建模[J]. 地球信息科学学报, 2017,19(9):1171-1177.

[ Li D S, Liu Y, Shi G G , et al. The expression and modeling of relationship evolution of spatio-temporal objects of multi-granularity based on time-dependent network[J]. Journal of Geo-information Science, 2017,19(9):1171-1177.]

[21]
Paprotny D, Oswaldo M N . Estimating extreme river discharges in Europe through a Bayesian network[J]. Hydrology and Earth System Sciences Discussions, 2016: 1-33.

[22]
Yae S J, Muhammad A, Jiyoung Y , et al. A Bayesian Network-Based Probabilistic Framework for Drought Forecasting and Outlook[J]. Advances in Meteorology, 2016,(2016-3-10), 2016: 1-10.

[23]
Pan Z, Lu W, Fan Y , et al. Identification of groundwater contamination sources and hydraulic parameters based on bayesian regularization deep neural network[J]. Environmental Science and Pollution Research, 2021: 1-13.

PMID

[24]
Fasaee M A K, Berglund E, Pieper K J , et al. Developing a framework for classifying water lead levels at private drinking water systems: A Bayesian Belief Network approach[J]. Water Research, 2021,189:116641.

DOI PMID

[25]
Molina J, Santiago Z, Pablo RG , et al. Innovative analysis of runoff temporal behavior through bayesian networks[J]. Water, 2016,8(11):484-489.

[26]
董洁平, 李致家, 戴健男 . 基于SCE-UA算法的新安江模型参数优化及应用[J]. 河海大学学报(自然科学版), 2012,40(5):485-490.

[ Dong J P, Li Z J, Dai J N . Application of SCE-UA algorithm to optimization of Xin' anjiang model parameters[J]. Journal of Hohai University(Natural Sciences), 2012,40(5):485-490.]

[27]
刘金涛, 宋慧卿, 张行南 , 等. 新安江模型理论研究的进展与探讨[J]. 水文, 2014,34(1):1-6.

[ Liu J T, Song H Q, Zhang X N , et al. A discussion on advances in theories of xinanjiang model[J]. Journal of China Hydrology, 2014,34(1):1-6.]

Outlines

/