专刊:地理时空知识图谱理论方法与应用

基于超赋值理论的模糊位置描述形式化与推理机制

  • 张雪英 , 1, 2 ,
  • 叶鹏 , 3, 4, * ,
  • 张慧峰 1, 2
展开
  • 1.江苏省地理信息资源开发与利用协同创新中心,南京 210023
  • 2.南京师范大学虚拟地理环境教育部重点实验室,南京 210023
  • 3.扬州大学城市规划与发展研究院,扬州 225127
  • 4.扬州大学建筑科学与工程学院,扬州 225127
*叶 鹏(1991— ),男,安徽马鞍山人,博士,讲师,硕士生导师,主要从事地理大数据挖掘研究。 E-mail:

张雪英(1970— ),女,四川眉山人,博士,教授,博士生导师,主要从事地理大数据挖掘、智慧城市和人文社会GIS等方面研究。E-mail:

收稿日期: 2023-01-17

  修回日期: 2023-03-31

  网络出版日期: 2023-06-02

基金资助

国家自然科学基金项目(41971337)

国家重点研发计划(2021YFB3900903)

江苏高校哲学社会科学研究一般项目(2022SJYB2128)

Formal Representation and Reasoning Mechanism for Vague Spatial Location Description based on Supervaluation

  • ZHANG Xueying , 1, 2 ,
  • YE Peng , 3, 4, * ,
  • ZHANG Huifeng 1, 2
Expand
  • 1. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China
  • 2. Key Laboratory of Virtual Geographic Environment, Nanjing Normal University, Ministry of Education, Nanjing 210023, China
  • 3. Urban Planning and Development Institute, Yangzhou University, Yangzhou 225127, China
  • 4. College of Architectural Science and Engineering, Yangzhou University, Yangzhou 225127, China
*YE Peng, E-mail:

Received date: 2023-01-17

  Revised date: 2023-03-31

  Online published: 2023-06-02

Supported by

National Natural Science Foundation of China(41971337)

National Key Research and Development Program of China(2021YFB3900903)

Key Project of Philosophy and Social Science Research in Colleges and Universities in Jiangsu Province(2022SJYB2128)

摘要

基于位置描述进行空间定位是大数据时代位置服务向智能化转型的关键。针对不同语境中位置描述模糊性差异显著而难以定位的问题,本文提出一种面向模糊位置描述的形式化方法与推理机制。首先,通过梳理人类空间认知规律,明确自然语言中位置描述时关注的要素类型,研究模糊位置描述的形式化表示。然后,基于超赋值理论,从空间对象、距离关系和方向关系3个方面构建模糊位置描述的推理机制。顾及位置描述的上下文语义,利用观察值阈值开展空间推理实现定位。最后,设计收集位置描述的问答系统对方法进行验证。结果表明,本文方法能够依据实际应用场景及时调整位置描述的形式化表示粒度,空间推理结果贴合直观认知。

本文引用格式

张雪英 , 叶鹏 , 张慧峰 . 基于超赋值理论的模糊位置描述形式化与推理机制[J]. 地球信息科学学报, 2023 , 25(6) : 1135 -1147 . DOI: 10.12082/dqxxkx.2023.230025

Abstract

Location description is the natural language expression of human spatial cognition. Since natural language is the primary and basic means of information transmission in human society, location description is an important medium for transmitting spatial location information in human communication. Spatial positioning based on spatial location description is the key to intelligent transformation of location-based services in the era of big data. To solve the problem that the vagueness of location description in different contexts is significantly different and results in difficulty in positioning, this paper proposes a representation method and reasoning mechanism for vague location description. Firstly, by combing the law of human spatial cognition, the types of elements concerned in the description of natural language are clarified. Based on the analysis of the sources of vagueness, a formal representation of vague location description is constructed. Different from the traditional spatial information modeling which focuses on spatial relationship, the formal representation proposed in this paper establishes the vagueness relation and influence among different information factors by the strategy of multi-factors representation. The formal representation also enhances the semantic analysis ability for the vagueness of location description. Secondly, based on supervaluation theory, the reasoning mechanism of vague location description is proposed from three aspects: spatial object, distance relation, and direction relation. Considering the context semantics of spatial location description, the threshold of observation value is used to carry out spatial reasoning. By being super-valued to different contexts, the reasoning results in different situations are obtained. The aim of the reasoning mechanism is to establish the mapping relationship between vague location description and real spatial location. Thirdly, a Question-Answering (Q&A) system is designed to collect contexts of location description, and a case study on the method is conducted. In the case study, a group of users' viewpoints from Q&A on spatial cognition are transformed into the spatial scope in the real world. These spatial scopes can establish the relationship between qualitative spatial concepts and quantitative spatial data, so as to realize the representation of vague location description in GIS. The results show that the proposed method in this paper can adjust the granularity of formal representation of location description in time according to actual application scenarios, and the spatial reasoning results fit intuitive cognition. In the future, knowledge graphs will be introduced to further improve the semantic reasoning ability and positioning accuracy for vague location description.

1 引言

位置是空间众多特征维度中一项基础且重要的特征,认知空间位置能够回答地理学六大问题中“在哪里”的问题,并为地理学其它问题的答案提供空间参照[1]。位置描述是人类空间认知的自然语言表达,用于阐述不同空间实体间的分布差异,使得人类和现实环境产生相互作用[2]。在当前大数据环境的时代背景下,通过语音或者文本进行自然语言交互式的位置服务(Location Based Services,LBS)已经成为趋势,以促进下一代地理信息平台向智能、泛在发展的整体转型[3]。然而,传统的GIS系统并不能处理这些位置描述信息,亟需通过空间推理建立自然语言中位置描述与物理世界中空间位置的映射关系,以实现基于位置描述的空间定位[4]
基于位置描述的空间推理可以看作是空间位置信息从各种地理描述到机器求解的过程[5],必须经过数学描述的转换过程,而面向位置描述的形式化表达成为了实现这一转换过程的基本途径。每种语言都有一套能够完整表达各种空间位置的词汇集合和句法结构,自然语言描述位置信息在给人或物定位时常使用的格式通常由参考框架、空间参考点、空间方位词组成[6]。为了将位置描述形式化,路径导航、空间定位、空间查询等领域都开展大量研究。Frank[7]提出了距离和方向关系的形式化定性推理方法;Zimmermann[8]研究了距离和方位结合在一起的空间关系描述方法;Liu[9]提出了定性距离和定性方向角的概念表达空间关系。在中文位置描述方面,张雪英等讨论了汉语中描述各种空间关系的空间词汇及其句法模式[10];郑玥等提出同时采用多种参照物并兼顾多种空间关系的组合描述机制[11];杜清运等[12]从语用、语义和句法3个独特视角剖析其结构特征,提出完整的空间信息自然语言表达模型;陈晓丹[13]基于形式语言的空间位置信息形式化表达构建了空间位置信息从要素到模式、从定量到定性、从静态到动态的多层次形式化表达机制。现有位置描述形式化更加关注空间关系的表达,在方向、拓扑和距离关系等方面开展了非常细致的建模。但是,常常忽视空间目标的认知、类型、形状等差异,没有考虑空间对象的形式化方法。并且,大多数研究结果适用于正确表达出地理空间的事实知识,并不针对空间定位等实际应用领域,缺乏顾及模糊性的表达机制。
位置描述以定性或半定量的方式存在,虽然提供了丰富的定位线索,但普遍具有模糊性。这种模糊性加剧了基于位置描述进行空间定位的难度,需要在空间推理的过程中尽量缩小并消除其模糊性。对于位置描述的模糊性研究则主要采用二值逻辑建模和模糊逻辑(Fuzzy Logic)的方法。典型的二值逻辑建模包括锥型模型[14]、方向矩阵模型[15]、基于Voronoi图的模型[16]、细节方向关系表达模型[17]等,依据模型结构将空间区域硬性地划分为几个区域。在客观世界中,空间在相邻方向的过渡是连续的、平滑的。若采用“非此即彼”的建模方式,则不同结果集合之间的过渡是跳跃的、不平滑的,用精确的方法描述和处理不确定性往往造成信息损失。模糊逻辑通过隶属度函数解释空间上每一点隶属于模糊位置的程度,通常隶属度函数(Membership Function)都是二维的。在确定一个空间位置的隶属度函数时,还需要借助认知实验、地理信息检索、遥感影像分类等方法[18-20]。由于模糊逻辑是线序的,每个隶属度赋值之间都可以比较大小,但是不适用于解释多维模糊性问题[21]
超赋值理论是哲学领域用来解释“模糊性”问题的一种非二值逻辑,其核心思想在于对难以判断真实性的含糊表达,引入真、假以外不定值进行模糊性解释[22]。例如:公园距离广场近,在某些情况下为真,在另外一些情况下为假,则“距离近”是一个可真可假的边界例子。超赋值理论能够比较精细且符合直观的刻画不定和确定的真、假之间的关系,同时在一定程度上保持经典逻辑[23]。相较于模糊性问题的其它解法,超赋值理论更容易让人理解和接受。本文依据空间认知过程和自然语言特点构建模糊位置描述的形式化表示方法,基于超赋值理论研究空间推理机制,有效地处理自然语言中空间位置信息的模糊性现象,通过面向模糊位置描述的空间推理实现空间定位的效果。

2 基于超赋值理论的模糊位置描述模型

2.1 超赋值理论

逻辑经验主义者梅尔博格(Henryk Mehlberg)在1958年的著作《科学的途径》[24]中基于日常语言模糊性引起的不确定陈述提出超赋值的基本想法。超赋值理论多数应用于哲学领域,在21世纪初左右被引入地理学领域,结合几何学知识研究空间和地理实体模糊性问题。超赋值理论利用以下几点核心观点对模糊性进行解释。
(1)外延和反外延。“森林”、“远”、“近”等都属于谓词范畴,是自然语言中用于展示客体性质、特征或者客体间关系的词项。在一定的论域内,那些可以确定地应用到谓词的对象的集合是该谓词的外延。相反的,那些确定地不能应用到此谓词的对象的集合属于反外延[25]。例如:在“超市附近的餐厅”这一论域中,距离500 m的餐厅位于谓词“近”的外延中,距离2000 m的餐厅位于谓词“近”的反外延中。
(2)半影区。论域内外延与反外延外以外的部分就是谓词的边界情形,即半影区(Penumbra),也称为真值间隙(Truth-Value Gaps)。半影区的存在导致含混谓词既不确定真,也不确定假[26]。接续先前的例子,距离1 000 m的餐厅是边界情形,距离 1 000 m处于谓词“近”的半影区。
(3)精确化。超赋值理论认为模糊性产生于模糊谓词在语义上的不完整或不确定性,这使得包含模糊谓词的语句可以用不同的方式来解释。对每种方式都使用更精确的语句解释,这就被称为精确化(Precisification)[27]。精确化的目的在于尽量缩小并消除含混谓词的半影区,逐渐扩大谓词的外延与反外延范围,使之成为可容许的精确化(Admissible Precisifications),即合理的、符合人们认知的精确化方式。
(4)取舍点。取舍点(Cut-off Point)是建立在精确化基础上的一个概念,用来解释不同情境下的精确化[28]。接续先前的例子,可把800 m作为一个取舍点,约定800 m以下(包含)的餐厅在“近”的外延之中,而除此之外的餐厅都在“近”反外延之中。这是“近”的一种精确化,其结果是没有含糊性的谓词。通过选择不同的取舍点,可以得到模糊谓词不同的精确化。需要注意的是,取舍点应来源于边界情形。

2.2 模糊位置描述模型

空间认知是人们对出现于周围环境中的各种事物和现象的存在、变化方式以及它们的相关位置的认识能力。从空间认知到位置描述,人们基于个体认知能力和特定需求,对客观存在空间中的事物及其关系进行感知,并利用语言系统抽象认知结果进行阐述。也是在这一过程中,多种来源的模糊性不断叠加,最终通过位置描述呈现出来,包括:① 空间对象自身的模糊性。部分空间对象具有描述不确切、空间位置不明确的空间范围,包括从有向无的过渡带和相邻地域之间的过渡带;② 空间认知过程的模糊性。人们对空间认知通常不能从一个观察点全面感知,限制其可感知的范围具有尺度依赖性;③ 自然语言增强的模糊性。自然语言中的模糊谓词可以扩大抽象认知结果的模糊性。加之使用语境的差异,由于不同的表达目的,自然语言描述的模糊性也会随之变化[29]
模糊位置描述是现实空间、空间认知和语言系统相叠加的最终呈现形式,通常有3种描述形式:① 地名;② 地址;③ 空间断言及组合,如“新街口附近”或“扬州大学以东”[30-31]。完整的空间断言中包括参考框架、空间对象和空间关系3类信息要素[32]。其中,参考框架在位置描述中是隐式的存在,但是不同的参考框架会影响参照物的选择和相关词汇(如方位词)的使用。空间对象存在于参考框架中,分为参照物与目标物。空间关系中距离关系对空间位置的约束最为强烈,方位关系次之,拓扑关系最弱。本文针对空间断言形式的位置描述进行分析,并试图理解空间断言中空间对象、距离关系与方向关系的模糊性。
单一的空间断言中只存在一组参照物、目标物及其空间关系。单一空间断言Vo中包含了参照物描述Vr、距离关系描述Vdis和方向关系描述VdirVoVrVdisVdir相互组合达到的效果。利用形式化的方式可以定义为:
o | L ( o ) V ( o , c ) , V o , c n c r a n g e ( o )
n c = n c r n c d i s n ( c d i r )
式中:o表示目标物;L表示现实世界物理空间中的位置;V表示位置描述;c表示包括含糊谓词的上下文;range函数表示o所在位置的空间范围;n(c)表示上下文c表达出的位置;n(cr)表示参照物的上下文cr表达出的位置;n(cdis)表示距离关系的上下文cdis表达出的位置;n(cdir)表示方向关系的上下文cdir表达出的位置。
多项单一空间断言可以组合成为复合空间断言。通过表达目标物之于多个参照物的相对位置,更加细致地描述出目标物位置的分布范围。在进行复合空间断言的空间推理时,首先将复合空间断言拆分为多项单一空间断言。其次,分别对单一空间断言进行空间推理。最后,将各项推理结果进行叠加,其交集为复合空间断言的最终推理结果。值得注意的是,在实际应用中面对逻辑复杂的位置描述较难通过逻辑推理机制进行推理,其原因在于复杂的空间推理会导致事理、规则的“组合爆炸”出现,使得推理效率低、复杂度高。因此,本文在对复合空间断言进行讨论时,仅限于多项空间断言描述同一目标物的情况,避免出现推理过程中推理目标的迁移与转换。

3 顾及精确化的模糊位置描述形式化

超赋值理论通过精确化的方式消除语义中的模糊性。在每个可容许的精确化情况下,模糊谓词实际上被精确化为精确谓词。在进行位置描述的形式化表示时,为消除其模糊性需要引入精确化的概念。

3.1 模糊空间对象形式化

位置描述中表达空间对象的模糊谓词通常是对象名称或代称,体现出空间对象的类型。相对于目标物,参照物在位置描述的使用者之间应该是相对熟悉、具有代表性的空间对象。因此,位置描述的使用者能够大致掌握参照物的空间位置的存在范围,但是受制于空间认知的能力仍然存在一定模糊性。在空间断言的描述模型中,模糊Vr的精确化依赖于上下文cr,利用形式化的方式可以定义为:
r | L ( r ) V ( r , c r ) , V r , c r n c r r a n g e ( r )
式中:r表示参照物;L表示现实世界物理空间中的位置;V表示位置描述;cr表示包括含糊谓词的上下文。range函数表示r所在位置的范围;n(cr)表示上下文cr表达出的位置。以参照物“A湖泊(lake)”为例,精确化V(r, cr)的形式化定义如下:
x y c r l a k e x , y , c r s l d ( g e o x , y ) i n ( c r ) )
式中:x表示位置描述中认知的位置;y表示真实世界物理空间的位置;geo(x, y)函数将x映射到yΔsld表示不同位置间的距离;in函数将上下文映射为数值。参照物规则为lake(x, y, cr)提供了充要条件。必要条件表明,如果认知位置x在一个给定上下文cr中与真实位置y匹配(xy的范围内),那么在这个上下文cr中,xy之间的距离必须属于某个阈值in(取舍点)。充分条件表明,如果在一个给定上下文cr中,xy之间的距离属于某个阈值in(取舍点),那么xy在给定的上下文cr中相匹配。然而,in(cr)的阈值并没有被明确的设定,因为还受到观察值的约束。

3.2 模糊距离关系形式化

位置描述中表达距离关系的模糊谓词有很多,“很远”、“较近”等都具有模糊性。在空间断言的描述模型下,模糊Vdis的精确化依赖于上下文cdis,利用形式化的方式可以定义为:
d i s | R ( d i s ) V ( d i s , c d i s ) , V d i s , c d i s n c d i s < v a l ( d i s )
式中:dis表示距离关系;R表示现实世界物理空间中的空间关系;V表示位置描述;cdis表示包括含糊谓词的上下文。val函数表示参照物和目标物之间的距离;n(cdis)表示上下文cdis表达出的距离。为便于阐述选择“近”作为示例,精确化V(dis, cdis)的形式化定义如下:
( r ) ( o ) ( c d i s ) ( n e a r ( r , o , c d i s ) ) s l d g e o r , g e o o < l o w ( c d i s ) )
式中:geo(x)函数将空间对象映射到空间位置;Δsld表示不同位置间的距离;low函数将上下文映射为数值。距离规则为near(r, o, cdis)提供了充要条件。必要条件表明,如果2个对象在一个给定上下文中离对方“近”,那么在这个上下文中,与对象相关的几何体之间的距离必须低于某个阈值low(取舍点)。充分条件表明,如果在一个给定上下文中,2个对象的几何体之间的距离低于某个阈值low(取舍点),那么这2个对象在给定的上下文中,这2个对象离对方“近”[33]low(cdis)同样受到观察值的约束。

3.3 模糊方向关系形式化

位置描述中表达方向关系的模糊谓词也有很多,“东边”、“左侧”等都具有模糊性。本文位置描述的方向关系是指目标物相对于参照物的方向。在空间断言的描述模型下,模糊Vdir的精确化依赖于上下文cdir,利用形式化的方式可以定义为:
d i r | R ( d i r ) V ( d i r , c d i r ) , V d i r , c d i r n c d i r e x p ( d i r )
式中:dir表示方向关系;R表示现实世界物理空间中的空间关系;V表示位置描述;cdir表示包括含糊谓词的上下文。exp函数表示参照物和目标物之间的方位;n(cdir)表示上下文cdir表达出的方位。为便于阐述选择“西”作为示例,精确化V(dir, cdir)的形式化定义如下:
( r ) ( o ) ( c d i r ) ( w e s t ( r , o , c d i r ) ) d e g ( a n g r , o ) i n ( c d i r ) )
式中:ang(r, o)函数将空间对象映射到直角坐标系中;Δsld表示目标物相对参照物的方位角度;in函数将上下文映射为数值。方向规则为west(r, o, cr)提供了充要条件。必要条件表明,如果目标物在一个给定上下文中位于参照物“西”,那么在这个上下文中,目标物对于参照物的方位角必须属于某个阈值in(取舍点)。充分条件表明,如果在一个给定上下文中,目标物对于参照物的方位角属于某个阈值in(取舍点),那么这两个对象在给定的上下文中,目标物在参照物“西”。in(cdir)同样受到观察值的约束。

4 基于上下文的模糊位置描述推理

4.1 基本思路

基于模糊位置描述进行空间推理的目的在于实现空间定位,需要消除模糊位置描述中的模糊性,即依据超赋值理论选择各模糊谓词的取舍点。在模糊位置描述形式化表示中,取舍点的阈值设定需要依据观察值的结果,而观察视角来源于上下文。
首先,依据模糊位置描述中各要素的形式化结果,从空间对象、距离关系和方向关系3个方面设定影响其模糊性的因素维度。其次,基于位置描述的上下文,提取影响模糊性因素的相关内容。最后,遵循超赋值理论基本原理,结合各模糊性因素的内容,设定形式化结果中涉及的阈值范围,并推理出模糊位置描述的真实空间分布。模糊位置描述推理的基本思路如图1所示。在推理过程中,阈值的具体数值可以结合实际应用场景和个人认知习惯进行确定。不同场景下阈值设定可以参考专家经验和认知实验。一方面,相关学者开展空间位置研究获得的认知能力参考范围;另一方面,借鉴已有认知实验结果获得位置范围的判断[34]
图1 模糊位置描述推理的基本思路

Fig. 1 The basic idea of reasoning mechanism for vague spatial location description

4.2 模糊空间对象的推理机制

基于模糊空间对象形式化表示,假设上下文c1=“江苏省扬州市”,c2=“地理学家考察过的地质公园”,c3=“学生实习计划里的地质公园”,以此为例说明空间对象的推理机制。对于不同的空间对象,将观察值做如下排列:
c i t y x 1 , y 1 , c 1 p a r k x 2 , y 2 , c 2 p a r k x 3 , y 3 , c 3
基于以上观察值的集合,阈值设定可能会是 in(c1)=(a, b),in(c2)={(a1, b1), (a2, b2), (a3, b3), (a1, b1)},in(c3)={(a1, b1),…, (an, bn),…, (a1, b1)}。这些阈值的设定受到对象类型、认知尺度、认知能力和熟悉程度等多方面的影响。例如:扬州市是一座城市,辖区范围非常广阔。但是在认知扬州市至上海市距离这样的场景时,由于尺度很大所以仍然将空间对象扬州市的阈值设定为点坐标;地质公园的位置描述非常精细,属于市域内相对小尺度的认知场景,所以将空间对象地质公园的阈值设定为面坐标。此外,认知能力强的个体对于熟悉空间对象的位置认知更加精准。地理学家作为领域内专业人员具有较强的空间认知能力,地质公园的阈值设定可以相对精确。相对而言,普通学生的空间认知能力较为薄弱,此时地质公园的阈值设定相对更加模糊,面坐标表示的范围会适当扩大。

4.3 模糊距离关系的推理机制

基于模糊距离关系形式化表示,假设上下文c1=“10分钟散步”,c2=“5分钟雨中的全速跑”,c3=“短时间的自行车骑行”,以此为例说明距离关系的推理机制。对于参照物r和目标物o,将观察值做如下排列:
n e a r r 1 , o 1 , c 1 n e a r r 2 , o 2 , c 2 n e a r r 3 , o 3 , c 3
基于这样的观察值的集合,保守的阈值设定可能会是low(c1)=240 m,low(c2)=750 m,low(c3)=780 m。这些阈值的设定在文献[35]中有一种简单的算法可以通过训练得到。距离关系阈值的设定受到移动方式、地形环境、通达程度、天气状态和修饰词语等多方面的影响。例如:在良好的天气下,通过乘车等高效的出行方式前往地形平坦、道路通达的地方,对于“近”的位置范围相对更加宽泛。相反的,在恶劣的天气中,通过步行等低效的出行方式前往地形崎岖、道路不通的地方,对于“近”的位置范围认知更加狭隘。此外,上下文中出现的“大约”、“可能”等模糊性修饰词语,也会进一步扩大阈值设定的范围。

4.4 模糊方向关系的推理机制

基于模糊方向关系形式化表示,假设上下文c1=“东边”,c2=“东北方”,c3=“10点钟方向”中,以此为例说明方向关系的推理机制。对于参照物r和目标物o,将观察值做如下排列:
e a s t r 1 , o 1 , c 1 n o r t h e a s t r 2 , o 2 , c 2 t e n c l o c k r 3 , o 3 , c 3
基于这样的观察值的集合,阈值设定可能会是in(c1)=[-45°, 45°),in(c2)=[22.5°, 67.5°),in(c3)=[300°, 330°)。通过对上下文语境进行推断,选择合适的模糊模型进行阈值设定[36]。方向关系阈值的设定受到认知维度、距离远近和修饰词语等多方面的影响。例如:“东”、“东北”、“10点钟方向”等体现出对于划分空间的数量。当目标物与参照物距离较近时,对于方位角的判断也更加精准。上下文中出现的“大约”、“可能”等模糊性修饰词语,也会进一步扩大阈值设定的范围。

5 案例研究

在实际应用场景中,面向模糊位置描述的形式化表示与推理主要用于消除人与机器之间交互障碍,服务于各类自然语言交互式的位置服务。并且,本文方法的推理机制依赖于丰富的上下文。因此,设计了一款人机交互的问答系统,用于收集自然语言描述空间位置的上下文数据。问答系统包括2个基本模块:后台管理与交互系统。在后台管理模块,管理员构建和管理提问内容与特征维度;在交互系统模块,系统依据后台管理模块中的设置,有针对性地提问特定空间位置的相关特征,用户在问答框中输入个人对于该问题的理解与认知。通过问答系统的运行,获得位置描述的上下文数据。进一步利用本文提出的模糊位置描述定位方法,借助可视化的方式进行定位结果的展示。本文选取南京市栖霞山风景区作为实验区域,利用问答系统收集关于扬州大学中特定位置的描述文本,基于文本方法进行空间定位并进行案例分析。栖霞山风景区部分区域的平面图如图2所示。
图2 实验区域及主要地物位置

Fig. 2 Experimental area and location of main features

5.1 基于单一空间断言的结果分析

通过问答系统收集到空间断言的位置描述文本,该游客想知道哪些湖泊位置距离自己所在位置近(图3)。问答系统从移动方式、天气状况、通达程度等多方面进行距离关系特征的提问,上下文中包含该用户对于模糊谓词“近”不同维度的认知。分别对空间断言的上下文进行超赋值,以推理出符合位置特征的湖泊。
图3 关于“哪些湖泊的位置距离近?”的空间断言示例

Fig. 3 An example of the spatial assertions about “Which lakes are near?”

在这段空间断言的上下文中,参照物为游客,目标物为“湖泊”,空间关系涉及距离关系,而方向关系是被忽略的。因此,当前空间断言中模糊谓词“近”的形式化表达如下:
( p ) ( l i ) ( c d i s ) ( n e a r ( p , l i , c d i s ) ) s l d g e o p , g e o l i < l o w ( c d i s ) )
式中:li表示目标物湖泊ip表示参照物游客;near表示距离关系中的“近”规则。其余参数与符号的含义与模糊位置描述形式化中的定义相同。
空间推理的依据在于对我和湖泊间的距离关系进行精确化。在移动方式方面,可以选择步行和游览车2种。当步行时,用户对于“近”的认知是不能超过10 min;当游览车出行时,用户对于“近”的认知是不能超过5 min。然而,出行方式的选择还受到天气状况的影响。由于当天天气晴朗,步行和游览车速度保持在正常水平。在通达程度方面,我与湖泊间都有道路连通。然而,连通湖泊A的道路是景区干道,允许步行和游览车通行。连接湖泊B、C的道路是人行道,仅能步行通过。对上下文内容进行超赋值,并且依据观察值阈值设置距离关系取舍点,如表1所示。
表1 基于空间断言的空间推理

Tab. 1 Semantic analysis based on supervaluation of single spatial assertion

推理因素 是否断言 上下文语义 观察值 阈值范围
移动方式 步行,≤10 min 乘游览车,≤5 min 500 m、2 250 m ① 500 m×1.0×1.0=500 m,阈值范围是[0, 500 m]
② 500 m×0.9×1.0=450 m,阈值范围是[0, 450 m]
③ 2 250 m×1.0×1.0=2 250 m,阈值范围是[0, 2 250 m]
地形环境 - -
通达程度 主干道 人行道 ×1.0 ×0.9(仅步行)
天气状态 晴朗 ×1.0
修饰词语 - -
将游客与湖泊的实际位置分布与观察值阈值进行对比。湖泊A、B和C都有道路与游客连通,其中湖泊A、B和C分别距离游客350、950和1 150 m。 湖泊A的距离符合阈值③,湖泊B的距离符合阈值①,湖泊C的距离则与阈值①-阈值③都不符合(图4)。因此,A和B是距离游客近的湖泊。
图4 空间断言的空间推理结果

Fig. 4 Spatial reasoning results of single spatial assertion

5.2 基于复合空间断言的结果分析

通过问答系统收集到复合空间断言的位置描述文本,该用户想知道“卧云亭”在什么位置(图5)。问答系统从不同参照物及其空间关系等多方面进行提问,上下文中包含该用户对地理实体“卧云亭”与其他参照物不同维度的认知,涉及“南边”、“对面”、“很近”多项模糊谓词。分别对多个空间断言的上下文进行超赋值,以确定“卧云亭”的空间位置分布。
图5 关于“卧云亭在什么位置?”的空间断言示例

Fig. 5 An example of the spatial assertions about “Where is the Woyun Pavilion?”

在这段复合空间断言的上下文中,参照物为乾隆御碑和桃花湖,天开岩无法作为参照物,目标物都是卧云亭,空间关系涉及距离关系和方向关系。因此,当前空间断言中与“卧云亭”相关模糊谓词“南边”、“对面”、“很近”的形式化表达如下:
( r q ) ( o w ) ( c d i r ) ( s o u t h ( r q , o w , c d i r ) ) s l d g e o r q , g e o o w < i n ( c d i r ) )
( r t ) ( o w ) ( c d i r ) ( c r o s s ( r t , o w , c d i r ) ) s l d g e o r t , g e o o w < i n ( c d i r ) )
( r t ) ( o w ) ( c d i s ) ( n e a r ( r t , o w , c d i s ) ) s l d g e o r t , g e o o w < l o w ( c d i s ) )
式中:ow表示目标物卧云亭;rq表示参照物乾隆御碑;rt表示参照物桃花湖。cross表示方向关系中的“对面”规则;south表示方向关系中的“南”规则;near表示距离关系中的“近”规则。其余参数与符号的含义与模糊位置描述知识模型中的定义相同。
空间推理的依据在于对卧云亭和不同参照物间的空间关系进行精确化。① 卧云亭在乾隆御碑的南边,距离很近。空间断言中涉及“南边”和“近”2个模糊谓词。单独使用“南”表明用户划分空间方位的数量为4,由于目标物与参照物距离近,方位角判断是精准的;“近”的精确化可以参照5.1节,同样考虑移动方式、天气状况、通达程度等多方面因素。② 卧云亭在桃花湖的对面。用户对于“对面”的认知是隔着一条道路,在可视范围内。在设定观察值阈值时,操场A临近的道路,体育馆的位置在道路的另一侧,并且临近道路50 m以内。对上下文内容进行超赋值,并且依据观察值阈值设置距离关系取舍点,如表2所示。
表2 基于复合空间断言的空间推理

Tab. 2 Semantic analysis based on supervaluation of compound spatial assertions.

参照物及空间关系 推理因素 是否断言? 上下文语义 观察值 阈值范围
乾隆御碑
方向关系
认知维度 南,4维 [225°, 315°) [225°, 315°)
距离远近 - -
修饰词语 - -
桃花湖
方向关系
认知维度 2维 空间一分为二 1
距离远近 - -
修饰词语 对面 1(说明:0为同侧,1为另一侧)
乾隆御碑
距离关系
移动方式 步行,≤10 min 500 m [0 m, 500 m]
地形环境 - -
通达程度 有道路连通 ×1.0
天气状态 晴天 ×1.0
修饰词语 - -
依据参照物的实际位置分布及其观察值阈值分别划定候选位置区域(图6)。乾隆御碑的[225°,315°)角度为“南”,设置为候选定位a;桃花湖相邻的道路有3条,分别将3条道路另一侧的区域设置为候选定位b;与乾隆御碑有道路相连,且走路不超过10 min的距离为“近”,道路两侧区域设置为候选定位c。将多条空间断言中推理出的候选位置a—c叠加,获得重合区域,即卧云亭在当前空间断言中描述的位置(图3(d))。由于空间断言在选择参照物时,从北侧和西侧2面阐述了空间关系,而东侧和南侧的空间关系缺失,因此与真实的卧云亭位置相比,东侧和南侧的空间推理结果缺乏精确化。总体而言,通过多个空间断言上下文的超赋值较为准确地获得目标物的空间定位。
图6 多个空间断言的空间推理结果

Fig.6 Spatial reasoning results of multiply spatial assertions

6 讨论

自然语言是人类日常传递空间位置信息的最基本手段,而定性的表达方式使得模糊性普遍存在。在当前大数据时代,智能化LBS的设计理念应体现以人为本的信息服务宗旨,建立和谐的交互方式。对位置信息的处理应该尽量符合人类的感知和认知过程。本文从空间位置的基本概念入手,厘清空间认知到位置描述的层级关系和模糊性来源。空间位置表达模型的构建,成为有效开展模糊位置描述定位研究的重要前提。在此基础上,将超赋值理论引入到空间认知领域,基于超赋值理解位置描述的模糊语义,将模糊位置描述转化为精确化的空间定位。超赋值理论的优势在于:① 保留了重言式。对于经典逻辑的重言式仍能够保持有效性,即确定为真或假的二值原则不变;② 特定场景中的精确化结构唯一。例如:公园和操场都位于“远”的边界例子,操场比公园远100 m。在三值逻辑的解释下,“公园远”和“操场远”的取值都为处于真假之间的不定值I,合取式取值依然为I。但在超赋值理论解释下,由于无法给出操场近且公园远的精确化,则合取式为假,符合直观认知;③ 对于多维含糊的问题,由于可精确化结构是偏序结构,能够表示出不同维度的模糊性之间的不可比较性。以“近”为例,可以是直线距离短,可以是行程距离短,也可以是路程时间少。模糊谓词“近”也是多维特征的“近”,不同维度的“近”之间是不可以比较的。
现阶段,基于二值逻辑建模的方法仍然是开展空间推理的主要方法之一。相关研究成果试图面向大众、多尺度、大规模的调查,以获得普适性空间认知规律,为建立模糊描述与真实空间的主流映射关系提供现实依据。事实上,相同的位置描述由于场景和个体的不同,指代的真实空间有很大差异。以不同场景下的空间尺度为例,当需要了解“扬州市荷花池公园”的空间位置时,仅仅认知到在“扬州市区内部”这样的尺度并不够精确,人们更希望知道公园位于“广陵区扬州大学东门对面”。空间尺度的变化会导致参照物、空间关系的相应变化,而空间尺度会由不同场景下实际的认知需求改变。超赋值理论认为模糊谓词在特定语境(context)中是有限表达的,非常适用于位置描述模糊性随特定场景改变的情况。超赋值理论通过对不同上下文分别进行超赋值,获得不同情境下的精确化结果,空间定位体现对于位置描述主观性和人为性的自适应。其中,可精确化结构的引入在其中起到了重要的作用,其中取舍点的确定最为关键。位置描述是人类将自身空间认知进行表达的结果。然而,空间定位则是逆向过程,需要通过位置描述理解本真的空间认知。因此,针对模糊描述的取舍点实际上需要挖掘空间认知中的相关理解。如何获得不同场景下取舍点的阈值范围,也成为定性位置描述向定量化空间定位转换需要继续突破的关键点。
案例分析结果表明,现有模型和方法可以处理表述较为简单的位置描述。但是,面向实际应用还需要将方法推广到更复杂的场景中。位置描述的复杂化增加其模糊性,基于超赋值理论的精确化过程中顾及的条件因素更加多样化,各条件取舍点的确认及多条件复合计算的规则更加复杂。例如:在青藏高原上找寻距离近的河谷,不仅需要同时从移动方式、地形环境、通达程度、天气状态等维度进行模糊性建模,并且各维度的取舍点还存在很大的不确定性。由于地形环境特殊,前往河谷的路线通达程度不确定,可选择的移动方式也不同于平原地带,天气状况更是变幻莫测,却没有相似的空间认识实验结果可以借鉴。因此,还需要针对性的先验和领域知识为精确化提供指导。现阶段,知识图谱引领大数据知识工程进入全新阶段,在计算性、推理性等方面都具备优势,成为知识管理和服务的重要工具。知识图谱将赋能位置描述语义解析与精确化定位向智能化转型,在人机协同、复杂推理等场景化应用方面也正面临挑战。

7 结论

从位置描述中理解位置语义实现定位是下一代GIS位置服务的发展方向。本文借鉴超赋值理论的基本理论,建立了一种模糊位置描述的形式化表示方法与推理机制。一方面,分析了自然语言进行位置描述时的上下文特点,通过构建描述模型实现模糊位置描述的形式化表示。另一方面,基于超赋值理论提出模糊位置描述推理,顾及位置描述上下文直接获得形式化表示中观察值阈值范围,实现空间定位的精确化推理。案例分析结果表明超赋值理论能够依据实际应用及时调整,空间推理结果比较精细且贴合直观。通过具有问答机制的查询系统体现出本文方法作为自然语言接口的应用场景。后续研究中将引入知识图谱进一步提升位置描述语义推理能力和定位精度。
[1]
Renz J. Qualitative Spatial Reasoning with Topological Information[M]. Heidelberg: Springer Berlin, 2002. DOI: 10.1007/3-540-70736-0

DOI

[2]
Vasardani M, Winter S, Richter, K F. Locating place names from place descriptions[J]. International Journal of Geographical Information Science, 2013, 27(12):2509-2532. DOI:10.1080/13658816.2013.785550

DOI

[3]
Liu Y, Guo Q H, Wieczorek J, et al. Positioning localities based on spatial assertions[J]. International Journal of Geographical Information Science, 2009, 23(11):1471-1501. DOI:10.1080/13658810802247114

DOI

[4]
Krishnapuram R, Keller J M, Ma Y. Quantitative analysis of properties and spatial relations of fuzzy image regions[J]. IEEE Transactions on Fuzzy Systems, 1993, 1(3):222-233. DOI:10.1109/91.236554

DOI

[5]
曹菡. 空间关系推理的知识表示与推理机制研究[D]. 武汉: 武汉大学, 2002.

[ Cao H. Research on knowledge representation and reasoning mechanism for spatial relation reasoning[D]. Wuhan: Wuhan University, 2002. ]

[6]
余建伟, 李清泉. 位置感知计算中定位信息的自然语言描述[J]. 地理与地理信息科学, 2009, 25(1):10-13,21.

[ Yu J W, Li Q Q. Natural language description of location information in location-aware computing[J]. Geography and Geo-Information Science, 2009, 25(1):10-13,21. ]

[7]
Frank A. Qualitative spatial reasoning about distances and directions in geographic space[J]. Journal of Visual Languages & Computing, 1992, 3(4):343-371. DOI:10.1016/1045-926X(92)90007-9

DOI

[8]
Zimmermann K, Freksa C. Qualitative spatial reasoning using orientation, distance, and path knowledge[J]. Applied Intelligence, 1996, 6(1):49-58. DOI:DOI:10.1007/BF00117601

DOI

[9]
Liu J. A method of spatial reasoning based on qualitative trigonometry[J]. Artificial Intelligence, 1998, 98(1/2):137-168. DOI:10.1016/S0004-3702(97)00069-6

DOI

[10]
张雪英, 闾国年. 自然语言空间关系及其在GIS中的应用研究[J]. 地球信息科学, 2007, 9(6):77-81.

[ Zhang X Y, Lv G N. Natural-language spatial relations and their applications in GIS[J]. Geo-information Science, 2007, 9(6):77-81. ]

[11]
郑玥, 龙毅, 明小娜, 等. 多种空间关系组合的地理位置自然语言描述方法[J]. 地球信息科学学报, 2011, 13(4):465-471.

DOI

[ Zheng Y, Long Y, Ming X N, et al. Natural language description of geographic location considering various spatial relations with different References[J]. Journal of Geo-Information Science, 2011, 13(4):465-471. ] DOI:10.3724/SP.J.1047.2011.00465

DOI

[12]
杜清运, 任福. 空间信息的自然语言表达模型[J]. 武汉大学学报·信息科学版, 2014, 39(6):682-688.

[ Du Q Y, Ren F. Representation model of spatial information in natural language[J]. Geomatics and Information Science of Wuhan University, 2014, 39(6):682-688. ] DOI:10.13203/j.whugis20140111

DOI

[13]
陈晓丹. 面向自然语言的空间位置信息形式化表达方法[D]. 南京: 南京师范大学, 2015.

[ Chen X D. Formalization of spatial location oriented natural language[D]. Nanjing: Nanjing Normal University, 2015. ]

[14]
Goyal R K, Egenhofer M J. Consistent queries over cardinal directions across different levels of detail[C]. In Proceedings of the 11th International Workshop on Database and Expert Systems Applications. IEEE, 2002:876-880. DOI:10.1109/DEXA.2000.875129

DOI

[15]
Du S H, Guo L, Wang Q. A scale-explicit model for checking directional consistency in multi-resolution spatial data[J]. International Journal of Geographical Information Science, 2010, 24(3):465-485. DOI:10.1080/13658810802629360

DOI

[16]
Tang X H, Qin K. Direction-relation similarity model based on fuzzy close-degree[C]. In Proceedings of the 2010 IEEE Interna-tional Conference on Progress in Informatics and Computing. IEEE, 2011:180-184. DOI:10.1109/PIC.2010.5687406

DOI

[17]
Gong Y X, Wu L, Lin Y Y, et al. Probability issues in locality descriptions based on Voronoi neighbor relationship[J]. Journal of Visual Languages & Computing, 2012, 23(4):213-222. DOI:10.1016/j.jvlc.2012.04.002

DOI

[18]
许珺. 关于线状地理特征空间关系的自然语言描述的形式化表达[J]. 遥感学报, 2007, 11(2):152-158.

[ Xu J. Formalizing the natural-language descriptions about the spatial relations between linear geographic objects[J]. Journal of Remote Sensing, 2007, 11(2):152-158. ]

[19]
Xu J, Pan X, Zhao J, et al. Virtual reality-based fuzzy spatial relation knowledge extraction method for observer-centered vague location descriptions[J]. ISPRS International Journal of Geo-information, 2021, 10(12):833. DOI:10.3390/ijgi10120833

DOI

[20]
Blaschke T, Merschdorf H, Cabrera-Barona P, et al. Place versus space: From points, lines and polygons in GIS to place-based representations reflecting language and culture[J]. ISPRS International Journal of Geo-information, 2018, 7(11):452. DOI:10.3390/ijgi7110452

DOI

[21]
Chen S Y, Zhang H Y, Yang H X. Urban functional zone recognition integrating multisource geographic data[J]. Remote Sensing, 2021, 13(23):4732. DOI:10.3390/rs13234732

DOI

[22]
熊明. 超赋值与悖论度[J]. 湖南科技大学学报(社会科学版), 2017, 20(1):25-30.

[ Xiong M. Supervaluation and degrees of paradoxicality[J]. Journal of Hunan University of Science & Technology(Social Science Edition), 2017, 20(1):25-30. ] DOI:10.13582/j.cnki.1672-7835.2017.01.005

DOI

[23]
陈明益. 含混性与超赋值论[J]. 哲学动态, 2014(8):104-109.

[ Chen M Y. Ambiguity and super-assignment theory[J]. Philosophical Trends, 2014(8):104-109. ]

[24]
Mehlberg H. The Reach of Science[M]. Toronto: University of Toronto Press, 1958.

[25]
Minock M, Mollevik J. Context-dependent 'near' and ‘far’ in spatial databases via supervaluation[J]. Data & Knowledge Engineering, 2013, 86:295-305. DOI:10.1016/j.datak.2013.02.004

DOI

[26]
Kulik L. A geometric theory of vague boundaries based on supervaluation[M]. Berlin, Heidelberg: Springer Berlin Heidelberg, 2001:44-59. DOI:10.1007/3-540-45424-1_4

DOI

[27]
Liu L, Chen L. A modal supervaluation description logic for characterization of vague concepts: Its semantics and a tableau algorithm for it[J]. Logic Journal of the IGPL, 2006, 14(6):873-888. DOI:10.1093/jigpal/jzl027

DOI

[28]
Rohrs B. Supervaluational propositional content[J]. Synthese, 2017, 194(6):2185-2201. DOI:10.1007/s11229-016-1051-y

DOI

[29]
Ye P, Zhang X Y, Zhang C J, et al. Positioning localities for vague spatial location description: A supervaluation semantics approach[J]. ISPRS International Journal of Geo-information, 2022, 11(1):68. DOI:10.3390/ijgi11010068

DOI

[30]
刘瑜, 袁一泓, 张毅. 基于认知的模糊地理要素建模——以中关村为例[J]. 遥感学报, 2008, 12(2):370-377.

[ Liu Y, Yuan Y H, Zhang Y. A cognitive approach to modeling vague geographical features: A case study of Zhongguancun[J]. Journal of Remote Sensing, 2008, 12(2):370-377. ] DOI:10.3321/j.issn:1007-4619.2008.02.025

DOI

[31]
王彦坤, 樊红, 王伟玺, 等. 地标空间方向的位置描述定位模型[J]. 测绘科学, 2020, 45(9):18-24.

[ Wang Y K, Fan H, Wang W X, et al. A positioning localities model about landmark locality description based on spatial direction relationship[J]. Science of Surveying and Mapping, 2020, 45(9):18-24. ] DOI:10.16251/j.cnki.1009-2307.2020.09.004

DOI

[32]
张毅, 邬阳, 高勇, 等. 基于空间陈述的定位及不确定性研究[J]. 地球信息科学学报, 2013, 15(1):38-45.

DOI

[ Zhang Y, Wu Y, Gao Y, et al. On the description-based spatial positioning and the associated uncertainty[J]. Journal of Geo-information Science, 2013, 15(1):38-45. ] DOI:10.3724/SP.J.1047.2013.00038

DOI

[33]
周森. 基于模糊语义的动画场景生成[D]. 长沙: 湖南大学, 2013.

[ Zhou S. Automatic scene generating based on fuzzy semantic[D]. Changsha: Hunan University, 2013. ]

[34]
王晓明, 刘瑜, 张晶. 地理空间认知综述[J]. 地理与地理信息科学, 2005, 21(6):1-10.

[ Wang X M, Liu Y, Zhang J. Geo-spatial cogmition: An overview[J]. Geography and Geo-Information Science, 2005, 21(6):1-10. ] DOI:10.3969/j.issn.1672-0504.2005.06.001

DOI

[35]
Minock M J. Vague relations in spatial databases[C]. In Proceedings of the International Conference on Application of Natural Language to Information Systems. Springer-Verlag, Berlin, Heidelberg, 2010:177-187. DOI:10.1007/978-3-642-13881-2_18

DOI

[36]
金鑫, 耿海燕, 高勇, 等. 空间方位关系在不同认知场境下的模糊性探讨[J]. 北京大学学报(自然科学版), 2009, 45(6):1025-1032.

[ Jin X, Geng H Y, Gao Y, et al. On vagueness of cardinal direction relationships in difference cognitive scenarios[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2009, 45(6):1025-1032. ] DOI:10.13209/j.0479-8023.2009.153

DOI

文章导航

/