地球信息科学学报  2018 , 20 (2): 139-146 https://doi.org/10.12082/dqxxkx.2018.170296

地球信息科学理论与方法

点线目标自然语言空间关系描述模拟表达方法研究

唐天琪1234, 曹青123, 张翎123, 龙毅123*

1. 南京师范大学地理科学学院,南京 210023
2. 南京师范大学 虚拟地理环境教育部重点实验室,南京 210023
3. 江苏省地理信息资源开发与利用协同创新中心,南京 210023
4. 江苏省测绘研究所,南京 210013

Simulated Expression Method of Spatial Relationship of Natural Language of Point, Line and Object

TANG Tianqi1234, CAO Qing123, ZHANG Ling123, LONG Yi123*

1. School of Geography Science, Nanjing Normal University, Nanjing 210023, China
2. Key Laboratory of Virtual Geographic Environment of Ministry of Education, Nanjing Normal University, Nanjing 210023, China
3. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application,Nanjing 210023, China
4. Jiangsu Provincial Research Institute of Survey and Mapping, Nanjing 210013, China

通讯作者:  *通讯作者:龙 毅(1968-),男,博士,教授,主要从事电子地图学、语音导航与位置服务、地图自动综合、智慧旅游等研究。 E-mail: longyi@njnu.edu.cn

收稿日期: 2017-06-29

修回日期:  2017-11-23

网络出版日期:  2018-03-02

版权声明:  2018 《地球信息科学学报》编辑部 《地球信息科学学报》编辑部 所有

基金资助:  国家自然科学基金项目(41571382、61472191)江苏省高校自然科学研究重大项目(15KJA420001)

作者简介:

作者简介:唐天琪(1992-),女,硕士,主要从事空间认知与地图可视化研究。E-mail: 1508102704@qq.com

展开

摘要

自然语言描述中蕴含丰富的地理空间信息,空间关系是自然语言描述中最重要的一部分,对理解整个描述语句起到决定性作用。但自然语言描述的不确定性、模糊性、灵活性等特征给计算机理解和处理自然语言增添了困难,因此建立定性的自然语言空间关系描述与定量的图形空间关系之间的映射关系是本文研究的重点。根据空间粒度的不同将自然语言空间关系描述分为完全模糊描述、区间模糊描述和定量模糊描述3类,提出缓冲区法和随机参数法2种可视化表达方法,并搭建原型系统进行实验。实验表明,该方法有效可行,有利于深化模糊语义的自然语言描述图形化研究。

关键词: 自然语言 ; 空间关系 ; 模拟表达

Abstract

Descriptions of natural language contain abundant geographical spatial information including geographical objects, spatial relations, attribute information and so on. Among them, the understanding of spatial relations tend to play a decisive role in understanding the whole description statement. However, the uncertainty, ambiguity,flexibility and other features of descriptions of natural language make it difficult for computer to understand and process natural language. Taking the natural language as a breakthrough point, we explore description of spatial relationship in natural language and visualization under fuzzy semantics, and realizes the goal of "text-to-figure" transformation. We focus on establishing the mapping relationship between the qualitative description language and quantitative graphic language. According to different levels of "vagueness", descriptions can be divided into three categories, namely completely fuzzy description, interval fuzzy description and quantitative fuzzy description, so as to study the natural language description based on different categories and levels. Furthermore, we put forward two methods of visualization expression: random parameter method and buffer method, which realize the visualization of spatial relations descriptions of natural language. In the example of Xianlin campus of Nanjing Normal University, the system adopts a three-tiered architecture containing user layer, service layer and data layer. We also design and develop the analogous expression system of spatial relations of natural language, which realizes the "text-to-figure" conversion between fuzzy natural language description and point-line features, and verifies the validity of the method proposed in this paper. Most importantly, this system contributes a lot to recognition, reasoning, calculation, formal expression and visualization expression of geographical spatial information.

Keywords: natural language ; spatial relation ; simulated expression

0

PDF (1455KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

唐天琪, 曹青, 张翎, 龙毅. 点线目标自然语言空间关系描述模拟表达方法研究[J]. 地球信息科学学报, 2018, 20(2): 139-146 https://doi.org/10.12082/dqxxkx.2018.170296

TANG Tianqi, CAO Qing, ZHANG Ling, LONG Yi. Simulated Expression Method of Spatial Relationship of Natural Language of Point, Line and Object[J]. Journal of Geo-information Science, 2018, 20(2): 139-146 https://doi.org/10.12082/dqxxkx.2018.170296

1 引言

自然语言符合人们的认知习惯和语言习惯,是人类空间认知结果的重要表现形式,运用自然语言与计算机进行对话是计算机的发展目标之一[1]。空间关系是GIS研究的重要理论问题之一,在GIS空间数据建模、空间查询、空间分析、空间推理、制图综合、地图认知等过程中起重要的作用。自然语言中空间关系描述虽然具有模糊性和不确定性等特点,但比GIS空间关系更接近于人们的认知、交流和表述习惯。因此,对自然语言空间关系的理解是GIS空间关系研究的一个基本问题[2]

近年来,自然语言空间关系研究内容主要集中在以下3个方面:① 开展认知实验,探讨人们在描述空间关系过程中地理要素类型及几何特征、空间关系类型等因素对空间关系词汇选择的影响,并建立空间关系词汇与GIS计算模型之间的映射关系[3,4];② 挖掘不同类型地理要素与空间关系词汇之间的联系,总结和归纳其中涉及的知识规则,构建空间关系词汇的语义映射模型[5,6];③ 构建基于受限环境下的空间关系描述句法模式,实现GIS空间查询、路径导航等领域的形式化表达[7,8,9,10,11,12]。虽然自然语言空间关系方面的研究取得一定进展,但研究结果多应用于空间查询,将定量化结果进行可视化表达的研究较少。

自然语言描述中蕴含丰富的地理空间信息,是生活中最常用语言形式之一。与自然语言相对的是形式语言,它缺乏自然语言的灵活性,是一种抽象的语言符号系统。科学技术的发展要求缩小形式语言与自然语言之间的差距,其解决的关键在于模糊语义的形式化。在认知语言学中,一条基本原理为“现实➝认知➝语言”[13]。空间关系描述的模拟表达是模糊语义形式化的一个重要阶段,即将自然语言中对于空间关系的描述转化为示意性地图的形式。因此,模糊空间关系表达的研究不仅满足自然语言、空间认知研究的需要,同时也是形式化语言中亟待解决的问题。本文旨在探讨如何建立自然语言与图形语言之间转换桥梁,有助于人工智能、定性空间推理等领域发展。

2 自然语言空间关系描述模糊性

模糊性是自然语言空间关系描述的一个重要特性,也是其复杂多变、难以被计算机“理解”的关键所在。本文在开展模糊空间关系认知实验的基础上,总结相关句法模式特点,将自然语言空间关系描述的“模糊性”按照空间粒度进行分类,即根据描述语句中“模糊”程度的差异进行细分,主要分为完全模糊描述、区间模糊描述、定量模糊描述3类,具体对比见表1

表1   不同空间粒度描述对比

Tab. 1   Comparison of the description of different spatial granularities

完全模糊描述区间模糊描述定量模糊描述
模糊性程度一般丰富
描述特点具有模糊含义词汇模糊含义词汇 + 定量参数范围模糊含义词汇 + 定量参数
示例距离关系33幢离行知楼较远33幢离行知楼300~400 m远33幢离行知楼大概320 m,步行约6 min
方向关系34幢在学行楼西北部34幢位于学行楼北偏西60~70°之间34幢在学行楼北偏西65°左右
方向关系
+距离关系
行远楼在体育场东北方向不远处行远楼位于体育场东北方向,100~200 m处行远楼在体育场北偏东30°方向,200 m左右,步行大约2 min

新窗口打开

完全模糊描述含有语义信息较少,描述内容最为模糊,不含定量参数信息,亦是人们面临陌生环境常用的描述形式;区间模糊描述、定量模糊描述含有语义信息较完全模糊描述丰富一些,在描述过程中以含有模糊语义词汇与定量参数组合的形式出现,不同的是区间模糊描述的往往是一个范围,如“几百米、方圆两公里内”等,而定量模糊描述进一步细化,精确到某一个数值,如“100 m、3 min”等,但是常带有表示程度的副词,如“约、左右、大概”等。

3 基于自然语言的模糊空间关系模拟表达方法

自然语言模拟表达的研究是自然语言到图形语言转换的重点。如何将定性的自然语言描述转化为定量参数是本文研究的关键。位置描述的空间定位方法研究目的在于建立定性位置描述与定量规则之间的联系[14,15,16],国外学者主要提出的方法有“point-Radius”方法和“shape”方法[17]、基于Voronoi图的空间定位方法[18]等。下面分别从距离关系、方向关系、拓扑关系3个方面阐述转换的方法。

3.1 距离关系

距离关系描述是人们日常生活对话中最常出现的描述之一。例如,游客问路,得到回答既可能是“不远”、“很近”这类定性描述,也有可能是“大约300 m”等含有数值的定量描述,或出现时间距离描述,即“步行5 min”、“开车20 min”等。

根据自然语言空间关系认知实验的研究内容,主要对5个距离关系描述词汇和时间距离描述统一地进行了定量化转换并获取规则(本文不详细阐述),距离划分情况如图1所示,图中同心圆非等距离排列。时间距离描述的模拟表达是本文研究的创新之处,该方法有效地建立了时间距离描述与计算机所需定量参数之间的映射联系,如描述中提到“步行3 min”,则对应词语为“很近”,采用“很近”对应的最小、最大距离进行计算即可。

图1   非等距离划分

Fig. 1   Unequal distance division

构建定量化规则的目的在于为可视化表达提供参数,不同可视化表达方法对于表达结果影响较大。在进行模拟可视化表达时,主要考虑空间走向和空间距离2个因素。本文只讨论点和线要素的表达。针对不同层次、等级描述内容设计2种表达方法:缓冲区法和随机参数法。① 缓冲区法:假设点A为参照物,L为目标线要素,根据描述中出现的词汇找到对应规则(步行时间T、最小距离SD、最大距离LD取值范围),则可视化表达距离为最小距离、最大距离加上一个固定数值(图2(a))。② 随机参数法:假设点A为参照物,L为目标线要素,根据描述中出现的词汇找到对应规则(步行时间T、最小距离SD、最大距离LD取值范围),则可视化表达距离为取值范围内的一个随机数值,且规定点A到2个端点的距离即为最小距离和最大距离(图2(b))。

图2   缓冲区法与随机参数法可视化表达

Fig. 2   Visualization expression of random parameter and buffer methods

缓冲区法和随机参数法的优势在于实现定性语言➝定量化规则➝可视化表达的过程。其中,缓冲区法生成的地图较为固定,而随机参数法为用户提供了更加丰富多变的读图体验。

表2示例了4种类型定量模糊描述:“化成楼离敏行路很近”为完全模糊描述、“化成楼到敏行路也就200~300 m远”为区间模糊描述、“化成楼到敏行路大约250 m”和“昨天我从化成楼走到敏行路花了3 min”。首先对4句话进行解析,4个示例的参照物都是化成楼,目标物为敏行路,但涉及距离关系的词汇略有不同,分别为“很近”、“200~300 m”、“大约250 m”和“走3 min”;最后再根据总结出的定量化规则,确定不同空间词汇对应参数。在模拟表达过程中采用2种方法,由于描述中并未涉及方向关系,因此示意图中所画道路走向不同都认为是正确的。

表2   距离关系描述语句示例

Tab. 2   The examples of distance relation descriptions

新窗口打开

具体分析不同描述语句的示意图:① “很近”对应的规则为:SD ∈(43.001,80.526],因此,使用随机参数法表示时只需满足敏行路到化成楼的最小距离在43.001~80.526 m范围内即可,使用缓冲区法表示时缓冲区为最小距离区间形成的矩形;② 描述语句中出现具体的参数范围,因此缓冲区和随机参数法的参数区间为[200,300];③ 中描述距离关系更为精确,随机参数法使用描述中出现数值,缓冲区法中人为设定区间为[245,255];④ “走3 min”对应规则与“很近”相同,此处不再赘述。

3.2 方向关系

空间走向是线状位置描述的主要特征,即采用参考点相互依赖关系隐式描述线状地物在地理空间中的走向[19]。在锥形八方向关系描述中(图3),各主方向关系对应的方向区间分别为:北[0º,22.5º)∪ [337.5º, 360º)、东北[22.5º,67.5º]、东[67.5º,112.5º]、东南[112.5º,157.5º]、南[157.5º,202.5º]、西南[202.5º,247.5º]、西[247.5º,292.5º]和西北[292.5º,337.5º]。本文在锥形模型基础上进行改进,构建与空间方向关系词汇对应的八边形方向模型(图4)。

图3   基于锥形的方向划分

Fig. 3   Directional partitioning based on taper

图4   八方向关系模型

Fig. 4   The eight-directional relationship model

本文提出方向关系模拟表达方法具有以下几个要求:①虽然描述语句涉及方向词汇差异较大,但最终解析结果为“东、南、西、北、东南、东北、西南、西北”八个词语;②只考虑绝对方向关系描述,并未对相对方向关系、内在方向关系表达进行探讨;③只考虑描述语句中出现的方向关系描述,而道路本身走向不予考虑。

示例:在厚生楼东北边是两江路,西北边是笃学路,东南边是正德路。

分析:解析结果如下:{“参照物”:“厚生楼”,“方向名词”:东北,“目标物”:两江路};{“参照物”:“厚生楼”,“方向名词”:西北,“目标物”:笃学路};{“参照物”:“厚生楼”,“方向名词”:东南,“目标物”:正德路}。由于描述中未涉及距离关系,因此道路的长短以及道路与厚生楼的距离未知,只要保证方向关系正确即可,如图5所示。

图5   空间方向的地图可视化

Fig. 5   Cartographic visualization of spatial direction

3.3 拓扑关系

拓扑关系研究在空间关系研究中占据重要地位,是自然语言空间关系研究中的难点。不同要素间由于自身形态复杂,造成人们对拓扑关系的认知、描述差异较大。点与线要素之间拓扑关系主要取决于点是否在线上,从空间词汇来说,即相离和包含。点与面要素之间拓扑关系比线要素略复杂一些,主要取决于点是否在面上,从空间词汇来说,即相离、在边上和包含。线和线、线和面要素之间拓扑关系复杂,在本文中不作详细讨论。

将点与线要素之间拓扑关系分为“相离”和“包含”2类,按照词汇的含义将其归入不同类别中;点与面要素分为“相离”、“在边上”和“包含”3类,同样按照词汇的含义将其归入不同类别中。根据上述方法判断语言解析结果对应的拓扑关系类型,若没有提及方向关系、距离关系,则可视化表达结果只要满足“相离”或“包含”即认为正确。

4 原型系统设计与实现

4.1 系统设计与实现

利用Microsoft公司的Visual Studio 2013环境下的C#编程语言,采用典型3层架构模式(数据层、服务层、用户层),结合使用ESRI公司的 ArcEngine10.2组件库搭建了实验原型系统。系统原型的实现主要包含2个阶段:形式化自然语言空间关系描述阶段和原型系统设计与实现阶段(图6)。

图6   原型系统实现流程

Fig. 6   Implementation process of the prototype system

该系统主要有3大功能:语义解析、模拟表达和地图输出。首先,借鉴文献[20]中提出的地理位置信息解析算法,根据用户在对话框中输入的文字描述,判断输入描述中是否含有相应特征词,获得与输入文本各句子对应的特征词词性序列集合[21],并按照“参照物 方向关系 距离关系 目标物”的格式显示在对话框中。

下面示例中解析的文字对应前文中提出的不同“模糊”等级描述(图7),“附近的校医院南边不远是厚生路”为完全模糊描述,“学明楼东北边200~300 m是两江路”为区间模糊描述,“学行楼南边大约400 m是学林路”和“从体育中心出发,向西南边步行2 min到达金大路”是定量模糊描述。

图7   语义解析实现

Fig. 7   Semantic parsing implementation

为了使得表达更接近实际地图,点要素的坐标采用实际地理坐标。根据前文提出的2种可视化表达方法,而缓冲区法和随机参数法,根据解析结果生成对应的地图。当模拟表达结束后,用户可以点击“输出图片”按钮,将生成的地按所需格式的图片进行保存,并存储在合适的位置,保存成功时会弹出对话框提示,以此获得个性化描述地图。

4.2 实验结果评价

将缓冲区法表达结果图(8(a))、随机参数法表达结果(8(b))、经过数字化的地图(图8(c))进行对比,详见表3。其中,2种方法对于拓扑关系的表达结果与实际地物一致,“相离”或“包含”表示正确即认为一致;2种方法控制地物之间相对方向关系的表达结果与实际地物一致,但是细节处理的好坏还需要设计详细的评价指标,在下一步研究中将重点探索。

图8   模拟表达结果与电子地图对比(1:15 000)

Fig. 8   Comparison between simulated results and electronic maps

表3   实验结果评价

Tab. 3   Evaluation of experimental results

缓冲区法表达结果随机参数法表达结果
空间
关系
表达
距离关系有差异有差异
方向关系基本一致基本一致
拓扑关系一致一致
表达
效果
特点不同缓冲区范围能清楚的反应其描述对应的模糊等级所有线要素宽度一致,区别较小
缺点实际生活中学林路为一条“弯曲”的道路,但是2种方法未表现出来

新窗口打开

5 结论

本文按照空间粒度不同对自然语言空间关系描述进行分类,并根据3个类别特点建立对应距离关系转换规则;构建八方向关系模型,并根据提出的2种可视化表达方法,而随机参数法和缓冲区法,实现不同表达效果;设计并实现了基于自然语言的模糊空间关系模拟表达平台,采用人机交互模式,提供用户语义解析、生成地图和地图输出3种功能,并将模拟表达结果和实际地图进行对比分析。但目前系统只针对点-线要素之间空间关系进行了研究,未来还将对其他地理要素组合表达进行研究。

The authors have declared that no competing interests exist.


参考文献

[1] 杜世宏,王桥,李治江.

GIS中自然语言空间关系定义

[J].武汉大学学报·信息科学版,2005,30(6):533-538.

URL      [本文引用: 1]     

[ Du S H, Wang Q, Li Z J.

Definitions of spatial relations of natural-language in GIS

[J]. Geomatics and Information Science of Wuhan University, 2005,30(6):533-538. ]

URL      [本文引用: 1]     

[2] 陈军,赵仁亮.

GIS空间关系的基本问题与研究进展

[J].测绘学报,1999,28(2):95-102.

URL      [本文引用: 1]      摘要

空间关系是GIS的重要理论问题之一,在GIS空间数据建模,空间查询,空间分析,空间推理,制图综合,地图理解等过程中起着重要的作用。目前国际上对空间关系的研究主要集中在空间关系的语义问题,空间关系描述空间关系表达,基于空间关系的分析等方面。

[ Chen J, Zhao R L.

Spatial relations in GIS: A survey on its key issues and research progress

[J]. Acta Geodaetica et Cartographica Sinica, 1999,28(2):95-102. ]

URL      [本文引用: 1]      摘要

空间关系是GIS的重要理论问题之一,在GIS空间数据建模,空间查询,空间分析,空间推理,制图综合,地图理解等过程中起着重要的作用。目前国际上对空间关系的研究主要集中在空间关系的语义问题,空间关系描述空间关系表达,基于空间关系的分析等方面。
[3] 许珺.

对于线状地理特征空间关系的自然语言理解

[J].地球信息科学,2008,10(3):363-369.

URL      [本文引用: 1]     

[ Xu J.

Natural-language understanding of spatial relations between linear geographic objects

[J]. Geo-information science, 2008,10(3):363-369. ]

URL      [本文引用: 1]     

[4] 杜冲,司望利,许珺.

基于地理语义的空间关系查询和推理

[J].地球信息科学学报,2010,12(1):48-55.

URL      Magsci      [本文引用: 1]      摘要

地理空间中的地物,根据其本体类型具有不同的地理语义特征。受到地理语义的影响,人们在描述几何特征和关系相似的物体之间的空间关系时,所用的词汇是不同的。目前,人们在空间关系的自然语言查询方面的研究主要集中在空间关系描述、空间关系自然语言形式化表达、空间关系自然语言查询语句的转换,以及空间关系自然语言查询的查询接口等方面,没有考虑到地理本体的语义差异,这会使得空间关系的自然语言查询不能符合人类语言和认知的习惯。本文依据一些学者在空间关系的自然语言描述的形式化(主要是线和线、线和面等形状的空间地物之间的关系)研究的基础上,针对不同地理本体类型的空间地物和空间关系自然语言描述词汇之间对应的语义关系有所不同的特点,总结了自然语言词汇在描述空间关系时的对应规则,提出不同特征类型地物和描述词汇之间的规则库设计方法,并设计部分空间地物的规则实例。最后,结合空间关系判断函数,设计具体查询系统实践举例证明。

[ Du C, Si W L, Xu J.

Querying and reasoning of spatial relations based on geographic semantics

[J]. Journal of Geo-information Science, 2010,12(1):48-55. ]

URL      Magsci      [本文引用: 1]      摘要

地理空间中的地物,根据其本体类型具有不同的地理语义特征。受到地理语义的影响,人们在描述几何特征和关系相似的物体之间的空间关系时,所用的词汇是不同的。目前,人们在空间关系的自然语言查询方面的研究主要集中在空间关系描述、空间关系自然语言形式化表达、空间关系自然语言查询语句的转换,以及空间关系自然语言查询的查询接口等方面,没有考虑到地理本体的语义差异,这会使得空间关系的自然语言查询不能符合人类语言和认知的习惯。本文依据一些学者在空间关系的自然语言描述的形式化(主要是线和线、线和面等形状的空间地物之间的关系)研究的基础上,针对不同地理本体类型的空间地物和空间关系自然语言描述词汇之间对应的语义关系有所不同的特点,总结了自然语言词汇在描述空间关系时的对应规则,提出不同特征类型地物和描述词汇之间的规则库设计方法,并设计部分空间地物的规则实例。最后,结合空间关系判断函数,设计具体查询系统实践举例证明。
[5] Xu J.

Formalizing natural-language spatial relations descriptions with fuzzy decision tree algorithm

[C]. Proceedings of the Society of Photo-Optical Instrumentation Engineers (Spie), 2006.

[本文引用: 1]     

[6] Xu J.

Formalizing natural-language spatial relations between linear objects with topological and metric properties

[J]. International Journal of Geographical Information Science, 2007,21(4):377-395.

https://doi.org/10.1080/13658810600894323      URL      [本文引用: 1]      摘要

People usually use qualitative terms to express spatial relations, while current geographic information systems (GISs) all use quantitative approaches to store spatial information. The abilities of current GISs to represent and query spatial information about geographic space are limited. Based on the result of a human-subject test of natural-language descriptions of spatial relations between linear geographic objects, this paper defines a series of quantitative indices that are related to natural-language spatial relation terms, and uses these indices to formalize the ambiguous natural-language representation with a decision-tree algorithm. The result indicates that using both topological indices and metric indices can formalize the natural-language spatial predicates better than using only topological indices. The rules extracted from the trees are used to characterize the spatial relations into qualitative description groups. Using these rules, a prototype of an intelligent natural-language interface for the ESRI software ArcGIS that can query spatial relations between two linear objects in natural English language is implemented using SNePS (the Semantic Network Processing System).
[7] 杜世宏.

空间关系模糊描述及组合推理的理论和方法研究

[D].北京:中国科学院大学,2004.

[本文引用: 1]     

[ Du S H.

Study on theories and methods of fuzzy description and compose Reasoning of Spatial Relations

[D]. Beijing: Graduate School of Chinese Academy of Sciences, 2004. ]

[本文引用: 1]     

[8] 张雪英,闾国年.

自然语言空间关系及其在GIS中的应用研究

[J].地球信息科学,2007,9(6):77-81.

https://doi.org/10.3969/j.issn.1560-8999.2007.06.014      URL      [本文引用: 1]      摘要

智能GIS的最终目标是实现用户与GIS的自然语言交互。如何从自然语言中自动抽取空间信 息,消除GIS中结构化空间信息与自然语言中非结构化空间信息之间的语义障碍,已成为智能GIS面临的两大难题。目前的相关研究主要集中于自然语言空间关 系。空间词汇及其句法模式是自然语言空间关系研究的核心问题。本文首先阐述了自然语言空间关系研究的几个基本问题,然后详细讨论了汉语中描述各种空间关系 的空间词汇及其句法模式。最后,探讨了GIS中自然语言空间关系查询请求表达的句法模式及其解析方法。

[ Zhang X Y, Lv G N.

Spatial relationships of natural language and their applications in GIS

[J]. Geo-information Science, 2007,9(6):77-81. ]

https://doi.org/10.3969/j.issn.1560-8999.2007.06.014      URL      [本文引用: 1]      摘要

智能GIS的最终目标是实现用户与GIS的自然语言交互。如何从自然语言中自动抽取空间信 息,消除GIS中结构化空间信息与自然语言中非结构化空间信息之间的语义障碍,已成为智能GIS面临的两大难题。目前的相关研究主要集中于自然语言空间关 系。空间词汇及其句法模式是自然语言空间关系研究的核心问题。本文首先阐述了自然语言空间关系研究的几个基本问题,然后详细讨论了汉语中描述各种空间关系 的空间词汇及其句法模式。最后,探讨了GIS中自然语言空间关系查询请求表达的句法模式及其解析方法。
[9] 邓敏,徐锐,李志林,.

空间查询中自然语言空间关系与度量空间关系的转换方法研究——以面目标为例

[J].测绘学报,2009,38(6):527-531.

URL      [本文引用: 1]     

[ Deng M, Xu R, Li Z L, et al.

A spatial query driven transformation between metric spatial relations and spatial relations of natural language: Taking regions as examples

[J]. Acta Geodaetica et Cartographica Sinica, 2009,38(6):527-531. ]

URL      [本文引用: 1]     

[10] 邓敏,黄雪萍,刘慧敏,.

利用自然语言空间关系的空间查询方法研究

[J].武汉大学学报·信息科学版,2011,36(9):1089-1093.

URL      [本文引用: 1]      摘要

首先,从空间认知语言学的角度研究了空间关系自然语言描述中谓词、量词等的分类方法;然后,在分析空间查询语言特点的基础上建立了自然语言空间查询的4类句法模式;最后,设计了一个基于自然语言空间关系的空间查询系统框架,并进行了初步实现。

[ Deng M, Huang X P, Liu H M, et al.

An approach for spatial query based on spatial relationships of natural language

[J]. Geomatics and Information Science of Wuhan University, 2011,36(9):1089-1093. ]

URL      [本文引用: 1]      摘要

首先,从空间认知语言学的角度研究了空间关系自然语言描述中谓词、量词等的分类方法;然后,在分析空间查询语言特点的基础上建立了自然语言空间查询的4类句法模式;最后,设计了一个基于自然语言空间关系的空间查询系统框架,并进行了初步实现。
[11] 黄雪萍,邓敏,吴静,.

线面目标自然语言空间关系集成表达与描述方法研究

[J].武汉大学学报·信息科学版,2013,38(2):230-234.

URL      [本文引用: 1]      摘要

提出了一种基于自然语言的线/面目标空间关系集成表达方法。首先,将线目标进行细化分解得到n个特征点和n-1条特征线,根据自然语言的描述习惯分别针对每个特征点和特征线建立线与面目标之间的空间关系,然后按照自然语言以线目标的走向为顺序对线面间空间关系进行描述的规则,对拓扑、方向、度量关系进行集成描述。实验验证了本文方法的可行性。

[ Huang X P, Ding M, Wu J, et al.

Integrated representation and description of spatial relationships of natural language between a line and an area

.[J]. Geomatics and Information Science of Wuhan University, 2013,38(2):230-234. ]

URL      [本文引用: 1]      摘要

提出了一种基于自然语言的线/面目标空间关系集成表达方法。首先,将线目标进行细化分解得到n个特征点和n-1条特征线,根据自然语言的描述习惯分别针对每个特征点和特征线建立线与面目标之间的空间关系,然后按照自然语言以线目标的走向为顺序对线面间空间关系进行描述的规则,对拓扑、方向、度量关系进行集成描述。实验验证了本文方法的可行性。
[12] 张彩丽,吴静,邓敏.

移动点与参考地物时空关系的自然语言描述方法研究

[J].地理与地理信息科学,2015,31(3):12-16.

URL      [本文引用: 1]     

[ Zhang C L, Wu J, Deng M.

Natural-language description of spatio-temporal relationships between moving points and reference features

[J]. Geography and Geo-Information Science, 2015,31(3):12-16. ]

URL      [本文引用: 1]     

[13] 王寅. 认知语言学[M].上海:上海外语教育出版社,2007.

[本文引用: 1]     

[ Wang Y.Cognitive Linguistic[M]. Shanghai: Shanghai Foreign Language Education Press, 2007. ]

[本文引用: 1]     

[14] 郑玥,龙毅,明小娜,.

多种空间关系组合的地理位置自然语言描述方法

[J].地球信息科学学报,2011,13(4):465-471.

https://doi.org/10.3724/SP.J.1047.2011.00465      URL      Magsci      [本文引用: 1]      摘要

针对单一描述语句表达位置信息的不足,如依赖用户对单一参照物的熟悉程度、定位范围较大而不明确等,本文提出同时采用多种参照物并兼顾多种空间关系的组合描述机制,逐步逼近目标位置,同时弱化用户对参照物的认知依赖。探讨了具有结构特征及与目标物有空间关系约束等不同类型参照物的选取方法,研究了空间关系等相对位置信息的描述参数及其计算方法,并结合空间认知理论将结果转换为对应的自然语言词汇,通过各种类型信息自然语言描述语句的句法模式形成完整的语句,最后在组合描述原则的指导下,将多个描述语句整合为多空间认知层次、多定位结构的位置信息描述语段。经实验对比单句描述与组合描述两种方式,证明后者有助于提高地理目标位置认知与定位的效果。

[ Zheng Y, Long Y, Ming X N, et al.

Natural-language description of geographic location considering various spatial relations with different references

[J]. Journal of Geo-Information Science, 2011,13(4):465-471. ]

https://doi.org/10.3724/SP.J.1047.2011.00465      URL      Magsci      [本文引用: 1]      摘要

针对单一描述语句表达位置信息的不足,如依赖用户对单一参照物的熟悉程度、定位范围较大而不明确等,本文提出同时采用多种参照物并兼顾多种空间关系的组合描述机制,逐步逼近目标位置,同时弱化用户对参照物的认知依赖。探讨了具有结构特征及与目标物有空间关系约束等不同类型参照物的选取方法,研究了空间关系等相对位置信息的描述参数及其计算方法,并结合空间认知理论将结果转换为对应的自然语言词汇,通过各种类型信息自然语言描述语句的句法模式形成完整的语句,最后在组合描述原则的指导下,将多个描述语句整合为多空间认知层次、多定位结构的位置信息描述语段。经实验对比单句描述与组合描述两种方式,证明后者有助于提高地理目标位置认知与定位的效果。
[15] 陈功,李霖,邢小雨,.

一种规则化自然语言位置估算方法

[J].测绘地理信息,2015,40(3):39-42.

https://doi.org/10.14188/j.2095-6045.2015.03.010      URL      [本文引用: 1]      摘要

位置信息是位置信息服务的前提和基础,位置信息的转换对统一位置信息描述和信息之间的空间联系具有重要的意义。针对估算规则化自然语言位置的空间位置的问题,首先分析了规则化自然语言位置的特征和内涵,总结出其结构化的表达形式;然后提出了一种规则化自然语言位置估算方法。

[ Chen G, Li L, Xing X Y, et al.

An estimation method of rule-based natural language position

[J]. Journal of Geomatics, 2015,40(3):39-42. ]

https://doi.org/10.14188/j.2095-6045.2015.03.010      URL      [本文引用: 1]      摘要

位置信息是位置信息服务的前提和基础,位置信息的转换对统一位置信息描述和信息之间的空间联系具有重要的意义。针对估算规则化自然语言位置的空间位置的问题,首先分析了规则化自然语言位置的特征和内涵,总结出其结构化的表达形式;然后提出了一种规则化自然语言位置估算方法。
[16] 余建伟,李清泉.

位置感知计算中定位信息的自然语言描述

[J].地理与地理信息科学,2009,25(1):10-13.

URL      [本文引用: 1]     

[ Yu J W, Li Q Q.

Natural-language description of location information in location-aware computing

[J]. Geography and Geo-Information Science, 2009,25(1):10-13,21. ]

URL      [本文引用: 1]     

[17] John W, Qing H G, Hijmans R.

"The point-radius method for georeferencing locality descriptions and calculating associated uncertainty"

[J]. International Journal of Geographical Information Science, 2004,18(8):745-767.

https://doi.org/10.1080/13658810412331280211      URL      [本文引用: 1]     

[18] Gong Y, Li G, Liu Y, et al.

Positioning localities from spatial assertions based on voronoi neighboring

[J]. Science China Technological Sciences, 2010,53(1):143-149.

https://doi.org/10.1007/s11431-010-3203-5      URL      [本文引用: 1]      摘要

With the rapid development of Internet,much spatial information contained in non-structured or semi-structured documents is available on the World Wide Web.In such documents,localities are always textually described using spatial relationships and named places,instead of numerical coordinates.Hence,extracting positional information from locality descriptions is an important task.In this paper,we bridge two aspects of locality descriptions,namely generating locality descriptions and positioning localities,and provide a method to compute probability density according to the selection probability of a reference object to describe the position of the target object.Refinement operation on uncertainty field is used to deal with locality description involving multiple reference objects.Three metrics are introduced to measure the results of positioning localities.We choose the mixed selection probability function based on Euclidean distance and Voronoi stolen-area to compute probability density function.Finally,we use three cases to demonstrate the proposed methods.
[19] 黄亮,朱欣焰,呙维,.

一种线状位置文本描述的估算方法

[J].武汉大学学报·信息科学版,2014,39(4):481-485. ]

https://doi.org/10.13203/j.whugis20120155      URL      [本文引用: 1]      摘要

当前大量空间数据的位置信息多采用文本描述而非地理坐标,导致地理信息系统无法对这些数据进 行空间查询和分析,估算位置描述对应的地理坐标有助于提高空间数据的应用价值。针对已有方法在处理线状位置描述时缺少参考位置之间空间关系约束分析的不 足,提出了一种线状位置文本描述的估算方法。在传统方法的基础上,顾及了局部空间走向计算线状特征在参考位置处的空间分布,并引入了模糊可见性概念模糊估 算线状特征在参考位置之间的空间分布。实验结果表明,此方法能有效估算线状位置文本描述的空间分布范围。

Huang L,Zhu X Y, Guo W, et al.

A method of geo-referencing linear locality descriptions

[J]. Geomatics and Information Science of Wuhan University, 2014,39(4):481-485. ]

https://doi.org/10.13203/j.whugis20120155      URL      [本文引用: 1]      摘要

当前大量空间数据的位置信息多采用文本描述而非地理坐标,导致地理信息系统无法对这些数据进 行空间查询和分析,估算位置描述对应的地理坐标有助于提高空间数据的应用价值。针对已有方法在处理线状位置描述时缺少参考位置之间空间关系约束分析的不 足,提出了一种线状位置文本描述的估算方法。在传统方法的基础上,顾及了局部空间走向计算线状特征在参考位置处的空间分布,并引入了模糊可见性概念模糊估 算线状特征在参考位置之间的空间分布。实验结果表明,此方法能有效估算线状位置文本描述的空间分布范围。
[20] 钱程扬.

面向网络用户的地理位置信息扩展查询与可视化研究

[D].南京:南京师范大学,2009.

[本文引用: 1]     

[ Qian C Y.

Research on query and visualization of geographic information extension for network users

[D]. Nanjing: Nanjing Normal University, 2009. ]

[本文引用: 1]     

[21] 仇培元,张恒才,陆锋.

互联网文本蕴含道路交通信息抽取的模式匹配方法

[J].地球信息科学学报,2015,17(4):416-422.

https://doi.org/10.3724/SP.J.1047.2015.00416      URL      Magsci      [本文引用: 1]      摘要

<p>互联网页面和社交网络文本中蕴含丰富的道路交通信息,是其他交通信息采集平台的有效补充。然而,自然语言文本形式的交通信息多以线性参考或地标方位描述交通事件空间位置,且大量存在事件元素缺失或隐含现象,对交通信息的自动化抽取有着较大影响。考虑到交通信息的自然语言表达方式虽然自由随意,但表达模式相对固定,提出一种从互联网文本中抽取道路交通信息的模式匹配方法。首先,基于道路交通事件描述的语言特征构建模式库;然后,以特征词词性序列的形式表达互联网文本和抽取模式,利用DTW距离度量序列相似度,实现抽取模式匹配;最后,在匹配抽取模式和填补规则指导下获取结构化的道路交通信息。由上海市城市交通相关门户网站和微博客平台的实验过程显示,本文所提出的模式匹配方法,抽取道路交通信息的准确率和召回率分别达到90%和80%以上,表明该方法能有效抽取互联网文本蕴含的道路交通信息,且实现过程相对简单,易于扩展,具有可用性。</p>

[ Qiu P Y, Zhang H C, Lu F.

A pattern matching method for extracting road traffic information from Internet texts

[J]. Journal of Geo-information Science, 2015,17(4):416-422. ]

https://doi.org/10.3724/SP.J.1047.2015.00416      URL      Magsci      [本文引用: 1]      摘要

<p>互联网页面和社交网络文本中蕴含丰富的道路交通信息,是其他交通信息采集平台的有效补充。然而,自然语言文本形式的交通信息多以线性参考或地标方位描述交通事件空间位置,且大量存在事件元素缺失或隐含现象,对交通信息的自动化抽取有着较大影响。考虑到交通信息的自然语言表达方式虽然自由随意,但表达模式相对固定,提出一种从互联网文本中抽取道路交通信息的模式匹配方法。首先,基于道路交通事件描述的语言特征构建模式库;然后,以特征词词性序列的形式表达互联网文本和抽取模式,利用DTW距离度量序列相似度,实现抽取模式匹配;最后,在匹配抽取模式和填补规则指导下获取结构化的道路交通信息。由上海市城市交通相关门户网站和微博客平台的实验过程显示,本文所提出的模式匹配方法,抽取道路交通信息的准确率和召回率分别达到90%和80%以上,表明该方法能有效抽取互联网文本蕴含的道路交通信息,且实现过程相对简单,易于扩展,具有可用性。</p>

/