地球信息科学理论与方法

基于自然语言形态描述的地理实体模拟表达方法

  • 洪必文 1, 2, 3 ,
  • 曹青 1, 2, 3 ,
  • 张翎 , 1, 2, 3, 4, * ,
  • 龙毅 1, 2, 3 ,
  • 寇萱 1, 2, 3
展开
  • 1. 南京师范大学地理科学学院,南京 210023
  • 2. 虚拟地理环境教育部重点实验室,南京 210023
  • 3. 江苏省地理信息资源开发与利用协同创新中心,南京 210023
  • 4. 南京师范大学常州创新发展研究院,常州 213000
  • 5. 天翼物联科技有限公司,南京210001
*张翎(1982-)男,博士,江苏丹阳人,主要从事电子地图学、语音导航与位置服务、地图自动综合、智慧旅游等研究。E-mail:

洪必文(1996-),女,硕士生,湖北武汉人,主要从事空间认知与地图可视化。E-mail:840456645@qq.com

收稿日期: 2019-02-27

  要求修回日期: 2019-07-05

  网络出版日期: 2019-10-29

基金资助

国家自然科学基金项目(41571382)

国家自然科学基金项目(61472191)

江苏省高校自然科学研究重大项目(15KJA420001)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

Simulated Expression of Geographical Entities based on Morphology Description by Natural Language

  • HONG Biwen 1, 2, 3 ,
  • CAO Qing 1, 2, 3 ,
  • ZHANG Ling , 1, 2, 3, 4, * ,
  • LONG Yi 1, 2, 3 ,
  • Kou Xuan 1, 2, 3
Expand
  • 1. School of Geography Science Nanjing Normal University, Nanjing 210023, China
  • 2. Key Laboratory of Virtual Geographic Environment of Ministry of Education, Nanjing 210023, China
  • 3. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China
  • 4. Changzhou Institute of Innovation and Develop-ment, Nanjing Normal University, Changzhou 213000, China
  • 5. Tianyi IOT Technology Co., Ltd.,Nanjing 210001,China
*ZHANG Ling, E-mail:

Received date: 2019-02-27

  Request revised date: 2019-07-05

  Online published: 2019-10-29

Supported by

National Natural Science Foundation of China(41571382)

National Natural Science Foundation of China(61472191)

College Natural Science Research Key Program of Jiang Su Province(15KJA420001)

Copyright

Copyright reserved © 2019

摘要

日常生活中人们使用定性的自然语言描述地理实体,如何将定性描述的地理实体转换为定量的图形符号是空间认知、地图表达等领域面临的挑战。本文提出一种基于自然语言形态描述的地理实体表达方法,通过对自然语言中地理实体的语义信息进行分析,对自然语言描述的地理实体的形状、大小、分布状况等空间形态信息以地图形式进行近似表达。本文首先阐述了自然语言形态描述的定义与内涵,结合地图符号相关理论,研究了形态描述驱动的地理实体模拟表达策略,并对不同语义模糊度的地理实体图形表达进行了分析和实例设计,最后提出了一种计算空间实体相似性的方法对表达效果进行评估。结果表明,基于本文方法的地理实体模拟表达与手绘图中地理实体的平均相似度达到89.5%,与导览图的地理实体平均相似度达到86.86%,能够实现较好的表达效果,具有一定的科学性和可行性,为自然语言到地图语言的转换研究奠定了基础。

本文引用格式

洪必文 , 曹青 , 张翎 , 龙毅 , 寇萱 . 基于自然语言形态描述的地理实体模拟表达方法[J]. 地球信息科学学报, 2019 , 21(10) : 1491 -1501 . DOI: 10.12082/dqxxkx.2019.190083

Abstract

Natural language and maps both have the ability to express geospatial information. Compared with maps, natural language is more abstractive and acceptable to people. But a map has irreplaceable advantages to show the spatial morphological characteristics of geographic entities intuitively. The description of geographic entities in natural language is usually not completely quantitative. Except for limited quantitative descriptions of distances and sizes, there are likely also qualitative descriptions of colors, shapes, and etc. Transforming spatial information described by natural language to maps can release the burden of working memory and promote discovery, inference, and insight. Yet, it remains a challenge in the fields of spatial cognition and map symbols regarding how to convert qualitatively described geographic entities in natural language, which are usually fuzzy or semantics missing, into quantitative graphical symbols. In recent studies on "natural language to map", simple geometrical shapes and common icons were used to express geographic entities. However, much information of geographic entities, which represents the spatial cognition results of human to a certain extent, are lost. This paper proposed a method of geographic entity expression based on morphological description by natural language. By analyzing the semantic information of geographic entities described in natural language, the spatial shape information (e.g., shape, size, and distribution of geographical entities) and other properties necessary for entity expression (e.g., color) were approximately expressed in the form of map. First, the definition and connotation of natural language morphological description were introduced, and the classifications of morphological description and semantic fuzziness were given. Second, combined with the map symbol theory, the morphological description-driven geographic entity simulation expression strategies were studied. Five strategies were proposed for shape, size, color, orientation, and combination. Third, the geographic entity simulated expression with different semantic ambiguity was analyzed and designed, including geographic entity symbol design for single morphological type and different morphological types. Finally, an experiment was implemented for evaluating the validity and quality of the simulated expression of geographic entities. The experiment took Yihe Park, Beijing, China as an example and its tour commentary was applied to convert to a map. In addition, an evaluation method of spatial entity similarity was applied to assess the converted map. Our findings suggest that the graphic design method of this paper can achieve better expression results and has the potential of facilitating better conversion from natural language to maps.

1 引言

自然语言和地图是地理空间信息的2种表达方式。自然语言较地图语更抽象,普适性更高,但在地理实体的表达中,地图语言有着自然语言不可替代的优势,它能更直观、更深刻地描述地理实体的空间形态特征。
地图符号作为地图语言的表现形式[1],依据一定的抽象和概括规则,用类似地理实体的概念模型(几何形状)来表征地理实体,研究主要包括地图符号的图形和语义,其中地图符号视觉图形方面的研究较早,主要集中在地图符号的视觉变量设计[2,3,4]、地图符号结构设计[5]、符号库以及符号编辑器[6]、地图符号自动生成方法[7]等方面。该类研究重点关注地图符号的图形设计,对图形变量、图形描述与构造、构图规律、计算机建模等研究已经较为成熟。地图符号概念语义方面的研究近年来受到重视,如Landau等[8]探究了地理对象的属性信息和位置信息在空间认知和自然语言中的整合方式;Suchan等[9]通过问卷调查、采访和口头报告等方式调查地图使用者对地图的认知情况,作为制作地图的文字数据;胡最等[10]提出地图符号的语义概念模型,并运用该模型探索地图符号设计问题;苏艳军等[11]提出一种使用一项或多项属性数据驱动符号的视觉变量进而构成网络地图符号的方法;张金禄[12]提出一种自适应地图符号模型—树结构模型,并描述了该模型的符号设计方法;田江鹏等[13,14]提出一种语义驱动的层次化地图符号设计方法,通过符素表、语义结构驱动地图符号生成;李伟等[15]通过建立个性化地图符号概念模型,提出个性化地图符号设计方法和流程;Beshentsev[16]探究了地图符号的颜色和形状属性对信息传达的影响。该类研究重点关注地图符号的语言学本质特征以及根据相关语义描述自动生成地图符号。
自然语言中对地理实体的描述通常是不完全定量的,除了定量的距离、尺寸等描述,还有定性的颜色、抽象的形状等描述。现有的地图表达研究均建立在地理实体有准确的地理坐标(或坐标串)基础上,而自然语言转换的定量参数只能决定地理实体的大小、轮廓、分布区间等,无法精确描述地理实体的空间形态信息。如何针对模糊或缺失语义的自然语言形态描述,为自然语言中不完全定量描述的地理实体设计合理的图形来近似表达地理实体的空间形态特征尚缺少研究,因此,本文提出一种基于自然语言形态描述的地理实体模拟表达方法,为自然语言描述的地理实体设计合理的符合人类认知的地图符号,旨在打通大众通用的自然语言到专业应用的地图语言之间的信息变换渠道,使大众更深入地了解自然语言所描述的地理实体空间特征。

2 地理实体形态描述的定义与内涵

(1)地理实体形态描述定义
地理实体的形态指的是地理实体在一定条件下的表现形式。地理实体的“形”是空间尺度概念,表示外观,包括几何形状、尺寸大小、纹理、方向(或走向)和空间分布特征等;“态”是一种感知,表示状态或态势,包括颜色、物理状态和发展趋势等。自然语言中用来描述地理实体形态相关的词汇、短语以及句子统称为地理实体形态描述。
(2)地理实体形态描述特征与分类
通过分析自然语言中地理实体的描述特点,归纳总结出地理实体形态描述包括形状描述、尺寸描述、方向描述、纹理描述、颜色描述、物态描述和发展趋势描述等。文本描述驱动的地理实体表达过程中,起重要作用的主要是形状、尺寸、方向和颜色4个参数,因此将形态描述划分为形状描述、尺寸描述、方向描述和颜色描述4大类。
由于自然语言本身的模糊性以及不同语言表达方式所造成的语义模糊性程度不同,地理实体形态描述的模糊程度也不同。根据语义“抽象”程度差异进行细分,可将地理实体形状描述的“模糊性”划分为3类,如图1(a)所示;将地理实体尺寸描述分为2类,如图1(b)所示;将地理实体颜色描述分为3类,如图1(c)所示;将地理实体方向描述分为 2类,如图1(d)所示。
图1 形状描述、尺寸描述、颜色描述和方向描述的模糊性划分

Fig. 1 Ambiguity levels of shape description, size description, color description, and direction description

此外,不同形态类型描述的组合使得地理实体形态具有不同的特征,组合越单一,缺失的形态类型越多,语义信息越少,地理实体形态特征越模糊。因此,将自然语言中地理实体形态描述的“缺失情况”按照语义信息丰富程度进行分类,主要分为5个等级,等级越高,信息缺失越少,语义越丰富,具体见表1
表1 地理实体形态描述的语义缺失情况划分

Tab. 1 Division of semantic deficiency of geographical entity morphological descriptions

模糊性等级 语义信息丰富程度 地理实体几何形态描述模式 示例
一级 很低 O 南京师范大学
二级 较低 O+S 椭圆形花坛
O+M 小路
O+C 白色小亭
O+D 河流从西向东流动
三级 O+S+M 巨大矩形建筑物
O+S+C 海南的高速公路像一条银色绸缎
O+S+D 河流从南向北弯曲
O+M+C 翠绿的大草坪
O+M+D 小溪从东向南流淌
O+C+D 海南的高速公路像一条银色绸缎,自西向东延伸
四级 较高 O+S+M+C 贝尔湖湖色蔚蓝,湖水荡漾,湖形椭圆,湖水长约33 km,宽20 km,面积600多km2
O+S+M+D 万里长城自西南向东北蜿蜓于山脊上,宛如苍龙
O+S+C+D 弯曲的山路像褐色的长蟒,自西向北延伸
O+M+C+D 一条小河,银波泛泛,自东南向西北蜿蜒流去
五级 O+S+M+C+D 这条小路长100 m,宽10 m,从西向东弯曲,像一条灰白色的带子

注:O表示地理实体,S表示形状描述,M表示尺寸描述,C表示颜色描述,D表示方向描述。

3 形态描述驱动的地理实体模拟表达策略

视觉变量是地图符号的基本元素,由法国的Bertin于1967年在他的专著《Semiologie Graphique》中提出。Bertin 定义了形状、尺寸、方向、颜色、明度和密度6个变量,组成了描述图形符号规律的视觉变量。此后许多国内外学者在此基础上提出多种视觉变量的分类方案[17,18,19,20,21,22,23,24,25,26,27],公认的观点是视觉变量至少应包括:形状、尺寸、颜色、方向变量。通过视觉变量的组合,构成具有各种各样表达效果的地图符号,从而实现地理实体的有效表达。因此,要对自然语言描述的地理实体进行符号表达,首先需要通过分析语义信息中地理实体的形态描述,从形态描述中提取出地理实体视觉变量类型,进而通过视觉变量的组合确定地理实体的形状、尺寸、颜色、方向等形态特征,若形态描述中部分语义信息缺失,则在满足语义条件的基础上尽可能逼真地模拟现实世界中地理实体的基本形态,即缺失部分选取预先设定的对应类型地物的默认符号参数,基本思路如图2所示。
图2 地理实体符号表达基本思路

Fig. 2 Basic idea of geographic entity symbol expression

(1)形状描述的图形表达
传统地图符号是在地理实体具有准确的坐标(或坐标串)基础上设计,而自然语言中地理实体的形状描述在大多数情况下是不全面和模糊的,需通过对模糊的形状描述建立定量的符号模型,实现地理实体形状的模拟表达。
地图符号形状设计方法众多,一般而言,它可由基本几何图元或者其组合构成,几何图元包括线段、三角形、矩形、圆形等。由上文分析知,形状描述按照语义模糊性分3类:① 直接描述为“抽象几何形状”,符号设计过程直接根据形态描述中涉及的几何图形词汇,绘制对应的几何图形,如“椭圆形的湖泊”,可用椭圆形近似模拟湖泊的形状;② 半直接描述为“客观世界自然和人文事物的具象形状”,主要体现在比喻、拟人、拟物等修辞手法上,符号设计过程根据形态描述中提及的具象事物,通过几何图形的组合设计相应的具象形状模型,如“石头形状如龟”,可用圆、半圆、六边形、直线、圆弧等基本几何图形组合设计龟的简笔画近似模拟石头形状;③ 间接描述为“具有形状描述意义的修饰词”,这类描述最为抽象,往往只有形容词,其符号设计较为灵活,因此符号设计中只需体现形状描述中修饰词的含义即可。
(2)尺寸描述的图形表达
传统地图符号尺寸变量是建立在地理实体空间范围明确的基础上,用于反映地理对象的质量和数量的等级差异,并与地图比例尺相关;而对于自然语言中地理实体,则需要通过分析尺寸描述,确定地理对象本身的大小和范围或在背景区域中的相对大小,并据此设计相应的符号近似表达该地理实体。
由上文分析可知,尺寸描述按照语义模糊度分2类:① 直接描述,即定量描述,句法模式通常为“数词+(长度/宽度/高度等)单位”,此类符号表达基本原理是将数词直接转换为符号的尺寸变量参数,点状实体定量描述包括对实体的高度、宽度等的参数描述,将其转换为点状符号的直径、宽度大小即可反映点状实体的尺寸;线状实体定量描述包括对实体的长度和宽度等的参数描述,将其转换为线状符号的长度和粗细即可反映线状实体呈线状或带状的分布特点;面状实体定量描述包括对实体的长度、宽度、面积等的描述,将其转换为面状符号的长度、宽度和面积的大小即可反映面状实体的空间分布范围。② 间接描述,即定性描述,其句法模式通常为“(程度修饰词)+大/小/长/短等”,此类符号表达需根据背景区域的尺度特征以及与周边地物的关系,将定性描述的尺寸大小转换为对应的定量参数描述,进而依据“直接描述”的符号表达方法对地理实体的符号尺寸进行近似表达。
(3)颜色描述的图形表达
传统的地图符号颜色变量可反映地理对象的本质差异,如蓝色代表湖泊、绿色代表植被等。自然语言中对地理实体的颜色描述反映了在描述场景中地理实体的真实色彩。颜色描述驱动的符号表达是将描述语句中表示颜色的词汇提取出来,对于间接描述,需要根据提前建立好的语义色彩表(表2)确定相应颜色的RGB;对于直接描述类的颜色词汇,则参照常用RGB颜色对照表,将其转换为该符号对应的RGB数值。
表2 语义色彩表(部分)

Tab. 2 Color table of semantic information (part)

色彩描述 直观颜色 RGB
月牙泉宛若一颗绿宝石 宝石绿 34,177,76
公路如银丝带般缠绕在山间 银色 192,192,192
巍巍高山,郁郁葱葱 葱绿色 18,140,70
滔滔江水,碧波万顷 碧绿色 110,166,71
(4)方向描述的图形表达
自然语言中方向描述主要指对线状实体走向的描述,通常与形状描述相结合,用于确定线状实体的分布特征。方向描述的图形表达通常是提取描述中涉及的方向词汇(一般为绝对方向词汇),确定地理实体的起点和终点方向,基于该走向进行符号绘制。
(5)组合描述的图形表达
组合描述是指由形状、尺寸、颜色、方向描述中的2种或2种以上组合对地理实体形态特征进行描述。组合描述的符号表达策略为依次判断描述中是否有形状、尺寸、颜色、方向描述,如果有相应描述,则按照前文阐述的符号表达方法进行设计,如果没有,则根据地理实体本身的语义特征为其设计默认的符号。

4 自然语言描述的地理实体符号设计实例

(1)单一形态类型描述驱动的地理实体符号设计实例
根据上文阐述的符号设计方法,对自然语言 中不同形态描述的地理实体进行符号实例设计 (表3)。首先根据描述中形态、尺寸、颜色、方向的特征词确定对应的参数,然后根据参数和地理实体固有的常见属性特征对其进行适当修饰,从而完成符号设计。由于自然语言的地图表达中面状目标缺乏准确的地理坐标串,因此其符号设计需要参照文本中的形态信息,与传统面状目标地图符号设计有所不同。
表3 不同形态描述驱动的地理实体符号设计实例

Tab. 3 Geography entity symbol design examples driven by different morphological descriptions

形态描述类型 实体类型 描述示例 参数设计 符号设计
形状描述 A类 山峰 圆锥形的山峰峰峰相连
线 河流 “几”字型的黄河
长江的形状像“W”
湖泊 贝尔湖湖形椭圆
V字形的湖泊
B类 山峰 尖刀似的小山
石山 这座小石山像一个瓜葫芦
线 石桥 如彩虹的天然石桥
湖泊 洪泽湖是横放的三叶草
C类 中间是留佳亭
邀月门在东边
线 河流 弯弯曲曲的河流、河水曲折婉蜒
尺寸描述 A类 线 道路 这条小路只能通过一辆小汽车 路宽:3 m
这条路是双向6车道 路宽:24 m
B类 房子 矩形的小房子 尺寸:小
矩形的大房子 尺寸:大
颜色描述 A类 灯塔 一座象牙白的灯塔亭亭玉立 RGB:235, 229, 209
线 道路 海南的高速公路,就像绿色大海当中穿梭的一条银色绸缎 RGB:192, 192, 192
草坪 嫩绿的草坪 RGB:55, 116, 13
B类 线 滔滔江水,碧波万顷 RGB:66, 171, 145
月牙泉如一颗绿宝石 RGB:0, 152, 16
方向描述 走向描述 线 大溪从西向东弯曲
道路 道路自东北向西南延伸
(2)不同形态类型组合描述的地理实体符号设计实例
以点状实体的山峰、线状实体的河流、面状实体的湖泊为例,运用前文阐述的符号表达方法,构建不同形态类型组合描述的地理实体符号模型,由表1知,不同形态类型组合描述的语义缺失情况从高到低划分为5个等级,因此按照不同语义缺失情况的描述模式进行符号设计(表4)。首先基于人对地理实体的常规认知确定默认设计参数,制作默认地图符号,然后根据形态描述中可获取的特征修改设计参数,进行组合参数设计。形态描述越单一,地理实体形态特征越模糊,对应符号设计参数的不确定性越多,符号设计越自由,符号的唯一性等级越低,反之则相反。
表4 不同语义模糊度的地理实体符号设计实例

Tab. 4 Geography entity symbol design examples of different semantic ambiguity levels

地理
实体
默认设计
参数
默认
符号
自然语言
描述示例
形态描述
模式
模糊性 符号的
唯一性
组合参数
设计
设计参数
说明
形状:等腰三角形
尺寸:中
颜色:青绿色(RGB:141,193,130)
山峰 O 一级 一级 形状:默认
尺寸:默认
颜色:默认
高山 O+M 二级 二级 形状:默认
尺寸:大
颜色:默认
远远望去,一座圆锥形山峰高耸入云 O+S+M 三级 三级 形状:圆锥
尺寸:大
颜色:默认
远远望去,一座座山峰高耸入云,连绵不断,山上郁郁葱葱 O+S+
M+C
四级 四级 形状:圆锥形、连绵不断
尺寸:大
颜色:葱绿(RGB:18,140,70)
河流 形状:简单弧线
尺寸:中
颜色:海水蓝(RGB:40,150,200)
方向(走向):东西
河流 O 一级 一级 形状:默认
尺寸:默认
颜色:默认
走向:默认
弯曲的河流 O+S 二级 二级 形状:弯曲
尺寸:默认
颜色:默认
走向:默认
弯曲的大河 O+S+M 三级 三级 形状:弯曲
尺寸:大
颜色:默认
走向:默认
弯曲的大河清澈见底,河水像一张碧绿的玻璃纸 O+S+M+C 四级 四级 形状:弯曲
尺寸:大
颜色:碧绿(RGB:110,166,71)
走向:默认
弯曲的大河,碧波荡漾,自东北向西南蜿蜒流去 O+S+M+C+D 五级 五级 形状:弯曲
尺寸:大
颜色:碧绿(RGB:110,166,71)
走向:东北向西南
湖泊 形状:椭圆
尺寸:中
颜色:湖水蓝(RGB:153,196,233)
湖泊 O 一级 一级 形状:默认
尺寸:默认
颜色:默认
月牙形湖泊 O+M 二级 二级 形状:月牙形
尺寸:默认
颜色:默认
月牙形小湖 O+S+M 三级 三级 形状:月牙形
尺寸:小
颜色:默认
月牙泉从高空望去像是洒在鸣沙山上的一颗绿宝石 O+S+M+C 四级 四级 形状:月牙形
尺寸:小
颜色:宝石绿(RGB:34,177,76)

5 符号设计效果实证分析与评价

5.1 数据准备

为了客观评价本文地理实体模拟表达结果的有效性和质量,以颐和园场景描述为例,设计相关实体的符号,并对其进行可视化表达(图3),然后选取真实的导览图(选自颐和园官网(http://www.summerpalace-china.com/index.html#),图4(a))和手绘图(由南京师范大学地理科学学院GIS专业本科生根据颐和园场景描述绘制,参与人数50名,其中6份无效样本,图4(b)、(c)为参照对象将二者进行对比评价。
图3 “颐和园导游词”近似表达结果

Fig. 3 Approximate expression of “Tour Commentary of the Summer Palace ”

图4 符号设计效果对比与评价样本

Fig. 4 Samples of symbol design result comparison and evaluation

5.2 相似性评价方法

相似性是评定2个事物之间相近程度的一种度量,本文选取“地理实体相似性”作为评价指标,按照自然语言描述的地理实体抽象原则[28],计算基于颐和园场景描述的地理实体模拟表达结果与真实导览图中的地图符号的相似度,并对实验结果进行评估。已知两幅地图A与B,若A、B中每一个对应的地理实体相似,则称地图A与地图B地理实体相似。本文假定图3中颐和园近似表达结果为地图A,手绘地图或导览图为地图B。两幅地图地理实体相似度 SIMG ( A , B ) 计算公式为式(1):
SIMG ( A , B ) = i = 1 n ( w Gi × SIMG ( A i , B i ) )
式中: SIMG ( A i , B i ) 表示单个地理实体的相似度, w Gi 表示单个实体相似所占比重。
(1)点状地理实体 ( D ) 相似度:选取“几何形态 ( X D ) ”作为其评价指标,则其相似度 SIMG ( A Di , B Di ) 可表示为式(2):
SIMG ( A Di , B Di ) = SIMG ( X D )
若点状实体 A Di B Di 的几何形态一致,则 SIMG ( X D ) 为1;几何形态基本一致, SIMG ( X D ) 为0.5;几何形态不一致, SIMG ( X D ) 为0。
(2)线状地理实体 ( L ) 相似度:选取“几何形态 ( X L ) 、线实体与横轴的夹角 ( Z ) 、线实体长度与地图幅面对角线长度的比值 ( C ) ”作为其评价指标,则其相似度 SIMG ( A Li , B Li ) 可表示为式(3):
SIMG ( A Li , B Li ) = w GLX × SIMG ( X L ) + w GLZ × SIMG ( Z ) + w GLC × SIMG ( C )
式中: w GLX w GLZ w GLC 分别表示3个评价指标所占的权重; X L 的相似度 SIMG ( X L ) 为“若线状实体 A Li B Li 的几何形态一致,则 SIMG ( X L ) 为1;若基本一致, SIMG ( X L ) 为0.5;若不一致, SIMG ( X L ) 为0。 Z 的相似度 SIMG ( Z ) 计算为式(4),其中地图A中 Z ( A Li ) 满足 - 180 ° Z ( A Li ) 180 ° 、地图B中 Z ( B Li ) 满足 - 180 ° Z ( B Li ) 180 ° ,且 0 SIMG ( Z ) 1 ; C 的相似度计算为式(5)。
SIMG ( Z ) = 1 - Z ( A Li ) - Z ( B Li ) 180 °
SIMG ( C ) = min { C ( A Li ) / C ( B Li ) , C ( B Li ) / C ( A Li ) }
(3)面状地理实体 ( P ) 相似度:选取“几何形态 ( X P ) 、面实体最小外接矩形面积与地图幅面面积的比值 ( M ) 、面实体最小外接矩形周长与地图幅面周长的比值 ( ZC ) 、面实体最小外接矩形面积与周长的比值 ( MZC ) 、面实体最小外接矩形长与宽的比值 ( CK ) ”作为其评价指标,则其相似度 SIMG ( A Pi , B Pi ) 计算为式(6):
SIMG ( A Pi , B Pi ) = w X × SIMG ( X P ) + w M × SIMG ( M ) + w ZC × SIMG ( ZC ) + w MZC × SIMG ( MZC ) + w CK × SIMG ( CK )
式中: w GLX w GLZ w GLC 分别表示5个评价指标所占的权重; X P 的相似度 SIMG ( X P ) 为“若面状实体 A Pi B Pi 的几何形态一致,则 SIMG ( X P ) 为1;若基本一致, SIMG ( X P ) 为0.5;若不一致, SIMG ( X P ) 为0。 M ZC MZC CK 的相似度计算方式为式(7)-式(10)。
SIMG ( M ) = min { M ( A Pi ) / M ( B Pi ) , M ( B Pi ) / M ( A Pi ) }
SIMG ( ZC ) = min { ZC ( A Pi ) / ZC ( B Pi ) , ZC ( B Pi ) / ZC ( A Pi ) }
SIMG ( MZC ) = min { MZC ( A Pi ) / MZC ( B Pi ) , MZC ( B Pi ) / MZC ( A Pi ) }
SIMG ( CK ) = min { CK ( A Pi ) / CK ( B Pi ) , CK ( B Pi ) / CK ( A Pi ) }

5.3 地理实体平均相似性评价

图5是单个地理实体相似性计算结果,表5是地理实体平均相似性计算结果,可以看出点状地理实体相似度整体最高,与手绘图和导览图中点状地理实体的平均相似度分别为97.48%和100%,其中手绘图中的清遥亭、廊如亭和铜牛稍低,原因在于部分手绘图将其以圆点表示,导致形态不一致;线状实体次之,与手绘图和导览图中线状地理实体的平均相似度分别为74.74%和62.20%,主要原因为不同的人对文本中十七孔桥的形态描述理解不一,造成其相似度较低;面状地理实体的相似度最低,与手绘图和导览图中点状地理实体的平均相似度分别为74.39%和58.47%,由于文本并未对长廊的形态特征做说明,采用直线段不能准确的模拟长廊的实际形态,造成“长廊”相似度很低,而“万寿山”平均相似度低的原因在于文本中“……陆地面积约占1/4,湖水面积约占3/4……”该句,造成实验者对万寿山的大小认知不一致,从而相似度相对较低。总体来说,造成部分地理实体表达效果较差的原因主要为:形态描述缺失度较高;文本理解差异大。由地理实体平均相似度计算结果可知,手绘图与计算机成图的相似度较导览图的相似度更高,说明基于文本的空间认知规律性较强。
图5 地理实体相似度计算结果

Fig. 5 Similarity of geographical entities generated by different methods

表5 地理实体平均相似性计算结果

Tab. 5 Average similarity of geographical entities generated by different methods (%)

点状地理实体 线状地理实体 面状地理实体
手绘图 97.48 74.74 74.39
导览图 100 62.20 58.47

6 结论与展望

本文对自然语言描述的地理实体的符号表达方法进行了研究,主要成果如下:
(1)通过对地理实体形态描述的特点进行总结归纳,将其分为形状描述、尺寸描述、颜色描述和方向(走向)描述4大类,同时分析了形态描述的语义模糊性和缺失性;
(2)提出了自然语言形态描述驱动的地理实体符号模拟表达策略,对不同形态特征组合和不同语义模糊度的地理实体进行了符号实例设计;
(3)最后将基于颐和园场景描述中的地理实体表达结果与对应的手绘认知地图和真实导览图进行比较,提出了点、线、面3类地理实体的相似性计算方法。实验表明,点状地理实体、线状地理实体和面状地理实体的相似度依次降低,分析可知表达效果明显受限于地理实体描述文本。此外,与手绘图的相似度高于导览图,说明基于自然语言的空间认知具有共性。
总体来说,根据自然语言中的地理实体形态描述实现地图符号的近似表达符合人的认知习惯,有一定科学根据和可行性,为自然语言描述的地理实体转换为地图中地理实体符号的表达提供了解决方案。未来的研究将进一步优化基于自然语言空间关系描述的地理实体空间位置表达和基于自然语言场景描述的地图自动生成方法。
[1]
毛赞猷 . 新编地图学教程(第二版)[M]. 北京: 高等教育出版社, 2008: 158-169.

[ Mao Z Y. New cartography course 2th ed[M]. Beijing: Higher Education Press, 2008: 158-169. ]

[2]
Bertin J . Remarques sur l'expression graphique[J]. études Rurales, 1967,27(27):63-71.

[3]
徐智勇, 艾廷华, 危拥军 . 三维地图符号视觉参量研究[J]. 武汉大学学报·信息科学版, 2006,31(6):557-560.

[ Xu Z Y, Ai T H, Wei Y J . On visual variables of 3D map symbols[J]. Geomatics and Information Science of Wuhan University, 2006,31(6):557-560. ]

[4]
曹亚妮, 江南, 张亚军 . 电子地图符号构成变量及其生成模式[J]. 测绘学报, 2012,41(5):784-790.

[ Cao Y N, Jiang N, Zhang Y J . Constitution variables and generation models of electronic map symbols[J]. Acta Geodaetica et Cartographics Sinica, 2012,41(5):784-790. ]

[5]
卢瑞, 贾奋励, 田江鹏 等. 意象图式在地图符号结构生成中的应用研究[J]. 地球信息科学学报, 2016,18(6):758-766.

DOI

[ Lu R, Jia F L, Tian J P , et al. The application of image schema in the generation of map symbols[J]. Journal of Geo-information Science, 2016,18(6):758-766. ]

[6]
车森, 孙群, 刘海砚 . 参数控制的地图符号编辑器设计[J]. 武汉大学学报·信息科学版, 2013,38(11):1326-1329.

[ Che S, Sun Q, Liu H Y . Design of a parameter controlling symbol editing tool[J]. Geomatics and Information Science of Wuhan University, 2013,38(11):1326-1329. ]

[7]
卢瑞, 宋国民, 贾奋励 . 基于符号结构素的地图符号自动生成方法[J]. 测绘与空间地理信息, 2016,39(3):13-16.

[ Lu R, Song G M, Jia F L . Method of the automatic generation of map symbols based on structural elements[J]. Geomatics & Spatial Information Technology, 2016,39(3):13-16. ]

[8]
Landau B . Spatial language and spatial cognition[J]. Bridges between psychology and linguistics: A Swarthmore festschrift for Lila Gleitman, 1991: 145.

[9]
Suchan T A, Brewer C A . Qualitative methods for research on mapmaking and map use[J]. Professional Geographer, 2000,52(1):145-154.

[10]
胡最, 闫浩文 . 地图符号的语言学机制及其应用研究[J]. 地理与地理信息科学, 2008,24(1):17-20.

[ Hu Z, Yan H W . Analysis on linguistics mechanism for cartographic symbols and its application[J]. Geography and Geo-information Science, 2008,24(1):17-20. ]

[11]
苏艳军, 王英杰, 罗斌 . 新型网络地图符号概念模型及其描述体系[J]. 地球信息科学学报, 2009,11(6):839-844.

[ Su Y J, Wang Y J, Luo B . A new conceptual model and it`s describing system of internet map symbol[J]. Journal of Geo-information Science, 2009,11(6):839-844. ]

[12]
张金禄, 王英杰, 余卓渊 . 自适应地图符号模型与原型系统的实现[J]. 地球信息科学学报, 2009,11(4):468-474.

[ Zhang J L, Wang Y J, Yu Z Y . A research for the model of the adaptive map symbol[J]. Journal of Geo-information Science, 2009,11(4):468-474. ]

[13]
田江鹏, 贾奋励, 夏青 . 语义驱动的层次化地图符号设计方法[J]. 地球信息科学学报, 2012,14(6):736-743.

DOI

[ Tian J P, Jia F L, Xia Q . Design method of the semantic-driven hierarchical map symbols[J]. Journal of Geo-information Science, 2012,14(6):736-743. ]

[14]
田江鹏, 贾奋励, 夏青 . 依托语言学方法论的三维符号设计[J]. 测绘学报. 2013,42(1):131-137.

[ Tian J P, Jia F L, Xia Q . Research on 3D symbol design based on linguistic methodology[J]. Acta Geodaetica et Cartographics Sinica, 2013,42(1):131-137. ]

[15]
李伟, 陈毓芬, 钱凌韬 . 语言学的个性化地图符号设计[J]. 测绘学报 2015,44(3):323-329.

DOI

[ Li W, Chen Y F, Qian L T . Personalized map symbol design mechanism based on linguistics[J]. Acta Geodaetica et Cartographics Sinica, 2015,44(3):323-329. ]

[16]
Beshentsev A N . Informational properties of symbol color and shape and the language of the map[J]. Mapping Sciences and Remote Sensing, 1997,34(1):14-16.

[17]
(英) 基茨J S . 地图设计与生产[M]. 林言成等,译. 北京: 测绘出版社, 1983: 11-18.

[ (UK) Keats J S . Map design and production[M]. Lin Y C,et al,translation. Beijing: Publishing House of Surveying and Mapping, 1983: 11-18. ]

[18]
(美) 罗宾逊A H, 赛尔R D, 莫里逊J L. 地图学原理第5版[M]. 李道义,刘耀珍,译. 1989: 121-122.

[ ( US) Robinson A H, Xaar R D, Morrison J L . Elements of cartography5th ed[M]. Li D Y, Liu Y Z, translation. Beijing: Publishing House of Surveying and Mapping, 1989: 121-122. ]

[19]
陈毓芬 . 地图符号的视觉变量[J]. 测绘科学技术学报. 1995(2):145-148.

[ Chen Y F . Visual variable for map symbol[J]. Journal of Geomatics Science and Technology, 1995(2):145-148. ]

[20]
马耀峰 . 专题地图符号构成元素的研究[J]. 地理研究, 1997(3):23-31.

[ Ma Y F . A study on the symbolic constitution elements of thematic map[J]. Geographical Research, 1997(3):23-31. ]

[21]
蔡孟裔, 毛赞猷, 周良 . 新编地图学教程[M]. 北京: 高等教育出版社, 2000: 164-167.

[ Cai M Y, Mao Z Y, Zhou L. New cartography course[M]. Beijing: Higher Education Press, 2000: 164-167. ]

[22]
陈毓芬, 江南 . 地图设计原理[M]. 北京: 解放军出版社, 2001: 26-27.

[ Chen Y F, Jiang N. Map design principle[M]. Beijing: The People's Liberation Army Press, 2001: 26-27. ]

[23]
祝国瑞, 郭礼珍, 尹贡白 . 地图设计与编绘[M]. 武汉: 武汉大学出版社, 2001: 42-43.

[ Zhu G R, Guo L Z, Yin G B. Map design and editing[M]. Wuhan: Wuhan University Press, 2001: 42-43. ]

[24]
廖克 . 现代地图学[M]. 北京: 科学出版社, 2003: 108.

[ Liao K. Modern Cartography[M]. Beijing: Science Press, 2003: 108. ]

[25]
祝国瑞 . 地图学[M]. 武汉: 武汉大学出版社, 2004: 110-112

[ Zhu G R. Cartography[M]. Wuhan: Wuhan University Press, 2004: 110-112.]

[26]
马耀峰 . 地图学原理[M]. 北京: 科学出版社, 2004: 78-82.

[ Ma Y F. Elements of cartography[M]. Beijing: Science Press, 2004: 78-82. ]

[27]
凌善金, 王晓铃, 丁园园 . 静态地图符号视觉变量的分类及作用[J]. 安徽师范大学学报(自科版), 2017,40(1):69-76.

[ Ling S J, Wang X L, Ding Y Y . Classification and function of the visual variables of static map symbol[J]. Journal of Anhui Normal University(Natural Science). 2017,40(1):69-76. ]

[28]
曹青, 洪必文, 张翎 . 基于自然语言空间关系描述的地图近似表达方法[J]. 地球信息科学学报, 2018,20(11):5-13.

[ Cao Q, Hong B W, Zhang L . Map approximate expression method based on spatial relationship description in natural language[J]. Journal of Geo-information Science. 2018,20(11):5-13. ]

文章导航

/