基于自然语言形态描述的地理实体模拟表达方法
洪必文(1996-),女,硕士生,湖北武汉人,主要从事空间认知与地图可视化。E-mail:840456645@qq.com |
收稿日期: 2019-02-27
要求修回日期: 2019-07-05
网络出版日期: 2019-10-29
基金资助
国家自然科学基金项目(41571382)
国家自然科学基金项目(61472191)
江苏省高校自然科学研究重大项目(15KJA420001)
版权
Simulated Expression of Geographical Entities based on Morphology Description by Natural Language
Received date: 2019-02-27
Request revised date: 2019-07-05
Online published: 2019-10-29
Supported by
National Natural Science Foundation of China(41571382)
National Natural Science Foundation of China(61472191)
College Natural Science Research Key Program of Jiang Su Province(15KJA420001)
Copyright
日常生活中人们使用定性的自然语言描述地理实体,如何将定性描述的地理实体转换为定量的图形符号是空间认知、地图表达等领域面临的挑战。本文提出一种基于自然语言形态描述的地理实体表达方法,通过对自然语言中地理实体的语义信息进行分析,对自然语言描述的地理实体的形状、大小、分布状况等空间形态信息以地图形式进行近似表达。本文首先阐述了自然语言形态描述的定义与内涵,结合地图符号相关理论,研究了形态描述驱动的地理实体模拟表达策略,并对不同语义模糊度的地理实体图形表达进行了分析和实例设计,最后提出了一种计算空间实体相似性的方法对表达效果进行评估。结果表明,基于本文方法的地理实体模拟表达与手绘图中地理实体的平均相似度达到89.5%,与导览图的地理实体平均相似度达到86.86%,能够实现较好的表达效果,具有一定的科学性和可行性,为自然语言到地图语言的转换研究奠定了基础。
洪必文 , 曹青 , 张翎 , 龙毅 , 寇萱 . 基于自然语言形态描述的地理实体模拟表达方法[J]. 地球信息科学学报, 2019 , 21(10) : 1491 -1501 . DOI: 10.12082/dqxxkx.2019.190083
Natural language and maps both have the ability to express geospatial information. Compared with maps, natural language is more abstractive and acceptable to people. But a map has irreplaceable advantages to show the spatial morphological characteristics of geographic entities intuitively. The description of geographic entities in natural language is usually not completely quantitative. Except for limited quantitative descriptions of distances and sizes, there are likely also qualitative descriptions of colors, shapes, and etc. Transforming spatial information described by natural language to maps can release the burden of working memory and promote discovery, inference, and insight. Yet, it remains a challenge in the fields of spatial cognition and map symbols regarding how to convert qualitatively described geographic entities in natural language, which are usually fuzzy or semantics missing, into quantitative graphical symbols. In recent studies on "natural language to map", simple geometrical shapes and common icons were used to express geographic entities. However, much information of geographic entities, which represents the spatial cognition results of human to a certain extent, are lost. This paper proposed a method of geographic entity expression based on morphological description by natural language. By analyzing the semantic information of geographic entities described in natural language, the spatial shape information (e.g., shape, size, and distribution of geographical entities) and other properties necessary for entity expression (e.g., color) were approximately expressed in the form of map. First, the definition and connotation of natural language morphological description were introduced, and the classifications of morphological description and semantic fuzziness were given. Second, combined with the map symbol theory, the morphological description-driven geographic entity simulation expression strategies were studied. Five strategies were proposed for shape, size, color, orientation, and combination. Third, the geographic entity simulated expression with different semantic ambiguity was analyzed and designed, including geographic entity symbol design for single morphological type and different morphological types. Finally, an experiment was implemented for evaluating the validity and quality of the simulated expression of geographic entities. The experiment took Yihe Park, Beijing, China as an example and its tour commentary was applied to convert to a map. In addition, an evaluation method of spatial entity similarity was applied to assess the converted map. Our findings suggest that the graphic design method of this paper can achieve better expression results and has the potential of facilitating better conversion from natural language to maps.
表1 地理实体形态描述的语义缺失情况划分Tab. 1 Division of semantic deficiency of geographical entity morphological descriptions |
模糊性等级 | 语义信息丰富程度 | 地理实体几何形态描述模式 | 示例 |
---|---|---|---|
一级 | 很低 | O | 南京师范大学 |
二级 | 较低 | O+S | 椭圆形花坛 |
O+M | 小路 | ||
O+C | 白色小亭 | ||
O+D | 河流从西向东流动 | ||
三级 | 低 | O+S+M | 巨大矩形建筑物 |
O+S+C | 海南的高速公路像一条银色绸缎 | ||
O+S+D | 河流从南向北弯曲 | ||
O+M+C | 翠绿的大草坪 | ||
O+M+D | 小溪从东向南流淌 | ||
O+C+D | 海南的高速公路像一条银色绸缎,自西向东延伸 | ||
四级 | 较高 | O+S+M+C | 贝尔湖湖色蔚蓝,湖水荡漾,湖形椭圆,湖水长约33 km,宽20 km,面积600多km2 |
O+S+M+D | 万里长城自西南向东北蜿蜓于山脊上,宛如苍龙 | ||
O+S+C+D | 弯曲的山路像褐色的长蟒,自西向北延伸 | ||
O+M+C+D | 一条小河,银波泛泛,自东南向西北蜿蜒流去 | ||
五级 | 高 | O+S+M+C+D | 这条小路长100 m,宽10 m,从西向东弯曲,像一条灰白色的带子 |
注:O表示地理实体,S表示形状描述,M表示尺寸描述,C表示颜色描述,D表示方向描述。 |
表2 语义色彩表(部分)Tab. 2 Color table of semantic information (part) |
色彩描述 | 直观颜色 | RGB |
---|---|---|
月牙泉宛若一颗绿宝石 | 宝石绿 | 34,177,76 |
公路如银丝带般缠绕在山间 | 银色 | 192,192,192 |
巍巍高山,郁郁葱葱 | 葱绿色 | 18,140,70 |
滔滔江水,碧波万顷 | 碧绿色 | 110,166,71 |
表3 不同形态描述驱动的地理实体符号设计实例Tab. 3 Geography entity symbol design examples driven by different morphological descriptions |
形态描述类型 | 实体类型 | 描述示例 | 参数设计 | 符号设计 | ||
---|---|---|---|---|---|---|
形状描述 | A类 | 点 | 山峰 | 圆锥形的山峰峰峰相连 | ![]() | ![]() |
线 | 河流 | “几”字型的黄河 | ![]() | ![]() | ||
长江的形状像“W” | ![]() | |||||
面 | 湖泊 | 贝尔湖湖形椭圆 | ![]() | |||
V字形的湖泊 | ![]() | |||||
B类 | 点 | 山峰 | 尖刀似的小山 | ![]() | ![]() | |
石山 | 这座小石山像一个瓜葫芦 | ![]() | ![]() | |||
线 | 石桥 | 如彩虹的天然石桥 | ![]() | ![]() | ||
面 | 湖泊 | 洪泽湖是横放的三叶草 | ![]() | ![]() | ||
C类 | 点 | 亭 | 中间是留佳亭 | ![]() | ![]() | |
点 | 门 | 邀月门在东边 | ![]() | ![]() | ||
线 | 河流 | 弯弯曲曲的河流、河水曲折婉蜒 | ![]() | ![]() | ||
尺寸描述 | A类 | 线 | 道路 | 这条小路只能通过一辆小汽车 | 路宽:3 m | ![]() |
这条路是双向6车道 | 路宽:24 m | ![]() | ||||
B类 | 面 | 房子 | 矩形的小房子 | 尺寸:小 | ![]() | |
矩形的大房子 | 尺寸:大 | ![]() | ||||
颜色描述 | A类 | 点 | 灯塔 | 一座象牙白的灯塔亭亭玉立 | RGB:235, 229, 209 | ![]() |
线 | 道路 | 海南的高速公路,就像绿色大海当中穿梭的一条银色绸缎 | RGB:192, 192, 192 | ![]() | ||
面 | 草坪 | 嫩绿的草坪 | RGB:55, 116, 13 | ![]() | ||
B类 | 线 | 江 | 滔滔江水,碧波万顷 | RGB:66, 171, 145 | ![]() | |
面 | 泉 | 月牙泉如一颗绿宝石 | RGB:0, 152, 16 | ![]() | ||
方向描述 | 走向描述 | 线 | 溪 | 大溪从西向东弯曲 | ![]() | ![]() |
道路 | 道路自东北向西南延伸 | ![]() | ![]() |
表4 不同语义模糊度的地理实体符号设计实例Tab. 4 Geography entity symbol design examples of different semantic ambiguity levels |
地理 实体 | 默认设计 参数 | 默认 符号 | 自然语言 描述示例 | 形态描述 模式 | 模糊性 | 符号的 唯一性 | 组合参数 设计 | 设计参数 说明 |
---|---|---|---|---|---|---|---|---|
山 | 形状:等腰三角形 尺寸:中 颜色:青绿色(RGB:141,193,130) | ![]() | 山峰 | O | 一级 | 一级 | ![]() | 形状:默认 尺寸:默认 颜色:默认 |
高山 | O+M | 二级 | 二级 | ![]() | 形状:默认 尺寸:大 颜色:默认 | |||
远远望去,一座圆锥形山峰高耸入云 | O+S+M | 三级 | 三级 | ![]() | 形状:圆锥 尺寸:大 颜色:默认 | |||
远远望去,一座座山峰高耸入云,连绵不断,山上郁郁葱葱 | O+S+ M+C | 四级 | 四级 | ![]() | 形状:圆锥形、连绵不断 尺寸:大 颜色:葱绿(RGB:18,140,70) | |||
河流 | 形状:简单弧线 尺寸:中 颜色:海水蓝(RGB:40,150,200) 方向(走向):东西 | ![]() | 河流 | O | 一级 | 一级 | ![]() | 形状:默认 尺寸:默认 颜色:默认 走向:默认 |
弯曲的河流 | O+S | 二级 | 二级 | ![]() | 形状:弯曲 尺寸:默认 颜色:默认 走向:默认 | |||
弯曲的大河 | O+S+M | 三级 | 三级 | ![]() | 形状:弯曲 尺寸:大 颜色:默认 走向:默认 | |||
弯曲的大河清澈见底,河水像一张碧绿的玻璃纸 | O+S+M+C | 四级 | 四级 | ![]() | 形状:弯曲 尺寸:大 颜色:碧绿(RGB:110,166,71) 走向:默认 | |||
弯曲的大河,碧波荡漾,自东北向西南蜿蜒流去 | O+S+M+C+D | 五级 | 五级 | 形状:弯曲 尺寸:大 颜色:碧绿(RGB:110,166,71) 走向:东北向西南 | ||||
湖泊 | 形状:椭圆 尺寸:中 颜色:湖水蓝(RGB:153,196,233) | 湖泊 | O | 一级 | 一级 | 形状:默认 尺寸:默认 颜色:默认 | ||
月牙形湖泊 | O+M | 二级 | 二级 | 形状:月牙形 尺寸:默认 颜色:默认 | ||||
月牙形小湖 | O+S+M | 三级 | 三级 | 形状:月牙形 尺寸:小 颜色:默认 | ||||
月牙泉从高空望去像是洒在鸣沙山上的一颗绿宝石 | O+S+M+C | 四级 | 四级 | ![]() | 形状:月牙形 尺寸:小 颜色:宝石绿(RGB:34,177,76) |
[1] |
毛赞猷 . 新编地图学教程(第二版)[M]. 北京: 高等教育出版社, 2008: 158-169.
[
|
[2] |
|
[3] |
徐智勇, 艾廷华, 危拥军 . 三维地图符号视觉参量研究[J]. 武汉大学学报·信息科学版, 2006,31(6):557-560.
[
|
[4] |
曹亚妮, 江南, 张亚军 . 电子地图符号构成变量及其生成模式[J]. 测绘学报, 2012,41(5):784-790.
[
|
[5] |
卢瑞, 贾奋励, 田江鹏 等. 意象图式在地图符号结构生成中的应用研究[J]. 地球信息科学学报, 2016,18(6):758-766.
[
|
[6] |
车森, 孙群, 刘海砚 . 参数控制的地图符号编辑器设计[J]. 武汉大学学报·信息科学版, 2013,38(11):1326-1329.
[
|
[7] |
卢瑞, 宋国民, 贾奋励 . 基于符号结构素的地图符号自动生成方法[J]. 测绘与空间地理信息, 2016,39(3):13-16.
[
|
[8] |
|
[9] |
|
[10] |
胡最, 闫浩文 . 地图符号的语言学机制及其应用研究[J]. 地理与地理信息科学, 2008,24(1):17-20.
[
|
[11] |
苏艳军, 王英杰, 罗斌 . 新型网络地图符号概念模型及其描述体系[J]. 地球信息科学学报, 2009,11(6):839-844.
[
|
[12] |
张金禄, 王英杰, 余卓渊 . 自适应地图符号模型与原型系统的实现[J]. 地球信息科学学报, 2009,11(4):468-474.
[
|
[13] |
田江鹏, 贾奋励, 夏青 . 语义驱动的层次化地图符号设计方法[J]. 地球信息科学学报, 2012,14(6):736-743.
[
|
[14] |
田江鹏, 贾奋励, 夏青 . 依托语言学方法论的三维符号设计[J]. 测绘学报. 2013,42(1):131-137.
[
|
[15] |
李伟, 陈毓芬, 钱凌韬 . 语言学的个性化地图符号设计[J]. 测绘学报 2015,44(3):323-329.
[
|
[16] |
|
[17] |
(英) 基茨J S . 地图设计与生产[M]. 林言成等,译. 北京: 测绘出版社, 1983: 11-18.
[ (UK)
|
[18] |
(美) 罗宾逊A H, 赛尔R D, 莫里逊J L. 地图学原理第5版[M]. 李道义,刘耀珍,译. 1989: 121-122.
[ ( US)
|
[19] |
陈毓芬 . 地图符号的视觉变量[J]. 测绘科学技术学报. 1995(2):145-148.
[
|
[20] |
马耀峰 . 专题地图符号构成元素的研究[J]. 地理研究, 1997(3):23-31.
[
|
[21] |
蔡孟裔, 毛赞猷, 周良 . 新编地图学教程[M]. 北京: 高等教育出版社, 2000: 164-167.
[
|
[22] |
陈毓芬, 江南 . 地图设计原理[M]. 北京: 解放军出版社, 2001: 26-27.
[
|
[23] |
祝国瑞, 郭礼珍, 尹贡白 . 地图设计与编绘[M]. 武汉: 武汉大学出版社, 2001: 42-43.
[
|
[24] |
廖克 . 现代地图学[M]. 北京: 科学出版社, 2003: 108.
[
|
[25] |
祝国瑞 . 地图学[M]. 武汉: 武汉大学出版社, 2004: 110-112
[
|
[26] |
马耀峰 . 地图学原理[M]. 北京: 科学出版社, 2004: 78-82.
[
|
[27] |
凌善金, 王晓铃, 丁园园 . 静态地图符号视觉变量的分类及作用[J]. 安徽师范大学学报(自科版), 2017,40(1):69-76.
[
|
[28] |
曹青, 洪必文, 张翎 . 基于自然语言空间关系描述的地图近似表达方法[J]. 地球信息科学学报, 2018,20(11):5-13.
[
|
/
〈 |
|
〉 |