地球信息科学学报 ›› 2020, Vol. 22 ›› Issue (7): 1476-1486.doi: 10.12082/dqxxkx.2020.190565
刘俊楠1(), 刘海砚1(
), 陈晓慧1, 郭漩2, 郭文月2, 朱新铭1, 赵清波1
收稿日期:
2019-09-30
修回日期:
2019-12-18
出版日期:
2020-07-25
发布日期:
2020-09-25
通讯作者:
刘海砚
E-mail:6929423@qq.com;liu2000@vip.sina.com
作者简介:
刘俊楠(1991— ),男,辽宁锦州人,博士生,主要从事时空数据挖掘与知识图谱相关研究。E-mail:基金资助:
LIU Junnan1(), LIU Haiyan1(
), CHEN Xiaohui1, GUO Xuan2, GUO Wenyue2, ZHU Xinming1, ZHAO Qingbo1
Received:
2019-09-30
Revised:
2019-12-18
Online:
2020-07-25
Published:
2020-09-25
Contact:
LIU Haiyan
E-mail:6929423@qq.com;liu2000@vip.sina.com
Supported by:
摘要:
知识图谱广泛应用于人工智能领域,基于此融合多源地理空间数据并表示地理事物的语义和时空信息,实现“数据—知识”的转换成为人们关注的热点。但现有通用知识图谱的空间知识覆盖度低且存在错误,同时基于维基百科构建的地理知识图谱存在空间关系、中文属性和坐标信息等属性缺失问题。因此本文以地理空间数据和百度百科数据的特征分析为基础,提出了以地理空间数据提取地理实体为主,百度百科补充属性信息为辅的知识图谱构建方式。① 基于GeoSparql设计模式层的地理实体、要素、几何形状和空间关系的逻辑关系;② 通过地理实体提取、实体链接和属性信息填充,在数据层实现空间知识融合;③ 结合关系型数据库和图数据库,设计空间知识存储方式;④ 在实体和关系2个方面定量分析知识图谱的构建规模。结果表明,本文构建的知识图谱中地理实体覆盖度和链接百科成功率相对较高,扩充了地理实体的概念描述信息,并将地理坐标的覆盖率提高到100%,对地理数据到地理知识的拓展具有重要意义。
刘俊楠, 刘海砚, 陈晓慧, 郭漩, 郭文月, 朱新铭, 赵清波. 面向多源地理空间数据的知识图谱构建[J]. 地球信息科学学报, 2020, 22(7): 1476-1486.DOI:10.12082/dqxxkx.2020.190565
LIU Junnan, LIU Haiyan, CHEN Xiaohui, GUO Xuan, GUO Wenyue, ZHU Xinming, ZHAO Qingbo. The Construction of Knowledge Graph Towards Multi-Source Geospatial Data[J]. Journal of Geo-information Science, 2020, 22(7): 1476-1486.DOI:10.12082/dqxxkx.2020.190565
表3
知识图谱规模"
桥 | 汽车站 | 机场 | 火车站 | 服务区 | 铁路 | 国道 | 高速公路 | 省 | 市 | 合计/个 | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
要素数目/个 | 180 168 | 12 250 | 579 | 9538 | 7115 | 549 | 797 929 | 623 285 | 32 | 371 | 1 631 816 | ||||
实体数目/个 | 87 481 | 11 881 | 378 | 9050 | 2321 | 548 | 10 213 | 4365 | 32 | 371 | 126 640 | ||||
链接数目/个 | 3306 | 717 | 208 | 7006 | 113 | 347 | 2720 | 598 | 32 | 371 | 15 418 | ||||
链接比率/% | 3.78 | 6.03 | 55.03 | 77.41 | 4.87 | 63.32 | 26.63 | 13.70 | 100.00 | 100.00 | 12.17 | ||||
点实体链接比率/% | 10.22 | 线实体链接比率/% | 24.23 | 面实体链接比率/% | 100 |
表4
百度百科的概念标签统计"
数据 类型 | 标签 总数 | 标签1 | 标签2 | 标签3 | 标签4 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
类型 | 数目 | 类型 | 数目 | 类型 | 数目 | 类型 | 数目 | |||||||
桥 | 3306 | 建筑 | 1840 | 地理 | 1193 | 地点 | 1168 | 社会 | 154 | |||||
汽车站 | 717 | 车站 | 491 | 地点 | 368 | 交通设施 | 279 | 社会 | 245 | |||||
机场 | 208 | 机场 | 183 | 地点 | 159 | 交通设施 | 88 | 交通 | 86 | |||||
火车站 | 7006 | 车站 | 5695 | 交通设施 | 3960 | 地点 | 3064 | 交通 | 2059 | |||||
服务区 | 113 | 地理 | 38 | 地点 | 31 | 组织机构 | 25 | 公司 | 21 | |||||
铁路 | 347 | 交通线路 | 147 | 车站 | 78 | 地点 | 75 | 交通 | 64 | |||||
国道 | 2720 | 地点 | 396 | 地理 | 321 | 街区路 | 209 | 交通线路 | 112 | |||||
高速 | 598 | 地点 | 331 | 交通线路 | 297 | 街区路 | 221 | 交通 | 103 | |||||
省 | 32 | 行政区划 | 21 | 城市 | 3 | 自然地理 | 1 | 历史 | 1 | |||||
市 | 371 | 城市 | 153 | 行政区划 | 65 | 地点 | 61 | 地理 | 41 | |||||
提取标签类型合计 | 212 | 提取标签关系合计 | 33 322 | 补充标签关系合计 | 23 847 |
[1] | 漆桂林, 高桓, 吴天星. 知识图谱研究进展[J]. 情报工程, 2017,3(1):4-25. |
[ Qi G L, Gao H, Wu T X. The research advances of knowledge graph[J]. Technology Intelligence Engineering, 2017,3(1):4-25. ] | |
[2] | 徐冠华. 全社会要高度关注“数字地球”[J]. 中国测绘, 1999,3:6-7. |
[ Xu G H. Pay attention to "Digital Earth"[J]. China Surveying and Mapping, 1999(3):6-7. ] | |
[3] | Hahmann S, Burghardt D. How much information is geospatially referenced? Networks and cognition[J]. International Journal of Geographical Information Science Ijgis, 2013,27(6):1171-89. |
[4] | Aloteibi S, Sanderson M. Analyzing geographic query reformulation: An exploratory study[J]. Journal of the American Society for Information Science & Technology, 2014,65(1):13-24. |
[5] | 马雷雷. 空间关系本体描述与推理机制研究[D]. 郑州:解放军信息工程大学, 2012. |
[ Ma L L. Research on spatial relatioin ontology description and reasoning mechanism[D]. ZhengZhou: Information Engineering University, 2012. ] | |
[6] | Auer S, Bizer C, Kobilarov G, et al. DBpedia: A nucleus for a web of open data[C]. Proceedings of the Semantic Web, 6th International Semantic Web Conference, 2nd Asian Semantic Web Conference, ISWC 2007+ASWC 2007, Busan, Korea, November 11-15, 2007, 2007. |
[7] | Zeng Y, Wang D S, Zhang T L. CASIA-KB: A multi-source Chinese semantic knowledge base built from structured and unstructured Web data[C]. Proceedings of the Joint International Semantic Technology Conference, F, 2013. |
[8] | Sester M, Arsanjani J J, Klammer R, et al. Integrating and generalising volunteered geographic information[M]// Abstracting geographic information in a data rich world.Springer, Cham, 2014:119-155. |
[9] | Lehmann J, Hellmann S. Linked GeoData: Adding a spatial dimension to the web of data[C]. Proceedings of the International Semantic Web Conference,F, 2009. |
[10] | Ballatore A, Wilson D C. Geographic knowledge extraction and semantic similarity in OpenStreetMap[J]. Knowledge & Information Systems, 2013,37(1):61-81. |
[11] | Hu W, Li H, Sun Z, et al. Clinga: Bringing Chinese physical and human geography in linked open data[C]// International Semantic Web Conference. Springer, Cham, 2016:104-112. |
[12] |
Hoffart J, Suchanek F M, Berberich K, et al. YAGO2: A spatially and temporally enhanced knowledge base from Wikipedia[J]. Artificial Intelligence, 2013,194:28-61.
doi: 10.1016/j.artint.2012.06.001 |
[13] | Chen J, Deng S, Chen H. Crowdgeokg: Crowdsourced geo-knowledge graph, Proceedings of the China Conference on Knowledge Graph and Semantic Computing, 2017[C]. Springer. |
[14] | Zeng Y, Hao H, Xu B. Entity conceptualization and understanding based on web-scale knowledge bases[C]// 2013 IEEE International Conference on Systems, Man, and Cybernetics, IEEE, 2013:3500-3504. |
[15] |
高嘉良, 余丽, 仇培元, 等. 基于通用知识库的地理实体开放关系过滤方法[J]. 地球信息科学学报, 2019,21(9):1392-1401.
doi: 10.12082/dqxxkx.2019.190005 |
[ Gao J L, Yu L, Chou P Y, et al. A Knowledge-based method for filtering geo-entity relations[J]. Journal of Geo-Information Science, 2019,21(9):1392-1401. ] | |
[16] |
陆锋, 余丽, 仇培元, 等. 论地理知识图谱[J]. 地球信息科学学报, 2017,19(6):723-34.
doi: 10.3724/SP.J.1047.2017.00723 |
[ Lu F, Yu L, Chou P Y, et al. On geographic knowledge graph[J]. Journal of Geo-Information Science, 2017,19(6):723-34. ] | |
[17] | 刘瑜, 龚咏喜, 张晶, 等. 地理空间中的空间关系表达和推理[J]. 地理与地理信息科学, 2007,23(5):1-7. |
[ Liu Y, Gong Y X, Zhang J, et al. Representation and Reasoning of Spatial Relations in Geographical Space[J]. Journal of Geo-Information Science, 2007,23(5):1-7. ] | |
[18] | 陈晓慧. 地理空间情报知识图谱构建方法与技术研究[D]. 郑州:解放军信息工程大学, 2016. |
[ Chen X H. Research on construction and technology of geospatial intelligence knowledge Graph[D]. Zhengzhou: Information Engineering University, 2016. ] | |
[19] | Clementini E, Sharma J, Egenhofer M J. Modelling topological spatial relations: Strategies for query processing[J]. Computers & graphics, 1994,18(6):815-822. |
[20] | 张雪英, 张春菊, 杜超利. 空间关系词汇与地理实体要素类型的语义约束关系构建方法[J]. 武汉大学学报·信息科学版, 2012,37(11):1266-1270. |
[ Zhang X Y, Zhang C J, Du C L. Semantic relation between spatial relation terms and feature types of geographical entities[J]. Geomatics and Information Science of Wuhan University, 2012,37(11):1266-1270. ] | |
[21] | 李晓轩. 面向制图综合的道路信息表达研究与实践[D]. 郑州:解放军信息工程大学, 2010. |
[ Li X X. Study and practice on road information's expression for map generalization[D]. Zhengzhou: Information Engineering University, 2010. ] | |
[22] |
王东旭, 诸云强, 潘鹏, 等. 地理数据空间本体构建及其在数据检索中的应用[J]. 地球信息科学学报, 2016,18(4):443-52.
doi: 10.3724/SP.J.1047.2016.00443 |
[ Wang D X, Zhu Y Q, Pan P, et al. Construction of geodata spatial ontology and its application in data retrieva[J]. Journal of Geo-information Science, 2016,18(4):443-52. ] | |
[23] |
Huang W, Mansourian A, Abdolmajidi E, et al. Synchronising geometric representations for map mashups using relative positioning and Linked Data[J]. International Journal of Geographical Information Science, 2018,22:1-21.
doi: 10.1080/13658810701806481 |
[24] | Clementini E, Sharma J, Egenhofer M J. Modelling topological spatial relations: Strategies for query processing[J]. Computers & Graphics, 1994,18(6):815-22. |
[25] | Goyal R K, Egenhofer M J. Similarity assessment for cardinal directions between extended spatial objects[D]. In Spatial Information Science and Engineering, University of Maine, 2000. |
[1] | 李锐, 石佳豪, 董广胜, 刘朝辉. 多粒度时空对象组成结构表达研究[J]. 地球信息科学学报, 2021, 23(1): 113-123. |
[2] | 陈文静, 李锐, 董广胜, 李江. 网络地理信息服务中用户空间访问聚集行为研究[J]. 地球信息科学学报, 2021, 23(1): 93-103. |
[3] | 王志华, 杨晓梅, 周成虎. 面向遥感大数据的地学知识图谱构想[J]. 地球信息科学学报, 2021, 23(1): 16-28. |
[4] | 黄娟, 陈崇成, 叶晓燕, 马腾. “民国清流”名人文化主题数据的组织和可视化方法[J]. 地球信息科学学报, 2020, 22(5): 954-966. |
[5] | 王春, 徐燕, 江岭, 赵明伟. 规则格网DEM局地坡面凸凹性精度分析[J]. 地球信息科学学报, 2020, 22(3): 361-369. |
[6] | 黄楠, 杨昕, 刘海龙. 基于等高线空间关系的鞍部点提取方法[J]. 地球信息科学学报, 2020, 22(3): 410-421. |
[7] | 胡金龙, 唐梦鸽, 罗明良, 魏兰, 晏自红, 秦子晗. 基于DEM的一体化山地特征要素提取[J]. 地球信息科学学报, 2020, 22(3): 422-430. |
[8] | 周佳, 赵亚鹏, 岳天祥, 卢涛. 结合HASM和GWR方法的省级尺度近地表气温估算[J]. 地球信息科学学报, 2020, 22(10): 2098-2107. |
[9] | 高嘉良,余丽,仇培元,陆锋. 基于通用知识库的地理实体开放关系过滤方法[J]. 地球信息科学学报, 2019, 21(9): 1392-1401. |
[10] | 刘菊, 陈璨, 许珺. 基于众包的古琴名人时空信息采集与移动轨迹时空分析[J]. 地球信息科学学报, 2019, 21(6): 844-853. |
[11] | 李思宇, 向隆刚, 张彩丽, 龚健雅. 基于低频出租车轨迹的城市路网交叉口提取研究[J]. 地球信息科学学报, 2019, 21(12): 1845-1854. |
[12] | 周岩, 董金玮. 陆表水体遥感监测研究进展[J]. 地球信息科学学报, 2019, 21(11): 1768-1778. |
[13] | 洪必文, 曹青, 张翎, 龙毅, 寇萱. 基于自然语言形态描述的地理实体模拟表达方法[J]. 地球信息科学学报, 2019, 21(10): 1491-1501. |
[14] | 金澄, 安晓亚, 崔海福, 赵宇君, 王惠. 矢量瓦片地图线化简算法研究[J]. 地球信息科学学报, 2019, 21(10): 1502-1509. |
[15] | 吴吉东, 王旭, 王菜林, 何鑫, 叶梦琪. 社会经济数据空间化现状与发展趋势[J]. 地球信息科学学报, 2018, 20(9): 1252-1262. |
|