地球信息科学理论与方法

基于云原生的地理空间知识库管理关键技术与服务方法研究

  • 仲腾 , 1, 2 ,
  • 张雪英 , 1, 2, * ,
  • 许沛 1, 2 ,
  • 曹敏 1, 2 ,
  • 陈碧宇 3 ,
  • 刘启亮 4 ,
  • 王曙 5 ,
  • 杨宜舟 6
展开
  • 1.南京师范大学 虚拟地理环境教育部重点实验室,南京 210023
  • 2.江苏省地理信息资源开发与利用协同创新中心,南京 210023
  • 3.武汉大学测绘 遥感信息工程国家重点实验室,武汉 430079
  • 4.中南大学地理信息系,长沙 410083
  • 5.中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室,北京 100101
  • 6.北京吉威空间信息股份有限公司,北京 100043
* 张雪英(1970— ),女,四川眉山人,教授,博士生导师,主要从事地理大数据挖掘、知识图谱和人文社会GIS 等研究。E-mail:

仲腾(1988— ),男,江苏盐城人,副教授,硕士生导师,主要研究方向为地理知识图谱与知识服务。E-mail:

Editor: 蒋树芳

收稿日期: 2024-04-02

  修回日期: 2024-08-12

  网络出版日期: 2024-09-10

基金资助

国家重点研发计划项目(2021YFB3900903)

Critical Technologies and Service Approaches for Cloud-Native Geospatial Knowledge Base Management

  • ZHONG Teng , 1, 2 ,
  • ZHANG Xueying , 1, 2, * ,
  • XU Pei 1, 2 ,
  • CAO Min 1, 2 ,
  • CHEN Biyu 3 ,
  • LIU Qiliang 4 ,
  • WANG Shu 5 ,
  • YANG Yizhou 6
Expand
  • 1. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023
  • 2. Key Laboratory of Virtual Geographic Environment (Ministry of Education), Nanjing Normal University, Nanjing 210023, China
  • 3. State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University, Wuhan 430079, China
  • 4. Department of Geo-informatics, Central South University, Changsha 410083, China
  • 5. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
  • 6. Beijing GEOWAY Software Co., Ltd., Beijing 100043, China
* ZHANG Xueying, E-mail:

Received date: 2024-04-02

  Revised date: 2024-08-12

  Online published: 2024-09-10

Supported by

National Key Research and Development Program of China(2021YFB3900903)

摘要

地理空间知识的本质在于揭示地理事物和现象的时空分布、时空变化过程及其相互作用规律。地理空间知识库管理系统(GeoKGMS)以“图-文-数”一体化的地理空间知识库引擎为核心,致力于支撑地理空间知识资源的高效汇聚、地理空间知识图谱的自动构建和一站式地理空间知识工程建设,旨在形成新一代地理信息系统(GIS)的重要基础平台。本文重点阐述了基于云原生的地理空间知识库管理关键技术,包括云原生的地理空间知识库微服务统一调度技术、人机协同的地理空间知识图谱构建技术、地理空间知识图谱时空混合编码技术、以及多模态地理空间知识存储技术。在此基础上,设计了GeoKGMS的服务框架,实现了地理空间知识库管理、多模态地理空间知识抽取、地理空间知识图谱人机协同构建、地理空间知识推理、地理空间知识图谱质量评估和地理空间知识可视化六大管理服务功能。以喀斯特地貌知识图谱为例,充分发挥机器挖掘和专家知识的优势,实现了可持续的地理空间知识图谱工程化协同共建。

本文引用格式

仲腾 , 张雪英 , 许沛 , 曹敏 , 陈碧宇 , 刘启亮 , 王曙 , 杨宜舟 . 基于云原生的地理空间知识库管理关键技术与服务方法研究[J]. 地球信息科学学报, 2024 , 26(9) : 2013 -2025 . DOI: 10.12082/dqxxkx.2024.240184

Abstract

The essence of geospatial knowledge lies in unveiling the spatiotemporal distribution, dynamics of change, and interaction patterns of geographical entities and phenomena. However, existing knowledge base management platforms often overlook the specific needs of geospatial knowledge representation and lack the capability to handle the unique attributes of geospatial data, making it challenging to meet the requirements for constructing and applying geospatial knowledge graphs. The Geospatial Knowledge Base Management System (GeoKGMS) is designed on the basis of an integrated geospatial knowledge base engine that efficiently aggregates geospatial knowledge resources across various modalities—'Image-Text-Number'—automates the construction of geospatial knowledge graphs, and facilitates a one-stop geospatial knowledge engineering process. This paper elucidates four key technologies for managing geospatial knowledge bases. First, the cloud-native geospatial knowledge base microservice unified scheduling technology decomposes the large geospatial knowledge base management system into fine-grained, independently operable, and deployable microservices. By comprehensively managing the lifecycle of the geospatial knowledge base, service classification and orchestration methods are determined to achieve unified scheduling of these microservices. Second, a human-computer collaborative geospatial knowledge graph construction method is proposed, supporting the sustainable, collaborative construction of geospatial knowledge graph engineering. Third, the spatiotemporal hybrid encoding technology of the geospatial knowledge graph achieves unified representation of geospatial knowledge by integrating multimodal geospatial data and spatiotemporal information. Fourth, a multimodal geospatial knowledge integrated storage and large-scale spatiotemporal graph partitioning technology is proposed to address the challenges of efficiently managing complex structured geospatial knowledge and retrieving large-scale spatiotemporal knowledge tuples. Based on these key technologies, an application service framework for GeoKGMS has been designed, featuring six functional modules: geospatial knowledge base management, multimodal geospatial knowledge extraction, human-computer collaborative construction of geospatial knowledge graphs, geospatial knowledge reasoning, geospatial knowledge graph quality assessment, and geospatial knowledge visualization. To demonstrate GeoKGMS's capabilities, the Karst landform knowledge graph is used as a case study. The Karst landform knowledge graph is an integrated 'Image-Text-Number' geospatial knowledge graph, constructed based on geospatial knowledge extracted from the texts, schematic diagrams, and related maps in geomorphology textbooks. Through a collaborative pipeline, geomorphology experts and computers jointly perform tasks such as mapping, alignment, supplementation, and conflict resolution of geospatial knowledge. This collaboration ultimately leads to the automated construction of the Karst landform knowledge graph by GeoKGMS. The resulting graph is highly consistent with expert knowledge models, ensuring the interpretability of knowledge-driven geocomputation and reasoning in practical applications.

1 引言

地理空间知识图谱(Geospatial Knowledge Graph, GeoKG)基于图模型对地理空间概念实体及关系进行形式化描述,能够满足机器可理解、可计算、可推理的需求[1-6]。构建地理空间知识图谱需要严格的专业性和准确性,目前的研究多采用自底向上与自顶向下相结合的构建方法[7-9]。尽管特定领域的地理空间知识图谱研究在应用上具有优势,但由于缺乏统一的表达理论,其普及度较低[10-13]。地理空间知识与地理现象或事物的演化过程密切相关,展现出显著的时空特征和地理学特点[14-16]。由于缺少统一的构建标准和规范体系,地理空间知识图谱难以在地理空间知识库管理系统中得到高效管理。尽管DBpedia System、华为云KG等知识图谱平台(Knowledge Graph Platform, KGP)提供了通用知识图谱构建、管理、更新和应用的一站式服务[17-18],这些平台未考虑地理空间知识的表达需求,缺乏处理地理空间数据特有属性(如位置、空间关系等)的能力,因此难以满足地理空间知识图谱的构建和应用需求。针对现有知识库管理系统在时空知识存储、管理和推理等方面的局限性,研制地理空间知识库管理系统并形成一套统一的地理空间知识图谱构建和管理标准,对解决地理空间知识库的创建、操作与运行管理问题显得尤为重要。
地理空间知识库管理系统继承并发展了地理空间智能研究的理论和技术,是地理空间智能系统的重要组成部分。地理空间智能研究的快速发展,一方面得益于地理科学研究范式向“一个新的知识体系为核心,以大数据的驱动系统为手段[1]”的转变,另一方面得益于云计算平台在计算、网络、存储各方面的强大能力,为空间智能系统提供了基础运行环境。在系统架构层面,云原生和微服务等技术的发展为地理空间知识图谱的构建、管理、共享服务的普及提供了优秀的解决方案。微服务架构通过将单个应用程序开发成一系列小型服务来实现,每个服务均在独立的进程中运行,并通过轻量级机制进行通信。采取云原生的方案,各个KGP服务通过自动化机制独立部署,使得KGP主要聚焦于地理空间知识图谱的构建、管理和应用。
地理空间知识库管理系统(Geospatial Knowledge Base Management System, GeoKGMS)的设计需要充分考虑多源、多模态地理空间知识的普遍性以及地理学知识的分类和表达的特殊需求。一个高效且统一的地理空间知识库管理系统将成为组织和管理地理空间知识的基础软件,并且是地理空间智能发展的重要基石。本文探讨了基于云原生的地理空间知识库管理关键技术,设计了GeoKGMS的服务框架,并以喀斯特地貌知识图谱的构建为例进行了实验验证。

2 地理空间知识库管理关键技术

2.1 基于云原生的地理空间知识库微服务统一调度技术

GeoKGMS作为“数据-知识-模式”三元组协同的地理空间智能软件系统的三大支柱之一,采用云原生技术构建系统基础架构,以应对地理空间知识库构建、管理和应用的复杂业务需求。为了实现资源弹性伸缩、充分利用云计算环境充沛的计算资源,需要将庞大的地理空间知识库管理系统合理分解为细粒度、可独立运行和部署的微服务。此外,为了协同云资源以支持复杂场景下的地理空间智能分析计算,需要将分散的地理空间知识库管理微服务合理分类,并实现微服务统一调度。通过全面把握地理空间知识库的生命周期,理清系统内部和外部接口的逻辑关系,确定服务分类和编排方法,最终形成了云原生架构下GeoKGMS的微服务管理与统一调度技术模式(图1)。
图1 云原生架构下GeoKGMS微服务管理与统一调度模式

Fig. 1 GeoKGMS service management and unified scheduling model under cloud-native architecture

云原生架构具备资源池化和弹性计算的特性,能够有效应对资源消耗不均衡等问题,确保系统的稳定运行。如图1(a)所示,GeoKGMS采用高内聚、低耦合的设计原则,将地理空间知识库管理的核心能力分解为多个小型且独立的服务单元,每个单元可以按需选择合适的技术和开发框架。更新某个微服务时,只需单独编译、构建和部署,而不会影响系统的其他部分。部署在微服务之间的服务网格(Service Mesh)和代理(Proxy)用于控制微服务的通信、监控和安全,以保障系统的健壮性和可靠性。系统通过地理空间知识库引擎管理和调用这些微服务,以提供知识库服务能力调控的管理接口。由此,系统管理员和开发者可以持续集成和完善地理空间知识库管理微服务,以应对不同时期、不同地域和不同群体对地理空间知识库构建和地理空间智能计算的动态需求。
通过整合并统一调度地理空间知识库微服务,系统在构建地理空间知识库和解决复杂地理问题时,能够缩短微服务调用链,减少冗余的地理空间计算开销,如图1(b)所示。地理空间知识库微服务被整合为多模态地理空间知识抽取(抽取类)、地理空间知识图谱构建(构建类)、地理空间知识推理(推理类)和地理空间知识图谱质量评估(评估类)4大类,并在容器服务集群中进行集成和编排。通过定义统一的地理空间知识库标准格式和接口规范,并采用云端消息机制异步调用微服务API,促进地理空间知识库管理微服务高效协同。此外,GeoKGMS开放地理空间知识库引擎的外部接口,赋能其他地理空间智能系统,以支持地理空间知识驱动的地理建模和数据智能检索等应用。例如,基于地理空间知识库,推理生成满足地理空间智能计算需求的地理模型以及地理语义匹配度高的空间数据,进一步促进云计算资源的合理利用。

2.2 人机协同的地理空间知识图谱构建技术

在人机协同的地理空间知识图谱构建技术方面,研究基于时空框架的多模态地理空间知识集成模型,解决多源、多模态地理空间知识的融合问题;针对地理空间知识图谱构建成本高、难度大、效率低、质量差异大等问题,充分发挥机器挖掘与专家知识的优势,研究人机协同的地理空间知识图谱构建模式,实现可持续的地理空间知识图谱工程化协同构建。人机协同的地理空间知识图谱构建技术路线(图2)包含3个重要组成部分:地理空间知识获取、机器自动化构建和人机交互式完善。
图2 人机协同的地理空间知识图谱构建技术路线

Fig. 2 Technical flowchart for human-computer collaborative geospatial knowledge graph construction

地理空间知识获取基于地理学领域专家和地理空间知识管理员制定的统一地理空间知识框架体系进行。地理学领域专家通过本体建模的方式构建地理学领域知识表达模式(Schema),以进一步实现从地理学的文本、地图、图集、时空数据等内容中抽取大量相关领域的地理空间知识。通过地理空间知识映射和地理空间知识贡献者辅助的编辑修正,建立不同体系下的地理空间知识概念、关系及同义词属性的映射关系[19-20],从而形成机器自动化构建中所需的标准化地理空间知识资源。
在机器自动化构建过程中,通过发挥机器智能,将海量的地理空间知识实现对齐和补全,并在构建过程中标记地理空间知识冲突,形成初步的地理空间知识图谱。首先,采用图神经网络双塔模型将不同地理空间知识图谱实体转换到同一向量空间中。然后,采用语义相似度匹配计算实体距离和连通图计算方法,将知识图谱节点两两对齐并形成子图连通的地理空间知识图谱。针对地理空间知识缺失和语义关系冲突等问题,基于关系敏感的嵌入式方法,利用知识图谱自身的内容来发现并补全缺失的实体关系。通过计算实体和关系之间的全局关联度,发现并标记地理空间知识图谱中的不一致之处。
在人机交互式完善过程中,通过协同机器智能和人类智能,利用地理空间知识冲突消解和地理空间知识融合工具实现地理空间知识图谱的优化,最终得到高质量的地理空间知识图谱。在地理空间知识冲突检测与消解过程中,利用协同领域专家知识和强监督联合学习的方法进行知识冲突发现,针对具体的冲突问题进行特征匹配和异常分析。然后,地理学领域专家根据反馈的异常信息类别及内容进行人工纠正,如知识关联补充、地理规则纠正、属性缺失补充、因果矛盾消解以及实体矛盾消解。此外,通过专家协同引进、注解和补充图文数类结构化知识,如专有名词、地理规则、状态属性,确保目标地理空间知识库的规范性。最后,采用基于分块的大规模实例匹配方法,将目标地理空间知识库与已构建的源地理空间知识库融合,实现大规模地理空间知识的可持续更新。

2.3 地理空间知识图谱的时空混合编码技术

地理空间知识图谱的时空混合编码技术通过整合多模态地理空间数据和时空信息,实现地理空间知识统一表示。时空混合编码技术使地理空间知识推理能够在统一的地理语义空间下进行,有助于促进基于知识图谱的复杂地理问题推理。通过融合文本、图像和数字等多模态信息,并增强地理空间知识的时空动态性,提升了计算机利用形式化的知识图谱进行机器推理和问题求解的能力。地理空间知识图谱的时空混合编码技术路线主要包含基于多头注意力机制的时空语义关联、基于多模态预训练的地理空间知识图谱表示学习和基于时序正则化的联合学习框架3个部分(图3)。
图3 地理空间知识图谱的时空混合编码技术路线

Fig. 3 Technical flowchart for spatio-temporal hybrid encoding of geospatial knowledge graph

结合多头注意力机制,采用时间序列模型和空间卷积模型相结合的方式,实现地理时空语义关联。首先,理清实体节点对象需要编码的地理空间时间信息、地理空间位置信息、地理空间文本信息,并明确与节点相关的所有信息。其次,针对图谱节点中的地理空间时间信息,采用循环神经网络类的时序模型对其编码;针对图谱节点中的地理空间位置信息,采用卷积神经网络类的深度学习模型对其进行编码。最后,采用多头注意力机制将两类或多类别语义空间混合编码,进行时空关联计算、图谱周期编码、拓扑计算,扩展发现节点相关信息,为地理空间知识图谱表示学习提供时空语义数据基础。
采用多模态知识图谱自监督预训练方法,进一步增强地理空间知识图谱的表示学习能力。首先,利用RNN、CNN、MLP分别提取文本、图像、数值三个模态的特征信息,并基于GAN补全缺失的图像、文本和数值信息。其次,采用翻译模型或随机游走模型编码知识图谱结构,并定义打分函数为所有模态分配权重。最后,以节点预测或边预测为任务,基于负采样的损失函数进行自监督预训练,为地理空间知识图谱表示学习提供多模态数据基础。
基于时序正则化的联合学习框架,学习知识图谱中的时序知识,实现地理空间知识图谱的时空混合编码。时间感知嵌入主要融入了时序信息,将三元组扩展到四元组,以提供额外的时间信息。为了改善时间范围推理,通过事件编码器和邻居聚合器建模事件序列、聚合并发交互,实现事件序列和一致性信息融合。

2.4 多模态地理空间知识存储技术

基于关系模型(三元组表、属性表、关系索引优化)的知识存储方案在处理复杂语义关联关系方面存在不足,也无法解决地理空间知识图谱架构层的动态性。原生图数据库(如Neo4j、TigerGraph、PandaDB等)在数据组织上的具有天然优势,然而现有的图数据库系统普遍忽略了时空与语义的关联特性,不支持多模态地理空间知识的组织与管理。作为GeoKGMS的核心,地理空间知识库引擎采用多模态地理空间知识一体化存储和大规模时空图分割技术,解决复杂结构地理空间知识的高效管理和大规模时空知识元组的高效检索问题。
地理空间知识库引擎采用分布式原生图数据库作为核心枢纽,结合规则引擎、文件管理系统和空间数据库,构建了“图-文-数”一体化的地理空间知识存储方法(图4)。利用有向属性图的节点表示知识对象,有向边表示知识对象间的时空语义关联关系,使用图数据库实现地理空间知识图谱的存储;通过定长存储,实现数字ID+偏移量的快速查询操作;通过点、边、属性结构外键,设定并发式级联操作,建立点操作、边操作和属性操作之间的紧密联系,实现点插入、点删除时边和属性的联动操作。然后,将图像、规则的文件URL、数据库索引等地理空间知识元数据以属性的形式关联至地理空间知识图谱。通过多模态地理空间知识元数据关联至地理空间知识图谱节点的机制,将对多模态地理空间知识的增、删、改、查转换为对地理空间知识图谱的增、删、改、查及元数据关联的级联操作,实现多模态地理空间知识的统一管理。
图4 “图-文-数”一体化的地理空间知识存储技术路线

Fig. 4 Technical flowchart for integrated 'Image-Text-Number' geospatial knowledge storage

大规模时空图分割技术是地理空间知识库引擎建立“时间-空间-语义”耦合地理空间知识层级索引机制的基础。通过图节点的时空信息,从信息传递和信息编码的角度识别邻近图节点,从而实现有向属性图的压缩。利用时空约束的局部-整体-迭代社区聚类方法,对压缩后的有向属性图进行初步划分。对合并后的节点进行还原,并利用启发式算法对划分结果进行局部优化。对于被割裂的边,将其同时存储在起点和终点所属的子图中,确保子图间的连通性。在此基础上,在执行地理空间知识管理任务时动态维护全局索引和局部索引,以平衡地理空间知识的读写效率。

3 地理空间知识库管理系统服务框架

3.1 系统服务总体设计思想

在系统资源管理层面,GeoKGMS需要明确其管理对象,以实现地理空间知识库的有效管理。地理空间知识库是在地理空间知识图谱表示模型的指导下,通过抽象、表示、处理和存储现实世界中的地理对象而形成的地理空间知识集合[21-22]。地理空间知识是信息与知识在地理科学领域的延伸,通过解析地理科学领域独特的背景、过程和结果而得到的增值信息[23]。基于“多模态地理空间知识存储技术”的地理空间知识管理服务,考虑到地理学领域知识特点,采用图模式组织和管理知识,以确保地理空间知识的易获取性和灵活性[24]
在系统服务管理层面,GeoKGMS重点以“人机协同的地理空间知识图谱构建技术路线”为引导,开发知识库构建微服务,以实现多模态地理空间知识图谱的持续构建,减少地理学专家在维护地理空间知识上的时间和人力成本。系统的地理空间知识图谱构建过程需要突破传统知识图谱作为语义网络在单一文本模态[25]的限制,通过将多模态数据特征融入地理空间知识图谱以扩展其应用范围。
在系统应用层面,GeoKGMS基于“云原生的地理空间知识库微服务调度技术”,协同地理空间知识的多样化查询和智能化推理等服务,助力地理空间智能计算。首先,地理空间知识图谱构建服务保障了地理空间知识的多模态、多层次和易理解的可视化特性。然后,通过“地理空间知识图谱时空混合编码技术”增强机器理解地理空间知识图谱[7,26-27],研制地理空间知识的复杂语义推理微服务,以实现知识驱动的地理空间智能分析和复杂地理场景模拟计算。

3.2 系统总体架构设计

GeoKGMS基于云原生架构理念设计了其总体架构,共分为五层:云原生基础设施层、知识库资源管理层、知识库服务管理层、API网关层和应用层(图5)。云原生基础设施层基于Serverless容器服务集群构建,提供资源池化管理、弹性伸缩和持续部署等服务,支持容器化资源管理、微服务治理和消息协同的开发、集成和运行。知识库资源管理层以地理空间知识库引擎为核心,提供地理空间知识的存储、索引、查询和管理等服务。该层管理各种知识表示方法的知识库、知识抽取的数据源和相关模型,并提供地理空间知识库资源的基本操作、复杂操作和运行管理等服务。知识库服务管理层主要提供管理地理空间知识的获取、地理空间知识图谱的构建和评估、地理空间推理等服务,促进地理空间知识库的高效构建,同时增强地理空间知识库的知识计算和推理能力。API网关层提供系统的统一业务处理服务,包括对地理空间知识库资源的访问和操作鉴权,以及将来自应用层的地理空间知识库资源管理和服务调用请求转发到相应的后台服务。应用层直接面向用户提供地理空间知识库管理的所有服务,同时允许将地理空间知识库应用到示范系统中。
图5 云原生地理空间知识库管理系统的总体架构

Fig. 5 Overall architecture of the cloud-native geospatial knowledge base management system

3.3 系统功能体系

地理空间知识库管理系统的功能模块设计遵循高内聚、低耦合的原则,同时注重可扩展性和可维护性。在功能层面,GeoKGMS采用问题导向方法,在各模块中定义并实现了相应的接口。根据地理空间知识库的管理、构建和应用需求,GeoKGMS划分为六大功能模块:地理空间知识库资源管理模块、多模态地理空间知识抽取模块、地理空间知识图谱人机协同构建模块、地理空间知识推理模块、地理空间知识图谱质量评估模块和地理空间知识可视化分析模块(图6)。
图6 地理空间知识库管理系统功能模块结构

Fig. 6 Functional module structure of the geospatial knowledge base management system

(1)地理空间知识库资源管理模块。该模块提供资源目录、创建和操作管理等功能,支持对数据源、知识库和相关模型进行创建、删除、保存和修改操作。
(2)多模态地理空间知识抽取模块。该模块能从多模态数据源中提取地理空间知识,包括非结构化文本和地图,解决非结构化数据向结构化数据的转换问题。
(3)地理空间知识图谱人机协同构建模块。该模块通过人机协同的方式构建标准化地理空间知识图谱,涵盖知识映射、对齐、融合和冲突消解等功能。
(4)地理空间知识推理模块。该模块旨在完善地理空间知识图谱并解决复杂地理问题,包括链接预测和知识补全等任务。
(5)地理空间知识图谱质量评估模块。该模块对地理空间知识图谱进行质量评估,质量评估的框架体系涵盖数据来源、构建方法和成果内容等多个维度。
(6)地理空间知识可视化分析模块。该模块具有地理空间知识可视化展示、查询、编辑、计算和样式定制等功能,适用于不同模态、层次、类别和粒度地理空间知识的可视化。

4 云原生地理空间知识库管理系统的实现与应用实例

4.1 系统实现

地理空间知识库管理系统采用云原生技术架构,在阿里云Kubernetes容器服务Serverless版(ACK Serverless)平台上构建和运行。为满足多模态地理空间知识存储的需求,GeoKGMS部署了多种存储环境:利用Nebula Graph管理图数据,使用PostgreSQL数据库及PostGIS扩展插件管理结构化数据和空间数据,并使用OSS对象存储服务管理非结构化数据。地理空间知识库核心算法和模型,如地理空间知识图谱构建算法、推理补全模型等,采用Docker容器化封装,并提供微服务接口。
GeoKGMS在云原生的环境下,通过HTTP REST接口和消息中间件实现同步和异步通信(图7)。使用RabbitMQ中间件,通过分布式特性和消息持久化存储机制,实现系统服务的解耦。此外,消息队列的异步处理和削峰填谷机制有效缓解了GeoKGMS中耗时的知识抽取、知识图谱构建、知识推理和质量评估服务的压力。云原生的系统架构支持人机协同构建地理空间知识图谱,并满足知识管理者、贡献者和专家等不同角色的协同需求。Redis中间件的高性能、低延时和数据缓存共享特性为GeoKGMS内部缓存和热点知识的快速传输创造了条件,提高了地理空间知识管理、推理和可视化的效率。GeoKGMS的资源管理数据库和操作运行管理数据库作为关系数据库,负责持久化存储所有系统资源实例和操作记录。
图7 地理空间知识库管理系统服务流程

Fig. 7 Service flowchart of the geospatial knowledge base management system

4.2 应用案例

本研究以喀斯特地貌知识图谱为案例,验证GeoKGMS在地理空间知识资源管理和知识图谱人机协同构建的能力。喀斯特地貌知识图谱是一个“图-文-数”一体化的地理空间知识图谱,它在知识来源和可视化表达上都具备多模态的特点。喀斯特地貌知识图谱的构建基于《地貌学》[28]等涉及“喀斯特地貌”图文内容的地理学书籍以及相关的标准地图。通过构建流水线,地貌学专家用户与机器协同完成地理空间知识的映射、对齐、补全及冲突消解等步骤,最终由GeoKGMS自动化构建喀斯特地貌知识图谱(图8)。由于喀斯特地貌知识的专业程度高,知识图谱构建的前期资源预处理和知识抽取是难点。对于喀斯特地貌的时空知识,利用机器学习技术实现自动化抽取。面对复杂的地貌知识,系统通过词性标注和规则相结合的方法得到知识三元组,实现不同层级间的知识获取。系统选用基于产生式规则的知识图谱边关系推理补全模型,输入喀斯特地貌知识三元组和专家制定的规则集合,输出补全的关系集合。这些新发现的隐藏知识经地貌学专家用户筛选后成为喀斯特地貌知识图谱的一部分。
图8 人机协同的喀斯特地貌知识图谱构建示意图

Fig. 8 Illustrative diagram of human-computer collaborative Karst landform knowledge graph construction

喀斯特地貌知识图谱的数据结构以树状知识框架为基础,结合网络和知识链表,有效支持知识的多模态和多层级特性。GeoKGMS通过地理空间知识库引擎的索引和查询功能,实现了喀斯特地貌知识图谱的可视化,展示了地理空间知识图谱多模态和多层级的特点(图9)。GeoKGMS能够快速检索相关地理空间知识,例如清晰展示“溶洞”相关的原始文本与地理空间知识图谱之间的对应关系。喀斯特地貌知识图谱相比原始文本,以更为凝练的形式表达喀斯特地貌知识,并准确描绘语义关系。人机协同构建的喀斯特地貌知识图谱与专家知识表达模式高度一致,确保知识驱动的地理计算和推理在实际应用中的可解释性。
图9 基于喀斯特地貌知识图谱的知识检索与可视化示意图

Fig. 9 Illustrative diagram of knowledge retrieval and visualization based on the Karst landform knowledge graph

5 总结和展望

本研究提出的基于云原生的地理空间知识库管理系统(GeoKGMS)以“图-文-数”一体化地理空间知识库引擎为核心,面向多模态地理空间知识的高效组织与管理。本研究突破了人机协同地理空间知识图谱的构建等关键技术,探索了地理空间知识库管理服务的方法,从而实现地理空间知识图谱的高质量、可持续工程建设。
未来的工作将重点放在将GeoKGMS从研究和原型开发阶段过渡到成熟的产品阶段,以实现GeoKGMS的广泛普及和推广。特别是将探索在亿级时空知识元组场景下,测试和评估地理空间知识库的管理能力,以及如何将构建的地理空间知识图谱有效地应用于实际地理场景中,以提供更广泛的地理空间解决方案。最终实现GeoKGMS的产品化,支持知识驱动的地理空间智能分析计算和应用示范系统建设。
[1]
Zhou C H, Wang H, Wang C S, et al. Geoscience knowledge graph in the big data era[J]. Science China Earth Sciences, 2021, 64(7):1105-1114. DOI:10.1007/s11430-020-9750-4

[2]
Zhang X Y, Huang Y, Zhang C J, et al. Geoscience knowledge graph (GeoKG): development, construction and challenges[J]. Transactions in GIS, 2022, 26(6):2480-2494. DOI:10.1111/tgis.12985

[3]
Wang S, Zhang X Y, Ye P, et al. Geographic knowledge graph (GeoKG): A formalized geographic knowledge representation[J]. ISPRS International Journal of Geo-Information, 2019, 8(4):184. DOI:10.3390/ijgi8040184

[4]
李德仁. 论时空大数据的智能处理与服务[J]. 地球信息科学学报, 2019, 21(12):1825-1831.

DOI

[Li D R. The intelligent processing and service of spatiotemporal big data[J]. Journal of Geo-information Science, 2019, 21(12):1825-1831.] DOI:10.12082/dqxxkx.2019.190694

[5]
陆锋, 诸云强, 张雪英. 时空知识图谱研究进展与展望[J]. 地球信息科学学报, 2023, 25(6):1091-1105.

DOI

[Lu F, Zhu Y Q, Zhang X Y. Spatiotemporal knowledge graph: advances and perspectives[J]. Journal of Geo-information Science, 2023, 25(6):1091-1105.] DOI:10.12082/dqxxkx.2023.230154

[6]
张洪岩, 周成虎, 闾国年, 等. 试论地学信息图谱思想的内涵与传承[J]. 地球信息科学学报, 2020, 22(4):653-661.

DOI

[Zhang H Y, Zhou C H, Lv G N, et al. The connotation and inheritance of Geo-information Tupu[J]. Journal of Geo-information Science, 2020, 22(4):653-661.] DOI: 10.12082/dqxxkx.2020.200167

[7]
诸云强, 孙凯, 胡修棉, 等. 大规模地球科学知识图谱构建与共享应用框架研究与实践[J]. 地球信息科学学报, 2023, 25(6):1215-1227.

DOI

[Zhu Y Q, Sun K, Hu X M, et al. Research and practice on the framework for the construction, sharing, and application of large-scale geoscience knowledge graphs[J]. Journal of Geo-information Science, 2023, 25(6):1215-1227.] DOI:10.12082/dqxxkx.2023.210696

[8]
黄恒琪, 于娟, 廖晓, 等. 知识图谱研究综述[J]. 计算机系统应用, 2019, 28(6):1-12.

[Huang H Q, Yu J, Liao X, et al. Review on knowledge graphs. Computer Systems and Applications, 2019, 28(6):1-12.] DOI:10.15888/j.cnki.csa.006915

[9]
Ji S X, Pan S R, Cambria E, et al. A survey on knowledge graphs: representation, acquisition, and applications[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 33(2):494-514. DOI:10.1109/TNNLS.2021.3070843

[10]
Zheng Y L, He Q Y, Qian P, et al. Construction of the ontology-based agricultural knowledge management system[J]. Journal of Integrative Agriculture, 2012, 11(5):700-709. DOI:10.1016/S2095-3119(12)60059-8

[11]
Skobelev P O, Simonova E V, Smirnov S V, et al. Development of a knowledge base in the “smart farming” system for agricultural enterprise management[J]. Procedia Computer Science, 2019, 150:154-161. DOI:10.1016/j.procs.2019.02.029

[12]
陶坤旺, 赵阳阳, 朱鹏, 等. 面向一体化综合减灾的知识图谱构建方法[J]. 武汉大学学报(信息科学版), 2020, 45(8):1296-1302.

[Tao K W, Zhao Y Y, Zhu P, et al. Knowledge graph construction for integrated disaster reduction[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8):1296-1302.] DOI:10.13203/j.whugis20200125

[13]
杜志强, 李钰, 张叶廷, 等. 自然灾害应急知识图谱构建方法研究[J]. 武汉大学学报(信息科学版), 2020, 45(9):1344-1355.

[Du Z Q, Li Y, Zhang Y T, et al. Knowledge graph construction method on natural disaster emergency[J]. Geomatics and Information Science of Wuhan University, 2020, 45(9):1344-1355.] DOI:10.13203/j.whugis20200047

[14]
刘俊楠, 刘海砚, 陈晓慧, 等. 面向多源地理空间数据的知识图谱构建[J]. 地球信息科学学报, 2022, 22(7):1476-1486.

[Liu J N, Liu H Y, Chen X H, et al. The construction of knowledge graph towards multi-source geospatial data[J]. Journal of Geo-information Science, 2022, 22(7):1476-1486.] DOI:10.12082/dqxxkx.2020.190565

[15]
蒋秉川, 万刚, 许剑, 等. 多源异构数据的大规模地理知识图谱构建[J]. 测绘学报, 2018, 47(8):1051-1061.

DOI

[Jiang B C, Wan G, Xu J, et al. Geographic knowledge graph building extracted from multi-sourced heterogeneous data[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(8):1051-1061.] DOI:10.11947/j.AGCS.2018.20180113

[16]
林珲, 游兰, 胡传博, 等. 时空大数据时代的地理知识工程展望[J]. 武汉大学学报(信息科学版), 2018, 43(12):2205-2211.

[Lin H, You L, Hu C B, et al. Prospect of geo-knowledge engineering in the era of spatio-temporal big data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12):2205-2211.] DOI:10.13203/j.whugis20180318

[17]
王传庆, 李阳阳, 费超群, 等. 知识图谱平台综述[J]. 计算机应用研究, 2022, 39(11):3201-3210.

[Wang C Q, Li Y Y, Fei C Q, et al. Survey of knowledge graph platform[J]. Application Research of Computers, 2022, 39(11):3201-3210.] DOI:10.19734/j.issn.1001-3695.2022.04.0145

[18]
Morsey M, Lehmann J, Auer S, et al. DBpedia and the live extraction of structured data from Wikipedia[J]. Program, 2012, 46(2):157-181. DOI:10.1108/00330331211221828

[19]
Liu X K, Tu Z Y, Wang Z J, et al. A crowdsourcing-based knowledge graph construction platform[C]. // International Conference on Service-Oriented Computing. Cham: Springer International Publishing, 2020:63-66. DOI:10.1007/978-3-030-76352-7_9

[20]
Tang J, Li J, Liang B Y, et al. Using bayesian decision for ontology mapping[J]. Journal of Web Semantics, 2006, 4(4):243-262. DOI:10.1016/j.websem.2006.06.001

[21]
张斌, 魏扣, 郝琦. 国内外知识库研究现状述评与比较[J]. 图书情报知识, 2016, 33(3):15-25.

[Zhang B, Wei K, Hao Q. Review and comparison of research status of knowledge base at home and abroad[J]. Documentation, Information & Knowledge, 2016, 33(3):15-25.] DOI:10.13366/j.dik.2016.03.015

[22]
陆锋, 余丽, 仇培元. 论地理知识图谱[J]. 地球信息科学学报, 2017, 19(6):723-734.

DOI

[LU F, YU L, QIU P Y. On geographic knowledge graph[J]. Journal of Geo-information Science, 2017, 19(6):723-734.] DOI:10.3724/SP.J.1047.2017.00723

[23]
张雪英, 张春菊, 吴明光, 等. 顾及时空特征的地理知识图谱构建方法[J]. 中国科学:信息科学, 2020, 50(7):1019-1032.

[Zhang X Y, Zhang C J, Wu M G, et al. Spatiotemporal features based geographical knowledge graph construction[J]. Scientia Sinica Informationis, 2020, 50(7):1019-1032.] DOI: 10.1360/SSI-2019-0269

[24]
化立志. 基于知识图谱的领域知识库管理系统的设计与实现[D]. 北京: 北京邮电大学, 2018.

[Hua L Z. The design and implementation of domain knowledge base management system based on knowledge graph[D]. Beijing: Beijing University of Posts and Telecommunications, 2018.]

[25]
石顺中, 闾海荣, 董少春, 等. 地球科学知识体系编辑平台[J]. 高校地质学报, 2020, 26(4):384-394.

DOI

[Shi S Z, Lyu H R, Dong S C, et al. An editing platform of geoscience knowledge system[J]. Geological Journal of China Universities, 2020, 26(4):384-394.] DOI:10.16108/j.issn1006-7493.2020019

[26]
王鑫, 邹磊, 王朝坤, 等. 知识图谱数据管理研究综述[J]. 软件学报, 2019, 30(7):2139-2174.

[Wang X, Zou L, Wang C K, et al. Research on knowledge graph data management: a survey[J]. Journal of Software, 2019, 30(7):2139-2174.] DOI:10.13328/j.cnki.jos.005841

[27]
Chen X J, Jia S B, Xiang Y. A review: knowledge reasoning over knowledge graph[J]. Expert Systems with Applications, 2020, 141:112948. DOI:10.1016/j.eswa.2019.112948

[28]
南京大学地理系地貌教研组. 地貌学[M]. 北京: 人民教育出版社, 1961.

[Department of Geomorphology, Nanjing University. Geomorphology[M]. Beijing: People's Education Press, 1961.]

文章导航

/