地理知识图谱推理研究进展与展望
作者贡献:Author Contributions
段雨希参与文献收集总结与论文写作;陈碧宇参与论文的写作和修改;李岩、林黎参与论文收集与计量分析;张雪英参与论文的修改。所有作者均阅读并同意最终稿件的提交。
DUAN Yuxi participated in literature collection and summary and thesis writing; CHEN Biyu participated in thesiswriting and revision; LI Yan and LIN Li participated in thesis collection and quantitative analysis; and ZHANG Xueyingparticipated in thesis revision. All authors read and approved the final manuscript for submission.
段雨希(1998— ),女,广西桂林人,博士生,主要从事地理知识图谱研究。E-mail: yuxiduan@whu.edu.cn |
收稿日期: 2024-08-19
修回日期: 2024-11-01
网络出版日期: 2025-01-23
基金资助
国家重点研发计划项目(2021YFB3900903)
国家自然科学基金项目(42271473)
Reasoning on Geographical Knowledge Graph: Advances and Perspectives
Received date: 2024-08-19
Revised date: 2024-11-01
Online published: 2025-01-23
Supported by
National Key Research and Development Project(2021YFB3900903)
National Natural Science Foundation of China(42271473)
【目的】随着知识图谱技术在GIS领域应用和发展,地理知识图谱(GeoKG)近年来逐渐成为GIS领域的重要研究方向。GeoKG往往无法确保涵盖所有知识,知识的缺失和不一致性严重影响应用性能,需要采用GeoKG推理技术来自动补全缺失知识、识别矛盾知识、预测地理现象未来发展趋势。区别于通用知识图谱推理技术,GeoKG推理技术需要着重考虑地理知识的复杂时空特性。本文对近年来GeoKG的推理工作进行了全面介绍和总结。【分析】首先,介绍了GeoKG推理的相关概念与问题描述;其次,本文分析了GeoKG推理的二大核心任务: ① 面向知识补全的推理模型,主要用于填补图谱中的空白,确保知识的完整性; ② 面向预测任务的推理模型,旨在通过已有地理数据预测未来的趋势。两类模型各自针对不同的应用场景进行优化,并在地理数据的处理中各有侧重。【展望】展望了GeoKG推理的未来发展趋势,指出未来GeoKG推理技术的发展将更加关注时空数据的复杂关系处理、多尺度地理知识的推理、多模态数据的融合,以及提高推理模型的可解释性与智能化。此外,GeoKG与大规模预训练模型的结合也将成为关键方向。
段雨希 , 陈碧宇 , 李岩 , 张雪英 , 林黎 . 地理知识图谱推理研究进展与展望[J]. 地球信息科学学报, 2025 , 27(1) : 41 -59 . DOI: 10.12082/dqxxkx.2025.240460
[Objectives] With the application of knowledge graph techniques in the field of Geographical Information Science (GIS), the Geographical Knowledge Graph (GeoKG) has become a key research direction. GeoKGs often lack sufficient geographic knowledge coverage, which can negatively impact downstream applications. Therefore, reasoning techniques are essential for GeoKG to complete missing knowledge, identify inconsistencies, and predict trends in geographic phenomena. Unlike reasoning techniques applied to general knowledge graphs, reasoning on GeoKGs must handle the unique and complex spatial and temporal characteristics of geographic phenomena. This paper comprehensively introduces and summarizes recent advances in GeoKG reasoning. [Analysis] First, it introduces the relevant concepts and problem definitions of GeoKG reasoning. Second, it analyzes the two core tasks of GeoKG reasoning: knowledge completion and prediction. The reasoning model for knowledge completion primarily fills gaps in the graph to ensure knowledge integrity, while the reasoning model for prediction aims to forecast future trends based on existing geographic data. These two models are optimized for different application scenarios, with different focuses in processing geographic data. [Prospect] Finally, the paper explores future development trends in GeoKG reasoning, highlighting areas such as processing complex relationships in spatiotemporal data, reasoning with multi-scale geographic knowledge, fusing multimodal data, and enhancing the interpretability and intelligence of reasoning models. Additionally, the integration of GeoKGs with large-scale pre-trained models is expected to become a key area of focus.
表1 基于Google Scholar搜中英文关键词Tab. 1 Chinese and English keywords based on Google Scholar search |
中文关键词 | 英文关键词 |
---|---|
地理知识图谱 | Geographical Knowledge Graph; Geospatial Knowledge Graph; GeoKG |
时空知识图谱 | Spatiotemporal Knowledge Graph |
知识图谱补全 | Knowledge Graph Completion |
知识图谱去噪 | Knowledge Graph Denoising |
知识图谱预测 | Knowledge Graph Prediction |
表2 面向补全的主流地理知识图谱推理方法对比Tab. 2 Comparison of mainstream geographic knowledge graph reasoning methods for completion |
算法类别 | 具体模型/用途 | 优点 | 缺点 |
---|---|---|---|
基于转移表示的推理方法 | TransE-GDR, TransR-GDR, TransD-GDR[12] | 引入地理空间距离限制,提高GeoKG的嵌入表示 | TransE-GDR不善于处理复杂关系,TransR-GDR训练时间较长,TransD-GDR计算成本高,更换数据集需要精细调参 |
GEUKE[13] | 结合空间和结构特征,性能优于传统模型 | 需要大量的训练数据,缺乏灵活性与通用性 | |
MSEN-GRP[14] | 构建多层相似性增强网络,显著提升补全性能 | 需要复杂的网络结构和算法,属性相似性网络补全效果不显著 | |
VerE-TransE, VerE-TransD, VerE-TransR[15] | 利用注意力机制处理时间嵌入,效果显著 | VerE-TransE不适合复杂关系, VerE-TransR训练时间长 | |
DT-WE[16] | 集成时间和空间嵌入模块,提高预测概率 | 计算复杂度较高,训练时间较长 | |
HyperRotatE[17] | 结合平移和旋转思想,有限训练数据下表现出色 | 高维表示需要较大的计算量,模型受数据噪声影响大 | |
RotateS2F[18] | 通过旋转操作表示实体和关系,捕捉复杂关系特性 | 需要复杂的数学运算,有可能生成常识错误的负样本 | |
HyperQuaternionE[19] | 捕捉不同关系特性,隐式学习概念邻域 | 计算过程复杂,需要解决不同空间的调和问题 | |
Dihedron Algebra[20] | 使用高超复数代数操作降维推理补全 | 算法复杂,理解和实现难度较高,训练时间长 | |
DistMult[21] | 利用向量表示将语义信息嵌入低维空间,基于文本数据推理 | 对结构信息的捕捉不够精确 | |
ComplEx[22] | 利用向量表示将语义信息嵌入低维空间,基于文本数据推理 | 对结构信息的捕捉不够精确 | |
基于神经网络的推理方法 | ST-GCN[23] | 结合时间信息和空间结构进行特征提取 | 对数据质量要求较高 |
STSE, S-TSE[24] | 利用递归神经网络获取时空感知关系嵌入,补全知识图谱 | 模型复杂度高,训练和推理速度较慢 | |
基于规则的推理方法 | 领域语义规则[25] | 利用领域知识规则进行森林火灾知识图谱补全 | 规则定义需要领域专家知识,推广性不足 |
瓦斯事故时空图谱[26] | 通过本体模型及推理规则库实现隐性知识推理 | 规则和本体模型复杂,构建成本高 | |
作物病虫害诊断[27] | 基于预定义规则推理作物病虫害诊断 | 规则定义需要领域专家知识,灵活性不足 | |
水利信息知识图谱[28] | 利用隐藏知识实现智能数据补全 | 需要大量领域知识和规则,推广性不足 | |
供应链可视性[29] | 使用OWL定义和构建供应链可视性领域语义模型 | OWL复杂度高,构建和维护成本高 | |
滑坡知识图谱[30] | 结合深度学习与OWL进行预测补全 | 深度学习模型复杂,训练成本高 | |
时空知识图谱补全[31] | 定义合并时间中心和位置中心的三元概念规则进行补全 | 规则定义复杂,适应性不足 | |
岛屿知识图谱[32] | 使用实体词典和规则模式提取实体和关系,补全缺失知识 | 依赖预定义规则,灵活性不足 |
表3 面向预测的地理知识图谱推理方法对比Tab. 3 Comparison of geographic knowledge graph reasoning methods for prediction |
算法类别 | 具体模型 | 优点 | 缺点 |
---|---|---|---|
基于深度学习的预测方法 | KST-GCN[37] | 结合知识和交通特征,提高预测性能,适用性较高 | 对数据质量较为依赖 |
KG-ST-CNN[38] | 结合知识图谱和深度时空卷积神经网络,提高城市拥堵预测准确性 | 计算复杂,模型的转移性有待进一步验证 | |
STKGN[39] | 利用连续时间动态图神经网络,模拟和预测实体演变过程 | 计算开销大,影响模型实时性应用 | |
KGR-STGNN[40] | 结合图卷积网络(GCN)和时间卷积网络(TCN),有效捕捉地铁交通流量的时空动态特征 | 计算复杂度高 | |
KatGCN[41] | 能够预测多个共生事件的不同类型 | 对数据质量依赖较大 | |
HIT-GCN[42] | 结合道路网络特性,显著提高短期和长期预测的准确性 | 模型复杂,训练和推理速度较慢 | |
ODT-GCN[43] | 结合交通知识图谱,Trans-R模型和GCN,提高出租车需求预测的准确性 | 模型转移性较差 | |
Graph-Flashback[44] | 根据用户的历史轨迹推荐最有可能访问的下一个 POI | 对用户历史数据依赖性强 | |
DynAttGraph2Seq[45] | 能够处理动态时空数据,进行序列到序列的预测 | 对时空数据质量和数量要求高,计算效率低 | |
GeoNN[46] | 专为地理空间表示学习而设计的模型,可有效捕捉地理空间实体之间的空间属性和交互 | 需要大量计算资源和高质量数据 | |
Geo-RippleNet [47] | 专为地理社交网络设计的POI推荐模型 | - | |
MFGAT[48] | 提取丰富的结构信息,扩展到时空版本,预测 TKG 中的缺失链接 | 模型复杂并且训练 GAT 可能需要大量资源 | |
FDSA-STG[49] | 改进注意力机制,提取流量特征 | ||
RAG-GAT[50] | 捕捉图结构中的丰富信息,灵活建模时间维度相关性 | ||
Bi-LSTM[51] | 结合小麦病虫害知识图谱,预测准确率为93.21% | 模型复杂度高,训练成本大 | |
Know-Evolve[52] | 通过深度进化网络捕捉地理实体动态演化 | 调参数复杂 | |
ConvRL-KGM[53] | 结合LSTM和ConvR对时空数据进行预测 | 存在过拟合风险 | |
基于概率模型的预测推理 | 暴雨灾害链预测[54] | 预测暴雨灾害链中次生灾害与衍生后果强度或等级的概率地学数据 | 计算复杂度高,训练成本大 |
KG-MTKF[55] | 处理和预测非线性动态系统中的地理知识 | 可解释性和用户接受度较差 |
利益冲突:Conflicts of Interest 所有作者声明不存在利益冲突。
All authors disclose no relevant conflicts of interest.
[1] |
夏毅, 兰明敬, 陈晓慧, 等. 可解释的知识图谱推理方法综述[J]. 网络与信息安全学报, 2022, 8(5):1-25.
[
|
[2] |
张雪英, 张春菊, 吴明光, 等. 顾及时空特征的地理知识图谱构建方法[J]. 中国科学(信息科学), 2020, 50(7):1019-1032.
[
|
[3] |
侯中妮, 靳小龙, 陈剑赟, 等. 知识图谱可解释推理研究综述[J]. 软件学报, 2022, 33(12):4644-4667.
[
|
[4] |
陆锋, 诸云强, 张雪英. 时空知识图谱研究进展与展望[J]. 地球信息科学学报, 2023, 25(6):1091-1105.
[
|
[5] |
|
[6] |
陆锋, 余丽, 仇培元. 论地理知识图谱[J]. 地球信息科学学报, 2017, 19(6):723-734.
[
|
[7] |
[
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
刘鹏, 景江波, 魏卉子, 等. 基于时空约束的瓦斯事故知识库构建及预警推理[J]. 煤炭科学技术, 2020, 48(7):262-273.
[
|
[27] |
于合龙, 沈金梦, 毕春光, 等. 基于知识图谱的水稻病虫害智能诊断系统[J]. 华南农业大学学报, 2021, 42(5):105-116.
[
|
[28] |
冯钧, 徐新, 陆佳民. 水利信息知识图谱的构建与应用[J]. 计算机与现代化, 2019(9):35-40.
[
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
唐曾杨, 艾廷华, 徐海江. 地理知识图谱下的建筑群空间分布模式推理[J]. 地球信息科学学报, 2023, 25(6): 1202-1214.
[
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|
[46] |
|
[47] |
高嘉良, 仇培元, 余丽, 等. 基于旅游知识图谱的可解释景点推荐[J]. 中国科学(信息科学), 2020, 50(7):1055-1068.
[
|
[48] |
|
[49] |
|
[50] |
|
[51] |
张善文, 王振, 王祖良. 结合知识图谱与双向长短时记忆网络的小麦条锈病预测[J]. 农业工程学报, 2020, 36(12):172-178.
[
|
[52] |
|
[53] |
|
[54] |
|
[55] |
贺汪延, 张巍, 李厚芝, 等. 知识图谱优化卡尔曼滤波预测库岸滑坡位移[J]. 高校地质学报, 2023, 29(3):372-381.
[
|
[53] |
王志华, 杨晓梅, 周成虎. 面向遥感大数据的地学知识图谱构想[J]. 地球信息科学学报, 2021, 23(1):16-28.
[
|
/
〈 |
|
〉 |