“专刊:地理时空知识图谱理论方法与应用” 栏目所有文章列表

(按年度、期号倒序)

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部

Please wait a minute...
  • 全选
    |
  • 专刊:地理时空知识图谱理论方法与应用
    地球信息科学学报. 2023, 25(6): 1089-1090.
  • 专刊:地理时空知识图谱理论方法与应用
    陆锋, 诸云强, 张雪英
    地球信息科学学报. 2023, 25(6): 1091-1105. https://doi.org/10.12082/dqxxkx.2023.230154
    PDF全文 (1430) HTML (410)   可视化   收藏

    地理信息的不断泛化对经典的地理信息分析模式提出了巨大挑战,网络化的知识服务将逐渐成为地理信息应用的新模式,助力地理计算到社会计算的形态转变。地理知识服务需要打通人、机构、自然环境、地理实体、地域单元、社会事件之间的关联,促进知识辅助下的数据智能与计算智能。本文聚焦地理时空知识获取与形式化表达及分析的迫切需求,首先分析了时空知识图谱的基本概念与特征,认为时空知识图谱是指具有地理时空分布或位置隐喻的知识构成的有向图,即以时空分布特征为核心的知识图谱;然后提出了时空知识图谱的研究框架,该框架可实现时空大数据到时空知识服务应用的转变,包括泛在时空大数据、时空知识获取、时空知识管理、时空知识图谱、软件系统及行业应用等多个层次;接着从文本描述地理信息抽取、异构地理语义网对齐、时空知识表达与表示学习等方面,介绍了相关研究进展;结合应用实践,介绍了面向行业的时空知识图谱构建与应用途径;最后,讨论了时空知识图谱研究目前面临的关键科学问题与技术瓶颈,提出在大模型时代,构建显式的时空知识图谱,并针对行业需求开展知识推理,仍是时空知识服务的必由之路。

  • 专刊:地理时空知识图谱理论方法与应用
    李发东, 王海起, 孔浩然, 刘峰, 王志海, 王琼, 徐建波, 单宇飞, 周啸宇, 闫峰
    地球信息科学学报. 2023, 25(6): 1106-1120. https://doi.org/10.12082/dqxxkx.2023.220464

    命名实体识别(NER)是自然语言处理众多研究基础,其可以被定义为分类任务,旨在从非结构化文本中定位出命名实体,同时将命名实体分类成预定义类别。与英文相比,中文构词灵活、不具有边界性,且缺乏高质量中文NER数据集,导致中文命名实体识别难度较大。细粒度实体是粗粒度实体的细分类型,中文细粒度命名实体尤其是地理命名实体识别难度更大。中文地理命名实体识别无法同时兼顾精度和召回率,改善中文细粒度地理命名实体识别性能至关重要。因此,本文提出2种联合词汇增强模型的中文细粒度地理命名实体识别模型。首先,将词汇作为“知识”注入模型,基于词汇增强方式探究适合细粒度命名实体识别方法,并找出适合细粒度命名实体识别方法BERT-FLAT以及LEBERT;其次,为进一步提升细粒度地理命名实体识别性能,针对上述2种方法在预训练模型、对抗训练以及随机权重平均3个方面进行改进,形成联合词汇增强模型RoBERTa-wwm-FLAT以及LE-RoBERTa-wwm;最后,对联合词汇增强模型进行消融实验,探究不同改进策略对于地理命名实体识别性能影响。基于CLUENER数据集和1个微博数据集的实验表明:① 与无词汇增强功能模型相比,具有词汇增强功能模型在细粒度命名实体识别任务中F1-score提升了10%左右; ② 针对词汇增强方法进行的3处改进使模型在细粒度地理命名实体识别任务中F1-score提升了0.36%~2.35%; ③ 与对抗训练改进、随机权重平均改进相比,预训练模型改进对地理命名实体识别精度的影响最大。

  • 专刊:地理时空知识图谱理论方法与应用
    黄宗财, 陆锋, 仇培元, 彭澎
    地球信息科学学报. 2023, 25(6): 1121-1134. https://doi.org/10.12082/dqxxkx.2023.220617

    网络文本是构建和填补大规模地理知识图谱的重要地理信息来源。但网络文本来源广泛、动态性强、表达方式复杂多样、蕴含地理信息良莠不齐,网络文本蕴含地理信息质量评估面临评估对象多层次、质量维度不明确、评估指标多元化、深层次指标难获取和评估方法多样化的挑战。因此,本文提出了一种网络文本蕴含地理信息质量评估框架(QAF-GIWT)。QAF-GIWT面向网络文本获取地理信息过程,明确了数据源、数据项和数据集3层质量评估对象,针对不同层次评估对象定义了包含相关性、新颖性、可靠性和完整性4个质量维度和相应的量化评估指标,系统地梳理了质量评估过程中所涉及指标计算、指标综合和质量预测方法的特点及其适用性。其中,借助自然语言处理技术及相应的指标计算方法,构建了包含单元地理语义比率、地理语义含量比率、平均地理信息含量比率和地理信息含量比率、地理实体比率、窗口地理信息含量比率等指标。实验中针对马蜂窝等类型网站特性设计了QAF-GIWT框架,针对多层次质量指标的综合评估,采用了层次分析法进行可靠性综合评估,应用实验案例验证了QAF-GIWT框架的有效性。QAF-GIWT提供了一整套囊括质量维度、质量指标和质量评估方法的方案,可辅助进行海量异构动态的网络文本数据源的筛选和从中获取地理信息的过滤,大幅度减小信息获取的复杂度,降低数据存储冗余度。

  • 专刊:地理时空知识图谱理论方法与应用
    张雪英, 叶鹏, 张慧峰
    地球信息科学学报. 2023, 25(6): 1135-1147. https://doi.org/10.12082/dqxxkx.2023.230025

    基于位置描述进行空间定位是大数据时代位置服务向智能化转型的关键。针对不同语境中位置描述模糊性差异显著而难以定位的问题,本文提出一种面向模糊位置描述的形式化方法与推理机制。首先,通过梳理人类空间认知规律,明确自然语言中位置描述时关注的要素类型,研究模糊位置描述的形式化表示。然后,基于超赋值理论,从空间对象、距离关系和方向关系3个方面构建模糊位置描述的推理机制。顾及位置描述的上下文语义,利用观察值阈值开展空间推理实现定位。最后,设计收集位置描述的问答系统对方法进行验证。结果表明,本文方法能够依据实际应用场景及时调整位置描述的形式化表示粒度,空间推理结果贴合直观认知。

  • 专刊:地理时空知识图谱理论方法与应用
    蒋秉川, 黄梓航, 任琰, 孙勇, 范爱民
    地球信息科学学报. 2023, 25(6): 1148-1163. https://doi.org/10.12082/dqxxkx.2023.220967

    新型作战样式对战场环境服务保障提出了新要求,战场环境智能化服务急需基于全域多维战场环境数据实现知识的提升。针对战场环境智能认知的知识建模问题,将知识图谱与战场环境相结合,提出了战场环境知识分类方法,认为战场环境知识图谱是大数据人工智能条件下战场环境知识表示的一种新形式;针对三元组知识表示碎片化的问题,构建了战场环境时序超图表示模型,实现了实体知识、事件知识、影响过程知识和服务决策知识的多层次统一图建模,将各类知识表示为具备时空特点、场景特点的统一知识超图网络;最后,利用地图、事件、影响过程和作战影响效能等数据进行实验验证,超图网络从语义层面实现了各类战场环境知识的关联,可进一步为实现基于超图的智能推理和服务决策提供支撑。

  • 专刊:地理时空知识图谱理论方法与应用
    罗秋雨, 乐阳, 谷岩岩
    地球信息科学学报. 2023, 25(6): 1164-1175. https://doi.org/10.12082/dqxxkx.2023.230054

    知识图谱作为人工智能技术与应用中重要的数据基础设施,已经成为地理科学领域的一个研究热点。目前对地理知识图谱进行嵌入表达时通常使用默认的超参数(如2层网络搜索深度),但是部分地理知识图谱的网络规模和拓扑特征与通用知识图谱不同,其合理性需进一步论证。为此,本文围绕城市轨道交通人地关系,基于地铁线路网络的拓扑结构特征,结合客流数据、POI(兴趣点)数据以及建成环境数据等构建地铁出行知识图谱;利用GraphSAGE模型学习实体的多维度特征嵌入,并结合POI数据对站点分类结果进行语义识别,对比验证适合地铁出行知识图谱嵌入表达的网络搜索深度。不同于默认的 2层搜索深度,当搜索深度为3层时,本研究所构建的地铁出行知识图谱的节点嵌入效果最优。因此,地理知识图谱嵌入表达的超参数选择需要顾及时空和人类活动相关的网络规模和拓扑特征,要避免不加甄别地使用其他领域通用知识图谱的已有成果。使用3层搜索深度获得的地铁站点分类结果也更具合理的解释性,可为利用知识图谱和人工智能方法进行站点规划和客流预测提供基础。

  • 专刊:地理时空知识图谱理论方法与应用
    陈晖萱, 郭旦怀, 葛世寅, 王婧, 王彦棡, 陈峰, 杨微石
    地球信息科学学报. 2023, 25(6): 1176-1185. https://doi.org/10.12082/dqxxkx.2023.230034

    面向自然语言的地理空间场景描述一直是地理信息科学的重要研究方向,传统方法更注重空间关系的遍历性描述,难以融合人类空间认知,与人类自然语言有较大的差距。地理空间场景自然语言描述的本质是地理空间二维向量转换词空间一维向量的过程。本文提出M2T空间场景自然语言表达框架,通过空间场景理解、语言合成和注意力感知3个知识图谱,在多源知识图谱的融合机制下,生成自然语言空间场景描述文本。其中空间场景描述知识图谱解决遍历空间关系剪枝难题,同时通过建立空间关系图谱建立空间场景之间关联,支持空间场景连续表达;自然语言风格知识图谱建立空间表达与语言风格的关联,实现了贴切于空间自然语言表达的多样化语言风格;空间关注度知识图谱根据空间场景主体和客体交互状态,建立注意力矩阵捕捉自然语言空间表达的细微之处。以北京故宫为例设计的原型系统,实验表明系统生成结果与人类游记接近,且内容覆盖更完整,风格更多样,验证了M2T框架的有效性,并展现了空间场景自然语言描述应用的潜在价值。

  • 专刊:地理时空知识图谱理论方法与应用
    桂志鹏, 胡晓辉, 刘欣婕, 凌志鹏, 姜屿涵, 吴华意
    地球信息科学学报. 2023, 25(6): 1186-1201. https://doi.org/10.12082/dqxxkx.2023.230019

    主流地图检索方法多基于元数据文本匹配或图像内容相似度计算,缺乏对用户意图的主动理解,导致检索结果欠佳;而现有意图识别方法无法准确表达与识别复杂地理概念联合约束的地图资源检索需求。为此,本文提出一种顾及地理语义的地图检索意图形式化表达与识别方法,旨在利用相关反馈样本“感知”用户需求,以提升检索精度。该方法通过地理本体约束“意图-子意图-维度分量”模型的构建,实现检索需求的语义化描述;并将意图识别视为组合优化问题,基于最小描述长度准则、顾及地理概念从属关系的样本随机合并策略及贪心搜索实现最优意图识别。实验结果表明,相比基于频繁项集挖掘的RuleGO、决策树的DTHF算法,本文方法具有更高的识别准确度与噪声容忍度;随机合并策略可在不降低识别准确性的情况下有效缩短平均求解耗时;样本增强策略保证算法在样本规模仅为20时仍具有较高识别准确度。该方法可望应用于地理信息门户,提升各类地理信息资源共享与发现的服务品质。

  • 专刊:地理时空知识图谱理论方法与应用
    唐曾杨, 艾廷华, 徐海江
    地球信息科学学报. 2023, 25(6): 1202-1214. https://doi.org/10.12082/dqxxkx.2023.220761

    以图结构表达的知识图谱不仅在语义网络的描述与推理中发挥着重要作用,对于空间实体的结构化抽象与空间推理也具有重要意义。空间实体的联系信息在知识图谱中以图的边记录,通过路径探测、子图对齐、模式发现等基于边的知识图谱计算推理,在空间场景认知可发挥重要作用。地理知识图谱是一种对地理概念、实体及其相互关系进行形式化描述的知识系统,既有通用知识的内涵与特点,也有地理知识特定的时空特征,能够将语义模型和时空模型联系起来,描述语义关系、空间关系和时间关系,在地理知识的表达、理解、获取与推理方面有巨大的应用潜力。现有地理知识图谱的研究工作多集中于语义方面,语义关系的抽取与表达比较丰富,可以支持进一步的地理知识语义搜索等功能;然而地理知识图谱在时空模型上的知识表达比较缺乏,现有的空间关系局限在要素之间,很少涉及空间认知中进一步的分布态势、空间格局等,地理知识图谱在空间语义知识方面有待增强。本文基于知识图谱构建原理,以建筑群地理知识图谱构建为例,实现格网型建筑物模式的识别。先将建筑物抽象成实体,表达为图的节点,基于几何邻近分析提取建筑物之间的空间邻域关系,以此构建建筑群地理知识图谱;在此基础上结合建筑物模式识别的领域知识,进一步推理构建其他的空间语义关系,完善地理知识图谱;再将建筑群场景的格网模式表达为知识图谱的规则,在知识图谱上基于NoSQL语言进行推理。结果表明,本文方法能有效提取建筑物格网模式,验证了地理知识图谱在空间推理上的作用和在领域问题研究中的良好适应性,为地理知识图谱在空间认知领域的应用提供了思路。

  • 专刊:地理时空知识图谱理论方法与应用
    诸云强, 孙凯, 胡修棉, 闾海荣, 王新兵, 杨杰, 王曙, 李威蓉, 宋佳, 苏娜, 牟兴林
    地球信息科学学报. 2023, 25(6): 1215-1227. https://doi.org/10.12082/dqxxkx.2023.210696

    地球科学(以下简称地学)知识图谱具有强大的知识表示和语义推理能力,已成为地学大数据和地学人工智能发展必要的基础设施。然而,目前的地学知识图谱研究主要面向实验场景,缺乏面向实际应用的大规模地学知识图谱构建方法和共享应用框架研究,导致尚未真正在地学领域现实应用中得到使用。为此,本文面向地学大数据和人工智能研究与应用对地学知识图谱的迫切需求,首先研究了大规模地学知识图谱的构建技术,在此基础上,提出一种覆盖地学知识图谱构建、共享和应用全生命周期的总体框架。然后,以“深时数字地球(DDE)”国际大科学计划为例,开展了面向实际应用的知识图谱平台研发实践。最后,利用该平台,构建了DDE大规模地学知识图谱,开展了知识图谱开放共享,有效实现了知识图谱应用,证明本框架可有效支撑大规模地学知识图谱的构建与共享应用。本文对于地学知识图谱现实应用价值的实现具有重要的促进作用。

  • 专刊:地理时空知识图谱理论方法与应用
    王益鹏, 张雪英, 党玉龙, 叶鹏
    地球信息科学学报. 2023, 25(6): 1228-1239. https://doi.org/10.12082/dqxxkx.2023.210800

    我国是受台风影响最严重的国家之一,台风灾害严重威胁着沿海地区的社会经济和自然环境。近年来,随着知识图谱相关理论和应用技术的发展,其强大的知识整合与表达能力可以为台风灾害事件的动态监测与管理决策提供有力支持。针对当前台风灾害事件相关模型对时空过程表达不足等方面存在的问题,首先,从台风灾害机理出发,通过对台风灾害事件组成要素和动态特性的分析,提出从概念、对象、状态、特征和关系5个层次建立的台风灾害事件知识表达模型。其次,充分顾及台风灾害事件信息的多粒度特性,在模型中将不同的特征信息统一到各个对象中。为了突出台风灾害事件的时空过程,以状态作为过程在特定时空下的截面。最后,以2021年台风烟花事件为案例,构建了台风灾害事件知识图谱。结果表明,该模型不仅突出了事件中不同对象的特征刻画,通过多个对象的状态序列表达出台风灾害事件的时空过程,进一步提高台风灾害事件的全过程信息表达与存储,为应急决策方案提供有效的数据与决策辅助支持。

  • 专刊:地理时空知识图谱理论方法与应用
    杨玉莹, 赵学胜, 刘会园, 彭舒, 吕源鑫
    地球信息科学学报. 2023, 25(6): 1240-1251. https://doi.org/10.12082/dqxxkx.2023.210585

    湿地作为地表覆盖类型的一种,对于生物多样性与气候变化有着重要的意义,也是人类的基本生存环境之一。为更好地理解和表达湿地知识及分类间关系,本文提出了一种基于本体的湿地知识图谱构建方法。首先,利用GlobeLand30数据、生态地理分区数据,围绕湿地类型、特征分布等要素分析湿地领域知识,提取知识间的语义关系,通过本体建模形成湿地知识图谱的概念框架;其次,融合百度百科数据等进行湿地实体的提取、属性信息抽取,丰富湿地知识图谱的数据层;最后,使用图数据库Neo4j存储实体关系和实体属性,实现了湿地知识图谱构建。本文构建的知识图谱扩充了湿地实体的概念描述信息,探索了顾及时空特征的湿地知识表示方法,为地表覆盖领域的知识图谱构建提供了一个应用范例。

  • 专刊:地理时空知识图谱理论方法与应用
    刘建湘, 陈晓慧, 刘海砚, 张兵, 徐立, 刘涛, 付雨萌
    地球信息科学学报. 2023, 25(6): 1252-1266. https://doi.org/10.12082/dqxxkx.2023.210631

    随着全球经济一体化的深入推进,海上交通拥堵和船舶事故频发。为了对海上船舶活动进行监管和分析,传统的方法主要利用船舶定位数据进行数据挖掘,未结合其他海上多源数据进行船舶时空活动过程和行为模式分析,缺少深层次的知识挖掘。为此,本文综合利用多源数据,在提取轨迹的语义信息基础上,构建船舶活动知识图谱,为低知识密度的轨迹时空点序列向高阶语义知识转化提供一种有效途径。具体地,首先通过解析船舶活动的特征和组成要素,基于“过程-事件-行为”的核心思想,设计船舶活动知识图谱本体层;然后利用Stop/Move模型提取轨迹语义信息,利用DMCNN模型抽取船舶突发事件,完成实例层填充;最后通过构建原型系统,对上述模型和方法进行验证。结果表明,本文所构建的船舶活动知识图谱,可以支持对船舶常规活动和突发事件进行知识表示,并可以实现时空活动查询和回溯,进而达到语义增强效果,具有一定的应用价值。