第十九届中国地理信息科学理论与方法学术年会优秀论文

大语言模型驱动的台风灾害知识服务:关键技术与应用

  • 黄毅 , 1, 2 ,
  • 张雪英 , 3, 4, * ,
  • 盛业华 3, 4 ,
  • 夏永奇 1, 2 ,
  • 叶鹏 5, 6
展开
  • 1.南京邮电大学物联网学院,南京 210003
  • 2.江苏省智慧健康大数据分析与位置服务工程研究中心,南京 210023
  • 3.江苏省地理信息资源开发与利用协同创新中心,南京 210023
  • 4.南京师范大学 虚拟地理环境教育部重点实验室,南京 210023
  • 5.扬州大学城市规划与发展研究院,扬州 225127
  • 6.扬州大学建筑科学与工程学院,扬州 225127
*张雪英(1970—),女,四川眉山人,博士,教授,博士生导师,主要从事地理大数据挖掘、知识图谱和人文社会GIS等研究。E-mail:

作者贡献:Author Contributions

黄毅、张雪英和盛业华完成论文结构与方法的设计与提出;黄毅、夏永奇和叶鹏完成实验的设计与实现;黄毅和张雪英完成论文的撰写与修改。所有作者均阅读并同意最终稿件的提交。

HUANG Yi, ZHANG Xueying and SHENG Yehua completed the structure and experimental design; Huang Yi, Xia Yongqi and Ye Peng completed the experiments; Huang Yi and Zhang Xueying completed the writing and revision of the paper. All authors have read and approved the final manuscript for submission.

黄 毅(1992—),男,江西南昌人,博士,讲师,硕士生导师,主要从事地理人工智能研究。 E-mail:

收稿日期: 2025-04-17

  修回日期: 2025-05-16

  网络出版日期: 2025-06-05

基金资助

国家自然科学基金项目(42401570)

国家自然科学基金项目(42471463)

国家重点研发计划项目(2021YFB3900903)

自然资源要素耦合过程与效应重点实验室开放课题(2024KFKT020)

Typhoon Disaster Knowledge Service Driven by Large Language Models: Key Technologies and Applications

  • HUANG Yi , 1, 2 ,
  • ZHANG Xueying , 3, 4, * ,
  • SHENG Yehua 3, 4 ,
  • XIA Yongqi 1, 2 ,
  • YE Peng 5, 6
Expand
  • 1. School of Internet of Things, Nanjing University of Posts and Telecommunications, Nanjing 210003, China
  • 2. Smart Health Big Data Analysis and Location Services Engineering Lab of Jiangsu Province, Nanjing 210023, China
  • 3. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China
  • 4. Key Laboratory of Virtual Geographic Environment, Nanjing Normal University, Ministry of Education, Nanjing 210023, China
  • 5. Urban Planning and Development Institute, Yangzhou University, Yangzhou 225127, China
  • 6. College of Architectural Science and Engineering, Yangzhou University, Yangzhou 225127, China
*ZHANG Xueying, E-mail:

Received date: 2025-04-17

  Revised date: 2025-05-16

  Online published: 2025-06-05

Supported by

National Natural Science Foundation of China(42401570)

National Natural Science Foundation of China(42471463)

National Key Research and Development Program of China(2021YFB3900903)

Open Foundation of the Key Laboratory of Coupling Process and Effect of Natural Resources Elements(2024KFKT020)

摘要

目的】现阶段台风灾害知识服务常面临着“数据海量、知识难求、服务受限”的困境,如何从海量数据中快速凝练知识,提升台风灾害知识服务水平,减轻灾害带来的破坏性影响是当前研究的关键。大语言模型(LLMs)在自然语言处理领域展示出优异的性能,能够有效挖掘各类灾害信息,为深度灾害知识服务提供有效支撑。【方法】本研究深入解析了LLMs在台风灾害领域的应用前景,搭建了涵盖数据、知识、服务的台风灾害知识服务方法。【结果】就数据层到知识层而言,提出了基于Qwen2.5-Max的台风灾害知识图谱自动化构建方法。该方法首先提出了多层次台风灾害知识表达模型,而后构建了顾及时空特征和灾情影响的台风文本训练数据集。在此基础上采用“预训练+微调”的技术范式,实现了灾害数据到灾害知识的快速凝练。就知识层到服务层而言,提出了基于Qwen2.5-Max的台风灾害智能问答方法。该方法利用构建的台风灾害知识图谱,采取图检索增强生成(GraphRAG)方法,实现了基于图的灾害知识检索与面向用户的个性化防灾减灾指导方案生成。【结论】本研究充分展示了LLMs在台风灾害领域的广泛应用前景,也为LLMs与地理信息技术的交叉融合打下了基础,有望推动地理人工智能的进一步发展。

本文引用格式

黄毅 , 张雪英 , 盛业华 , 夏永奇 , 叶鹏 . 大语言模型驱动的台风灾害知识服务:关键技术与应用[J]. 地球信息科学学报, 2025 , 27(6) : 1249 -1262 . DOI: 10.12082/dqxxkx.2025.250175

Abstract

[Objectives] This study addresses the critical challenges in typhoon disaster knowledge services, which are often hindered by "massive data, scarce knowledge, and limited services." The core objective is to rapidly distill actionable knowledge from vast datasets to enhance disaster management efficacy and mitigate typhoon-related impacts. Large Language Models (LLMs), renowned for their superior performance in natural language processing, are leveraged to deeply mine disaster-related information and provide robust support for advanced knowledge services. [Methods] This research establishes a typhoon disaster knowledge service framework encompassing three layers: data, knowledge, and service. [Results] For the data-to-knowledge layer, an LLM-driven (Qwen2.5-Max) automated method for constructing typhoon disaster Knowledge Graphs (KGs) is proposed. This method first introduces a multi-level typhoon disaster knowledge representation model that integrates spatiotemporal characteristics and disaster impact mechanisms. A specialized training dataset is curated, incorporating typhoon-related texts with explicit temporal and spatial attributes. By adopting a "pre-training + fine-tuning" paradigm, the framework efficiently transforms raw disaster data into structured knowledge. For the knowledge-to-service layer, an LLM-based intelligent question-answering system is developed. Utilizing the constructed typhoon disaster KG, this system employs Graph Retrieval-Augmented Generation (GraphRAG) to retrieve contextually relevant knowledge from the graph and generate user-specific disaster prevention and mitigation guidance. This approach ensures seamless conversion of structured knowledge into practical services, such as personalized evacuation plans and resource allocation strategies. [Conclusions] The study highlights the transformative potential of LLMs in typhoon disaster management and lays a foundation for integrating LLMs with geospatial technologies. This interdisciplinary synergy advances Geographic Artificial Intelligence (GeoAI) and paves the way for innovative applications in disaster service.

1 引言

1.1 台风灾害研究亟需由数据驱动向知识驱动转变

台风是指发生在西北太平洋地区上的低压涡旋,是世界上破坏性最强的自然灾害之一。台风灾害不仅会产生强风、暴雨和风暴潮,还易引发山洪、泥石流、滑坡等次生灾害,对社会经济发展、人民财产安全等产生巨大影响[1]。中国是受台风灾害影响最频繁、灾情最严重的国家之一。全面提升台风灾害综合防治能力,对于我国防灾减灾建设具有重要的现实意义。
随着物联网、传感器、社交媒体等技术的进步,多类型、多尺度、全模态灾害大数据为台风灾害研究提供了丰富的数据资源。然而,单纯依赖数据体量大、类型多、尺度全的特点,其价值非但没被充分利用,反而陷入数据挖掘滞后业务需求的境地[2-3]。造成这一窘境的原因在于,传统数据驱动的研究范式虽能通过数据分析发掘出潜在模式规律,但其不可解释、稳健性差等弊端使其难以准确预测未来发展趋势[4-5]。在此背景下,科学研究的第五范式(AI for Science)顺应而生。该范式强调数据到知识的智能转换,认为领域知识需与大数据算法模型紧密结合,促进内在机理和外显数据的有机协同,从而提升复杂问题求解能力[6-7]。然而,由于缺乏统一的语义基础,多源灾害数据集成共享、数据挖掘和知识发现难度较大,亟需通过知识工程技术为新范式下的台风灾害研究建立系统化、形式化、规范化的知识体系[8-9]
作为大数据时代的知识工程集大成者,知识图谱是推动人工智能从数据驱动的感知时代到知识驱动的认知时代跨越的重要基石[10-12]。作为知识图谱在台风灾害领域的延申,台风灾害知识图谱不仅能为机器认知领域提供丰富的背景知识,更能打破气象、灾害、应急等学科间知识界限,促进灾害数据、知识和模型的有机结合,进而支撑深度灾害知识服务[13-14]。然而,当前知识图谱构建流程繁琐,且缺乏对灾害时空特征、多灾耦合作用等知识的考量。为此,如何围绕台风灾害时空特征及作用关系,充分挖掘大数据中蕴含的碎片化灾害知识,高效构建机器可理解、可计算、可推理的台风灾害知识库,实现由台风灾害大数据向大规模灾害知识库的跃迁,是全面提升台风灾害知识服务智能化水平的重要前提。

1.2 台风灾害知识服务的场景化与智能化升级

在实现由数据向知识的转变后,如何发展知识驱动的深度服务有待进一步探索[15-16]。当前学界对于知识服务的探究尚处于初步阶段,早期观点认为知识服务是指通过整合、组织、分析并推送知识资源,为用户提供个性化、智能化知识产品和服务的过程[17]。近年来,知识服务被视为一种基于显性与隐性资源的服务模式,其关键在于准确理解用户需求,并按需提供知识开发与创新等增值性服务[18]。相较于传统信息服务,知识服务以需求为牵引,通过知识获取与集成处理提供专业级服务应用[19]。尽管知识服务的定义尚未统一,但其内涵均包括资源整合、知识智能化推送、知识驱动的复杂问题求解[10,20]
在台风灾害领域,现有知识服务以数据驱动的信息服务为主导,主要包括灾害数据共享、灾情信息获取与可视化、灾害风险评估、灾害预报预警等。其中,灾害数据共享是灾害应急减灾的重要基础支撑条件,被联合国教科文组织认定为开发科学实践的重点领域之一[21]。灾害信息获取与可视化是指通过信息技术从不同来源数据中抽取得到结构化灾害信息资源,并对其进行可视分析,包括灾害信息抽取[22]、时空信息关联[23]与多模态数据融合[24]。灾害风险评估是对潜在灾害损失进行系统性分析量化,主要包括数据驱动、物理模型驱动及基于指标体系的风险评估方法[25]。灾害预报预警是当前最为重要的灾害知识服务类型之一,包括灾害预报和灾害预警[26]。其中,前者正经历由传统基于动力模型的气象参数预报,向基于机器学习的灾害影响预报转变;后者是对预报结果的深化,通过监测分析灾害前兆及时发布警报信息,从而减少台风灾害带来的损失与影响。
尽管台风灾害知识服务取得了显著进展,但现有服务注重广度而非深度,对灾害综合防治的支持十分有限。一方面,以数据获取与共享为代表的知识服务注重数据的整合管理,对于充分挖掘海量灾害数据的潜在价值探索不足;另一方面,以预报预警为代表的知识服务关注灾害强度变化,对灾害在不同场景下对不同要素造成的影响及应对关注不足。为此,构建面向具体场景与用户需求的精细化知识服务,是全面提升台风防灾减灾能力的关键。

1.3 大语言模型在台风灾害知识服务中的应用前景

大语言模型(Large Language Models,LLMs)是指在大规模文本语料上训练、拥有数十亿甚至更多参数的语言模型,具有优秀的自然语言理解和生成能力[27]。2018年,OpenAI提出了早期GPT模型,展现了模型在广泛应用场景中的强大能力。自此,各大厂商相继推出一系列LLMs,包括T5[28]、LLaMa[29]、DeepSeek-R1[30]等。随着模型规模的急剧增长,LLMs具备了更为强大的多任务适应能力和高度可扩展性,为知识服务的智能化、精准化发展提供了新的可能性,已被初步应用于地震、内涝等灾害领域[31]
在台风灾害知识服务领域,LLMs同样具备较大的潜在应用价值,包括如下2个方面: ① LLMs助力台风灾害数据整合。台风灾害数据来源丰富、格式多样,具有显著的语义不一致特征,限制了语义网络、框架表示、谓词逻辑等传统数据表示方法的使用。然而,LLMs可通过其强大的语义理解能力,实现多源异构数据的统一解析和关联,从而将海量灾害数据中存在的潜在规律提炼为机器可理解、可操作的灾害知识,形成台风灾害知识图谱;② LLMs拓展知识服务类型。LLMs基于其强大自然语言理解与生成能力,可为不同用户群体提供个性化知识服务,增强用户对复杂灾害场景的应对能力。例如,在政府机构层面,LLMs可快速生成灾情简报、救援方案等内容,为防灾减灾提供可靠的决策支持;在公众层面,LLMs能通过实时互动问答的形式,为公众提供精准的防护建议和心理疏导,完善台风防灾减灾宣教体系建设,全面提升全社会抵御自然灾害的综合防范能力。
综上,LLMs与台风灾害知识服务相结合,有助于打破现有体系中数据、知识、服务间的断层,拓宽台风灾害知识服务应用领域,实现从数据到知识、从知识到服务的全链条优化(图1)。为此,本研究将重点探索LLMs在台风灾害知识集成与台风灾害知识问答2个层次的应用及其实现路径,力争推动台风灾害知识服务的情境化、智能化与高效化发展。就知识集成而言,第2节系统阐述了基于LLMs与知识图谱的多源异构数据整合方法:研究首先基于Qwen2.5-Max模型,通过领域数据与通用数据的混合语料预训练,强化模型对台风灾害知识体系的语义理解能力,继而采用指令微调技术,实现台风灾害知识图谱的自动化构建。就知识问答而言,第3节构建了基于图检索增强生成的问答框架:通过检索知识图谱的三元组实现提示上下文增强,并结合LLMs的生成能力输出具备可信度、完整性和权威性的响应结果。最后,在第4节通过案例应用,验证本研究提出的数据、知识、服务一体化的可行性。
图1 台风灾害知识服务体系

Fig. 1 Knowledge service system for typhoon disasters

2 台风灾害知识图谱自动化构建

2.1 总体思路

本文基于“预训练+微调”范式 ,利用LLMs完成台风灾害知识图谱构建。其中预训练是指在特定领域的专属语料库上对基座模型(Foundation Model,FM)进一步训练,以增强其对领域数据的语义理解能力。针对台风领域,通过引入领域特定的术语、概念和语义规则,使模型能够更精准地捕捉灾害语境下的信息特征。虽然预训练后的模型掌握了领域知识,但仍然不具备领域任务的能力,需要对其进一步微调使之与知识抽取和融合2个任务对齐。微调是指利用标注数据集,对预训练模型(Pre-Train Model,PTM)进行任务层面的优化调整,从而使模型能够胜任具体应用场景。在台风灾害知识图谱构建任务中主要包括实体识别、关系提取和实体融合。通过微调,模型能够快速适应不同的数据需求,从多源异构数据中一步提取结构化知识,从而实现知识图谱的自动化构建。就台风灾害领域而言,台风灾害知识图谱的构建也可参照该流程实现,其总体技术路线如图2所示。
图2 LLMs驱动的台风灾害知识图谱构建技术路线

Fig. 2 Technical route for constructing a typhoon disaster knowledge graph by LLMs

2.2 关键技术

2.2.1 台风灾害知识表达模型构建

台风灾害知识表达模型需从演化过程和灾情影响双视角下刻画[32]。具体来说,演化过程借鉴“过程-关系”表示方法[11],提出了“对象-阶段-状态-特征-关系”的多层知识表达模型。其中,对象层包括涉及的各类实体;阶段层围绕台风发展历程划分为形成、发展、持续、衰亡4个阶段;状态层是对过程的细化,用于描述对应时刻下台风灾害的基本情况;特征层定义了实体在相应状态下的时空属性、行为特征等;关系层定义了知识图谱中包含的各类关系,如时序关系、拓扑关系、因果关系、作用关系等。
灾情影响知识从灾害学视角出发,提出了“对象-承灾体类别-受灾实例-特征-关系”的知识表达模型。其中对象层描述灾害中涉及的各类实体;承灾体类别根据《自然灾害承灾体分类与代码》 (GB/T 32572—2016)[33],划分为人、财产、资源和环境3大类15小类。每类承灾体派生出多个受灾实例,每个实例包含独特的灾害特征,所有特征组合形成特征层。

2.2.2 基座模型预训练

基座模型预训练需预先构建高质量台风灾害语料库,为模型的领域适应性训练提供基础。该语料库包含历史案例、数据资料、新闻资讯。其中,前两类数据为模型提供了台风灾害领域的深度知识,如灾害发生的规律、统计数据及典型案例等;新闻资讯数据补充了灾害动态信息,使模型具备捕捉实时变化的能力。在数据预处理阶段,基于式(1)所示的正则表达式去除数据中的HTML标签、特殊符号等噪声;在此基础上,依据国家规范对个人信息、地理坐标等敏感数据进行脱敏处理;最后将清洗后的文本转换为JSON格式的训练语料。台风灾害语料库制作完成后,采用混合语料训练策略,将通用语料与灾害语料按不同比例组合为预训练语料集输入Qwen2.5-Max,以实现通用性与专用性的平衡。
T c l e a n = R e g e x R e p l a c e ( T r a w , { ϕ h t m l ,   ϕ s y m b o l } )
式中:ϕhtml表示HTML标签正则模式; ϕsymbol为特殊符号过滤规则。
预训练从Qwen2.5-Max权重初始化开始,保留了模型在广泛语料上的学习能力,降低了实现的技术门槛,目标函数如式(2)所示,模型会调整自身参数,在不丢失通用语言能力的同时,逐步适应台风灾害语境的语义特性。同时,模型训练可采用自适应学习率调整策略,根据领域数据的复杂性动态调节学习速率。在训练初期,保持领域语料的权重较低,以防止模型过快丧失通用语言能力;在后续迭代中,逐步增加领域语料比例,使模型逐步向台风灾害领域的知识分布收敛。每轮迭代后,通过验证集上的表现监控模型性能,并根据损失函数的变化动态调整训练参数。预训练完成后,通过文本续写等方式检验预训练效果。
L p r e t r a i n = α L g e n e r a l + ( 1 - α ) L d o m a i n
式中: α∈[0,1],为混合比例系数; Lgeneral表示通用语料的交叉熵(Cross-Entropy,CE)损失; Ldomain为台风灾害语料的领域适配损失。

2.2.3 预训练模型微调

为使模型具备高效执行实体识别、关系提取和实体融合等任务的能力,预训练后的Qwen2.5-Max模型可通过指令微调(Instruction-tuning)的方式进行增强。指令微调的目标函数如式(3)所示。模型在微调阶段的目标是优化2个部分:① 经验风险最小化,通过最小化交叉熵损失LCE来提高模型在训练数据上的表现; ② 结构风险最小化,通过添加正则化项βR(θ)来控制模型的复杂度,避免过拟合。另外指令模板Ik的引入使得模型能够根据不同的任务或指令调整其行为,从而实现灵活的任务适配。
L f i n e t u n e = i = 1 N L C E ( y i ,   f θ ( x i ; I k ) ) + β R ( θ )
式中: LCE(yi, fθ(xi; Ik))为交叉熵损失,用于衡量模型预测值fθ (xi; Ik)与真实标签yi之间的差异; Ik是指令模板; βR(θ)是正则化项; R(θ)是正则化函数; β是惩罚系数。
指令生成是指令微调的第一步,该过程需解决如下问题:① 如何使LLMs适配知识图谱构建任务。由于LLMs是参数化的隐式知识,知识图谱是结构化的显性知识,需探索二者间协同方式以弥补其中存在的鸿沟; ② 如何提升基于LLMs的台风灾害知识图谱构建能力。在完成与知识图谱的协同后,需进一步明确知识图谱的构建过程,并将此过程以指令的形式激发LLMs以保障图谱构建质量。
针对问题①,可通过设计角色扮演、格式输出 2项任务用于协同LLMs和知识图谱。其中,角色扮演任务赋予LLMs特定角色,使之能迅速转换为领域专家[34];而格式输出任务明确LLMs的输出格式,获取所需的结构化知识。针对问题②,可进一步设计4项任务以提高LLMs性能,分别为时空知识补全,用于构建多维时空框架;共指消解,用于解析复杂指代关系;实体对齐,用于解决异构数据源的一致性;生命周期判定,用于捕捉台风演化过程。上述任务通过文本描述嵌入到指令中用于指令微调LLMs,共同构建台风灾害知识图谱。

2.2.4 台风灾害知识图谱的质量评价方法

结合文献[35]—文献[36]中提出的关于GeoKG质量评价框架和台风灾害知识图谱的特点,可从准确性与完整性2个维度入手,评价台风灾害知识图谱的质量。
(1)准确性评价。准确性是衡量图谱中各类知识元素是否真实、无歧义的核心指标。本研究从 4个层面进行准确性细分: ① 概念准确率(Concept Accuracy,CA):判断图谱中引入的每一个概念是否准确,是否符合灾害学与地理学等权威术语标准;② 实体准确率(Entity Accuracy,EA):检测知识图谱中台风对象、承灾体等是否被正确识别,并准确映射到对应类别; ③ 属性准确率(Attribute Accuracy,AA):评估实体属性是否能够准确描述其行为或状态特征; ④ 关系准确率(Relation Accuracy,RA):检验实体间的关系是否符合真实语义逻辑,是否存在误连、漏连等问题。准确率的计算方式如下:
A c c u r a c y i   =   C o r r e c t l y   M a t c h e d   I t e m s i T o t a l   M a t c h e d   I t e m s i   ×   100 % ,   i { C A ,   E A ,   A A ,   R A }
式中:i可以是CA、EA、AARA;(Correctly Matched Itemsi)为正确匹配的三元组数量;(Total Matched Itemsi)为参与匹配的三元组总数。
(2)完整性评价。完整性评价主要用于反映知识图谱能否全面刻画灾害关键要素与关系结构,尤其关注图谱对“演化过程”和“灾情效应”等知识的覆盖能力。该评价同样参照上述4个维度,即: ① 概念完整性(Concept Integrity,CI):衡量图谱是否涵盖灾害学中应包含的核心概念; ② 实体完整性(Entity Integrity,EI):检测图谱有效提取并涵盖各类关键实体,尤其是台风本体、各阶段现象、承灾体等; ③ 属性完整性(Attribute Integrity,AI):评估图谱能否全面表征实体的特征信息,如时空坐标、强度等级等;④ 关系完整性(Relation Integrity,RI):判断图谱是否完整刻画了实体间应有的关系结构。完整性计算方式如下:
C o v e r a g e i   =   V a l i d   I t e m s i     b y   L L M s T o t a l   I t e m s i     b y   h u m a n   ×   100 % ,     i { C I ,   E I ,   A I ,   R I }
式中:i可以是CI、EI、AIRI,(Valid Itemsi by LLMs)为LLMs抽取的三元组总数;(Total Itemsi by human)代表由人工提取的三元组总数。

3 台风灾害智能问答服务

3.1 总体思路

为了实现高效、精准的台风灾害智能问答服务,本文提出了一种结合LLMs与知识图谱的智能问答方法,并通过图检索增强生成技术(Graph Retrieval Argument Generate,GraphRAG)构建台风灾害智能问答系统。GraphRAG是一种图基检索增强生成框架[37],具有高效检索、复杂推理、高可扩展性等特征,有助于解决台风灾害场景中知识时效性、语义关联性和复杂推理能力不足等问题。
具体来看,知识图谱是台风灾害智能问答的核心组件,相关理论与方法已在第2节阐述。问答系统通过GraphRAG技术实现基于知识图谱的深度检索和上下文生成,利用用户输入的语义特征在知识图谱中检索相关节点及其关系路径,并最终将知识图谱的结构化数据与用户的非结构化信息整合为统一的上下文内容输入LLMs(本节同样以Qwen2.5-Max为基座模型)进行生成式回答。相较于传统知识问答方法,基于GraphRAG的智能问答具有显著的技术优势。一方面,知识图谱的结构化特性为LLMs提供了显式语义约束,减少了结果中可能出现的幻觉;另一方面,知识图谱的深度检索和LLMs的隐式推理能力使得系统能处理复杂的多实体、多关系问题。从技术实现上看,基于GraphRAG的台风灾害智能问答以用户输入的问题为起点,通过多阶段的检索与生成实现知识的精准推荐。核心流程包括基于图的知识索引(Graph-Based Indexing)、图引导下的知识检索(Graph-Guided Retrieval)和图增强下的结果生成(Graph-Enhanced Generation),如图3所示。
图3 结合知识图谱和大语言模型的台风灾害智能问答

Fig. 3 Intelligent Q&A diagram for typhoon disasters combining knowledge graph and LLMs

3.2 关键技术

3.2.1 基于图的知识索引

基于图的知识索引旨在创建一个高效的索引结构,以便于后续快速检索相关信息,包括数据收集、知识抽取、层次聚类、社区摘要生成(Community Summaries Generation)。其中,前2个环节用于知识图谱构建,相关方法已在上一节阐述,此处不再赘述。层次聚类主要用于优化知识图谱的组织形式,可采用Leiden算法实现。作为一种先进的社区检测算法,Leiden能够有效地发现图中自然形成的社区结构,即一组内部联系紧密但与其他密集群体连接较为稀疏的节点集合。通过对初始知识图谱执行这种分层聚类,可将相似或相关的实体归类到同一社区,实现对大规模复杂网络的简化。最后,在社区摘要生成过程中,采用自下而上的方法为每个社区及其重要组成部分创建简明扼要的描述。这些摘要概括了社区内的主要实体、关键主张(claim)及实体间关系,提供了一个快速了解整个数据集概貌的窗口。

3.2.2 图引导下的知识检索

在构建完成基于图的索引后,如何从庞大的知识图谱中找到最相关的内容作为问答的基础仍有待解决,而图引导下的知识检索为该问题的解决提供了有效途径。具体来说,LLMs通过解析提问中出现的实体和关系明确用户需求,并将其映射到对应的知识节点上。例如,“7月3日台风烟花登陆广东”的提问会转化为查找与所述日期、位置及灾害对应的地理要素。基于上述转换,系统可采用图遍历算法寻找与问题密切相关的子图,并将搜索结果导出供后续回答使用。此外,如何设定检索范围同样值得深入探究。一方面,为了有效提升检索效率,可设置一定的限制条件(如最大深度、节点数量上限等)以避免冗余的计算开销;另一方面,为保障结果的完整性,也可进一步扩大搜索范围,以实现对灾害信息全貌的了解。

3.2.3 图增强下的结果生成

经上述两步后,系统将获得若干个高质量候选子图用于结果生成。该步骤总体流程可概况为: ① 子图语义信息解析。从子图中总结事实与关系,确保生成内容紧扣用户查询的核心需求; ② 问答结果生成。台风灾害智能问答以LLMs作为生成器,将子图中的结构化知识转化为自然语言表述。在生成过程中,模型结合子图的结构特征(如节点权重和关系类型),剔除无关内容,优先突出关键信息。例如,在回答“某台风登陆的影响”时,生成模型会综合提取子图中影响范围、受灾区域、经济损失等信息,组织形成语法正确、逻辑连贯的文本。

3.2.4 问答结果的质量评价方法

与2.2.4节不同,本节重点阐述台风灾害知识问答结果的质量评价方法。该方法采用独立的自然语言生成任务评价框架,分为客观评价和主观评价2类。
(1)客观评价。客观评价侧重于对生成文本与参考答案在形式和语义上的相似度进行评价,主要包括精确匹配率(Exact Match,EM):衡量模型生成答案是否与参考答案在字面上完全一致[38];F1分数:兼顾精确率与召回率,衡量答案对参考答案信息的整体覆盖能力;BLEU分数[39]:基于n-gram重叠程度评估语言生成质量,衡量表达是否流畅、通顺[40];余弦相似度(Cosine Similarity):基于嵌入向量的余弦相似度计算生成文本与参考答案在语义层面的接近程度,能弥补BLEU对词序敏感的缺陷。相关的计算方式如表1所示。
表1 评价方式分类与计算

Tab. 1 Classification and calculation of evaluation methods

评价方式 计算方法 公式编号
客观评价 EM E M = × 100 % (6)
F1 F 1 = 2 P r e c i s i o n R e c a l l P r e c i s i o n + R e c a l l (7)
BLEU B L E U = B P e x p 1 N n = 1 N l o g p n (8)
余弦相似度 C o s i n e   s i m i l a r i t y =   A B A   B | =   i n A i B i i = 1 n A i 2 i = 1 n B i 2 (9)
主观评价 DeepSeek/ChatGPT 专家打分
(2)主观评价。由于台风灾害知识问答任务开放性高,客观评价指标难以充分表征系统性能的语义维度。为此,可建立基于预训练语言模型的代理评估机制,通过引入以商用LLMs(DeepSeek/ChatGPT等)为专家代理的协同评分框架,模拟专家评审的认知决策过程。该方法将模型生成的参考解与候选答案进行多维度语义对比,在保证评估效率的前提下显著降低人工评审成本,已在地学[41]、化学[42]、社会科学[43]等领域扩展应用。

4 案例应用

4.1 基于LLMs的台风灾害知识图谱构建

基于第2节阐述的技术细节,本文以维基百科与百度百科中的台风词条数据、灾害新闻报道数据、中国气象年鉴数据及中国海洋灾害公报等数据为主要知识源(表2),初步实现了顾及演化过程和灾情影响的台风灾害知识图谱构建。本文涉及的所有实验数据及代码可下载于: https://pan.baidu.com/s/1Dy0bnklBIBte-XO7pMwWTwpwd=hrte,提取码: hrte。
表2 灾害数据基本信息

Tab. 2 Basic information of typhoon disaster data

来源 类型 规模 时间跨度/年 预处理后的体量/万tokens
中国气象年鉴、海洋灾害公报 数据资料 15篇 2011—2023 5.4
维基百科、百度百科 历史案例 69个词条 2006—2023 21.9
新闻报道、官方资讯 新闻资讯 120篇报道 2015—2023 32.7
构建完成的知识图谱包含7 221个节点、52条边和5 776条三元组,支持中文语境下台风气象学知识、台风灾害案例知识等内容的查询。在查询时,通过知识图谱中构建的语义网络,可以迅速获取所需的灾害知识,并对知识的逻辑结构进行可视化展示。其中,图4遵照了“对象-承灾体类别-受灾实例-特征-关系”的灾情知识表达逻辑,刻画了台风灾害在不同时空状态下的灾情效应。图5则遵循了“对象-阶段-状态-特征-关系”的知识表达层次,展示了台风灾害演化过程中涉及的全生命周期知识。
图4 台风“Khanun”的灾情效应

Fig. 4 The disaster effects of typhoon "Khanun"

图5 台风“Khanun”演化过程

Fig. 5 The evolution of typhoon "Khanun"

台风灾害知识图谱质量评价采用2.2.4节所述方法,基于概念、实体、属性及关系4类核心语义单元,从准确性与完整性2个维度量化评价。具体来说,对比随机抽样结果与专家标注的基准数据集,重点评估演化过程和灾情效应两类知识的表征能力。实验结果如表3所示,表中零样本提示定义为仅含任务描述的基础提示模板,上下文学习是指通过嵌入单样本/三样本示例实现,指令微调指使用的生成模型为训练后的LLMs。显然,本文所提方法在跨层级知识抽取中较基线模型有显著优势。
表3 台风灾害知识图谱质量评价结果

Tab. 3 Quality evaluation of typhoon disaster knowledge graph (%)

提示方式 评价指标
CA EA AA RA CI EI AI RI
演化过程 零样本提示 73.19 74.90 74.63 74.01 73.37 75.61 73.49 73.85
上下文
学习
单样本提示 90.47 88.70 88.37 89.55 90.17 91.36 88.69 88.30
三样本提示 96.03 94.47 96.06 93.34 96.32 94.29 97.07 97.05
指令微调 98.41 98.13 98.29 98.33 98.73 98.53 99.56 98.52
灾情效应 零样本提示 70.22 69.50 70.01 71.34 71.81 70.04 70.17 70.38
上下文
学习
单样本提示 79.46 78.59 80.37 75.29 79.48 78.02 78.01 76.13
三样本提示 82.20 80.06 81.42 80.41 80.76 79.32 78.37 80.70
指令微调 98.37 98.82 98.02 97.59 98.31 98.78 98.48 98.26

注:加粗数值为最优解。

4.2 知识图谱增强LLMs的台风灾害智能问答

台风灾害智能问答能精确定位用户所需知识,通过交互式问答提供个性化信息服务。基于第3节所述方法,利用前期构建好的台风灾害知识图谱,增强模型对台风灾害复杂语境的解读能力;在此基础上,通过GraphRAG构建知识图谱增强的智能问答系统,将多灾种知识纳入台风灾害知识库,提升模型对于复杂台风灾害的理解,使其能对用户提问做出更准确的回应。
智能问答结果评价采用3.2.4节所述方法,以余弦相似度为指标评价结果的可靠性。若参考答案和模型生成答案越相似,则得分趋近于1,反之趋近于0。如表4所示,实验数据源自随机采样的100组问答对,参考答案由领域专家独立作答生成,模型生成答案与参考答案在高相似度区间的个数越多,表明模型生成的答案越可靠。结果表明,GraphRAG增强的生成结果在高相似度区间(0.8,1.0)的分布密度显著高于其他方法,验证了知识图谱与LLMs协同框架的可靠性。
表4 问答结果质量评价结果

Tab. 4 Evaluation for the quality of Q&A results

提示方式 余弦相似度区间
(0.0,0.2) (0.2,0.4) (0.4,0.6) (0.6,0.8) (0.8,1.0)
演化过程 零样本提示 28 19 27 11 15
上下文 单样本提示 21 14 24 18 23
学习 三样本提示 12 17 16 22 33
GraphRAG 6 14 11 21 48
灾情效应 零样本提示 26 15 31 10 18
上下文 单样本提示 17 15 22 25 21
学习 三样本提示 11 10 19 27 33
GraphRAG 4 7 18 20 51

注:加粗数值为最优解。

5 结论与讨论

5.1 结论

随着数字化与物联网技术的快速发展,海量灾害数据为台风灾害知识服务提供了数据支撑。知识图谱作为多源异构数据语义互联的核心基础,LLMs作为高效的自然语言处理工具,二者具有天然的互补性。为此,本文提出了知识图谱与LLMs的协同框架,以Qwen2.5-Max为基座模型,实现了台风灾害知识图谱构建与知识图谱服务的双重创新,为完善“数据-知识-服务”提供了全链路解决方案。
(1)知识图谱构建:针对通用知识图谱(如Wikidata、DBpedia)在时空动态性与因果逻辑建模上的固有缺陷[44],构建了顾及演化过程和灾情影响的台风灾害知识图谱,可实现台风致灾因子、承灾体脆弱性、应急资源分布等要素的时空关联建模与因果推理。相较于传统分布式构建方法[45],本文基于LLMs“预训练+指令微调”的技术范式,以Qwen2.5-Max为例,明确了最新研究[44]所提图谱构建理论,重构了图谱构建方法,简化了图谱构建流程。
(2)知识服务:现有地学问答模型(如K2[46]、GeoGPT[47])虽然具有一定的自然语言交互能力,但其生成结果因缺乏结构化知识约束易导致显著事实性偏差[48]。因此,本文创新性地提出将知识图谱的时空关系引入到图检索增强生成(GraphRAG)框架,利用图谱节点与文本语义的联合检索机制以及LLMs的文本生成能力,研制了基于Qwen2.5-Max的台风灾害问答智能体,为LLMs与知识图谱协同增强的台风灾害知识服务提供了参考方案。

5.2 讨论

LLMs驱动的台风灾害知识服务研究尚处于起步阶段,相关理论方法仍有待完善。未来研究需在以下4个方面深入探索。
(1)时空过程和灾害机理等复杂知识表示。台风灾害领域知识已远超出三元组所能表达的简单关联事实。尽管本文提出了多层次灾害知识表达模型,其本质仍是三元组模型,该模型受限于底层结构的先天缺陷,在根本上限制了知识图谱的表达与推理能力。目前,时空语义增强仍然是知识图谱在知识表示方法上面临的开放性问题。为此,如何基于超图等图论方法,彻底改进现有三元组表达模式,是对台风灾害知识图谱乃至地学知识图谱语义表达能力提出的基本要求,也是本研究后续需进一步探索的基础科学问题。
(2)面向多源异构数据的台风灾害知识获取。台风灾害的精准监测与预警对台风防灾减灾至关重要,而多源异构灾害知识获取是提升灾害感知与决策能力的关键。然而,本文所采用的数据来源较为单一,在台风灾害知识获取的全面性和鲁棒性方面存在一定局限,未能充分利用多源异构数据的互补优势。为此,如何突破多模态数据融合与知识对齐技术,通过跨模态表征学习和知识图谱构建,实现台风灾害多维度知识的深度关联与协同推理,是本研究后续待解决的一个关键技术问题。
(3)台风灾害知识图谱和大语言模型的深度融合。数据挖掘与人工智能深度耦合是当前知识服务升级的关键,充分利用知识图谱和LLMs的优势实现融合互补也在人工智能领域达成共识。尽管本文通过GraphRAG技术实现了二者的初步融合,但召回文本质量不高、排序机制不严谨、知识库内容缺陷等问题仍影响着模型的可靠性。为此,探索符合台风灾害科学特性的知识图谱和LLMs融合方法,避免二者融合陷入“物理约束僵化”或“黑箱化预测”的两难困境,是后续研究亟待解决的另一个关键问题。
(4)大语言模型拓展台风灾害深度知识服务。知识图谱构建与知识问答作为本文重点解析的两大应用服务,展现了LLMs在多源数据整合与结构化知识输出方面的卓越能力。然而,得益于模型强大的知识理解与推理能力,其在知识服务领域的应用理应更为深远。为此,如何拓宽LLMs在台风灾害知识服务领域的应用,是后续服务需要关注的一大应用问题。
AI使用说明:本文没有使用AI技术。
■ 本文图文责任编辑:黄光玉 蒋树芳

利益冲突:Conflicts of Interest 所有作者声明不存在利益冲突。

All authors disclose no relevant conflicts of interest.

[1]
李泽椿, 张玲, 钱奇峰, 等. 中央气象台台风预报业务的发展及思考[J]. 大气科学学报, 2020, 43(1):10-19.

[Li Z C, Zhang L, Qian Q F, et al. The development and consideration of typhoon forecast operation of National Meteorological Center[J]. Transactions of Atmospheric Sciences, 2020, 43(1):10-19.] DOI:10.13878/j.cnki.dqkxxb.20200110015

[2]
李德仁, 眭海刚, 倪梓轩, 等. 论天空地一体化灾损监测评估[J]. 中国减灾, 2022(5):28-31.

[Li D R, Sui H G, Ni Z X, et al. On disaster monitoring and evaluation of sky-ground integration[J]. Disaster Reduction in China, 2022(5):28-31.] DOI:10.3969/j.issn.1002-4549.2022.05.010

[3]
周成虎, 王华, 王成善, 等. 大数据时代的地学知识图谱研究[J]. 中国科学:地球科学, 2021, 51(7):1070-1079.

[Zhou C H, Wang H, Wang C S, et al. Research on geo-knowledge map in the age of big data[J]. Scientia Sinica (Terrae), 2021, 51(7):1070-1079.] DOI:10.1360/SSTe-2020-0337

[4]
陆锋, 诸云强, 张雪英. 时空知识图谱研究进展与展望[J]. 地球信息科学学报, 2023, 25(6):1091-1105.

DOI

[Lu F, Zhu Y Q, Zhang X Y. Spatiotemporal knowledge graph: Advances and perspectives[J]. Journal of Geo-information Science, 2023, 25(6):1091-1105.] DOI:10.12082/dqxxkx.2023.230154

[5]
张钹, 朱军, 苏航. 迈向第三代人工智能[J]. 中国科学:信息科学, 2020, 50(9):1281-1302.

[Zhang B, Zhu J, Su H. Toward the third generation of artificial intelligence[J]. Scientia Sinica (Informationis), 2020, 50(9):1281-1302.] DOI:10.1360/SSI-2020-0204

[6]
李国杰. 智能化科研(AI4R):第五科研范式[J]. 中国科学院院刊, 2024, 39(1):1-9.

[Li G J. AI4R: The fifth scientific research paradigm[J]. Bulletin of Chinese Academy of Sciences, 2024, 39(1):1-9.] DOI:10.16418/j.issn.1000-30 45.20231007002

[7]
诸云强, 孙凯, 王曙, 等. 顾及复杂时空特征及关系的地球科学知识图谱自适应表达模型[J]. 中国科学:地球科学, 2023, 53(11):2609-2622.

[Zhu Y Q, Sun K, Wang S, et al. An adaptive representation model for geoscience knowledge graphs considering complex spatiotemporal features and relationships.[J] Scientia Sinica (Terrae), 2023, 66(11):2563-2578.] DOI:10.1360/SSTe-2022-0371

[8]
林珲, 游兰, 胡传博, 等. 时空大数据时代的地理知识工程展望[J]. 武汉大学学报(信息科学版), 2018, 43(12):2205-2211.

[Lin H, You L, Hu C B, et al. Prospect of geo-knowledge engineering in the era of spatio-temporal big data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12):2205-2211.] DOI:10.13203/j.wh ugis20180318

[9]
诸云强, 孙凯, 胡修棉, 等. 大规模地球科学知识图谱构建与共享应用框架研究与实践[J]. 地球信息科学学报, 2023, 25(6):1215-1227.

DOI

[Zhu Y Q, Sun K, Hu X M, et al. Research and practice on the framework for the construction, sharing, and application of large-scale geoscience knowledge graphs[J]. Journal of Geo-information Science, 2023, 25(6):1215-1227.] DOI:10.12082/dqxxkx.2023.210696

[10]
陈军, 刘万增, 武昊, 等. 基础地理知识服务的基本问题与研究方向[J]. 武汉大学学报(信息科学版), 2019, 44(1):38-47.

[Chen J, Liu W Z, Wu H, et al. Basic issues and research agenda of geospatial knowledge service[J]. Geomatics and Information Science of Wuhan University, 2019, 44(1):38-47.] DOI:10.13203/j.whugis20180441

[11]
张雪英, 张春菊, 吴明光, 等. 顾及时空特征的地理知识图谱构建方法[J]. 中国科学:信息科学, 2020, 50(7):1019-1032.

[Zhang X Y, Zhang C J, Wu M G, et al. Spatiotemporal features based geographical knowledge graph construction[J]. Scientia Sinica (Informationis), 2020, 50(7):1019-1032.] DOI:10.1360/SSI-2019-0269

[12]
张永军, 李彦胜, 党博, 等. 多模态遥感基础大模型:研究现状与未来展望[J]. 测绘学报, 2024, 53(10):1942-1954.

[Zhang Y J, Li Y S, Dang B, et al. Multi-modal remote sensing large foundation models: Current research status and future prospect[J]. Acta Geodaetica et Cartographica Sinica, 2024, 53(10):1942-1954.] DOI:10.11947/j.AGC S.2024.20240019

[13]
王卷乐, 韩雪华, 卜坤, 等. 防灾减灾知识服务系统及其应用研究[J]. 全球变化数据学报(中英文), 2020, 4(1):16-23.

[Wang J L, Han X H, Bu K, et al. Knowledge service system on disaster risk reduction and its application in social media analysis[J]. Journal of Global Change Data & Discovery, 2020, 4(1):16-23.] DOI:10.3974/geodp.2020.01.03

[14]
Zhang X Y, Huang Y, Zhang C J, et al. Geoscience knowledge graph (GeoKG): Development, construction and challenges[J]. Transactions in GIS, 2022, 26(6):2480-2494. DOI:10.1111/tgis.12985

[15]
侯志伟, 荆文龙, 秦承志, 等. 智能时代的红树林知识服务展望:从植物图谱到知识图谱[J]. 中国科学:地球科学, 2025, 55(1):111-125.

[Hou Z W, Jing W L, Qin C Z, et al. Prospects on mangrove knowledge services in the smart era: From plant atlas to knowledge graphs[J]. Scientia Sinica (Terrae), 2025, 55(1):111-125.] DOI:10.1360/SSTe-2024-0022

[16]
周成虎, 孙九林, 苏奋振, 等. 地理信息科学发展与技术应用[J]. 地理学报, 2020, 75(12):2593-2609.

DOI

[Zhou C H, Sun J L, Su F Z, et al. Geographic information science development and technological application[J]. Acta Geographica Sinica, 2020, 75(12):2593-2609.] DOI:10.11821/dlxb202012004

[17]
Muller E, Zenker A. Business services as actors of knowledge transformation: The role of KIBS in regional and national innovation systems[J]. Research Policy, 2001, 30(9):1501-1516. DOI:10.1016/S0048-7333(01)00164-0

[18]
刘万增, 陈军, 翟曦, 等. 时空知识中心的研究进展与应用[J]. 测绘学报, 2021, 50(9):1183-1193.

DOI

[Liu W Z, Chen J, Zhai X, et al. Research progress and application of spatiotemporal knowledge center[J]. Acta Geodaetica et Cartographica Sinica, 2021, 50(9):1183-1193.] DOI:10.11947/j.AGCS.2021.20210160

[19]
王卷乐, 张敏, 袁月蕾, 等. 知识服务驱动“一带一路”防灾减灾[J]. 科技导报, 2020, 38(16):96-104.

DOI

[Wang J L, Zhang M, Yuan Y L, et al. Knowledge services drive disaster risk reduction in the Belt and Road initiative[J]. Science & Technology Review, 2020, 38(16):96-104.] DOI:10.3981/j.issn.1000-7857.2020.16.011

[20]
龚健雅, 耿晶, 吴华意. 地理空间知识服务概论[J]. 武汉大学学报(信息科学版), 2014, 39(8):883-890.

[Gong J Y, Geng J, Wu H Y. Geospatial knowledge service: A review[J]. Geomatics and Information Science of Wuhan University, 2014, 39(8):883-890.] DOI:10.13203/j.whugis20140119

[21]
闵晓冬, 王卷乐, 韩保民, 等. 开放科学背景下全球灾害数据共享平台建设与应用的现状分析[J]. 中国科技资源导刊, 2023, 55(5):41-52,89.

[Min X D, Wang J L, Han B M, et al. Evaluation of the international disaster database under the open science initiative[J]. China Science & Technology Resources Review, 2023, 55(5):41-52,89.] DOI:10.3772/j.issn.1674-1544.2023.05.005

[22]
Hu Y J, Mai G C, Cundy C, et al. Geo-knowledge-guided GPT models improve the extraction of location descriptions from disaster-related social media messages[J]. International Journal of Geographical Information Science, 2023, 37(11):2289-2318. DOI:10.1080/13658816.2023.2266495

[23]
Sun H Y, Di Z H, Qin P H, et al. Spatio-temporal variation and dynamic risk assessment of drought and flood disaster (DFD) in China[J]. International Journal of Disaster Risk Reduction, 2024,100:104140. DOI:10.1016/j.ijdrr.2023.104140

[24]
沈伟豪, 钟燕飞, 王俊珏, 等. 多模态数据的洪涝灾害知识图谱构建与应用[J]. 武汉大学学报(信息科学版), 2023, 48(12):2009-2018.

[Shen W H, Zhong Y F, Wang J J, et al. Construction and application of flood disaster knowledge graph based on multi-modal data[J]. Geomatics and Information Science of Wuhan University, 2023, 48(12):2009-2018.] DOI:10.13203/j.whugis20220509

[25]
杨绚, 张立生, 王铸. 基于机器学习算法的县域台风灾害经济损失风险评估[J]. 热带气象学报, 2022, 38(5):651-661.

[Yang X, Zhang L S, Wang Z. Risk assessment for typhoon economic losses in county-based units using machine learning[J]. Journal of Tropical Meteorology, 2022, 38(5):651-661.] DOI:10.16032/j.issn.1004-4965.2022.059

[26]
Schultz M G, Betancourt C, Gong B, et al. Can deep learning beat numerical weather prediction?[J]. Philosophical Transactions of the Royal Society A, 2021, 379(2194):20200097. DOI:10.1098/rsta.2020.0097

[27]
Chang Y P, Wang X, Wang J D, et al. A survey on evaluation of large language models[J]. ACM Transactions on Intelligent Systems and Technology, 2024, 15(3):1-45. DOI:10.1145/3641289

[28]
Raffel C, Shazeer N, Roberts A, et al. Exploring the limits of transfer learning with a unified text-to-text transformer[J]. Journal of machine learning research, 2020, 21(140):1-67.

[29]
Touvron H, Lavril T, Izacard G, et al. LLaMA: Open and efficient foundation language models[EB/OL]. 2023: 2302.13971. https://arxiv.org/abs/2302.13971v1.

[30]
DeepSeek-AI, Guo D Y, Yang D J, et al. DeepSeek-R1:Incentivizing reasoning capability in LLMs via reinforcement learning[EB/OL]. 2025: 2501.12948. https://arxiv.org/abs/2501.12948v

[31]
杨必胜, 陈一平, 邹勤. 从大模型看测绘时空信息智能处理的机遇和挑战[J]. 武汉大学学报(信息科学版), 2023, 48(11):1756-1768.

[Yang B S, Chen Y P, Zou Q. Opportunities and challenges of spatiotemporal information intelligent processing of surveying and mapping in the era of large models[J]. Geomatics and Information Science of Wuhan University, 2023, 48(11):1756-1768.] DOI:10.13203/j.whugis20230378

[32]
王益鹏, 张雪英, 党玉龙, 等. 顾及时空过程的台风灾害事件知识图谱表示方法[J]. 地球信息科学学报, 2023, 25(6):1228-1239.

DOI

[Wang Y P, Zhang X Y, Dang Y L, et al. Knowledge graph representation of typhoon disaster events based on spatiotemporal processes[J]. Journal of Geo-information Science, 2023, 25(6):1228-1239.] DOI:10.12082/dqxxkx.2023.210800

[33]
民政部国家减灾中心. 自然灾害承灾体分类与代码:GB/T 32572-2016[S]. 北京: 中国标准出版社,2016:2-4.

[ National Disaster Reduction Center, Ministry of Civil Affairs. Classification and coding for natural disaster exposure: GB/T 32572-2016[S]. Beijing: Standards Press of China, 2016: 2-4.]

[34]
Tseng Y M, Huang Y C, Hsiao T Y, et al. Two tales of persona in LLMs: A survey of role-playing and personalization[EB/OL]. 2024: 2406.01171. https://arxiv.org/abs/2406.01171v3.

[35]
Wang S, Qiu P Y, Zhu Y Q, et al. Review, framework, and future perspectives of Geographic Knowledge Graph (GeoKG) quality assessment[J]. Geo-spatial Information Science, 2024:1-21. DOI:10.1080/10095020.2024.2403785

[36]
Xue B C, Zou L. Knowledge graph quality management: A comprehensive survey[J]. IEEE Transactions on Knowledge and Data Engineering, 2023, 35(5):4969-4988. DOI:10.1109/TKDE.2022.3150080

[37]
Edge D, Trinh H, Cheng N, et al. From local to global: A graph RAG approach to query-focused summarization[EB/OL]. 2024: 2404.16130. https://arxiv.org/abs/2404.16130v2

[38]
Yang Y, Yih W T, Meek C. WikiQA: A challenge dataset for open-domain question answering[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA, USA: ACL, 2015:2013-2018. DOI:10.18653/v1/d15-1237

[39]
Singhal A. Modern information retrieval: A brief overview[J]. IEEE Data Engineering Bulletin, 2001, 24(4):35-43.

[40]
Papineni K, Roukos S, Ward T, et al. BLEU: A method for automatic evaluation of machine translation[C]// Proceedings of the 40th annual meeting of the Association for Computational Linguistics. Philadelphia, 2002:311-318.DOI:10.3115/1073083.1073135

[41]
Ning Y S, Liu H. UrbanKGent: A unified large language model agent framework for urban knowledge graph construction[EB/OL]. 2024: 2402.06861. https://arxiv.org/abs/2402.06861v2

[42]
Wang Q Y, Downey D, Ji H, et al. SciMON: Scientific inspiration machines optimized for novelty[C]//Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1:Long Papers). Stroudsburg, PA, USA: ACL, 2024:279-299. DOI:10.18653/v1/2024.acl-long.18

[43]
Tong S, Mao K, Huang Z, et al. Automating psychological hypothesis generation with AI: When large language models meet causal graph[J]. Humanities and Social Sciences Communications, 2024,11:896. DOI:10.1057/s41599-024-03407-5

[44]
Ma X G. Knowledge graph construction and application in geosciences: A review[J]. Computers & Geosciences, 2022,161:105082. DOI:10.1016/j.cageo.2022.105082

[45]
Zhong L F, Wu J, Li Q, et al. A comprehensive survey on automatic knowledge graph construction[J]. ACM Computing Surveys, 2024, 56(4):1-62. DOI:10.1145/3618295

[46]
Deng C, Zhang T H, He Z M, et al. K2:A foundation language model for geoscience knowledge understanding and utilization[C]// Proceedings of the 17th ACM International Conference on Web Search and Data Mining. ACM, 2024:161-170. DOI:10.1145/3616855.3635772

[47]
Zhang Y F, Wei C, He Z T, et al. GeoGPT: An assistant for understanding and processing geospatial tasks[J]. International Journal of Applied Earth Observation and Geoinformation, 2024,131:103976. DOI:10.1016/j.jag.2024.103976

[48]
张新长, 赵元, 齐霁, 等. 基于AI大模型的文生图技术方法研究及应用[J]. 地球信息科学学报, 2025, 27(1):10-26.

DOI

[Zhang X C, Zhao Y, Qi J, et al. Research and application of text-to-image technology based on AI foundation models[J]. Journal of Geo-information Science, 2025, 27(1):10-26.] DOI:10.12082/dqxxkx.2025.240657

文章导航

/