【目的】现阶段台风灾害知识服务常面临着“数据海量、知识难求、服务受限”的困境,如何从海量数据中快速凝练知识,提升台风灾害知识服务水平,减轻灾害带来的破坏性影响是当前研究的关键。大语言模型(LLMs)在自然语言处理领域展示出优异的性能,能够有效挖掘各类灾害信息,为深度灾害知识服务提供有效支撑。【方法】本研究深入解析了LLMs在台风灾害领域的应用前景,搭建了涵盖数据、知识、服务的台风灾害知识服务方法。【结果】就数据层到知识层而言,提出了基于Qwen2.5-Max的台风灾害知识图谱自动化构建方法。该方法首先提出了多层次台风灾害知识表达模型,而后构建了顾及时空特征和灾情影响的台风文本训练数据集。在此基础上采用“预训练+微调”的技术范式,实现了灾害数据到灾害知识的快速凝练。就知识层到服务层而言,提出了基于Qwen2.5-Max的台风灾害智能问答方法。该方法利用构建的台风灾害知识图谱,采取图检索增强生成(GraphRAG)方法,实现了基于图的灾害知识检索与面向用户的个性化防灾减灾指导方案生成。【结论】本研究充分展示了LLMs在台风灾害领域的广泛应用前景,也为LLMs与地理信息技术的交叉融合打下了基础,有望推动地理人工智能的进一步发展。
【目的】针对IFC标准的建筑信息模型(BIM)在实际应用中存在几何优先、语义弱化、跨软件语义丢失等问题,借鉴知识图谱及其推理算法(TransE)模型,将BIM模型信息进行网络化语义表达,通过增强模型的几何和语义关联性,解决跨平台交互语义丢失问题。【方法】以Revit软件库自带三层建筑模型为实验对象,将TransE模型应用于BIM语义信息的提取。BIM语义信息首先分解为构件语义、关联语义、坐标语义3种,建立构件节点的IfcEntity动态标签及关联节点的静态关系属性标签,提取了2 453个BIM语义节点、14 844条关联关系。【结果】实验及结果表明: ① 知识图谱能有效地将BIM模型构件及复杂关系进行图形化表达; ② 对比不同参数组合下TransE模型性能指标(MRR\Hits@n)发现:嵌入维度与模型性能成正比,学习率与模型性能成反比; ③ 当嵌入维度为200、学习率为0.000 5时,模型的评价指标最优; ④ 通过搜索系统查询所有构件节点进行结果验证发现,BIM构件语义信息提取成功率为94.47%。【结论】本文所倡导方法适用于BIM语义信息的提取及其更深层次的语义分析,研究结果为BIM与GIS集成提供一种语义转换的新途径。
【目的】全球离散格网系统(Discrete Global Grid Systems,DGGS)本质上是多尺度栅格结构,地理空间矢量与格网的集成是难点,矢量线格网化是其中的基本问题。现有方案多以平面格网单元中心(格心)连线为矢量线建模结果,但扩展到球面后建模精度降低,本文针对这一缺陷提出矢量线全球离散格网系统高精度建模方法。【方法】首先选择与地球拟合程度更高的菱形三十面体构建六边形格网系统,以3个相邻菱形面构成组合结构并建立三轴整数坐标系描述单元空间位置;然后根据矢量线首尾端点所在单元确定最优方向编码以减少搜索范围,通过编码邻近运算搜索矢量线经过的球面单元,以球面格心连线为建模结果并提出跨面矢量线处理方法;最后增加单元顶点(格点)作为结构要素,实现多结构要素矢量线建模,进一步提高建模精度。【结果】实验结果表明:本文方案能正确实现全球各个大洲海岸线格网化建模,确保格网化单元与矢量线拓扑相交,且相较平面格网建模结果兼具精度和效率优势。【结论】针对传统矢量数据格网建模方法的几何精度损失和拓扑畸变问题,本文提出高精度球面格网化建模方法,为矢量数据转换至格网同构处理提供有力支撑。
【目的】精确识别城市河流浊度分布对于了解城市水环境质量、评估污染状况和优化水资源管理具有重要意义。目前,在水质遥感反演研究中,一般先依据相关系数选择建模的敏感波段或组合,然后建立反演模型。然而,由于常用卫星遥感数据的光谱波段范围较宽且波段数量有限,寻找敏感波段或波段组合的过程存在不确定性。【方法】本文提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)的浊度反演方法,该模型由4个卷积层、2个池化层和4个全连接层组成。以郑州市东风渠和熊耳河水体为研究对象,基于Planet卫星数据、实测浊度数据和光谱数据,利用CNN模型对河流水体浊度进行遥感反演,并与2种回归分析方法和3种经典机器学习方法进行精度对比,最终生成研究区浊度空间分布图。【结果】研究区浊度反演的决定系数(R2)达到0.908,均方根误差(RMSE)为0.410 NTU,相较于最优回归分析模型和最优经典机器学习方法分别提升39.6%和6.5%。通过“目测+实地采样+实验室水质分析”的方式对结果进行了验证,结果表明,CNN模型生成的浊度分布图与实际采样数据和实地调查结果基本一致,研究区浊度平均值为3.52 NTU,标准差为1.003 NTU,变异系数为0.28。【结论】本研究表明卷积神经网络方法能够有效捕捉遥感影像中的非线性和高维数据复杂关系,可以提高河流水体浊度遥感反演的精度。
【目的】随着我国城市化进程的深入和市场竞争的加剧,长时间工作已成为普遍的社会问题,对劳动者身心健康与城市可持续发展构成挑战。当前关于城市居民工作活动的研究多依赖问卷调查数据,样本量有限且缺乏针对特大城市长时间工作现象的探究。【方法】本研究基于长时序手机信令数据,提出了一个识别长时间工作者的技术框架,系统分析了2019年11月份北京市长时间工作现象的空间分布特征。【结果】研究发现,北京市长时间工作者(周工作时长≥40 h)占比达47.1%,平均周工作时长48.86 h,其空间分布呈现“多中心集聚”格局,集中于CBD、金融街、中关村及亦庄等就业聚集区。不同性别和年龄群体分异显著:男性平均周工作时长(49.62 h)较女性(48.14 h)高1.5 h; 20~29岁男性群体的平均周工作时长(50.68 h)最长,而30~39岁女性群体尽管人数占比最高(22.13%),但其平均周工作时长(47.59 h)反而最低。此外,不同类型就业聚集区的长时间工作特征呈现明显的分异规律:CBD和中关村等区域的长时间工作人数更多,亦庄地区的长时间工作者占比最高(58.0%),而新发地、马驹桥等批发物流基地的工作强度更大(平均周工作时长均超过50 h)。【结论】本研究为深入理解北京市长时间工作现象提供了丰富的实证依据,研究结果为优化劳动时间政策提供了数据支持,对促进城市可持续发展和社会公平具有现实意义。
【目的】从大量在线新闻文章中自动生成新闻事件的故事脉络,有助于跟踪事件演变,在灾害应急救援、军事冲突分析和社会治理等领域有重要应用。现有方法首先通过直接编码文章特征或挖掘关键词共现模式对新闻文章聚类,然后根据时间顺序或地点标签生成故事脉络。然而,这些方法未能充分挖掘利用新闻文本中事件的时空属性,导致生成的故事脉络难以准确刻画新闻事件在时空维度上的演变过程。【方法】本文提出一种基于时空最优传输的新闻故事脉络生成方法。首先,设计了一种两阶段的无监督故事发现方法,先根据新闻流的文档级语义嵌入初步聚合新闻文章,再通过候选故事中的关键词分布更精细地将语义相关新闻分配到同一个新闻故事;然后,利用正则匹配和Wikidata数据,将新闻文章中提取的时间表达式和地名实体分别解析为标准格式时间和位置坐标,以挖掘新闻文章中的时空信息;最后,提出基于最优传输的时空距离计算方法,并引入距离衰减函数建模时空关联的衰减规律,利用最大生成树构建顾及时空关联的故事脉络。为了验证本文方法的有效性,本文在公开的大规模中文故事脉络生成数据集ChineseNewsEvents上开展大量实验。【结果】在故事发现任务上,与基线方法Story Forest和SCStory相比,本文方法在聚类度量指标AMI上提升0.147以上,在ARI上提升0.103以上,在B3-F1达到与SCStory可比较的性能。在脉络生成的结果上,本文方法在相关性、准确性、关联性方面表现更好。【结论】本文提出的方法能更准确地在时空维度上表达新闻事件的发展演变过程,为事件演变检测和模拟提供一种新的工具。
【目的】通过研究极端天气影响下人群停留行为扰动的特征来反映人群动态整体受影响程度,为增强城市韧性、降低灾害损失和保障城市秩序稳定提供支撑。【方法】在个体层面和群体层面,分别基于相似性思想和Z-Score原理构建了定量化停留时空扰动度量方法,并利用2022年7月泉州暴雨事件期间匿名化手机位置数据,对有关方法的有效性进行了检验。【结果】 ① 本文构建的方法能够定量化反映人群停留行为的时空扰动; ② 从个体尺度上看,本文方法能够有效揭示个体的受影响类型和时空分布特征,研究案例数据显示居住在市中心区域个体地理位置和时间安排更容易受到暴雨事件的综合影响;居住在郊区和远郊地区的个体,虽然停留位置有所改变,但时间作息基本不变; ③ 从群体层面上看,本文方法能够反映人群受暴雨影响的时间扰动模式和地理扰动分布,研究案例数据显示暴雨事件当天,受影响群体居住地区覆盖了全市建成区面积的68.71%,而且不同地区的群体停留行为表现出不同的韧性特征和恢复速度。长时间停留行为的停留人次在暴雨前夕显著增加,最大变化幅度为9.82%。短停留行为的停留人次在暴雨来临前和来临时明显减少,而暴雨下午则出现显著增加,停留人次的最大变化幅度高达21.48%。【结论】本文提出的方法能够从个体层面、群体层面定量分析极端天气对人群停留行为的影响范围及程度,能够为应急管理部门评估灾害风险,处置应对有关事件提供支撑。
【背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究提出基于均衡化感受野的3D目标检测方法VoxTNT,通过局部-全局协同注意力机制提升检测性能。在局部层面,设计了PointSetFormer模块,引入诱导集注意力模块(Induced Set Attention Block, ISAB),通过约简的交叉注意力聚合高密度点云的细粒度几何特征,突破传统体素均值池化的信息损失瓶颈;在全局层面,设计了VoxelFormerFFN模块,将非空体素抽象为超点集并实施跨体素ISAB交互,建立长程上下文依赖关系,并将全局特征学习计算负载从O(N 2)压缩至O(M 2)(M<<N, M为非空体素数量),规避了复杂的Transformer 直接使用在原始点云造成的高计算复杂度。该双域耦合架构实现了局部细粒度感知与全局语义关联的动态平衡,有效缓解固定感受野和多尺度融合导致的特征建模偏差。【结果】实验表明,该方法在KITTI数据集单阶段检测下,中等难度级别的行人检测精度AP(Average Precision)值达到59.56%,较SECOND基线提高约12.4%,两阶段检测下以66.54%的综合指标mAP(mean Average Precision)领先次优方法BSAODet的66.10%。同时,在WOD数据集中验证了方法的有效性,综合指标mAP达到66.09%分别超越SECOND和PointPillars基线7.7%和8.5%。消融实验进一步表明,均衡化局部和全局感受野的3D特征学习机制能显著提升小目标检测精度(如在KITTI数据集中全组件消融的情况下,中等难度级别的行人和骑行者检测精度分别下降10.8%和10.0%),同时保持大目标检测的稳定性。【结论】本研究为解决自动驾驶多尺度目标检测难题提供了新思路,未来将优化模型结构以进一步提升效能。
【目的】随着空间分辨率的提高,遥感图像所蕴含的信息越来越复杂,其中包含了大量的空间特征与语义特征,而二者的有效提取融合对于语义分割的效果起到关键性作用,然而,大多数现有方法只关注特征融合部分的研究改进,而没有考虑空间语义特征的一致性,导致了边缘分割不完整等问题。此外,这些方法往往忽略了边缘信息的精确提取。上述这些问题将会严重影响分割的准确性。【方法】本文提出了一种基于多尺度深度监督的高分辨遥感图像语义分割模型。首先,针对空间与语义特征分别设计不同的特征提取分支,充分利用遥感图像的空间和语义信息;其次,在空间分支中加入本文所提出的空间去冗余残差模块,引入小波变换与坐标卷积,更加有针对性地提取空间特征,并更好地关注边缘特征;然后,在语义分支中加入本文所提出的残差注意力Mamba,实现了对于全局层次的语义特征提取;最后,在特征融合部分采用多尺度特征融合机制,设计大内核分组特征提取模块将空间分支、语义分支特征与深层次特征逐层融合,抑制无效特征,激活有效特征。此外,本模型采用深度监督机制,对各个阶段的特征融合层添加辅助监督头,提高训练效率。【结果】本文在ISPRS Potsdam和随机采样裁剪数据增强后的Vaihingen数据集上进行了对比实验与消融实验,结果表明本文所提出算法在ISPRS Potsdam和随机采样裁剪数据增强后的Vaihingen数据集上的平均交并比达到83.43%和86.49%,与其他9种最新的核心方法相比,如CGGLNet、CMLFormer等,在平均交并比指标上分别至少提高了5.00%和3.00%。【结论】本文算法能够有效地提取空间语义特征,并将其有效融合,提高了遥感图像语义分割的准确率。
【目的】特征匹配是航空影像三维重建的核心步骤之一。然而,航空影像在成像过程中受阴影、视角变化等因素的影响导致匹配点数量少且分布不均匀。【方法】本文提出了一种顾及阴影和视角差异的多策略融合特征匹配方法,该方法结合了传统的SIFT特征提取算法和前沿的LightGlue特征匹配学习网络,通过引入多种优化策略,实现了复杂成像条件下的高质量匹配效果,主要包括以下3点改进: ① 提出了一种自适应阴影区域增强策略,通过影像原始信息提取阴影区域,利用阴影区和非阴影区平均亮度之比确定初始亮度增强因子,并根据阴影区域间的灰度差异对亮度增强因子进行改正,实现阴影区域的亮度增强处理,以恢复阴影区域的地物细节信息,提升特征点数量; ② 引入多视角模拟影像生成策略,利用相机姿态构建多视角模拟影像,以提升输入特征的视角变化适应性,提高匹配质量; ③ 设计了一种基于K-Means聚类的RANSAC匹配优化算法,根据影像的原始色彩信息动态确定聚类数K,并剔除明显色彩不一致的匹配点,利用确定的K值对匹配点进行聚类处理并对每一簇分别利用RANSAC算法进行局部优化,降低平面假设误差,获取相应的内点作为最终匹配结果。【结果】实验基于A3相机采集的航空影像数据,对影像进行单一策略和组合策略处理。实验结果表明,经过自适应阴影区域增强策略和多视角模拟策略处理后,匹配点数量相比于未处理增加了近3倍,聚类RANSAC优化策略相比于传统RANSAC优化方法的平均像素距离误差降低了约30%,匹配正确率平均提升24.8%。【结论】本文方法有效地解决了复杂成像条件下航空影像匹配困难的问题,为三维重建等下游任务提供了更加充分且可靠的数据支持。
【目的】建筑物轮廓的规则化是基础地理信息数据生成和更新的一项重要内容。基于遥感影像提取的建筑物图斑通常存在不完整、冗余点等问题因而难以直接用于制图,而现有规则化方法只考虑建筑物图斑局部形状和弱直角特征,忽略建筑物在影像的真实分布与形状,造成轮廓与实际形状不符。【方法】为此,本文提出一种顾及建筑物方向特征的规则化方法。首先,提出一个基于多任务学习的建筑物提取模型,同时实现建筑物图斑的提取与图斑方向的定量描述;然后,结合建筑物图斑形状和邻近关系划分建筑物群组和独立建筑物,并分别计算轮廓主方向;最后,基于优化的轮廓主方向拆解和重构建筑物轮廓边,实现对建筑物轮廓的规则化。【结果】在Inria数据集和WHU建筑物数据集上与4个传统建筑物规则化算法和2个直接从影像提取建筑物轮廓的算法展开了对比试验,本文结果在“Y”形建筑物、“C”形建筑物、建筑物群等场景下表现明显优于其他方法。相较于向量重组法,本文方法在Inria数据集的交并比指标上有5.28%提升。【结论】表明本方法能够获得更清晰准确的建筑物角点,有效避免邻近建筑物互相压盖的问题,且相较于直接获取建筑物轮廓的实例分割算法,本文方法有更高的精度和运算效率。
【目的】针对部分低光遥感图像存在的色彩失真以及噪声伪影的问题,本文提出一种基于Retinex-Net的融合去噪和色彩优化的低光遥感图像增强算法DICR-Net(Denoising and Integrated Color Retinex-Net-based Network)。【方法】在色彩优化阶段,该算法在分解网络和调整网络中引入了挤压激励网络(SENet)和跳跃连接(SC),并在调整网络中引入了颜色损失函数以优化色彩保真度。其中,SENet通过自适应调整特征通道权重以关注重要信息,SC将浅层特征传递到深层以避免信息丢失。在去噪阶段,本文构建了一个基于U-Net的可变形卷积去噪网络DCDNet(Deformable Convolutional Denoising Network),并在该网络中引入了噪声损失函数以抑制图像噪声。DCDNet的卷积层采用可变形卷积(DConv),确保卷积区域始终覆盖物体形状,同时减少卷积层以降低运算量。【结果】本文采用武汉大学发布的WHU-RS19 遥感图像数据集以及低光图像增强领域经典的LOL数据集,将所提出的DICR-Net算法与MSRCR、Zero-DCE、LIME、Retinex-Net、SCI、DDNet进行对比。实验表明,本文算法在图像的视觉效果上有所提升。与次优算法相比,在遥感图像数据集上,DICR-Net的PSNR、SSIM、SAM、SAT和Delta E分别提升了2.74%、1.54%、2.95%、6.53%和8.82%;在LOL数据集上,DICR-Net的PSNR、SSIM、SAM、SAT和Delta E分别提升了5.30%、6.44%、3.37%、5.10%和10.80%。【结论】该算法在低光遥感图像增强上色彩与噪声表现较好,为遥感图像的长期监测、动态追踪等应用提供了技术支持。
【目的】深度学习方法在地物识别中可以通过自动提取复杂地形特征从而显著提升效率,其中DeepLabV3+算法能够有效捕获多像素特征,被广泛地应用于遥感影像的分割和识别。但其在滑坡识别中细节处理能力受限,容易导致目标边界的模糊和识别错误,此外,该模型依靠卷积运算捕获的是局部信息,难以有效地建立长距离依赖关系。【方法】本文提出了一种基于DeepLabV3+的改进模型,首先,引入坐标注意力(Coordinate Attention,CA)机制,增强特征表达能力。其次,使用密集空间空洞金字塔池化(Dense Atrous Spatial Pyramid Pooling,DenseASPP)模块替换原有的空间空洞金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,提升多尺度特征提取效果并有效地解决了空洞卷积低效或失效的问题;同时,通过并联加入条形池化(Strip Pooling,SP)分支模块,提升主干网络对长距离依赖关系的建模能力。最后,引入级联特征融合(Cascade Feature Fusion,CFF)模块,用于整合不同层次的特征信息,进一步优化分割性能。【结果】使用毕节滑坡数据集进行实验,结果表明,改进后模型相较原模型的MIoU提高了2.2%,F1分数提高了1.2%;与其他主流深度学习模型进行对比,该模型在提取精度方面均表现出一定优势。在分割效果上,该模型在识别滑坡区域的整体准确性上有显著提高,分割结果与原始滑坡形态保持很高的一致性,减少了错分和漏分现象,在滑坡边界的分割上更加精确。【结论】通过验证数据集测试及实际应用验证,本文提出的方法在不同场景、不同复杂程度下的滑坡影像均表现出较强的识别能力,尤其在植被覆盖区、河流邻近区域等复杂背景环境中表现更加稳定,展现出较强的泛化能力和普适性。
【目的】舆情的传播演化具有典型的空间属性,从地理空间维度关注舆情问题正发展成为重要的研究趋势。【方法】本研究基于××航客机事故,构建“城市-社交-观点-心理”四维地理舆情超网络模型,运用复杂网络、GIS空间、机器学习等方法探索地理舆情问题的时空演化特征,并运用MRQAP模型探索地理舆情空间演化的驱动机制。【结果】本文实证结果表明: ① 中国舆情热点空间分布具有明显的地理集聚效应与空间相关性。舆论热点集中分布于胡焕庸线以南的京津冀、山东半岛、长三角、珠三角和成渝等城市群且焦点集中在信息传播能力强、舆论影响力大的城市;爆发期与持续期的集聚效应更为鲜明; ② 社交子网呈现菱形钻石结构且具有鲜明的社区效应,但连结效率相对较低;心理子网的主流情绪具有明显的非负面转化特征;观点子网的话题具有分散化演化特征;城市子网呈现明显的“点-轴”结构与高度一体化特征,网络传播效率较高; ③ 同配效应、虹吸效应与邻近效应均对舆论的空间传播具有驱动效应。社交相似、心理相似、观点相似、良好的教育环境、外向型的发展方式、优越的媒体环境以及制度、社会与组织邻近均有助于带动舆情信息空间扩散。【结论】舆情热点的空间分布及其演化特征不仅受地理因素的影响,还与社会经济特征、社会网络结构和心理情绪变化密切相关。
【意义】大气污染防治不仅是实现碳达峰碳中和的有力支撑,也是保障公众健康、推动绿色转型发展的重要途径。 【方法】基于2012—2022年遥感反演的PM2.5数据,综合运用空间自相关分析、参数最优地理探测器和多尺度时空地理加权回归模型(MGTWR)等方法,揭示长江经济带三大城市群PM2.5年均、季节、月均浓度3个尺度的时空演变特征及其影响因素的时空异质性。【结果】 ① 长江经济带三大城市群的年均PM2.5浓度以2013年为拐点,呈现倒“U”型变化趋势,整体上表现为北部浓度高于南部。2012—2022年,长江中游城市群的PM2.5浓度均值略高于成渝城市群和长江三角洲城市群,各个城市群的时间变化趋势基本一致,区域差距逐渐缩小,空气质量明显改善; ② 三大城市群PM2.5浓度整体呈现“冬高夏低、春秋居中”的季节性周期变化规律,各季节的空气质量均得到大幅提升,尤其以冬季改善明显。月均PM2.5浓度表现为“U”型起伏,各区域的逐月PM2.5浓度显著下降,大部分区域降至50 μg/m3以下; ③ 三大城市群的年均PM2.5在整体上呈现出显著的空间正相关,但单个城市群的空间自相关性存在差异。高-高区主要分布在长江三角洲城市群和长江中游城市群的西北部,少数分布在成渝城市群川南地区的泸州和自贡。低-低区主要分布在长江经济带东南沿海和江西省。低-高区仅位于湖北宜昌; ④ 在影响PM2.5空间分异的关键因素中,第二产业占比对PM2.5的影响最大,其次是NDVI和人均GDP。多尺度时空地理加权回归模型(MGTWR)在拟合PM2.5方面表现出优于其他空间回归模型的精度。其回归系数分析表明,人均GDP是抑制PM2.5浓度的主导因素,其次是第二产业占比,呈正相关关系。年均风速和坡度的影响强度相对较弱,具有 2个方向的作用效果。年均降水量、NDVI和规模以上工业数量对PM2.5浓度有较强的削弱作用;年均气温和人口密度有较强的促进作用。【结论】 MGTWR方法同时考虑了长时间序列和多尺度分析,为探索PM2.5的驱动机制提供了新的分析视角。