阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 评论
    秦其明
    地球信息科学学报. 2025, 27(10): 2283-2290. doi: 10.12082/dqxxkx.2025.250426 cstr: 32074.14.dqxxkx.2025.250426
    PDF全文 (379) HTML (1200)   可视化   收藏

    【目的】随着全球在轨地球观测卫星数量的快速增长,遥感数据呈现爆炸式积累,为地球系统科学研究提供了动态认知全球变化的前所未有机遇;与此同时,也伴生多源异构、标注稀缺、任务泛化不足与数据过载等一系列挑战。【方法】为应对这些瓶颈问题, Google DeepMind 提出了 AlphaEarth Foundations(AEF),通过整合光学、SAR、LiDAR、气候模拟及文本等多模态数据,构建统一的64 维嵌入表征场,实现了跨模态、跨时空的语义一致性的数据融合,并在 Google Earth Engine 等平台开放。【结果】AEF的主要贡献体现在: ① 缓解了长期存在的“数据孤岛”问题,建立了全球一致的嵌入层; ② 通过 vMF 球面嵌入机制提升了语义相似性度量能力,支持高效的检索与变化检测; ③ 将复杂的预处理与特征工程前置于预训练阶段,使下游应用进入“分析就绪”状态,大幅降低了应用成本。论文指出,AEF 的应用潜力释放可分为3个阶段:首先是地表覆盖分类与变化检测;其次是嵌入向量与物理模型深度耦合,推动科学发现;最后有望演化为空间智能基座,成为全球地理空间智能服务的一种基础设施。尽管如此, AEF仍面临若干挑战: ① 嵌入向量可解释性不足,限制了科学归因和因果分析; ② 域迁移与跨场景适应性存在不确定性,极端环境下的鲁棒性有待验证; ③ 性能优势需要更多跨区域、独立实验的实证支撑。【结论】AEF 以其在数据效率和跨任务泛化方面的突破,代表了遥感与地理空间人工智能研究的新方向,为未来地学研究提供了坚实支撑,但其进一步发展依据可解释性、鲁棒性及真实性验证的持续提升,并将64维嵌入向量通过不同途径转化为可广泛使用的数据资源。

  • 遥感科学与应用技术
    于瀚洋, 蓝朝桢, 王龙号, 魏紫珺, 高天, 王亦乔, 刘芮萌
    地球信息科学学报. 2025, 27(8): 1896-1919. doi: 10.12082/dqxxkx.2025.250052 cstr: 32074.14.dqxxkx.2025.250052
    PDF全文 (183) HTML (1350)   可视化   收藏

    【意义】影像匹配是完成多景影像空间位置对齐的方法和过程,而自动化影像匹配是现代摄影测量与遥感数据处理中关键的一环。【进展】随着对地观测技术的发展和多源遥感数据获取能力的提高,综合协同处理多源数据的能力需求推动多模态遥感影像的匹配技术研究不断深入,近年来基于深度学习的思想深刻影响了影像匹配领域技术的发展。本文在介绍传统遥感影像匹配框架的基础上,分析了多模态遥感影像的类型、特点与匹配难点,重点论述了针对多模态遥感影像不同深度学习方法研究的新进展,并分析了其优缺点,归纳总结了目前适应多模态遥感影像匹配任务的数据集,对深度学习方法在多模态遥感影像匹配中的发展成果和当前挑战进行了总结。成果方面,该领域算法在高效、鲁棒和精度上显著提升,多模态融合策略和多种创新框架与模型推动了研究发展并反映了该领域从模块化适配到整体建模的转变,揭示了数据驱动的表征学习与几何推理的更深度融合。但当前研究仍存在显著瓶颈,多模态差异方面,异构性严重制约匹配效能,模型泛化能力不足;数据与计算层面,高质量标注数据稀缺、计算资源需求大;工程部署层面,算法实战能力欠缺,误匹配剔除困难,模型在混合模态数据处理中泛化性差。【展望】最后对多模态遥感影像深度学习匹配方法领域的发展趋势与未来展望进行了深入探讨,包括模态无关的设计、物理信息约束的网络架构以及适应复杂环境的轻量化方案等。

  • 地球信息科学理论与方法
    张暖, 王涛, 张艳, 魏毅博, 李镏文, 刘熠晨
    地球信息科学学报. 2025, 27(8): 1751-1779. doi: 10.12082/dqxxkx.2025.250137 cstr: 32074.14.dqxxkx.2025.250137
    PDF全文 (177) HTML (1229)   可视化   收藏

    【意义】街景图像视觉位置识别(Street View Image-based Visual Place Recognition, SV-VPR)是一种基于视觉特征信息的地理位置识别技术,其核心任务是通过分析街景图像的视觉特征,实现对未知地点的地理位置预测和精确定位。该技术需要克服不同环境条件下的外观变化(如昼夜光照差异、季节更替特征演变等)和视点差异(如车载相机与卫星图像的视角偏差),并通过计算图像特征相似性、几何约束等条件来实现精准识别。作为计算机视觉与地理信息科学的交叉领域,SV-VPR与视觉定位、图像检索、SLAM等技术密切相关,在无人机自主导航、自动驾驶高精度定位、网络空间地理围栏构建、增强现实场景融合等领域具有重要应用价值,特别是在GPS信号缺失场景下展现出独特的定位优势。【分析】本文系统综述了街景图像视觉位置识别技术的研究进展,主要包含以下内容:首先,阐述了图像视觉位置识别技术的基础概念与分类,深入探讨了街景图像视觉位置识别技术的基础概念与分类方法;其次,详细分析了该领域的关键技术研究;此外,全面梳理了街景图像视觉位置识别技术相关的数据集资源;同时,梳理了该技术的评价方法与指标体系;最后,对街景图像视觉位置识别技术的未来研究方向进行了展望。【目的】通过本综述,旨在为相关研究者提供系统化的技术发展脉络梳理,帮助快速把握领域研究现状;关键技术与评估方法的对比分析,为算法选型提供决策依据;前沿挑战与潜在突破方向的预判,启发创新性研究思路。

  • 第十九届中国地理信息科学理论与方法学术年会优秀论文
    黄毅, 张雪英, 盛业华, 夏永奇, 叶鹏
    地球信息科学学报. 2025, 27(6): 1249-1262. doi: 10.12082/dqxxkx.2025.250175 cstr: 32074.14.dqxxkx.2025.250175
    PDF全文 (256) HTML (1280)   可视化   收藏

    目的】现阶段台风灾害知识服务常面临着“数据海量、知识难求、服务受限”的困境,如何从海量数据中快速凝练知识,提升台风灾害知识服务水平,减轻灾害带来的破坏性影响是当前研究的关键。大语言模型(LLMs)在自然语言处理领域展示出优异的性能,能够有效挖掘各类灾害信息,为深度灾害知识服务提供有效支撑。【方法】本研究深入解析了LLMs在台风灾害领域的应用前景,搭建了涵盖数据、知识、服务的台风灾害知识服务方法。【结果】就数据层到知识层而言,提出了基于Qwen2.5-Max的台风灾害知识图谱自动化构建方法。该方法首先提出了多层次台风灾害知识表达模型,而后构建了顾及时空特征和灾情影响的台风文本训练数据集。在此基础上采用“预训练+微调”的技术范式,实现了灾害数据到灾害知识的快速凝练。就知识层到服务层而言,提出了基于Qwen2.5-Max的台风灾害智能问答方法。该方法利用构建的台风灾害知识图谱,采取图检索增强生成(GraphRAG)方法,实现了基于图的灾害知识检索与面向用户的个性化防灾减灾指导方案生成。【结论】本研究充分展示了LLMs在台风灾害领域的广泛应用前景,也为LLMs与地理信息技术的交叉融合打下了基础,有望推动地理人工智能的进一步发展。

  • 地球信息科学理论与方法
    李俊明, 胡雅璇, 王楠楠, 王斯雅琦, 王若兰, 吕琳, 房紫晴
    地球信息科学学报. 2025, 27(7): 1501-1519. doi: 10.12082/dqxxkx.2025.250161 cstr: 32074.14.dqxxkx.2025.250161
    PDF全文 (201) HTML (1244)   可视化   收藏

    【意义】经典统计推断依赖大样本与独立同分布前提,但时空数据却往往不满足这两大前提,因此,经典统计框架下的时空统计方法具有一定理论局限;相较而言,贝叶斯统计范式下的时空统计方法通过融合先验信息、引入参数随机性,形成统一的概率推断框架,可考虑更多不确定性,并能有效克服时空数据中的小样本和非独立问题,在时空统计建模中体现出较强的自身优势,并受到广泛关注和快速发展。【进展】本文首先从方法论演进角度出发,从传统贝叶斯时空统计与贝叶斯时空机器学习两个视角系统梳理了主流的贝叶斯时空统计模型,前者包括贝叶斯时空演化层次模型、贝叶斯时空回归层次模型、贝叶斯空间面板数据模型、贝叶斯时空地理加权回归模型、贝叶斯时空变系数模型和贝叶斯网格化时空高斯过程模型,后者包括贝叶斯时空因果森林模型、贝叶斯时空神经网络模型和贝叶斯时空图卷积神经网络模型;后又从实际应用方面,重点回顾了贝叶斯时空统计模型在公共卫生、环境科学、经济社会与公共安全、能源与工程等领域的应用。【展望】贝叶斯时空统计方法需在多源异构数据建模、深度学习融合、因果推断机制引入及高性能计算优化等方面实现突破,以兼顾理论完备性与实践适应性,推动其发展为具备因果推断、自适应泛化及智能分析的下一代时空建模范式。

  • 地球信息科学理论与方法
    刘康
    地球信息科学学报. 2025, 27(7): 1520-1531. doi: 10.12082/dqxxkx.2025.250196 cstr: 32074.14.dqxxkx.2025.250196
    PDF全文 (168) HTML (1036)   可视化   收藏

    【意义】人类移动与交通、传染病、安全等密切相关,使得轨迹分析与建模成为持续的研究热点。目前,学界与业界已发展了大量以机器学习/深度学习为主流的轨迹专门模型,如轨迹插值模型、轨迹预测模型、轨迹分类模型等。然而,这些模型大多针对专门任务设计、基于局部区域数据训练,难以泛化应用于其他任务、其他区域乃至其他类型的轨迹。近年来,随着生成式人工智能发展,通用基础模型在自然语言处理、计算机视觉等领域得到显著应用。在这一技术发展趋势下,构建轨迹基础模型,使其学习到大规模轨迹数据的通用特征,以适用于不同区域与多种下游任务,成为轨迹建模的迫切需求。【方法】本文首先系统综述了各类轨迹专门模型的研究进展与发展脉络,然后将轨迹建模任务分为常规任务(轨迹相似性计算、插值、预测、分类等)与生成任务(轨迹生成),阐述了近年来面向这两类任务的轨迹基础模型前沿研究进展。【结论】本文认为,面向常规任务的轨迹基础模型除了具备任务泛化能力,还应进一步强化其空间泛化与数据泛化能力;面向生成任务的轨迹基础模型还需攻克空间泛化难题,能够基于易获取的目标城市宏观数据或特征,“从无到有”生成城市级大规模轨迹数据。此外,将轨迹数据与其他类型数据(如文本、地图、其他地理空间数据)联合构建多模态地理基础模型,以及构建面向交通管理、传染病传播、公安寻人等业务场景的轨迹基础模型,也是未来值得探讨的研究方向。

  • 第十九届中国地理信息科学理论与方法学术年会优秀论文
    郑成龙, 宋辞, 陈洁
    地球信息科学学报. 2025, 27(6): 1317-1331. doi: 10.12082/dqxxkx.2025.250168 cstr: 32074.14.dqxxkx.2025.250168
    PDF全文 (128) HTML (1078)   可视化   收藏

    目的】随着我国城市化进程的深入和市场竞争的加剧,长时间工作已成为普遍的社会问题,对劳动者身心健康与城市可持续发展构成挑战。当前关于城市居民工作活动的研究多依赖问卷调查数据,样本量有限且缺乏针对特大城市长时间工作现象的探究。【方法】本研究基于长时序手机信令数据,提出了一个识别长时间工作者的技术框架,系统分析了2019年11月份北京市长时间工作现象的空间分布特征。【结果】研究发现,北京市长时间工作者(周工作时长≥40 h)占比达47.1%,平均周工作时长48.86 h,其空间分布呈现“多中心集聚”格局,集中于CBD、金融街、中关村及亦庄等就业聚集区。不同性别和年龄群体分异显著:男性平均周工作时长(49.62 h)较女性(48.14 h)高1.5 h; 20~29岁男性群体的平均周工作时长(50.68 h)最长,而30~39岁女性群体尽管人数占比最高(22.13%),但其平均周工作时长(47.59 h)反而最低。此外,不同类型就业聚集区的长时间工作特征呈现明显的分异规律:CBD和中关村等区域的长时间工作人数更多,亦庄地区的长时间工作者占比最高(58.0%),而新发地、马驹桥等批发物流基地的工作强度更大(平均周工作时长均超过50 h)。【结论】本研究为深入理解北京市长时间工作现象提供了丰富的实证依据,研究结果为优化劳动时间政策提供了数据支持,对促进城市可持续发展和社会公平具有现实意义。

  • 地球信息科学理论与方法
    贺力, 王融
    地球信息科学学报. 2025, 27(9): 2151-2164. doi: 10.12082/dqxxkx.2025.250273 cstr: 32074.14.dqxxkx.2025.250273

    【意义】社会现象本质上具有内在空间属性,空间视角为解析复杂社会问题提供了关键路径。随着社会科学“空间转向”的不断深化,以及地理信息系统(GIS)在数据获取、空间分析与建模、空间可视化等方面的持续进步, GIS已成为社会问题求解的重要工具。然而,地理学与社会科学在理论范式、方法逻辑与尺度认知上的差异,制约了二者的深度融合。亟需系统厘清其融合路径,辨识核心挑战与潜在机遇。【进展】本文提炼GIS赋能社会科学研究的五大优势:拓展研究思维、支撑时空数据、提升调查技术、丰富表达形式、强化分析能力;综述其在经济学、政治学与社会学中的典型应用,揭示跨学科共性与学科差异;深入剖析融合过程中的三重挑战——数据与问题的匹配难题、方法与机制的整合困境以及地点与尺度的情境错位,并提出针对性的应对路径。【展望】人工智能,特别是大模型的发展,为GIS空间分析注入新方法论动能。未来应构建“大模型-空间分析”协同范式,推动GIS从工具应用向理论支撑跃升,提升其在社会问题求解中的科学价值与实践效能。

  • 遥感科学与应用技术
    李旺平, 尉文博, 刘晓杰, 柴成富, 张雪莹, 周兆叶, 张秀霞, 郝君明, 魏玉明
    地球信息科学学报. 2025, 27(6): 1448-1461. doi: 10.12082/dqxxkx.2025.250034 cstr: 32074.14.dqxxkx.2025.250034
    PDF全文 (220) HTML (1035)   可视化   收藏

    目的】深度学习方法在地物识别中可以通过自动提取复杂地形特征从而显著提升效率,其中DeepLabV3+算法能够有效捕获多像素特征,被广泛地应用于遥感影像的分割和识别。但其在滑坡识别中细节处理能力受限,容易导致目标边界的模糊和识别错误,此外,该模型依靠卷积运算捕获的是局部信息,难以有效地建立长距离依赖关系。【方法】本文提出了一种基于DeepLabV3+的改进模型,首先,引入坐标注意力(Coordinate Attention,CA)机制,增强特征表达能力。其次,使用密集空间空洞金字塔池化(Dense Atrous Spatial Pyramid Pooling,DenseASPP)模块替换原有的空间空洞金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,提升多尺度特征提取效果并有效地解决了空洞卷积低效或失效的问题;同时,通过并联加入条形池化(Strip Pooling,SP)分支模块,提升主干网络对长距离依赖关系的建模能力。最后,引入级联特征融合(Cascade Feature Fusion,CFF)模块,用于整合不同层次的特征信息,进一步优化分割性能。【结果】使用毕节滑坡数据集进行实验,结果表明,改进后模型相较原模型的MIoU提高了2.2%,F1分数提高了1.2%;与其他主流深度学习模型进行对比,该模型在提取精度方面均表现出一定优势。在分割效果上,该模型在识别滑坡区域的整体准确性上有显著提高,分割结果与原始滑坡形态保持很高的一致性,减少了错分和漏分现象,在滑坡边界的分割上更加精确。【结论】通过验证数据集测试及实际应用验证,本文提出的方法在不同场景、不同复杂程度下的滑坡影像均表现出较强的识别能力,尤其在植被覆盖区、河流邻近区域等复杂背景环境中表现更加稳定,展现出较强的泛化能力和普适性。

  • 遥感科学与应用技术
    史世豪, 施群山, 周杨, 胡校飞, 齐凯
    地球信息科学学报. 2025, 27(7): 1596-1607. doi: 10.12082/dqxxkx.2025.250015 cstr: 32074.14.dqxxkx.2025.250015
    PDF全文 (210) HTML (1176)   可视化   收藏

    【目的】小目标检测在军事和民用领域具有重要意义,但由于低分辨率、高噪声环境、目标遮挡及背景复杂等因素的影响,传统检测方法在精度和鲁棒性上难以满足实际需求,复杂场景下的小目标检测问题仍极具挑战性。因此,本文提出一种混合特征与多尺度融合的小目标检测算法。【方法】首先,本文设计了一种混合特征提取模块(Hybrid Conv and Transformer Block, HCTB),充分利用局部和全局上下文信息来增强网络对小目标感知,优化了计算效率和特征提取能力;其次,提出了多膨胀率共享卷积核模块(Multi-Dilated Shared Kernel Conv, MDSKC),通过不同膨胀率的空洞卷积扩展主干的感受野,高效提取多尺度特征;最后,结合基于Omni-Kernel和Cross Stage Partial思想构建的全核跨阶段特征融合模块(Omni-Kernel Cross Stage Model, OKCSM),优化了小目标特征金字塔网络,更大程度上保留小目标的信息,提高了检测性能。【结果】本文在 VisDrone2019和TinyPerson数据集上进行了消融实验和对比实验,结果表明:本文方法相较于基线模型yolov8n,在查准率、召回率、mAP50mAP50:95上分别提升为1.3%、3.1%、3%、1.9%和3.6%、1.3%、2.1%、0.7%,且模型尺寸和GFLOPs仅为6.3 MB和11.3 G;此外,在与HIC-Yolov5、TPH-yolov5、Drone-YOLO等经典算法的对比实验中,本文提出的算法显示出明显的优势,优于其他对比方法。【结论】本文算法有效提升了检测精度,证明了本文算法面对复杂场景中小目标检测问题方面具有良好的检测性能。

  • 地理空间分析综合应用
    孙宝娣, 陈柯颖, 陈赵慧, 王纯, 燕玉玺, 唐敬超, 刘亦枫
    地球信息科学学报. 2025, 27(7): 1671-1686. doi: 10.12082/dqxxkx.2025.250058 cstr: 32074.14.dqxxkx.2025.250058

    【意义】社区作为城市基本构成单元,碳排放水平和精确核算直接影响着建筑行业整体减排成效,本文梳理了目前碳核算主要方法及其优劣,提出了基于数字孪生技术提升社区碳核算精确性和全面性的新思路。【进展】本文首先介绍3种传统碳核算方法—碳排放因子法、质量平衡法和实测法及其应用情况,梳理适用于社区尺度碳核算的数字孪生技术,主要包括建筑信息模型BIM、地理信息系统GIS和物联网IoT技术;本文分析了 ① 拓展基于数字孪生技术碳核算的覆盖面至社区层次,② 加强多项数字孪生技术的融合互联程度,③ 建立基于数字孪生技术的社区碳核算体系3个方面发展趋势;提出集成BIM、GIS和IoT 3种成熟技术并搭建基于城市信息模型CIM社区碳排放体系的广阔前景。【展望】未来,应用数字孪生技术可实现“不同尺度”和“不同地域环境”社区精准碳核算、碳排量预测、减碳路径制定、以及进行评估与反馈。同时随着AI技术发展,未来有望将城市信息模型CIM社区碳核算单元与AI智能体整合,充分发挥大数据、大模型和大算力优势,从而构建智慧城市智能化社区碳核算体系。

  • 遥感科学与应用技术
    单慧琳, 王兴涛, 刘文星, 吴心悦, 高润泽, 李红旭
    地球信息科学学报. 2025, 27(6): 1381-1400. doi: 10.12082/dqxxkx.2025.250009 cstr: 32074.14.dqxxkx.2025.250009

    目的】随着空间分辨率的提高,遥感图像所蕴含的信息越来越复杂,其中包含了大量的空间特征与语义特征,而二者的有效提取融合对于语义分割的效果起到关键性作用,然而,大多数现有方法只关注特征融合部分的研究改进,而没有考虑空间语义特征的一致性,导致了边缘分割不完整等问题。此外,这些方法往往忽略了边缘信息的精确提取。上述这些问题将会严重影响分割的准确性。【方法】本文提出了一种基于多尺度深度监督的高分辨遥感图像语义分割模型。首先,针对空间与语义特征分别设计不同的特征提取分支,充分利用遥感图像的空间和语义信息;其次,在空间分支中加入本文所提出的空间去冗余残差模块,引入小波变换与坐标卷积,更加有针对性地提取空间特征,并更好地关注边缘特征;然后,在语义分支中加入本文所提出的残差注意力Mamba,实现了对于全局层次的语义特征提取;最后,在特征融合部分采用多尺度特征融合机制,设计大内核分组特征提取模块将空间分支、语义分支特征与深层次特征逐层融合,抑制无效特征,激活有效特征。此外,本模型采用深度监督机制,对各个阶段的特征融合层添加辅助监督头,提高训练效率。【结果】本文在ISPRS Potsdam和随机采样裁剪数据增强后的Vaihingen数据集上进行了对比实验与消融实验,结果表明本文所提出算法在ISPRS Potsdam和随机采样裁剪数据增强后的Vaihingen数据集上的平均交并比达到83.43%和86.49%,与其他9种最新的核心方法相比,如CGGLNet、CMLFormer等,在平均交并比指标上分别至少提高了5.00%和3.00%。【结论】本文算法能够有效地提取空间语义特征,并将其有效融合,提高了遥感图像语义分割的准确率。

  • 地理空间分析综合应用
    王锴庆, 肖炎焱, 张智玮, 李永乐
    地球信息科学学报. 2025, 27(7): 1738-1750. doi: 10.12082/dqxxkx.2025.250148 cstr: 32074.14.dqxxkx.2025.250148

    【目的】兴趣点(POI)具有地理空间实体与文化信息承载双重特性,是分析、识别区域文化表达和功能特质的数据基础。基于POI大数据识别、分析大运河沿线旅游文化场景类型及其特征,对实现大运河沿线地区文旅差异化可持续发展具有重要意义。【方法】通过将POI数据与场景理论结合、空间实体与文化价值关联、定量统计与定性组态分析融合,构建了“空间载体-文化价值-场景类型”分析框架。本文抓取476 968条POI数据,首先建立了包括6个大类、 24个小类的旅游文化舒适物数据库;采用德尔菲(Delphi)法确定旅游舒适物场景子维度的分值,计算旅游文化场景表现得分;最后,运用描述性统计分析、 K均值聚类法、系统聚类法识别旅游文化场景类型,并将聚类结果进行地图可视化表达,分析旅游文化场景类型特征、组态影响机制与对策建议。【结果】① 大运河江苏段沿线能够彰显当地旅游文化特色,地方特质显著,具备一定表现能力和吸引力,但在旅游文化价值取向上差异较大,尤其表现在本地性、迷人、展示、功用主义和感召力等子维度,表明大运河江苏段沿线旅游文化场景具有异质性特征; ② 经过聚类分析,大运河江苏段沿线34个县(市、区)可以划分为本土型场景(10个)、功利型场景(8个)、舒适型场景(13个)以及魅力型场景(3个)4种类型,判别分析验证了聚类结果的科学性。4种场景类型呈现不同特征; ③ 江苏大运河沿线旅游文化场景类型的组态影响路径可归纳为3条,受经济发展、城镇化、人口规模、财政政策、交通通达、文旅资源多因素耦合影响,其中经济发展、城镇化水平和人口规模是影响旅游文化场景类型的核心条件。【结论】基于POI大数据,将场景理论引入文化旅游发展研究中,为区域文旅差异化可持续发展开拓了新思路。

  • 专栏:“地球系统数字孪生与场景智能计算”
    郝源斐, 刘喆, 郑曦, 钱云
    地球信息科学学报. 2025, 27(9): 2070-2085. doi: 10.12082/dqxxkx.2025.250129 cstr: 32074.14.dqxxkx.2025.250129

    【目的】街道空间是行人在城市环境中的主要感知界面,高品质的街道空间视觉质量对提升街道空间活力具有重要意义。传统方法多依赖单一客观指标进行评价,难以有效衔接客观环境特征与行人主观感知。【方法】本研究提出一种基于大语言模型进行评价的新框架,纳入主观感知的“风格维度”,将传统的单一指标量化分析扩展到数量化与风格化的综合分析。本框架基于百度街景图像,结合语义分割技术评价植被密度与天空开敞度2项客观指标;结合先进的大语言模型能力,通过提示词工程进行优化,评价植被多样性、建筑类型、建筑连续性、人行道使用情况、车行道使用情况及标识使用情况6项主观指标。最终结合潜在狄利克雷分布(Latent Dirichlet Allocation, LDA)主题模型对研究区的街道类型分类,以探讨不同街道的空间特征及其优化方向。【结果】以北京市西城区为研究区,研究结果揭示了区域内植被密度与天空开敞度的空间分布情况,呈现了行人对植被多样性、建筑类型等指标的主观评价。通过聚类分析识别出以西单北大街为主的综合服务类街道、以西黄城根南街为主的特色类街道以及以灵境胡同为主的混合类型街道。【结论】本研究创新性地引入具有人类感知能力的大语言模型,并结合提示词工程提高模型性能,实现街道视觉质量的高效、主客观融合评价,为大规模街景图像自动化评估提供参考。

  • 专栏: "跨域空间高精度地图与智能导航控制"
    赵璐颖, 周杨, 胡校飞, 黄高爽, 甘文建, 侯铭波
    地球信息科学学报. 2025, 27(10): 2293-2315. doi: 10.12082/dqxxkx.2024.240262 cstr: 32074.14.dqxxkx.2024.240262

    【意义】跨视角图像地理定位是指将带有坐标元数据的卫星图像作为参考图像,从而确定待查询的地面视角图像地理坐标的过程。由于卫星图像可以做到全球覆盖且获取便捷,将其作为参考影像进行图像定位极大地扩展了图像地理定位的应用范围。【进展】伴随各种算法技术的发展,跨视角地理定位经历了从手工提取特征提取到深度学习的过程,其具体的定位思路也经历了从利用检索的方法直接将检索到的卫星图像中心坐标标记为地面图像位置的图像级跨视角定位,到像素级的细粒度定位,即更精准地将对应的卫星图像相应像素位置坐标赋值给地面图像的过程。然而,在跨视角地理定位的具体实现过程中,由于地面(侧视)图像和卫星(俯视)图像之间视角的剧烈变化,导致地面图像和卫星图像间的视觉内容差异巨大、相似性很小,这也使得跨视角图像地理定位具有较大的挑战性。然而为了提升跨视角地理定位的精度,各种学者纷纷进行各种表征学习、度量计算等算法的改进。同时针对巨大的视角差异,一些学者甚至研究跨视角图像之间专门的几何变换、图像生成等视角转换方法,以及借助方向信息、无人机图像信息的中间视角连接等提升定位精度。【目的】本文针对跨视角地理定位中出现的不同方法,以及用到的各种数据集、评价方法等进行梳理总结,在此基础上讨论未来的发展趋势。

  • 地球信息科学理论与方法
    李霄, 王少华, 梁浩健, 周亮, 刘畅, 王润桥, 苏澄
    地球信息科学学报. 2025, 27(8): 1822-1840. doi: 10.12082/dqxxkx.2025.250144 cstr: 32074.14.dqxxkx.2025.250144

    【目的】可持续发展是全球各国发展的核心议题,涵盖了可持续的交通体系、包容和可持续的城市化等重要内容。作为城市公共服务设施的重要组成部分,公交网络是城市稳定运行的基石,其站点与线路的分布直接影响居民的出行方式。现有研究多聚焦于公交站点与线路的可达性分析、选址优化以及与人口、土地利用等因素的空间耦合关系,但在面对城市空间异质性和设施冗余问题时,仍存在优化深度不足、影响机制不清等问题。【方法】本文以北京市为例,重点关注北京东城区、西城区,本研究基于公交网络、地形、经济等多源数据,构建影响因素体系,并采用XGBoost机器学习方法,揭示驱动因子对公交站点分布的影响权重。在此基础上,提出了考虑站点冗余的数学模型,优化上下行站点的空间布局,绘制北京市公交站点空间优化布局图。【结果】研究结果表明: ① 北京市公交设施分布存在不均衡现象,中心城区与边缘区域在便捷公共交通可达人口比例上相差超过30%; ② 在19类影响因素中,人口密度为核心驱动因子,占比27.77%,风景名胜数量和停车场数量的影响较小,特征重要性不足0.5%; ③ 与p-中值模型相比,所提出的冗余优化模型显著减少了优化后站点的冗余程度,同时兼顾了加权距离最小化的性能,优化后的站点布局沿着原有公交线路分布且更加均匀。【结论】该研究结果可以为公交站点及其他公共服务设施布局提供一定的参考与理论支撑,有助于提升公共资源利用效率,促进城市可持续发展。

  • 地球信息科学理论与方法
    郑强文, 吴升, 魏婧卉
    地球信息科学学报. 2025, 27(6): 1361-1380. doi: 10.12082/dqxxkx.2025.250122 cstr: 32074.14.dqxxkx.2025.250122

    背景】传统方法因静态感受野设计较难适配城市自动驾驶场景中汽车、行人及骑行者等目标的显著尺度差异,且跨尺度特征融合易引发层级干扰。【方法】针对自动驾驶场景中多类别、多尺寸目标的3D检测中跨尺度表征一致性的关键挑战,本研究提出基于均衡化感受野的3D目标检测方法VoxTNT,通过局部-全局协同注意力机制提升检测性能。在局部层面,设计了PointSetFormer模块,引入诱导集注意力模块(Induced Set Attention Block, ISAB),通过约简的交叉注意力聚合高密度点云的细粒度几何特征,突破传统体素均值池化的信息损失瓶颈;在全局层面,设计了VoxelFormerFFN模块,将非空体素抽象为超点集并实施跨体素ISAB交互,建立长程上下文依赖关系,并将全局特征学习计算负载从ON 2)压缩至OM 2)(M<<NM为非空体素数量),规避了复杂的Transformer 直接使用在原始点云造成的高计算复杂度。该双域耦合架构实现了局部细粒度感知与全局语义关联的动态平衡,有效缓解固定感受野和多尺度融合导致的特征建模偏差。【结果】实验表明,该方法在KITTI数据集单阶段检测下,中等难度级别的行人检测精度AP(Average Precision)值达到59.56%,较SECOND基线提高约12.4%,两阶段检测下以66.54%的综合指标mAP(mean Average Precision)领先次优方法BSAODet的66.10%。同时,在WOD数据集中验证了方法的有效性,综合指标mAP达到66.09%分别超越SECOND和PointPillars基线7.7%和8.5%。消融实验进一步表明,均衡化局部和全局感受野的3D特征学习机制能显著提升小目标检测精度(如在KITTI数据集中全组件消融的情况下,中等难度级别的行人和骑行者检测精度分别下降10.8%和10.0%),同时保持大目标检测的稳定性。【结论】本研究为解决自动驾驶多尺度目标检测难题提供了新思路,未来将优化模型结构以进一步提升效能。

  • 遥感科学与应用技术
    平一凡, 卢俊, 郭海涛, 侯青峰, 朱坤, 桑泽豪, 刘彤
    地球信息科学学报. 2025, 27(7): 1608-1623. doi: 10.12082/dqxxkx.2025.250051 cstr: 32074.14.dqxxkx.2025.250051

    【目的】跨视角图像地理定位是指通过将待查询影像与不同视角且具备精确位置信息的参考影像进行匹配从而推断其地理位置的一门技术。该技术已经广泛应用于无人机导航、目标定位等现实任务中。当前基于深度学习的无人机-卫星跨视角图像检索定位方法大多依赖监督学习,但高质量标注样本的稀缺导致监督学习模型的泛化能力受限。同时,由于现有方法对空间布局特征的建模缺失,使得跨视角影像间的显著域差异难以弥补。【方法】针对上述问题,本文提出了一个基于无人机-卫星影像的跨视角图像检索定位新架构——DINO-MSRA,该架构首先利用经Conv-LoRA微调后的Dinov2大模型作为特征编码器,旨在利用较少的参数量增强模型的特征提取能力。其次,设计了一个基于Mamba模块的空间关系感知特征聚合器(MSRA)用于聚合图像特征,通过将空间配置特征嵌入到全局描述符中,为跨视角匹配定位任务带来了显著的性能增益。最后,采用InfoNCE损失函数对模型进行训练。【结果】本文在Univerisity-1652和SUES-200数据集上进行了大量对比实验和消融实验,实验结果表明,当分别面向无人机定位任务和无人机导航任务时,本文方法在Univeirity-1652数据集上的R@1精度达到95.14%、97.29%,相比于目前最优算法CAMP分别提升0.68%、1.14%;在SUES-200数据集上150 m高度的R@1精度分别达到97.2%、98.75%,相较于CAMP提升1.8%、2.5%,并且所需参数量也明显少于现有算法,仅为Sample4Geo的19.2%;【结论】DINO-MSRA在跨视角图像匹配方面优于目前最先进的方法,实现了更高的精度,更快的推理速度,证明了其在具有挑战性的场景中的鲁棒性和实际应用潜力。

  • 第十九届中国地理信息科学理论与方法学术年会优秀论文
    岳梓晨, 钟少波, 梅新
    地球信息科学学报. 2025, 27(6): 1289-1304. doi: 10.12082/dqxxkx.2025.240715 cstr: 32074.14.dqxxkx.2025.240715
    目的】知识图谱作为一种融合多模态数据源的前沿技术,在GIS领域获得广泛关注。知识图谱主要通过图数据库构建。然而,目前主流的图数据库对地理时空数据的组织和分析仍面临挑战。【方法】为了解决这一问题,本文提出了一种桥接图数据库和空间数据引擎的时空语义建模与查询优化方法。该方法在图数据库中将地理实体存储为占位符节点(仅保留映射ID),并与时空索引节点(时间树、Geohash编码)建立关联,以增强时空聚合能力。同时,在关系数据库中存储完整的地理时空对象,并采用表分区策略优化检索效率。该方法通过统一标识符和JDBC实现跨数据库地理实体的路由映射,当用户调用图数据库中预注册的时空函数时,查询重写器基于实体标识符将图查询转换为SQL语句,并下推至关系数据库处理,随后将结果反馈至图查询流程。此外,引入两阶段提交协议保障异构数据库的数据同步性。【结果】本文通过集成Neo4j和PostGIS实现了该方法的原型系统,并基于深圳市多源时空数据集(包含出租车轨迹、共享单车轨迹、路网、POI及遥感影像),对不同规模数据进行查询和存储效率实验。结果表明:相较于主流图数据库系统(Neo4j、GraphDB),本方法在地理时空查询中显著提升性能,尤其在复杂计算场景下响应时间可缩短1~2个数量级,并支持原生图数据库无法实现的栅格计算;通过轻量化图节点和PostGIS数据压缩,存储空间减少约3~5倍。相较于虚拟知识图系统(Ontop),本方法在空间查询和存储消耗上差异较小,但在大规模时空查询中响应时间显著缩短。【结论】相较于现有方法,本文方法可直接利用现有图数据库构建实体化时空知识图,提升了地理时空知识图的建模灵活性和查询效率,且支持用户自定义扩展地理时空函数库,为知识图谱中地理时空数据的高效管理和分析提供了新的思路。
  • 专栏:“地球系统数字孪生与场景智能计算”
    杜沛, 沈扬杰, 刘振夏, 俞肇元
    地球信息科学学报. 2025, 27(9): 2106-2116. doi: 10.12082/dqxxkx.2025.250220 cstr: 32074.14.dqxxkx.2025.250220

    【目的】随着全球气候变化、海平面上升与人类活动不断加强,海岸带人-地-海关系发展呈现出复杂性、敏感性和脆弱性等特征,亟需建立集成环境感知、过程模拟和情景推演的海岸带综合研究体系。数字孪生作为一种融合数据、模型与知识的智能系统新范式,为海岸带复杂系统的精准镜像与智能调控提供了新思路。【分析】本文系统梳理了当前海岸带数字化建设发展脉络,分析了在多重压力下海岸带自然与人文强耦合的数字化建设需求,提出以陆海交互过程为场景基底,人-地-海互馈为演绎主线的数字孪生海岸带建设思路与框架。本文从信息集成与知识聚合、自然过程模拟与人地耦合决策、短期预测与长期监测、真实表达与智能交互4个方面构建系统架构,讨论了海岸带数据治理、场景建模、要素预测、长期监控以及数字孪生系统平台的关键技术。【展望】以多源数据时空融合场景为基础、以推演与干预能力为目标的数字孪生海岸带,将有助于突破传统海岸带数字化系统建设瓶颈,提升海岸带系统的可计算性与可管理性,有望为气候变化背景下的海岸带可持续发展与治理体系现代化提供新工具与新范式。

  • 遥感科学与应用技术
    陈丽佳, 陈宏辉, 谢艳秋, 何天友, 叶菁, 吴林煌
    地球信息科学学报. 2025, 27(7): 1624-1637. doi: 10.12082/dqxxkx.2025.250092 cstr: 32074.14.dqxxkx.2025.250092

    【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力,影响了推理分割质量。【方法】为了解决这一问题,本文提出了一种联合跨尺度注意力和语义视觉Transformer的遥感影像分割框架(Cross-scale Attention Transformer, CATrans),融合跨尺度注意力模块和语义视觉Transformer,提取上下文先验知识增强局部特征表示和分割性能。首先,跨尺度注意力模块通过空间和通道两个维度进行并行特征处理,分析浅层-深层和局部-全局特征之间的依赖关系,提升对遥感影像中不同粒度对象的注意力。其次,语义视觉Transformer通过空间注意力机制捕捉上下文语义信息,建模语义信息之间的依赖关系。【结果】本文在DeepGlobe、Inria Aerial和LoveDA数据集上进行对比实验,结果表明:CATrans的分割性能优于现有的WSDNet(Discrete Wavelet Smooth Network)和ISDNet(Integrating Shallow and Deep Network)等分割算法,分别取得了76.2%、79.2%、54.2%的平均交并比(Mean Intersection over Union, mIoU)和86.5%、87.8%、66.8%的平均F1得分(Mean F1 Score, mF1),推理速度分别达到38.1 FPS、13.2 FPS和95.22 FPS。相较于本文所对比的最佳方法WSDNet, mIoUmF1在3个数据集中分别提升2.1%、4.0%、5.3%和1.3%、1.8%、5.6%,在每类地物的分割中都具有显著优势。【结论】本方法实现了高效率、高精度的高分辨率遥感影像语义分割。

  • 专栏:“地球系统数字孪生与场景智能计算”
    潘洁晨, 邢帅, 曹家印, 戴莫凡, 黄高爽, 职露
    地球信息科学学报. 2025, 27(9): 1999-2020. doi: 10.12082/dqxxkx.2025.250151 cstr: 32074.14.dqxxkx.2025.250151

    【意义】随着遥感测绘与自动驾驶技术的快速发展,三维点云语义分割作为数字孪生系统的核心基础技术,其研究热度持续升温。航空点云语义分割被认为是有望提升三维地理信息系统的自动化、智能化的关键技术之一。【分析】在深度学习技术和激光雷达(Light Detection and Ranging, LiDAR)、深度相机、三维激光扫描仪等传感器的推动下,点云语义分割技术通过精确的特征提取和高效的模型训练能够实现大规模点云数据的自动分类和高精度识别。然而,相比于高密度、类别均衡的典型点云语义分割数据集(如室内点云数据或自动驾驶和机器人领域的室外点云数据),航空点云由于其特有的数据特性(如大范围三维地形覆盖、动态平台运动误差累积、地物空间尺度差异大、复杂地物遮挡等因素),在点云配准、特征提取等关键环节仍面临显著挑战,目前基于深度学习的航空点云语义分割研究仍处于起步阶段。同时,受限于数据不同获取方式、不同分辨率、不同属性信息,现有研究距离算法落地应用还有一段距离。【进展】本文旨在对这一领域的发展进行全面的分析研究,包括各类适应算法的特点、数据集、性能指标和最新提出的方法,以及它们的优势和局限性。此外,本文还提供与现有技术水平的定量比较,对有代表性的方法进行研究,包括精度分析和适用性能分析。【展望】最后,总结分析航空点云语义分割技术突破亟需在特征表达、多模态融合、小样本学习、点云语义分割算法可解释性及大模型基准构建等多个维度开展系统性研究创新,不仅有助于解决当前算法在实际部署中的瓶颈问题,还可为数字孪生城市、灾害应急响应等重大应用提供可靠的技术支撑。

  • 第十九届中国地理信息科学理论与方法学术年会优秀论文
    李朝奎, 谢梦愿, 吕强, 唐至娜
    地球信息科学学报. 2025, 27(6): 1263-1274. doi: 10.12082/dqxxkx.2025.240603 cstr: 32074.14.dqxxkx.2025.240603

    目的】针对IFC标准的建筑信息模型(BIM)在实际应用中存在几何优先、语义弱化、跨软件语义丢失等问题,借鉴知识图谱及其推理算法(TransE)模型,将BIM模型信息进行网络化语义表达,通过增强模型的几何和语义关联性,解决跨平台交互语义丢失问题。【方法】以Revit软件库自带三层建筑模型为实验对象,将TransE模型应用于BIM语义信息的提取。BIM语义信息首先分解为构件语义、关联语义、坐标语义3种,建立构件节点的IfcEntity动态标签及关联节点的静态关系属性标签,提取了2 453个BIM语义节点、14 844条关联关系。【结果】实验及结果表明: ① 知识图谱能有效地将BIM模型构件及复杂关系进行图形化表达; ② 对比不同参数组合下TransE模型性能指标(MRR\Hits@n)发现:嵌入维度与模型性能成正比,学习率与模型性能成反比; ③ 当嵌入维度为200、学习率为0.000 5时,模型的评价指标最优; ④ 通过搜索系统查询所有构件节点进行结果验证发现,BIM构件语义信息提取成功率为94.47%。【结论】本文所倡导方法适用于BIM语义信息的提取及其更深层次的语义分析,研究结果为BIM与GIS集成提供一种语义转换的新途径。

  • 地理空间分析综合应用
    张可艺, 肖佳, 方建
    地球信息科学学报. 2025, 27(6): 1478-1498. doi: 10.12082/dqxxkx.2025.240617 cstr: 32074.14.dqxxkx.2025.240617

    【意义】大气污染防治不仅是实现碳达峰碳中和的有力支撑,也是保障公众健康、推动绿色转型发展的重要途径。 【方法】基于2012—2022年遥感反演的PM2.5数据,综合运用空间自相关分析、参数最优地理探测器和多尺度时空地理加权回归模型(MGTWR)等方法,揭示长江经济带三大城市群PM2.5年均、季节、月均浓度3个尺度的时空演变特征及其影响因素的时空异质性。【结果】 ① 长江经济带三大城市群的年均PM2.5浓度以2013年为拐点,呈现倒“U”型变化趋势,整体上表现为北部浓度高于南部。2012—2022年,长江中游城市群的PM2.5浓度均值略高于成渝城市群和长江三角洲城市群,各个城市群的时间变化趋势基本一致,区域差距逐渐缩小,空气质量明显改善; ② 三大城市群PM2.5浓度整体呈现“冬高夏低、春秋居中”的季节性周期变化规律,各季节的空气质量均得到大幅提升,尤其以冬季改善明显。月均PM2.5浓度表现为“U”型起伏,各区域的逐月PM2.5浓度显著下降,大部分区域降至50 μg/m3以下; ③ 三大城市群的年均PM2.5在整体上呈现出显著的空间正相关,但单个城市群的空间自相关性存在差异。高-高区主要分布在长江三角洲城市群和长江中游城市群的西北部,少数分布在成渝城市群川南地区的泸州和自贡。低-低区主要分布在长江经济带东南沿海和江西省。低-高区仅位于湖北宜昌; ④ 在影响PM2.5空间分异的关键因素中,第二产业占比对PM2.5的影响最大,其次是NDVI和人均GDP。多尺度时空地理加权回归模型(MGTWR)在拟合PM2.5方面表现出优于其他空间回归模型的精度。其回归系数分析表明,人均GDP是抑制PM2.5浓度的主导因素,其次是第二产业占比,呈正相关关系。年均风速和坡度的影响强度相对较弱,具有 2个方向的作用效果。年均降水量、NDVI和规模以上工业数量对PM2.5浓度有较强的削弱作用;年均气温和人口密度有较强的促进作用。【结论】 MGTWR方法同时考虑了长时间序列和多尺度分析,为探索PM2.5的驱动机制提供了新的分析视角。

  • 地理空间分析综合应用
    胡胜, 王振华, 邢汉发, 刘文凯, 刘烨菲, 李家驹, 张冠衡
    地球信息科学学报. 2025, 27(7): 1687-1703. doi: 10.12082/dqxxkx.2025.250064 cstr: 32074.14.dqxxkx.2025.250064

    【目的】本文旨在研究中国城市路网形态与道路交通碳排放之间的关系及其影响机制。随着交通运输业的快速发展,道路交通碳排放(RTCE)已成为我国碳排放的重要组成部分。深入分析路网形态对道路交通碳排放的影响,对于实现碳达峰和碳中和目标具有重要意义。【方法】本文以中国302个城市功能区域为研究对象,基于城市路网、道路交通碳排放网格数据、人口和GDP网格数据,采用多尺度地理加权回归模型(MGWR)和SHAP机器学习方法,从道路等级分布、交通网络密集度和交通网络结构3个维度量化路网形态,并分析其对道路交通碳排放的影响机制。【结果】① 道路交通碳排放的空间分布呈现以京津冀(1 003.604 t/km2)、长三角(849.074 t/km2)、珠三角(1 615.291 t/km2)及省会城市(1 168.886 t/km2)为中心向周边递减的多中心分布格局,东部地区高于中西部地区。路网形态的空间分布特征中,交通网络密集度和道路等级分布与RTCE的分布特征类似,南方地区道路方向丰富度(RDR)较高,北方地区道路网格系数(GC)较高; ② 路网形态对道路交通碳排放的影响具有显著的空间异质性。例如,路网密度(RND)对珠三角地区的影响更为显著(0.636),道路方向丰富度(RDR)对长三角地区的影响更为显著(0.259)。此外,不同路网形态指标对各地区道路交通碳排放的影响程度具有显著差异; ③ 路网形态对道路交通碳排放具有空间非平稳性和非线性影响。例如, RND的带宽仅为45,而RCR的带宽为215,表明不同路网形态特征对道路交通碳排放的空间影响尺度不同。在考虑非线性影响的机器学习SHAP分析中, RND是对道路交通碳排放影响的最重要特征。【结论】本文通过MGWR模型和SHAP方法,揭示了路网形态对道路交通碳排放的空间非平稳性和非线性影响机制。研究结果表明,不同区域的路网形态特征对道路交通碳排放的影响存在显著差异,这种差异不仅体现在空间分布上,还体现在影响机制上。因此,在制定低碳路网规划时,需要充分考虑路网形态的空间异质性、非平稳性和非线性特征,从“密度-等级-结构”多维特征视角进行综合分析,以实现城市交通的低碳发展。这些发现为城市交通规划和低碳发展提供了科学依据,对实现可持续城市发展、改善交通效率和提高居民生活质量具有重要意义。

  • 地球信息科学理论与方法
    朱歌, 张政, 曹涟帅, 马焜阳, 徐欣悦, 成毅
    地球信息科学学报. 2025, 27(9): 2165-2176. doi: 10.12082/dqxxkx.2025.250207 cstr: 32074.14.dqxxkx.2025.250207

    【目的】地图编制涉及要素选取、符号化与注记配置等专业操作,存在制图过程复杂、效率不高等问题。基于大语言模型(LLM)的文生地图制图技术可以大大简化制图过程,提高了制图效率,但仍存在人工调试依赖度高、工具调用流程碎片化等问题。【方法】本文提出基于DeepSeek的文生地图智能体构建方法,通过对自然语言指令的任务分解与工具自主适配,实现了从用户输入到可视化输出流程的自动化处理。研究以DeepSeek模型为核心,为地图要素配备制图工具及使用描述,分析模块结构及协作机理,构建了5类工具集,通过理解指令推理生成任务思维链,调用可视化工具实现自然语言到地图的跨模态映射。【结果】为检验智能体的有效性,分别以基于本地地图数据和网络地图服务的制图任务为对象,以DeepSeek-V3-0324和R1模型作为决策核心,完成了基于自然语言的自动制图任务。实验表明文生地图智能体可以在低工具复杂度任务中实现工具复用,并具备通过多工具链式调用完成高复杂度生成任务的能力。【结论】基于DeepSeek构建的智能体可以较好地完成文生地图任务,且通过40次重复实验发现: V3的执行效率是R1的6.56倍,平均执行效率约为6.29 s/step,对LangChain Agent的模块化适配性更优。

  • 遥感科学与应用技术
    崔丽群, 褚如波, 金海波
    地球信息科学学报. 2026, 28(2): 420-435. doi: 10.12082/dqxxkx.2026.250482 cstr: 32074.14.dqxxkx.2026.250482

    【目的】本文旨在提升高分辨率遥感图像的目标检测性能,针对小目标检测、复杂背景处理和密集目标分布等关键问题,提出了一种解决方案。【方法】本文基于YOLOv11框架,提出了一种融合多尺度特征协同与情景感知的遥感目标检测方法。设计了3个创新模块: ① 多核特征融合模块(Parallel Kernel Feature Fusion Module, PKFFM),用于跨尺度特征整合以增强表示能力; ② 级联双分支注意力模块(Cascaded Dual-Branch Attention Module, CDBAM),通过突出相关空间和通道信息优化特征提取; ③ 情景感知模块(Scenario-Aware Module, SAM),增强网络捕获全局上下文信息的能力。此外,引入了RS-WIoU(Remote Sensing Wise Intersection over Union)损失函数,以更好地适应高分辨率遥感数据,进一步提升检测性能。【结果】为验证本文方法的有效性,本文在高分辨率遥感数据集TGRS-HRRSD、NWPU VHR-10和DOTA-v1.0上进行实验。实验结果表明,本文方法在各数据集上的平均精度(mP)分别达到97.3%、87.3%和84.3%,相较于基线模型YOLOv11,精度分别提升2.1%、3.8%和2.9%, mAP50-95分别提升3.0%、1.2%和1.5%;此外,本文模型展现出轻量化特性和强鲁棒性,优于其他遥感目标检测算法。【结论】本文方法通过PKFFM、CDBAM、SAM以及RS-WIoU损失函数的协同作用,显著提升了高分辨率遥感图像目标检测的精度与鲁棒性,为遥感影像目标检测提供了高效的解决方案。未来可进一步探索这些模块在其他数据集和任务中的适用性,以提升模型的泛化能力并推动遥感技术的进步。

  • 遥感科学与应用技术
    陈欣, 孙群, 余岸竹, 高艺, 孔令辉
    地球信息科学学报. 2025, 27(6): 1420-1434. doi: 10.12082/dqxxkx.2025.240628 cstr: 32074.14.dqxxkx.2025.240628

    目的】建筑物轮廓的规则化是基础地理信息数据生成和更新的一项重要内容。基于遥感影像提取的建筑物图斑通常存在不完整、冗余点等问题因而难以直接用于制图,而现有规则化方法只考虑建筑物图斑局部形状和弱直角特征,忽略建筑物在影像的真实分布与形状,造成轮廓与实际形状不符。【方法】为此,本文提出一种顾及建筑物方向特征的规则化方法。首先,提出一个基于多任务学习的建筑物提取模型,同时实现建筑物图斑的提取与图斑方向的定量描述;然后,结合建筑物图斑形状和邻近关系划分建筑物群组和独立建筑物,并分别计算轮廓主方向;最后,基于优化的轮廓主方向拆解和重构建筑物轮廓边,实现对建筑物轮廓的规则化。【结果】在Inria数据集和WHU建筑物数据集上与4个传统建筑物规则化算法和2个直接从影像提取建筑物轮廓的算法展开了对比试验,本文结果在“Y”形建筑物、“C”形建筑物、建筑物群等场景下表现明显优于其他方法。相较于向量重组法,本文方法在Inria数据集的交并比指标上有5.28%提升。【结论】表明本方法能够获得更清晰准确的建筑物角点,有效避免邻近建筑物互相压盖的问题,且相较于直接获取建筑物轮廓的实例分割算法,本文方法有更高的精度和运算效率。

  • 第六届空间数据智能学术会议(SpatialDI 2025)会议优秀论文
    郭漩, 张金雪, 魏伊冰, 于淑彤, 刘俊楠, 刘海砚, 徐道柱, 徐明亮
    地球信息科学学报. 2025, 27(12): 2789-2801. doi: 10.12082/dqxxkx.2025.250239 cstr: 32074.14.dqxxkx.2025.250239

    【目的】轨迹知识图谱能够有效记录轨迹与地理空间实体间深层语义联系,在揭示复杂关联信息方面展现出显著优势。传统的面向领域数据源的知识图谱构建方法依赖于专业知识,涉及繁重的数据预处理和实体关系抽取工作,对用户的专业技能要求较高。【方法】为降低轨迹知识图谱构建门槛,本文提出了一种大语言模型提示学习增强的轨迹知识图谱构建方法,支持以自然语言驱动的任务执行流程,显著降低了知识图谱构建的使用门槛。首先设计预处理任务提示策略,引导模型自动生成异常轨迹数据处理代码,完成数据预处理工作,降低了编程能力的依赖;其次设计工具调用的两级系统提示策略,完成轨迹实体关系抽取工具的匹配与调用,将繁重的构建流程封装于提示模板与自动化工具中,使非专业用户通过简单的语言指令完成图谱构建。【结果】为验证本文方法的可行性与有效性,本文通过构建轨迹预处理和实体关系抽取工具匹配的测试语句集,选取真实船舶和车辆轨迹数据作为知识图谱构建数据集,评估提示策略的适用性,在通义千问和百度千帆主流大语言模型上,分别达到了75%和80%以上的准确率。【结论】本文验证了结合提示学习的大语言模型在低门槛构建轨迹知识图谱中的有效性,展现出所设计提示策略的良好泛化性与应用价值。

  • 地球信息科学理论与方法
    聂智勇, 贾奋励, 杨剑, 方立, 林佳诺, 张源琳, 陈思烨
    地球信息科学学报. 2025, 27(6): 1332-1343. doi: 10.12082/dqxxkx.2025.240677 cstr: 32074.14.dqxxkx.2025.240677

    目的】从大量在线新闻文章中自动生成新闻事件的故事脉络,有助于跟踪事件演变,在灾害应急救援、军事冲突分析和社会治理等领域有重要应用。现有方法首先通过直接编码文章特征或挖掘关键词共现模式对新闻文章聚类,然后根据时间顺序或地点标签生成故事脉络。然而,这些方法未能充分挖掘利用新闻文本中事件的时空属性,导致生成的故事脉络难以准确刻画新闻事件在时空维度上的演变过程。【方法】本文提出一种基于时空最优传输的新闻故事脉络生成方法。首先,设计了一种两阶段的无监督故事发现方法,先根据新闻流的文档级语义嵌入初步聚合新闻文章,再通过候选故事中的关键词分布更精细地将语义相关新闻分配到同一个新闻故事;然后,利用正则匹配和Wikidata数据,将新闻文章中提取的时间表达式和地名实体分别解析为标准格式时间和位置坐标,以挖掘新闻文章中的时空信息;最后,提出基于最优传输的时空距离计算方法,并引入距离衰减函数建模时空关联的衰减规律,利用最大生成树构建顾及时空关联的故事脉络。为了验证本文方法的有效性,本文在公开的大规模中文故事脉络生成数据集ChineseNewsEvents上开展大量实验。【结果】在故事发现任务上,与基线方法Story Forest和SCStory相比,本文方法在聚类度量指标AMI上提升0.147以上,在ARI上提升0.103以上,在B3-F1达到与SCStory可比较的性能。在脉络生成的结果上,本文方法在相关性、准确性、关联性方面表现更好。【结论】本文提出的方法能更准确地在时空维度上表达新闻事件的发展演变过程,为事件演变检测和模拟提供一种新的工具。