“专栏:“地球表层系统数据挖掘与知识发现”” 栏目所有文章列表

(按年度、期号倒序)

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部

Please wait a minute...
  • 全选
    |
  • 专栏:“地球表层系统数据挖掘与知识发现”
    王卷乐, 谢忠, 陈旻, 宋春桥, 宋佳, 余卓渊
    地球信息科学学报. 2026, 28(3): 0-i.
  • 专栏:“地球表层系统数据挖掘与知识发现”
    王卷乐, 谢忠, 宋佳, 宋春桥, 陈旻, 余卓渊, 邱芹军, 李凯, 段博文
    地球信息科学学报. 2026, 28(3): 545-555. doi: 10.12082/dqxxkx.2026.250303 cstr: 32074.14.dqxxkx.2026.250303

    【意义】在开放科学背景下,不断涌现的开放数据增加了可用的资源,但也同时因为数据的分散、异构、多语义等特征,为数据的深度挖掘和知识发现带来挑战。地球表层系统圈层交互强烈且人类活动活跃,由此产生的科学数据尤其丰富,围绕该领域的数据挖掘与知识发现是全球科学前沿和竞争焦点。【进展】本文围绕地球表层系统科学数据的发现、管理、挖掘、模型共享与集成应用,开展了系统深入的全链条关键技术研究。通过本体更新与对齐方法,构建了可动态更新、规模庞大的地球表层系统科学数据目录和关联网络,提升了数据共享评估的准确性与效率;结合云计算、容器虚拟化等前沿技术研发的智能服务工具,实现了对海量遥感数据的高效处理与信息提取,探索了多源数据管理的标准化路径;研发了融合遥感大数据与智能算法的高精度地球表层系统参数数据产品,并实现了时空演变规律的高效挖掘分析;通过创新性的异构模型容器化服务技术,解决了地表系统科学模型共享与计算的难题;建立了可在线计算的协同分析环境,并在蒙古高原生态屏障建设和长三角城市群可持续发展评估等应用场景中示范。【展望】在以上技术进展基础上,指出地球表层系统科学数据挖掘与知识发现研究面向FAIR化、智能化、产品化、模型化以及场景化的未来发展趋势。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    邱芹军, 刘建东, 吴亮, 谢忠, 陶留锋, 郝孟璂, 李伟杰, 王洋
    地球信息科学学报. 2026, 28(3): 556-572. doi: 10.12082/dqxxkx.2025.250088 cstr: 32074.14.dqxxkx.2025.250088

    【目的】地球表层系统科学数据有向加权关联网络的关键节点识别对科学数据精准推荐与知识发现具有重要意义,但现有方法存在评估片面、特征利用不足及权重分配科学性欠缺等挑战。【方法】本文提出一种基于主客观融合权重的逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution, TOPSIS)的关键节点识别方法。首先,提出节点相似中心性指标,通过融合关联度与强度平衡局部拓扑与全局影响力;然后,构建整合网络拓扑、数据关联及节点相似性的多指标评价体系,全面刻画节点重要性;接着,提出双层权重优化策略,结合层次分析法(Analytic Hierarchy Process, AHP)和指标相关性定权法(Criteria Importance Through Intercriteria Correlation, CRITIC)方法,融合主客观权重,提升评估科学性;最后,结合TOPSIS评估方法进行节点重要性的综合评估。【结果】实验基于团队构建的不同规模的地表系统科学数据有向加权关联网络,结合加权易感-感染-恢复(SIR)模型进行实验验证,结果表明:与传统网络加权中心性以及基于主观或客观权重的TOPSIS等方法相比,本文方法在肯德尔相关系数值和TOP-K命中率方面表现更优,且在网络中展现强鲁棒性。【结论】该方法为地表系统科学数据网络分析提供了新方法,可支撑智能推荐、资源优化及系统脆弱性分析等实际应用,助力地球系统科学研究的深度发展。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    张静, 吴田军, 骆剑承, 李曼嘉, 方之杨, 李子琪
    地球信息科学学报. 2026, 28(3): 573-590. doi: 10.12082/dqxxkx.2025.250098 cstr: 32074.14.dqxxkx.2025.250098

    【目的】智能解译土地利用空间地理要素“在哪里”、“是什么”以及“怎么样”等问题是地学研究的经典问题,但相关方法在实际业务中常存在不准确、不好用的问题。近年来,将地理实体视为表达单元已成为重要的分析应用模式。然而,地理实体在不同粒度表现出相异的空间与语义特征,导致地理实体形态与属性的刻画仍存在难精准的弊端。为此,本文以系统性解构土地利用空间、精准表达地理对象为目标,剖析地理分区、地物分层、地类分级在解析复杂地表时的关键作用,并将其有序整合至遥感计算技术。【方法】本研究紧扣地理分析与遥感计算耦合的核心要义,将多粒度解构问题拆解为基于历史信息数据的地理空间区域划分、基于高分辨率影像的细粒度对象化建模、层级结构优化的递进循环3个关键过程。该方法遵循“全域-区域-局部-对象”由粗到细的多粒度层级空间,首先由地理分区为切入点认知全域背景、拆分全域单元;继而引入地理信息数据和各类专题数据构建局部约束单元;然后依托图像处理技术和地物分层策略,协同实现细粒度对象提取;最终通过层级关联优化形成动态更新的多粒度表达体系。【结果】以国土空间全要素监测监管为需求导向,选取东营市垦利区开展土地利用空间多粒度解构实验,获得了区域多要素地理对象,为后续研究提供基础数据支撑。【结论】经过初步实证研究,证明了方法的可实现性与优越性。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    张紫琦, 沈岗, 李永坤, 张孟斐, 陈正航, 付少坤, 吴锋
    地球信息科学学报. 2026, 28(3): 591-604. doi: 10.12082/dqxxkx.2026.250536 cstr: 32074.14.dqxxkx.2026.250536

    【目的】山洪灾害突发性强且常呈链式演化,现有预警模型在多源知识融合、建模自动化及全过程概率推理方面仍存不足。【方法】本研究构建了一种基于大语言模型深度挖掘、知识图谱驱动贝叶斯网络的山洪灾害链预警建模方法。研究利用大语言模型从3 000篇领域文献中抽取蕴含因果关系的三元组,构建了山洪灾害链知识图谱。该图谱经由一系列剪枝、节点聚合、离散化操作,被映射为有向无环的贝叶斯网络拓扑。研究对历史灾情报道进行结构化解析与状态赋值,在通过精确率等指标验证大语言模型各环节输出可靠性的基础上,构建了离散化数据集以支持参数学习,最终生成了可用于灾害链概率推理的预警模型。【结果】在典型案例验证中,模型准确预测了完整灾害链的演进路径与关键节点状态,总体平均Brier评分为0.160 8,证明了其良好的概率校准能力;批量案例测试Brier评分为0.184 6,进一步证实了模型在不同灾害链结构下的泛化稳定性。敏感性分析结果也揭示了多灾种叠加的非线性放大效应。【结论】该方法有效融合了领域先验知识与历史灾情数据,突破了传统建模的效率瓶颈,提升了灾害链预警的可解释性与智能化水平,为防灾减灾决策提供了新的理论路径。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    仲文, 邵彤, 王磊, 郭佳欣
    地球信息科学学报. 2026, 28(3): 605-622. doi: 10.12082/dqxxkx.2026.250586 cstr: 32074.14.dqxxkx.2026.250586

    【目的】街道空间感知是理解城市环境特征的重要手段,近年来受到广泛关注。然而,传统街道感知方法依赖问卷调研和宏观数据,存在主观性强、时效性差、空间分辨率低等局限,难以适应精细化空间治理的需求。本研究以北京市五环内区域为例,旨在构建一种大语言模型驱动的多模态街道空间感知分析框架,系统刻画街道空间感知及其文本语义特征。【方法】基于OpenStreetMap(OSM)路网按50 m间距采集百度时光机街景影像,依据可持续发展三重底线理论构建“生态-社会-经济”提示词体系,调用通义千问Qwen2-VL-72B大语言模型生成街景感知描述文本;进一步结合BERT和双层LSTM模型获得细粒度感知评分。在交通分析分区(TAZ)尺度上,开展感知指数的空间映射与自相关分析,并综合运用共词网络、LDA主题模型与文本知识图谱等方法,构建从街景影像到语义描述,再到量化感知,最终映射至地理空间格局的级联分析框架。【结果】以北京市五环路以内范围为研究区,研究结果揭示了研究区街道空间感知呈显著集聚分布,正向感知区域主要集中于二、三环,普遍具备较高绿化水平、整洁有序的街道环境以及较为丰富的文化、商业活动;负向感知区域多位于城市外围及功能尚不完善片区,常存在设施缺失、噪声干扰和环境污染等问题。语义分析表明,自然生态、功能效能、历史文化和商业活力是影响感知的关键主题。【结论】大语言模型与街景大数据的结合能够有效联通客观建成环境与主观感知评价,在精细空间尺度上揭示街道空间品质差异,为微观空间评估与街道更新提供了可推广、可解释的新技术路径。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    陈玮彤, 许鑫, 王曙, 杨飞, 诸云强, 赵晨
    地球信息科学学报. 2026, 28(3): 623-635. doi: 10.12082/dqxxkx.2026.250608 cstr: 32074.14.dqxxkx.2026.250608

    【目的】高质量地理问答数据集是地理大语言模型训练与微调的重要基础资源。在实际应用中,数据集一旦被非版权方用于私有模型微调,侵权方往往仅开放模型接口用于商业化服务,从而规避对原始数据来源的审计与追溯。针对这一问题,本文提出了一种基于语态后门水印的地理问答数据集版权保护方法。【方法】首先通过微调代理模型的方式,构造获得将部分问答响应改写为具有积极语态特征且语义保持一致的水印响应。随后,在问题文本中嵌入语义自然且低频出现的触发器词汇,构建含水印的地理问答数据集。在版权验证阶段,仅通过黑盒访问嫌疑模型的推理接口,并结合预训练的水印判别器,根据判别器输出的语态特征判定其是否使用了版权方的数据集。【结果】在DeepSeek-Coder、Qwen3和Llama-3共3个主流开源大语言模型上的实验结果表明,在20%水印嵌入率条件下,水印模型在语义一致性和语言流畅性指标上与干净模型基本一致,且水印验证成功率可稳定达到78%以上。此外,在Llama-3模型上的对比实验结果表明,本文方法在中文地理问答数据集上可实现86.75%的水印验证成功率,而对比方法在该场景下难以获得有效的水印检测结果;在Qwen3模型上的鲁棒性实验表明,在30%干净数据子集进行两轮微调后,仍能保持70.21%的水印验证成功率。【结论】该方法供了一种在不访问原始数据集、仅依赖黑盒模型接口条件下的黑盒版权验证解决方案,为地理问答数据集的版权保护提供有效技术支撑。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    王辉, 潘晓, 王书海, 陈晓, 李宁, 王佐承
    地球信息科学学报. 2026, 28(3): 636-651. doi: 10.12082/dqxxkx.2026.250455 cstr: 32074.14.dqxxkx.2026.250455

    【目的】海洋表面温度(Sea Surface Temperature, SST)是影响海洋生态系统的关键因素之一。为解决不同尺度的数据波动变化和多种环境变量之间相互影响问题,以提升在复杂海洋环境中的长时序预测性能。【方法】本文提出一种兼具多尺度建模时间特征和自适应挖掘变量间相互作用的时序预测模型ACAFNet(Adaptive Cross-scale Attention Frequency-aware Network),模型通过动态选择关键尺度划分时间序列,结合双注意力机制提取局部与全局特征;利用频域变换与可学习马氏距离度量多环境变量相关性,生成掩码矩阵筛选关键变量;最后融合多尺度时序特征与变量依赖关系进行预测。【结果】在1个私有数据集和3个跨纬度公开浮标数据集(覆盖热带至亚寒带)上,与5种基线模型进行在4个预测步长(96、168、336、720步)进行对比实验。实验表明, ACAFNet相比Transformer类模型在MSE、MAERMSE上平均降低1.81%、2.11%和1.36%,说明其在捕获多尺度波动与变量交互方面更具优势。【结论】 ACAFNet通过自适应多尺度划分与频域变量度量,有效提升了SST长时序预测的精度与鲁棒性,为海洋多变量时序预测提供了新思路。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    段腾飞, 吴雨桐, 陆雨婷, 刘辉, 吴鹏海
    地球信息科学学报. 2026, 28(3): 652-669. doi: 10.12082/dqxxkx.2026.250574 cstr: 32074.14.dqxxkx.2026.250574

    【目的】精准提取遥感影像地表水体对水资源管理、洪涝灾害监测及生态环境保护具有重要意义。尽管深度学习已成为主流方法,但现有模型难以兼顾局部细节的刻画与长距离全局依赖的建模,导致水体边界分割粗糙、微小细长河流断裂漏检,以及在复杂光照条件下难以精准区分水体与山体、建筑阴影等难题。【方法】针对上述问题,本研究提出了一种基于双主干特征动态融合的语义分割模型(Dual Backbone Fusion Net, DBF-Net)。该模型采用编码器-解码器架构,构建了MobileNetV3与Swin Transformer的异构双主干,分别负责提取局部细节与全局语义特征,以弥补单一架构在特征表征上的固有缺陷;设计了动态融合模块,通过自适应加权机制实现异构特征的有效对齐与深度互补,解决特征差异引起的融合难题;同时,引入链式空洞空间金字塔池化,以级联方式高效聚合多尺度上下文信息,增强模型对不同尺度水体目标的感知能力。【结果】在ESWKB与GID 2个公开数据集上,与Swin-Unet、 SegFormer、 CMTFNet等6种方法进行的对比实验结果表明:DBF-Net在各项评价指标上均优于对比模型,取得全面领先。具体而言,模型在2个数据集上的总体精度(OA)与交并比(IoU)分别达到99.15%、96.34%和96.47%、86.78%。相较于主流对比模型,DBF-Net在2个数据集上的IoU分别提升了0.15%~3.38%和0.72%~4.45%。此外,消融实验显示,该模型在ESWKB数据集上的IoU较MobileNetV3与Swin Transformer单主干基线分别提升2.16%与2.07%。【结论】本文提出的DBF-Net有效提升了模型在细小水体及复杂背景干扰条件下的提取精度,为实现更加精准的水体提取任务提供了技术支持,也为今后相关领域的研究提供了更多的探索思路。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    林实秋, 陈晓娜
    地球信息科学学报. 2026, 28(3): 670-690. doi: 10.12082/dqxxkx.2026.250141 cstr: 32074.14.dqxxkx.2026.250141

    【目的】准确预估未来积雪深度数据对于气候变化背景下冰雪经济发展具有重要意义,然而,现有未来积雪深度数据产品空间分辨率普遍较低,难以满足应用需求。本研究旨在设计一种降尺度方法提升北半球未来积雪深度产品空间分辨率,并分析其时空变化特征。【方法】共筛选第六次耦合模型比对计划(CMIP6)的21个主要大气环流模式(GCMs)和4个共享社会经济路径(SSPs)的积雪深度数据,时间范围涵盖1980—2100年。研究结合微波积雪深度数据和光学积雪覆盖率数据,耦合了Delta降尺度方法和空间特征迁移方法,分3个阶段将空间分辨率为1~2.5°的CMIP6未来情景数据降尺度至0.05°,并利用实地积雪深度观测数据进行精度验证。【结果】验证结果表明,降尺度积雪深度数据集在1980—2023年的均方根误差(RMSE)、偏差(Bias)和平均绝对误差(MAE)的表现均优于欧洲中期天气预报中心第五代陆面再分析数据集(ERA5-Land)和全球陆面数据同化系统(GLDAS)等主流再分析数据集。此外,基于降尺度积雪深度数据集分析发现,随着温室气体排放情景不断加剧,北半球积雪深度在2015—2100年的下降速率逐渐加快,而在空间分布上,东欧亚地区的积雪深度呈增加趋势,而北美地区则预计会减少。【结论】本研究提出的多维耦合降尺度方法有效提升了未来积雪深度数据的空间分辨率与精度,其结果可为冰雪经济发展、气候变化研究和水文过程模拟等应用提供重要数据支撑。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    黄柳红, 范晓梅, 詹鹏飞, 宋春桥
    地球信息科学学报. 2026, 28(3): 691-705. doi: 10.12082/dqxxkx.2026.250270 cstr: 32074.14.dqxxkx.2026.250270

    【目的】河口作为陆海交互作用的关键区域,其水质变化直接影响沿岸生态系统服务功能和人类健康福祉。然而,受潮汐、径流、悬浮物和有色可溶性有机物等多重因素共同作用,河口水环境往往表现出高度复杂性与动态性,发展有效的水环境遥感监测方法至关重要。FUI(Forel-Ule Index)水色指数通过21级色标(1-21)量化水体颜色,可有效表征水质特征。因此,本研究利用长时序卫星遥感数据,对南海沿岸河口开展大尺度FUI监测,以揭示河口水体颜色的空间分布格局与演变特征,探索FUI水色指数在复杂河口环境中的适用性与生态指示价值。【方法】本研究利用2013—2024年Landsat-8和Landsat-9卫星遥感影像,提取南海沿岸245个河口的FUI水色指数并分析空间分布特征,结合Theil-Sen Median趋势分析法和Mann-Kendall检验分析年际变化趋势,进一步对比干湿季的时空分布差异。【结果】① 空间格局上,南海沿岸河口FUI多年均值范围为11~21,平均值为17.30。南海周边岸带(泰国湾最低,东部海岸最高)与国家间(柬埔寨最低,菲律宾最高)存在显著差异; ② 年际变化显示,近10年南海沿岸河口FUI年际变化趋势存在差异,中国、越南等国河口水色向绿色转变,而马来西亚、印度尼西亚等国河口水色趋向更浑浊的黄棕色; ③ 干湿季河口FUI空间分布存在差异,在干季,中国广东省、泰国南部以及柬埔寨河口FUI较其他地区低,湿季FUI高值集中分布于越南北部至马来半岛西岸。年际变化上,干季年际变化率均值为-0.02/年,湿季河口FUI的年际变化率均值为-0.004/年,2013—2024年干湿季FUI整体波动幅度较小,湿季FUI始终高于干季且差异稳定。【结论】南海沿岸河口FUI的空间与时间变化特征揭示出水色存在显著的地域分异和季节特征,反映出区域人类活动、水文条件的综合影响。本研究不仅拓展了FUI水色指数在复杂河口环境中的适用性,也为南海沿岸河口水质的长期监测、生态环境评估与跨国水环境管理提供了关键的基础信息。

  • 专栏:“地球表层系统数据挖掘与知识发现”
    蔡润, 乔亦娜, 杨慧, 范怀伟, 姚月婧, 崔柳, 王勇, 冯健, 王文峰
    地球信息科学学报. 2026, 28(3): 706-721. doi: 10.12082/dqxxkx.2026.250210 cstr: 32074.14.dqxxkx.2026.250210

    【目的】作为典型的干旱区生态系统与人类活动高强度交互作用区域,新疆的甲烷循环过程受人类活动与自然地理条件的双重影响显著。分析多源数据驱动下新疆XCH4浓度时空变化及影响机制,对于应对气候变化、制定精准的区域甲烷减排策略具有重要意义。【方法】本文针对新疆独特的自然地理与人文环境特征,基于2019—2023年Sentinel-5P卫星XCH4数据,综合集成地表起伏度、气象条件、植被指数、畜牧活动强度、煤矿开采强度和夜间灯光等多源时空数据,采用SHAP值解析方法定量分析各影响因素对甲烷浓度时分异特征的贡献度及交互作用机制,通过特征重要性排序筛选核心影响因素,构建XGBoost-DF混合模型进行XCH4数据重建,进而揭示新疆地区甲烷柱(XCH4)浓度的时空分布特征及演变规律。【结果】 ① 构建的XGBoost-DF混合模型预测精度优于单一模型,能够有效填补XCH4遥感观测数据的缺测区域,为复杂区域甲烷时空变化及影响机制研究提供了可靠的数据支撑,SHAP-XGBoost为新疆甲烷源汇精准识别提供了可解释性工具; ② 影响因素分析显示,畜牧强度是人为排放主导因子,牛类养殖贡献占畜牧业总增量的88.7%;自然因素中地表温度通过增强甲烷生成菌活性对浓度变化起正向驱动作用,而近地面10 m风速通过扩散效应抑制局部积累; ③ 新疆XCH4浓度呈现“南高北低、盆地高于山区”的空间分异特征,2019—2023年年均浓度范围为1 727.3~1 972.61 ppb,整体呈上升趋势,增幅1.5%,季节性波动呈夏秋双峰特征。【结论】本文提出的遥感数据重建与影响因素分析方法,用于新疆XCH4浓度的时空变化与影响因素分析,为后期该区域的甲烷减排举措与管理制度提供了理论依据和技术支持。