【意义】经典统计推断依赖大样本与独立同分布前提,但时空数据却往往不满足这两大前提,因此,经典统计框架下的时空统计方法具有一定理论局限;相较而言,贝叶斯统计范式下的时空统计方法通过融合先验信息、引入参数随机性,形成统一的概率推断框架,可考虑更多不确定性,并能有效克服时空数据中的小样本和非独立问题,在时空统计建模中体现出较强的自身优势,并受到广泛关注和快速发展。【进展】本文首先从方法论演进角度出发,从传统贝叶斯时空统计与贝叶斯时空机器学习两个视角系统梳理了主流的贝叶斯时空统计模型,前者包括贝叶斯时空演化层次模型、贝叶斯时空回归层次模型、贝叶斯空间面板数据模型、贝叶斯时空地理加权回归模型、贝叶斯时空变系数模型和贝叶斯网格化时空高斯过程模型,后者包括贝叶斯时空因果森林模型、贝叶斯时空神经网络模型和贝叶斯时空图卷积神经网络模型;后又从实际应用方面,重点回顾了贝叶斯时空统计模型在公共卫生、环境科学、经济社会与公共安全、能源与工程等领域的应用。【展望】贝叶斯时空统计方法需在多源异构数据建模、深度学习融合、因果推断机制引入及高性能计算优化等方面实现突破,以兼顾理论完备性与实践适应性,推动其发展为具备因果推断、自适应泛化及智能分析的下一代时空建模范式。
【意义】人类移动与交通、传染病、安全等密切相关,使得轨迹分析与建模成为持续的研究热点。目前,学界与业界已发展了大量以机器学习/深度学习为主流的轨迹专门模型,如轨迹插值模型、轨迹预测模型、轨迹分类模型等。然而,这些模型大多针对专门任务设计、基于局部区域数据训练,难以泛化应用于其他任务、其他区域乃至其他类型的轨迹。近年来,随着生成式人工智能发展,通用基础模型在自然语言处理、计算机视觉等领域得到显著应用。在这一技术发展趋势下,构建轨迹基础模型,使其学习到大规模轨迹数据的通用特征,以适用于不同区域与多种下游任务,成为轨迹建模的迫切需求。【方法】本文首先系统综述了各类轨迹专门模型的研究进展与发展脉络,然后将轨迹建模任务分为常规任务(轨迹相似性计算、插值、预测、分类等)与生成任务(轨迹生成),阐述了近年来面向这两类任务的轨迹基础模型前沿研究进展。【结论】本文认为,面向常规任务的轨迹基础模型除了具备任务泛化能力,还应进一步强化其空间泛化与数据泛化能力;面向生成任务的轨迹基础模型还需攻克空间泛化难题,能够基于易获取的目标城市宏观数据或特征,“从无到有”生成城市级大规模轨迹数据。此外,将轨迹数据与其他类型数据(如文本、地图、其他地理空间数据)联合构建多模态地理基础模型,以及构建面向交通管理、传染病传播、公安寻人等业务场景的轨迹基础模型,也是未来值得探讨的研究方向。
【目的】视觉平衡是影响地图信息传输效率和视觉美感的重要因素之一。尽管现有的视觉平衡度计算方法在传统地图的度量和评价方面表现出色,但面对个性化要素配置的微地图时,其适用性却大打折扣。尤为突出的是,微地图图面要素的活跃性导致其分布格局复杂且量化工作艰巨,给微地图的视觉平衡度计算造成了极大挑战。【方法】本文提出了一种多因子驱动的微地图视觉平衡度计算方法。首先对每幅微地图进行自适应共现滤波和隶属度矩阵划分,以优化图像分布特征,确定各要素的归属程度,实现基于鲁棒模糊C均值聚类的图面配置要素提取。接着引入亮度、对比度、显著性3个视觉特征因子,分别关注图像的重量、细节和焦点,量化图面要素布局的配置权重。最后,依据图面要素视觉重心与几何中心的距离及方位构建微地图视觉平衡度计算方法。依据上述方法,构建了一个涵盖项目原创、新闻媒体及旅游官网等多种数据源的78幅微地图实验数据集,并通过参数影响实验、评价调查与对比实验、图面要素分布变化实验等,依次验证所提方法的有效性。【结果】当距离权重α为0.8,角度权重β为0.2时,提出的视觉平衡度计算方法最符合人类的审美认知。【结论】所提方法与专家制图经验高度契合,体现了良好的人类视觉认知模拟性能。
【目的】传统聚落拥有丰富的乡土文化价值,是悠久农耕文明及其深厚智慧的结晶,结合信息地理学原理揭示其传统文化内涵具有重要意义。当前,从社会文化符号视角考察景观基因的信息属性特征的相关探讨较为缺乏。【方法】对此,结合信息熵理论,本文首先提出景观基因符号信息量的概念。接着,根据景观基因符号表达方式的差异,本文从灰度距离、频谱、Bayesian概率统计、邻接关系和结构要素等方面定义了相应的信息量计算方法,并以湖南省中田村为案例开展了相应的实验。同时,本文根据实验结果设计了模拟旅游导览路线,探讨了景观基因符号信息量的潜在应用前景。【结果】结果表明:① 可以结合信息量计算方法度量景观基因的符号信息量; ② 景观基因符号信息量可以度量景观基因符号的文化属性特征信息;③ 景观基因符号信息量在传统村落保护和合理开发等领域有着广阔的应用前景。【结论】本文是从信息科学视角探究景观基因信息特征的科学尝试,有助于推动景观基因理论的深化应用。
【目的】建筑物是地图上的重要组成要素,其形状识别既是空间认知和相似关系领域的研究热点和难点,也可以为地图制图综合的自动化实现提供技术支持。针对目前基于监督学习的栅格化建筑物形状识别方法需要大量标注样本的缺陷,本文融合了对比学习的自监督特征提取策略和迁移学习的监督分类技术,提出了一种基于对比迁移模型(Contrastive Learning Transfer Model, CLTM)的栅格化建筑物形状识别方法。【方法】首先,提取建筑物的形状并对其进行二值化和尺寸标准化处理,消除尺度与像素等因素的干扰;然后,构建对比学习模型对建筑物形状进行编码,获得高维特征向量,利用设计的对比损失函数优化模型;最后,以对比损失进行梯度更新,使用迁移参数预测建筑物形状以验证模型性能。【结果】实验结果表明,该方法的建筑物形状分类准确率达到93.79%,高于AlexNet方法的93.11%,但低于ResNet50方法的96.10%。在形状识别应用中运用t-SNE可视化技术,清晰展示了不同形状类别在特征空间中的聚类趋势,直观显示了形状识别效果,进一步验证了模型的有效性。【结论】尽管该方法的分类准确率低于监督的ResNet50方法,但该模型显著减少了分类准确率对大量标注数据的依赖,同时降低了人工视觉偏差的影响,是一种有效可靠的建筑物识别方法。
【目的】小目标检测在军事和民用领域具有重要意义,但由于低分辨率、高噪声环境、目标遮挡及背景复杂等因素的影响,传统检测方法在精度和鲁棒性上难以满足实际需求,复杂场景下的小目标检测问题仍极具挑战性。因此,本文提出一种混合特征与多尺度融合的小目标检测算法。【方法】首先,本文设计了一种混合特征提取模块(Hybrid Conv and Transformer Block, HCTB),充分利用局部和全局上下文信息来增强网络对小目标感知,优化了计算效率和特征提取能力;其次,提出了多膨胀率共享卷积核模块(Multi-Dilated Shared Kernel Conv, MDSKC),通过不同膨胀率的空洞卷积扩展主干的感受野,高效提取多尺度特征;最后,结合基于Omni-Kernel和Cross Stage Partial思想构建的全核跨阶段特征融合模块(Omni-Kernel Cross Stage Model, OKCSM),优化了小目标特征金字塔网络,更大程度上保留小目标的信息,提高了检测性能。【结果】本文在 VisDrone2019和TinyPerson数据集上进行了消融实验和对比实验,结果表明:本文方法相较于基线模型yolov8n,在查准率、召回率、mAP50、mAP50:95上分别提升为1.3%、3.1%、3%、1.9%和3.6%、1.3%、2.1%、0.7%,且模型尺寸和GFLOPs仅为6.3 MB和11.3 G;此外,在与HIC-Yolov5、TPH-yolov5、Drone-YOLO等经典算法的对比实验中,本文提出的算法显示出明显的优势,优于其他对比方法。【结论】本文算法有效提升了检测精度,证明了本文算法面对复杂场景中小目标检测问题方面具有良好的检测性能。
【目的】跨视角图像地理定位是指通过将待查询影像与不同视角且具备精确位置信息的参考影像进行匹配从而推断其地理位置的一门技术。该技术已经广泛应用于无人机导航、目标定位等现实任务中。当前基于深度学习的无人机-卫星跨视角图像检索定位方法大多依赖监督学习,但高质量标注样本的稀缺导致监督学习模型的泛化能力受限。同时,由于现有方法对空间布局特征的建模缺失,使得跨视角影像间的显著域差异难以弥补。【方法】针对上述问题,本文提出了一个基于无人机-卫星影像的跨视角图像检索定位新架构——DINO-MSRA,该架构首先利用经Conv-LoRA微调后的Dinov2大模型作为特征编码器,旨在利用较少的参数量增强模型的特征提取能力。其次,设计了一个基于Mamba模块的空间关系感知特征聚合器(MSRA)用于聚合图像特征,通过将空间配置特征嵌入到全局描述符中,为跨视角匹配定位任务带来了显著的性能增益。最后,采用InfoNCE损失函数对模型进行训练。【结果】本文在Univerisity-1652和SUES-200数据集上进行了大量对比实验和消融实验,实验结果表明,当分别面向无人机定位任务和无人机导航任务时,本文方法在Univeirity-1652数据集上的R@1精度达到95.14%、97.29%,相比于目前最优算法CAMP分别提升0.68%、1.14%;在SUES-200数据集上150 m高度的R@1精度分别达到97.2%、98.75%,相较于CAMP提升1.8%、2.5%,并且所需参数量也明显少于现有算法,仅为Sample4Geo的19.2%;【结论】DINO-MSRA在跨视角图像匹配方面优于目前最先进的方法,实现了更高的精度,更快的推理速度,证明了其在具有挑战性的场景中的鲁棒性和实际应用潜力。
【目的】高分辨率遥感影像语义分割通过精准提取地物信息,为城市规划、土地分析利用提供了重要的数据支持。当前分割方法通常将遥感影像划分为标准块,进行多尺度局部分割和层次推理,未充分考虑影像中的上下文先验知识和局部特征交互能力,影响了推理分割质量。【方法】为了解决这一问题,本文提出了一种联合跨尺度注意力和语义视觉Transformer的遥感影像分割框架(Cross-scale Attention Transformer, CATrans),融合跨尺度注意力模块和语义视觉Transformer,提取上下文先验知识增强局部特征表示和分割性能。首先,跨尺度注意力模块通过空间和通道两个维度进行并行特征处理,分析浅层-深层和局部-全局特征之间的依赖关系,提升对遥感影像中不同粒度对象的注意力。其次,语义视觉Transformer通过空间注意力机制捕捉上下文语义信息,建模语义信息之间的依赖关系。【结果】本文在DeepGlobe、Inria Aerial和LoveDA数据集上进行对比实验,结果表明:CATrans的分割性能优于现有的WSDNet(Discrete Wavelet Smooth Network)和ISDNet(Integrating Shallow and Deep Network)等分割算法,分别取得了76.2%、79.2%、54.2%的平均交并比(Mean Intersection over Union, mIoU)和86.5%、87.8%、66.8%的平均F1得分(Mean F1 Score, mF1),推理速度分别达到38.1 FPS、13.2 FPS和95.22 FPS。相较于本文所对比的最佳方法WSDNet, mIoU和mF1在3个数据集中分别提升2.1%、4.0%、5.3%和1.3%、1.8%、5.6%,在每类地物的分割中都具有显著优势。【结论】本方法实现了高效率、高精度的高分辨率遥感影像语义分割。
【目的】精细提取全球地表水对水资源管理及气候监测具有重要意义。合成孔径雷达(SAR)凭借主动微波成像技术,可面向多云多雨地区实现全天时、全天候水体动态变化监测。针对传统方法对河网密布、地形复杂地区水体提取精度低以及由于SAR成像特性导致难以精准区分水体、山体阴影、裸地等难题,本文提出了一种顾及SAR多通道信息的多尺度特征融合水体提取MSFSwin(Multi-Scale Feature Fusion Swin)网络模型。【方法】通过融合升、降轨Sentinel-1影像的双极化特征及数字高程模型(DEM)构建多通道遥感水体数据集;并引入空洞空间金字塔池化(ASPP)模块,通过不同感受野的特征聚合增强对多尺度水体区域的感知能力,弥补Swin Transformer在跨窗口特征整合方面的不足;同时,设计多层次解码结构,通过层级特征融合强化跨尺度信息交互,实现水体精细提取。为验证本文提出MSFSwin模型的有效性与鲁棒性,选取青藏高原典型水体覆盖区进行水体提取实验,并定性、定量比较不同水体提取方法(含多种深度学习模型及KNN算法)的精度。【结果】MSFSwin模型在水体提取精度上明显优于Swin Transformer、Segformer、ViT等模型及KNN算法。其中,MSFSwin模型在干流湖泊交汇区的BF-score较原模型Swin Transformer提升了4.15%,在细小水体区IoU提升了3.52%,实现了复杂地形下的水体高精度自动提取。【结论】本文通过MSFSwin模型及多通道融合策略对水体、山体阴影等区分效果明显,有效提升了模型在复杂地形条件下水体提取的鲁棒性与适用性,为全天时、全天候、高精度水体提取提供了可靠技术支持。
【目的】降雨监测对于防御气象灾害、保护生态环境以及科学管理水资源等具有重要意义。现有研究在利用机器学习算法反演降雨时,出现将类别不均衡或随机过、欠采样等数据作为模型输入特征的情况,存在特征间包含相关性较高的因子,易削弱模型精度与泛化能力等问题,本文提出一种新的融合机器学习和卫星遥感资料的降雨监测模型。【方法】该方法利用福建省2020—2022年14次主要降雨过程中实测雨量数据和FY-3D卫星微波温湿度计融合产品(Microwave Temperature Sounder/Microwave Humidity Sounder, TSHS)中的微波湿度计(Microwave Humidity Sounder, MWHS)亮温资料,提出基于合成少数类过采样(Synthetic Minority Over-sampling Technique, SMOTE)与主成分分析(Principal Component Analysis, PCA)法,通过随机森林(Random Forest, RF)分类器构建SMOTE-PCA-RF小时级监测模型,实现福建省降雨落区识别与等级划分,并与RF、 PCA-RF、 SMOTE-RF的反演结果进行对比,从中筛选出最优模型。【结果】SMOTE-PCA-RF模型在降雨落区反演的测试风险评分(Threat Score, TS)和等级划分反演的测试调和平均值(F1)均为0.60,表现最优,且相较于其他模型, TS值提高3.45%~9.09%, F1值提高9.09%~33.33%。此外,研究发现SMOTE法虽能提升模型的分类性能,但会加剧过拟合现象与空报率(False Alarm Rate, FAR);而PCA法通过数据降维不仅能提高模型泛化能力,还将训练时效提升9.75%~31.70%。基于SMOTE-PCA-RF模型的个例分析表明,随着降雨量增加导致反演精度有所降低,但测试F1值达0.50,反演结果与实测雨况空间分布具有较高一致性。【结论】研究可为降雨监测提供技术支撑,有助于相关部门快速且直观了解大尺度范围内降雨落区及强度划分的空间分布变化,进一步提升气象防灾减灾能力。
【意义】社区作为城市基本构成单元,碳排放水平和精确核算直接影响着建筑行业整体减排成效,本文梳理了目前碳核算主要方法及其优劣,提出了基于数字孪生技术提升社区碳核算精确性和全面性的新思路。【进展】本文首先介绍3种传统碳核算方法—碳排放因子法、质量平衡法和实测法及其应用情况,梳理适用于社区尺度碳核算的数字孪生技术,主要包括建筑信息模型BIM、地理信息系统GIS和物联网IoT技术;本文分析了 ① 拓展基于数字孪生技术碳核算的覆盖面至社区层次,② 加强多项数字孪生技术的融合互联程度,③ 建立基于数字孪生技术的社区碳核算体系3个方面发展趋势;提出集成BIM、GIS和IoT 3种成熟技术并搭建基于城市信息模型CIM社区碳排放体系的广阔前景。【展望】未来,应用数字孪生技术可实现“不同尺度”和“不同地域环境”社区精准碳核算、碳排量预测、减碳路径制定、以及进行评估与反馈。同时随着AI技术发展,未来有望将城市信息模型CIM社区碳核算单元与AI智能体整合,充分发挥大数据、大模型和大算力优势,从而构建智慧城市智能化社区碳核算体系。
【目的】本文旨在研究中国城市路网形态与道路交通碳排放之间的关系及其影响机制。随着交通运输业的快速发展,道路交通碳排放(RTCE)已成为我国碳排放的重要组成部分。深入分析路网形态对道路交通碳排放的影响,对于实现碳达峰和碳中和目标具有重要意义。【方法】本文以中国302个城市功能区域为研究对象,基于城市路网、道路交通碳排放网格数据、人口和GDP网格数据,采用多尺度地理加权回归模型(MGWR)和SHAP机器学习方法,从道路等级分布、交通网络密集度和交通网络结构3个维度量化路网形态,并分析其对道路交通碳排放的影响机制。【结果】① 道路交通碳排放的空间分布呈现以京津冀(1 003.604 t/km2)、长三角(849.074 t/km2)、珠三角(1 615.291 t/km2)及省会城市(1 168.886 t/km2)为中心向周边递减的多中心分布格局,东部地区高于中西部地区。路网形态的空间分布特征中,交通网络密集度和道路等级分布与RTCE的分布特征类似,南方地区道路方向丰富度(RDR)较高,北方地区道路网格系数(GC)较高; ② 路网形态对道路交通碳排放的影响具有显著的空间异质性。例如,路网密度(RND)对珠三角地区的影响更为显著(0.636),道路方向丰富度(RDR)对长三角地区的影响更为显著(0.259)。此外,不同路网形态指标对各地区道路交通碳排放的影响程度具有显著差异; ③ 路网形态对道路交通碳排放具有空间非平稳性和非线性影响。例如, RND的带宽仅为45,而RCR的带宽为215,表明不同路网形态特征对道路交通碳排放的空间影响尺度不同。在考虑非线性影响的机器学习SHAP分析中, RND是对道路交通碳排放影响的最重要特征。【结论】本文通过MGWR模型和SHAP方法,揭示了路网形态对道路交通碳排放的空间非平稳性和非线性影响机制。研究结果表明,不同区域的路网形态特征对道路交通碳排放的影响存在显著差异,这种差异不仅体现在空间分布上,还体现在影响机制上。因此,在制定低碳路网规划时,需要充分考虑路网形态的空间异质性、非平稳性和非线性特征,从“密度-等级-结构”多维特征视角进行综合分析,以实现城市交通的低碳发展。这些发现为城市交通规划和低碳发展提供了科学依据,对实现可持续城市发展、改善交通效率和提高居民生活质量具有重要意义。
【目的】城市三维增长与文化古迹保护之间的冲突矛盾给可持续发展带来了挑战。开展古迹保护约束下城市三维空间增长模拟,可以为城市空间布局优化、遗址管控与治理以及可持续发展目标的实现提供有效空间决策支持。然而,当前顾及古迹保护的城市三维增长情景模拟研究较少。【方法】本文构建了一个三维分区GA-CA-Markov模型,以西安都市圈为研究区,首先,利用分区GA-CA-Markov模型预测古遗迹约束条件下的城市水平增长3种情景,其次,基于随机森林模型对新增建设用地进行城市功能类型分类,并采用LightGBM模型预测各功能区的建筑高度,从而预测古遗迹保护约束下城市三维空间增长。【结果】结果显示:① 三维分区GA-CA-Markov模型能够有效模拟古迹约束下城市增长格局,城市水平增长模拟的总体精度达到89.65%, FoM系数达到0.274 0,建筑高度均方根误差在1.7~2.8 m之间。 ② 古迹保护情景下,新增建设用地以住宅与公共服务用地为主,并呈现跳跃式与边缘式增长,整体形成低密度的有序扩张格局;新增建筑高度受到严格控制,以中低层建筑为主,通过限制垂直发展有效协调了城市扩张与古迹保护之间的关系。 ③ 古迹周边0.5 km的住宅和公共服务用地建筑高度受到了显著控制,有效维护了城市景观的整体协调性。【结论】三维分区GA-CA-Markov模型可广泛应用于古城的三维空间精细模拟与预测,为城市古迹保护和空间治理提供科学依据。
【目的】国家文化公园建设背景下,长城、大运河等线性文化遗产本体上的旅游与游憩活动正在迅速拓展至沿线的带状区域,国家文化公园的景观规划设计就需要从资源价值角度回答“在哪儿能看见景观”的问题,其关键在于有效解决大规模文化遗产视觉感知研究中存在的景观多维语义表达不充分和可视计算量大的问题。【方法】本文基于格式塔理论,综合大型线性文化遗产景观蕴含的系统层级、空间结构、历史功能及形态美学等多维语义,设计了景观语义特征点自动提取与可视区位计算方法。首先,遵循突出线性文化遗产景观意义和视觉价值的原则,将遗产景观抽象概括为一组包含景观语义信息的特征点;其次,基于景观语义特征点计算可视区位,并选用NetCDF多维数据格式将可视计算结果与景观语义特征点集成组织存储,以特征点为纽带将景观多维语义与可视区位一体化表达;进而,通过可视区位挖掘方法,实现对于景观语义的“概括—表征—还原”过程;【结果】选取京津冀行政区范围内的明代长城遗产进行实证研究,基于DEM和文物普查等基础数据共提取出53 454个特征点,并进行了可视区位计算与组织,实地验证可视区位的特征点数量和内容吻合度平均值分别为76.37%和70.69%,表明方法能够快速提取表征大规模遗产景观语义的特征点,可视区位计算结果具有较高可信度,基于特征点的可视区位信息挖掘能够寻找特定区位上的可视景观语义和感知特定景观语义的优质可视区位,实现景观语义和可视区位的双向查询。【结论】多维语义特征点提取与景观可视区位计算方法可以为大尺度文化遗产可视分析研究和景观视觉价值挖掘提供方法和思路。
【目的】兴趣点(POI)具有地理空间实体与文化信息承载双重特性,是分析、识别区域文化表达和功能特质的数据基础。基于POI大数据识别、分析大运河沿线旅游文化场景类型及其特征,对实现大运河沿线地区文旅差异化可持续发展具有重要意义。【方法】通过将POI数据与场景理论结合、空间实体与文化价值关联、定量统计与定性组态分析融合,构建了“空间载体-文化价值-场景类型”分析框架。本文抓取476 968条POI数据,首先建立了包括6个大类、 24个小类的旅游文化舒适物数据库;采用德尔菲(Delphi)法确定旅游舒适物场景子维度的分值,计算旅游文化场景表现得分;最后,运用描述性统计分析、 K均值聚类法、系统聚类法识别旅游文化场景类型,并将聚类结果进行地图可视化表达,分析旅游文化场景类型特征、组态影响机制与对策建议。【结果】① 大运河江苏段沿线能够彰显当地旅游文化特色,地方特质显著,具备一定表现能力和吸引力,但在旅游文化价值取向上差异较大,尤其表现在本地性、迷人、展示、功用主义和感召力等子维度,表明大运河江苏段沿线旅游文化场景具有异质性特征; ② 经过聚类分析,大运河江苏段沿线34个县(市、区)可以划分为本土型场景(10个)、功利型场景(8个)、舒适型场景(13个)以及魅力型场景(3个)4种类型,判别分析验证了聚类结果的科学性。4种场景类型呈现不同特征; ③ 江苏大运河沿线旅游文化场景类型的组态影响路径可归纳为3条,受经济发展、城镇化、人口规模、财政政策、交通通达、文旅资源多因素耦合影响,其中经济发展、城镇化水平和人口规模是影响旅游文化场景类型的核心条件。【结论】基于POI大数据,将场景理论引入文化旅游发展研究中,为区域文旅差异化可持续发展开拓了新思路。