【意义】 地理建模是解决地理学相关的各种复杂实际问题的科学手段,但执行过程导向的传统地理建模方式给建模者(尤其是非专业用户)实际应用时带来沉重的建模负担。【方法】 本文提出了智能化地理建模应该从用户的建模目标出发,形式化为初始的建模问题单元,以递归求解的思路逐步解决当前的建模问题单元,之后上溯推理形式化新的建模问题单元、相应求解出适用的地理模型(或其组成部分),从而实现根据用户实际应用问题的场景自动构建出合适的地理模型工作流。【进展】 本文介绍了在此基本思想指导下,作者近年来开展的一系列智能化地理建模的方法研究工作,旨在有效降低实际应用中非专业用户的地理建模难度,同时保障所建模型的准确性。基于上述方法研究工作,可实现领域建模知识(尤其是案例化的应用场景知识)驱动、“数据-知识-模型”协同递归的智能化地理建模计算应用模式,基于此开发了原型系统——地理空间智能计算系统(EGC)。【展望】 本文最后重点讨论了上述方法研究与当前兴起的利用大语言模型进行地理建模研究工作之间的关系,并讨论了下一步研究方向。
【目的】 大语言模型是否具有空间认知能力及其水平的量化方法,是大模型和地理信息科学研究的重要问题。目前还缺乏大语言模型空间认知能力测评的系统方法和标准。本文在研究现有大语言模型特征的基础上开展大语言模型在空间认知问题上的测试标准研究,最终形成一套具备大语言模型空间认知能力的测试标准框架SRT4LLM和测试流程,用以评估大语言模型的空间认知能力。【方法】 SRT4LLM分别从空间场景中的空间对象类型、空间关系和Prompt策略3个维度研究构建测试体系,包括3种空间对象类型、3种空间关系和3种提示工程策略,并制定标准化测试流程。通过对8个不同参数的大语言模型进行多轮测试,验证SRT4LLM标准的有效性和结果的稳定性,据此标准测试不同大模型在逐次改进的提示工程的得分。【结果】 输入空间对象的几何复杂度影响大语言模型空间认知,不同大模型表现差异较大,但同一大模型得分较为稳定,随着空间对象几何复杂性和空间关系复杂度的增加,大语言模型对3种空间关系的判断准确率最大仅有7.2%的小幅下降,显示本测试标准在不同场景间的较强的适应性。改进的提示工程能够部分改善大语言模型的空间认知问答得分,且不同大模型的改善程度差异较大,本标准具备挖掘大模型空间认知能力的能力。同一大语言模型多轮测试表明测试结果收敛,大模型之间的分值差也较稳定。【结论】 SRT4LLM具备度量大语言模型空间认知能力的能力,可作为大语言模型空间认知能力的评估的标准化工具,可为下一步构建原生的地理大模型提供支持。
【目的】 区位问题广泛应用于公共服务设施布局规划。经典区位问题多以设施成本、出行距离成本或覆盖客户数量等效率指标为目标,空间公平性考虑不足。部分区位模型考虑服务空间公平性,但存在公平与效率指标难以协调、计算复杂度过高和模型缺乏通用性等不足之处。针对现有区位问题之局限,本文提出了一个兼顾设施经济性、出行便捷性和空间公平性的双目标设施区位问题(CEEFLP)。【方法】 CEEFLP有2个目标函数:最小化设施总成本函数,以及最小化出行距离和距离半方差聚合函数。前者优化设施经济性,后者平衡出行便捷性和空间公平性。为求解CEEFLP,设计了一个基于节点交换方法的迭代局部搜索(ILS)算法。【结果】 14个基准案例计算结果表明:① ILS算法能够高效、高质量地求解CEEFLP,模型参数α为1、推荐值和0.001时,ILS求解结果与最优解或已知最好解的差距分别为0.09%、0.24%和0.41%;② 设施成本预算确定时,可以通过出行成本小幅上升,换取所有公平性指标的改善;出行距离增加2.17%,出行距离标准差和基尼系数分别下降了7.95%和9.75%; ③ 增加设施成本预算,既能够降低出行成本,也能够改善空间公平性指标;设施成本每增加1%,出行距离平均下降0.37%,出行距离标准差和基尼系数分别下降0.31%和0.31%。【结论】 CEEFLP能够为设施选址提供一组Pareto最优解,兼顾到设施成本、出行成本和空间公平性,对于公共服务设施布局规划具有实用价值。
【目的】 城市道路网选取是地图综合领域的重要研究方向之一,其中特征选择是影响选取准确性的关键环节。然而,随着新的特征指标不断提出,如何科学地选择特征成为了一直以来亟待解决的难题。【方法】 本文引入了机器学习的可解释性框架—SHapley加性解释(SHapley Additive exPlanations, SHAP),旨在分析道路网选取中的特征重要性,为特征选择提供新的解决方案。首先,通过文献统计的方式,研究选用了7种常见的特征作为研究对象,并以10个中国典型城市的1:25万和1:100万比例尺道路网数据为基础,构建包含7种特征指标的数据集。随后,利用LightGBM与XGBoost两种监督学习模型进行训练,并通过模型的评价指标对模型性能进行评估。最后,采用SHAP框架对2个模型进行解释,并分析特征间的相似性、作用方向及其重要性。【结果】 在特征相似性方面,拓扑特征具有较强的相似性,“周边POI数量”与其他特征的相似性较低。在特征作用方向方面,“周边POI数量”和“交通流量”对模型的影响较为不稳定,而其他特征的高值通常有正向贡献。在特征重要性方面,XGBoost模型显示“等级”是最重要的特征,之后是“长度”和“交通流量”。而LightGBM模型的结果与XGBoost模型类似,表明模型对特征重要性影响较小。研究进一步基于本文的权重结果进行道路网选取,并将结果与标准数据进行对比,实验结果显示选取结果与标准数据有较高的一致性。【结论】 本文提出了一种新的解决方案,用于道路网选取中的特征重要性分析,并为特征选择和特征赋权问题提供了参考依据。
【目的】 多尺度面状建筑群组相似度计算在场景相似检索、模式识别及匹配、地图综合等方面有着重要的应用。然而,传统几何方法只能提取建筑物的低维特征且权重设置主观性强;现有深度学习方法较少考虑建筑物之间的空间关系特征,且只通过图级处理得到群组的上下文信息,容易忽略局部细节的差异性。鉴于此,本文提出一种融合空间关系与SimGNN(Similarity Computation via Graph Neural Networks)的多尺度面状建筑群组相似度计算方法,通过图级和细粒度节点级两种策略比较两群组目标的几何特征和空间关系特征,从而得出二者的相似度。【方法】 首先,将两幅不同比例尺的矢量地图裁剪成若干个同区域的建筑群组,并分别构建它们的图结构;然后,提取群组中各建筑物的几何特征和空间关系特征组成特征向量;最后,将图结构和特征向量输入到相似度计算模型SimGNN中,分别经过图级和节点级处理,得到两群组之间的相似度计算结果。【结果】 与现有方法相比,该模型利用两种策略处理几何和空间关系特征得出的相似度结果更符合人们的空间认知,且该模型能够通过节点级相似度,体现出建筑群组间的细微差异,有效地提高了不同尺度建筑群组之间相似度计算的准确性。【结论】 该模型有助于提升建筑群组相似检索、识别及匹配等空间数据处理方法的合理性和可靠性。
【目的】 建筑物群组模式是城市结构和功能的重要组成部分,其自动识别是城市规划与分析、城市区域制图综合等领域研究的热点和难点问题。针对现有建筑物群组模式分类研究具有简单性和特定性,忽视了领域知识应用的问题,本文提出了一种融合领域知识的建筑物群组模式自动分类方法。【方法】 首先,以建筑物多尺度表达和制图综合的需求为牵引,面向街区内建筑物群组分布层次,将建筑物群组模式分为规则、混合和不规则3类,并构建和标注数据集;其次,结合视觉认知特点和传统规则算法的相似性判断领域知识,设计了一种正对投影对偶图(dual positive projection graph,DPRG)及其节点相似性特征描述;然后,引入Graph Sample and Aggregate (GraphSAGE)网络构建了建筑物群组模式自动分类模型,通过数据驱动的学习获取模式自动分类能力。【结果】 DPRG优于常用的邻近图及其对偶图结构,测试集准确率达到91.2%,相较于已有方法准确率提高了9.0%,规则与不规则模式的二分类准确率达到98.4%;该模型相较于GCN和GAT模型,准确率分别提高了3.6%和4.6%。【结论】 验证了该模型对规则与不规则模式优良的分类能力,同时对分类模糊的混合模式具有较好的区分能力,并将分类结果进行应用测试与分析。
【目的】 训练样本的质量对模型性能和预测结果有着重要影响,对于小样本数据区域,有限的样本数量及空间分布不均匀可能导致模型无法充分学习致灾要素特征,进一步增加了模型过拟合风险,影响模型预测准确度,因此需要根据区域特点有针对性地采集优化训练样本。【方法】 本文提出一种训练样本采样优化方法,将滑坡正样本原型采样(PBS)方法与无监督聚类模型用于训练样本采样,得到筛选扩充的正样本数据集及客观提取的负样本数据集,构建训练样本采集优化的(Sample Optimization, SO)数据集。然后,引入对小样本数据处理效果较好的随机森林(Random Forest, RF)与支持向量机(Support Vector Machine, SVM)构建滑坡易发性评价模型,分别与原始数据(Raw Data, RD)和仅数据扩充(Data Augmentation, DA)的数据集开展对比实验,利用AUC等指标分析模型预测性能,并基于频率比法对滑坡易发性分区结果进行优选。最后,以滑坡灾害样本数据较少的莆田市为例,开展滑坡易发性评价研究,验证本文提出的训练样本采样优化方法的有效性和泛化能力。【结果】 采用SO数据集构建的模型相较于基于RD、DA数据集,AUC值分别提升了10.69%与18.23%,说明预测性能皆有明显的提高,意味通过筛选扩充正样本和客观提取负样本数据集可以获得更好的性能,且有效缓解了模型训练过程中的过拟合问题;根据频率比分析结果, SO-RF的极高与高易发区频率比均高于SO-SVM,说明SO-RF比SO-SVM更适合类似莆田市区域的有限小样本滑坡数据的易发性评价。【结论】 本文提出的训练样本优化结合机器学习的评价方法具有较高的适用性和准确率,研究成果可为基于机器学习的滑坡易发性评价的训练样本采样方法提供有效思路。
【目的】 等高线与河流之间的不一致性是地理空间数据库更新、维护中的常见问题,目前相关研究大多仅针对单线河,鲜少涉及双线河。鉴于此,提出了一种发掘形态特征的等高线与双线河之间的不一致性探测及处理方法。【方法】 首先,通过DTW算法建立河流两侧岸线目标节点间的映射关系,并对其进行Morphing变换提取双线河中心线;然后,根据弯曲特征参数提取等高线山谷点,并依据DTW算法提取近似山谷线;接着,以双线河中心线为枢纽,建立山谷点与双线河、山谷线与双线河的综合判断规则来探测不一致区域;最后,运用等高线相似变换、河流移位与等高线协同变换,对不一致区域进行移位修正,并通过仿射变换处理局部等高线落水现象。【结果】 本文选取3处不同地形区域进行实验,经修正后山谷点均位于双线河内部,山谷线与双线河间的平均路径差得到有效减小,其中经等高线相似变换结合协同变换修正后的整体平均路径差分别为2.417 、0.033 、2.783 m,经河流移位结合等高线协同变换修正后的整体平均路径差分别为2.667、0.057、0.042 m,均维持在一致性阈值范围内。【结论】 本文通过充分发掘等高线与双线河的形态特征,实现了二者间的不一致性探测与处理,拓展了等高线与河流间的空间关系一致化研究范围,有助于推动多源地理空间数据的高质量集成与融合。
【目的】 现有的语义变化检测方法对于遥感影像的局部和全局特征利用不足,且忽略了不同时相间的时空依赖性,导致土地覆盖语义分类结果不精确。此外,检测的变化对象存在边缘模糊问题,检测结果和实际变化区域的一致性有待提升。【方法】 针对这些挑战,受具有长序列处理能力的视觉状态空间模型(Vision State Space Model, VSSM)启发,本文提出了一种融合卷积神经网络(Convolutional Neural Networks, CNN)与VSSM的语义变化检测网络CVS-Net。该网络有效结合了CNN的局部特征提取优势与VSSM捕捉长距离依赖关系的能力,并嵌入基于VSSM的双向时空关系建模模块以引导网络深入理解影像间的时空变化逻辑关系。此外,为增强模型对变化对象边缘的识别精度,提出了边缘感知强化分支,通过联合拉普拉斯算法和多任务架构自动集成边界信息,增强模型对于变化地物的形状模式的学习能力。【结果】 在SECOND和FZ-SCD数据集上,将本方法与HRSCD.str4、Bi-SRNet、ChangeMamba、ScanNet及TED五种主流的SCD方法进行对比。实验结果显示,本方法的语义变化检测性能优于其他对比方法,验证了本方法的有效性。在SECOND数据集上实现了23.95%的分离卡帕系数(Sek)和72.89%的平均交并比(mIoU),在FZ-SCD数据集上的SeK达到23.02%, mIoU达到72.60%。消融实验结果中,随着在基础网络中添加各模块, SeK值逐步提升至21.26%、23.04%和23.95%,证明了CVS-Net中各模块的有效性。【结论】 本方法可有效提升了语义变化检测的属性和几何精度,可为城市可持续发展、土地资源管理等应用领域提供技术参考和数据支撑。
【目的】 基于模型驱动的机载LiDAR建筑物点云三维模型重建依赖于建筑物点云与预定义基元间的拟合,受建筑物点云密度不均与噪声影响,基元拟合过程中在结构细节上极易产生误差,导致模型重建结果的精度较低。为提高模型重建的精度,本文提出了联合序列二次规划及高程步长校正的机载LiDAR建筑物点云三维模型重建方法。【方法】 首先,建立一个含有经典屋顶结构的基元库,包含简单屋顶、复杂屋顶以及阶跃型屋顶,并结合各屋顶面片间的邻接关系与脊线属性构建邻接矩阵,根据邻接矩阵在基元库中选取最佳匹配的基元;其次,通过序列二次规划算法计算基元形状参数,获得在全局最佳拟合状态下的参数配置,得到初始的建筑物三维模型,通过旋转、平移建筑物模型来校正其与建筑物点云在三维空间中的相对位置;最后,利用城市地理标记语言(City Geography Markup Language, CityGML)储存结构清晰、拓扑正确的建筑物三维模型。【结果】 选取Building3D数据集中10组经典的建筑物点云用于建筑物三维模型重建实验,将本文方法与现有相同基于模型驱动方法的重建结果进行对比,并使用经典的精度评定指标对结果进行定量分析。所选用实验数据对应的目标函数平均值为0.32 m,相较于对比方法精度提升0.03 m,建筑物基元与建筑物点云的水平平均偏差为0.10 m,竖直平均偏差为0.04 m。【结论】 本文通过序列二次规划算法求得的最佳形状参数可构建拓扑完整,形状规则的建筑物三维模型;以屋顶点云平均点间距为步长的高程梯度校正可以有效提高建筑物三维模型重建精度。
【目的】 精准可靠的逐日卫星降水产品(Satellite Precipitation Product, SPP)是气象和水文研究中不可或缺的基础数据源。然而,现有逐日SPP存在局部降水细节捕捉不足、部分地区误差较大等问题,导致降水空间刻画不清、预测精度不高。【方法】 基于此,本研究提出一种精准捕捉降水空间异质性的加权堆叠遥感日降水产品质量提升方法(Spatial Heterogeneity Weight Stacking, SHW-Stacking)。该方法首先耦合特征重要性与非线性相关性进行自适应特征优选,然后利用高斯混合聚类获得描述日降水空间异质性的同质子区,最后构建加权堆叠机器学习模型融合SPP与站点数据以获得高质量降水产品。【结果】 选取中国区域2016—2020年逐日IMERG降水数据为研究对象,将SHW-Stacking与基于传统分区的类别型梯度提升(TC-Catboost)、5种经典机器学习方法(Catboost、lightGBM、XGBoost、RF、ELM)和原始SPP进行比较。 结果表明,SHW-Stacking能够准确再现实测降水空间分布,其多时间尺度性能均表现最优,在日、季和年尺度上MAE分别至少降低4.6%、3.1%和2.7%, KGE分别至少提高3.4%、1.9%和2.0%,且在降水强度大于1 mm/day时对降水事件的捕捉能力明显优于其他对比方法。此外,聚类分区因素贡献度仅次于IMERG,其作为首要和次要影响因子的天数占比达39.6%和33.9%,凸显空间异质性对降水融合的关键作用。【结论】 SHW-Stacking能够有效捕捉局部降水细节,精确刻画降水空间分布,为精细化降水数据生产提供了一种切实可行的思路和方法。
【目的】 深度卷积神经网络(DCNNs)已经成功应用于高分辨率遥感图像的语义分割,但高分辨率遥感图像普遍存在类内方差大,类间方差小、目标尺度变化显著等问题。卷积运算因其局部性,在处理这些复杂问题时受到了限制。基于Transformer的方法则拥有强大的全局信息建模能力,但在局部信息的提取方面存在缺陷。【方法】 本文提出一种增强多尺度目标感知的双路径高分辨率遥感图像分割算法DMFPNet,模型采用基于DCNN和Transformer的非对称双编码器结构。首先,基于深度卷积构建可变通道空间金字塔模块(SCSP),动态提取融合多通道信息。其次,提出一种多尺度特征增强Transformer模块,通过特征锚点预处理,为模块提供空间偏置信息,同时在自注意力机制中构建可学习余弦相似矩阵,引导模块聚焦图像中不同尺度的目标。最后,构建了一种双边特征引导融合模块(BFGF),实现2条分支之间不同尺度特征的融合与信息交换。【结果】 本文在Vaihingen和Potsdam数据集上进行了对比实验与消融实验,结果表明:本模型在Vaihingen数据集上分别获得了83.29%、90.65%、 91.69%的平均交并比(mIoU)、mF1(mean F1-Score)和OA(Overall Accuracy),在Potsdam数据集上获得了73.29%、83.98%、88.47%的mIoU、mF1和OA;相较于本文所对比的最佳方法,mIoU在Vaihingen和Potsdam数据集分别提升0.76%和1.42%。【结论】 证明了本模型在解决高分辨率遥感图像语义分割中类内类间方差变化大、目标尺度多变等复杂问题方面具有良好的性能和较高的分割准确性。
【目的】 森林作为陆地生态系统的主体,具有调节气候、保持水土等多种功能。在森林面临的众多危害中,火灾对森林资源的危害日益严重。分析影响森林火灾的因素对于预防森林火灾和制定相关策略至关重要。【方法】 本研究选取中国为研究区,识别森林火灾主要驱动因素,选取植被、气候、地形、人类活动等森林火灾相关驱动因子,利用地理探测器进行全局森林火灾的驱动力分析。并基于植被分区方案,定量计算了8个植被区划的森林火灾空间分布驱动力。【结果】 ① 全局尺度上,森林火灾的空间分布受植被覆盖度(fvc)的影响最大,解释力为0.130 2,气候因子对森林火灾的驱动力相对较强;驱动因子交互作用均为增强,森林火灾的发生是各驱动因子综合作用的结果;且森林火灾驱动因子与森林火灾发生概率之间存在非线性关系和影响阈值; ② 局域尺度上,气候和植被作为森林火灾的关键驱动因素,很大程度上解释了各个分区森林火灾的空间分布。如气温(tem)是寒温带针叶林区域(CTNF)、温带针叶、落叶阔叶混交林(TCBMF)、青藏高原高寒植被区域(AVTP)3个区域的最高解释力驱动因子,解释力分别为0.313、0.410、0.052;风速(win)是暖温带落叶阔叶林区域(WTBF)的最高解释力驱动因子,解释力为0.279。【结论】 在不同区域,森林火灾主要驱动因子和因子的交互作用均有差异,定量验证了森林火灾空间分布驱动力的空间异质性。研究结果有助于了解中国不同区域森林火灾的驱动因素,并帮助政策制定者设计火灾管理战略,以减少潜在的火灾危害。
【目的】 休闲环境品质是影响居民休闲体验和参与度的关键因素,与城市区域活力和经济发展紧密相关。探究环境品质如何影响休闲空间活力对促进城市发展至关重要。【方法】 本研究遵循人本导向,提出一种基于图文融合感知的环境品质与空间活力关系探究框架。利用手机信令数据测度休闲空间活力,在应用网络评论文本与街景影像数据综合感知城市休闲环境品质的基础上,通过参数最优地理探测器模型(OPGD),从全局和局部空间尺度深入分析了南京市单一休闲环境品质因子以及交互作用对休闲空间活力的影响机制。【结果】 ① 南京市休闲空间活力分布呈现“单核心-多中心”的空间分布模式,主城区活力以新街口商圈为核心集聚,江北区形成两端与中心呼应的“三点”格局,仙林地区的高活力区分布在大学城周边,东山高活力区位于双龙大道地带; ② 从全局看,南京市的休闲空间活力由经济水平间接主导。从局部空间看, 14个休闲环境品质因子对休闲空间活力的影响表现出明显的区域异质性,而在高水平休闲空间活力的市、区级核心区,环境品质因子对休闲空间活力的影响均显著; ③ 南京市休闲空间活力的形成机制与区域地理位置、人口密度与构成、经济收入水平等密切相关。【结论】 南京市的分析结果说明,图文融合感知下的休闲环境品质探究提升了休闲空间活力影响因子及其机制研究的系统性与全面性,为优化城市休闲环境品质和提升休闲空间活力提供了科学依据。