地理空间知识的本质在于揭示地理事物和现象的时空分布、时空变化过程及其相互作用规律。地理空间知识库管理系统(GeoKGMS)以“图-文-数”一体化的地理空间知识库引擎为核心,致力于支撑地理空间知识资源的高效汇聚、地理空间知识图谱的自动构建和一站式地理空间知识工程建设,旨在形成新一代地理信息系统(GIS)的重要基础平台。本文重点阐述了基于云原生的地理空间知识库管理关键技术,包括云原生的地理空间知识库微服务统一调度技术、人机协同的地理空间知识图谱构建技术、地理空间知识图谱时空混合编码技术、以及多模态地理空间知识存储技术。在此基础上,设计了GeoKGMS的服务框架,实现了地理空间知识库管理、多模态地理空间知识抽取、地理空间知识图谱人机协同构建、地理空间知识推理、地理空间知识图谱质量评估和地理空间知识可视化六大管理服务功能。以喀斯特地貌知识图谱为例,充分发挥机器挖掘和专家知识的优势,实现了可持续的地理空间知识图谱工程化协同共建。
我国已将发展智能网联汽车、发展自动驾驶作为国家的重要战略方向,高精地图作为自动驾驶的核心基础设施具有高精度与高商业价值的特点,其安全问题不可忽视。本文基于不可见字符,在不影响高精地图数据精度与自动驾驶应用场景的前提下,提出了一种适用于OpenDrive格式标准下高精地图数据的数字水印算法。首先,构建水印信息与不可见字符的映射机制,根据原始水印信息建立包含水印比特值、比特位置信息与海明码的复合型水印字符序列,在保证水印比特与水印索引同步性的同时为算法提供一定的自纠错能力;然后,将映射后的不可见字符按照伪随机置乱后的标识符集合及其属性值的顺序嵌入到高精地图属性值中,使水印信息无规律地嵌入至数据中且分布较为均匀。检测水印时依据伪随机置乱的初始条件按照嵌入顺序提取出水印比特与其对应的索引位置,最后根据多数原则获取最终水印信息并依据海明码对错误比特进行纠正。研究表明,该算法能够抵抗平移、旋转、缩放、裁剪的攻击,在裁剪数据98元素,具有很好的鲁棒性。可为OpenDrive格式高精地图的版权保护提供参考。
设施选址对提高居民生活质量至关重要,利用地理可达相似性聚类对空间元素进行分类是求解此类问题的重要方法。然而,现有的应用于地理可达性分析的聚类算法存在地理可达性测度不准确、不涉及簇中心选取或簇中心不可达等缺陷,不能有效求解真实场景下的设施选址问题。基于此,本文提出一种基于可达距离的模糊C均值聚类算法(Fuzzy C-Means based on Reachable Distance, FCM-RD)。FCM-RD算法改造了经典FCM算法的目标函数、隶属度函数和簇中心函数,使其适用基于可达距离的聚类分析。其次,以沿路网的最短路径距离作为可达距离衡量元素间的地理可达相似性,将聚类元素的二维地理坐标映射为路网坐标,并以此设计簇中心迭代机制,实现在聚类过程中以可达距离迭代不受约束的可达簇中心。同时,对所提簇中心迭代机制的有效性进行理论分析和实验验证,结果表明,FCM-RD算法在每次迭代中所选的各簇簇中心唯一且为当前簇类目标函数最小值点。最后,基于真实地理场景的仿真实验表明,相比基准算法,FCM-RD不仅能获得位置不受限的可达簇中心,而且能获得更好的聚类效果,为实际场景下的地理空间聚类方案提供了有效且精准的解决方案。
可视性是指在一定环境条件下,观察者从特定位置所能看到的空间范围。针对现有基于点云数据的可视性分析方法主要聚焦于室外视角,同时未充分考虑点云空洞的问题,提出一种减弱点云空洞影响的室内视角可视性分析方法。首先,将预处理得到的窗户中心点看作视点,以视点为中心,理论视距为半径,构建半球形视域空间。然后将视域空间内的点投影至深度图像形成视域图像,其像素深度值即为可视视距。通过分析视域空间的可视范围,模拟室内通过窗户观测到的外部场景。在这个过程中,点云空洞会造成视距错误,利用空间属性对视域空间分类,并根据不同类别视域空间的地物连续性和遮挡关系提出视距校正方法,以减弱点云空洞对可视空间体积的影响。最后,利用视点处的可视空间体积指数进行可视性分析,并与现有基于体素、基于表面的可视性分析方法以及人工评价进行比较。结果表明,本方法与人工评价的结果具有更好的一致性,能够更有效地分析建筑内部的可视性,为城市规划、景观设计等相关领域提供了一种全面可靠的可视性分析策略。
在生态文明建设背景下,全面推行河长制是我国解决复杂水问题、维护河湖生态健康的有力措施,然而当前仍存在面向河长制的河道管理地图理论研究不足、设计方法缺失等问题。首先本研究以河长制内涵解析为突破点,以地图视角剖析用户关注信息和用图需求,从横向协同及纵向协同结合的维度提出“多部门协同联动、多级河长任务分解”的河道管理地图设计理念,从而构建河道管理地图内容框架。其次,基于地理场景理论对河道管理场景中的时间、地点、人物、事物、事件与现象等要素进行归纳分析,以指导各图组的制图表达内容选取。然后,选择交互式仪表盘的表现形式及电子大屏这一传播媒介,基于用户体验五要素模型、认知、视觉、地图交互科学等理论,进行大屏幕地图的信息架构设计、界面版式设计、色彩配置、信息设计及交互设计。最后,以上海市宝山区为例,设计并实现河道管理仪表盘地图系统并进行系统性可用性评估,结果显示该仪表盘地图能够支持多尺度的河道管理信息显示,帮助用户清晰了解河长制相关信息。本研究旨在促进面向河长制的河道管理地图标准化与规范化、多部门协同管理、共建共享等方面发挥积极作用。
建筑物群组具有明显的空间分布模式,其相关研究在地图制图、地图匹配及查询等领域均有诸多应用。已有的建筑物群组模式识别研究主要采用传统几何方法和机器学习方法,取得了较好的实验结果。但同时,传统几何方法存在规则定义复杂、识别出的模式较为单一等缺点;而机器学习则存在对样本数据要求高、分类特征选择困难等问题。方向熵是信息熵的一种,常用于评估空间中不同方向性随机变量的不确定性,可应用于描述空间现象方向的分布特征和规律。本研究引入方向熵进行典型建筑物群组的多模式识别。首先,使用人工视觉方法对兰州市的建筑物数据进行聚类,并构建最小生成树几何模型。其次,按照7:3的比例将建筑物群组划分为样本集1和样本集2。通过样本集1计算直线型、格网型和不规则型建筑物群组的分类阈值,并在样本集2上验证,结果显示,这3种建筑物群组的分类精度均达到了97%以上。最后,将所提方法应用于上海市的建筑物数据中,并获得了符合人类认知的结果。这也从另外一个角度说明方向熵可以应用于群组目标分布模式识别。
完整的PM2.5时空数据集是实现大气污染防治的关键。然而, 实时获取的PM2.5数据集容易受机器故障、人为失误、大气等因素影响普遍存在缺失。针对现有缺失值重构方法未能充分顾及PM2.5日周期性及其与影响因子之间的复杂关系等问题,本文提出了一种顾及日周期性的PM2.5站点缺失值重构方法(Daily Periodicity-Based Spatial-Temporal Interpolation, DP-STF)。DP-STF首先以日观测数据为处理单元基于时空相关性对缺失位置筛选最优时空邻域,然后利用P-BSHADE(Point Estimation Model of Biased Sentinel Hospital-based Area Disease Estimation)顾及时空异质性以迭代方式对缺失数据进行时空初始估计,最后利用Stacking集成机器学习拟合PM2.5与其影响因子的复杂时空非线性关系,并用于缺失PM2.5数据估计。以京津冀2020年小时尺度PM2.5站点数据为研究对象,利用DP-STF方法对缺失数据重构并与7种经典方法对比。实验结果表明:相比传统方法,DP-STF精度最优,其平均RMSE、MAE至少降低了39.83%、40.12%, R2至少提高了5.56%。此外,DP-STF还能够有效捕捉PM2.5极值,极大提升了在时空非平稳区的预测精度。
PM2.5浓度预测对于空气污染的防控和治理具有重要意义。传统图卷积神经网络(Graph Convolutional Network, GCN)等时空预测模型主要通过监测站点间的欧氏距离来度量PM2.5分布的空间相关性,未顾及地形和风向等因素对大气污染物传输过程的各向异性影响,导致地形复杂区域内的预测结果精度偏低。为此,本文提出了一种顾及地理环境各向异性的PM2.5浓度时空图卷积网络预测模型。首先,考虑地理环境的各向异性特征,利用地形和风向等对站点间PM2.5传播的各向异性影响构建GCN的边,将站点PM2.5浓度、土地利用和其他气象因子建模为GCN的节点特征。其次,通过GCN提取站点PM2.5浓度的空间特征。最后,通过门控循环单元(Gate Recurrent Unit, GRU)建模站点PM2.5浓度的时间特征并进行预测。本文以山地型省份贵州省2017年逐小时PM2.5浓度记录进行实验,并采用一系列时空预测基线模型(GTWR、STSVR和GCN+GRU)与本文模型进行对比。实验结果表明: ① 本文模型的PM2.5浓度预测结果的RMSE、MAE别为10.047、6.848,相比基线模型平均下降了11.29%和12.16%;R2为0.883,比基线平均提升了3.72%; ② 通过不同地形对站点PM2.5浓度相关性影响分析,论证了山脉沟谷等地形会显著影响站点间的PM2.5浓度的相关性,进而影响站点PM2.5浓度预测结果; ③ 充分考虑地形和风向对PM2.5传播产生的各向异性影响,能够显著提升存在山脉和沟谷地形区域内PM2.5预测精度。
在新经济地理学将空间要素纳入主流经济学的研究范畴后,空间数据统计分析方法也被引入经济学文献中。以地理邻近性为基本特征的集聚经济成为重要的研究对象并逐渐成为经济地理学与GIS交叉研究的领域。Ripley’s K函数属于空间点模式分析中基于距离的方法,也被称为多距离空间聚类分析,DO指数在其基础上发展而来,相比于K函数,DO指数更符合经济学中企业不完全随机分布的计算标准。本文根据2008年和2018年经济普查数据,以《中国经济普查年鉴》为参考标准,清洗数据后利用DO指数测度了京津冀协同发展战略提出前后制造业协同集聚的特征和动态演化过程。结果表明:① 2008年和2018年分别有85.47%和82.53%的制造业产业对发生协同集聚,平均强度由0.030变为0.029,10年间协同集聚的基本格局保持稳定;但协同集聚强度高的TOP 20行业对明显向河北省扩散;② 协同集聚发生的尺度范围扩大,2008年全部行业对协同集聚的显著尺度范围是25~68 km,2018年则是55 km以内和75~103 km。省市边界临界值约为75 km,京津冀协同发展战略提出后制造业跨省级行政区的合作更多,而TOP 20行业对的跨行政边界特征更加明显;③ 制造业协同集聚呈现“两极分化”特点,行业间协同集聚强度值高的更高,但中等强度协同集聚的行业对强度值变低。2018年第一个局部高值出现的尺度为54.5 km,小于2008年的68 km,但整体上显著尺度范围又大于2008年,协同集聚的行业对空间分布尺度范围小的更小,大的更大,在一定程度上验证了协同集聚存在循环累积因果效应。
乡村振兴背景下,探究乡村快递点布局影响因素,对乡村基础设施建设具有重要意义。本文根据泰森多边形理论的发展现状和社会经济应用研究的需要,提出了变形泰森多边形理论。基于变形泰森多边形理论,以江苏省苏州市乡村(其含义见正文)为研究区,快递点为具体案例,采用普通最小二乘法(OLS)、空间滞后模型(SLM)、空间误差模型(SEM)、地理加权回归(GWR)等方法,揭示了乡村快递点布局影响因素。本文得出如下主要结论。① 变形泰森多边形是泰森多边形在社会经济应用中的改进和拓展,变形泰森多边形由变形区和非变形区2个部分组成,变形区是泰森多边形的局部变形,非变形区是原始的泰森多边形。变形泰森多边形可以有效地解决泰森多边形空间划分与实际情况不匹配的问题,有利于提高社会经济问题研究的可行性与科学性。② 将快递点服务范围作为快递点布局的表征指标,以该指标为因变量,人口规模、经济规模、路网密度等为自变量,探究研究区快递点布局影响因素。P (Probability)<0.05时,研究区OLS、SLM模拟结果显示:人口规模、平均坡度、水域面积为正影响因素,其中人口规模为正主导影响因素;经济规模为负影响因素。研究区GWR模拟结果显示:人口规模和水域面积为正空间影响,经济规模为负空间影响,路网密度、平均坡度正负空间影响均存在。变形泰森多边形理论有助于推动泰森多边形理论的发展,该理论能为未来社会经济应用研究中的空间划分提供新依据。同时,本文结果对认识乡村快递点布局影响因素具有一定价值,对乡村振兴战略实施具有参考意义。
城市三维模型是数字孪生、智慧城市建设的重要载体,实现建筑轮廓线的有效提取是城市高精度建模和三维测图的关键步骤。针对现有建筑物轮廓线提取效率与准确度较低的问题,本文提出了一种基于彩色机载点云的建筑轮廓线深度学习提取方法。首先,通过垂直投影,由经过渐进形态学滤波后的建筑物彩色机载点云,分别生成描述建筑物空间信息的高程栅格图像与反映其纹理差异的可见光栅格图像;然后,利用Line-CNN深度学习网络,经过特征提取、结点预测、路线生成等过程,从栅格图像中初步提取出线段特征;最后,为有效提取轮廓线特征,提出了一套综合修剪与补全操作的优化策略,并结合高程和可见光栅格图像中的优化线段信息,获得规则且完整的建筑物轮廓线特征。经过对南京信息工程大学的机载点云数据以及ISPRS H3D 2019数据集的实验证明,该方法对机载点云建筑物轮廓线提取有效,避免了因三维点云深度学习中标定样本不足而无法直接提取的问题;能准确、完整地提取出场景中建筑物的轮廓线特征,平均准确度与完整度均高达90%,且算法较为高效,有利于大范围城市三维建模与地籍测量等相关应用。
单木分割的精准度对林木资源的调查有重要意义。但是,传统的单木分割算法在处理大规模点云数据时存在临近树木易混淆、算法运算效率低等问题,针对上述问题,本文提出改进谱聚类和粒子群改进K-means聚类的单木分割算法。首先,通过Mean Shift算法对点云数据进行体素化,在该过程中采用自适应带宽和高斯核函数来计算体素间的相似度,以构建出反映体素特性的高斯相似图。然后应用Nyström方法处理高斯相似图,采用K最近邻搜索采样,以选取代表性样本,降低谱聚类在处理大规模数据时的计算负担,同时保持数据的核心特性。通过Nyström近似,得到相似图的近似特征向量,实现从高维空间到低维特征空间的有效映射。最后引入粒子群算法对K-means聚类进行优化。该优化先随机初始化一群粒子,每个粒子代表一组潜在的聚类中心,在每一次迭代中,粒子根据个体历史最佳位置和群体历史最佳位置更新其速度和位置,并调整聚类中心以最小化内部聚类距离。这种策略能够平衡全局搜索与局部搜索,避免陷入局部最优。本文选取NEWFOR公开的点云数据进行实验。实验结果表明,本文算法获得的分割结果相较对比算法准确率提高5.3%,处理效率提升23倍。
建筑垃圾是城市更新过程中不可避免的产物,造成严重的环境污染和生态压力,精准量化城市建筑垃圾年产量与资源转化率对衡量城市更新代价至关重要。传统人工估算建筑垃圾产量的方法严重依赖统计数据和历史经验,在实际应用中缺乏灵活性,耗时耗力,准确性和时效性亟需提升;现有深度学习模型针对小目标、多尺度特征提取与融合能力相对较差,难以处理形状不规则、碎片化检测区域。因此,本文提出一种多尺度特征融合与注意力增强网络MS-FF-AENet,动态跟踪检测建筑物和建筑垃圾消纳场变化,从而精准量化城市建筑垃圾年产量。使用深度编码网络,获取细粒度高阶语义信息,提高分类识别的精度。解决感受野不足导致提取大型目标时产生不连续的孔洞问题,利用双注意力增强机制更好地保留空间细节,使特征提取更丰富。在解码器中融合骨干网络的浅层和中层特征,更好地捕捉上下文信息,增强复杂场景下高效、准确的特征提取能力。利用MS-FF-AENet提取研究区不同时期的遥感影像数据,通过分析建筑物面积变化情况,计算新增建筑物产生工程垃圾以及拆除建筑物产生拆除垃圾,得到城市建筑垃圾年产量;使用MS-FF-AENet提取不同时期的建筑垃圾消纳场,根据填埋垃圾变化量得出城市建筑垃圾填埋量,间接估算城市建筑垃圾资源转化率。本文基于北京市昌平区2019—2020年高分遥感影像,实验结果表明: ① 在包括UNet、SegNet、PSPNet、DeepLabV3+、DSAT-Net、ConvLSR-Net和SDSC-UNet在内的一系列基线中, MS-FF-AENet在提取建筑物和建筑垃圾的精度和效率等方面更具优势; ② 2019—2020年研究区由于城市更新产生的建筑垃圾年产量约为4 101 156.500 t,其中填埋部分约为2 251 855.872 t,资源转化部分约为1 849 300.628 t,建筑垃圾资源转化率为45.09%,进一步印证政府统计报告结果。本文为城市更新代价精准量算提供了一个便捷且有效的分析思路。
卫星微波遥感的SMAP土壤水分产品可以用于大陆和全球尺度,但因为空间分辨率低,难以满足中小尺度的应用。经验性降尺度方法是空间降尺度常用方法,但因为需要依赖于光学遥感获取降尺度因子,所以易受云雾影响导致无法获得时间连续的高空间分辨率土壤水分。为了解决这个问题,我们结合机器学习和深度学习方法进行了降尺度研究。首先,获取地表温度、植被指数、反照率、土地覆盖、地形数据、土壤质地等降尺度因子。然后,利用机器学习模型(Random Forest、LightGBM、XGBoost)建立SMAP土壤水分产品数据与降尺度因子的经验降尺度模型。选择其中精度较好的XGBoost模型将SMAP-L4土壤水分产品的空间分辨率由9 km降尺度至1 km。最后,基于9 km和1 km土壤水分数据对训练DSCGAN超分辨率模型,并利用该模型获取研究区域时空连续的土壤水分数据。结果表明,降尺度得到的土壤水分与SMAP 原数据之间的相关性系数R为0.96,均方根误差RMSE为0.034 m3/m3,偏置bias为0.011 m3/m3,无偏均方根误差ubRMSE为0.034 m3/m3。与实测站点之间的相关性系数R为0.696,均方根误差RMSE为0.192 m3/m3,偏置bias为-0.171 m3/m3,无偏均方根误差ubRMSE为0.089 m3/m3。本文方法为生产时空连续的更高空间分辨率的地表土壤水分提供了一个框架,可以满足区域水分调查和农业干旱监测等小尺度应用需求。