流域过程模拟是地理学研究和流域科学管理的有效工具。在应用需求的推动下,长时段、高空间分辨率的多过程综合模拟逐渐兴起,流域过程模拟所需的计算量越来越大,亟需借助并行计算技术来提高效率。流域过程模拟并行计算的现有研究,大多为针对特定模型的个例研究,缺乏对指导各类流域过程模型并行计算的共性思路和原则进行讨论和梳理。首先,对可指导流域过程模拟并行计算的地理规律进行了分析,从空间、子过程和时间3 个角度,探讨了空间等级层次结构、空间相互作用、子过程间依赖关系、时空动态变化等地理规律,对流域过程模拟并行计算的指导作用;然后,根据地理规律在并行计算中所发挥作用和适用范围的不同对其分类;最后,结合2 个实例,对地理规律的流域过程模拟并行计算进行了分析和验证,旨在对流域过程模拟并行计算理论和方法的发展与应用提供借鉴。
影像金字塔是实现影像数据多分辨率组织的重要方式,是提高影像可视化性能的有效手段。传统串行金字塔构建算法,对大规模影像数据的构建性能已无法满足遥感影像快速浏览的预处理需求。故此,其成为一个亟待解决的问题,而利用多核、多节点的高性能集群计算环境和并行机制是一个重要的技术途径。本文在共享外存的高性能集群环境下,提出使用消息传递接口(MPI)的金字塔并行构建算法,对构建遥感影像金字塔过程中的重采样与I/O 过程进行并行处理,大大缩短了遥感影像金字塔构建时间。实验结果表明:(1)该算法比传统串行构建方法的加速效果明显,对于单波段遥感影像,其加速效果可达到GDAL的5 倍以上,而对于多波段遥感影像,加速效果可达到GDAL的2 倍以上;(2)遥感影像数据量越大,并行构建算法加速效果越显著,对于大规模的遥感影像,本文提出的金字塔并行构建算法的速度可达到GDAL的10 倍左右。
异常轨迹检测是移动对象数据挖掘的一个重要研究领域。TRAOD(TRAjectory Outlier Dectection Algorithm)算法是一种经典的异常轨迹检测算法,但它对于海量轨迹数据的异常检测效率低。为提高海量轨迹数据集的异常检测效率,本文提出了一种利用MapReduce 的异常轨迹检测并行算法(Parallel algorithm for TRAjectory Outlier Detection, PTRAOD),并在此基础上提出了网格索引的异常轨迹检测并行算法(Grid-based Parallel algorithmfor TRAjectory Outlier Dectection, GPTRAOD)。GPTRAOD算法在PTRAOD算法的基础上,利用网格索引实现区域查询,进一步提高算法效率。将PTRAOD算法和GPTRAOD算法在Hadoop 平台上加以实现,结果表明:本文提出的2 个并行检测算法,能实现异常轨迹的检测;GPTRAOD算法的效率优于PTRAOD算法;GPTRAOD算法具有较高的可扩展性和较好的加速比。
随着高性能计算的发展,并行技术已经广泛应用于LiDAR数据的分析处理。本文针对现有LiDAR数据生成DEM并行算法所存在的负载不均衡问题,设计并实现了动态负载均衡的LiDAR数据生成DEM并行算法。该算法采用主从式并行策略,管理进程负责LiDAR点云的高效自适应条带划分,计算进程负责LiDAR点云生成DEM的计算。本文设计了任务量的动态调度策略:首先,由所有进程并行创建任务量由大到小排列的待处理任务队列;然后,管理进程根据计算进程的反馈对待处理任务进行动态分配,以达到负载均衡。在24 核集群环境下,用30 GB(约12 亿点)LiDAR数据对本文算法进行测试,生成分辨率为1 m的格网DEM,算法加速比峰值达到15.16;同时,与静态调度策略进行对比实验,结果显示本文的动态负载均衡策略可更好地保证进程间的负载均衡,有效地提高了LiDAR生成DEM并行算法的整体效率。
目前,地理空间数据面临着由于数据量膨胀和计算量高速增长而引起算法效率低的问题,采用"分而治之"的数据分组策略提高运算效率已成为研究的热点。面向分布不均匀的线数据,本文提出了基于密度的线数据分组算法(简称LGAD)。首先,算法通过查找高密度区提取样本线段,保证了分组算法的起点落到高密区;其次,考虑线空间拓扑关系的复杂性,引用水平、垂直和夹角距离度量线段间距离,创建样本线段与其他线段的距离矩阵;最后,以距离矩阵和最优选择方法实现数据负载均衡分组。实验结果显示,对数据分组和分组后数据进行线段聚类的2个过程中,该算法体现了较好的时间优势,与串行计算相比,在分组数为2-12 时,平均比率达4.3,提高了应用的响应速度,具有较好的实际意义。
目前,空间关系查询中常用的Plane Sweep 算法是一种串行方法,而关于多核CPU的并行查询算法,在面对海量数据查询时,由于CPU核心数及线程数量的限制,其难以满足查询效率需求。针对该问题,本文提出了一种全新的异构多核架构多边形图层间空间关系查询的并行算法。首先,利用STR 树索引过滤不相交的多边形;然后,对过滤后多边形的线段构建四叉树索引,利用CPU+GPU架构并行计算线段的相交以判断多边形环间的拓扑关系;再根据环间的拓扑关系计算多边形间的维度扩展九交模型(DE-9IM)参数值,据此确定多边形间的空间关系;最后,通过实验验证了该算法的准确性和高效性。实验表明,本算法能有效缩短大数据量的空间查询时间。在实验中逐渐增加目标数据集和源数据集多边形的数量,当两数据集都为50 000 个多边形时,以包含关系为例,相比于ArcGIS,本文提出的算法可达到2 倍的加速比。
流域编码是以子流域划分进行流域相关研究的重要内容。Pfafstetter 流域编码以编码唯一、顾及流域拓扑关系及编码效率高等优点而被广泛采用。本文在流域相关研究的分析范围不断增大、数据精度越来越高的需求背景下,以Pfafstetter 编码为基础,对流域编码并行化方法进行研究。首先,分析了Pfafstetter 编码不全面和码位不一致的问题,改进了Pfafstetter 编码规则;然后,从数据并行的角度,讨论了并行计算环境下的数据划分及并行化策略,进而设计了流域编码并行算法;最后,利用长江中上游流域SRTM数据,在集群系统上对流域编码并行算法的正确性和并行性能进行了测试。实验结果表明,本文设计实现的流域编码并行算法可获取与实际较为一致的计算结果,且提高了编码计算效率,可为基于子流域划分的流域分析并行化提供参考。
栅格地理计算并行编程库的研发有助于实现对栅格地理计算算法的并行化。在现有的研究中,Qin 等(2014)设计并初步研发的栅格地理计算并行算子(PaRGO),在设计思路上能较好地隐藏与并行编程软硬件环境相关的复杂细节,实现栅格地理计算通用步骤的并行化,且较其他类似思路的编程库而言,PaRGO能兼容多种常用的并行计算平台,具有明显优势。但PaRGO目前在设计上仅直接支持本地、邻域及全局计算特点的栅格地理计算算法并行化,对于更为复杂的区域计算特点算法并行化的支持能力尚未探究。对此,本文选取栅格数字地形分析中具有区域计算特点、递归设计的多流向算法为算例,利用PaRGO进行并行化设计、实现及测试,以计算时间、相对加速比和相对并行效率为定量指标。通过可运行性和并行性能进行评价,结果表明:PaRGO虽然不能直接支持对递归的多流向算法进行并行化,但在根据多流向计算的原理将该递归算法转变为非递归的设计之后,可将算法由原区域计算改造为邻域迭代计算,就能利用PaRGO 实现并行化,并得到较好的并行效果。在集群环境下,MPI版本并行程序的并行效果优于MPI/OpenMP混合版本。
从并行地理算法的正确性评测、性能评测、评测流程和评测工具实现等角度,研究了高性能集群环境下的评测技术。在正确性评测假设基础上,将评测用例在不同进程数环境下的计算结果与该算法在单进程环境下的运算结果逻辑求差得出相对误差,提出了问题规模计算方法。根据评测用例的问题规模确定评测用例的权重,提出了性能指标和评测流程,并通过评测工具自动获得同一个并行地理计算算法。在多个不同评测用例下的评测指标来衡量算法的计算误差与性能,形成评测报告。经实验验证,本文方法能较好地满足并行地理计算算法评测的需求,为并行空间分析算法性能优化提供技术保障。
在地理栅格并行计算处理中,数据I/O 已成为制约计算性能的主要瓶颈之一。本文针对该问题,首先分析广泛应用于GIS 栅格数据存储的GeoTIFF 格式,重点研究数据的2 种存储模式(即条带存储与块状存储),并根据这2 种存储方式,分别构建了栅格数据从逻辑结构向物理存储结构的映射模型。然后,针对地理空间并行计算的需要,提出了栅格数据的并行读写框架,并利用MPI 并行I/O 技术的文件视图方法,实现了GeoTIFF 数据并行I/O库(pGTIOL)。结果表明,对比开源栅格空间数据转换库(GDAL)的主从I/O 模式,本文提出的pGTIOL 准确读写数据,具有更高的性能。该库隐藏了底层并行I/O 的细节,提供简单易用的并行读写GeoTIFF 栅格数据的接口,支持多数据类型和多种空间分割,实现了对条带存储与块状存储数据的异步并行读写,从而满足动态负载均衡的需求。
针对目前公共交通模型很少关注乘客行为和人车相互作用的问题,提出了虚拟公共交通环境的概念及其构成要素的矢量表达,进而采用Multi-agent System 方法构建了车辆Agent 和乘客Agent 行为模型;并提出了公共交通运行中的车辆、乘客之间相互作用,以及时空变化的模拟算法,实现了虚拟公共交通环境原型系统。最后,设计了7 条道路、8 条公交线路、30 个公交站点和1 万次出行的小型公交环境作为实例验证,结果产生了车辆1428 次,上下车刷卡30 436 人次。通过分析总出行时间分布和对比不同发车间隔下乘客平均等待时间,发现了总出行时间分布与输入的出行需求数据相一致,且缩短发车间隔情况下各站点乘客的平均等待时间明显随之缩短。同时,通过原型系统分析了公交车辆的运行情况和乘客公交出行行为。结果表明,本文所提出的模型和算法能有效地模拟公共交通环境,便于交通管理者和科研工作者观察、处理和分析公共交通环境中所产生的数据。
随着服务业的发展和文化产业的不断推进,城市文化娱乐休闲服务业成为城市经济和社会发展的重要标志和推动力。本文以地理空间实体数据和商业统计数据为基础,以GIS 的空间数据可视化和统计分析方法,研究典型城市娱乐休闲服务业KTV在中国大陆地区的行业发展、空间分布及空间扩散特征。研究表明,KTV在全国发展迅速、分布广泛,在宏、中、微观的全国、省域和市域尺度下,其空间分布分别表现出空间区域分异、等级差异、面状均衡和中心集聚等特征,并与区域经济、人口、文化等因素有一定的相关性。各种类型KTV在空间扩散上具有由东向西,由中心向周边扩散的特点,其中连锁类KTV扩散具有社会经济现象地理扩散规律,主要表现为空间等级扩散和接触扩散特征。
银川平原盐渍土时空格局及其与土地利用强度变化关联关系的空间区位特征,可从土地利用强度的角度阐释土壤盐渍化的动因,为盐渍化因地制宜的治理提供参考依据。本文重点研究了盐渍土空间分布定量遥感生成方法,通过土地利用遥感制图、半方差函数的地统计学方法和灰色关联度分析法,对2004-2010 年银川平原的土地利用强度变化、土壤盐渍化程度变化及各类盐渍土与土地利用强度的关联度,进行了空间区位分布特征的可视化表达。研究结果表明:银川平原的发展仍具集聚效应,土地利用强度变化与城镇体系格局、交通干线、沟渠分布、土壤盐分含量密切相关;2004-2010 年间,银川平原土壤盐渍化存在整体减轻、局部加重的空间分布特征,与土地利用强度变化间的响应关系,存在较明显的空间差异;银川平原土壤盐渍化程度变化与土地利用强度变化间的关联度为0.7781,与水体、耕地这2 种土地类型间的关联程度最高。银川平原土壤盐渍化的干扰活动中,水体与耕地类型的利用行为是较重要的影响因子。
旅游资源与旅游区位的地域差异是客观存在的,对区域旅游发展空间错位及其原因的分析可为促进区域旅游均衡发展提供科学依据。本文以安徽省16个地级市为研究单元,运用重力模型和二维组合矩阵,选取旅游收入、资源丰度和旅游区位作为评价指标,定量分析旅游发展空间错位关系,并利用ArcGIS软件将结果进行可视化表达。研究发现:安徽省旅游收入、资源丰度和旅游区位的重心分别处于(117.63°E,31.18°N)、(117.51°E,31.12°N)和(117.20°E,32.00°N),经度方向最大错位0.43°,最小0.12°,纬度方向最大错位0.88°,最小0.06°;与区域几何中心相比,旅游收入重心和资源丰度重心均向南偏移;从旅游收入-资源丰度、旅游收入-旅游区位的组合矩阵来看,呈错位和同步发展的城市均为8个。整体而言,安徽省旅游空间错位主要是因旅游区位和旅游资源的条件差异,四大旅游板块要结合自身的特点,发挥优势,挖掘潜力,通过采取不同的空间矫正策略达到区域旅游协同发展的目的。
通过对登革热疫情分布及时空变化的分析,发现该病的分布和流行规律,将有助于登革热防控工作的开展。本文以2004-2013年间传染病网络直报系统的全国地市级登革热逐月发病率资料为基础,就发病率、涉及地市以及与输入性病例之间的关系,进行空间统计学分析。结果表明:中国登革热发病率的对数值与国外输入性病例数呈显著相关(r=0.669,p<0.05);登革热输入性病例地市(有输入性病例的地市)数量与登革热本地病例地市(有登革热本地病例的地市)数量呈显著线性相关(r=0.939,p<0.05);疫情整体呈稳步递增的趋势,且发病率重心不稳定,从东南沿海(广东、福建)逐步向内陆和西南地区(云南边界)迁移,显示登革热可能流行范围正在扩大;中国登革热疫情呈现波动性非随机空间分布,其高聚集区主要分布在广东的珠江三角洲、韩江三角洲,以及西南边境的云南德宏傣族景颇族自治州和西双版纳傣族自治州。中国登革热疫情是由输入性病例引起的本地流行,因此,加强入境人员(特别是来自东南亚疫区)的健康教育,尤其在输入性病例输入高风险时间段(7-10月),对控制登革热疫情有重要意义。
茶园土壤有机质分布有明显的空间性,如何凭借有限的采样点数据预测研究区的有机质分布,对了解茶叶种植区土壤状况、指导茶园经营管理、提高茶叶品质和产量有重要意义。本文对江浙4种名茶种植区,利用描述性统计,以及地统计学中的半方差函数模型、空间插值等方法对比分析了茶园土壤有机质的空间异质性。研究结果表明:(1)4个研究区的土壤有机质平均水平均较高,适合茶叶生长,且浙江省2个茶叶种植区的有机质平均水平高于江苏省2个茶叶种植区的有机质水平;(2)半方差函数模型拟合表明,溪龙乡种植区有机质含量表现出中等空间相关性,而其他3个种植区表现出强烈的空间相关性;(3)各种植区土壤有机质的空间分布以结构性因子(土壤理化性质、地形地貌)为基础,受人类活动、经营模式、茶园管理等随机性因子影响,整体趋势上表现出局部变异的特征。