对轨迹数据进行分析和处理能够揭示移动对象的运动规律并挖掘出与其相关的隐含信息,移动对象的不规律或异常运动产生了异常轨迹数据,异常数据的出现往往意味着有特殊情况发生,隐含着更有意义的信息,快速、准确地检测异常轨迹能够服务于交通分析及事故检测等具体应用领域。针对传统轨迹异常检测方法没有充分考虑轨迹局部异常的问题,该文提出一种基于停留区域识别的子轨迹异常检测方法:① 设计了一种基于密度的停留点检测算法检测轨迹集的停留点,通过寻找核心点以建立初始簇,使用核心点邻域内的点扩展当前簇,并根据簇内的时间间隔是否满足时间条件,从而检测出停留点; ② 根据停留点集合识别停留区域,将任意2个停留区域作为一对起点和终点区域后对轨迹进行分段;③ 根据分段后子轨迹的起点区域和终点区域对子轨迹集进行分组;④ 针对每个分组内的子轨迹,设计子轨迹异常检测算法检测异常空间子轨迹和异常时空子轨迹。在真实轨迹数据集上与传统异常检测方法进行对比,实验结果表明本文所提方法能有效地检测出异常子轨迹,并且运行时间明显低于TRAOD方法,检测准确率比TRAOD方法最高提升了23.9%;F1分数值相较于ATDC和iBAT方法有明显提升,最高提升率分别为7.8%和16.1%。本研究描述的轨迹异常检测方法可以为交通运输和管理部门提供有效的决策信息,为车辆轨迹数据挖掘提供新的解决方案。
准确、可靠的短时客流预测可为城市轨道交通提供运营决策支持。本研究以基于Transformer机制的LSTM网络、深度注意力模块和CNN网络为基础,提出了城市轨道交通网络级多步短时客流预测模型(STIPM)。该预测模型由3个分支组成,分支一以时间序列进站客流为输入,提出了基于Transformer机制的LSTM网络提取该数据中的时间相关性;分支二以基于时间步的OD数据为输入,提出了深度注意力模块挖掘数据中大量的时间、空间相关性,利用基于时间步的OD数据能够更好地展现站间联系紧密程度和全局信息,从而完成了拓扑网络信息提取;分支三的输入为POI数据,使用CNN网络获取其时空相关性,并作为时间与空间特征之间的纽带。为了保证在预测精度足够高的条件下,获得更长的预测时间和更详细的预测信息,本文采用“神经网络多输出”策略,完成了多步预测任务。本文在2个大规模城市轨道交通真实数据集中对该模型进行测试,并将预测结果与10个基准模型和4个消融实验模型进行对比,在RMSE、MAE与WMAPE评估指标中,STIPM模型均得到最高的预测精度,结果表明该模型具有一定的优越性与鲁棒性。
当前路网主要借助属性表中若干特征项的属性信息对其进行语义相似性评估,很少顾及到路网的分级层次结构、空间拓扑信息以及邻域要素信息,一定程度上影响着语义相似性评估结果的准确性。针对上述问题,本文提出一种“整体(骨架树)→部分(同构子树)→个体(stroke)”的路网层次化语义相似性度量模型,该模型顾及了路网属性特征项、上下级拓扑关联和邻域POI的语义信息,突破了传统模型仅以路网属性特征项的语义信息作为相似性评估指标的局限性。① 利用stroke技术表达路网,并对其进行分级;② 将路网数据映射到关联骨架树,进而建立考虑其层次性的路网相似性度量模型;③ 利用层次分析法和熵权法分别确定约束指标权值,并通过加权法计算路网的语义相似度。将该模型应用到路网匹配实验中,并与既有模型进行对比,结果表明利用本文提出的语义相似性度量模型,同时结合同构子树进行道路匹配,不仅可以提高匹配结果的准确性,而且可以提高匹配效率。对于文中案例所选的路网,拓扑关联语义信息对匹配结果的影响较邻域POI语义信息更显著,且与遍历法相比,以同构子树作为参照进行路网匹配,其匹配速率得到明显提升。
城市出租汽车是居民出行的重要方式之一,地理流空间理论为发掘人群出行特征,优化车辆运营效率提供了新视角。本文利用厦门市出租汽车轨迹数据,采用地理流空间分析理论,对人群出行的整体随机性质进行了分析,基于流相似性度量识别并分析了丛集、汇聚、发散和社区4种典型模式及混合模式的空间分布特征,对比了基于巡游车和网约车2种车辆的人群出行模式。结果表明流空间理论能够系统性发现人群出行典型模式及混合模式,主要体现在:① 基于2类车辆的人群出行流在空间中呈现出显著的非随机特征;② 巡游车和网约车的典型模式在空间分布上有明显差别,网约车的有关模式分布范围更广,在厦门岛外各区中心及岛内东部软件园等区域附近较为突出,且网约车由于其订单由用户需求驱动,更容易发现潜在的高出行需求区域,同时出行结构更容易形成社区模式,而巡游车主要分布在传统岛内知名城市地标附近;③ 同一区域内巡游车和网约车出行混合模式普遍存在,约占典型模式的四分之一左右,而且不同类型车辆的主要混合模式存在差异,综合考虑混合模式能够提高城市公共设施规划的精确性和科学性。本文结果可以为车辆调度优化和城市交通规划提供支持,也表明地理流空间理论能够更有效揭示地理流对象的空间模式特征。
随着互联网租赁自行车(共享单车)的兴起,“共享单车+地铁”“共享单车+公交”已成为城市通勤的主要接驳方式,但共享单车的“潮汐效应”也成为共享单车管理和资源调配的“痛点”和“难点”。因此,发现共享单车的“潮汐规律”,准确预测共享单车停车区(电子围栏)的租还需求,对于共享单车的有序规范发展,优化用车体验和环境等具有重要意义。本文首先基于共享单车订单数据和“电子围栏”空间数据,提出一种识别共享单车潮汐点的时空模型并分析其潮汐性时空特征。该模型将潮汐点定义为短时间内因大量共享单车租或还从而导致无车可租或无车位可停的电子围栏,然后根据电子围栏在某时间段的状态进行分类,并赋予不同的缺车/缺停指数。结果显示该模型能够精准识别特定时段出现的潮汐点。随后,基于共享单车订单、城市信息点(POI)、道路、人口、土地利用、气温、风速等时空数据,并考虑局部范围内的电子围栏相关性,构建KNN-LightGBM模型来预测共享单车租还需求:① 利用主成分分析(Principal Component Analysis,PCA)进行特征提取;② 利用KNN(K Nearest Neighbors)算法计算局部范围内电子围栏之间相关信息;③ 整合PCA提取的特征向量和电子围栏相关信息作为输入特征,利用LightGBM方法进行租还需求预测;④ 评估影响租还需求预测的特征重要性。结果表明:与常用的4种机器学习方法进行对比,KNN-LightGBM在不同时间尺度下的预测实验中RMSE、MAE的平均值均最小,R2和r平均值均最大,预测效果较好;利用KNN计算局部范围内的电子围栏相关性,能够有效的提高预测精度,与LightGBM相比,KNN-LightGBM的RMSE和MAE分别降低了10%和11%,R2和r分别提高了3%和4%;共享单车的历史订单数据对租还需求预测最为重要,与最近公共交通接驳站距离的重要性次之。
渣土车轨迹数据蕴含丰富的行为模式信息,包括停车行为、运输路径、异常活动、渣土装载与倾倒OD点等关键特征,已逐渐成为渣土车运行监测与作业行为监管的主要数据来源。但是目前在渣土车作业行为提取中仍主要采用车载GPS数据结合工地电子围栏的传统签到系统,存在电子围栏与道路相互包含、重叠等一系列问题。针对传统渣土车作业行为提取中存在的车辆作业误判问题,本文提出一种顾及轨迹还原与分类的渣土车作业行为提取方法。① 从运动状态和几何形态2个方面理解并识别渣土车作业行为模式;② 利用顾及时间与距离的停留点提取算法提取车辆停留点,处理停留点与轨迹的映射关系,完成基于停留点的轨迹匹配;③ 构建平均相似值函数对轨迹进行语义信息增强;④ 提出SR-LGBM算法,筛选作业轨迹与非作业轨迹,实现渣土车的作业行为提取。采用南京市渣土车轨迹数据进行测试,结果表明,本文方法的准确率达97.29%,相比GaussianNB、Logistic Regression等传统分类算法其准确率与召回率均得到不同程度的提高,有效解决了电子围栏与道路重叠或多个围栏交叉造成的误判问题,可实现准确、高效的作业行为提取。
鉴于目前关于时空数据的综合评价未能充分考虑时空交互信息,本文提出一种时空动态熵值法,可同时考虑空间、时间和时空交互3个维度的信息熵,采用该方法综合测度了2000—2020年黄河流域地级市尺度的生态文明指数(EcCI)和共同富裕指数(CoPI);采用贝叶斯自适应多阶段时空演化模型精细研究了黄河流域EcCI和CoPI时空演进规律,有效识别了二者在研究期内的非线性局部变化趋势;为了能够定量测度黄河流域EcCI和CoPI的时空协同状态,本文提出一种贝叶斯时空协同模型,实现了二者在四类变化组合场景下时空协同状态的有效测度。研究发现,黄河流域EcCI和CoPI的时空演进过程可分为3个时期:2000—2007年(前期)、2008—2015年(中期)和2016—2020年(后期);EcCI的总体空间格局在后期发生了一定转变,而CoPI则在3期保持了基本稳定,表明CoPI的区域协调难度要高于EcCI;在前期和中期,有少数区域的EcCI和CoPI出现了降低趋势,但在后期,绝大部分区域的EcCI和CoPI都呈现出增长趋势,相较于EcCI而言,CoPI的增长趋势表现出区域极化特征;在时空协同方面,EcCI和CoPI的空间协同状态在3个阶段基本保持稳定,西部和东部EcCI和CoPI的空间格局达到协同,而中部的EcCI相对水平高于CoPI;二者的变化趋势在3个阶段呈现出逐步协同优化的过程,尤其在后期,黄河流域68(92%)个地级市EcCI与CoPI的增长态势趋于一致,但仍存在较大的区域差异性,因此,在建立生态文明和共同富裕的精准推进政策体系时,应充分考虑地区异质性特征,并加强区域城市间统筹联动。
农村可达指数(RAI)是联合国可持续发展目标(SDGs)的重要评估指标(SDG 9.1.1),用于衡量享受道路交通服务的农村人口比例,但是目前存在指标不全、范围有限、数据有偏和解释不足等问题。因此,本文基于1:25万道路数据、1:100万行政区划数据、100 m分辨率人口数据、城市建成区数据、高程数据和GDP数据六种全球或区域开放的地理空间数据,评估了全国2852个区县单元的RAI和NSRP(难以享受道路交通服务的农村人口)指标,并引入社会经济变量和地形变量理解这2个指标的空间格局。研究发现:① 虽然我国仍有485.3万难以享受道路交通服务的农村人口;但是享受道路交通服务的农村人口比例为99.5%,且该值远高于世界银行给出的评估结果(71.8%);② RAI和NSRP的空间格局均沿“胡焕庸线”呈两极化分布:“胡焕庸线”以东地区的RAI值较高、NSRP值较低;而“胡焕庸线”以西地区的RAI值较低、NSRP值较高;③ RAI和NSRP与社会经济和地形变量显著相关,且与地形变量的相关性更高,表明地形对2个指标空间格局影响显著。本研究首次在区县级尺度上揭示了我国农村交通服务的空间格局,可以为改善农村道路交通设施提供决策支持。
网络舆情分析在突发事件科学管理及应急响应中作用显著。本文以2021年发生的我国首例野象大跨度北移事件为案例,采用事件抽取和扩展BosonNLP的情感分析方法,研究新闻及社交媒体关于野象北移的情感关切响应及事件级联效应,并用地理探测器等空间统计分析方法揭示其影响机制,进而探讨此类突发事件与其他舆情的传播及演化差异。结果表明:① 野象北移舆情起始期较长而爆发期较短,且其信息扩散受空间距离衰减规律的影响较小,而主要取决于地区互联网资源供给及传播媒介分布情况,有别于公共卫生、自然灾害等跨区域重大突发事件舆情演进规律;② 北移象群逼近人口密集的城区时易引爆舆情;期间,新闻媒体全面关注野象迁移动态且积极意向明显,成为推动公众舆情趋向正面社会建构的重要话语力量;③ 微博舆情情感在全国及省域尺度均存在显著空间集聚性;事源地云南及其邻域为低-低集聚型情感冷区,国内媒体及微博用户主要分布地(北京、山东、江苏等)为高-高集聚型情感热区;突发事件主要影响区(昆明和玉溪)亦为高-高集聚型情感热区,而我国野象传统分布区(普洱和西双版纳)却为情感冷区;决策部门及新闻媒体应差异化响应舆情情感冷热区的民众关切并精准引导当地舆论。该研究对丰富大数据时代下舆情地理学的分析方法,促进生物多样性保护与社会和谐发展等具有重要意义。
城市滨水空间作为重要的城市公共空间,是体现城市活力与形象的重要载体。然而,目前研究主要侧重于单一类型的滨水空间活力的影响因素研究,缺乏对不同类型滨水空间活力的差异影响因素及各影响因素间的交互作用研究,难以对城市不同类型滨水空间的精细化管理提供指导。基于此现状,本文拟以深圳市为例,以百度热力图人口数据作为滨水空间活力的表征,整合多源地理数据,利用地理探测器模型,探寻不同类型下滨水建成环境与活力之间的交互关系,结合地理加权回归分析进一步识别活力的驱动因素。研究结果表明:① 各类滨水空间活力驱动因素存在较大差异,滨河空间中区位及可达性因子为主要驱动因子,q值高达0.757、0.720,滨湖空间区位、人口密度、滨水绿地率以及交通可达性因子活力的解释力更强,其中区位q值为0.807,海滨空间活力的驱动因子包括:区位、道路可达性以及建筑与水面的高宽比因子,q值分别为0.774、0.694和0.499;② 任意2个影响因子共同作用的解释力并非均大于单独作用结果,与以往研究不同,研究显示功能混合度因子及滨水绿地率因子与其他因子的交互作用,对于滨水空间影响力提升最为显著;③ 活力影响因素空间差异大,圈层特征明显。研究结论对我国未来城市规划建设、湖库海滨区域的深入开发以及滨水空间经济效益的提升具有重要的参考价值。
数字经济时代,实体空间与信息空间融合叠加、场景消费与符号消费共同作用的新零售消费空间对城市空间发展的影响不断扩大。以西安市新零售奶茶消费空间为研究对象,通过空间句法模型分析奶茶消费空间分布特征,构建门槛回归、多尺度地理加权回归模型对奶茶消费空间分布影响因素进行解析。研究发现:① 新零售奶茶消费空间区位选择对市场信息高度敏感并能够回应空间调控决策,传统零售业区位论中涉及的消费市场、空间接近性、地价、同行业发展等因素仍对新零售奶茶消费空间分布产生显著影响,但实体与信息在新零售奶茶消费空间中存在尺度博弈,信息作用随着尺度的扩大而更加明显;② 新零售奶茶消费空间分布中蕴含着品牌社群组织行为特征,消费社群的消费主体性增强,不同品牌新零售奶茶消费空间通过多种方式促进消费社群成长;③ 社会文化感知在实体与信息消费空间中均存在价格门槛效应。低价位消费空间场景与符号价值作用机制中信息流与物质流之间相互排斥,文化扩散依靠场景与符号密度、传播速度与频次。高价位消费空间场景与符号价值作用机制中信息流与物质流相互促进,文化扩散依靠场景与符号影响力和传播距离。④ 空间句法模型模拟了实体消费的信息空间延展,门槛回归与多尺度地理加权回归模型揭示了新零售消费空间生产与再生产机制,拓展了消费地理学中新零售消费空间研究。
从生产-生活-生态功能角度划分城市空间格局,不仅是国土空间结构优化的基础,也能反映城市用地的内在功能形态和空间组合模式。然而,以往城市“三生空间”的识别主要利用遥感图像、兴趣点和土地利用数据进行,缺少城市内部的立体信息。街景图像可以体现城市内部街道特征,实现街道内部物理环境近距离大规模高分辨率的客观测量。因此,本文基于街景图像提取场景语义特征,提出一种中心城区“三生空间”的识别和特征重要性分析的方法。以成都市四环内为研究区,使用梯度极限提升算法识别城市“三生空间”,进行模型精度对比检验,从道路、格网和交通分析区3个尺度分析研究区“三生空间”的格局分布特征,并引入沙普利加和解释(SHAP)方法探索“三生空间”的特征重要性。结果显示:① 本文提出的基于街景图像识别“三生空间”方法具有较好的效果,模型识别生产、生活和生态空间的R2均达到0.6,表明使用街景图像识别“三生空间”具有可行性;② 分析研究区内的“三生空间”分布格局,研究区内以生产-生活空间为主,数量多且在区域内呈片状分布,以生态空间为主的单元数量少,主要分布在大型公园处;③ 分析7维场景层语义特征的重要性,其中街道开敞度和机动化程度对三类空间形成的影响最大。本研究成果丰富了“三生空间”识别的数据和方法体系,为城市空间结构优化和发展决策提供了新的工具。
准确识别影响环境安全感知的视觉因素,对于改善城市交通环境与提升行人出行安全具有重要支撑作用。然而,既有研究难以对复杂场景下的环境安全感知进行大规模定量化研究。因此,本文利用图像语义分割和目标检测技术从街景图像中提取视觉要素,通过人工评分结合深度学习的方式构建道路安全感知数据集;再基于轻量梯度提升机和SHAP解释框架,识别出影响环境安全感知的视觉因素;最后,选取道路环境特殊的峡谷性城市兰州市安宁区高校聚集地为例进行实证研究。结果表明:① 高校及商业街的安全感知评分较高,城市道路的普遍偏低;② 天空、人行道、道路和树木的图像占比值是对环境安全感知影响最大的四类要素,其中,天空的图像占比值为线性关系,人行道和树木的图像占比值近似对数函数,道路的图像占比值则类似二次函数;③ 视觉要素占比和个数存在交互影响作用,合理的要素分布有助于形成良好的空间视线,以及营造合适的行为活动空间,从而提升环境安全感知。
基于地点的犯罪时空预测由于不直接涉及个人数据,且可与警务巡逻和精准化治安防控策略有机结合,现已成为预测性警务领域的研究热点和主要实践方向。本文对2013年以来国内外犯罪时空预测的最新进展进行综述,主要工作包括: ① 总结了该领域研究在文献数量快速增加、研究主题日益多元、主要研究群体分布相对集中等方面的总体特征; ② 梳理了犯罪时空预测的目标主体、时间尺度、空间尺度、模型方法、精度评价、实践效果评估六大基本要素的新变化、新指标或新进展; ③ 介绍了常用犯罪时空预测软件及各国预测性警务实践; ④ 探讨了在实践应用的各个阶段所面临的伦理问题及挑战,以及各界为规避此问题做出的尝试; ⑤ 展望了犯罪时空预测后续研究重点。本研究为犯罪时空预测领域勾勒出一个较为全面和清晰的轮廓,可为国内犯罪地理、智慧警务、警用地理信息系统(PGIS)等相关领域的研究者和从业人员提供有益参考。