轨迹与交通

基于地理流空间的巡游车与网约车人群出行模式研究

  • 王鹏洲 , 1, 2 ,
  • 赵志远 , 1, 2, 3, * ,
  • 姚伟 1, 2 ,
  • 吴升 1, 2, 3 ,
  • 汪艳霞 4 ,
  • 方莉娜 1, 2, 3 ,
  • 邬群勇 1, 2, 3
展开
  • 1.福州大学数字中国研究院(福建),福州 350003
  • 2.空间数据挖掘与信息共享教育部重点实验室,福州 350003
  • 3.海西政务大数据应用协同创新中心,福州 350002
  • 4.福州市勘测院有限公司,福州 350108
*赵志远(1989—),男,安徽亳州人,博士,从事时空大数据分析与挖掘。E-mail:

王鹏洲(1997—),男,山西晋中人,硕士,从事时空轨迹数据挖掘。E-mail:

收稿日期: 2021-12-01

  修回日期: 2022-03-18

  网络出版日期: 2023-04-19

基金资助

国家重点研发计划项目(2017YFB0503500)

中国博士后科学基金项目(2019M652244)

福建省中央引导地方科技发展专项(2020L3005)

Human Travel Patterns by E-hailing Cars and Traditional Taxis based on Geographic Flow Space

  • WANG Pengzhou , 1, 2 ,
  • ZHAO Zhiyuan , 1, 2, 3, * ,
  • YAO Wei 1, 2 ,
  • WU Sheng 1, 2, 3 ,
  • WANG Yanxia 4 ,
  • FANG Lina 1, 2, 3 ,
  • WU Qunyong 1, 2, 3
Expand
  • 1. Academy of Digital China (Fujian), Fuzhou University, Fuzhou 350003, China
  • 2. Key Laboratory of Spatial Data Mining and Information Sharing, Ministry of Education, Fuzhou 350003, China
  • 3. Fujian Collaborative Innovation Center for Big Data Applications in Governments, Fuzhou 350002, China
  • 4. Fuzhou Investigation & Surveying Institute Co., Ltd., Fuzhou 350108, China
*ZHAO Zhiyuan, E-mail:

Received date: 2021-12-01

  Revised date: 2022-03-18

  Online published: 2023-04-19

Supported by

National Key Research and Development Program of China(2017YFB0503500)

China Postdoctoral Science Foundation(2019M652244)

The Central Guided Local Development of Science and Technology Project of Fujian(2020L3005)

摘要

城市出租汽车是居民出行的重要方式之一,地理流空间理论为发掘人群出行特征,优化车辆运营效率提供了新视角。本文利用厦门市出租汽车轨迹数据,采用地理流空间分析理论,对人群出行的整体随机性质进行了分析,基于流相似性度量识别并分析了丛集、汇聚、发散和社区4种典型模式及混合模式的空间分布特征,对比了基于巡游车和网约车2种车辆的人群出行模式。结果表明流空间理论能够系统性发现人群出行典型模式及混合模式,主要体现在:① 基于2类车辆的人群出行流在空间中呈现出显著的非随机特征;② 巡游车和网约车的典型模式在空间分布上有明显差别,网约车的有关模式分布范围更广,在厦门岛外各区中心及岛内东部软件园等区域附近较为突出,且网约车由于其订单由用户需求驱动,更容易发现潜在的高出行需求区域,同时出行结构更容易形成社区模式,而巡游车主要分布在传统岛内知名城市地标附近;③ 同一区域内巡游车和网约车出行混合模式普遍存在,约占典型模式的四分之一左右,而且不同类型车辆的主要混合模式存在差异,综合考虑混合模式能够提高城市公共设施规划的精确性和科学性。本文结果可以为车辆调度优化和城市交通规划提供支持,也表明地理流空间理论能够更有效揭示地理流对象的空间模式特征。

本文引用格式

王鹏洲 , 赵志远 , 姚伟 , 吴升 , 汪艳霞 , 方莉娜 , 邬群勇 . 基于地理流空间的巡游车与网约车人群出行模式研究[J]. 地球信息科学学报, 2023 , 25(4) : 726 -740 . DOI: 10.12082/dqxxkx.2023.210769

Abstract

Traditional taxis and the e-hailing cars are two main transport vehicles for the public in current taxi market, which aim to satisfy the customized travel demand in daily lives of citizens in urban public transportation system. Due to the differences in service modes and commercial patterns, the two vehicles are appropriate for different target groups. Investigating the spatial and temporal characteristics of these two types of vehicle based on human travel flows can support the applications such as optimization of the urban public transportation and land use planning. The geographical flow space theory proposed recently provides a new theoretical perspective as well as a systematical analysis framework in studying the flow patterns of the travels by different types of vehicles. In this paper, we adopt this formulated theory framework to describe the travel flow. We select five typical flow patterns, namely random, clustering, aggregation, divergence, and community patterns, to reveal their spatial distribution characteristics and compare the differences in their travel patterns. The trajectory dataset of traditional taxis and the e-hailing cars in Xiamen City is employed to validate the effectiveness of the geographical flow space theory. We find that: (1) the travel flows of the two types of vehicles present significant non-random characteristics in flow space; (2) people tend to choose e-hailing cars for long distance travel, while prefer the traditional taxis for short and medium distance travels; (3) the two types of cars show different spatial distribution characteristics of the four typical flow patterns. The travels by e-hailing cars are more widely distributed and exhibit clustering patterns around the sub-centers at the suburban areas outside the core Xiamen Island and the east-southern software park area inside the Xiamen Island. Due to the travel demand driven model, the e-hailing cars satisfy the emerging high travel demand areas and tend to form community patterns. While the traditional cars are mainly distributed around the well-known city landmarks (e.g., Zengcuoan, Zhongshan road) on the Island; (4) approximately a quarter of the local areas have more than one typical flow patterns. Different types of cars exhibit different co-location flow patterns and spatial distribution characteristics. The mixed flow patterns derived from the geographical flow theory provide a more comprehensive perspective to better understand the travel flows, which can mitigate the misleading information from each isolated flow pattern. The above findings imply that the geographical flow theory can help to better understand the characteristics of the geographical flows and can be used to improve the applications based on related results.

1 引言

巡游车和网约车是满足城市居民日常出行需求的两种重要途径[1-2]。巡游车,一般指传统出租车,是公共交通服务中用于满足居民个性化出行的方式,长期以来主要通过乘客“招手停”和司机“巡游寻客”的方式实现出行供给和需求匹配。网约车是近年来随信息与通信技术发展而产生、兴起的出行方式,主要通过平台桥接用户需求和服务供给,进行自动匹配,是一种新型的服务模式。近年来,网约车迅速发展,深刻改变了城市出租汽车的运营格局,也给城市交通环境造成一定影响[3-5]。实际上,巡游车与网约车的运营策略存在差异,前者主要是经验驱动,后者则主要是需求驱动,所服务目标人群也有差异。探究人群基于2种车辆的出行模式,能够为2种车辆的协同发展和城市公共出行优化提供支撑,从而提高城市居民出行服务水平和车辆运行效率。
记录车辆位置信息和载客信息的轨迹数据为研究人群出行模式提供了数据基础[6]。基于上述数据,学者们在基本统计特征、空间分布特征和出行交互特征3个方面开展了人群出行模式以及与城市空间结构联系的研究[7-8]。在基本统计特征方面,通过构建运营强度[9]、空驶率[10]等指标对巡游车和网约车运营特征进行了对比分析;在空间分布特征方面,分析上客点或下客点的时空分布特征[11],并根据流入流出量识别聚集和发散模式[12-13],有学者分别将其形象地比喻为“源”和“汇”(Source and Sink)模式[14]或“火山”和“黑洞”(Volcano and Black Hole)模式[15];在出行交互特征方面,通过定义流相似性[16-17]并将点空间的聚类算法应用于流数据来识别区域间交互[18-19]。层次聚类算法常被用来识别和可视化流丛集模式[20-23],但其对噪声数据不敏感,识别和可视化流丛集模式[20-23],但其对噪声数据不敏感,在聚类结果中会出现异常流数据;为解决此问题,学者们将基于密度的聚类算法应用于流聚类中[24-27],但其对参数较为敏感且不能识别关键流信息;针对上述问题提出了空间统计方法,如Moran's I[28]、Ripley's K函数[29]等。此外,采用模块度、信息熵等目标函数基于复杂网络社区划分方法划分不同社区出行[30-31]。然而现有研究主要面向单一车辆出行模式分析,缺少不同车辆人群多种出行模式的系统性对比分析,有关分析结果也只能反映人群出行单一维度信息,在支撑具有综合性、权威性特点的城市管理决策时缺乏系统性。
地理流空间理论为分析城市人群出行模式提供了系统性理论分析框架。首先,在理论分析框架方面,地理流空间是指将流视为基本元素的空间,可以根据流的起点和终点所在二维平面的笛卡尔积进行定义[32]。裴韬等[33]基于规范化数学定义,将地理流进一步转换为由起点、方向和长度3个要素组成的地理流极坐标表达,并根据每个要素维度的丛集、随机和排斥特征组合,推测出存在27种理论地理流模式,并指出其中的部分典型模式具有较为明确的地理意义。因此,地理流空间理论为已有地理流模式分析提供了理论依据。例如,在这一理论框架下,Shu等[34]提出基于地理流的L函数以克服K函数中可变的显著性检测基准值识别最大聚集尺度不准的局限,Fang等[35]将曼哈顿距离用于L函数中来提取居民基于道路的出行流聚类。
其次,在系统分析框架方面,根据地理流理论可以在判定随机模式的基础之上,进一步从丛集、汇聚、发散和社区模式等多种维度对地理流现象进行分析,形成更为全面性的认识,能够避免单一维度特征的片面性,从而提高有关决策的科学性。例如,丛集模式对应的区域可以用来指导区间公交线路选择,而汇聚和发散模式则可以用于指导出租车待客区域规划,如果上述模式独立考虑,有关土地空间难以统筹,现有可用土地资源可能只能满足其中一种需求,从而导致有限用地资源难以充分利用,降低出行需求管理效率。已有部分学者注意到多种流模式协同的优势,例如裴韬[33]等梳理了“丛集-汇聚-发散”、“社区-汇聚-发散”和“社区-丛集”共3种混合模式的概念及其对应的现实世界场景,而许多学者一般将聚集和发散模式一并分析讨论[14-15],也是为了避免单一模式所反映出行流特征的片面性。然而,以地理流空间理论为参考,综合分析人群出行模式综合性特征的研究还相对较少。
为此,本文旨在研究基于巡游车与网约车的典型人群出行流模式时空分布特征,并对两类车辆人群出行模式异同进行对比分析。通过上述研究能够深化对城市人群出行流模式的理解,为城市出租汽车协同调度以及公共交通优化决策提供指导。

2 研究方法

基于流空间理论,选择随机、丛集、汇聚、发散和社区等典型模式来反映人群综合出行特征,并参考现有研究成果,按照常用、最新原则,通过K函数和L函数判断流的随机性,通过相似性算法和逐级合并的层次聚类算法识别丛集、汇聚和发散模式,基于边介数删除弱连接的GN算法识别流社区模式。

2.1 随机模式判断

随机性和异质性是流模式的两种基本类型[33],其中随机性表示流在流空间中呈现出随机分布,不存在明显的聚集特征。K函数和局部K函数通常被用来判断流随机性和异质性[36]。K函数基本思想是对出行流一定范围内的流进行计数,然后除以流密度进而计算K值,并对设定间隔内的其他距离进行重复计算。流空间的K函数为:
K r = i j σ i j F r n ρ (i , j = 1,2 , · · · , n ; i j)
式中: r表示距离; n为空间中流的总数目;当出行流 i和出行流 j距离不超过 r时, σ i j F (r) = 1,否则 σ i j F (r) = 0 ρ代表研究区域内流的密度, ρ = n / V V为流数据集的O平面面积和D平面面积的乘积。本研究中O平面面积为流数据集起点组成最小凸包的面积。
K函数的期望值为 E K r = π 2 r 4。对于一定的距离 r,当K观测值大于K预期值,则表明与在该空间尺度的随机性分布相比,该分布的聚集程度更高,否则相反。
通过对K函数进行标准化可以得到L函数[34]
L r = K (r) π 2 4 - r = i j σ i j F r ρ n π 2 4 - r (i , j = 1,2 , · · · , n ; i j)
L函数期望值为0,判断随机或聚集方法与K函数类似。但其在判断最大聚集尺度时需结合L函数的导数来判断,具体地,最大聚集尺度为L函数最大值右侧第一个L函数导数极小值处。

2.2 丛集模式识别

出行流丛集模式为流异质性的一种表现形式,裴韬等[33]将其定义为流空间中流的聚集,具体表现为流起点或终点聚集,同时方向和长度也都聚集。本文采用项秋亮等[23]提出的流相似性算法和逐级合并的层次聚类算法来识别流丛集模式。
(1)时空相似性
空间相似即流起点和终点同时聚集可以分别计算O点、D点间距离来识别。通过在 f l o w i的OD点建立以 D r为半径的缓冲区,为了保证流 f l o w i f l o w j相似,要求 f l o w j的O点、D点分别在 f l o w i的一定距离缓冲区内,如图1所示。
图1 OD出行流空间相似度关系

Fig. 1 Diagram of the spatial similarity relationship of OD travel flow

时间相似性采用出行流起始时间差除以特定的时间参数,综合流空间、时间相似性度量方法, f l o w i f l o w j之间的时空相似性为:
S T _ S i m i j = 1 - f u n c r a t i o O 2 × f u n c r a t i o D 2 × f u n c (r a t i o T) 2 × 8 / 7
r a t i o O = d i s t O i , O j / D r
r a t i o D = d i s t D i , D j / D r
r a t i o T = t i m e D i f f O i , O j / t i m e S p a n
f u n c r a t i o = r a t i o + 1 (r a t i o 1) (r a t i o > 1)
式中: S T _ S i m i j为第 i j条流的时空相似性; r a t i o O r a t i o D r a t i o T分别为O点、D点及出行时间相似因子; d i s t为计算两点间欧式距离函数; t i m e D i f f为计算时间差异的函数; t i m e S p a n为时间参数,具体原理可参考文献[23]。
通过式(3)可发现,如果2条流相似即 S T _ S i m i j值域在[0,1],需要 d i s t O i , O j D r d i s t O i , O j D r t i m e D i f f ( O i , O j ) t i m e S p a n。距离越小,出发时间越临近,2条出行流在时空上越相似。 D r的取值大小是判断2条出行流之间相似性的关键。当 D r的取值为固定值时,会出现判断流相似性时出现定性和定量的错误,项秋亮等[16]为解决这一问题引入了参数k,其为流长度与 D r的比值。当流长度大于 D r 0k倍时, D r为固定值 D r 0,否则为流长度除以k,即:
D r = l e n f l o w i k ( l e n f l o w i k × D r 0 ) D r 0 ( l e n f l o w i > k × D r 0 )
式中: l e n为计算流长度的函数,本文中为流起点和终点之间的欧氏距离。
k D r 0是相似性计算中的2个关键参数。对于参数k的选取,项秋亮等[23]发现随着k的增大,流聚类结果的空间尺度越小,类簇对应的流数量也越少,并对比了k取[3,5]范围的变化情况,本文综合既有研究中有关k参数的设定原则和取值,出于可对比性目的,将k设定4开展后续研究。在 D r 0的选择上,当该参数取值增大时,聚类结果中最大的流簇对应的流数量越高,流的OD点距离中心流的最大距离越大。实际上, D r 0的选择可以根据应用目的进行确定,考虑到本文提取丛集流可用于支撑公共交通优化,因此参照公交车站常用的服务半径参数,将 D r 0设定为500 m。
(2)逐级合并的层次聚类算法
基于流时空相似性度量方法,本文采用凝聚层次聚类算法来对出行流进行聚类,以发现在时空上都邻近的出行流,即出行流丛集模式。经典的层次聚类算法,初始把每个出行流都看作一个类簇,逐层选择相似性最高的类簇进行合并,时间复杂度为 O ( n 3 ),当出行流的数量较多时,其效率较低。本文采用项秋亮等[16]提出的逐级合并OD流层次聚类算法,时间复杂度为 O ( n 2 ),可明显提升聚类效率。

2.3 汇聚和发散模式识别

汇聚模式定义为流在流空间中终点聚集、方向随机或排斥、长度任意;而发散模式与其差异为流起点聚集,流方向和长度与汇聚模式相同[33]。与之前学者提出的源和汇类似,目前主要通过对研究区域划分地理分析单元,然后将上下客点关联到对应的分析单元,统计不同研究单元流入流出量来判断汇聚或发散模式。然而,此方法识别的汇聚和发散模式依赖于空间单元的划分,可能将聚散区域切分为几部分,导致流量减少,不能有效进行识别,且不同时空尺度对分析出的汇聚和发散模式也有影响。
为此,本文基于丛集模式的识别方法来识别汇聚和发散模式,计算时空相似性时分别只考虑D点、O点与时间。汇聚模式其时空相似性为:
G A T _ S T _ S i m i j = 1 - f u n c r a t i o D 2 × f u n c ( r a t i o T ) 2 × 4 / 3
式中: G A T _ S T _ S i m i j为第 i j条流的汇聚时空相似性; r a t i o D r a t i o T分别为D点和到达时间相似因子,计算方式参考2.2节。
发散模式时空相似性为:
D I V _ S T _ S i m i j = 1 - f u n c r a t i o O 2 × f u n c ( r a t i o T ) 2 × 4 / 3
式中: D I V _ S T _ S i m i j为第 i j条流的发散时空相似性; r a t i o O r a t i o T分别为O点和出行时间相似因子,计算方式参考2.2节。
基于逐级合并的层次聚类算法分别通过汇聚相似性和发散相似性来识别汇聚模式、发散模式,因需结合丛集模式一起分析,所以采用参数取值与其保持一致。

2.4 社区模式识别

流社区模式在流空间中具体表现为流起点聚集、方向任意、长度聚集[33]。现有社区挖掘方法通过构建出行网络,基于模块度和社区发现算法来识别社区模式。本文将研究区按500 m划分规则网格作为地理分析单元,空间关联O、D点到各个单元,统计不同单元间出行量来构建出行网络。
社区挖掘算法采用Girvan和Newman提出的基于边介数删除弱连接的GN算法[37]。GN算法是一种分裂算法,首先将所有节点看成一个社区,通过删除边将社区划分为更小的社区。但其未考虑区域间流量的影响,本文将区域间流量作为边权重,使用加权的GN算法来进行社区检测,具体流程为:
(1)以无权网络计算网络中所有连接边的边介数,将边介数除以对应边的权重得到边权比;
(2)逐次寻找边权比最高的边将其删除,并计算网络中的模块度Q;
(3)重复步骤(1)、(2),直到所有边均被删除;
(4)查找Q值最大的划分序号,在原始矩阵中依次去除截止到此次划分的边,得出最终矩阵。
划分标准采用Newman和Girvan提出的模块度[38],物理含义是社区节点的连边数与随机情况下的边数之差,取值范围是 - 0.5 , 1.0,具体公式如下:
Q = 1 2 m A v w - k v k w 2 m δ c v , c w
式中: v w在本研究中代表各个地理分析单元;如果 v w之间的存在出行量, A v w为1,否则为0; k v k w分别为节点 v和节点 w的度,也就是与地理分析单元有交互的出行量之和; m为出行网络中所有出行量之和; c v c w分别表示地理分析单元 v w所属的社区;如果 v w在同一个社区,即 c v = c w δ c v , c w为1,否则为0。

3 研究区概况与数据来源

3.1 研究区概况

本文研究区域为厦门市,其位于中国福建省东南、海峡西岸(图2),是著名的旅游城市。厦门岛是厦门市的政治、经济、文化中心,不到10%的面积承载了超过50%的常住人口。岛外的厦门北站和岛内的厦门站、高崎国际机场、东渡码头是厦门市主要的交通枢纽,已建成的3条地铁线分别从厦门岛内通往集美区、海沧区和翔安区,为居民出行带了便利。
图2 研究区概况

Fig. 2 Overview of the study area

3.2 数据及预处理

研究数据采用厦门市2019年5月31日巡游车和网约车订单数据,数据来源为2020年数字中国创新大赛(https://data.xm.gov.cn/opendata-competition/index.html#/.)。在具体分析时,本文参考现有通勤研究方案[39],选择7:00—9:00为早高峰时段, 17:00—19:00为晚高峰时段。
数据驱动的分析研究需要尤其关注数据质量问题[40]。出租车数据在产生的过程中可能会因为传感器设备故障或后台系统异常造成部分数据丢失的情况。为此,需要对原始数据进行清洗,首先去除空值较多且不需要的字段,如等待时间、订单匹配时间、行驶距离等。其次删除上客点或下客点不在研究区的订单,去除数值为空、上下客时间格式异常的订单。最终清洗后巡游车、网约车的订单数据字段见表1。数据清洗后巡游车早、晚高峰订单数据分别为22 116、21 620条,网约车为35 776、39 402条。
表1 订单数据样例

Tab. 1 Examples of the order records

车辆ID 上车时间 上车经度/°E 上车纬度/°N 下车时间 下车经度/°E 下车纬度/°N
87a1*****a 2019-05-31 08:49:00 118.1****2 24.5****1 2019-05-31 09:17:00 118.1****3 24.4****6
f8bb*****2 2019-05-31 07:04:00 118.1****1 24.4****5 2019-05-31 07:11:00 118.1****8 24.4****3
ff50*****7 2019-05-31 07:48:00 118.0****5 24.4****3 2019-05-31 08:27:00 118.1****8 24.4****0
9b28*****f 2019-05-31 07:51:00 118.1****8 24.5****6 2019-05-31 08:34:00 118.0****8 24.5****3

4 研究结果及分析

4.1 流总体性质分析

巡游车与网约车在早晚高峰均未呈现出明显的随机性。基于K函数的分析结果中,对于确定的距离r,早晚高峰时K观测值都大于K预期值,表明相比于随机性,出行流分布的聚类程度更高(图3)。基于L函数的分析结果同样佐证了有关模式(图4)。实际上,虽然2种判定方式的定性结果相近,但在最大聚集尺度数值上存在显著差异,例如基于L函数发现巡游车在早晚高峰出行流最大聚集尺度都为15 km,而网约车早晚高峰的最大聚集尺度都为13 km,而基于K函数的分析结果则分别为13 km和18 km左右。Shu等[34]在提出L函数时指出K函数由于显著性分析中基准数值随距离发生变化,难以有效识别最大聚集分割尺度,图3图4表明在厦门市人群基于出租汽车出行流存在这一现象。这也提示学者在开展流模式的分析中,对涉及最大聚类尺度的结果分析中,需要进行深入论证,避免结果出现误导。
图3 出行流K函数分布

Fig. 3 The K function distribution of the travel flows

图4 出行流L函数及导数分布

Fig. 4 The L and L' distribution of the travel flows

基于人群出行流在空间上呈现聚集特性,下文分别从丛集模式、汇聚模式、发散模式和社区模式来分析工作日早晚高峰2类车辆人群出行流特征差异。

4.2 丛集模式分析

巡游车早高峰时段出行流丛集模式在若干地方呈现聚集特征,如厦门站、厦门大学第一附属医院、东渡码头和演武小学等(图5(a))。其中流量最大的丛集出行为思明区人民法院附近到泛华大厦的110条出行流。晚高峰高流量流丛集模式主要分两部分,一部分沿着嘉禾路双向分布,如嘉达花园附近、明发商业广场、禾山中学、厦门站等区域间交互;另一部分为中山路、厦门大学、曾厝垵与厦门站间交互(图5(c))。
图5 丛集模式空间分布

Fig. 5 Spatial distribution of the clustering patterns

相比巡游车,网约车在早晚高峰丛集流流量更大。例如在厦门岛东部早高峰(图5(b))流量最多的为华林东盛花园到产业园区340条出行量,且出行量大于100的丛集流有40%终点位于此,起点都在小区附近。此外,软件园也是丛集模式终点汇集的区域,这2大类代表了早高峰上班族通勤流。晚高峰时段(图5(d)),在岛东部丛集模式起点为软件园及其它办公大厦,终点都位于大型商场,如国贸新城、五缘湾乐都汇等,岛外主要为集美街道学校与厦门北站间的交互。
综上所述,巡游车与网约车出行流丛集模式在厦门岛西部是较为类似的,尤其是沿嘉禾路、厦禾路附近。岛内差异较大的区域位于岛东侧软件园、各商业大厦与各个住宅小区间的出行流。据此可以对出行量较大区域规划公共交通出行,从而一定程度缓解交通拥堵。

4.3 汇聚和发散模式分析

巡游车、网约车在早晚高峰时段的汇聚和发散模式分别呈现出不同的分布特征。早高峰汇聚区域在晚高峰多为发散区域,较多知名地标既是汇聚点也是发散点,如车站、医院、商业广场等。巡游车与网约车汇聚和发散区域在空间上也呈现异质性分布。
在聚集模式中,早高峰期间,巡游车主要集中在医院(厦大一附院、中山医院等)、办公区域(五缘湾同安商务大厦、嘉义路与宜南路交叉口)、交通枢纽等(图6(a))。而网约车则更多分布在厦门岛东侧(软件园及产业园附近)、环白鹭洲公园工作区域、集美区(官任、诚毅广场、集美软件园附近)等(图6(b))。
图6 汇聚模式空间分布

Fig. 6 Spatial distribution of the aggregation patterns

在晚高峰时段,巡游车聚集区域主要有商场(SM广场、万达广场)、交通枢纽。而网约车聚集区域主要在商场(湖里万达、明发城、海沧区阿罗海城市广场)、集美大学诚毅学院,同安区、翔安区也有聚集区域(图6(d))。汇聚模式区域有大量车辆由载客变为空载,此现象是出租汽车协同发展需重点考虑的问题。例如巡游车汇聚区域附近存在网约车发散热点,可以考虑将过多空载的巡游车调度到发散热点区域接单以实现协同发展。
对于发散模式,早高峰期间主要是集中在居民区,由人群上班通勤、就医等需求驱动,但可以看出巡游车与网约车发散区域差异较大,交集很少。巡游车出行主要有医院(中医院、中山医院),居民区(加州花园、一安花园附近、吕岭社区周边)、交通枢纽、仙岳路翔安大道入口(图7(a))。网约车出行则主要集中在居民区(都市港湾、嘉盛豪园等),其中大多数都在工作区域附近,如软件园、商业大厦(图7(b))。
图7 发散模式空间分布

Fig. 7 Spatial distribution of the divergent patterns

晚高峰时段,交通枢纽是两类车辆出行发散模式的集中区域。除此之外,巡游车出行发散模式主要集中在商场(明发商业广场、SM城市广场、瑞景商业广场)、景区(中山路口、曾厝垵)(图7(c))。而网约车出行发散区域在商场等知名地标较少,主要集中在办公区域(厦门航运国际中心附近、软件园、环白鹭洲公园工作区域)和医疗地点(仙岳医院、厦大一附院)(图7(d))。
综上可发现,2类车辆发散区域差异较大,巡游车发散区域主要是知名地标,人流较大区域;而网约车主要承载了上班回家的工作人群和就医回家人群。聚集和发散热点的分布特征对不同车辆之间的调度优化有重要指导意义,也能够为城市规划及公共设施选址提供支撑。

4.4 社区模式分析

通过对人群出行网络进行社区划分发现巡游车较多节点间流量较少,对社区发现算法有较大影响,早晚高峰社区划分后模块度值均为0.04,社区数分别为605和679。通过设定阈值,删除节点间流量小于阈值的边。综合考虑不同阈值下模块度、社区数和流量,我们最终选取阈值为5,即构建的网络节点间流量均大于等于5。详细出行网络参数见表2
表2 巡游车与网约车早晚高峰社区检测参数

Tab. 2 Traditional taxi and online car-hailing morning and evening peak community detection parameters

巡游车 网约车
早高峰 晚高峰 早高峰 晚高峰
节点数 174 180 291 333
边数 365 406 552 693
平均度 4.20 4.51 3.75 4.16
图密度 0.02 0.03 0.01 0.01
模块度 0.48 0.46 0.63 0.63
社区数 16 12 23 28
对巡游车与网约车人群出行网络进行社区划分后发现,巡游车在早晚高峰分别识别出16个和12个社区结果,网约车分别为23个和28个社区结果,网约车社区数较多原因在于其运营范围更大且在岛外各区都存在网格数较少的社区。在社区模式分布上,巡游车在早晚高峰社区地块在岛外分布很少,只有厦门北站及周围几个区域,大部分集中在岛内。其中,早高峰社区研究单元数大于10的有5个,较大的2个社区位于厦门站所在的梧村街道与嘉莲街道、筼筜街道和厦门岛西南部沿岸附近(图8(a));晚高峰社区研究单元数大于10的有 4个,包括厦门北站、高崎机场、东渡码头等大型交通枢纽(图8(c))。
图8 社区模式空间分布

Fig. 8 Spatial distribution of the community patterns

网约车的社区模式分布范围较广,在岛外各区之间独自分为不同社区,区间没有交互,在岛内呈现东部和西南两大块,分别是科技园和中山路。具体地,早高峰社区个数大于10的有4个,包括集美区、厦门岛西南部和岛东侧(图8(b));晚高峰社区个数大于10的有7个,主要位于厦门岛西南部、东侧、东北侧区域、机场附近区域、以及集美区及翔安区建成区(图8(d))。
综上可以发现,网约车社区分布范围更广,可能与司机住址或者接单模式有较大联系,巡游车主要通过街边巡游接单,主要串联的是城市大型地标建筑之间的联系,而网约车则是需求驱动,即使在岛外整体出行需求相对较低的区域,也能够形成较为显著的社区模式。

4.5 混合模式分析

不同的流模式反映不同类型的人群出行特征,同一地区因承担多种类型的人群出行需求,而呈现多种类型组合流模式,分析混合模式特征能全面反映局部区域人群出行组合型特征,从而提高有关人群出行决策的科学性。图9呈现的是2种车辆在早晚高峰期间典型模式的混合分布状况,可以发现,在早高峰期间巡游车呈现出突出的混合模式特征,其中,在厦门站、万象城和禾祥商城附近巡游车呈现出丛集、汇聚、发散和社区4种模式混合的特征,而“丛集-汇聚-社区”的主要分布在交通枢纽附近、写字楼区域、医院等。在晚高峰时段,巡游车4种出行模式都有的区域有所变化,主要分布在厦门站、中山路、厦门大学、明发商业广场等地,而网约车主要集中在厦门站附近。
图9 混合模式空间分布

Fig. 9 Spatial distribution of the mix patterns

总体而言,混合模式所存在的网格占所有模式网格的四分之一左右,这表明较多区域呈现多种模式混合的特征,这在开展相关决策时需统筹综合考虑。表3为巡游车与网约车在早晚高峰时段各模式随机混合所组成的混合模式占有典型模式网格的比例,可以看出早晚高峰、不同类型车辆之间的混合模式有所不同。例如,巡游车存在较多的混合模式为“发散-社区模式”、“汇聚-社区模式”和“丛集-社区模式”,而网约车为“汇聚-社区模式”、“丛集-社区模式”和“汇聚-社区-丛集模式”。在各地区开展居民个性化公共出行优化治理时,需要根据不同车辆特征,综合考虑混合模式所反映的出行特点进行决策。
表3 各混合模式网格数量统计

Tab. 3 Statistics on the number of grids in each mix pattern (个)

模式 巡游车
早高峰
巡游车
晚高峰
网约车
早高峰
网约车
晚高峰
发散-社区 8 7 15 13
发散-汇聚 4 2 1 5
发散-丛集 1 2 4 1
社区-汇聚 11 4 30 19
社区-丛集 22 10 17 21
汇聚-丛集 1 0 11 6
汇聚-发散-社区 1 10 1 3
汇聚-发散-丛集 0 0 1 4
汇聚-社区-丛集 8 1 20 19
丛集-发散-社区 1 3 2 7
丛集-汇聚-发散-社区 3 8 0 4
混合模式总体占比/% 28 24 27 25

5 讨论

5.1 人群出行模式差异原因及应用

车辆运营模式和人群出行时的心理特点是巡游车与网约车人群出行流模式差异的2个重要原因。从运营模式角度,网约车由于系统就近派单且司机有倾向的载客区域,因此相对巡游车服务范围更广且更易形成社区,巡游车主要通过路边寻找进行载客,因此一般集中在人流量较大的区域。例如岛外厦门北站区域。而从出行心理角度,在需求意愿产生时,乘客为了降低打车的不确定性,在车辆较少的地方一般会优先选择网上叫车,这就使得网约车更能出现在实际需求高的区域;在人流较多、位置描述复杂、车辆供给较多的地方,在不考虑舒适性的情况下,会等待巡游车满足出行需求,例如在火车站、机场和医院附近巡游车出现明显聚集。
流模式挖掘结果可为不同对象的业务决策提供支撑。对政府而言,可以针对出行量大且集中的区域,配置定向公共交通,提高居民出行服务水平。例如丛集模式发现晚高峰高崎机场和厦门北站之间存在稳定且集中的出行需求,可通过增加区间直达公交提高人群运输效率。其次,聚集模式发现早高峰时段科技园和各商业大厦拥有大量人群流入,其大部分来自附近居民小区,针对这一现象也可设置多条公交接驳车辆,满足早高峰时段居民通勤出行需求。
对车辆运营企业而言,基于汇聚和发散模式发现的汇聚和发散热点可为车辆在精细时空尺度进行协同发展提供支持。例如晚高峰时段网约车在厦门岛东部的发散热点区域并没有发现巡游车聚集,巡游车公司可通过此类规律调度附近的车辆到网约车载客热区进行载客,以更好地满足人群出行需求,同时降低车辆空驶。其次,将同一时段的汇聚和发散模式一同分析,汇聚热点的车辆会转变为空载,而发散热点车辆需求高,可将多余的车辆就近调度到发散热点区域。

5.2 典型混合模式案例剖析

上文分析结果表明,混合出行模式普遍存在,这意味同一个地区居民出行需求类型多样,单一出行模式刻画的区域人群出行特征存在片面性,在用于指导城市决策时存在一定的局限,需要综合考虑混合模式特征。厦门站、中山路、曾厝垵和厦门大学是4种混合模式同时出现的典型区域,进一步分析表明区域之间都有较高出行流量交互(图10),同时存在丛集、聚集、发散以及社区特征。根据前文识别算法,丛集模式可以认为是聚集和发散模式的一种特殊情况组合,因此,丛集模式对应的流也符合聚集和发散模式流的范畴。对比上述4个典型地标之间各类模式的流量(表4表5),可以看出,丛集模式对不同地点聚集和发散模式的贡献程度有所不同。对于厦门大学而言,与其他3个地点之间的丛集模式流对发散模式流的贡献达到68%,这意味着如果设立对应的区间公交路线,可以有效解决近70%从厦门大学出发的出租汽车出行需求,可以有效避免设置较多的出租车等待区等交通服务配套设施。然而对于厦门站而言,与其余3个位置之间的丛集流模式仅对其聚集和发散模式贡献了19%,这意味着单纯依赖个别地区的区间公交,难以有效满足厦门站的出租汽车出行需求,仍然需要配套设置对应的交通服务配套资源。而仅依靠单一出行模式做出的决策可能会造成资源的浪费,难以支撑上述更为科学的决策结果。
图10 典型丛集-汇聚-发散空间组合模式剖析

Fig. 10 Typical clustering-aggregation-divergent spatial combination patterns

表4 丛集模式区域间出行量

Tab. 4 Inter-regional trips in clustering patterns (个)

厦门站 中山路 厦门大学 曾厝垵 丛集出发汇总
厦门站 0 69 51 31 151
中山路 31 0 81 71 183
厦门大学 36 118 0 63 217
曾厝垵 64 65 30 0 159
丛集到达汇总 131 183 111 134 -
表5 汇聚和发散模式出行量

Tab. 5 Trips in aggregation and divergent patterns (个)

厦门站 中山路 厦门大学 曾厝垵
汇聚模式 672 347 260 285
丛集到达占比/% 19 53 43 47
发散模式 811 455 318 293
丛集出发占比/% 19 40 68 54

5.3 不足与展望

本研究仅采用了一个工作日早晚高峰的轨迹数据来研究搭乘巡游车与网约车人群出行流模式差异,后续研究中可进一步分析出行模式在日间以及不同日期类型下的差异,例如工作日、周末与节假日间的差异;其次,可以考虑地理环境因素等对不同出行流模式的影响,例如针对特定的流模式结合出行区域土地利用、路网、POI、街景等数据进行影响因素分析,从而对人群出行模式进行预测以更好地指导多类型运营车辆协同发展;此外,考虑到我们使用的各种流模式挖掘算法虽比较成熟,但其在精度及时空复杂度方面还有一定的缺陷,后续我们计划对相关算法进行深入研究并进行优化;最后本文仅利用厦门市一个工作日早晚高峰时段的数据分析巡游车与网约车人群出行模式差异,所分析结果有多大代表性还需要进行进一步研究,后续计划研究对比不同城市人群出行模式在日间的稳定性,验证有关分析结果的通用性。

6 结论

本文利用厦门市出租汽车轨迹数据,采用地理流空间分析理论,对人群出行的整体随机性质进行了分析,基于流相似性度量识别并分析了丛集、汇聚、发散和社区4种典型模式的空间分布特征,并以厦门市为例,对比了基于巡游车和网约车两种车辆的人群出行模式。结果表明地理流空间理论能够系统性发现人群出行典型模式及混合模式,主要体现在:① 基于2类车辆的人群出行流在空间中呈现出显著的非随机特征;② 巡游车和网约车的典型模式在空间分布上有明显差别,网约车的有关模式分布范围更广,在厦门岛外各区中心及岛内东部软件园等区域附近较为突出,而巡游车主要分布在传统岛内知名城市地标附近;③ 同一区域内巡游车和网约车出行混合模式普遍存在,约占典型模式的四分之一左右,而且不同车辆类型的主要混合模式存在差异,协同考虑混合模式能够提高城市公共设施规划的针对性和科学性。
本文有关巡游车与网约车人群出行模式的分析结果对政府、出租车公司在开展城市交通优化、车辆调度效率提升等应用具有指导意义。此外,本文研究结果表明其理论框架和典型流模式类型能够更为系统的揭示人群出行流的空间特征,从而能够支撑更为科学、精准的应用决策。实际上,地理流空间理论对研究具有流特性地理现象(如货物运输、动物迁徙、信息传播等)的空间特征具有普适性,通过分析反映不同特征的流模式及其组合特征,能够全面地认识有关地理现象,作出更为科学的应用决策。
[1]
Yang J, Sun Y Z, Shang B W, et al. Understanding collective human mobility spatiotemporal patterns on weekdays from taxi origin-destination point data[J]. Sensors, 2019, 19(12):2812-2830. DOI:10.3390/s19122812

DOI

[2]
吴华意, 黄蕊, 游兰, 等. 出租车轨迹数据挖掘进展[J]. 测绘学报, 2019, 48(11):1341-1356.

[Wu H Y, Huang R, You L, et al. Recent progress in taxi trajectory data mining[J]. Acta Geodaetica et Cartographica Sinica, 2019, 48(11):1341-1356.] DOI:10.11947/j.AGCS.2019.20190210

DOI

[3]
Nie Y. How can the taxi industry survive the tide of ridesourcing? Evidence from Shenzhen, China[J]. Transportation Research Part C: Emerging Technologies, 2017, 79:242-256. DOI:10.1016/j.trc.2017.03.017

DOI

[4]
Qian X, Lei T, Xue J, et al. Impact of transportation network companies on urban congestion: Evidence from large-scale trajectory data[J]. Sustainable Cities and Society, 2020, 55:102053-102065. DOI:10.1016/j.scs.2020.102053

DOI

[5]
Erhardt G D, Roy S, Cooper D, et al. Do transportation network companies decrease or increase congestion[J]. Science advances, 2019, 5(5):eaau2670. DOI:10.1126/scia dv.aau2670

DOI

[6]
Shi C, Li Q, Lu S, et al. Exploring Temporal Intra-Urban Travel Patterns: An Online Car-Hailing Trajectory Data Perspective[J]. Remote Sensing, 2021, 13(9):1825-1840. DOI:10.3390/rs13091825

DOI

[7]
Liu X, Gong L, Gong Y, et al. Revealing travel patterns and city structure with taxi trip data[J]. Journal of Transport Geography, 2015, 43:78-90. DOI:10.1016/j.jtrangeo.2015.01.016

DOI

[8]
Zhong C, Schläpfer M, Müller Arisona S, et al. Revealing centrality in the spatial structure of cities from human activity patterns[J]. Urban Studies, 2017, 54(2):437-455. DOI:10.1177/0042098015601599

DOI

[9]
林鹏飞, 翁剑成, 刘文韬, 等. 基于多源数据的网络约租车与出租车运营特征分析[J]. 交通工程, 2020, 20(1):26-33.

[Ling P F, Weng J C, Liu W T, et al. Operational characteristics analysis of ride-hailing services and traditional taxis based on multi-source data[J]. Journal of Transportation Engineering, 2020, 20(1):26-33.] DOI:10.13986/j.cnki.jote.2020.01.005

DOI

[10]
胡松, 林鹏飞, 孙宇星, 等. 多场景模式下网约车与巡游车运营特征差异及调度策略研究[J]. 交通工程, 2021, 21(4):29-38.

[Hu S, Ling P F, Sun Y X, et al. Operation characteristics difference and scheduling strategy between E-hailing and traditional taxis in multi-scenario mode[J]. Journal of Transportation Engineering, 2021, 21(4):29-38.] DOI:10.13986/j.cnki.jote.2021.04.005

DOI

[11]
Wang D, Miwa T, Morikawa T. Comparative analysis of spatial-temporal distribution between traditional taxi service and emerging ride-hailing[J]. ISPRS International Journal of Geo-Information, 2021, 10(10):690-714. DOI:10.3390/ijgi10100690

DOI

[12]
Fang Z, Yang X, Xu Y, et al. Spatiotemporal model for assessing the stability of urban human convergence and divergence patterns[J]. International Journal of Geographical Information Science, 2017, 31(11):2119-2141. DOI:10.1080/13658816.2017.1346256

DOI

[13]
杨喜平, 方志祥, 赵志远, 等. 城市人群聚集消散时空模式探索分析——以深圳市为例[J]. 地球信息科学学报, 2016, 18(4):486-492.

DOI

[Yang X P, Fang Z X, Zhao Z Y, et al. Exploring urban human spatio-temporal convergence-dispersion patterns: A case study of Shenzhen city[J]. Journal of Geo-information Science, 2016, 18(4):486-492.] DOI:10.3724/SP.J.1047.2016.00486

DOI

[14]
Liu Y, Wang F, Xiao Y, et al. Urban land uses and traffic 'source-sink areas': Evidence from GPS-enabled taxi data in Shanghai[J]. Landscape and Urban Planning, 2012, 106(1):73-87. DOI:10.1016/j.landurbplan.2012.02.012

DOI

[15]
Liu Q, Wu Z, Deng M, et al. Network-constrained bivariate clustering method for detecting urban black holes and volcanoes[J]. International Journal of Geographical Information Science, 2020, 34(10):1903-1929. DOI:10.1080/1 3658816.2020.1720027

DOI

[16]
Guo X G, Xu Z J, Zhang J Q, et al. An OD flow clustering method based on vector constraints: A case study for Beijing taxi origin-destination data[J]. ISPRS International Journal of Geo-information, 2020, 9(2):128-149. DOI:10.3390/ijgi9020128

DOI

[17]
Gao X, Liu Y, Yi D, et al. A spatial flow clustering method based on the constraint of origin-destination points' location[J]. IEEE Access, 2020, 8:216069-216082. DOI:10.1109/ACCESS.2020.3040852

DOI

[18]
Song C, Pei T, Ma T, et al. Detecting arbitrarily shaped clusters in origin-destination flows using ant colony optimization[J]. International Journal of Geographical Information Science, 2019, 33(1):134-154. DOI:10.1080/1365 8816.2018.1516287

DOI

[19]
Liu Q, Yang J, Deng M, et al. SNN_flow: a shared nearest-neighbor-based clustering method for inhomogeneous origin-destination flows[J]. International Journal of Geographical Information Science, 2022, 36(2):253-279. DOI:10.1080/13658816.2021.1899184

DOI

[20]
Yao X, Zhu D, Gao Y, et al. A stepwise spatio-temporal flow clustering method for discovering mobility trends[J]. IEEE Access, 2018, 6:44666-44675. DOI:10.1109/ACCESS.2018.2864662

DOI

[21]
He B, Zhang Y, Chen Y, et al. A simple line clustering method for spatial analysis with origin-destination data and its application to bike-sharing movement data[J]. ISPRS International Journal of Geo-information, 2018, 7(6):203-219. DOI:10.3390/ijgi7060203

DOI

[22]
Zhu X, Guo D. Mapping large spatial flow data with hierarchical clustering[J]. Transactions in GIS, 2014, 18(3):421-435

DOI

[23]
项秋亮, 邬群勇, 张良盼. 一种逐级合并OD流向时空联合聚类算法[J]. 地球信息科学学报, 2020, 22(6):1394-1405.

DOI

[Xiang Q L, Wu Q Y, Zhang L P. An OD flow spatio-temporal joint clustering algorithm based on step-by-step merge strategy[J]. Journal of Geo-information Science, 2020, 22(6):1394-1405.] DOI:10.12082/dqxxkx.2020.190276

DOI

[24]
Zhu X, Guo D, Koylu C, et al. Density-based multi-scale flow mapping and generalization[J]. Computers, Environment and Urban Systems, 2019, 77:101359-101368. DOI:10.1016/j.compenvurbsys.2019.101359

DOI

[25]
Song C, Pei T, Shu H. Identifying flow clusters based on density domain decomposition[J]. IEEE Access, 2019, 8:5236-5243. DOI:10.1109/ACCESS.2019.2963107

DOI

[26]
Fang M, Tang L, Kan Z, et al. An adaptive Origin-Destination flows cluster-detecting method to identify urban mobility trends[J]. arXiv preprint arXiv:2106.05436

[27]
Tao R, Thill J C. A density-based spatial flow cluster detection method[C]. International Conference on GIScience Short Paper Proceedings. 2016, 1(1):288-291. DOI:10.21433/B3118mf4r9rw

DOI

[28]
Liu Y, Tong D, Liu X. Measuring spatial autocorrelation of vectors[J]. Geographical Analysis, 2015, 47(3):300-319. DOI:10.1111/gean.12069

DOI

[29]
Kan Z, Kwan M P, Tang L. Ripley's K-function for network-constrained flow data[J]. Geographical Analysis, 2021, 0:1-20. DOI:10.1111/gean.12300

DOI

[30]
Chen Y, Xu J, Xu M. Finding community structure in spatially constrained complex networks[J]. International Journal of Geographical Information Science, 2015, 29(6):889-911. DOI:10.1080/13658816.2014.999244

DOI

[31]
Guo D, Jin H, Gao P, et al. Detecting spatial community structure in movements[J]. International Journal of Geographical Information Science, 2018, 32(7):1326-1347. DOI:10.1080/13658816.2018.1434889

DOI

[32]
Gao Y, Li T, Wang S, et al. A multidimensional spatial scan statistics approach to movement pattern comparison[J]. International Journal of Geographical Information Science, 2018, 32(7):1304-1325. DOI:10.1080/13658816.2018.1426859

DOI

[33]
裴韬, 舒华, 郭思慧, 等. 地理流的空间模式:概念与分类[J]. 地球信息科学学报, 2020, 22(1):30-40.

DOI

[Pei T, Shu H, Guo S H, et al. The concept and classification of spatial patterns of geographical flow[J]. Journal of Geo-information Science, 2020, 22(1):30-40.] DOI:10.12082/dqxxk x.2020.190736

DOI

[34]
Shu H, Pei T, Song C, et al. L-function of geographical flows[J]. International Journal of Geographical Information Science, 2021, 35(4):689-716. DOI:10.1080/136588 16.2020.1749277

DOI

[35]
Fang Z, Shu H, Song C, et al. Identifying Aggregation Artery Architecture of constrained Origin-Destination flows using Manhattan L-function[J]. arXiv preprint arXiv:2108.09042,2021

[36]
Tao R, Thill J C. Spatial cluster detection in spatial flow data[J]. Geographical Analysis, 2016, 48(4):355-372. DOI:10.1111/gean.12100

DOI

[37]
Girvan M, Newman M E J. Community structure in social and biological networks[J]. Proceedings of the national academy of sciences, 2002, 99(12):7821-7826. DOI:10.1073/pnas.122653799

DOI

[38]
Newman M E J, Girvan M. Finding and evaluating community structure in networks[J]. Physical review E, 2004, 69(2):026113-026127. DOI:10.1103/PhysRevE.69.026113

DOI

[39]
付鑫, 孙茂棚, 孙皓. 基于GPS数据的出租车通勤识别及时空特征分析[J]. 中国公路学报, 2017, 30(7):134-143.

[Fu X, Sun M P, Sun H. Taxi commute recognition and temporal-spatial characteristics analysis based on GPS data[J], China Journal of Highway and Transport, 2017, 30(7):134-143.] DOI:10.19721/j.cnki.1001-7372.2017.07.017

DOI

[40]
Miller H J, Goodchild M F. Data-driven geography[J]. GeoJournal, 2015, 80(4):449-461. DOI:10.1007/s10708-014-9602-6

DOI

文章导航

/