Orginal Article

Temporal and Spatial Distribution of High Efficiency Passengers Based on GPS Trajectory Big Data

  • SUN Fei , 1, 3 ,
  • ZHANG Xia 2 ,
  • TANG Luliang , 1, * ,
  • LIU Zhang 1 ,
  • YANG Xue 1 ,
  • DONG Kun 4
Expand
  • 1. State Key Laboratory of Information and Engineering in Surveying, Mapping and Remote Sensing, Wuhan University, Wuhan 430079, China
  • 2. School of Urban Design, Wuhan University,Wuhan 430072, China
  • 3. Faculty ofInformation Engineering,China University of Geosciences, Wuhan 430074, China
  • 4. Space Star Technology CO., Ltd, Beijing 100086, China
*Corresponding author: TANG Luliang, E-mail:

Received date: 2014-05-16

  Request revised date: 2014-12-23

  Online published: 2015-03-10

Copyright

《地球信息科学学报》编辑部 所有

Abstract

The uneven spatial and temporal distribution of taxi passengers not only affects cabdrivers' income-but also has an effect on development and enhance of taxi efficiency.Since taxi is regarded as the supplementation of city public transit, it is important to improve the taxi efficiency.According to many former researches done on taxi driving strategies, the objects always aim to focus on the taxi driver, and researchers merely consider the effects of an empty taxi situation, which may affect the taxi efficiency due to the fuel consumption and time cost.In this paper, in order to improve taxis' profits and efficiency, we used the taxis' GPS big data to optimizethe evaluation model of taxi efficiency by taking its empty state into consideration, and proposed the concept of high efficiency passengers for the first time. Then, we defined and quantified the high efficiency passengers, and established a new spatial and temporal analysis method for high efficiency passengers. Finally, we extracted high efficiency passenger source information and its spatial and temporal distribution pattern from taxi driving routs.To further verify this method, we took Wuhan's taxi data asan example, extracted the high efficiency passenger source from different aspects, such as time, space and screening conditions, and found some distribution patterns of the city passengers through comparison and analysis.According to the distribution patterns, the quantity of high efficiency passengers is associated with traffic conditions, and most high efficiency passengers are distributed far from the downtown area.These facts have proved that the studies on temporal and spatial distribution of high efficiency taxi passengers can provide scientific evidence and references for improving cab drivers' income and taxi efficiency.

Cite this article

SUN Fei , ZHANG Xia , TANG Luliang , LIU Zhang , YANG Xue , DONG Kun . Temporal and Spatial Distribution of High Efficiency Passengers Based on GPS Trajectory Big Data[J]. Journal of Geo-information Science, 2015 , 17(3) : 329 -335 . DOI: 10.3724/SP.J.1047.2015.00329

1 引言

出租车作为城市公共交通的重要补充,由于客源在不同时段、不同城市区域分布不均衡,往往形成在上下班高峰时段“跑不动”、在非高峰时段“客源少”的现状[1],极大地影响了出租车作为城市公共交通补充作用的发挥。尤其是近年来ITS技术的发展,衍生出很多改善出租车效率的新举措,如电召,以及“快的”、“嘀嘀”等互联网打车软件,让乘客直接用手机就可以完成预约、打车、付费一系列流程。这虽然在一定程度上提高了出租车工作效率,但也导致了出租车拒载率的提升和打车更加困难[2],而国内外现有对出租车运营效率的研究仍仅限于表面[3]。因此,研究出租车客源不同时段的城市空间地理分布,对于提升出租车的工作效率,具有重要意义。本文以出租车GPS数据为研究对象,通过对出租车优质客源进行定义与量化,建立优质客源的时空分析方法,从出租车行驶轨迹中提取优质客源信息与时空分布规律,为提高出租车运营效率提供科学依据。

2 出租车驾驶行为的现状分析

现有国内外有关出租车驾驶行为的研究中,多以出租车司机为研究对象,如Bin Li等人通过研究大量出租车GPS数据,得到了出租车寻客的一些策略,并验证了主动寻客要比原地等客载客量更大[4]。Liang Liu对收益高的出租车司机与一般司机的驾驶行为进行了分析对比,分析出top drivers收益高的一些决定因素,发现top drivers的平均驾驶速度快,载客率高[5];Phithakkitnukoon等根据出租车载客信息,利用贝叶斯分类算法推断出在特定时间或地点的空驶出租车数量[6];Jing Yuan等利用GPS轨迹数据,对出租车载客、空驶、停车都进行了分析,提出停车位置探测算法,找出了出租车最可能停车的位置[7];史文欢在出租车跟踪的基础上提出一种出租车平均速度,该平均速度将作为交通流平均速度的估计值来估计市区路网的交通状态[8];辛飞飞等利用载客数据分析了出租车的路网时空分布[9];Gang Pan等利用出租车轨迹研究了城市土地利用的分类,发现出租车上下客位置的浮动与区域的土地利用类型相关[10];唐炉亮等利用FCD数据研究出租车司机路径选择的认知,以及类似蚂蚁的行为特征,提出了公众出行路径优化算法[11]。目前,利用GPS数据对载客驾驶信息的研究,大多是以出租车司机作为研究主体,通过出租车的驾驶行为来获取有价值信息,而很少有以客源作为研究目标的,并且缺乏对客源的分类,以及对出租车运营效率的研究。

3 优质客源事件的时空分析方法

3.1 优质客源的定义

出租车的运营效率很大程度上与出租车客源的分布有关,因此,要提高出租车的效率,就需了解给出租车带来高效益的客源分布。获取行驶里程长、行驶速度快、换乘时间间隔短的客源,才能最大程度上提高出租车的工作效率[12]。优质客源单程的里程长对应着单程的收入高,驾驶速度快对应着单位时间内司机收入高,由于还要考虑使出租车的寻客时间短,所以,必须考虑等待客源时间内的开销。据此,优质客源是指为出租车司机群体带来较高收入、送达效率较高且送达后寻客时间短的乘客。

3.2 优质客源的量化与评价模型

为进行优质客源准确的研究,首先对优质客源进行量化处理,本文根据上述优质客源描述的定义,将收入、效率和寻客时间纳入量化的因素,其中收入与里程和该城市的计价系数相关,效率跟收入与时间相关,寻客时间与空载载客状态相关。国内外对于此过程的现有研究仅局限于载客状态,以往的出租车效率量化模型只考虑了载客时单位里程与计价基数的影响,未考虑载客态成本因素,即只计算了出发点到目的地的单位时间收入。但由于空载状态的出租车没有收入,且伴随时间和损耗开销不断增加[13],所以,本文以浮动车数据,将出租车的载客状态(1)和相邻下一个空载状态(0)结合起来,作为一个研究对象(图1),首次引入空载状态的影响,以优化出租车运输效率的评价模型。
Fig. 1 Selection of the research object

图1 研究对象的选取

本文将空载影响因素纳入出租车送达效率的评价,可以用总利润来表达。总盈利I是出租车单次换乘的盈利为载客态的里程乘以计价系数再减去载客态与相邻空载状态的成本开销。
I = K 0 × L 1 - K 1 × L 1 + L 2 (1)
式(1)中,L1为载客态(1)的行驶里程;L2为相邻空载状态(0)的行驶里程;K0为某一时期该地的出租车计价标准;K1表示了出租车行驶单位里程的开销系数,包括油费和损耗。计算出总盈利后再引入时间因素,定义出租车的收入效率E,即单位时间内获得的盈利。
E = I T = I ( T 1 + T 2 ) (2)
式(2)中,I为换乘的盈利,T1为载客态的时间开销,T2为空载状态的时间开销(min)。

3.3 优质客源的选取

由于每个城市每个研究时段客源分布特征都大不相同,无法对优质客源进行准确的公式筛选,因此,引入一种动态变化的思想,类似于GIS时空变化的分析方式[14],提出了一种观察不同筛选条件下的优质客源分布动态变化的方法。首先,利用式(1)处理GPS数据得到每一段载客态与空载状态的行驶距离和行驶时间,然后,代入式(2)计算每次换乘的利润与效率。由于优质客源的选取应满足一定条件,所以,效率高的出租车换乘的收入与效率也均应满足一定的条件,即把盈利与效率作为客源优质性的衡量标准,因此,分别取利润与效率均满足统计值的Top30%、Top20%、Top15%的客源分布记录,观察不同分布记录中载客点分布的动态变化,并据此研究优质客源的分布规律。

3.4 优质客源的时空分布分析

利用筛选出的优质客源的属性信息,从不同角度研究其时空分布规律。
(1)不同选取条件的优质客源分布。从客源分布数据中分别选取占收入和效率不同比例的优质客源位置信息(如Top30%、Top20%和Top15%)来观察不同条件下的优质客源分布的动态变化规律,可以找到城市中的优质客源最集中区域,并且发掘出城市优质客源分布的普遍规律。
(2)优质客源的时间分布。利用频率直方图统计出某一选取条件(如Top30%)下优质客源在不同时段的分布,可观察不同时段的优质客源数量,了解城市居民的日常出行规律,反映不同时段的出租车运营效率。
(3)优质客源的空间分布。在某一选取条件(如Top30%)下,优质客源信息中按照时间信息筛选出不同时段的优质客源空间分布,进而了解不同时段的客源分布规律,寻找该时段的优质客源集中分布区域。

4 武汉市出租车GPS轨迹大数据的优质客源时空分布

4.1 数据处理

本文以武汉市区作为研究区域,采用了2009年3月9日60余辆出租车的GPS数据,包含车辆编号、经纬度、速度、道路方向、时间戳、载客状态(载客或空载)等信息。对原始数据的预处理流程为:
(1)依据车辆编号将数据以文本导出,对不同车辆的数据记录按照时间排序组织。
(2)利用轨迹数据中GPS数据点的经纬度与时间信息经过坐标换算,分别计算出每一段载客态与空载状态的行驶距离和行驶时间[15],并且记录载客与下客行为对应的地理位置与时刻。
(3)将第(2)步得到的距离统计数据代入利润和效率的计算公式(式(1)、(2))进行计算,得到所有换乘的客源分布信息(包括总利润、效率、载客点经纬度、上客时刻)。在公式计算中,考虑到出租车计价标准(K0),在计算中使用武汉市2009年出租车的收费标准:1 km内价格为3元,1~2 km价格为5元,2~3 km价格为8元,3 km以上每增加1 km为1.4元[16],考虑单位里程的开销(K1),了解到武汉市出租车2009年每公里油耗大概在0.5~0.7元间,结合出租车行驶过程中保养和损耗的开销,确定每公里开销为0.9元。

4.2 不同选取条件的优质客源分布

根据优质客源的选取条件,我们从客源分布数据中选取了均满足收入和效率的Top30%、Top20%、Top15%的客源位置信息,观察不同条件下优质客源分布的动态过程。利用ArcGIS中密度制图功能,得到优质客源密度分布与地理底图的叠加图(图2-4),由绿到红,颜色的加深代表着优质客源分布密度的增大,密度值表示落入某一圆形搜索区内的点所占的权重值,其大小与核密度搜索区半径有关[17]
Fig. 2 Spatial distribution of the Top30% high efficiency passengers

图2 Top30%优质客源空间分布

Fig. 3 Spatial distribution of the Top20% high efficiency passengers

图3 Top20%优质客源空间分布

Fig. 4 Spatial distribution of the Top15% high efficiency passengers

图4 Top15%优质客源空间分布

从不同比例界值筛选出的分布图(图2-4)可看出:
(1)优质客源大都是分布在居民活动较频繁,交通较发达的地区。这是因为居民聚集区域交通需求量大,交通发达地区出租车数量大。由Top30%到Top15%优质客源的分布范围逐渐减小且分布变得分散,这是因为优质客源量与出租车效率筛选比例成正比。
(2)交通需求量最多的地域优质客源反而不多。这是因为其多集中于商业区,出租车司机的竞争大,交通又较为拥堵,因此,出租车运营效率偏低[18]。而优质客源在交通状况好的区域分布明显,并且都远离市中心呈分散分布。
(3)通过不同界值分布的动态变化可看出,三环线附近在这几个筛选条件下都有优质客源的分布,并且越优质的客源在三环线分布的越明显。这是由于当时武汉的三环线一些路段刚刚建成,路况好、车流量不多[19],且三环线附近的客源行驶里程都较远,从而给司机带来可观的单程收入。
(4)汉阳地区的沌口也是优质客源的集中点,这是由于该地区虽然人口不密集,但其作为武汉市新兴的经济开发区,汇集了许多大型企业(如东风汽车、制衣、制药与食品企业),并且社会活动多,因此客源量大[20],又因为远离市中心所以交通路况好,故给出租车司机带来了较高收益。

4.3 优质客源的时间分布

为了研究优质客源在时间上的分布规律,把Top30%的客源数据作为研究对象,利用直方图统计出这些优质客源上客点在时间上的分布情况(图5)。
Fig. 5 Temporal distribution of the Top30% high efficiency passengers on Mar.9

图5 3月9日Top30%优质客源时间分布

图5的直方图可得出:
(1)0-5 时优质客源逐渐减少。这是因为此时段居民出行量少,客源数量减少导致优质客源也相应减少。
(2)5-8 时优质客源数量递增。这是因为该阶段居民出行量增加,并且由于交通状况比较通畅,因此,优质客源呈上升趋势。
(3)8-17时之后均有一个递减的趋势。这说明此时正值上下班高峰期,导致交通状况开始拥堵,因此,出租车运行效率降低,优质客源减少。
(4)晚上20 时之后又开始逐渐递增。这是因为在该时间段内居民出行量虽然开始减少,但是交通状况有所改善,出租车运行效率增加,故优质客源开始增加。
(5)深夜23-1时期间优质客源量较大。这是因为此时的大部分公共交通都已经停运,出租车作为仅剩的公共交通载客量就大量增加,而且此时段内拥堵路段少,出租车运行效率高,故优质客源数量增加。

4.4 优质客源的空间分布

为了研究优质客源在不同时段上的空间分布规律,以Top30%的客源数据为研究对象,分成几个不同的时段进行观察对比,本文选择了0-7 时、7-9 时、9-11 时、11-13 时、13-15 时、17-19 时、19 时以后的几个时段优质客源分布进行对比分析(图6)。
Fig. 6 Spatial distribution of high efficiency passengers at different time periods

图6 不同时段的优质客源空间分布

图6可得到优质客源空间分布规律:
(1)7 时以前优质客源大都分布在三环线以内,并集中在长江大桥和珞喻路。这是因为此时市内交通较通畅,该时段营业场所多为酒店和宾馆,而珞喻路分布着较多的酒店。
(2)7-9 时处于上班高峰期,出行量增加,优质客源也相应增加,但是分布较分散。9时以后优质客源开始减少,这是因为居民出行减少,直到中午优质客源才开始增加且开始分布在三环线附近。
(3)13-15 时优质客源分布密集且多集中于居民区(如汉口江汉区),这是因为此时居民出行量少,居民区附近交通通畅,而商业区周围交通依然拥堵。
(4)17-19 时是下班晚高峰,此时的优质客源数量大幅减少,且分散分布在离市中心较远的地区。
(5)19 时以后居民外出活动增多,因此,优质客源仍分布与偏离市中心较远的外围地带,但在21~24 时时,由于此时的出行量减少,交通条件改善,优质客源开始呈聚集分布。

5 结论

优质客源分布研究对出租车作为城市公共交通重要补充作用的效益提升有重要意义。本文以改善和提高出租车效益为出发点,提出了出租车优质客源的评价与量化方法,建立了优质客源的时空分布分析方法,并以武汉市为例,从出租车GPS行驶轨迹大数据中提取优质客源信息与优质客源的时空分布规律,为提高出租车运营效率提供了科学依据。

The authors have declared that no competing interests exist.

[1]
陈盛,陆建. 出租车交通调查分析及对策[J].交通标准化,2003(5):41-44.

[2]
俞康. 打车软件结伴出租车像是“露水情缘”[N].中华工商时报,2014-2-28(D02).

[3]
柳妍. 基于信息技术下的出租车营运研究[J].商业文化,2009(10):205-206.

[4]
LI B, Zhang D Q, Sun L, et al.Hunting or Waiting? Discovering Passenger-Finding Strategies from a Large-scale Real-world Taxi Dataset[C].8th IEEE International Workshop on Managing Ubiquitous Communications and Services,2011:63-68.

[5]
Liu L, Andris C, Ratti C.Uncovering cabdrivers’ behavior patterns from their digital traces[J]. Computers, Environment and Urban Systems,2010,34(6):541-548.

[6]
Phithakkitnukoon S,Veloso M, Bento C, et al. Taxi-aware map:Identifying and predicting vacant taxis in the city[C].Proceedings of the First international joint conference on Ambient intelligence,2010(1):86-95.

[7]
Yuan J, Zheng Y, Xie X.Driving with Knowledge from the Physical World[C]. In Proc. KDD 2011, 2011:316-324.

[8]
史文欢,孔庆杰,刘允才.基于出租车跟踪的市区路网交通状态估计方法[J].交通信息与安全,2009(5):29-32.

[9]
辛飞飞,陈晓洪,林航飞.浮动车数据路网时空分布特征研究[J].中国公路学报,2008,21(4):105-110.

[10]
Pan G, Qi G D, Wu Z H, et al.Land-use classificationusing taxi GPS traces[J]. IEEE Transactions On Intelligent Transportation System,2013,14(1):113-123.

[11]
唐炉亮,常晓猛,李清泉,等.基于蚁群优化算法与出租车GPS数据的公众出行路径优化[J].中国公路学报,2011,24(2):89-95.

[12]
宋炜.晒晒出租车的收入账[N].榆林日报,2012-03-27(003).

[13]
慕晨,宣慧玉,张发.出租车运营中空车行为的仿真研究[J].系统工程学报,2008,23(5):554-559.

[14]
鲍文东. 基于GIS的土地利用动态变化研究[D].济南:山东科技大学,2007.

[15]
韩忠民. 知经纬度计算两点精确距离[J].科技传播,2011(11):196-197.

[16]
吴欣. 武汉出台的士计费办法,3块钱可打的[N].楚天都市报,2003-05-26(A09).

[17]
刘艳,马劲松. 核密度估计法在西藏人口空间分布研究中的应用[J].西藏科技,2007(4):6-8.

[18]
郭雪婷,秦艳丽,雷震.基于出租车GPS数据的城市道路拥堵判别[J].交通信息与安全,2013,31(5):140-144.

[19]
梅军.武汉三环91公里今日全线画圆[N]. 楚天都市报,2010-12-30(009).

[20]
何人民.武汉沌口经济开发区工业产值首破千亿元[N].中国工业报,2009-12-31(A04).

Outlines

/