A Method of Deriving the Boarding Station Information of Bus Passengers Based on Comprehensive Transfer Information Mined from IC Card Data

  • SONG Xiaoqing , 1 ,
  • FANG Zhixiang , 1, * ,
  • YIN Ling 2 ,
  • LIU Lihan 1 ,
  • YANG Xiping 1 ,
  • Shih-Lung Shaw 1, 3
Expand
  • 1. State Key Laboratory of Information Engineering in Surveying, Mapping, Remote and Sensing, Wuhan University, Wuhan 430079, China
  • 2. Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China 3. Department of Geography, University of Tennessee, Knoxville 379960925, USA
*Corresponding author: FANG Zhixiang, E-mail:

Received date: 2015-08-05

  Request revised date: 2015-11-14

  Online published: 2016-08-10

Copyright

《地球信息科学学报》编辑部 所有

Abstract

Due to the lack of bus operating data, some scholars put forward a method, which uses the orthogonal transfer information between different bus routes, to derive the boarding station information of bus passengers. However, a lot of the bus single trips lack the orthogonal transfer information in practical applications, which lead to the difficulty in deriving the boarding station information of bus passengers. To solve this issue, based on the existing research, this paper put forward a method for deriving the boarding station information of bus passengers based on the comprehensive transfer information mined from IC card data. This method uses the comprehensive transfer information between the subways and buses information mined from the IC card data to confirm the driving direction of buses, and then, divide the passengers of the same single trip into groups. These groups would match the corresponding boarding stations more accurately. We fully take use of the orthogonal transfer information and non-orthogonal transfer information between different bus routes and the transfer information between subways and buses to recognize the fiducial groups and their boarding station information, then, we use the minimum error rule to derive the pending groups′ boarding stations. Using the transfer information to confirm the driving direction could enlarge existing research on how to determine a single trip's driving direction, which makes the method of driving the boarding station information of bus passengers more complete and scientific. In the end, through example analysis, this study greatly increases the number of fiducial groups. This method has a higher reliability and accuracy compared to the method which only uses the orthogonal transfer information between different bus routes to derive the boarding station information of bus passengers. In this study, we use the transfer information to confirm the driving direction of some single trips with the absence of the location data. In addition, we use the transfer information mined from three transfer approaches to derive the boarding station information of bus passengers as well as put forward a series of constraint rules to make the result more accurate and feasible, which are considered to be the most significant innovation and contribution. Deriving the boarding station information of bus passengers is the up-front work in getting the bus passengers' demands and the bus service ability data, which has a guiding significance to urban planning.

Cite this article

SONG Xiaoqing , FANG Zhixiang , YIN Ling , LIU Lihan , YANG Xiping , Shih-Lung Shaw . A Method of Deriving the Boarding Station Information of Bus Passengers Based on Comprehensive Transfer Information Mined from IC Card Data[J]. Journal of Geo-information Science, 2016 , 18(8) : 1060 -1068 . DOI: 10.3724/SP.J.1047.2016.01060

1 引言

公交IC卡(Integrated Circuit Card)在中国许多大城市得到了广泛使用,城市公交IC卡数据具有真实、准确、时效性强、样本量大等特点,能够真实地反映城市公交运营情况和城市居民公交出行特 征[1]。从IC卡数据中提取城市公交客流时空分布信息已成为一种重要的公交数据采集方法[2]。海量的公交IC卡数据为公交出行分析[3]、公交路线与站点规划[4]、评价与服务[5]提供了可行的数据支撑。目前,只有少数城市的IC卡可以记录公交乘客的上下车站点信息,大多数城市的IC卡只记录了车辆编号和刷卡时间等简单信息,而没有记录乘客上车站点、下车站点以及换乘站点等完整信息,对公交分析与优化造成较大困难。因此,如何利用这些不完整的IC卡数据推算公交乘客的上下车站点信息,对公交进行分析与优化是一个棘手的问题。为此,学者们展开了相关研究:于勇、戴霄等[6-8]对IC卡数据进行聚类分析,将聚类分析结果与公交运营资料(包括公交线路走向、站点布局、调度时刻表等公交运营信息)所推算出的车辆到站时间进行时间匹配,确定持卡乘客的上车站点;陈绍辉、徐建闵等[9-10]根据公交车辆GPS数据和公交IC卡数据分别推算站点间运行时间,建立匹配约束规则完成上车站点匹配。
然而,由于某些城市的公交车辆还没有配置车载GPS,而且受路况影响,车辆并非完全按照公交运营时刻表运行,这使上述方法得不到实施或者匹配误差较大。因此,张颂等[11]提出在仅有公交IC卡数据的情况下,利用乘客在公交线间的正交换乘信息(2条公交线路之间有且仅有1个相同的站点提供乘客换乘)推算乘客的上车站点。但是,该方法在实际运用中容易出现单个班次无正交换乘信息因而无法匹配上车站点的情况。因此,本文在此基础上提出一种基于IC卡综合换乘信息(公交线间的正交和非正交换乘信息、地铁和公交线间的换乘信息)的公交乘客上车站点推算方法,以此解决只利用正交换乘信息而存在的某些单个班次仍无法进行站点匹配的困难,该方法对数据完整性要求不高,适用性更广、更合理。

2 基于IC卡综合换乘信息的公交 乘客上车站点推算方法

2.1 数据准备及概念定义

本文使用了2类数据进行推算:(1)核心数据,包括IC卡刷卡数据(路线、闸机编号和刷卡时间等)、公交地铁路线以及站点的地理矢量数据;(2)补充数据,包括公交收费制度、公交时速报道信息等。从补充数据中可得到本文推算方法中所需的判断乘客是否换乘的换乘时间 T tr ,以及公交车的行驶速度 V
定义目标公交线为研究对象,某一条公交线(如11路公交线);目标公交车为目标公交线上的某一辆公交车(如11路公交线上刷卡闸机号为01的公交车);班次是指公交车从公交线的始发站A驶达终点站B或者从公交线的终点站B驶达始发站A,1个往返班次记为2个班次,一辆公交车一天通常行驶若干个班次。
本文涉及的换乘方式主要有3种:地铁线换乘公交线(图1(a)),公交线间的正交换乘(图1(b)),公交线间的非正交换乘(图1(c))。定义正交换乘为2条公交线路之间有且仅有1个站点提供下车乘客换乘另1条公交线,如图1(b)所示;非正交换乘为2条公交线路之间有2个或者多个站点提供下车乘客换乘另1条公交线,如图1(c)所示。若某乘客在时间上有相邻两条不同路线的刷卡记录,前一条记录的时间为 t 1 ,后一条记录的时间为 t 2 ,若 | t 2 - t 1 < T tr T tr 为换乘时间),则该乘客有一次换乘。综合换乘信息包括:乘客在公交线间的正交和非正交换乘信息、乘客在地铁和公交线间的换乘信息。
Fig. 1 Three ways of transfering to the target bus line

图1 换乘到目标公交线的3种换乘方式

2.2 算法流程

图2为基于IC卡综合换乘信息的公交乘客上车站点推算方法的流程,具体包括6个步骤:
Fig. 2 The process of confirming the boarding stations of bus passengers

图2 公交乘客上车站点的推算流程

(1)选取某一条公交线作为目标公交线、该公交线上的某一辆公交车作为目标车,对目标线的上行路线站点与下行路线站点按站点顺序分别编号(从1开始的正整数)。
(2)区分目标车的班次。对该车闸机一天的刷卡记录按刷卡时间进行排序,分析记录在时间上的分布规律,结合该公交车一个班次的行驶时间 T sg 以及司机到达首末站之后的休息时间 T R (司机休息期间该车闸机不产生刷卡记录),将一天的记录分布到几个班次上[11]
(3)判断目标车在各班次的行车方向。利用部分换乘信息依据2.3节识别班次方向的规则判断各班次是上行方向还是下行方向。
(4)同班次内乘客分组。对同一个班次内的乘客按刷卡时间分组。分组思想:①从地理矢量数据中查找目标线上相邻站点间的最小站距 L min ,根据公交车的行驶速度 V ,计算目标车在相邻站点间的最短行驶时间 T min T min = L min / V ),将其设为分组的阈值;②在刷卡时间上相邻的2个乘客,前一个乘客的刷卡时间为 t 1 ,后一个乘客的刷卡时间为 t 2 ,若 | t 2 - t 1 | < T min ,则将这2个乘客划为一组,视为在同一个站点上车,对分组结果按时间顺序编号(从1开始的正整数),不同班次的分组结果分别编号。
(5)确定分组结果中的基准组及其上车站点。基准组指乘客分组后通过正交换乘、非正交换乘、地铁换乘公交3种换乘信息可以确定上车站点的那部分乘客组。基准站为基准组对应的上车站点。根据2.4节识别分组结果的基准组及其上车站点。
(6)匹配待定组。待定组是指经过基准组识别之后剩余的乘客组。待定站为目标公交线上基准站之外的公交站点。对比组间的刷卡时间间隔与站点间标准行程时间的偏差,利用2.5节最小偏差规则将偏差最小的待定站匹配到待定组[11]

2.3 判断各班次的行车方向

判断班次的行车方向是匹配上车站点不可或缺的一步,确定站点的序号(确定行驶方向之后站点的编号)。基于换乘信息判断班次行车方向的具体判断过程如下:
(1)分别对目标线的上行路线站点、下行路线站点按站点顺序依次编号。
(2)获取目标车所有班次的正交换乘信息和从地铁换乘到目标车乘客的换乘信息,初步得到部分换乘乘客的上车站点。如图1所示,从地铁换乘到目标车的乘客的上车站点为距离该地铁站最近的公交站点,正交换乘到目标车的乘客上车站点为正交换乘站点,依此识别出这2部分乘客的上车站点。
(3)对比同班次中2个(或以上)乘客的上车时间以及上车站点对应的上行编号、下行编号,识别班次的行车方向。表1是初步识别上车站点得到的部分换乘乘客的上车信息。乘客1的上车时间记为 T 1 ,上车站点在上行路线中的编号记为 U 1 ,在下行路线中的编号记为 D 1 ;乘客2的上车时间记为 T 2 ,上车站点在上行路线中的编号记为 U 2 ,在下行路线中的编号记为 D 2
Tab. 1 The boarding station information of some passengers in the same single trip (initially)

表1 同班次中部分乘客上车站点信息(初步)

乘客编号 卡编号 上车站点 上行编号(U) 下行编号(D) 上车时间(T) 班次号
1 0235***91 科技园② 38 16 07:53:03 1
2 3243***02 竹园宾馆① 13 41 08:51:53 1
T 1 < T 2 时,若 U 1 < U 2 D 1 > D 2 ),则目标车在该班次的行驶方向为上行方向,上车站点的序号为上行编号;若 U 1 > U 2 D 1 < D 2 ),则目标车在该班次的行驶方向为下行方向,上车站点的序号为下行编号。
T 1 > T 2 时,若 U 1 < U 2 D 1 > D 2 ),则目标车在该班次的行驶方向为下行方向,上车站点的序号为下行编号;若 U 1 > U 2 D 1 < D 2 ),则目标车在该班次的行驶方向为上行方向,上车站点的序号为上行编号。奇数号班次行车方向相同,偶数号班次行车方向相同,奇数号班次与偶数号班次行车方向相反。依据以上规则识别出目标车所有班次的行车方向及站点序号。
表1,T1<T2且 U 1 > U 2 D 1 < D 2 ),目标车在第1班次的行驶方向为下行,站点序号为下行编号。
本文在判断班次行车方向的方法上具有一定的适用性,要求目标车至少有1个班次有2个(或以上)从其他公交线正交换乘到目标车或者从地铁换乘到目标车的乘客。

2.4 确定分组结果中的基准组

确定基准组的步骤为:
(1)获取各个班次中,从地铁换乘到目标车以及从其他公交线的公交车换乘到目标车的乘客换乘信息。
(2)判断基准组及其对应的上车站点。
利用图1中3种换乘方式的乘客的换乘信息判断基准组及其对应的上车站点序号。利用3种换乘方式判断基准组及其上车站点的过程如下:
①从地铁换乘到目标公交车:如图1(a)所示,从地铁出站换乘到目标车的乘客的上车站点为距离地铁站最近的公交站点,可以确定唯一的换乘站点。图中距离地铁站Sm3最近的换乘站点为St3,从地铁站Sm3换乘到目标公交车的乘客所在的组为基准组,St3为基准站。
②从其他公交线正交换乘到目标公交车:如图1(b)所示,从其他公交线正交换乘到目标车的乘客的上车站点为正交换乘站点。图中从Se3换乘到目标公交车的乘客所在的组为基准组,St4为基准站。
③从其他公交线非正交换乘到目标公交车:如图1(c)所示,2条公交线间的换乘站点不止一个,目标公交线的St2和St4站点都是可能的上车站点。班次号记为 tr ,换乘站点序号记为 i ,乘客分组号记为 j ,匹配约束规则:
当某个换乘乘客有且仅有一个 i j 时,该 i 所对应的站点即为该组乘客(基准组)的上车站点(基准站)。表2是目标车辆在第1班次某2个乘客的换乘站点信息。这2个乘客可能的换乘站点有多个,乘客1的可能换乘站点序号都大于或等于分组号,无法确定准确的上车站点;乘客2有且仅有一个可能的换乘站点序号大于或等于分组号,可确定该乘客的上车站点是14号站点。
Tab. 2 Transfer station information of some passengers (partial information)

表2 乘客的换乘站点信息(部分)

乘客编号 卡编号 换乘前路线 班次号(tr 分组号(j 可能的换乘站点序号(i
1 0203***54 80路 1 5 8、9、10、11、12
2 3266***86 74路 1 13 9、10、14
tr 1 = tr 2 j 1 = j 2 ,有且仅有一个 i 1 = i 2 时,该 i 所对应的站点即为该组乘客(基准组)的上车站点(基准站)。表3是目标车辆在第2班次某2个乘客的换乘站点信息。乘客1与乘客2的班次号相等、分组号相等(在同一站点搭乘目标车),且乘客1与乘客2可能的换乘站点序号都有15,可确定上车站点是15号站点。
Tab. 3 Transfer station information of some other passengers (partial information)

表3 乘客的换乘站点信息(部分)

乘客编号 卡编号 换乘前路线 班次号(tr 分组号(j 可能的换乘站点序号(i
1 3252***49 211路 2 12 13、14、15
2 0208***83 82路 2 12 15、16

2.5 匹配待定组

本文参考文献[11]提出的剩余组上车站点的匹配方法进行待定组匹配。识别完基准组之后剩余的乘客组视为待定组,比较待定组和基准组间的刷卡时间间隔与待定站和基准站间的行驶时间,计算二者的差值,将时间偏差最小的待定站匹配到待定组,称为最小偏差规则。按最小偏差规则完成剩余待定组的上车站点匹配,如图3所示。
Fig. 3 The process of deriving the boarding stationsfor the pending groups

图3 待定组上车站点的匹配过程

参照图3, S 1 为始发站,以第一个基准组和最后一个基准组为界,将待定组分为3个组群。若只有一个基准组,则分为2个组群(无组群二)。Tm,n为组n的第一个乘客的刷卡时间与组m的最后一个乘客的刷卡时间的差值(n>m);ta,b为公交车在站点ab间的标准行驶时间,ta,b =Lab/vLabab站距,v为时速报道信息中的公交车时速)。
由于某些站点无乘客刷卡上车,待定组数量小于或者等于待定站的数量。3个组群中若待定组的数量与所对应的待定站的数量相等,则一一对应匹配;若待定组的数量小于待定站的数量,匹配组i时,RL)代表乘客组i的右(左)相邻基准组,rl)代表待定站右(左)相邻基准站,Ti,RTL,i)代表组i与右(左)相邻基准组的刷卡时间间隔,tk,rtl,l+k)代表待定站与右(左)相邻基准站间的标准行驶时间。则匹配过程如下:
(1)若组i位于第一个组群(图3),组群1有N1个待定站,则计算yk=|Ti,R-tk,r |,k=1,…, N1。取最小yk所对应的k,组i的上车站点为Sk
(2)若组i位于中间组群(图3),组群2有N2个待定站,计算yk=|TL,i -tl,l+k|+|Ti,R -tl+k,r |,k=1,…,N2。取最小yk所对应的k,组i的上车站点为Sl+k
(3)若组i位于最后一个组群(图3),匹配算法和组群1相似,匹配顺序和组群1相反。

3 实例分析

本文所涉及的基础数据有:
(1)深圳市2011年8月IC卡数据以及公交地铁路线、站点的地理矢量数据。IC卡数据的字段包括:IC卡卡号、刷卡日期、刷卡时间、刷卡闸机编号、交易类型(地铁进站、地铁出站、公交车刷卡)、实价、原价、路线名称,如表4所示。公交和地铁的地理矢量数据:公交线与地铁线的空间数据与属性数据;公交站点与地铁站点的空间数据与属性数据。
Tab. 4 Shenzhen IC card data record (partial information)

表4 深圳市IC卡数据记录(部分)

卡编号 交易时间编码 闸机编号 交易类型 实价/分 原价/分 路线 站点
0209***79
0209***85
3236***68
20110801101456
20110801082026
20110801081948
220001279
268025118
268012115
31
21
22
120
0
270
200
0
300
836路
1号线
1号线

桃园站
车公庙站

注:交易时间“20110801101456”表示“2011年8月1日10时14分56秒”;交易类型“31”表示公交车上车刷卡,“21”表示地铁入站,“22”表示地铁出站

(2)深圳市公共交通收费制度信息以及深圳市2011年下半年轨道交通二期工程开通后的公交时速报道信息等,如公共交通收费制度给出公交车与公交车、公交车与地铁之间的换乘优惠制度。公交时速报道信息表明,深圳市2011年下半年轨道交通二期工程开通后,高峰期车速提高至28 km/h。这部分数据具有现实意义,可帮助提高研究结果的准确率。
将这些数据存储到数据库SQL Server 2008中,IC卡原始数据中有重复及代刷记录(对于同一张IC卡,连续刷卡时间间隔非常小(<=30 s)即视为代刷记录[12-13]),构建核心数据的数据仓库[8-9, 14],利用数据库查询检索功能将原始IC卡数据中的重复及代刷记录剔除[15]
实验数据是深圳市2011年8月1日(周一)的IC卡数据,随机选取深圳市10条公交线,每条公交线随机选取一辆公交车作为研究对象,统计不同换乘方式识别出的基准组数量,如表5所示。最后,实验以深圳市113路公交线为例,给出各班次基准组的识别结果(表6)以及站点匹配的结果。以此验证本文方法的可行性和适用性。
Tab. 5 The statistics of the result for determining the fiducial groups of different routes

表5 不同路线识别基准组结果统计表

线路名 班次数 基准组数量 正交换乘基准组数量 非正交换乘基准组数量 地铁换乘目标车基准组数量
79路 4 13 2 2 9
101路 3 6 0 1 5
113路 6 18 5 3 10
223路 10 19 7 2 10
311路 6 11 4 0 7
320路 6 23 10 6 7
323路 4 12 4 4 4
338路 6 19 4 3 12
383路 8 15 2 4 9
395路 4 13 5 1 7
Tab. 6 The result for determining the fiducial groups of bus line 113

表6 113路识别基准组结果

班次数 班次号 本研究确定的基准组数量 本研究确定的
基准组组号
正交换乘确定的
基准组数量
正交换乘确定的
基准组组号
6 1 5 13、15、34、39、40 2 15、39
2 2 11、12 1 11
3 3 11、21、25 0
4 3 17、26、28 1 28
5 3 18、24、27 0
6 2 24、25 1 24
表5中基准组数量是后3列数据的和,是本文提出的3种换乘方式识别之后得到的基准组数量和。与正交换乘数据进行对比,结果表明,得到的基准组数量比只利用正交换乘得到的基准组数量多,这有助于提高站点匹配结果的准确率。并且,公交路线的某些班次不存在正交换乘的乘客,且这种情况比较常见(如表6第3班次、第5班次),只利用正交换乘信息推算公交乘客的上车站点的方法具有很大的局限性。
将113路公交线视为目标公交线,随机选取113路闸机编号为231010944的公交车作为目标公交车,该车一天有568名乘客,571条刷卡记录。经过调查, T sg 为90 min, T R 为10 min,深圳市收费制度中规定乘车换乘时间 T tr 为90 min,为提高精度,研究中设 T tr 为40 min[16-18]。班次识别后,一天的刷卡记录分为6个班次,如图4所示(相同颜色的记录为同一个班次)。各班次内乘客分组,以班次1为例,如图5所示(相同颜色的记录为同一个组,视为在同一站点上车)。
Fig. 4 Dividing the bus passengers into groups of six single trips

图4 刷卡乘客分成6个班次

Fig. 5 Dividing first single trip's passengers into several groups

图5 班次1乘客分组

表6为利用换乘信息确定的基准组数量及其乘客组号,由待定组的匹配过程可知,当2个基准组之间的待定组数量与对应的待定站数量相等时,待定组与待定站一一对应,这类待定组等同于基准组。与只利用正交换乘相比,本文可使准确确定上车站点的乘客组数占总乘客组数的比值大大提高,班次1提高了53.7%,班次2提高了4.3%,班次3提高了48.0%,班次4提高了8.6%,班次5提高了16.7%,班次6提高了3.2%,这使站点匹配的准确率有所提高。表6中第3、5班次的正交换乘确定基准组的数量是0,因此,只利用正交换乘无法得到这2个班次的站点匹配结果。
经过上述推算,图6给出本方法乘客上车站点的匹配结果,该方法具有更高的可行性。
结合图4图5图6,班次1和班次6刷卡记录相对密集,尤其第1班次有乘客上车的站点最多。深圳市的交通高峰期主要集中在上班族的上下班时间点,早晚高峰一般为上午7-9时(班次1)和下午17-20时(班次6),中午大多数的上班族在工作单位就餐。此外,研究中发现第1班次第6组和第6班次第14组、26组的乘客数量较多。经过站点匹配和实地调查发现,第1班次第6组乘客的上车站点是蛇口沃尔玛,该站点周边以居住区为主,上班高峰期该站上车人数较多。而第6班次14组和26组乘客上车站点分别为上海宾馆西、深大北门,这2个站点周边以工作区为主,下班高峰期上车人数较多。这些研究分析结果与深圳市居民工作日的出行通勤规律相符,具有较高的可信度。
Fig. 6 The results of deriving the boarding stations

图6 上车站点推算结果

4 结语

准确推估公交车乘客的上车站点是获取公交客流量、公交服务能力等信息的前提。在缺少定位数据的情况下,本文提出了一种基于IC卡低成本海量数据综合换乘信息的公交乘客上车站点推算方法。该方法充分利用从IC卡数据中挖掘出的地铁与公交、公交与公交之间的换乘信息识别班次行驶方向、确定基准组上车站点,其优点在于:(1)在缺少定位数据的情况下,利用换乘信息识别班次行车方向,适用性广;(2)基于3种换乘方式得到的换乘信息推算公交乘客的上车站点,并提出了一系列的匹配约束规则,与以往研究相比,具有更高的可行性和准确率,对公交线网以及城市规划具有重要的使用价值。同时,该推算公交乘客上车站点的方法具有一定的局限性。在判断目标车各班次行驶方向以及确定基准组的过程中均用到了换乘信息,故该方法不适用于无换乘乘客的车辆,对于此类公交车的乘客上车站点的推算还有待于深入研究。

The authors have declared that no competing interests exist.

[1]
Attewell P B, Yeates J, Selby A R.Soil movements induced by tunneling and their effects on pipelines and structures[M]. London: Blackie and Son Ltd, 1986.

[2]
Bagchi M, White P R.What role for smart-card data from bus systems[J]. Proceedings of the Institution of Civil Engineers Municipal Engineer, 2004,157(1):39-46.

[3]
闫磊,李津.基于公交IC卡数据的乘客出行时空推算研究[D].长春:吉林大学,2012.

[ Yan L, Li J.The calculate research on trip temporal of passenger based on the data of bus intelligent card[D]. Changchun: Jinlin University, 2012. ]

[4]
Pelletier M P, Trépanier M, Morency C.Smart card data use in public transit: A literature review[J]. Transportation Research Part C, 2011,19(4): 557-568.Smart card automated fare collection systems are being used more and more by public transit agencies. While their main purpose is to collect revenue, they also produce large quantities of very detailed data on onboard transactions. These data can be very useful to transit planners, from the day-to-day operation of the transit system to the strategic long-term planning of the network. This review covers several aspects of smart card data use in the public transit context. First, the technologies are presented: the hardware and information systems required to operate these tools; and privacy concerns and legal issues related to the dissemination of smart card data, data storage, and encryption are addressed. Then, the various uses of the data at three levels of management are described: strategic (long-term planning), tactical (service adjustments and network development), and operational (ridership statistics and performance indicators). Also reported are smart card commercialization experiments conducted all over the world. Finally, the most promising research avenues for smart card data in this field are presented; for example, comparison of planned and implemented schedules, systematic schedule adjustments, and the survival models applied to ridership.

DOI

[5]
吕慎,田锋,王京元.基于DEA的接运公交运营绩效评价[J].公路交通科技,2010,27(8):96-102.lt;p>为了从换乘者角度评价接运公交的运营绩效,并根据评价结果进行运营管理的优化,以接运公交高峰小时发车数和同步发车数为输入指标,以接运公交实载率和换乘乘客平均候车时间为输出指标建立了DEA综合评价模型。利用C<sup>2</sup>R模型研究接运公交运营绩效的有效性和依据DEA综合评价模型的投影理论分析接运公交输入剩余和输出亏空,并将C<sup>2</sup>R模型与C<sup>2</sup>GS2模型相结合研究接运公交的规模收益。结果表明,目前大部分接运公交运营绩效处于非DEA有效状态,导致该结果的主要因素是其运营调度与轨道交通同步性水平偏低,因此运营管理优化首要目标是实现接运公交与轨道交通的同步运营,并以此为目标优化接运公交高峰小时发车数。</p>

DOI

[ Lv S, Tian F, Wang J Y.Assessment of performance of feeder buses based on DEA technique[J]. Journal of Highway and Transportation Research and Development, 2010,27(8):96-102. ]

[6]
于勇,邓天民,肖裕民.一种新的公交乘客上车站点确定方法[J].重庆交通大学学报:自然科学版,2009,28(2):121-125.公交IC卡是一种新的客流信息采集手段,它的广泛使用为公交管理者进行客流分析提供了新的数据源。充分利用公交IC卡刷卡时间信息,根据相邻两站点间的最短刷卡间隔,通过系统聚类法对IC卡刷卡数据按照时间顺序进行聚类分析。在此基础上,将聚类分析的结果与公交运营资料所推算出的车辆到站时间进行时间匹配,确定持卡乘客的上车站点。最后,通过实例验证了该方法的可行性与实用性。

DOI

[ Yu Y, Deng T M, Xiao Y M.A novel method of confirming the boarding station of bus holders[J]. Journal of Chongqing Jiaotong University (Natural Science), 2009,28(2):121-125. ]

[7]
戴霄,陈学武.基于公交IC信息的公交数据分析方法研究[D].南京:东南大学,2006.

[ Dai X, Chen X W.Approach on the information analysis of urban public traffic base on the data of bus intelligent card[D]. Nanjing: Southeast University, 2006. ]

[8]
吴美娥,杨浩.对公交IC卡数据处理分析应用的探索[D].北京:北京交通大学,2010.

[ Wu M E, Yang H.The exploration of data processing and analysis application on the bus intelligent card[D]. Beijing: Beijing Jiaotong University, 2010. ]

[9]
陈绍辉,陈艳艳,赖见辉.基于GPS与IC卡数据的公交站点匹配方法[J].公路交通科技,2012,29(5):102-108.lt;p>&nbsp;一票制(单次刷卡)公交线路IC卡数据中缺少乘客上车站点信息,为获得乘客上车站点信息,需要将IC卡交易数据与公交站点进行匹配。首先根据公交车辆GPS数据和公交IC卡数据分别推算站点间运行时间,建立匹配约束规则完成首次站点匹配,并求得公交车辆GPS系统与公交IC卡收费系统的时间平均偏差值,再将时间平均偏差嵌入数据匹配模型,利用禁忌搜索算法对其他未匹配的交易记录进行二次匹配。为作比较,数据试验还包括仅根据站点间运行时间对GPS和IC卡数据进行匹配,从而找到IC卡交易记录与公交站点对应关系。数据试验表明:在GPS数据较完整的条件下,该方法能够精确实现IC卡交易记录与上车站点的匹配,而对比试验方法的匹配精度为80%,低于本文所研究方法。</p>

DOI

[ Chen S H, Chen Y Y, Lai J H.An approach on station ID and trade record match based on GPS and IC card data[J]. Journal of Highway and Transportation Research and Development, 2012,29(5):102-108. ]

[10]
徐建闵,熊文华,游峰.基于GPS和IC卡的单线公交OD生成方法[J].微计算机信息,2008,24(22):221-222.分析了公交车GPS和公交IC卡的基础数据,提出了基于公交车GPS和公交IC卡的数据融合的理论依据及两级数据融合方法;首次利用"总量控制"的思想较好地解决了在进行下车人数的推算过程中所产生的总量误差问题;建立了生成单线公交OD的计算公式模型,该模型将为公交运行评价、智能调度、线网优化等提供科学的数据参考依据。

DOI

[ Xu J M, Xiong W H, You F.The method of singal-line public transportation OD based on GPS and intelligent card[J]. Microcomputer Information, 2008,24(22):221-222. ]

[11]
张颂,陈学武,陈峥嵘.基于公交IC卡数据的公交站点OD矩阵推导方法[J].武汉理工大学学报:交通科学与工程版,2014,38(2):333-337.在仅有公交IC卡刷卡数据的条件下,设计了相应的聚类分析流程,利用正交换乘、最大相似原 理、回程匹配等方法完成公交IC卡刷卡记录的上下车站点推导,从而完成公交站点OD矩阵的推导.通过实例验证了该方法的可行性与实用性,并与人工调查数据 进行了比较,结果表明该方法具有较高的可靠性.

DOI

[ Zhang S, Chen X W, Chen Z R.A method of deriving bus stops O-D matrix based on bus IC card data[J]. Journal of Wuhan University Technology (Transportation Science & Engineering), 2014,38(2):333-337. ]

[12]
李海波,陈学武,陈峥嵘.基于公交IC卡数据的乘客出行时间特征研究[A].新型城镇化与交通发展——2013年中国城市交通规划年会暨第27次学术研讨会论文集[C].北京:中国建筑工业出版社,2014.

[ Li H B, Chen X W, Chen Z R.Approach on the travel time characteristic of passengers based on IC card[A]. In: A New Type of Urbanization and Transportation Development-2013 China City Traffic Planning Conference and the Proceedings of the 27th Symposium[C]. Beijing:China Architecture & Building Press, 2014. ]

[13]
侯艳,何民,张生斌.基于公交IC卡刷卡记录的居民出行OD推算方法研究[J].交通信息与安全,2012,30(6):109-114.居民出行OD调查需要耗费巨大的资金和人力,并且常常由于调查的组织不力或者调查人员的不负责而导致调查数据不可信。公交IC卡数据可以准确显示每位持卡人的出行信息,通过对数据进行分析可以获得居民出行OD信息。根据公交IC卡数据的特征,针对不同类型的数据,提出了相应的数据预处理方法,利用处理后的数据使用VBA结合ADO技术推算公交出行的OD矩阵。利用此方法对昆明市公交出行OD进行推算,获得数据精确度较高,可以作为传统的大规模人工OD调查的替代方法。结合推算过程遇到的问题,为公交IC卡数据记录方式提出4条改善建议以使数据能够更准确、更简便地应用于OD推算。

DOI

[ Hou Y, He M, Zhang S B.Origin-destination matrix estimation method based on bus smart card records[J]. Journal of Transport Information and Safety, 2012,30(6):109-114. ]

[14]
孙旭. 公交IC卡数据分析与数据仓库构建研究[D].长春:吉林大学,2007.

[ Sun X.Research on data analysis and data warehouse construction on the data of bus intelligent card[D]. Changchun: Jilin University, 2007. ]

[15]
Robinson S, Narayanan B, Toh N, et al.Methods for pre-processing smartcard data to improve data quality[J]. Transportation Research Part C, 2014,49:43-58.The approaches are tested using smartcard data from the Singapore public transport network from one week in April 2011. The results suggest that approximately 7.7% of all smartcard rides recorded the passenger as alighting one stop before the bus stop that they most probably alighted at. A further 0.7% of smartcard rides recorded the passenger as alighting more than one stop before the bus stop that they most probably alighted at. There was no evidence that smartcards overestimated the distance travelled by the passenger.

DOI

[16]
王若琳,赵娅丽,谭永凯.基于IC卡数据的公共交通换乘识别方法[J].城市轨道交通研究,2014(2): 76-85.基于2012年3月“深圳通”IC卡数据进行了公共交通换乘识别 方法的研究.换乘识别涉及到了道路公交不同线路的换乘、道路公交与城市轨道交通之间的换乘.分别确定了三种换乘方式各自不同的换乘时间阈值,进而判断出乘 客的两次乘车是换乘行为还是出行行为.最后抽取了工作日和非工作日各一天的数据进行了实例分析.

DOI

[ Wang R L, Zhao Y L, Tan Y K.Recognition method of transit based on intelligent card data[J]. Urban Mass Transit, 2014,2,76-85. ]

[17]
张孜,邹亮,朱玲湘.基于公交IC卡的公交换乘数据获取方法研究[J].交通信息与安全,2011,29(6):21-24.城市公共交通系统能否正常和高效地运营不仅取决于道路和车辆等设施条件,更有赖于运营管理手段和技术手段的先进性。传统的人工调查方法耗费巨大的人力物力,而调查结果却很难达到理想效果,所得数据不能动态反映城市公交出行的长期变化趋势。文中以公交IC卡为切入点,通过对乘客2次刷卡间的时间分析以及利用公交GPS时间点的数据进一步分析乘客换乘所用的时间,判断出乘客2次乘车是换乘行为还是2次出行。

DOI

[ Zhang Z, Zou L, Zhu L X.Method to collect public transportation transfer data of urban road intersection based on IC card[J]. Journal of Transport Information and Safety, 2011,29(6):21-24. ]

[18]
徐文远,邓春瑶,刘宝义.基于公交IC卡数据的公交客流统计方法[J].中国公路学报,2013,26(5):158-163.为了获得准确可靠的居民公交出行信息,从而为公交系统的规划和优化提供数据支持,提出了基于公交IC卡数据的公交客流统计方法。结合公交系统GPS应用,建立了基于公交IC卡数据和GPS信息的时刻匹配上车站点判断方法;利用基于站点吸引权的下车站点判断方法对下车人数进行了推算,并针对单个乘客刷卡情况对居民出行情况进行研究,给出了基于刷卡间隔与换乘阈值的关系、换乘距离及运行方向的换乘识别方法,同时明确了符合居民出行情况的换乘参数确定方法。最后利用哈尔滨市现有公交IC卡数据、GPS数据及线路站点数据,对该方法的有效性进行了验证。结果表明:所提出的利用公交IC卡数据进行公交客流统计的方法是有效的。

DOI

[ Xu W Y, Deng C Y, Liu B Y.Approach on public traffic passenger flow statistics based on IC data[J]. China Journal of Highway and Transport, 2013,26(5):158-163. ]

Outlines

/