大数据与智慧交通

智能卡和出租车轨迹数据中蕴含城市人群活动模式的差异性分析

  • 郑晓琳 ,
  • 刘启亮 , * ,
  • 刘文凯 ,
  • 吴智慧
展开
  • 中南大学地理信息系,长沙 410083
* 刘启亮(1986— ),男,山东龙口人,副教授,主要从事时空数据挖掘、时空统计研究。E-mail:

郑晓琳(1995— ),女,吉林松原人,硕士生,主要从事时空数据挖掘研究。E-mail: zhengxiaolin@csu.edu.cn

收稿日期: 2019-06-18

  要求修回日期: 2019-12-27

  网络出版日期: 2020-08-25

基金资助

国家重点研发计划项目(2017YFB0503601)

国家自然科学基金项目(41971353)

国家自然科学基金项目(41601410)

中南大学创新驱动计划项目(2018CX015)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

Discovery of Urban Human Mobility Patterns from Smart Card Transactions and Taxi GPS Trajectories: A Comparative Study

  • ZHENG Xiaolin ,
  • LIU Qiliang , * ,
  • LIU Wenkai ,
  • WU Zhihui
Expand
  • Department of Geo-informatics, Central South University, Changsha 410083, China
* LIU Qiliang, E-mail:

Received date: 2019-06-18

  Request revised date: 2019-12-27

  Online published: 2020-08-25

Supported by

National Key Research and Development Program of China(2017YFB0503601)

National Natural Science Foundation of China(41971353)

National Natural Science Foundation of China(41601410)

Innovation Drive Program of Central South University(2018CX015)

Copyright

Copyright reserved © 2020

摘要

当前采用交通流数据量化城市人群活动模式研究已经取得了丰硕的研究成果,但是对于同一区域、同一时段不同类型交通流数据反映城市人群活动模式的共性与差异性仍然知之甚少,直接影响了城市人群活动模式挖掘结果的可解释性与实际应用效果。为此,本文旨在对目前广泛采用的智能卡数据(公交和地铁刷卡)和出租车轨迹数据2种重要的交通流数据,从时空分布模式的差异性、行程距离及距离衰减效应的差异性、空间社团结构的差异性3个方面,探索二者反映城市人群活动模式的差异性:① 采用北京市六环以内区域2016年5月9日至15日的智能卡和出租车轨迹数据进行实验分析,研究发现:① 2种交通流反映出行需求的空间分布呈现出高度相关性,但是在同一空间单元上,2种交通流反映出行需求的时间相关性较低;② 2种交通流的使用率在不同空间位置存在明显差异,仅在城市中心区域使用率较为均衡;③ 2种交通流反映人群行程距离的空间分布、距离衰减效应存在明显差异,公共交通对于促进长距离出行更为重要;④ 从2种交通流发现的空间社团结构都显示了城市的多中心结构特征,但是二者发现社团结构存在的差异性表明两种交通方式对城市空间交互起着不同的作用。本研究有助于深入理解多源交通流反映城市人群活动的内在机理,提升城市人群活动模式在城市规划、交通管理等领域的应用效果。

本文引用格式

郑晓琳 , 刘启亮 , 刘文凯 , 吴智慧 . 智能卡和出租车轨迹数据中蕴含城市人群活动模式的差异性分析[J]. 地球信息科学学报, 2020 , 22(6) : 1268 -1281 . DOI: 10.12082/dqxxkx.2020.190312

Abstract

In the era of big data, traffic flows play an important role in understanding our socioeconomic environment. In recent years, two types of traffic flows, smart card transactions and taxi GPS trajectories, have been widely but usually separately utilized to understand human mobility in big cities. To date, although numerous research achievements have been made, the relationship between these two types of traffic flows that occur in the same area and in the same time period is still poorly understood. Thus, the pattern of urban human mobility may be biased by using a single type of traffic flow. In this study, we aimed to compare the urban human mobility patterns derived from the two traffic flows, i.e., smart card transactions and taxi GPS trajectories. Taking the area within the Sixth Ring Road of Beijing as study area, we collected the smart card transactions and taxi GPS trajectories data from May 9th to May 15th in 2016. Specifically, we compared: ① the spatio-temporal distributions of public transit and taxi usage; ② the travel distance of public transition and taxi usage and the distance-decay effects, and ③ the spatial community structures discovered from the two traffic flows. Our results show that: ① the spatial distributions of travel demand revealed by two traffic flows are highly correlated. However, the correlations between origin and destination time series extracted from the two traffic flows were very weak; ② the usages of public transit and taxi had spatial heterogeneity, and the spatial difference between the usages of public transit and taxi cannot be fully explained by the number of intersections, the number of points of interest, and the average distance to the nearest city center, shopping center, hospital and subway; ③ the travel distances extracted from taxi GPS trajectories decayed faster than that extracted from public transit, indicating that public transit was more important in facilitating long-distance travel, and ④ spatial communities discovered from the two traffic flows both reflected the polycentric spatial structure of the city. However, the differences in spatial community structures indicated that the two traffic flows played different roles in spatial interactions in the city. The quantitative comparison between smart card transactions and taxi GPS trajectories could improve our understanding of human mobility in Beijing, which also demonstrates the potential biases by using a single traffic flow to study urban system dynamic. Our results suggest integrating multi-source traffic flows to understand urban human mobility patterns in future.

1 引言

伴随着我国城镇化进程的加快,交通拥堵、土地利用混乱、基础设施滞后、环境污染等“城市病”日益严重,极大制约了我国城市经济建设、运行效率和可持续发展。为了应对此类“城市病”问题,迫切需要定量刻画城市中人群活动的模式与规律,加深城市人群活动与城市空间结构间耦合关系的理解,指导科学合理的城市空间规划与城市管理政策制定[1,2]。近年来,随着移动定位、移动互联及移动计算等城市感知技术的成熟与发展,海量的城市交通流数据(公交、地铁刷卡、出租车轨迹、手机定位等)已经可以被广泛获取,使定量化发现城市人群活动模式成为可能,并引起了国内外学者的广泛关注[3,4]
当前,智能卡数据(公交刷卡和地铁刷卡)与出租车轨迹数据是研究城市人群活动模式的2种重要的交通流数据源。前者记录了居民出行的时间、费用及上下车站点等信息,后者记录了出租车运行时的车辆行驶轨迹、载客状态等信息。研究已经发现上述两类交通流信息中蕴含了丰富的城市人群活动模式,如城市人群出行特征模式、城市人群活动热点、城市空间交互模式等。在城市人群出行特征模式分析方面:Gong等[5]采用特征分解方法从深圳市地铁刷卡数据中识别人群出行的时空变化特征;Zhong等[6]借助公交刷卡记录数据研究了伦敦、新加坡和北京市居民出行随时间变化的规律模式;Liu等[7]采用出租车轨迹数据研究了上海市人群移动模式并定量描述了移动步长的统计分布特征;Zhu等[8]以街道为分析单元,采用出租车轨迹数据研究了北京市人群出行的时空特征规律。在城市人群活动热点分析方面:龙瀛等[9]采用公交刷卡记录数据识别了北京市通勤的热点方向;Zhao等[10]采用空间聚类方法从武汉市出租车轨迹数据中发现人群出行热点区域的时空分布规律;Song等[11]利用蚁群扫描统计方法从北京市出租车OD流中发现出行热点轨迹的空间分布区域。在城市空间交互模式探测方面:Zhong等[12]采用社团结构挖掘方法利用新加披2010—2012年的公交刷卡数据检测城市空间结构的演变;Liu等[13]采用社团结构挖掘方法从上海市出租车轨迹数据中发现城市局部交互结构;Liu等[14]采用自然语言处理中的文档主题生成模型从北京市出租车轨迹数据中发现路段间的空间交互模式。
国内外学者在采用交通流数据量化城市人群活动模式方面已经取得了一系列的成果,但多是采用单一来源交通流数据开展研究。不同来源的交通流数据由于采集方式、目标群体、使用目的等方面存在的差异性,其蕴含的人类活动信息通常存在固有偏见[15],难以深入而全面地发现城市人群活动模式,极大限制了采用城市交通流数据应对“城市病”问题的实际应用效果。当前诸多学者已经认识到,为了应对数据代表性问题,更全面地发现城市人群活动模式,需要融合多源交通流数据进行分析[13,16]。采用多源交通流数据进行融合分析,其首要任务需要对不同来源数据间的联系与偏见性进行定量理解[17]。然而,当前研究对于不同来源交通流数据反映城市人群活动模式的固有倾向性与差异性仍然知之甚少,一方面难以从更全面的视角对城市人类活动模式进行深入洞察,另一方面难以真正实现多源交通流数据的集成分析。最近,Zhang等[17]针对新加坡一个周的智能卡数据和出租车轨迹数据进行了对比分析,比较了二者在反映出行需求、出行距离及空间交互等方面的联系。但是,上述对比分析数据并非来源于同一时段,其结果势必存在一定偏差。而且,在经济发达地区得到的研究结论能否在发展中国家推广尚存在疑问。
为此,本文以北京市六环以内区域为例,采用相同区域、相同时段的智能卡数据和出租车轨迹数据,从交通方式使用的时空分布、行程距离与距离衰减效应、空间交互模式3个方面,探索2种交通流数据反映城市人群活动模式的共性与差异性。研究结论对于深入理解城市人群活动特征及构建多源交通流协同分析模型具有重要价值。

2 实验数据与研究方法

2.1 数据源

本文研究区域为北京市六环以内的市区,总面积为3985 km2,采用的地理分析单元为交通分析小区,共包括1451个交通分析小区。本文采用2016年5月9—15日智能卡刷卡数据和出租车GPS轨迹数据开展研究,其中智能刷卡数据包括公交(834条线路,4229个站点)和地铁刷卡数据(21条线路,264个站点)的上下车记录,出租车轨迹包括29 000辆出租车的轨迹坐标和车辆状态。为了使2种交通流数据在时间上对齐,删除了缺失较多信息的数据,最终选择每天的8—24时为研究时段。对2种数据进行粗差处理后,共获得智能卡刷卡OD数据55 647 105条,出租车OD数据1 330 516条。2种交通流的轨迹起点和终点依据空间位置分别匹配到交通分析小区,OD点数据以小时为单位进行汇总。本文所用数据购买于数据堂,仅用于科研用途。

2.2 研究方法

综合现有研究对智能卡刷卡数据和出租车GPS轨迹中人群活动模式挖掘的研究方法,本文从3个方面对从2种交通流数据集中提取的人类活动模式进行对比分析:① 多源交通流出行需求的时空分布;② 多源交通流的行程距离空间分布及距离衰减效应;③ 多源交通流反映的城市空间交互结构。
2.2.1 多源交通流出行需求时空分布模式分析
公共交通和出租车反映了城市居民不同的出行需求,这2种交通方式产生的交通流都受到人口规模,土地利用分类和其他社会经济特征等因素的影响[18]。分析比较2种交通方式中出行需求在时间和空间上的分布状态,能够更好地理解2种交通方式反映城市人群活动模式的异同。
(1)多源交通流出行需求时间分布。本文从2个方面分析2种交通流行程需求在时间上的变化特征:① 针对2种交通流,分别统计每小时出行需求(轨迹OD点数量)的变化趋势,理解人们对公共交通和出租车在不同时间范围内使用的一致性和差异性;② 以每个交通分析小区为分析单元,采用Spearman相关性系数[19]分别分析2种交通流轨迹OD点时间序列的相关性,用于理解2种交通方式在不同空间位置上使用的时间相关性。
(2)多源交通流出行需求空间分布。本文分别分析了2种交通流行程需求在空间上热点(冷点)分布与使用的相对平衡性:① 分别汇总每个交通分析小区在工作日和周日2种交通流出行起点和终点的数目,得到2种交通方式在工作日和周末的出入行程的空间分布。针对每个交通分析小区内出行起点和终点的数目,采用Getis-Ord Gi*统计量[20]识别 2种交通流出行起点和终点在空间上的冷点和热点;② 引入对数比值来衡量2种交通方式在空间上使用的相对平衡性[17]。例如,对于工作日的出行需求,给定交通分析小区vi的对数比计算如下:
R i day = lo g 10 O day v i s E day s O day v i t E day t
式中: O day v i s O day v i t 分别表示智能卡刷卡数据和出租车轨迹数据在子区域i每日的平均起点数量(出行需求); E day s E day t 分别表示智能卡刷卡数据和出租车轨迹数据的每日平均的总行程数量。从式(1)可见,对数比通过消除2种交通流轨迹起点和终点数目量纲的差异来评价2种交通流使用的相对平衡性,可用来分析2种交通流体现的出行需求在空间分布上的差异性具体存在于哪些空间单元上。 R i day 等于0,表示2种交通方式在同一子区域的相对出行需求相同; R i day 大于0,表示智能卡的相对使用率高于出租车的相对使用率; R i day 小于0,表示智能卡的相对使用率低于出租车的相对使用率。
2.2.2 多源交通流行程距离分析
行程距离反映了人类活动的范围,蕴含了人类行程的目的性。2种交通流反映的行程距离的差异性是城市居民对2种交通方式使用差异性的重要体现。本文从2个方面对2种交通流反映的行程距离进行分析:
(1)分别计算2种交通流每条行程在工作日和周末的行程距离,并将结果映射在相应的交通分析小区内,计算每个交通分析小区内出入境的平均行程距离。采用Spearman相关性系数计算2种交通流反映的行程距离信息在研究区内的整体相关程度。
(2)分别计算2种交通方式在不同距离上的出行概率,分析人群出行的距离衰减效应。
2.2.3 多源交通流中城市空间社团结构发现
本文将每个交通分析小区视为一个节点,节点间的行程数量作为边权重,构建空间交互网络。采用基于模块度的社区检测方法[21]分别从2种交通方式在工作日和周末构建的空间交互网络中发现社团结构,探索2种交通流表征空间交互模式的差异性,模块度计算公式如下:
Q = 1 2 m A ij - k i k j 2 m δ c i , c j
式中:m表示空间交互网络中的总行程数; A ij 表示2个交通分析小区i,j间每日平均行程数量;每个节点的节点度 k i = A ij ; c i , c j 分别表示节点i和节点j所属社团, δ c i , c j 是用来判断节点ij是否在同一个社团内,在同一个社团内, δ c i , c j =1,否则, δ c i , c j =0。本文采取凝聚层次聚类的策略发现空间社区结构,每次合并使模块度值增加最大的2个社区结构,直到模块度值不再增大。

3 实验结果及分析

3.1 多源交通流出行需求时空模式对比分析

图1展示了2种交通流轨迹的每小时平均OD数量的变化趋势。对于智能卡数据,在工作日能观察到较为明显的早晚高峰,在周末没有显著的峰值,且周六和周日出行需求随时间变化呈现出相似的模式。对于出租车轨迹数据,工作日同样出现较为明显的出行高峰,但高峰出现时间与智能卡数据有明显差异,周六和周日2天出行需求相似且整体平稳。
图1 智能卡和出租车出行需求逐小时变化趋势

Fig. 1 Hourly variation of origin and destination points extracted from smart card transactions and taxi GPS trajectories

图2展示了每个交通分析小区上2种交通流在工作日和周末的行程起点和终点时间序列的相关性,其统计结果列于表1。可见,2种交通流行程起点和终点时间序列在每个交通分析小区上多呈现正相关,但是相关程度普遍较低,表明2种交通出行方式体现的人群出行的时间演化规律具有较为明显的差异。
图2 2种交通流在工作日和周末的行程起点和终点时间序列相关性对比

Fig. 2 The correlation between origin and destination time series oftwo traffic flowson weekdays and weekends

表1 依据2种交通流时间相关性对交通分析小区分类统计

Tab. 1 Classification of traffic analysis zones based on the temporal correlation between two kinds of traffic flow

相关性 交通分析小区数量/个
工作日
行程起点
周末
行程起点
工作日
行程终点
周末
行程终点
-1.0~ -0.8 0 0 2 1
-0.8~ -0.6 9 3 28 12
-0.6~ -0.4 30 13 89 63
-0.4~ -0.2 80 65 170 171
-0.2~0.0 354 409 480 481
0.0~0.2 246 248 264 243
0.2~0.4 324 293 231 224
0.4~0.6 289 266 138 162
0.6~0.8 109 136 46 76
0.8~1.0 10 18 3 18
图3展示了在工作日和周末从2种交通流提取的日均出行需求的空间分布,图4展示了出行需求的空间冷热点探测结果(空间距离设置为2.5 km)。可见:① 2种交通流的出行热点均主要在四环以内,但出租车的出行热点范围要略大于公共交通,出租车出行需求较公共交通出行在空间上更为集中,周末公共交通出行需求较为均衡,空间冷热点较少;② 4种组合(工作日出行起点,周末出行起点,工作日出行终点,周末出行终点)下的 2种交通流行程需求的Spearman相关性为0.809、0.799、0.796、0.789,这说明在大多数情况下公共交通使用率高的区域,出租车的使用率也较高;③ 2种交通方式的使用在空间上也存在一些明显的差异,如机场附近出租车的使用率明显高于公共交通,而在天通苑附近公共交通的使用率明显高于出租车。
图3 2种数据集提取的平均每日行程需求的空间分布

Fig. 3 Spatial distributions of average daily trips extracted from smart card transactions and taxi GPS trajectories

图4 2种数据集提取的平均每日行程需求的冷热点空间分布

Fig. 4 The hot and cold spots of average daily trips extracted from smart card transactions and taxi GPS trajectories

为了进一步发现2种交通方式的使用在空间分布上的差异性,采用对数比值定量评价2种交通出行方式在每个交通分析小区上使用的相对平衡性。图5展示了4种组合(工作日出行起点、周末出行起点、工作日出行终点、周末出行终点)的对数比值直方图(左边数字表示对数比值小于0的比例,右边数字表示对数比值大于0的比例),图6展示了 4种组合对数比值的空间分布。可见:① 2种交通出行方式使用占主导的区域数量差别不大,但是空间分布不均匀,2种交通方式使用较为均衡的区域主要位于四环以内;② 基于出行起点计算的出行需求相对平衡性(图5(a)和图5(c))表明在研究区域内,公共交通相对使用率较高的小区略多,基于出行终点计算的出行需求相对平衡性表明(图5(b)和图5(d))出租车相对使用率较高的小区略多。
图5 分别采用2种交通流出行起点和终点计算的对数比值的直方图

注:直方图中左边数值表示对数比值小于0的比例,右边数值表示对数比值大于0的比例。

Fig. 5 Histograms of log odds ratio based on each combination of trip category (outgoing vs. incoming) and type of day (weekdays vs. weekends)

图6 分别采用2种交通流出行起点和终点计算的对数比值的空间分布

Fig. 6 Spatial patterns of log odds ratio based on each combination of trip category (outgoing vs. incoming) and type of day (weekdays vs. weekends)

为了探索2种交通方式使用差异的可能影响因素,本文进一步采用地理加权回归模型[22],分析了对数比值与交通分析小区内道路口数目,公共设施数量和区域可达性的关系。图7展示了回归系数的空间分布,可见不同空间位置上道路口数量、公共设施数量与区域可达性对2种交通方式使用差异的影响存在较为明显的差异。但是,4个回归模型中R2介于0.114到0.167之间,说明上述3个因素解释 2种交通方式使用差异的能力极为有限,可能还有其他因素对不同交通方式的使用率具有重要影响。
图7 3种变量的回归系数空间分布

Fig. 7 Spatial distributions of the regression coefficients calculated for three independent variables

3.2 多源交通流行程距离对比分析

图8图9分别展示了在工作日和周末从2种交通流轨迹中提取的起点和终点平均行程距离的空间分布模式和直方图,分析可见:
图8 2种交通流中提取的平均行程距离的空间分布

Fig. 8 Average travel distances of the trips extracted from smart card transactions and taxi GPS trajectories

图9 2种交通流中提取的平均行程距离的直方图

Fig. 9 Histogram of the average travel distance extracted from the two traffic flows

(1)出租车行程距离的空间分布比较平滑,由城市中心向城市外围行程距离逐渐增大,较短的出行距离主要集中在五环以内(图8(b)、图8(d)、图8(f)、图8(h))。工作日从五环内出发的出租车行程距离(5~10 km)明显小于到达五环内的出租车行程距离(15~35 km),而周末从五环内出发的出租车行程距离与到达五环内的出租车行程距离差别不大(5~10 km)。公共交通的出行距离空间分布与出租车具有明显的差异,不同长度的出行距离在空间上分散分布。
(2)公共交通在工作日和周末,依据行程起点计算的行程距离(图8(a)和图8(e))大致相同,且具有类似的空间分布,依据行程终点计算的行程距离(图8(c)和图8(g))亦大致相同。出租车轨迹在工作日和周末,依据行程起点计算的行程距离(图8(b)和图8(f))大致相同,但是工作日依据行程终点计算的行程距离(图8(d))明显比周末依据行程终点计算的行程距离(图8(h))要长。
(3)在工作日,依据公共交通出行起点(图8(a))和终点(图8(c))计算的行程距离具有类似的空间分布(Spearman相关性为0.93),然而依据出租车轨迹起点(图8(b))和终点计算的行程距离(图8(d))空间分布具有明显的差异(Spearman相关性为0.25)。在周末,依据公共交通出行起点(图8(e))和终点(图8(g))计算的行程距离亦具有类似的空间分布(Spearman相关性为0.93),然而依据出租车轨迹起点(图8(f))和终点计算的行程距离(图8(h)) 空间分布亦存在差异(Spearman相关性为0.57)。从上述分析可以推断,北京市公共交通出行具有较高的对称性(即人们早上到工作场所的行程链与下班后回家的行程链基本吻合),而出租车出行的对称性较低。
图10展示了从2种交通流中发现的人群活动的距离衰减效应,本文采用分段拟合的策略对距离衰减效应进行幂律拟合,结果发现:① 在工作日,出行距离超过30 km后,2种交通出行方式的行程距离均迅速衰减;在周末,出行距离超过15 km后, 2种交通出行方式的行程距离迅速衰减。这可能表明工作日由于通勤出行的原因,人群出行距离较长,这也侧面说明了北京市通勤距离较长;② 在工作日和周末,从出租车轨迹数据中提取到的行程距离一直比从智能卡轨迹数据提取到的行程距离衰减地更快,表明在北京市公共交通在促进长距离行程方面的重要性。
图10 2种交通流数据中提取到人群活动的距离衰减效应

Fig. 10 Distance decay of trips extracted from smart card transactions and taxi GPS trajectories on weekdays and weekends

3.3 城市空间社团结构探测结果对比分析

图11展示了分别采用智能卡数据和出租车轨迹数据社区检测结果,可以发现:
图11 从智能卡和出租车数据发现的空间交互社区

Fig. 11 Spatial communities discovered from smart card and taxi data on weekdays and weekends

(1)采用出租车轨迹OD数据发现的空间社团结构具有较好的空间连续性,且与区域行政边界具有较好的一致性,这表明行政区划对城市人群移动具有一定的约束作用;但是采用智能卡轨迹OD数据发现的空间社团结构包含了部分空间不连续的社团结构,其主要原因在于公共交通受到站点设置的约束,但是这些站点在空间上的分布相对于连续采样的GPS轨迹数据较为稀疏。
(2)针对同一交通流,在工作日和周末发现的社团结构存在差异,周末发现的社区数目增多,表明周末人们的出行范围小于工作日。从智能卡轨迹OD数据发现的社团结构差异较小(主要是南五环附近发生变化),但是从出租车轨迹OD数据发现的社团结构差异较大。这表明,公共交通在工作日和周末的使用情况变化不大,而出租车在工作日和周末的使用存在较大差异。

3.4 讨论

从上述实验结果可以发现,北京市智能卡OD数据和出租车OD数据反映的人群活动模式通常存在较为明显的差异。通过分析上述结果,对2种交通流在反映出行需求、出行距离及空间交互等方面的区别与联系进行总结:
(1)2种交通方式在相同空间单元上时间演化趋势的差异性较大,但是具有类似的空间分布模式(即公共交通使用率高的区域出租车使用率也通常较高);2种交通出行方式的出行热点均比较集中(主要位于四环以内区域),但是出租车在机场等大型交通枢纽、休闲娱乐区域的使用率明显高于公共交通。
(2)2种交通方式相对使用率在工作日和周末总体差异不大,但是在不同空间位置2种交通方式使用的差异性明显。在城市中心区域(四环以内) 2种交通方式使用较为均衡,城市边缘(四环以外)二者相对使用率差异性明显。本文试图采用与交通出行密切相关的3种地理背景信息(道路口数目,公共设施数量和区域可达性)对2种交通方式相对使用率差异进行解释,但是其解释能力较低,未来需要进一步结合其他社会经济信息对这种差异进行综合解释。
(3) 2种交通方式出行距离的空间分布的对比分析表明公共交通出行距离的空间分布呈现较为随机的状态,而出租车出行距离具有较强的规律性,主要呈现从市中心到城市外围出行距离逐渐增大的趋势。这也说明出租车的出行距离,可能受到城市设施布局、社会经济等因素的控制。通过对2种交通方式行程距离的衰减效应进行分析后可以发现,北京市工作日通勤距离较长,公共交通对于长程出行更为重要。
(4)从2种交通流中发现的空间社团结构均显示北京市呈现多中心的结构特征,但是从2种交通流中发现的空间社团结构存在明显的差异:从出租车轨迹中发现的社团结构空间连续性较好且与行政边界较为吻合,而从智能卡数据由于受到站点位置的约束,发现的社团结构存在较多空间不连续的部分。周末发现的空间社团数量要多于工作日,这也进一步证实了周末由于通勤出行数量的显著降低,人群的活动范围相对较小(行程距离较短)。
与文献[17]针对新加坡智能卡数据和出租车轨迹数据对比分析结果相比,北京市2种交通流数据反映的人群活动模式的对比分析结果存在明显不同:
(1)在2种交通方式使用的相对平衡性方面,新加坡的出租车相对使用率高的区域数目明显多于公共交通,而在北京市二者的相对使用率占主导的区域数量差异不大。
(2)在2种交通方式出行距离的空间分布规律方面,距离衰减效应的幂律拟合结果明显不同,新加坡的出租车对促进长距离行程更加重要,而北京的公共交通对促进长距离行程更为重要。
(3)从2种交通流发现的空间社团结构方面,在新加坡,针对同一交通流,在工作日和周末发现的社团结构差异不大,而在北京市,针对同一交通流,在工作日和周末发现的社团结构在形态和数量上均存在明显差异;在新加坡,从2种交通流中发现的社团结构空间连续性较好且均于行政边界较好吻合,而在北京市,从智能卡数据发现的空间社团结构空间连续性较差且与行政边界吻合度较低。
上述对比分析结果亦充分说明不同社会经济背景下多源交通流的运行模式具有明显的差异,在发达国家得到的研究结论并不能在发展中国家进行推广。

4 结论

本文以北京市为例,首次采用同一区域、同一时间范围的智能卡和出租车轨迹OD数据,对2种重要的交通流数据(智能卡和出租车轨迹)中蕴含的人类活动模式的区别与联系进行了定量分析。首先,通过相关性分析、热点分析及相对平衡性分析等方法,定量评价了2种交通方式使用的时空分布模式差异性;然后,通过分析2种交通方式的行程距离空间分布及距离衰减效应,对2种交通方式反映的城市人群活动规律进行定量描述;最后,采用基于模块度的社团检测方法对2种交通流中蕴含的人群空间交互信息进行挖掘,发现2种交通流表征空间交互信息的差异性规律。本文研究揭示了北京市智能卡与出租车轨迹中蕴含城市人群活动模式的倾向性与差异性,对于城市交通规划、城市交通设施布局以及城市空间结构优化具有重要的参考价值。主要结论如下:
(1) 2种类型交通流反映的城市人群活动特征在空间分布上具有较好的吻合性,但是2种交通流反映的人群活动特征在相同空间单元上的时间演化规律相差甚大。因此,现有研究采用单一交通流出行序列发现城市功能结构或土地利用时势必存在较大差异,因为这2类交通流反映了不同类型的人群活动特征。例如,出租车在反映往返大型交通枢纽、休闲娱乐区域等位置的人群活动特征更具有优势,而公共交通能够更好反映城市人群的通勤模式。
(2) 2种类型交通流反映城市人群活动范围不同,智能卡数据反映的人群活动范围在空间上分布较随机,对于反映长距离的人群出行活动更为重要;出租车数据反映的人群活动范围在五环以内都比较均匀且出行距离普遍较短(5~10 km)。因此,现有采用单一出租车数据研究城市人群出行范围或城市功能区域时,其识别的出行范围或城市功能区域可能偏小,需要进一步融合智能卡数据开展研究。
(3) 2种交通流数据反映城市不同区域间人群活动的空间交互作用具有明显差异,从出租车轨迹数据中发现的人群空间交互作用更多体现了城市行政区划对人群互动的约束作用,而从智能卡数据发现的城市人群空间交互作用更多地反映特定地点(或站点)间的人群流动,导致发现的空间社团空间连续性较差。此外,出租车轨迹数据反映的人群空间交互作用在工作日和周末差异较大,表明出租车的使用率在工作日和周末存在较大差异,而智能卡轨迹数据反映的人群空间交互作用在工作日和周末差异较小。因此,当前采用出租车轨迹数据发现城市的多中心结构时需要同时考虑工作日和周末的出行差异,而且其发现的多中心结构可能多是反映了行政区域的约束,综合出租车与智能卡数据发现城市多中心结构需要引起足够的重视。
(4)2种交通流数据反映的城市人群活动特征在北京和新加坡具有明显差异,其原因可能是在城市规划、社会发展水平及社会文化等方面存在的差异。同时也在一定程度上表明,不同国家城市间人群活动特征的相互借鉴意义不大。
本文发现的2种交通流数据反映城市人群活动模式的倾向性与差异性可以进一步指导构建多源交通流协同的时空数据挖掘模型。需要注意的是,本文在研究人群出行距离时,受到数据源包含信息所限并没有考虑不同交通工具间的换乘模式,因此可能忽略一些更长距离的出行模式,对于不同交通工具的换乘模式有待进一步开展研究。
[1]
Long Y, Han H Y, Tu Y C, et al. Evaluating the effectiveness of urban growth boundaries using human mobility and activity records[J]. Cities, 2015,46:76-84.

[2]
Gong L, Liu X, Wu L, et al. Inferring trip purposes and uncovering travel patterns from taxi trajectory data[J]. Cartography and Geographic Information Science, 2016,43(2):103-114.

[3]
Liu Y, Liu X, Gao S, et al. Social sensing: A new approach to understanding our socioeconomic environments[J]. Annals of the Association of American Geographers, 2015,105(3):512-530.

[4]
郑宇. 城市计算概述[J]. 武汉大学学报·自然科学版, 2015,40(1):1-13.

[ Zheng Y. Introduction to urban computing[J]. Geomatics and Information Science of Wuhan University, 2015,40(1):1-13. ]

[5]
Gong Y X, Lin Y Y, Duan Z Y. Exploring the spatiotemporal structure of dynamic urban space using metro smart card records[J]. Computers, Environment and Urban Systems, 2017,64:169-183.

[6]
Zhong C, Batty M, Manley E, et al. Variability in regularity: mining temporal mobility patterns in London, Singapore and Beijing using smart-card data[J]. PLoS One, 2016,11(2):e0149222.

DOI PMID

[7]
Liu Y, Kang C G, Gao S, et al. Understanding intra-urban trip patterns from taxi trajectory data[J]. Journal of Geographical Systems, 2012,14(4):463-483.

[8]
Zhu D, Wang N H, Wu L, et al. Street as a big geo-data assembly and analysis unit in urban studies: A case study using Beijing taxi data[J]. Applied Geography, 2017,86:152-164.

[9]
龙瀛, 张宇, 崔承印. 利用公交刷卡数据分析北京职住关系和通勤出行[J]. 地理学报, 2012,67(10):1339-1352.

[ Long Y, Zhang Y, CUI C Y. Identifying commuting pattern of Beijing using bus smart card data[J]. Acta Geographica Sinica, 2012,67(10):1339-1352.]

[10]
Zhao P X, Qin K, Ye X Y, et al. A trajectory clustering approach based on decision graph and data field for detecting hotspots[J]. International Journal of Geographical Information Science, 2016,31(6):1101-1127.

[11]
Song C, Pei T, Ma T, et al. Detecting arbitrarily shaped clusters in origin-destination flows using ant colony optimization[J]. International Journal of Geographical Information Science, 2018,33(1):134-154.

[12]
Zhong C, Arisona S M, Huang X F, et al. Detecting the dynamics of urban structure through spatial network analysis[J]. International Journal of Geographical Information Science, 2014,28(11):2178-2199.

[13]
Liu X, Gong Y X, Liu Y. Revealing travel patterns and city structure with taxi trip data[J]. Journal of Transport Geography, 2015,43:78-90.

[14]
Liu K, Gao S, Lu F. Identifying spatial interaction patterns of vehicle movements on urban road networks by topic modelling[J]. Computers, Environment and Urban Systems, 2019,74:50-61.

[15]
Lu S W, Fang Z X, Zhang X R, et al. Understanding the representativeness of mobile phone location data in characterizing human mobility indicators[J]. ISPRS International Journal of Geo-information, 2017,6(1):7.

[16]
杨喜平, 方志祥. 移动定位大数据视角下的人群移动模式及城市空间结构研究进展[J]. 地理科学进展, 2018,37(7):18-27.

[ Yang X P, Fang Z X. Recent progress in studying human mobility and urban spatial structure based on mobile location big data[J]. Progress in Geography, 2018,37(7):18-27. ]

[17]
Zhang X H, Xu Y, Tu W, et al. Do different datasets tell the same story about urban mobility-a comparative study of public transit and taxi usage[J]. Journal of Transport Geography, 2018,70:78-90.

[18]
龙瀛, 孙立君, 陶遂. 基于公共交通智能卡数据的城市研究综述[J]. 城市规划学刊, 2015,223(3):70-77.

[ Long Y, Sun L J, Tao S. A review of urban studies based on transit smart card data[J]. Urban Planning Journal, 2015,223(3):70-77. ]

[19]
Fieller E C, Hartley H O, Pearson E S. Tests for rank correlation coefficients[J]. Biometrika, 1961,48(1-2):29-40.

[20]
Getis A, Ord J. The analysis of spatial association by use of distance statistics[J]. Geographical Analysis, 1992,24(3):189-206.

[21]
Newman M E J, Girvan M. Finding and evaluating community structure in network[J]. Physical Review E, 2004,69(2 Pt 2):026113.

[22]
Fotheringham A, Brunsdon C, Charlton M. Geographically weighted regression: the analysis of spatially varying relationships[M]. New York: The Wiley Press, 2002.

文章导航

/