Big-data Oriented Commuting Distribution Model and Application in Large Cities

  • LIU Yunshu , 1, 2, 3 ,
  • ZHAO Pengjun , 1, 2, 3, * ,
  • LV Di 1, 2, 3
Expand
  • 1. Shenzhen Graduate School, Peking University, Shenzhen 518055, China
  • 2. College of Urban and Environmental Sciences, Peking University, Beijing 100871, China
  • 3. Laboratory for Earth Surface Processes(LESP) Ministry of Education, Peking University, Beijing 100871, China
* ZHAO Pengjun, E-mail:

Received date: 2020-06-29

  Request revised date: 2020-07-26

  Online published: 2020-10-21

Supported by

National Natural Science Foundation of China(41925003)

Copyright

Copyright reserved © 2021

Abstract

In recent years, big data has been widely applied in traffic analysis. However, they are mostly used for data visualization and phenomenon description. There is a lack of big-data oriented transport modeling, which leads to limited application of big-data in transportation planning. In this study, we propose a Location-Space Dependent Indicator (LSDI) based on the time-space interaction between transportation and land use. Based on this indicator, the urban commuting distribution model is developed, which improves the traditional gravity model. Taking Beijing as a study case, the developed model is applied and verified using mobile phone signaling big data derived from the communication service of an operator in September 2017. Travel generation and distribution models are constructed and verified respectively. Our results show that: (1) For the travel generation model simulations, commuter population and resident population show a good linear relationship. This model generates a significant prediction with a goodness of fit of 0.84; (2) For the travel distribution model simulations, a comparison analysis is conducted between gravity model, radiation model, and modified model with LSDI. The gravity model corrected by real commuting data performs best in regression analysis with a goodness of fit of 0.94. But large errors occur in the probability density distribution. The radiation model performs normal in regression analysis with a goodness of fit of 0.37. It has a better accuracy in the probability density distribution. The modified gravity model with LSDI has the best overall performance. The underestimation phenomenon is optimized in the commuter population distribution with a highest goodness of fit (0.85). Our findings provide new insights in developing big-data oriented transport prediction models and contribute to promote the application of big data in transport planning.

Cite this article

LIU Yunshu , ZHAO Pengjun , LV Di . Big-data Oriented Commuting Distribution Model and Application in Large Cities[J]. Journal of Geo-information Science, 2021 , 23(7) : 1185 -1195 . DOI: 10.12082/dqxxkx.2021.200334

1 引言

随着城市化与机动化的推进,交通拥堵、能耗排放等交通问题成为社会关注的重点问题,北京等特大城市面临的形势尤为严峻。如何解决交通问题、提升公众出行质量,成为城市发展面临的挑战[1]。传统交通研究多通过居民出行调查、交通检测器等获取截面数据,对居民出行和道路承载情况进行获取。随着移动定位技术的成熟,基于位置的服务(Location Based Service, LBS)逐渐进入人们的生活。在提供产品服务的同时,带有时空间属性的大数据得以积累,如电子地图数据[2]、GPS数据[3]、公交刷卡数据[4]和手机信令数据[5]。其中,手机信令数据凭借时效性高、成本低、延续性好等优点[6],在交通分析中受到了学者们的广泛关注。
根据不同的研究目标和数据处理方法,基于手机信令数据的交通出行研究主要包括交通信息获取和居民出行信息获取2个方面[7]。① 基于手机数据的实时性,对道路交通信息进行监测和提取[8,9,10]。② 基于手机数据的客观性,通过对特定时空间范围内的居民出行信息进行分析,挖掘居民出行特征[7,11-13]。由于目前手机用户隐私保护规范尚未健全,获取真实手机数据较为困难,同时基于手机信令数据对居民出行OD研究方法尚不成熟,国内外相关研究多在可视化展示和现象描述阶段进行尝试,应用手机信令数据进行交通预测模型构建与模拟的研究相对较少。
经典的交通需求预测框架以“四阶段”模型为代表,其核心内容是基于居民出行现状和社会经济发展趋势,预测目标年交通需求量的空间分布情况,主要分为出行产生、出行分布、出行方式选择和道路选择4个步骤[14]。其中,出行产生和出行分布是第一阶段,用以“评估、校准和验证”出行者与土地利用之间的相互作用关系,进而预测得到出行者的出行需求[14]。主流建模过程包括出行产生预测和出行分布预测2个阶段。根据模型假设不同,出行产生预测通常分为2种:① 类别分析模型[15],假设不同土地利用、家庭类型的平均出行率变化不大,预测未来年土地开发、家庭组分情况;② 回归分析模型[15],假设出行量与土地、交通、居民等变量之间的相关关系,预测土地利用、社会经济变量的变化情况。根据模型类别不同,出行分布预测可以分为4种:① 增长系数模型,如常增长系数模型、平均增长系数模型[16],假设交通设施、出行模式变化不大,预测出行流量的增长趋势;② 构造模型,如重力模型[17]、介入机会模型[18],假设出行量与变量之间的作用关系(空间、交通、居民等),预测出行模式的分布规律;③ 效用模型,如随机效用模型[19]、离散选择模型[20],假设出行者进行理性决策,追求出行选择效用最大,预测出行选择的概率分布;④ 数据驱动模型,如决策树模型[21]、神经网络模型[22],假设出行量变化符合对应数据规律、模型算法,预测出行数据的变化规律。
在理论研究上,单一的空间作用理论或效用理论难以对群体出行规律和个体出行特征进行综合表征,在模型应用上,高时空精度数据的匮乏成为提升模型预测水平的阻碍[16,23]。在新的技术背景下,有必要基于大数据的应用对经典出行需求预测模型进行修正与提升。

2 研究区概况与数据来源

2.1 研究区概况

本文以北京市全域范围作为研究区域。据统计,截止2017年末,北京市常住人口达2170.70万人,常住人口密度为1323人/km2[24]。由人口聚集产生的大规模交通需求也在不断增加,2017年北京中心城区工作日出行总量(含步行)同比增加2.4%,达到3893万人次[25]。同时,交通拥堵、生态环境破坏等一系列“城市病”也随之产生。北京市早晚高峰拥堵延时指数均处于高位水平,整体拥堵指数占全国第二[26]。因此,厘清北京市居民通勤出行现状,构建精准的出行需求预测模型,对于城市交通规划与管理具有重要意义。
为避免以往研究单元(交通小区、行政区域等)存在的尺度不统一,空间非连续等问题,本文采用1 km×1 km的空间网格作为标准研究单元。通过重采样处理,将手机信令数据映射到位置网格系统中,实现研究数据的统一、均衡化分布。

2.2 数据来源

手机信令数据是一款匿名、脱敏的群体性数据产品,基于手机定位技术,可以对手机用户所在的基站ID进行定位,进而对用户位置进行获取。通过国内某运营商手机信令数据产品接口,采集到北京市2017年9月的数据信息。手机信令数据分为驻留信息和出行信息2部分。其中,驻留信息定义为用户在同一个基站网格内停留30 min及以上,出行信息记录了用户空间位置的变化。
驻留信息和出行信息是用户在使用运营商服务过程中,其时空间位置的客观记录。通过对用户停留、移动状态的识别,可以实现通勤行为的提取。本文结合居民通勤出行特点,对手机信令模式下的通勤行为进行定义和识别(表1)。
表1 通勤居民与通勤出行识别

Tab. 1 Identification of commuters and commute travel

流程阶段 规则定义
月度驻留信息汇总 将统计时段分为工作日白天、工作日夜晚、周末白天和周末夜晚;分别统计居民在所有驻留网格中的月度累计驻留时长。
居住地与工作地定义 居住地是指居民在工作日夜晚和周末夜晚累计驻留时长最长的网格;工作地是指除了居住地之外,居民在工作日白天累计驻留时长最长,并且在60%以上的工作日均在此地发生过驻留的网格。
通勤居民筛选 居民年龄在19~59岁之间;在一个月的研究时段内,驻留行为在研究区内累计出现10 d以上;可以识别出工作地位置。
通勤出行识别 从居住地到工作地的出行行为;出发时间早于中午12:00;包括多段出行信息的拼接。

注:根据居民的工作时段特征,将白天时段定义为8:00-21:00。

统计可得,共识别出真实通勤用户1 738 776人,真实通勤出行OD634 066对。通过空间化处理(图1),共建立1 km×1 km标准研究单元16 985个,包含居住地网格9989个(58.81%),工作地网格9464个(55.72%)。
图1 2017年北京市职住空间分布

Fig. 1 Job-house space distribution of Beijing in 2017

3 大数据交通模型构建

3.1 技术路线

本文基于北京市2017年手机信令数据进行通勤交通模型的构建、测算与验证。① 对北京市全域范围内的出行产生预测模型和出行分布预测模型进行构建;② 分别针对通勤出行量和通勤OD量进行测算指标提取;③ 基于真实的手机信令数据,提取出对应的验证指标;④ 分别应用不同的模型方法对预测结果进行对比验证。技术路线如图2所示。
图2 本文的技术路线

Fig. 2 Methodological workflow of this study

3.2 交通与土地利用的交互作用关系

交通与土地利用的交互作用关系源自于Hansen提出的“交通-土地利用相互作用环”假设,指出交通与土地利用要素处于动态反馈的循环状态[27]。一方面,交通网络直接影响城市空间的发展,交通运行状况反映城市空间结构、区位可达性等信息;另一方面,土地利用直接作用居民的出行要素和出行特征,城市功能结构促生和决定了居民的交通需求[28]
同时,二者的交互作用关系呈现出时空间动态交互特征。在时间维度上,根据不同的出行需求,居民的交通选择具有时期稳定性和时间弹性,与之相对应的土地利用演化过程具有时间分异性,而不同的土地利用更新速度进一步影响了交通系统的变化周期;在空间维度上,根据不同的出行需求,居民的交通分布模式具有空间尺度效应,与之匹配的土地利用区位分布表现出空间变异特征,进而通过空间区位可达性进一步影响居民出行。

3.3 区位空间依赖因子

区位空间依赖因子(Location-space Dependence Indicator, LSDI)反映了交通与土地利用相互作用规律的时间维度特征。居民的居住地区位和就业地区位选择具有时期稳定性,即通常居民在短期内发生迁居或者就业地改变的可能性较小;同时,居民在上学、就医、日常购物等方面的区位选择也具有一定的时期稳定性,大多数居民更换就学地、就医地和日常购物地的频率相对较小。通勤、通学、就医、日常购物等出行被称为生活必须出行,也成为刚性出行需求(休闲娱乐等出行称为弹性出行需求)。居民空间区位选择的时期稳定性体现出交通与土地利用相互作用过程中的土地和交通要素变化有“快慢”之分的时间分异规律:居民交通出发时间、方式选择等变化较快,但刚性出行需求的出发地和目的地变化相对较慢,区域土地利用变化和基础设施等变化更慢[29]。空间区位选择的时期稳定性造成通勤、通学、就医、日常购物等刚性出行需求目的的交通流在地理空间上不同区位之间的发生周期性,进而形成交通流分布的区位空间依赖性。
基于居民个体在月度驻留记录中累积驻留次数的频度分布情况,用驻留位置的频度占比表征该位置对于居民出行选择的吸引力,将区位空间依赖因子定义为:
U ij = λ ij λ ij
式中: U ij 为来自 i 地区的居民个体访问 j 地区的区位空间依赖因子,表征该地区对居民出行的吸引力强度; λ ij 为居民在 j 地区的累积驻留次数; λ ij 为居民在所有研究单元中累积驻留次数之和。

3.4 大数据模型构建

3.4.1 出行产生预测
基于第一性原理,对居民择业过程提出2个基本假设:① 工作范围(通勤出行范围)在北京市市域范围内;② 就业市场稳定,即市域内的工作机会满足本地的就业人口。由于工作机会数与常住人口数成正比[30],基于上述假设可推论得出通勤人口与常住人口成正比。故模型构建过程分为2步:① 基于手机用户驻留人口提取各单元网格的常住人口;② 通过通勤人口与常住人口的数量关系,对日均通勤出行量进行预测。
(1)基于驻留人口的常住人口提取
根据工作夜晚(0:00—6:00)驻留人口与统计常驻人口的正比例关系[2,5],对任意位置的手机用户常住人口进行计算:
m i = P Z × z i
式中: m i i 区手机用户常住人口; P 为北京市统计常住人口; Z 为工作夜晚总驻留人口; Z i i 区工作夜晚驻留人口。计算可得北京市总的手机用户常住人口为944.38万人。
(2)基于从业人口和常住人口的通勤人口提取
基于通勤人口与常住人口之间的正比例关系,假设研究区范围内的总从业人口(统计通勤人口)与总常住人口(统计常住人口)之间有同样的比例关系。其中,统计通勤人口为政府机构统计的通勤人口,本文用统计年鉴中三次产业从业人员年末人数作为总的通勤人口;统计常住人口为统计年鉴中公布的常住人口,2017年北京市的常住人口为2 170.70万。根据手机用户常住人口对手机用户通勤人口(基于该运营商手机信令数据识别出的通勤人口)进行计算:
T = Q P × M
T i = T M × m i
式中: T 为总的手机用户通勤人口; Q 为统计通勤人口; P 为统计常住人口; M 为总的手机用户常住人口。由此可得比例系数 T M 为0.574 4,进而得到 i 区的手机用户通勤人口。
3.4.2 出行分布预测
基于1 km空间单元,对得到的通勤产生量进行OD分布预测。本文采用3组模型进行出行分布预测(表2表3):① 重力模型;② 辐射模型;③ 修正模型。
表2 2017年北京市通勤出行分布预测模型

Tab. 2 Trip distribution prediction model of commuting in Beijing in 2017

模型类型 模型名称 计算公式
重力模型 非约束重力模型M1 T ij = C m i α n j β d ij γ
单边约束重力模型M2 T ij = B ij C m i α n j β d ij γ
辐射模型 未矫正非约束辐射模型M3 T ij = T i × m i × n j m i + s ij × ( m i + n j + s ij )
未矫正单边约束辐射模型M4 T ij = B ij × T i × m i × n j m i + s ij × ( m i + n j + s ij )
矫正后非约束辐射模型M5 T ij = T i ( 1 - m i M ) × m i × n j m i + s ij × ( m i + n j + s ij )
矫正后单边约束辐射模型M6 T ij = B ij × T i ( 1 - m i M ) × m i × n j m i + s ij × ( m i + n j + s ij )
修正模型 修正重力模型(以M1为例) T ij = C m i α n j β d ij γ × A ij
修正辐射模型(以M3为例) T ij = T i × m i × n j m i + s ij × ( m i + n j + s ij ) × A ij
表3 2017年北京市通勤出行分布预测模型参数

Tab. 3 Parameters of trip distribution prediction model of commuting in Beijing in 2017

参数名称 参数定义
T ij i 区到 j 区的手机用户通勤人口
C 重力模型归一化因子
m i , n j i 区与 j 区的手机用户常住人口
d ij i 区与 j 区几何中心之间的直线距离
α , β , γ 重力模型矫正因子,表征空间质量和距离对通勤出行的影响作用
B ij 平衡因子,对通勤产生总量进行约束
T i i 区的手机用户通勤人口
s ij i 区几何中心点为圆心,以 d ij 为半径的圆形区域内手机用户常住人口总和(未包含出发和到达网格的手机用户常住人口)
M 总的手机用户常住人口
A ij 区位空间依赖因子,表征交通流在 i 地区与 j 地区之间的空间分布常态惯性
其中,重力模型源于引力公式,表征不同地理单元之间的出行量与“质量”(例如人口)成正比,与其间距成反比,其中,重力模型的基本形式如表2中M1所示,将空间化后的真实通勤用户与真实通勤出行OD数据带入模型,通过无约束的非线性优化,使得模型预测值与真实值之间的最小二乘(Ordinary Least Square,OLS)误差最小,进而求解出模型中各参数的取值。
经典重力模型主要分为无约束模型和有约束模型2种,区别在于是否为满足特定目标而对模型变量(出行产生/吸引量、出行距离/成本等)进行约束[31,32]。本文在非约束重力模型M1基础上,引入平衡因子 B ij ,构建单边约束模型M2,以保证出行OD总量与预测出行发生总量保持一致。其中,平衡因子 B ij 需满足条件:
T i = i B ij T ij
辐射模型起源于粒子扩散现象,粒子从某位置发出,具有一定的概率被周边物质吸收,其吸收概率独立于其他参数,仅受到空间中物质质量分布的影响。Simini等[30]将其应用于无限空间的理想系统中,对预测的出行产生量进行分配。
由于热力学系统的限制,辐射模型在有限系统中会出现低估现象,需要引入归一化因子对模型进行优化[32]。根据是否进行出行产生约束和理想条件修正,本文构建出4个辐射子模型M3、M4、M5和M6。其中,在有限系统中, M = i m i ,当处于无限系统时, M 趋近于无穷大,则 lim M 1 - m i / M = 1
重力模型和辐射模型均属于宏观模型,在群体层面上探究出行行为的同时,通常会丢失与个体相关的出行特征[33]。本文综合考虑群体出行决策与个体出行选择,引入区位空间依赖因子对重力模型和辐射模型进行修正。区位空间依赖是指个体出行者基于自身选择形成的个人出行偏好,包括出行起讫点、出行距离、出行频度等,可以对个体出行特征进行刻画。
根据数据保密要求,将居民个人的区位空间依赖因子映射到网格空间中。在修正模型中,基于重力模型、辐射模型分别引入区位空间依赖因子 A ij ,表征 i 地区与 j 地区之间的平均区位空间依赖。其中, A ij 满足:
A ij = Midian { U ij }

4 模型测算与验证

4.1 出行产生量模拟

基于手机信令数据筛选得到的1 738 776名真实通勤用户,从通勤人口数量和空间分布的角度对模型预测结果进行验证。
4.1.1 人口数量对比
分别提取手机用户通勤人口(预测值)与真实通勤用户(真实值)进行散点图绘制(图3)和OLS模型回归分析(表4)。分析可知,二者呈现显著的线性关系,回归模型的调整R2为0.842,表明在通勤人口数量上具有较好的模拟效果。
图3 2017年北京市通勤人口预测与真值对比

Fig. 3 Commuting population prediction and validation of Beijing in 2007

表4 通勤人口对比OLS回归分析

Tab. 4 OLS analysis of commuting population validation

coef std err t P>|t| [0.025 0.975]
Intercept 118.7107 5.174 22.943 0.000 108.568 128.853
T i - true 2.4216 0.010 231.131 0.000 2.401 2.442

注: T i - true 为基于手机信令数据筛选的真实通勤用户。

4.1.2 空间分布对比
基于各单元网格的模型预测结果和真值数据,构建百分比误差(Absolute Percentage Error,APE)作为检验指标,对预测误差的空间特征进行探究。如式(7)所示, T i 为预测结果, T i - ture 为真值数据:
APE = T i - T i - true T i × 100 %
通过莫兰指数(Moran's Index)检验,判断预测误差是否存在显著的空间异质性。首先,构建全局莫兰指数,对研究区范围内的空间自相关情况进行判断,结果如图4表5所示。通过给定的z得分可以判断,在全局空间中,存在集聚分布情况。
图4 2017年北京市通勤人口预测误差空间自相关检验结果分布(全局莫兰指数)

Fig. 4 Spatial autocorrelation test result (Global Moran's I) of commuting population prediction error in Beijing in 2017

表5 2017年北京市通勤人口预测误差全局莫兰指数统计指标

Tab. 5 Statistics of Global Moran’s I of commuting population prediction error in Beijing in 2017

统计指标 数值
Moran's Index 0.016 302
Expected Index -0.000 100
Variance 0.000 003
z得分 9.699 093
p值 0.000 000
进而,构建局部莫兰指数,对误差集聚现象的分布情况进行探究,结果如图5表6所示。可以得出,① 空间集聚情况总体不显著,表明预测误差没有显著空间差异;② 低值(LL)聚类和高低(HL)异常值现象,主要分布在延庆区东北部和怀柔区北部,由于该区域多为自然风景区,通勤人口分布极少,因而出现误差集聚的现象,在整体上不具有普遍性。
图5 2017年北京市通勤人口预测误差空间异质性(局部莫兰指数)

Fig. 5 Spatial heterogeneity of commuting population prediction error (Local Moran's I) in Beijing in 2017

表6 2017年北京市通勤人口预测误差空间集聚类型统计

Tab. 6 Statistics of spatial agglomeration types of commuting population prediction error in Beijing in 2017

空间集聚情况 集聚数量 集聚数量占比/%
不显著 9878 98.889
高值(HH)聚类 0 0.000
高低(HL)异常值 9 0.090
低高(LH)异常值 8 0.080
低值(LL)聚类 94 0.941
因此,预测误差在空间上没有普遍的异质性,即预测模型在空间分布上表现稳定,模拟效果较好。

4.2 出行分布OD模拟

基于手机信令数据筛选得到真实通勤OD,从OD数量分布和OD数量发生率的角度对模型预测结果进行验证。
4.2.1 OD数量分布
基于出行产生量预测结果,得到手机用户通勤人口总量为5 424 541人,与筛选的真实通勤人口 1 738 776人相差较大。为提升可比性,将真实通勤OD进行等比例扩大(手机),即比例系数=手机用户通勤人口总量/真实通勤人口总量,形成矫正后的通勤OD真值。各模型预测结果与OD真值的数量分布情况如图6所示。其中,M2-1是指在单边约束重力模型M2基础上,引入区位空间依赖因子得到的修正模型,修正模型命名以此类推。
图6 2017年北京市通勤OD模拟与真值验证

Fig. 6 Commuting OD simulation and verification of Beijing in 2017

整体分析可知:① 随着通勤人口数量的增加,通勤OD真值的频率分布呈现出下降趋势;② 根据等比例扩大的原理,矫正前后的通勤OD真值表现出相同的概率密度分布趋势,矫正后的真值整体向右方平移。
在重力模型中:① 非约束重力模型M1的预测结果近似为抛物线形状,即通勤人口较少与较多的OD对频率分布最少;② 单边约束效果显著,模型M2在M1的基础上向真值方向靠近,在通勤人口数量的低值和高值区间,均发生了低估(图6(a)); ③ 区位空间依赖因子修正效果显著,对M2的低估现象进行了改善,整体趋势与真实的通勤OD数据相符,M2-2明显优于M2(图6(b))。
在辐射模型中,① 分别对比矫正前后、单边约束前后的模型M3、M4、M5和M6,各模型预测结果没有明显差异,整体模拟效果较好;② 基于简单性原则,未矫正单边约束辐射模型M4更优,与真值相比,在高值区间出现了高估现象(图6(c));③ 在M4的基础上进行区位空间依赖因子修正,效果不显著(图6(d))。
2组模型对比:① 未修正的辐射模型M4比重力模型M2更优,在通勤人口小于100人的区间内,M4均对OD真值进行了很好的估计。不足的是,在大于100人的区间内,辐射模型发生了明显的高估,重力模型发生了明显的低估(图6(e));② 修正后的重力模型M2-2比辐射模型M4-2有更好的模拟效果,与真值数据具有较好的拟合程度。在通勤人口大于10人的区间内,M2-2与真值数据的分布趋势几乎相同,而M4-2发生了明显的高估现象(图6(f))。
4.2.2 OD数量发生率
将通勤OD与通勤产生量的比率定义为OD数量发生率,可以对OD数量进行归一化处理,计算方式如下:
T ij - ratio = T ij / T i × 100 %
式中: T ij - ratio 表示由 i 区产生,出发通向 j 区的手机用户通勤人口数量与 i 区产生的手机用户通勤人口的占比; T ij i 区通向 j 区的通勤人口数量; T i i 区产生的手机用户通勤人口。同理,可以对真实的OD数量进行归一化处理。
在重力模型、辐射模型和修正模型3种类型中,对出行产生量模拟结果较为优异的模型M2、M4、M2-2和M4-2分别进行OD数量发生率计算,进而与OD真值进行OLS回归分析。结果如表7所示。
表7 2017年北京市通勤OD人口比率回归分析

Tab. 7 Regression analysis of commuting OD population ratio of Beijing in 2017

预测模型 模型名称 拟合优度(调整R2
重力模型 单边约束重力模型M2 0.94
辐射模型 未矫正单边约束辐射模型M4 0.37
修正模型 修正单边约束重力模型M2-2 0.85
修正未矫正单边约束辐射模型M4-2 0.34
分析可知:① 整体上,重力模型的拟合效果明显优于辐射模型,M2优于M4,M2-2优于M4-2;② 引入区位空间依赖因子的修正模型会造成拟合优度的部分降低,修正后的重力模型M2-2仍具有较高的拟合准确度(调整R2为0.85)。综合分析OD数量分布和OD数量发生率的回归结果(表8)可知,重力模型在OD数量分布上,出现明显的低估现象,在OD数量发生率上模拟效果较好;辐射模型在OD数量分布上与真值数据差距较小,在OD数量发生率回归中,拟合效果一般;修正重力模型有效修正了重力模型在OD数量分布上的低估现象,同时在OD数量发生率上模拟效果较好;修正辐射模型在OD数量分布上修正效果不明显,在OD数量发生率回归中拟合效果不理想。因此,基于区位空间依赖因子的修正重力模型综合表现最优。
表8 2017年北京市通勤出行预测模型综合评价

Tab. 8 Comprehensive evaluation of commuting models of Beijing in 2017

模型名称 评价指标
通勤人口数量分布 通勤人口比率
重力模型 - +
辐射模型 + -
修正重力模型 + +
修正辐射模型 + -

注:+表示效果好;-表示效果差。

5 结论与展望

5.1 结论

通勤出行需求的精确预测与模拟是实现科学交通规划的重要内容,也是缓解“城市病”,协调交通与土地利用一体化发展的重要抓手。大数据的应用从理论和实践层面上为通勤出行需求建模提供了新的思路。本文基于北京市2017年手机信令数据,进行交通与土地利用时空间交互作用的分析,通过构建区位空间依赖因子,对广泛应用的重力模型[26,30]和辐射模型[26,32]进行优化和验证。其中,基于引力关系的重力模型是刻画人口流动的重要框架,在人口出行预测研究中应用广泛。基于扩散动力学的辐射模型,由于其无参数性,得到了研究者的广泛关注。
模型模拟结果表明:① 出行产生预测中,通勤人口与常住人口表现出良好的线性关系,区别于传统研究中依赖土地功能、居民属性的建模方法,基于第一性原理的居民就业建模思路更为简洁和高效。② 出行分布预测中,重力模型在回归分析验证中表现最优,在全局的概率密度分布上误差较大,引入区位空间依赖因子后,对重力模型的概率密度分布优化效果显著,在OD数量比率回归分析中拟合优度达到0.85的较高水平。而辐射模型在回归分析验证中拟合效果一般,推测由于模型构建中对OD之间区位特征和需求竞争关系的缺失,同时,在城市内部的尺度上,模型中的直线距离未能很好地表征实际的出行成本[34]

5.2 讨论与展望

在出行分布预测的模拟过程中,本研究具有一定的局限性:
(1) 重力模型在构建过程中,需要通过矫正真实通勤OD数据得到固定的模型参数,对于真值数据量、数据精度有相当的依赖[35],由于模型参数的不通用性,在通勤流量的动态预测中,重力模型具有一定的局限性。
(2) 基于个体出行记录的区位空间依赖,在本文中造成了拟合精度的部分降低。分析可能存在3个方面原因:① 工作地受到较长时期的居民择业影响,本文研究时段只有一个月,其有效性受到限制;② 工作地往往具有稳定性和唯一性,非通勤出行可能造成通勤区位空间依赖的分散;③ 由于数据保密要求,本文通过网格单元对区位空间依赖进行表征,一定程度上减弱了个体区位空间依赖的影响。
在后续研究中,可以从2个方面进行提升:① 针对区位空间依赖特征引起的拟合精度降低,可以从居民择业、非通勤出行和研究尺度的角度对区位空间依赖因子进行考量,对模型拟合精度进行优化;② 针对空间单元大小对数据和模型精确度的影响,应进一步探究空间尺度效应在出行需求预测中的作用机制。
[1]
交通运输部. 城市公共交通“十三五”发展纲要[EB/OL]. http://www.gov.cn/xinwen/2016-07/25/content_5094575.htm,2016-07-25.

[Ministry of Transport. The 13th five-year plan for urban public transport development[EB/OL]. http://www.gov.cn/xinwen/2016-07/25/content_5094575.htm,2016-07-25, 2016-07-25.]

[2]
刘云舒, 赵鹏军, 梁进社. 基于位置服务数据的城市活力研究——以北京市六环内区域为例[J]. 地域研究与开发, 2018, 37(6):64-69,87.

[ Liu Y S, Zhao P J, Liang J S. Study on urban vitality based on LBS data: A case of Beijing within 6th ring road[J]. Areal Research and Development, 2018, 37(6):64-69,87. ]

[3]
郭文伯, 张艳, 柴彦威, 等. 基于GPS数据的城市郊区居民日常活动时空特征——以北京天通苑、亦庄为例[J]. 地域研究与开发, 2013, 32(6):159-164.

[ Guo W B, Zhang Y, Chai Y W, et al. Study on spatio-temporal figure of suburban residents based on GPS data: A case study of Tiantongyuan and Yizhuang in Beijing[J]. Areal Research and Development, 2013, 32(6):159-164. ]

[4]
龙瀛, 张宇, 崔承印. 利用公交刷卡数据分析北京职住关系和通勤出行[J]. 地理学报, 2012, 67(10):1339-1352.

[ Long Y, Zhang Y, Cui C Y. Identifying commuting pattern of Beijing using bus smart card data[J]. Acta Geographica Sinica, 2012, 67(10):1339-1352. ]

[5]
海晓东, 刘云舒, 赵鹏军, 等. 基于手机信令数据的特大城市人口时空分布及其社会经济属性估测——以北京市为例[J]. 北京大学学报(自然科学版), 2020, 56(3):518-530.

[ Hai X D, Liu Y S, Zhao P J, et al. Using mobile phone data to estimate the temporal-spatial distribution and socioeconomic attributes of population in megacities: a case study of Beijing[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(3):518-530. ]

[6]
杨飞, 裘炜毅. 基于手机定位的实时交通数据采集技术[J]. 城市交通, 2005(4):67-72.

[ Yang F, Qiu W Y. Mobile phone location based real time traffic data collection-research[J]. Urban Transport of China, 2005(4):67-72. ]

[7]
冉斌. 手机数据在交通调查和交通规划中的应用[J]. 城市交通, 2013, 11(1):72-81,32.

[ Ran B. Use of cellphone data in travel survey and transportation planning[J]. Urban Transport of China, 2013, 11(1):72-81,32. ]

[8]
Ygnace J-L, Drane C, Yim Y B, et al. Travel time estimation on the San Francisco Bay Area network using cellular phones as probes[R]. Institute of Transportation Studies, UC Berkeley, 2000.

[9]
Lovell D J. Accuracy of speed measurements from cellular phone vehicle location systems[J]. ITS Journal - Intelligent Transportation Systems Journal, 2001, 6(4):303-325.

DOI

[10]
王西点. 基于手机位置的实时交通信息采集技术[J]. 中国交通信息产业, 2009(1):128-130.

[ Wang X D. Real-time traffic information collection technology based on mobile phone location[J]. China Transportation Information Industry, 2009(1):128-130. ]

[11]
González M C, Hidalgo C A, Barabási A L. Understanding individual human mobility patterns[J]. Nature, 2008, 453(7196):779-782.

DOI PMID

[12]
Calabrese F, Di L G, Liu L, et al. Estimating origin-destination flows using opportunistically collected mobile phone location data from one million users in Boston Metropolitan Area[J]. IEEE Pervasive Computing, 2011, 10(4):36-44.

DOI

[13]
杨飞. 基于手机定位的交通OD数据获取技术[J]. 系统工程, 2007(1):42-48.

[ Yang F. Traffic OD data collection based on cell phone location technology[J]. Systems Engineering, 2007(1):42-48. ]

[14]
Mcnally M G. The Four Step Model[M]. Bingley: Emerald Group Publishing Limited, 2007.

[15]
肖秋生, 徐慰慈. 城市交通规划[M]. 北京: 人民交通出版社, 1990.

[ Xiao Q S, Xu W C. Urban transportation planning[M]. Beijing: China Communications Press, 1990. ]

[16]
Modi K B, Zala L B, Umrigar F, et al. Transportation planning models: a review[C]// Proceedings of National Conference on Recent Trends in Engineering and Technology, 2011.

[17]
Casey H J. Applications to traffic engineering of the law of retail gravitation[J]. Traffic Quarterly, 1955, 9(1):23-35.

[18]
Stouffer S A. Intervening opportunities: A theory relating mobility and distance[J]. American Sociological Review, 1940, 5(6):845-867.

DOI

[19]
Manski C F. The structure of random utility models[J]. Theory and Decision, 1977, 8(3):229.

DOI

[20]
Ben-Akiva M E, Lerman S R. Discrete choice analysis: theory and application to travel demand[M]. Cambridge: MIT Press, 1985.

[21]
Pitombo C S, De Souza A D, Lindner A. Comparing decision tree algorithms to estimate intercity trip distribution[J]. Transportation Research Part C: Emerging Technologies, Elsevier, 2017, 77:16-32.

[22]
Dantas A, Yamamoto K, Lamar M V, et al. Neural network for travel demand forecast using GIS and remote sensing[C]// Proceedings of the IEEE-INNS-ENNS International Joint Conference on Neural Networks. IJCNN 2000. Neural Computing: New Challenges and Perspectives for the New Millennium. IEEE, 2000, 4:435-440.

[23]
李涵. 组团城市出行分布模型优化研究[D]. 重庆:重庆交通大学, 2012.

[ Li H. Trip distribution models optimization research in cluster city[D]. Chongqing: Chongqing Jiaotong University, 2012 ]

[24]
北京市统计局. 北京统计年鉴2018[EB/OL]. http://nj.tjj.beijing.gov.cn/nj/main/2018-tjnj/zk/indexch.htm.

[Beijing Municipal Bureau of Statistics. Beijing statistical yearbook in 2018[EB/OL]. http://nj.tjj.beijing.gov.cn/nj/main/2018-tjnj/zk/indexch.htm]

[25]
北京交通发展研究院. 2018年北京交通发展年报[EB/OL]. http://www.bjtrc.org.cn/List/index/cid/7.html.

[Beijing Transport Institute. Beijing transportation development annual report in 2008[EB/OL]. http://www.bjtrc.org.cn/List/index/cid/7.html.]

[26]
高德地图. 2017 年度中国主要城市交通分析报告[EB/OL].

[AutoNavi. China major city traffic analysis report in 2017[EB/OL]. https://trp.autonavi.com/download.do. ]

[27]
Hansen W G. How accessibility shapes land use[J]. Journal of the American Institute of Planners, 1959, 25(2):73-76.

DOI

[28]
赵鹏军, 万婕. 城市交通与土地利用一体化模型的核心算法进展及技术创新[J]. 地球信息科学学报, 2020, 22(4):792-804.

DOI

[ Zhao P J, Wan J. The development and innovation of the core algorithm of the integrated model of urban transport and land use[J]. Journal of Geo-information Science, 2020, 22(4):792-804. ]

[29]
赵鹏军, 万婕. 城市交通与土地利用一体化模型的理论基础与发展趋势[J]. 地理科学, 2020, 40(1):12-21.

DOI

[ Zhao P J, Wan J. The key technologies of integrated urban transport-land use model: Theory base and development trends[J]. Scientia Geographica Sinica, 2020, 40(1):12-21. ]

[30]
Simini F, González M C, Maritan A, et al. A universal model for mobility and migration patterns[J]. Nature, 2012, 484(7392):96-100.

DOI

[31]
Lenormand M, Huet S, Gargiulo F, et al. A universal model of commuting networks[J]. PLoS One, 2012, 7(10):e45985.

DOI

[32]
Masucci A P, Serras J, Johansson A, et al. Gravity versus radiation models: On the importance of scale and heterogeneity in commuting flows[J]. Physical Review E, 2013, 88(2):022812.

DOI

[33]
Yan X Y, Wang W X, Gao Z Y, et al. Universal model of individual and population mobility on diverse spatial scales[J]. Nature Communications, 2017, 8(1):1-9.

DOI

[34]
Ren Y, Ercsey-Ravasz M, Wang P, et al. Predicting commuter flows in spatial networks using a radiation model based on temporal ranges[J]. Nature Communications, 2014, 5(1):1-9.

[35]
Lenormand M, Bassolas A, Ramasco J J. Systematic comparison of trip distribution laws and models[J]. Journal of Transport Geography, Elsevier, 2016, 51:158-169.

Outlines

/