地球信息科学理论与方法

共享单车出行OD的时空注意力残差网络预测模型

  • 曹弋 , * ,
  • 白涵文 ,
  • 王艺筱
展开
  • 大连交通大学交通运输工程学院,大连 116028

曹弋(1982— ),男,辽宁大连人,博士,教授,主要从事交通运输规划与管理研究。E-mail:

Copy editor: 蒋树芳

收稿日期: 2023-07-17

  修回日期: 2023-10-11

  网络出版日期: 2024-03-31

基金资助

辽宁省社会科学规划基金项目(L22BSH003)

Spatiotemporal Attention Residual Network Prediction Model for OD of Bicycle Sharing Trips

  • CAO Yi , * ,
  • BAI Hanwen ,
  • WANG Yixiao
Expand
  • School of Transportation Engineering, Dalian Jiaotong University, Dalian 116028, China
*CAO Yi, E-mail:

Received date: 2023-07-17

  Revised date: 2023-10-11

  Online published: 2024-03-31

Supported by

Social Science Planning Fund Project of Liaoning Province(L22BSH003)

摘要

为探究共享单车出行的复杂时空规律与特性,揭示城市因素对共享单车出行OD的影响,提高OD预测精度,开展本研究。结合城市计算,考虑疫情、天气、温度、风速与节假日因素,构建共享单车出行OD的时空注意力残差网络预测模型(USTARN)。 USTARN先将共享单车OD数据通过时空特征切分捕捉单车流的时空依赖性,再结合注意力机制进行深度残差学习,最后根据城市因素学习结果调整预测结果。利用从政府数据开放平台获取的深圳市共享单车订单大数据及城市因素数据集,分析共享单车出行时空分布规律及其影响因素。将OD数据集按7:1:2划分为训练集、验证集与测试集,分别进行训练预测、模型参数自适应调整及模型验证对比实验。研究表明,USTARN模型的共享单车出行OD预测平均误差为7.68%,与不含城市计算的STARN模型及传统的CNN, BiLSTM模型相比,误差分别降低了5.93%、7.55%、6.07%,预测精度显著提高。 USTARN模型充分反映了时间、空间、疫情、天气、温度、风速等因素对共享单车出行OD的影响。研究成果对共享单车出行OD的精准预测具有理论指导意义,对该出行模式的推广并解决居民出行“最后一公里”问题具有实际应用价值。

本文引用格式

曹弋 , 白涵文 , 王艺筱 . 共享单车出行OD的时空注意力残差网络预测模型[J]. 地球信息科学学报, 2024 , 26(3) : 556 -566 . DOI: 10.12082/dqxxkx.2024.230407

Abstract

This study aims to explore the complex spatiotemporal patterns of bicycle-sharing trips, reveal the influence of urban factors on the OD of bicycle-sharing trips, and improve the accuracy of OD prediction. Combining the theory of urban computing, urban factors such as the epidemic, months, weather conditions (minimum temperature, maximum temperature, and wind speed), and whether it is a weekday along with the length information of non-motorized lanes are selected to construct a bicycle-sharing demand prediction model (USTARN) that integrates urban computing and spatiotemporal attention residual network. USTARN first captures the spatiotemporal dependence of sharing bicycle flow through spatial area division and time series slicing, then combines the attention mechanism for deep residual learning, and finally adjusts the deep residual prediction results according to the urban factor prediction results to improve the model performance. Using the big data from bicycle orders and urban factor datasets in Shenzhen obtained from the government data open platform, this study visualizes the spatiotemporal distribution patterns of bicycle-sharing trips and analyzes their influencing factors using the Python development environment. The OD data set is divided into training set, verification set, and test set in a 7: 1:2 ratio, and the model training, model parameter adaptive adjustment, and model result comparison are carried out, respectively. The results show that the average error of the USTARN model for OD prediction of bike-sharing trips is 7.68%, which is 5.93%, 7.55%, and 6.07% lower than that of the STARN model without urban computing and the traditional CNN model, which is good at data feature extraction, and the BiLSTM model, which is good at dealing with bi-directional time-series data, respectively. The USTARN model fully reflects the influence of time, space, epidemic, weather, and other factors on the OD of bike-sharing trips. Our results have theoretical guiding significance for the accurate prediction of bike-sharing trip OD, which can provide a scientific basis for urban non-motorized roadway planning and have practical application value for the promotion of bike-sharing travel mode and solving the 'last mile' problem of residents travel.

1 引言

共享单车在资源共享、绿色低碳与大数据智能化管理等方面优势明显。在短距离出行和公交接驳中,居民愈发倾向选择共享单车。这将使私家车需求减少,慢行交通增加,地铁与公交出行相应增加。OD(Origin-Destination)量作为交通预测与规划的核心数据,表征了出行起点小区与终点小区之间(OD对)的出行量。自i小区出发,终到j小区的OD量可记为Xij,反之记为Xji。总体OD可用OD矩阵表示,它反映了两两小区之间的出行交换量。该数据的精准预测是本文的研究核心。然而,当前的共享单车出行OD预测手段较单一,考虑因素片面,预测精度不高,难以为后续的设施规划与数量配给提供充分依据和有力支撑,一定程度上制约了该出行方式的发展[1]。因此,利用大数据资源,融合城市计算与时空残差网络,构建共享单车出行OD预测模型以提高预测精度,尤为必要。
国内外学者对共享单车出行进行了诸多研究。在出行规律与影响因素方面,付学梅等[2]对共享单车骑行数据进行赫希曼指数计算,表明工作日呈现两个明显骑行高峰,非工作日较均匀。Zhao等[3]基于网格交通需求模式聚类使用DTW算法研究出行规律,认为共享单车的主要交通功能为地铁接驳。Du[4]结合概率拟合、随机森林等方法对上海市摩拜单车系统进行层次聚类分析,发现居住面积、公园绿地面积及人口规模与单车使用频率成正相关。Matthew等[5]通过网络问卷调查了北京市用户使用共享单车的意愿,时空特性分析结果表明,周转率高的地区多为居民区及附近公交站点。El-assi等[6]采用多元线性回归模型研究Toronto共享单车出行的影响因素,发现人口密度、自行车道规模及公交枢纽周边用地性质对单车出行均有正影响。Zhang等[7]的研究发现,路网交叉口密度、交通枢纽空间分布、单车基础设施数量对单车出行有显著影响。上述研究表明,用地、人口、交通设施等稳定因素对共享单车出行特征的影响,是通过长期作用反映到人们日常出行规律中的。因此,通过历史出行数据训练,可以反映出上述因素对出行特征的影响。但并未考虑天气、疫情等随时间变化因素对共享单车出行的影响。
在预测模型与算法方面,深度学习是机器学习的进一步发展,近年来广泛应用于交通预测。其中长短时神经网络(LSTM)颇受学者们青睐,张鹏飞等[8]利用LSTM深度学习网络从历史信息中选择与出行行为密切相关的特征,提高了出行OD预测精度。许淼等[9]引入注意力机制构建AM-LSTM预测模型,更好的捕捉了共享单车的出行时空特征,提高了预测精度。李福等[10]基于极端梯度推进决策树(XGBoost)算法发现了共享单车借车数量与气温、风速、天气等因素相关。Zhang等[11]采用贝叶斯结构时间序列模型量化了疫情导致单车出行量的激增。乔少杰等[12]结合天气特征,利用LSTM预测各站点的共享单车发生量。温惠英等[13]基于双向长短神经网络(BiLSTM)进行交通流预测预测,预测精度高于传统的LSTM; BiLSTM多用于双向时序数据,在预测精度上高于传统的LSTM。除此之外还有善于抓取数据特征的卷积神经网络(CNN)。如李帅等[14]利用卷积神经网络(CNN)提取城市交通数据的空间特征,提高了交通拥堵预测精度。杨帆等[15]融合卷积神经网络的特征提取能力和双向长短期记忆网络的双向时序数据处理能力,构建卷积长短期记忆网络模型(CNN-BiLSTM)预测共享单车需求量。深度学习方法均通过对历史出行数据的训练,学习掌握出行规律,进而预测未来出行量。客观上反映了用地、人口、交通设施等稳定因素对出行特征的影响。但仍缺少非稳定因素对预测结果的调整。
尽管国内外学者对共享单车OD预测进行了相关研究,但大多是对传统模型的改进或神经网络模型的开发。前者对数据的规律性要求较高,往往需要配合大规模出行调查,数据获取代价大、抽样率低且存在不可靠数据。后者虽能利用大数据克服前者不足,但多为站点群预测,存在训练机制单一、较少考虑天气、疫情等随时间变化的因素对单车出行的影响、预测精度普遍不高等短板。且现有研究大多仅预测发生与吸引量,缺少对OD量的预测。
本研究使用融合注意力机制的时空序列切分残差网络模型学习并预测共享单车OD量,能够在继承残差网络原本优势的同时,进一步提高模型预测精度;通过城市计算综合考虑城市多种因素调整预测结果,以反映城市多因素对单车OD的综合影响。研究成果对共享单车OD预测理论的进步与发展、智能化管理水平的提高,具有理论指导意义;对OD精准预测、出行模式推广并解决居民出行“最后一公里”问题,具有重要的实际应用价值。

2 OD量预测模型

2.1 USTARN模型结构

本研究针对传统OD预测方法,基于城市计算智能算法,提出改进的共享单车OD预测模型。传统的交通预测“四阶段”法包括出行生成、出行分布、交通方式划分与交通分配。其中出行分布的任务就是预测OD量,最具代表性的模型为重力模型。预测时,需要利用人工调查统计到的现状OD量,标定重力模型参数。再利用前一阶段预测出的交通小区发生与吸引量,利用标定后的重力模型逐一计算两两小区间的OD量。该过程中的人工工作量较大、调查为抽样调查、数据样本易偏且预测精度较低。本研究提出融合城市计算与时空注意力残差网络模型(USTARN),是借助大数据与智能算法,自学习出行特征与规律,自训练因素影响机制,进而实现OD预测。图1为USTARN模型结构,主体包括数据处理模块、OD数据预测模型、城市因素预测模型及融合预测4部分,其中OD数据预测模型包括空间区域划分模块、时间序列分割模块、结合注意力机制的残差网络模块及组合预测模块。
图1 USTARN模型结构

Fig. 1 USTARN model structure

数据处理模块将所有数据集清洗为有效数据,将共享单车订单数据集计为OD数据,为了避免学习过程中梯度爆炸并加快收敛及训练速度。将城市因素数据归一化处理[16]。计算过程如式(1)所示。
x n e w = x - x m i n x m a x - x m i n
式中:x为原始气温数据; x n e w则为归一化后的气温; x m i n为气温数据中的最小值; x m a x为气温数据中的最大值。
OD数据输入SAD模块中划分空间小区,在TSS模块中切割时间序列,生成XhXdXw即邻近小时、日及周数据片段。将XhXdXw输入EResNet模块中预测深度残差,然后通过Att模块强化预测流矩阵YhYdYw,再输出OD预测结果Y1。将城市因素归一化数据嵌入全连接层,将其从低维映射到高维输出某一小时预测结果Y2。融合预测层将Y1Y2输入全连接层并根据Y2调整Y1,输出未来某小时各区域共享单车OD量的批量预测最终结果Ypred

2.2 OD数据预测模型

(1) 时空单位定义
定义1:定义时间步长c为1 h,即OD数据集单位为辆/(小时·小区)。定义小区编号为i(i=1, 2, 3,…, 步长编号为t(t=1, 2, 3, …, n),历史时长为T(T=1, 2, 3, …, n)。以数据集中第一个小时节点为时间起点,定义小区i到小区j的第t个时间步长内OD量为Xij(t)∈R。定义时间节点o小区i到小区j在历史T时间步长内总的历史OD量为Xij={Xij(o)|o=1, 2, …, T}。
(2) 空间区域划分(SAD)
结合地理信息数据,对待测区域进行经纬度网格划分处理,将一个待测大区划分为若干个相同形状的小区,将输出的预测结果由一个总量转化为一批分量,可更精确地掌握各个小区共享单车用户实时出行OD量。
(3) 时间序列分割(TSS)
依据时空数据规律,少数前期关键数据可以决定少数未来数据,而交通数据的本质是具有周期性的时间序列数据,故应综合不同步长的时间特性预测未来OD量。模型将输入数据集按时间维度切割为3个片段——邻近小时,日及周数据片段。
定义2:待测时间序列长度Tx=1,即预测未来 1 h内的单车OD量;邻近小时数据片段Yh、邻近日数据片段Yd与邻近周数据片段Yw分别为待测片段前1 h、1 d与1周的数据。
(4) EResNet层:残差网络在处理数据时将上层输出参数输入残差层后与本层卷积参数相加输出结果H(x)=F(x)+x,使模型较好的保存原有参数特性,可避免梯度爆炸等问题。本研究使用残差网络,削弱卷积堆叠对模型的副作用,增强对数据结构空间依赖性的捕捉及分析。对3种时间特征的数据分别预测,采用相同的EResNet网络结构,每个网络结构由两个残差层组成,每个残差层均由卷积层及激活函数组成。
(5) Att层:本模型将3个EResNet输出的不 同流矩阵输入注意力单元,根据其时空依赖性重新分配权重。注意力单元包含挤压、激发和加权 3个步骤。假定输入注意力模块的特征图尺寸为W×L,通道数为C,在经过注意力单元后,得到的特征图尺寸和通道数不变,只改变了特征图像素点之间的权重比,使具有更多有用信息的特征图权重变得更大。
(6)组合预测层:由单车空间分布特性可知,不同网格均受到彼此间不同程度的邻近性、周期性、趋势性影响。故将Att层输出的不同时间特征预测流矩阵YhYdYw输入一个全连接层,将3个时间特征预测结果结合,得到共享单车出行OD量预测结果,即流矩阵Y1,如式(2)所示。
Y 1 = θ h Y h + θ d Y d + θ w Y w
式中: θ h θ d θ w为3个分别代表邻近小时、日和周影响的可训练参数; 为哈达玛积。

2.3 城市因素预测模型

由城市因素分析可知,共享单车的出行在土地利用、人口、交通设施等稳定的城市因素影响下已经形成出行规律。由图2可知,在土地类型、人口、交通设施等稳定因素,天气、气温、温度、疫情等非稳定因素的综合影响下,宝安区、福田区、南山区、罗湖区及龙华区的共享单车出行量在2021年1—4月变化较大,但整体出行量明显高于其它地区。因此,利用共享单车历史OD数据,训练出行规律并预测未来出行OD,就反映了稳定因素对出行规律的影响。通过模型的城市因素预测模型与融合预测,考虑天气、气温、温度、疫情等因素的影响,调整OD预测结果,方可反映非稳定因素的影响。
图2 各区每月共享单车出行量统计

Fig. 2 Statistics of monthly shared bike trips

城市因素数据集的时间维度应与OD数据集对应。其中工作日与节假日信息能够直接获取,而天气、疫情等未知特征可使用时间特性为Xh的特征数据近似预测Tx时刻的特征数据。从网络结构上分析,即将归一化后的特征数据集嵌入全连接层,输出预测结果Y2

2.4 融合输出端

(1) 输入数据:输入到全连接神经网络的数据包括城市特征流矩阵、共享单车OD预测流矩阵以及时间信息。这些数据经过预处理,转换为神经网络可接受的形式。
(2) 高维映射:在全连接神经网络中,每一层都对输入数据进行加权求和与非线性变换。这样,网络可以学习到从单一城市特征的低维到多个城市特征的高维复杂映射,捕捉数据中更高级别的特征。
(3) 调整OD预测流矩阵:根据学习到的城市因素对共享单车出行的影响规律,神经网络可以调整OD预测流矩阵。模型中预留了其他因素对共享单车出行OD影响的调整模块结构,以便未来的功能扩展。
(4) 输出结果:在输出层,全连接神经网络将调整后的高维OD预测流矩阵降维输出OD预测结果。

3 数据与分析

3.1 数据集

(1) 共享单车数据
深圳市共享单车运营商有哈啰单车、青桔单车及美团单车。全市注册用户2 911万人,单车日均使用量达138万人次,车辆日均周转率3.5次,是我国共享单车系统较为完备的城市之一,具有典型的代表性及研究价值。本研究收集整理了深圳 市政府数据开放平台公布的共享单车数据集,时间跨度自2020-01-30—2021-04-15,共计441 d,其中包括364 d无疫情数据和95 d有疫情数据,总计38 096 760条订单数据,每条数据包含车辆编号,订单编号,起讫点坐标及起讫时刻,示例如表1所示。
表1 深圳市共享单车订单数据示例

Tab. 1 Example of bicycle sharing order data in Shenzhen

车辆编号 起点时间 起点纬度/°N 起点经度/°E 讫点时间 讫点纬度/°N 讫点经度/°E
8c3692da54d90dbf6dc22d 2020-12-30 13:54 22.523 06 114.040 15 2020-12-30 14:30 22.518 42 114.058 58
b502ad04cf4dc7cdbd5ba4 2020-12-30 13:54 22.522 98 114.040 27 2020-12-30 14:30 22.518 33 114.057 92
b5576b989742ba817cffec 2020-12-04 0:10 22.522 79 114.039 53 2020-12-04 0:22 22.519 21 114.052 43
143ea93f0d7e0e193728b8 2020-12-04 0:10 22.522 82 114.039 58 2020-12-04 0:22 22.519 24 114.052 41
1bee57a32c25b9ff567ad7 2020-12-04 20:42 22.520 16 114.040 21 2020-12-04 20:47 22.517 22 114.041 52
(2) 城市因素数据
天气因素对共享单车出行OD有重要影响。OD预测结果后续可用于指导设施规划与策略实施。如夏季持续高温时,调整投放量和出行策略。通过深圳市气象局网站获取历史气象数据包括当日最低气温、最高气温、风速(1—5级)、天气状况(1 晴天,2 多云或阴,3 小雨或霾,4 中雨或大风或小雪,5 恶劣天气)。
整体数据集中包含有疫情与无疫情的时段,可全面反应有、无疫情时共享单车的使用情况及规律。既可用于疫情期间OD预测,又可用于无疫情期间OD预测。在对无疫情和未来其他类似突发公共卫生事件期间,掌握共享单车OD出行规律均有一定参考作用,具有普适性及实用价值。通过政府疾控中心网站获取疫情数据,包括当日新增病例数、累计确诊数、现存病例数、累计治愈数、累计死亡数。
此外,工作日与非工作日、不同用地性质的共享单车出行特征也有不同。表2中显示,同一区域工作日出行热度高于非工作日;同一时段居民区出行热度高于商业区。
表2 典型区域工作日与非工作日出行热度对比

Tab. 2 Comparison of heat on weekdays and non-weekdays in typical areas

早高峰8:00—9:00 工作日(4月12日) 非工作日(4月11日)
公司企业型区域(如招商银行、万科总部等)
居民住宅型区域(如深圳石厦社区)

3.2 出行时空分布特性

(1) 空间分布
通过对订单状态筛选、位置提取并匹配ArcGIS,可对共享单车起讫点位置进行可视化分析, 图3为2021年4月13日共享单车订单起点分布情况。
图3 4月13日共享单车订单起点分布

Fig. 3 Starting point distribution of bike saring orders on April 13th

通过对深圳市行政区进行小区划分,划分为16×16共256个网格单元,将订单GPS数据填充 进各小区,可得到不同地理属性的共享单车小时分布。发现共享单车主要集中地为居民区及公共交通枢纽附近、商业及工业用地区域,且城市化高的市中心地区分布量远高于郊区,宝安区出行量最多,福田区出行密度最大,坪山区及大鹏新区出行量鲜少。其中大量市民由住宅区-轨道站点-写字楼之间的短途接驳需求旺盛,出行目的多为通勤。
(2) 时间分布
通过连接订单数据与日历信息,可得到共享单车工作日与非工作日的小时出行量。引用seaborn库强化可视化分析,发现工作日单车出行量均呈现马鞍状分布,在8:00及18:00达到顶点,且早高峰出行量大于晚高峰,工作日时间分布不均匀性明显,非工作日白天单车出行量分布均匀,如图4所示。
图4 不同时间属性共享单车OD出行量

Fig. 4 Shared bike OD trips by time attribute

综合时空分析可以发现,发生量主要集中于早7:00—9:00居民区及附近交通枢纽和晚16:00— 20:00商业区及企业用地,吸引量分布时间与地点恰好相反。
(3) 骑行距离分布
使用Python计算2020年1—4月每个订单起讫点间距离作为共享单车出行距离d(矢量距离),以 1 000 m以内、1 000~2 000 m、2 000~3 000m、3 000~4 000 m、4 000~5 000 m、5 000 m以上为单位按月份集计订单出行距离,如图5所示。
图5 2020年1-4月订单出行距离分布

Fig. 5 Distribution of distance travelled for orders in January to April 2020

将接驳范围通常为1 km定为出行距离分割界限,对比无疫情的2020年1—4月与疫情管控严格的2021年1—4月共享单车出行距离,可以发现 1 km内短距离出行占比由51%下降至40%,大于 1 km的中长距离出行占比由49%增长至60%,表明深圳共享单车疫情期间中长途骑行需求提升,其独自承担完整出行的能力有所提高,如图6所示。
图6 2020年与2021年1-4月长短距离出行比例分布

Fig. 6 Distribution of the proportion of long and short distance trips between 2020 and 2021, January to April

3.3 城市因素对出行的影响

对数据进行时间特征处理,利用pandas计算数据的斯皮尔曼相关系数矩阵,如图7所示。
图7 城市因素影响分布

Fig. 7 Distribution of the impact of urban factors

(1) 疫情。关联疫情与单车订单数据可分析二者间关系,如图8所示。疫情发生时日均出行量较无疫情时增加50%左右,这是由于政府缩减公共交通服务且疫情在共享单车系统中传播风险较小所致。每日新增人数达10人以上时,日均出行量缩减至5万辆左右,推测是由于疫情管控措施升级导致居民出行总量骤减。
图8 新增确诊数与日均发生量的关系

Fig. 8 Relationship between the number of new confirmed diagnoses and the average daily number of occurrence

(2) 气温。结合气温数据与订单数据分析发现,在当日最低气温低于10℃及大于25℃时出行量较小,处于10℃~25℃时出行量大于150万辆。
(3) 天气。结合天气数据与订单数据分析发现,天气状况对出行量有显著影响,晴朗、多云天气日均出行量大于120万辆,雾霾及小雨天气出行量有所下降,中雨及以上恶劣天气出行量极少。
(4) 风速。结合风速数据与订单数据分析发现,风级与日均出行量成反比,1级风时日均出行量最高,4级风时极少,5级风时无出行量。
综上可得,疫情、气温、天气及风速因素对共享单车出行均存在一定影响。月份和是否工工作日的影响性体现在时空序列中。由于这些因素对共享单车出行存在的影响,本文谈及的城市因素包括疫情、气温、天气、风速[17]

4 结果与讨论

4.1 模型评价指标

USTARN模型训练后,可以通过3个流矩阵和城市因素特征值预测Xt。选择均方根误差作为评估函数,如式(3)—式(5)所示。
M A E = 1 n i = 1 n Y p r e d , i - Y t r u , i
R M A E = 1 n i = 1 n ( Y p r e d , i - Y t r u , i ) 2
M A P E = 100 % n i = 1 n Y p r e d , i - Y t r u , i Y t r u , i
式中: Y p r e d , i为第i个预测的流矩阵; Y t r u , i为第i个真实的流矩阵。

4.2 数据处理

对单车出行密度最大的福田区订单数据集清洗并剔除无效数据后,得到7 515 620条有效订单数据。经过OD数据集计后,获得2 073 538条小时共享单车OD数据,数据标签及内容如表3示例所示。
表3 共享单车OD数据集示例

Tab. 3 Example of shared bike OD dataset

时间段 起点经
度区域
起点纬
度区域
终点经
度区域
终点纬
度区域
OD量
/辆
2020-01-30 11:00 13 3 11 2 1
2020-01-30 12:00 2 3 14 5 2
2020-01-30 13:00 11 3 14 4 1
2020-01-30 14:00 22 9 24 7 0
2020-01-30 18:00 21 12 21 10 2
为消除城市因素数据单位不统一、数值过大或过小对最终预测层带来的不利影响,使用sklearn库对城市因素数据集归一化处理。归一化后的城市其他数据集示例如表4所示。
表4 城市因素数据预处理结果示例

Tab. 4 Example of pre-processing results for urban factor datat

时间 现存确诊 当日新增 最高温度 最低温度 天气 风速等级 是否工作日
2020-01-30 9:00 0.117 52 1.000 00 0.333 33 0.217 39 0.25 0.090 91 0
2020-02-02 13:00 0.223 95 0.349 06 0.466 67 0.304 35 0.00 0.045 45 0
2020-02-05 13:00 0.335 92 0.042 45 0.433 33 0.391 31 0.25 0.000 00 1
2021-02-19 14:00 0.066 52 0.075 47 0.533 33 0.434 78 0.00 0.045 45 1
2021-04-03 8:00 0.643 02 0.000 00 0.800 00 0.782 61 0.00 0.000 00 0

4.3 USTARN对比实验

USTARN模型将城市因素与共享单车历史大数据共同作用于映射关系并克服传统模型的短板,进而实现OD预测。
为了验证城市因素预测模块的必要性,实验以有无城市因素预测模块作为控制变量,对比含城市因素预测模块的时空注意力残差网络预测模型(USTARN)与不含城市因素预测模块的时空注意力残差网络预测模型(简称STARN)。
为了验证USTARN模型优越性,使用传统成熟模型CNN[18]与BiLSTM[19]分别预测共享单车OD并比较模型预测结果。CNN为使用3×3卷积核的卷积神经网络,该模型避免了传统算法中复杂的特征提取和数据重建,在处理过程中有较大优势,适用于存在多尺度特征的短期预测。BiLSTM为结合前向LSTM与后向LSTM的长短时预测模型,该模型有效解决了简单循环神经网络的梯度爆炸或消失问题,适用于非线性单元,也适用于构造更大型深度神经网络。USTARN克服了传统非线性预测模型中影响因素单一和数据深度不能兼容的问题,适用于多因素特征的深度神经网络预测。
实验采用tensorflow及keras等框架实现,分别运用USTARN、STARN、CNN、BiLSTM 共4种模型预测OD,将数据集按7:1:2划分为训练集、验证集和测试集,以第118区域2021年3月24日4时—4月15日24时共计500 h的共享单车发生量与吸引量作为测试集输出示例。使用MAE、RMSE、MAPE作为模型评价指标,比较模型预测精度,如表5所示。
表5 各模型误差表现

Tab. 5 Error performance of each model

模型 MAE RMSE MAPE/%
USTARN 16.73 22.87 7.68
STARN 27.05 34.23 13.61
CNN 30.82 40.21 15.23
BiLSTM 27.54 35.75 13.75
为了清晰展示预测效果拟合曲线,防止因时 间过长而导致拟合曲线重叠而难以辨认差异,截 取48 h的拟合曲线作为示例分析说明。使用Adam作为模型优化器,以2021年4月7日及8日第19—40区与第48—56区OD量作为最终预测结果输出示例,并与实际值对比,如图9图10所示。
图9 4月7日第19—40区OD量预测结果对比

Fig. 9 Comparison of OD volume forecast results for the April 7 19th & 40th intervals

图10 4月8日第48—56区OD量预测结果对比

Fig. 10 Comparison of OD volume forecast results for the April 8 19th & 40th intervals

表5可知,USTARN模型的3种评价指标均小于不含城市计算的STARN模型,说明USTARN的预测精度更高,也证实了不能忽视城市因素对共享单车OD量的显著影响;USTARN削弱卷积堆叠对模型的副作用,增强对数据空间依赖性及时间序列依赖性地捕捉及分析,预测误差均小于其他2种传统预测模型,更加说明其预测精度优越性。由图9图10可以发现,较其他3种模型拟合表现,USTARN预测趋势是最贴近实际值的,既 本模型具有良好的学习与预测能力,将预测OD进行地图匹配可以获得福田区4月8日OD出行图如图11所示。
图11 4月8日福田区预测OD量

Fig. 11 Forecasts OD volume for futian district on 8 April

5 结论

为有效提高共享单车OD预测精度,提出了融合城市计算的时空序列切分残差网络模型,该模型融合了共享单车时空数据,实现了对共享单车OD的精准预测。以深圳市地区作为研究对象,研究得出以下结论:
(1) 本研究在现有残差神经网络基础上加入时空切分以强化OD出行时空依赖性特征,加入注意力影响机制以强化OD分布聚集特性,加入城市计算模块改善OD预测效果,为模型功能扩展预留了其他影响因素调整模块的接口。对比验证结果表明, USTARN模型平均误差为7.68%,与STARN模型及传统CNN, BiLSTM模型相比,误差分别降低了5.93%、7.55%、6.07%。USTARN模型不仅继承了普通残差网络模型的优越性,还添加了时空依赖性特征及城市因素影响,进一步提升了其OD预测准确性。
(2) 研究发现OD量呈现明显的时空规律性,早高峰住宅区附近发生量较大,商业和工业用地附近吸引量较大,晚高峰反之,工作日需求波动远大于非工作日。晴朗、多云天气日均出行量最多,雾霾及小雨天气出行量有所下降,中雨及以上恶劣天气出行量极少。疫情期间,共享单车独自承担中长距离完整出行的比例高于无疫情时期,短距离出行比例较无疫情时期有所降低。
由于数据集与研究条件限制,案例分析中未能选取更多城市因素数据集和分析用户个体出行偏好,未来工作中,可添加更多上述因素并添加相应功能模块,利用更好研究条件进一步预测更大范围的单车需求。尽管如此,本研究所取得的一般性规律与模型方法,仍可为同类研究所借鉴。
[1]
Duan Y M, Zhang S, Yu Z R. Applying Bayesian spatio-temporal models to demand analysis of shared bicycle[J]. Physica A: Statistical Mechanics and Its Applications, 2021, 583:126296. DOI:10.1016/j.physa.2021.126296

[2]
付学梅, 隽志才. 时间维度下上海市共享单车骑行模式研究[J]. 交通运输系统工程与信息, 2020, 20(3):219-226.

[ Fu X M, Juan Z C. Unraveling mobility pattern of dockless bike-sharing use in Shanghai[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(3):219-226. ] DOI:10.16097/j.cnki.1009-6744.2020.03.033

[3]
Zhao X F, Hu C Y, Liu Z, et al. Weighted dynamic time warping for grid-based travel-demand-pattern clustering: Case study of Beijing bicycle-sharing system[J]. ISPRS International Journal of Geo-Information, 2019, 8(6):281. DOI:10.3390/ijgi8060281

[4]
Du Y C, Deng F W, Liao F X. A model framework for discovering the spatio-temporal usage patterns of public free-floating bike-sharing system[J]. Transportation Research Part C: Emerging Technologies, 2019, 103:39-55. DOI: 10.1016/j.trc.2019.04.006

[5]
Wang Y C, Douglas M, Hazen B. Diffusion of public bicycle systems: Investigating influences of users' perceived risk and switching intention[J]. Transportation Research Part A: Policy and Practice, 2021, 143:1-13. DOI:10.1016/j.tra.2020.11.002

[6]
El-Assi W, Salah Mahmoud M, Nurul Habib K. Effects of built environment and weather on bike sharing demand: A station level analysis of commercial bike sharing in Toronto[J]. Transportation, 2017, 44(3):589-613. DOI:10.1007/s11116-015-9669-z

[7]
Zhang Y, Thomas T, Brussel M, et al. Exploring the impact of built environment factors on the use of public bikes at bike stations: Case study in Zhongshan, China[J]. Journal of Transport Geography, 2017, 58:59-70. DOI:10.1016/j.jtrangeo.2016.11.014

[8]
张鹏飞, 翁小雄. 基于注意力机制LSTM的地铁乘客出行行为预测研究[J]. 重庆交通大学学报(自然科学版), 2022, 41(5):14-19.

[ Zhang P F, Weng X X. Travel behavior prediction of metro passengers based on attention mechanism LSTM[J]. Journal of Chongqing Jiaotong University (Natural Sciences), 2022, 41(5):14-19. ] DOI: 10.3969/j.issn.1674-0696.2022.05.03

[9]
许淼, 刘宏飞, 初凯. 基于AM-LSTM模型的共享单车时空需求预测[J]. 湖南大学学报(自然科学版), 2020, 47(12):77-85.

[ Xu M, Liu H F, Chu K. Spatiotemporal demand prediction of bike-sharing based on AM-LSTM model[J]. Journal of Hunan University (Natural Sciences), 2020, 47(12):77-85. ] DOI:10.16339/j.cnki.hdxbzkb.2020.12.010

[10]
李福, 徐良杰, 朱然博, 等. 基于XGBoost算法的共享单车借车需求量预测[J]. 武汉理工大学学报(交通科学与工程版), 2021, 45(5):880-884.

[ Li F, Xu L J, Zhu R B, et al. Demand forecasting of rental volume in bike-sharing based on XGBoost algorithm[J]. Journal of Wuhan University of Technology (Transportation Science & Engineering), 2021, 45(5):880-884. ] DOI:10.3963/j.issn.2095-3844.2021.05.013

[11]
Zhang Y C, Fricker Jon D. Quantifying the impact of COVID-19 on non-motorized transportation: A Bayesian structural time series model[J]. Transport Policy, 2021, 103. DOI:10.1016/J.TRANPOL.2021.01.013

[12]
乔少杰, 韩楠, 岳昆, 等. 基于数据场聚类的共享单车需求预测模型[J]. 软件学报, 2022, 33(4):1451-1476.

[ Qiao S J, Han N, Yue K, et al. Shared-bike demand prediction model based on station clustering[J]. Journal of Software, 2022, 33(4):1451-1476. ] DOI:10.13328/j.cnki.jos.006461

[13]
温惠英, 张东冉. 基于Bi-LSTM模型的高速公路交通量预测[J]. 公路工程, 2019, 44(6):51-56.

[ Wen H Y, Zhang D R. Highway traffic volume prediction based on Bi-LSTM model[J]. Highway Engineering, 2019, 44(6):51-56. ] DOI:10.19782/j.cnki.1674-0610.2019.06.009

[14]
李帅, 杨柳, 赵欣卉. 基于深度学习的城市区域短时交通拥堵预测算法[J]. 科学技术与工程, 2023, 23(25):10866-10878.

[ Li S, Yang L, Zhao X H. Prediction algorithm of short-term traffic congestion in urban area based on deep learning[J]. Science Technology and Engineering, 2023, 23(25):10866-10878. ]

[15]
杨帆, 车向红, 王勇, 等. 城市共享单车需求的多特征CNN-BiLSTM预测方法[J]. 测绘通报, 2023(8):113-119,150.

DOI

[ Yang F, Che X H, Wang Y, et al. Multi-feature CNN-BiLSTM prediction method for urban bike-sharing demand[J]. Bulletin of Surveying and Mapping, 2023(8):113-119,150. ] DOI:10.13474/j.cnki.11-2246.2023.0242

[16]
杨寒雨, 赵晓永, 王磊. 数据归一化方法综述[J]. 计算机工程与应用, 2023, 59(3):13-22.

DOI

[ Yang H Y, Zhao X Y, Wang L. Review of data normalization methods[J]. Computer Engineering and Applications, 2023, 59(3):13-22. ] DOI:10.3778/j.issn.1002-8331.2207-0179

[17]
彭然, 王竞钊, 刘业浩, 等. 武汉典型城市交通因素对 COVID-19传播的影响研究[J]. 南方建筑, 2022(4):78-87.

[ Peng R, Wang J Z, Liu Y H, et al. A study of the influence of typical urban transportation factors on the spread of COVID-19 in Wuhan[J]. South Architecture, 2022(4):78-87. ] DOI:10.3969/j.issn.1000-0232.2022.04.011

[18]
Lin L, He Z B, Peeta S. Predicting Station-level hourly demand in a large-scale bike-sharing network: A graph convolutional neural network approach[J]. Transportation Research Part C: Emerging Technologies, 2018, 97:258-276. DOI:10.1016/j.trc.2018.10.011

[19]
[ Li Z Y, Ge H X, Cheng R J. Traffic flow prediction based on BILSTM model and data denoising scheme[J]. Chinese Physics B, 2022, 31(4):146-155. ]

文章导航

/