基于DBI和稀疏轨迹数据的交通状态精细划分与识别

朱秋圳; 邬群勇; 姚铖鑫; 孙豪宇

doi:10.12082/dqxxkx.2022.210408

地球信息科学学报 >

2022 , Vol. 24 >Issue 3: 458 - 468

DOI: https://doi.org/10.12082/dqxxkx.2022.210408

地球信息科学理论与方法

基于DBI和稀疏轨迹数据的交通状态精细划分与识别

朱秋圳 ^,¹^,²^,³ ,
邬群勇 ^,¹^,²^,³^,^* ,
姚铖鑫 ¹^,²^,³ ,
孙豪宇 ¹^,²^,³

展开

1.福州大学空间数据挖掘与信息共享教育部重点实验室,福州 350108
2.卫星空间信息技术综合应用国家地方联合工程研究中心,福州 350108
3.福州大学数字中国研究院（福建）,福州 350108

*邬群勇（1973— ）,男,山东诸城人,研究员,主要从事时空数据挖掘和地理信息服务研究。 E-mail: qywu@fzu.edu.cn

朱秋圳（1996— ）,男,福建平和人,硕士生,主要从事时空数据挖掘研究。E-mail: zqiiuz@163.com

收稿日期: 2021-07-18

要求修回日期: 2021-08-30

网络出版日期: 2022-05-25

基金资助

国家自然科学基金项目(41471333)

中央引导地方科技发展专项(2017L3012)

版权

收起

Fine Classification and Identification of Traffic States based on DBI and Sparse Trajectory Data

ZHU Qiuzhen ^,¹^,²^,³ ,
WU Qunyong ^,¹^,²^,³^,^* ,
YAO Chengxin ¹^,²^,³ ,
SUN Haoyu ¹^,²^,³

Expand

1. Key Lab of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350108, China
2. National & Local Joint Engineering Research Center of Satellite Geospatial Information Technology, Fuzhou 350108, China
3. The Academy of Digital China (Fujian), Fuzhou 350108, China

*WU Qunyong, E-mail: qywu@fzu.edu.cn

Received date: 2021-07-18

Request revised date: 2021-08-30

Online published: 2022-05-25

Supported by

National Natural Science Foundation of China(41471333)

The Central Guided Local Development of Science and Technol- ogy Project(2017L3012)

Copyright

Fold

摘要

浮动车轨迹数据已逐渐成为城市交通状态识别的主要数据源之一,但是现有基于浮动车轨迹数据的交通状态识别中多数是应用高精度或是多源轨迹数据。针对稀疏轨迹数据在城市交通状态识别中存在识别精度不高的问题,本文提出一种结合戴维森堡丁指数（DBI）和轨迹相似性度量的动态交通状态划分方法。首先,对轨迹数据和路网数据进行预处理并且建立不同时间片的路段轨迹集合;接着,依据轨迹速度-空间相似性,利用戴维森堡丁指数动态地扩展轨迹的空间维度,并根据轨迹相似性度量方法构建最佳车辆队列;然后,将前后不同的车辆队列进行二次处理,连接组成交通流簇;最后,基于模糊C均值聚类方法将交通流进行划分,实现路段交通状态的识别。采用厦门市厦禾路、湖滨西路和湖滨南路交叉路段上的真实出租车轨迹数据进行测试,结果表明,本文所提方法保证了车辆队列速度分布与原始轨迹速度分布基本一致,相比对比方法Kmeans++和ST-DBSCAN,本文方法均方根误差平均下降了18.77%和21.22%,并且在不同的实验路段表现更加稳定,可有效、可靠地运用稀疏轨迹数据识别城市交通状态,进而实现城市交通状态的精细分析。

关键词： 城市交通; 动态划分; 轨迹相似性度量; 稀疏轨迹数据; 戴维森堡丁指数; 车辆队列; 状态识别; 模糊聚类

本文引用格式

朱秋圳 , 邬群勇 , 姚铖鑫 , 孙豪宇 . 基于DBI和稀疏轨迹数据的交通状态精细划分与识别[J]. 地球信息科学学报, 2022 , 24(3) : 458 -468 . DOI: 10.12082/dqxxkx.2022.210408

Abstract

Compared with traditional traffic detection data, floating vehicle trajectory data have the characteristics of wide coverage, low cost, and high mobility, which have been widely used in urban traffic status recognition and have gradually become one of the main data sources for urban traffic state recognition. However, most of the existing traffic state recognition based on floating vehicle trajectory data is based on high-precision or multi-source trajectory data. To address the problem of low accuracy of sparse trajectory data in urban traffic state recognition, this paper proposes a dynamic traffic state classification method combining Davies-Bouldin Index (DBI) and trajectory similarity metric to finely classify urban road traffic state, and then realizes the spatial and temporal characteristics of urban traffic state. Firstly, we pre-process the trajectory data and road network data, including data cleaning, map matching, and format conversion, record the relative spatial distances between trajectory points and matching road sections, and build a set of trajectories of road sections in different time slices. Secondly, we dynamically extend the spatial dimension of trajectories by using Davies-Bouldin Index (DBI) according to the trajectory speed-spatial similarity, and construct the best vehicle queue according to the trajectory similarity measure. After that, the different vehicle queues before and after are processed twice, and the vehicle queues are merged according to the rules and connected to form traffic flow clusters, so as to achieve the purpose of dividing local road sections and laying the foundation for subsequent recognition of local traffic states. Finally, the global trajectory points are clustered based on the fuzzy C-means clustering method to divide traffic states, and the speed bounds of different traffic states are obtained and compared with the previous traffic flow cluster speed The comparison is carried out to realize the local road traffic state identification, and then realize the fine analysis of traffic state. The real cab trajectory data at the intersection sections of Xiamen Xiahe Road, Hubin West Road, and Hubin South Road are used for testing. The results show that the traffic speed map calculated by the trajectory similarity metric method can reflect the changes of traffic speed on the road section more clearly, and the method ensures that the vehicle queuing speed distribution is basically consistent with the original trajectory speed distribution. Compared with the comparison methods, i.e., Kmeans++ and ST-DBSCAN, the root-mean-square error of the proposed method decreases by 18.77% and 21.22% on average, and it performs more stable and robust in different experimental road sections. It can effectively and reliably use sparse trajectory data to identify urban traffic states, and then realize the fine analysis of urban traffic states, which provides auxiliary decisions for the management of urban road traffic problems.

Key words： urban traffic; dynamic segmentation; similarity metrics; sparse trajectory data; Davies-Bouldin index; vehicle queues; status recognition; fuzzy cluster

1 引言

城市机动车保有量在持续增加,城市交通供给与需求的矛盾日益尖锐^[1],伴随而来的交通拥堵成为一个亟待解决的城市热点问题。相对于传统的交通检测数据,浮动车轨迹数据具有覆盖范围广、成本低、机动性强的特点,被广泛应用于城市交通状态的识别^[2,3],常见的是基于车辆行驶速度、密度、行驶时间、队列长度和流量等交通参数进行交通状态的识别。黄子赫等^[4]引入分块并行计算改进传统DBSCAN算法,提取时速小于10 km/h的轨迹点进行聚类识别拥堵路段。邬群勇等^[5]综合考虑空间和速度属性,提出基于多源轨迹数据的城市交通状态精细划分和识别方法,在时空维度上识别拥堵的范围。An等^[6]基于车辆数目、速度等参数构建网格拥堵模型,通过拥堵规模、传播方向和关键网格3个指标反映常发性拥堵的演化模式。Chaurasia等^[7]根据交叉路口的车流特性,基于车流量和车辆速度对交叉路口拥堵进行识别。Kalinic等^[8]基于交通流量数据通过流量和密度指标构建模糊推理模型描述交通拥堵情况。Wang等^[9]通过构建三层贝叶斯网络以捕捉车辆行程时间之间的关系评估道路交通状态。

以上的研究方法多数是基于采样密度相对较高或者多源的轨迹数据进行,难以适用低频轨迹数据。然而,高频轨迹数据对采样设备的存储和传输有较严格的要求,使得高频轨迹数据获取困难,与之相反的低频轨迹数据因为易获取、覆盖广等特性,在交通大数据挖掘与分析中被广泛应用^[10]。实际道路交通情况下,车辆队列长度与交通流量存在一定关系,可以通过估计观测车辆队列与常规车辆队列的隐含关系评估路段的交通状态。如He^[10]等基于低频浮动车轨迹数据重建道路交叉口,并根据车辆路口即走即停的特性识别拥堵交叉路口。Zhao等^[11]基于隐马尔科夫模型根据不同频率的历史轨迹数据估计车辆队列长度。Zhang等^[12]基于冲击波理论使用低占有率的轨迹数据推算道路车辆队列长度识别交通状态。Zhao等^[13]根据观测车辆的历史轨迹来估测车辆道路占有率,以此推算出总队列长度和交通流量识别交通状态。Ramezani等^[14]针对浮动车不同渗透率和采样间隔提出队列估计方法,探测车辆位置以及速度,并捕捉道路中车辆队列演变的相互依赖性。

以上基于低频浮动车轨迹数据的研究多数通过交通流理论或概率理论建立车辆队列,进而间接地识别出交通状态或道路交通信息。利用交通流理论或概率理论的方法能较好地重建车辆分布情况,但是需要设置众多参数,通常是在理想的条件下进行,在城市道路交通日益复杂多变的情况下,其结果可能与实际状况存在差异^[15,16]。本文研究一种基于稀疏轨迹数据的动态道路交通状态精细识别方法,从轨迹数据本身出发,减少前提参数设置,使之能够适应复杂多变的道路交通情况。该方法根据轨迹速度、空间的相似性,结合戴维森堡丁指数（DBI）动态地扩展轨迹的空间维度,将同一条道路上速度、空间相近的一系列轨迹动态地聚合为一个车辆队列,并通过二次处理链式地连接队列将路段进行划分,再使用模糊C均值算法对交通状态进行分级,进而得到精细交通状态划分结果。

2 数据来源

本文所采用的轨迹数据来源于2020年数字中国创新大赛公开的2020年6月18日—2020年6月24日为期一周的厦门市出租车GPS轨迹数据,采样频率于15~120 s不等,属于稀疏时空轨迹数据^[10,18],主要包括车辆编号、行驶方向、时间、经纬度、载客状态等基本信息,如表1所示,同一辆出租车在同一个时间内只能有一条轨迹数据,因此以出租车车辆id和采样时间为键,可以唯一确定一个轨迹点。路网数据则根据OpenStreetMap中2021年厦门市底图进行矢量化得来。

表1 轨迹数据样例及注解

Tab. 1 Sample track data and annotations

字段	样例	注释
cid	75677bf5af02481b760fa11eae94031c	车辆id
status	1	载客状态
speed	29.6	速度/(km/h)
direction	9	车头朝向
time	2020-06-22 08:45:11	采样时间
lon	118.12°E	经度
lat	24°N	纬度

为了精细识别路网在不同时空范围的交通状态,将路网内的轨迹数据进行时间分片,在时间片T内的任意路段R上轨迹点集合如式（1）所示。其中,三元组

(pid, s, dis)

表示一个轨迹点,

pid

表示车辆id编号,s表示时刻速度,

dis

表示车辆位置与路段行驶方向终点之间的相对距离,如图1所示。

（1）

P = {RID, [(pi d 1, s 1, di s 1), (pi d 2, s 2, di s 2), · · ·, (pi d n, s n, di s n)]}

显示原图|下载原图ZIP|生成PPT

图1 车辆相对距离示意

注：p_i轨迹点dis相对距离。

Fig. 1 Diagram of the relative distance of the vehicles

3 研究方法

研究流程如图2所示。首先,对原始浮动车轨迹数据和路网数据进行预处理。对原始浮动车轨迹数据的预处理包括：① 剔除经纬度为0、长时间位置不变、非载客状态的噪声数据以及重复数据,以免干扰交通状态的判定;② 对部分行驶方向角属性丢失的轨迹点进行属性修复,结合前后轨迹点的反正切值以及路网拓扑关系进行方向角的重算; ③ 将处理后的轨迹数据依据隐马尔可夫模型进行地图匹配^[19]。对原始路网数据的预处理包括：① 对研究区域路网进行矢量化;② 以正北方向为轴,顺时针方向为正方向,计算不同路段的方向角。轨迹点与路网数据处理完之后,根据轨迹点所处路段的位置,计算轨迹点与路段的空间相对距离dis（图1）;接着,对每条路段上的轨迹点进行轨迹相似性度量,结合DBI指数构建最佳车辆队列;然后,对车辆队列进行二次处理,提取路段分割点,对路段进行划分;最后,结合模糊C均值算法划分的交通状态层级精细识别路段在不同时空范围的交通状态,并进行交通状态的时空特征分析。

显示原图|下载原图ZIP|生成PPT

图2 基于DBI和稀疏轨迹数据的交通状态识别技术路线

Fig. 2 The technical route to recognize traffic state based on DBI and sparse trajectory data

3.1 相关定义

定义1：[速度-空间]域扩展

轨迹点在[速度-空间]维度上的扩展如图3所示,纵坐标v表示速度,横坐标d表示车辆与路段终点的相对距离。以轨迹点

p i

为例,其在速度维度的扩展长度为v₀,在空间维度的扩展长度为l₀。在实际道路情况下,相似交通状态的车辆速度的差距约10~20 km/h,因此,从经验角度上考虑, v₀取15 km/h;在交通堵塞队列长度与交通流量预测的研究中表明,道路的净空率一般可以达到7.5 m/veh^[13],即两行驶车辆间的距离为7.5 m。鉴于此,考虑到轨迹点的稀疏性,引入扩展因子α,

α ∈ 1, n

α ∈ N +

,其中, n的取值可根据路段的实际长度进行适当调整。令l₀=0.75·α,以达到动态扩展空间维的效果,为后续精细识别道路交通状态提供基础。

显示原图|下载原图ZIP|生成PPT

图3 轨迹点[速度-空间]域扩展示意图

注： p_i表示第i个轨迹点; S'_i表示第i个轨迹点与i+1个轨迹点扩展域的相交面积; v₀表示速度域扩展大小; l₀表示空间域扩展大小。

Fig. 3 Schematic diagram of the [velocity-space] domain expansion of a trajectory point

定义2：轨迹相似性度量

对于任意轨迹点

p i

,取其[速度-空间]扩展域作为包围矩阵。不同轨迹点进行[速度-空间]域扩展后,出现图3所示3种情况：① 轨迹点

p i - 1

与

p i

扩展后的包围矩阵相交面积为

S' i - 1

,大于设定面积阈值

S 0

;② 轨迹点

p i

与

p i + 1

扩展后的包围矩阵相交面积为

S' i

,小于设定面积阈值

S 0

;③ 轨迹点

p i + 1

与

p i + 2

扩展后的包围矩阵相离,相交面积

S' i + 1

为0,小于设定面积阈值

S 0

。付子圣等^[20]基于最小包围矩阵提出改进的轨迹相似性度量方法,当前后轨迹点的包围矩阵相交面积大于阈值

S 0

时,则认为它们属于同一个车辆队列。但是,其在空间维度上固定采用轨迹速度值的大小进行扩展,对于稀疏轨迹数据,以图3轨迹点

p i - 1

和

p i

为例（假设它们属于同一个车辆队列）,若空间扩展后

p i - 1

和

p i

包围矩阵的相交面积

S' i - 1

小于阈值

S 0

,则将他们纳入2个不同的车辆队列,这无疑增加了后续二次处理的工作量且会徒增错误划分的可能性。针对这个问题,本文轨迹相似性度量方法引入DBI指数进行优化,达到动态地扩展轨迹点空间维的目的。DBI的计算公式如下：

（2）

S i = 1 T i ∑ j = 1 T i X j - A i DBI = 1 k ∑ i = 1 k - 1 ∑ j = i + 1 k max {S i + S j Dis (i, j)}

式中：

S i

表示车辆队列

i

内部分散程度;

X j

表示队列

i

中第

j

个轨迹点;

A i

表示队列

i

的队列中心;

T i

表示队列

i

中轨迹点个数;

k

表示车辆队列个数;

Dis (i, j)

表示队列

i

与队列

j

的间距,通常用第

i

个队列中心与第

j

个队列中心的欧式距离表示;

S i + S j Dis (i, j)

则用来衡量第

i

个队列与第

j

个队列的相似程度。在同一个队列中轨迹点的相似度越高,则DBI分子越小;若队列间差异性越大,则DBI分母越大。因此DBI指数值越小,则表明车辆队列划分的效果越好。

采用不同的扩展因子

α

扩展轨迹点的空间维度（不同

α

值对应包围矩阵示意图如图4所示）,构建车辆队列,以达到动态扩展的效果,最后比较其DBI指数大小,采用最小DBI指数值所对应的车辆队列为最佳车辆队列,作为后续划分交通流的依据。

显示原图|下载原图ZIP|生成PPT

图4 基于DBI的包围矩阵示意图

注： p_i表示第i个轨迹点;S'_i表示第i个轨迹点与i+1个轨迹点扩展域的相交面积;v₀表示速度域扩展大小;l₀表示空间域扩展大小。

Fig. 4 Schematic diagram of the DBI-based envelope matrix

3.2 基于[速度-空间]相似性的车辆队列构建方法

同个车辆队列中的车辆速度与空间位置具有一定的相似性,本文以车辆与路段的相对距离dis作为其空间位置值,并以空间位置和速度作为构建队列的要素属性,结合传统聚类思想,将速度-空间相似的车辆链式地构建成车辆队列。

对于时间片

T

内的任意路段

R

上的轨迹点,车辆队列构建过程如下：

（1）初始化面积阈值

S 0

以及扩展因子

α = 1

;

（2）轨迹相似性度量：若前后轨迹点

p i

和

p i + 1

的包围矩阵相交面积

S' i

大于阈值

S 0

,则将

p i

和

p i + 1

归为同一个车辆队列;否则,当前车辆队列内只包含

p i

p i + 1

与下一个轨迹点

p i + 2

继续作轨迹相似性度量判别,以此类推,直至遍历至最后一个轨迹点

p n

;

（3）计算当前车辆队列结果的DBI指数;

（4）

α = α + 1

,重复步骤（2）—步骤（3）,直至

α > n

;

（5）选取最小DBI指数所对应的车辆队列

Q

作为最佳车辆队列。

3.3 车辆队列二次处理

设任意一条路段经过上述轨迹相似性度量后得到

n

个车辆队列

Q = {Q 1, Q 2, · · ·, Q n}

,任意相邻车辆队列

(Q n - 1, Q n)

之间可能存在如图5所示的情况。① 车辆队列间距离过长（如图5中

Q 1 、 Q 2

所示）,即队列间的路段间隙大;② 车辆队列长度过短,即车辆队列中车辆数目过少（如图5中

Q 3

所示）,可能是噪音导致,但盲目删除无疑会丢失信息。由于车辆队列中轨迹点数要达到一定数目才能有效地进行交通评估,文献[21]的判别标准为每条路段3个以上,缩放至局部路段层面,为了提高准确度和队列构建精细度,本文取2个。针对这些问题导致的无法正常分割路段问题,提出车辆队列的二次处理方法。对于不同情况,对原始车辆队列作如下处理：

显示原图|下载原图ZIP|生成PPT

图5 车辆队列示意

注：100表示当前位置距离交叉口间隔100 m,200表示当前位置距离交叉口间隔200 m,以此类推。

Fig. 5 Vehicle queue diagram

（1）判断前后车辆队列中车辆数量是否都

> 2

,若是,执行步骤（2）,否则执行步骤（3）;

（2）若前后车辆队列速度差

≥ 15 km / h

,则不作处理;若速度差

< 15 km / h

且前后车辆队列间距

< 10 ∙ αm

,则将前后两个队列合并,新车辆队列长度为原前车辆队列起点至原后车辆队列终点的距离,速度为两车辆队列速度平均值;

（3）若任一车辆队列中车辆数目

≤ 2

且前后车辆队列长度

< 10 ∙ αm

,则将前后车辆队列进行合并,合并规则同步骤（2）,否则不作处理;

（4）依次遍历相邻车辆队列直至最后一个车辆队列,完成队列二次处理;

（5）以处理结果集中前车辆队列的终点与后车辆队列的起点的中点作为路段分割点对路段进行划分;

（6）重复步骤（1）—（5）,完成所有路段上车辆队列的二次处理。

3.4 基于模糊聚类的交通流状态层级划分

结合文献[22],将交通状态分为自由流、缓行流和拥挤流3种状态。由于每个城市的交通状况不同,人为确定各种交通状态速度界限并不切实际,传统地通过设置交通速度参数阈值来判断交通状态的方法存在明显不足。因此,本文根据实验区域内实际交通数据,利用模糊C均值聚类算法确定各个交通状态的速度界限,对上述划分的交通流簇进行交通状态识别。剔除速度0值轨迹点以消除速度0值对交通状态划分的干扰。设城市路网内剩余共有

n

个轨迹点

p 1, p 2, …, p n

,隶属度矩阵

U c × n

中的元素

u i, j

表示第

j (j = 1,2, …, n)

个轨迹点对第

i (i = 1,2, 3)

个交通层级的隶属度。将轨迹点速度与隶属度进行迭代,直至目标函数值最大。目标函数为：

（3）

J m (U, V) = max (∑ i c ∑ j n u i, j m × d i, j 2) u i, j m = 1 ∑ k = 1 3 d ij d kj 2 m - 1

式中：

J m (U, V)

表示每个轨迹点到聚类中心的加权距离平方和;

u i, j m

表示轨迹点

j

属于第

i

类交通层级的隶属度,值介于0~1之间;

m

为模糊指数,通常取1.5~2.5^[5,24],数值越大表明待分类的结果模糊程度越大;

d i, j 2

表示第

j

个轨迹点与第

i

类交通层级速度界限的欧式距离。

4 实验与分析

4.1 研究区概况

以厦门市厦禾路、湖滨西路和湖滨南路交叉路段作为研究区域,如图6所示。该区域不仅有商业区、工作区以及居住区,且位于主干道附近,出租车轨迹点时间分布上比较均匀,包含较为全面的交通流状态。考虑到该区域信号灯配时规则以及数据采样频率,为了精细化分交通状态,以2 min为一个时间片对数据进行划分。

显示原图|下载原图ZIP|生成PPT

图6 厦禾路和湖滨西路交叉路段分布

Fig. 6 Distribution of road sections at the intersection of Xiahe Road and Hubin West Road

4.2 实验流程

由于道路交通状态的时间相关性, Yu等^[23]利用路段一周的平均速度矩阵作为计算相对误差的标准,与不同观测速率得到的路段速度矩阵进行比较,验证模型的有效性。本文通过以下2个形式进行验证。以路段A、B、I、J为实验路段,计算实验路段上所有轨迹点和车辆队列在晚高峰（17:00— 20:00）全时段内的速度标准偏差,验证车辆队列构建的准确性;其次,计算路段一周内（2020-06-18至2020-06-24）晚高峰期间（17:00—20:00）的周速度矩阵,并分别用本文方法、文献[5]和文献[20]所提方法计算2020-06-18 晚高峰（17:00—20:00）期间内的速度矩阵,将二者进行比较证明所提方法更有利于处理稀疏轨迹数据。

路段A、B、I、J上所有轨迹点和车辆队列在晚高峰（17:00—20:00）全时段内的速度标准偏差如图7所示,晚高峰期间轨迹点的速度大小差值在15 km/h附近上下波动,验证了上文v₀取15 km/h的合理性。大部分时间段内,车辆队列的标准偏差与原始轨迹点的标准偏差相差不大（5 km/h以内）,表明经过轨迹相似性度量构建车辆队列后,车辆队列与原始轨迹数据的速度分布基本保持一致。其中,红色圆圈处所在时间段原始轨迹点与车辆队列的速度标准差之差相差较大,经查验,存在2种情况：① 原始轨迹点速度之差均在15 km/h左右,且距离相近,所以经过轨迹相似性度量计算得到的车辆队列数目均为1,故标准偏差为0;② 原始轨迹点在该时间段内只有一个记录,显然车辆队列应为1,故标准偏差为0。

显示原图|下载原图ZIP|生成PPT

图7 轨迹点与车辆队列的速度标准偏差

注：时间段0表示17:00—17:02;时间段5表示17:10—17:12;以此类推。

Fig. 7 Speed standard deviation of track points and vehicle queue

利用本文方法、KMeans++^[5]和ST-DBSCAN^[20]计算得到实验路段一天中晚高峰（17:00—20:00）的速度矩阵和一周内晚高峰（17:00—20:00）周速度矩阵。其中,周速度矩阵中每个单元内的速度通过统计单元内一周的轨迹速度平均值计算得出。以周速度矩阵为基准,分别统计各方法的均方根误差（RMSE）和平均绝对误差（MAE）,如表2所示。对于不同实验路段,轨迹相似性度量方法的RMSE和MAE比对比方法低,且本文所提方法的RMSE比KMeans++分别降低了29.4%、16.8%、12.4%和16.5%,比ST-DBSCAN分别降低了34.0%、9.6%、9.0%、32.3%。可见,轨迹相似性度量方法应用在不同路段上的效果比较稳定,准确性相对更高,在处理稀疏轨迹数据时更有优势。

表2 各方法在不同路段上RMSE和MAE比较

Tab. 2 Comparison of MAE and RMSE for each method on different road sections

路段编号	使用方法	评价指标
路段编号	使用方法	RMSE	MAE
A	本文方法	7.53	10.18
	Kmeans++	9.87	14.43
	ST-DBSCAN	12.88	15.44
B	本文方法	8.54	10.5
	Kmeans++	10.31	12.63
	ST-DBSCAN	11.02	11.62
I	本文方法	9.02	11.4
	Kmeans++	10.85	13.02
	ST-DBSCAN	9.53	12.53
J	本文方法	8.46	8.87
	Kmeans++	8.77	10.63
	ST-DBSCAN	10.23	13.11

路段A晚高峰的日速度矩阵如图8（a）—图8（c）所示,周速度矩阵如图8（d）所示。相比周速度矩阵,通过本文方法得出的日速度矩阵能较清晰地识别各种交通状态,尤其是在路段前段和中间部分的拥堵状态表达形式上更加直观。但是,路段尾部交通状态的识别效果普遍不佳,可能是由于尾部轨迹较少的原因造成。相比对比方法,KMeans++方法得出的速度图忽略了部分时段内路段局部位置的交通状态变化,可能由于其算法本身的特性,造成局部交通状态的丢失。ST-DBSCAN方法能够较为准确地识别路段交通状态,然而由于定长扩展空间域的原因,使得交通状态划分过于分散。总体上,本文所提轨迹相似性度量方法可行并具有一定准确度。

显示原图|下载原图ZIP|生成PPT

图8 基于本文方法、KMeans++^[5]和ST-DBSCAN^[20]方法计算的路段A日速度矩阵与周速度矩阵图对比

注：时间段0表示17:00-17:02;时间段1表示17:02-17:04;以此类推。

Fig. 8 Comparison of daily velocity matrix plots based on the methods of this paper, KMeans++^[5] and ST-DBSCAN^[20]and weekly matrix plots for section A

4.3 交通状态时空特征分析

以厦禾路与湖滨西路交叉处8条路段为研究区域（如图6所示路段A—H）,分析其在2020-06-18晚高峰（17:00—20:00）时期的交通状态演化情况。首先使用模糊C均值聚类方法将实验区域内一周的轨迹数据划分为拥堵、缓行和畅通3类,将得到的3个聚类速度上界作为划分3种交通状态的速度界限,具体为：速度小于20 km/h列为拥堵,大于20 km/h,小于等于40 km/h,为缓行,大于40 km/h为畅通。路段A~H晚高峰交通状态如图9所示。

显示原图|下载原图ZIP|生成PPT

图9 路段A—H交通状态

注：时间段1表示17:00-17:02,时间段10表示17:20-17:22,以此类推。

Fig. 9 Road section A—H traffic status charts

（1）从空间上来看,路段C—H交通状态变化比较单一,大部分为缓行和拥堵两种交通状态,结合路段长度发现,路段E—H的长度都小于200 m,分布在上面的轨迹点较少,可能是交通状态单一的原因之一。路段C、D长度不短,但是交通状态仍然比较单一,分析原因有：① 根据路段周围POI可知,路段周围分布着商业区,住宅区,晚高峰时期路段可能会频繁出现拥堵情况;② 出租车司机由经验判断该时段内的交通状况,主观上避免经过C、D路段,导致高峰期分布在路段上的轨迹点稀少,也可能是导致交通状态单一的原因。路段A和路段B交通状态复杂多变,其中,路段A的拥堵部分主要集中在前、中部分,路段B的拥堵部分集中在中、后部分。路段A在200 m处有个路口,该路口连接着厦门市第八菜市场以及当地居民区,路段B在230 m处有厦门市大同小学,这些可能是导致路段A和路段B在中间部分拥堵的主要原因之一。其次,路段A、B在路段末尾处出现的缓行状态猜测是其上游路段通过路口时速度较慢导致。

（2）从时间上来看,路段A前段部分的拥堵状态主要集中于17:00—19:00,与晚高峰期间大量交通流涌入路网,导致信号灯处局部路段堵塞有着密切关系;中间部分的拥堵主要分布在17:30—18:30,考虑是200 m处通往居民区的路段对交通流的影响。路段B的拥堵状态主要分布在17:00—19:00,可能与该时间段大同小学放学通勤造成的交通流异常有关,后半段时间出现拥堵、缓行与畅通状态的切换,属于正常的交通流状态轮转。可以观察到路段B在路段前段部分拥堵状态较少,可能的原因之一是车辆在路段B尽头行驶方向往右,驶向右转专用道,而非等待直行。路段C的交通状态切换比较规律,可能与信号灯的配时有关。路段D和路段F的交通状态呈相反趋势,路段D在晚高峰前半段时间的拥堵状态主要集中于17:20—17:40之间,后半段时间的交通状态在拥堵与缓行之间来回切换。路段F在晚高峰前半段时间的交通状态在拥堵与缓行之间规律切换,后半段时间大多为缓行状态,间歇出现拥堵情况。路段G和路段H在晚高峰时期基本处于拥堵状态,结合POI发现路段G和路段H往南为大片居民区,因此该时段内路段的拥堵状态与下班通勤交通流有着主要联系。

5 结论

针对稀疏轨迹数据在城市交通状态识别中存在识别精度不高的问题进行实验,本文提出一种基于DBI和轨迹相似性度量的城市交通状态精细划分与识别方法,对城市道路交通状态进行精细划分,进而实现城市交通状态的时空特征分析。该方法依据车辆队列与交通流量的潜在关系,根据轨迹速度、位置的相似性,结合戴维森堡丁指数构建最佳车辆队列,经过二次处理计算各局部路段的交通速度,再结合模糊C均值提取交通状态层级,实现道路交通状态的精细划分。以厦禾路、湖滨西路和湖滨南路交叉路段上的真实轨迹数据为例,对该方法进行了有效验证并进行案例分析,研究结论为：

（1）使用DBI指数动态扩展轨迹空间维度,结合[速度-空间]相似性度量方法能够精细划分路网车辆队列,通过该方法计算的车辆队列速度分布与原始轨迹速度分布基本一致;

（2）相比KMeans++和ST-DBSCAN方法,该方法在不同实验路段下的稳定性较高,均方根误差平均下降了18.77%和21.22%,保证稀疏轨迹数据在交通状态识别上的有效性和可靠性;

（3）通过轨迹相似性度量方法计算出的交通速度图能够较为清晰地反映路段交通速度的变化,结合模糊C均值算法对城市道路的交通状态进行精细划分,可以较为准确地揭示城市路网交通状态的时空分布情况。

因此,本文基于稀疏轨迹数据的交通状态识别方法弥补了稀疏数据空间分布零星的不足,能够有效地刻画城市路网的交通状态时空分布特征,具有精度高、解释性强等特点,可以较好地为城市道路交通问题治理提供辅助决策。

参考文献

原文顺序 | 文献年度倒序 | 文中引用次数倒序

[1]

闫学东, 刘晓冰, 刘炀, 等. 基于浮动车大数据与网格模型的城市交通拥堵识别和评价研究[J]. 北京交通大学学报, 2019, 43(1):104-113.

[ Yan X

, Liu X

, Liu

, et al. Identification and evaluation of urban traffic congestion based on the big data of floating vehicles and grid modeling[J]. Journal of Beijing Jiaotong University, 2019, 43(1):104-113. ] DOI: 10.11860/j.issn.1673-0291.2019.01.012

[2]	Zheng Y. Trajectory data mining: an overview[J]. ACM Transactions on Intelligent Systems and Technology, 2015, 6(3):1-41. DOI: 10.1145/2743025

[3]	吴华意, 黄蕊, 游兰, 等. 出租车轨迹数据挖掘进展[J]. 测绘学报, 2019, 48(11):1341-1356. [ Wu H Y, Huang R, You L, et al. Recent progress in taxi trajectory data mining[J]. Acta Geodaetica et Cartographica Sinica, 2019, 48(11):1341-1356. ] DOI: 10.11947/j.AGCS.2019.20190210

[4]	黄子赫, 高尚兵, 蔡创新, 等. 多重处理的道路拥堵识别可视化融合分析[J]. 中国图象图形学报, 2020, 25(2):409-418. [ Huang Z H, Gao S B, Cai C X, et al. Visual fusion analysis of multiple-processing traffic congestion detection[J]. Journal of Image and Graphics, 2020, 25(2):409-418. ] DOI: 10.11834/jig.190272

[5]

邬群勇, 胡振华, 张红. 基于多源轨迹数据的城市交通状态精细划分与识别[J]. 交通运输系统工程与信息, 2020, 20(1):83-90.

[ Wu Q

, Hu Z

, Zhang

. Fine division and identification of urban traffic status based on multi-source trajectory data[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(1):83-90. ] DOI: 10.16097/j.cnki.1009-6744.2020.01.013

[6]	An S, Yang H Q, Wang J A, et al. Mining urban recurrent congestion evolution patterns from GPS-equipped vehicle mobility data[J]. Information Sciences, 2016, 373:515-526. DOI: 10.1016/j.ins.2016.06.033 DOI

[7]	Chaurasia B K, Manjoro W S, Dhakar M. Traffic congestion identification and reduction[J]. Wireless Personal Communications, 2020, 114(2):1267-1286. DOI: 10.1007/s11277-020-07420-0 DOI

[8]	Kalinic M, Krisp J M. Fuzzy inference approach in traffic congestion detection[J]. Annals of GIS, 2019, 25(4):329-336. DOI: 10.1080/19475683.2019.1675760 DOI

[9]	Wang S L, Huang W, Lo H K. Traffic parameters estimation for signalized intersections based on combined shockwave analysis and Bayesian Network[J]. Transportation Research Part C: Emerging Technologies, 2019, 104:22-37. DOI: 10.1016/j.trc.2019.04.023 DOI

[10]	He Z B, Qi G Q, Lu L L, et al. Network-wide identification of turn-level intersection congestion using only low-frequency probe vehicle data[J]. Transportation Research Part C: Emerging Technologies, 2019, 108:320-339. DOI: 10.1016/j.trc.2019.10.001 DOI

[11]	Zhao Y, Shen S Y, Liu H X. A hidden Markov model for the estimation of correlated queues in probe vehicle environments[J]. Transportation Research Part C: Emerging Technologies, 2021, 128:103-128. DOI: 10.1016/j.trc.2021.103128

[12]	Zhang H, Liu H X, Chen P, et al. Cycle-based end of queue estimation at signalized intersections using low-penetration-rate vehicle trajectories[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(8):3257-3272. DOI: 10.1109/TITS.2019.2925111 DOI

[13]	Zhao Y, Zheng J F, Wong W, et al. Various methods for queue length and traffic volume estimation using probe vehicle trajectories[J]. Transportation Research Part C: Emerging Technologies, 2019, 107:70-91. DOI: 10.1016/j.trc.2019.07.008 DOI

[14]	Ramezani M, Geroliminis N. Queue profile estimation in congested urban networks with probe data[J]. Computer-Aided Civil and Infrastructure Engineering, 2015, 30(6):414-432. DOI: 10.1111/mice.12095 DOI

[15]	Han K, Piccoli B, Szeto W Y. Continuous-time link-based kinematic wave model: Formulation, solution existence, and well-posedness[J]. Transportmetrica B: Transport Dynamics, 2016, 4(3):187-222. DOI: 10.1080/21680566.2015.1064793 DOI

[16]

周艳, 李妍羲, 江荣贵, 等. 交通拥堵与预警信息交互传播动力学分析[J]. 地球信息科学学报, 2017, 19(10):1279-1286.

DOI

[ Zhou

, Li Y

, Jiang R

, et al. Dynamic analysis of interactive transmission of warning information and traffic congestion[J]. Journal of Geo-information Science, 2017, 19(10):1279-1286. ] DOI: 10.3724/SP.J.1047.2017.01279

[17]	唐炉亮, 牛乐, 杨雪, 等. 利用轨迹大数据进行城市道路交叉口识别及结构提取[J]. 测绘学报, 2017, 46(6):770-779. [ Tang L L, Niu L, Yang X E, et al. Urban intersection recognition and construction based on big trace data[J]. Acta Geodaetica et Cartographica Sinica, 2017, 46(6):770-779. ] DOI: 10.11947/j.AGCS.2017.20160614

[18]

李思宇, 向隆刚, 张彩丽, 等. 基于低频出租车轨迹的城市路网交叉口提取研究[J]. 地球信息科学学报, 2019, 21(12):1845-1854.

DOI

[ Li S

, Xiang L

, Zhang C

, et al. Extraction of urban road network intersections based on low-frequency taxi trajectory data[J]. Journal of Geo-information Science, 2019, 21(12):1845-1854. ] DOI: 10.12082/dqxxkx.2019.190187

[19]	Hsueh Y L, Chen H C, Huang W J. A hidden Markov model-based map-matching approach for low-sampling-rate GPS trajectories[C]// 2017 IEEE 7th International Symposium on Cloud and Service Computing (SC2). IEEE, 2017:271-274. DOI: 10.1109/SC2.2017.52

[20]

付子圣, 李秋萍, 柳林, 等. 利用GPS轨迹二次聚类方法进行道路拥堵精细化识别[J]. 武汉大学学报·信息科学版, 2017, 42(9):1264-1270.

[ Fu Z

, Li Q

, Liu

, et al. Identification of urban network congested segments using GPS trajectories double-clustering method[J]. Geomatics and Information Science of Wuhan University, 2017, 42(9):1264-1270. ] DOI: 10.13203/j.whugis20150036

[21]

张彭, 张晓松, 雷方舒, 等. 道路拥堵概率估计方法及其在城市交通运行评价中的应用[J]. 交通运输系统工程与信息, 2015, 15(6):161-169.

[ Zhang

, Zhang X

, Lei F

, et al. A method for estimating road congestion probability and its application in urban traffic operation evaluation[J]. Journal of Transportation Systems Engineering and Information Technology, 2015, 15(6):161-169. ] DOI: 10.1 6097/j.cnki.1009-6744.2015.06.025

[22]	雷宁, 张光德, 陈玲娟. 基于改进模糊聚类算法的快速路交通状态分类评价[J]. 公路, 2017, 62(11):134-139. [ Lei N, Zhang G D, Chen L J. Evaluation of traffic status classification for urban expressway based on improved fuzzy clustering[J]. Highway, 2017, 62(11):134-139. ]

[23]	Yu J R, Stettler M E J, Angeloudis P, et al. Urban network-wide traffic speed estimation with massive ride-sourcing GPS traces[J]. Transportation Research Part C: Emerging Technologies, 2020, 112:136-152. DOI: 10.1016/j.trc.2020.01.023 DOI

[24]	王美红. 基于实测数据的天津市交通拥堵时空关联性分析[D]. 北京:北京交通大学, 2019. [ Wang M H. Analyzing spatiotemporal association of traffic congestion based on empirical data in Tianjin[D]. Beijing: Beijing Jiaotong University, 2019. ]

Options

文章导航

模态框（Modal）标题

摘要

本文引用格式

Abstract

1 引言

2 数据来源

表1 轨迹数据样例及注解

图1 车辆相对距离示意

3 研究方法

图2 基于DBI和稀疏轨迹数据的交通状态识别技术路线

3.1 相关定义

图3 轨迹点[速度-空间]域扩展示意图

图4 基于DBI的包围矩阵示意图

3.2 基于[速度-空间]相似性的车辆队列构建方法

3.3 车辆队列二次处理

图5 车辆队列示意

3.4 基于模糊聚类的交通流状态层级划分

4 实验与分析

4.1 研究区概况

图6 厦禾路和湖滨西路交叉路段分布

4.2 实验流程

图7 轨迹点与车辆队列的速度标准偏差

表2 各方法在不同路段上RMSE和MAE比较

图8 基于本文方法、KMeans++[5]和ST-DBSCAN[20]方法计算的路段A日速度矩阵与周速度矩阵图对比

4.3 交通状态时空特征分析

图9 路段A—H交通状态

5 结论

参考文献

图8 基于本文方法、KMeans++^[5]和ST-DBSCAN^[20]方法计算的路段A日速度矩阵与周速度矩阵图对比