A Critical Road Segment Identification Method Using Two-Stage Feature Learning with Dynamic and Static Road Segment Embedding

  • WU Weiyi ,
  • WU Sheng
Expand
  • The Academy of Digital China ( Fujian ), Fuzhou University, Fuzhou 350003, China
*WU Sheng, E-mail:

Received date: 2024-08-30

  Revised date: 2024-10-30

  Online published: 2025-01-23

Supported by

National Key Research and Development Program of China(2023YFB3906804)

Abstract

[Objectives] The accurate identification of critical road segments is crucial for effective traffic management across entire road networks. While significant progress has been made in identifying critical road segments, existing methods often fail to identify relatively critical road segments in local areas with lower traffic flow, particularly in large-scale networks such as city-level road systems. [Methods] To address this limitation, this study proposes a two-stage feature learning method based on the dynamic and static embeddings of road segments to identify critical road segments in large-scale networks. The proposed method consists of several key steps. First, travel routes are extracted from mobile positioning data to construct a comprehensive traffic corpus, which serves as the foundation for further analysis. Next, a two-stage feature learning process is conducted: (1) Static embeddings are extracted for each road segment to capture their inherent, unchanging characteristics. These embeddings are clustered to identify initial cluster centers, which serve as preliminary indicators of critical road segments. (2) Dynamic embeddings are then extracted for each road segment and processed using attention pooling, which emphasizes the most relevant aspects of the traffic data. These pooled feature vectors are subjected to differentiable clustering, a technique that optimize the clustering process through a loss function. The model iteratively adjusts until the loss value converges, signaling optimal clustering. Upon convergence, the static and dynamic features are fused to generate comprehensive feature representations for each road segment. These fused features are clustered again to identify the final cluster centers, which represent the critical road segments within the network. To validate the proposed method, a traffic corpus is constructed by using mobile positioning data from the Third Ring Road area of Fuzhou City. [Results] An identification experiment and comparative analysis of critical road segments are conducted using this road network as a case study. The results show that the proposed method effectively identifies critical road segments in large-scale road networks and relatively critical segments in local areas. [Conclusions] Furthermore, compared to existing methods, this method achieves superior performance across various evaluation metrics, indicating that the identified set of critical road segments is more reasonable and practical.

Cite this article

WU Weiyi , WU Sheng . A Critical Road Segment Identification Method Using Two-Stage Feature Learning with Dynamic and Static Road Segment Embedding[J]. Journal of Geo-information Science, 2025 , 27(1) : 167 -180 . DOI: 10.12082/dqxxkx.2025.240483

1 引言

在正常运行的城市路网中,存在一些对路网运行效率有较大影响的路段[1]。这些路段一旦发生拥堵,可能会造成局部路网瘫痪,因此可将其视为关键路段。若能识别出这些关键路段并进行有效管理,便能够缓解整个路网的交通压力,这对于提升城市交通系统的效率和可靠性具有重要意义。
目前,学术界针对关键路段识别研究提出了多种视角和方法。首先,从交通流量的角度,一些研究通过分析交通流量数据,识别在交通状态传播中起重要作用的路段。例如,贾洪飞等[2]基于浮动车GPS轨迹数据,并通过Apriori算法挖掘路网中使用频繁的关键路段;苏飞等[3]通过分析路段交通流量间的时空相关性,评估对交通状态传播影响较大的关键路段;此外,Zhao等[4]结合交通流分布和道路结构信息,提出了一种路网嵌入模型,用于识别拥堵路段。其次,从复杂网络的角度,研究者们更多关注路网结构的特性与其关键性的关联。Redzuan等[5]结合路段长度、中介中心性和道路密度识别关键路段; Chinthavali[6]通过分析路网结构与复杂网络的相似性,定义了链路相对重要性的关键性指数,识别易受影响的路段;而Almotahari等[7]则提出了结合网络拓扑与交通流量特性的新指标用于识别路网中的脆弱节点。此外,级联故障效应分析[8]和脆弱性分析[9]等方法也得到了较多关注。这些方法通常用于评估路段在突发事件或网络故障下的表现,能够识别在极端条件下对整个路网运行影响较大的关键路段。
然而,目前大多数研究[2-7]未能聚焦于识别正常路况下大规模城市路网中的关键路段,这可能源于实时交通数据的匮乏。但全面部署监测设备的高成本使得获取各路段实时交通数据几乎不具可行性。此外,这些方法大多只能识别全路网中交通流量较大或者连通性较好的关键路段,而忽略交通流量较小的局部区域内的相对关键路段。然而,城市路网作为一个整体,尽管局部交通状况对其影响相对较小,但多个局部交通状况的变化也可能对整个路网产生显著影响。基于此,本研究基于大规模手机定位数据估算各路段交通数据,并利用自然语言处理(Natural Language Processing, NLP)技术获取路段静态和动态嵌入,提出一种基于路段动静态嵌入的两阶段特征学习的方法,以识别出在正常路况下对整个城市路网或局部交通区域产生显著影响的路段。这不仅包括在全局内影响力较大的路段,还涵盖那些在交通流量较小的局部区域中起重要作用的相对关键路段。

2 研究方法和技术路线

2.1 技术路线

本文方法基于手机定位数据和路网数据构建交通语料库,然后提取各路段静态和动态嵌入,并经过两阶段特征学习,最终确定关键路段。主要步骤如下: ① 清洗手机定位数据并获取出行起讫点,结合路网数据计算得到出行路线集,并构建交通语料库; ② 分别使用Word2Vec和ELMo提取各路段静态和动态嵌入,并基于注意力池化-可微分聚类(Attention Pooling - Differentiable Clustering,AP-DC),进行两阶段特征学习; ③ 对AP-DC损失值收敛后得到的各路段融合特征进行聚类,将聚类中心作为关键路段; ④ 对关键路段识别结果进行评价。具体技术路线如图1所示。
图1 基于路段动静态嵌入两阶段特征学习的关键路段识别方法流程

Fig. 1 Critical segment identification method process based on two-stage feature learning of dynamic and static embedding of road segments

2.2 交通语料库构建

在NLP中,语料库(Corpus)是经过精心选择和整理的文本集合,用于语言分析、模型训练等[10]。在本研究中,将路网中的路段类比为单词,出行路线类比为句子,通过数字到字母的映射(即0~a, 1~b, …, 9~j),从而完成交通语料库的构建。具体处理步骤如下:首先对原始手机数据进行清洗,接着采用NetworkX[11]和Dijkstra算法[12]计算每对起讫点之间的最短出行路线,并通过模糊辨识模型[13]判断其是否由机动车出行产生。若是,则记录下该出行路线顺序经过的路段。最后将所有出行路线映射为字母序列,以构建交通语料库。大致构建过程如图2所示。
图2 交通语料库构建过程示例

Fig. 2 Example of traffic corpus construction process

2.3 基于路段动静态嵌入的两阶段特征学习

2.3.1 基于Skip-gram生成路段静态嵌入

在交通语料库中,各路段的上下文就是其所在出行路线中的附近路段。基于Word2Vec的Skip-gram模式[14],可以同时学习路段在出行路线中的共现关系和顺序关系。如图3所示,Skip-gram模式的输入层是当前路段的one-hot编码,即w(t),隐藏层是一个没有激活函数的简单线性层,输出层是周围路段的概率分布,如w(t-2)为路段t之前第2个路段的概率分布,而w(t+2)为路段t之后第2个路段的概率分布。若将交通语料库用于训练Skip-gram,则其损失函数的定义如式(1)。
l o s s = - 1 T t = 1 T       - c j c ,   j 0 l o g p ( w t + j | w t )
式中: T是总路段数; wt表示第t个路段; c是给定上下文窗口大小; p(wt+j|wt)是给定目标路段wt的情况下,预测近邻路段wt+j出现的概率。当损失函数收敛后,便能得到Skip-gram训练所输出的各路段Word2Vec嵌入。由于同一路段在不同上下文中出现次数不影响其嵌入表示,因此将其视为路段的静态嵌入。
图3 Skip-gram模式示例图

Fig. 3 Example diagram of Skip-gram model

2.3.2 基于ELMo生成路段动态嵌入

嵌入式语言模型(Embeddings from Language Models, ELMo)是一种深度语义表示模型,能根据单词在特定上下文中的使用来动态地调整其词嵌入,从而有效处理一词多义的问题[15]。同样,同一路段在不同出行路线(不同的上下文环境)中也可能呈现不同的特征。因此,本研究使用ELMo提取第i个路段的动态嵌入ELMoi,其公式如下。
E L M o i = γ k = 0 L S k [ h i k ; h i k ]
式中:L是BiLSTM的层数; γ是可学习的缩放参数;Sk是每层的可学习的权重; h i k中的k是第k层LSTM; i指第i个路段; [ h i k ; h i k ]表示前向和后向隐藏状态的拼接。
将交通语料库用于训练ELMo,将交叉熵损失(Cross-Entropy Loss)作为其损失函数,用于衡量模型当前位置预测路段的概率分布与真实路段的one-hot分布之间的差异,具体的计算公式如下:
l o s s = - 1 N i = 1 N j = 1 C y i j l o g ( p i j )
式中: N是当前处理批次中的路段数; C是总路段数; yij是一个二进制指示器,当样本i(即当前出行路线序列中需要被预测的某个特定位置路段的概率分布)最高概率的类别属于类别j(即路段j)时 yij=1,否则yij=0; pij是模型预测样本i属于类别j的概率。
ELMo会根据同一路段在不同出行路线中的出现次数相应生成不同的动态嵌入,并可以通过垂直堆叠形成动态嵌入矩阵,其中包含了该路段的所有动态嵌入。ELMo示意图如图4所示,最底层的R1Rn分别代表一条出行路线中第1条到第n条路段的one-hot编码;中间层表示双层LSTM结构; E1En代表第1条到第n条路段所提取出的ELMo嵌入表示。
图4 ELMo模型示例

Fig. 4 Example diagram of ELMo model

2.3.3 注意力池化

注意力池化(Attention Pooling,AP)机制是一种用于从序列数据中提取重要信息的方法。它为每个时间步分配一个注意力权重,并使用这些权重对序列进行加权求和,从而对各个不等长的序列均生成固定维度的表示[16]。本研究中的相关过程如图5所示, AP首先通过线性变换和激活函数计算各路段动态嵌入矩阵中各个动态嵌入Xi的输入注意力得分ai,再使用Softmax函数对这些得分进行归一化,最后使用归一化的权重wi对动态嵌入矩阵Xi进行Xi × wi加权求和,从而得到固定长度的特征向量。
α i = e x p ( w T t a n h ( w x x i + b x ) ) j = 1 n e x p ( w T t a n h ( w x x j + b x ) )
z = i = 1 n α i x i
式中:αi表示动态嵌入矩阵中第i个嵌入的注意力得分; xi表示动态嵌入矩阵中第i个嵌入; wx用于对输入的xi进行线性变换;bx为偏置向量; tanh(双曲正切函数)为激活函数; w T用于将经过tanh处理后的结果进行线性变换; e x p ( ) j = 1 n e x p ( )表示对注意力得分进行softmax归一化。z为池化后得到的路段特征向量。
图5 注意力池化机制示例

Fig. 5 Example diagram of attention pooling mechanism

2.3.4 可微分聚类

可微分聚类(Differentiable Clustering,DC)是一种将聚类算法与深度学习框架相结合的方法,它允许聚类过程在端到端的可微分神经网络中进行训练[17]。而传统的聚类算法,如K-Means通常是不可微分的,这意味着它们不能直接与神经网络一起训练,因为神经网络的优化通常依赖于梯度下降和反向传播。在本研究中,DC利用softmax函数实现软分配,计算每个经AP处理后的路段特征向量对各簇的归属概率,其公式如下:
r i k = e x p ( - β | | x i - c k | | 2 ) j = 1 K e x p ( - β | | x i - c j | | 2 )
式中: rik为路段i的特征向量xi属于簇k的概率; K表示簇的数量; ckcj分别表示聚类的第k个和第j个簇; β是用于控制分配软硬程度的参数。
软分配后,簇中心根据其结果进行更新,各簇中心ck_center是该簇中所有样本的加权平均,如下式。
c k _ c e n t e r = i = 1 n r i k x i i = 1 n r i k

2.3.5 两阶段特征学习过程

第一阶段,基于Skip-gram训练交通语料库,生成各路段静态嵌入并进行K-Means聚类,将其聚类中心作为第二阶段DC的初始聚类中心。
第二阶段,首先使用ELMo对交通语料库进行训练,以生成各路段动态嵌入矩阵,并通过AP对其进行处理。AP能根据矩阵中不同维度特征的重要性,动态调整对不同部分的关注,从而为各路段均形成一个固定维度的特征向量。接着,对各路段特征向量进行DC,即计算每个路段特征向量到各个初始聚类中心的距离后,将相应路段分配给距离最近的簇,从而得到聚类结果。最后需要根据聚类结果计算损失函数值,用于优化下一轮训练中AP和DC的参数。该过程也可简称为AP-DC,其损失函数由2部分构成,第1部分是最小化簇内距离与簇间距离的比值,第2部分是当前聚类中心与初始聚类中心的移动距离,计算公式如下:
        l o s s = α ( k = 1 K x i D k | | x i - c k | | 2 ) β ( k = 1 K j = k + 1 K | | c k - c j | | 2 ) + γ ( k = 1 K | | c - k c k i n i t | | 2 )
式中: K表示簇的数量;样本xi表示第i个路段的特征向量; ck c k i n i t分别为第k个簇的聚类中心及其初始聚类中心;Dk为第k个簇中的样本集合;αβγ分别为3个损失项的权重系数。
当AP-DC损失值收敛后,输出最后一轮中AP生成的各路段特征向量,这些特征向量即为经过两阶段学习的各路段融合特征。再对这些融合特征进行一次K-Means聚类,其聚类中心所对应的路段即为所要识别的关键路段。

2.4 评价指标

为评价所识别的关键路段的合理性,本文提出了3种评价指标。在介绍评价指标前,先定义某路段的最近邻和次近邻路段为其第1阶和第2阶近邻路段,那么依此可定义一个路段的第k阶近邻路段和k阶近邻路段(从第1阶到第k阶的所有近邻路段)。

2.4.1 k阶交通流覆盖率

k阶交通流覆盖率(Coverage Rate of k-order Traffic Flow,CRk)是指各关键路段及其所有k阶近邻路段的路段集合交通流量占整个路网交通流量的比例,计算公式如下:
C R k = i N k ( S ) F ( i ) i V F ( i )
式中: Nk(S)为关键路段集合S本身及其k阶近邻路段的集合; F(i)为路段i的交通流量。若一个关键路段集合的交通流量覆盖率越高,则说明这些关键路段在整个路网中具有的影响力越强。

2.4.2 k阶局部交通流承担率

k阶局部交通流承担率(Local Traffic Flow Bearing Rate of k-order,LFRk)是指一个路段交通流量除以其本身加上k阶近邻路段的交通流量总和,计算公式如下:
L F R k ( i ) = F ( i ) F ( i ) + j N k ( i ) F ( j )
式中: F(i)为路段i的交通流量; Nk(i)为路段i的第k阶近邻路段集合。一个路段的k阶局部交通流承担率越高,则说明其在k阶局部路网区域内的影响力越强。关键路段集合中各路段的k阶局部交通流承担率的平均值,即为该关键路段集合的k阶局部交通流承担率。

2.4.3 第k阶局部交通流关联性

使用不同时间间隔内的单个路段本身与其第k阶近邻路段的交通流量数据能够计算出一个Spearman相关系数值,可将其视为该路段的第k阶局部交通流关联性(The k-th Order Local Traffic Flow Correlation,LTFk)。假设共有n个时间间隔,则单个路段v的第k阶局部交通流关联性LTFk的具体计算公式如下:
L T F k = u N k ( v ) 1 - 6 × i = 1 n ( R ( T v i ) - R ( T u i ) ) 2 n ( n 2 - 1 | N k ( v ) |
式中:Nk(v)和| Nk(v) |分别为路段v的第k阶近邻路段集合及其数量; T v i T u i分别为路段v和其第k阶近邻路段uuNk(v))在第i个时间间隔内的交通流量; R ( T v i ) R ( T u i )分别为第i个时间间隔中路段v和其第k阶近邻路段u的交通流量的秩。一个路段的LTFk越接近1,则说明该路段与其第k阶近邻路段的交通流量变化的关联性越高,表示该路段在其第k阶局部区域内的影响力越强。关键路段集合中各路段的第k阶局部交通流关联性的平均值,即为该关键路段集合的第k阶局部交通流关联性值。

3 实验与分析

3.1 研究区概况与实验数据

为验证本研究方法的有效性,以福州市三环内路网作为研究区域,采用2023年3月20日的手机定位数据(使用WGS84坐标系,下同)和福州三环内路网数据(时间为2022年,来源于OSM网站)估算全路网交通流量并构建语料库。相关手机定位数据购自第三方数据服务商,该数据融合了GPS、WIFI、蓝牙以及手机传感器等多种技术进行定位,定位误差在5~50 m之间,每条手机定位记录包括用户脱敏ID、经纬度、定位时间和场景分类信息,如表1所示。为获取最短出行路线集,首先对手机定位数据进行清洗(包括剔除研究区外、重复无效、存在乒乓效应或漂移效应的数据)后,还剩下约100万个用户,平均每个用户约有34条记录。
表1 手机定位数据示例

Tab. 1 Example of mobile phone location data

脱敏ID 经度/°E 纬度/°N 定位时间 场景二级分类
00001f09-05bf-440b-a92e-9dbf99d7eef2 119.245 26.079 2023-03-20 13:58:57 酒店宾馆
00002edc-5b31-42d7-913b-4c06358ef30a 119.231 26.077 2023-03-20 15:20:37 地铁站
00004561-f310-4651-b9c5-ce2ec06d755b 119.324 26.084 2023-03-20 11:37:25 小吃快餐

3.2 出行路线集的计算和验证

为获取出行路线集,首先要对研究区路网数据进行处理,生成其NetworkX图形对象(共有20 433条路段和14 158个节点)。针对同一用户的相邻2条记录,将其经纬度输入路网NetworkX图形对象中计算Dijkstra最短路径,并根据距离阈值判断其是否产生出行。若是,则使用模糊辨识模型[13]筛选出由机动车产生的出行,并将该段出行所产生的出行流量纳入全路网交通流量的估算中,同时将其纳入出行路线集中。此外,为尽可能减少机动车受道路拥堵影响,从而提高模糊辨识模型中通过平均速度识别机动车出行方式的准确性,本实验选用工作日11—16时内的手机定位数据进行出行路线集的计算。同时,以1 h为间隔统计各路段在各时间间隔内的交通流量和车辆平均速度。图6展示了2023年3月20日11—16时的全路网交通流量估算结果。
图6 福州市三环内区域11—16时路网交通流量估算

Fig. 6 Estimation results of traffic flow in the road network within the third ring road of Fuzhou from 11:00 to 16:00

由于出行路线集的合理性直接关乎后续构建交通语料库的准确性,因此这里分别从交通流量分布规律和路网平均速度2个方面对其合理性展开验证。在路网交通流量方面,估算结果表明前20%的路段承担了约78%的交通流量,而剩下80%的路段承担了约22%的交通流量,这大致符合现实路网中交通流量的二八分布规律[18]图7展示了交通流量前20%路段的分布。
图7 福州市三环内区域11—16时交通流量前20%路段分布示意

Fig. 7 Distribution diagram of the top 20% road sections in traffic flow within the third ring road of Fuzhou from 11:00 to 16:00

由于研究区域完全覆盖了鼓楼区和台江区,本研究分别计算了这2个区域在11—16时的出行平均速度,以进行验证。结果显示,计算值与实际情况较为一致。具体而言,鼓楼区所计算的平均速度为30.89 km/h,实际为29.95 km/h;台江区所计算的平均速度为31.14 km/h,实际为32.27 km/h。上述实际数据来源于百度交通大数据平台,选取了某工作日的相同时段进行对比分析。

3.3 构建研究区交通语料库

按2.2的方法构建研究区的交通语料库(表2)。经统计,各路段在该语料库中平均出现55次,其规模足以充分挖掘各路段静态和动态嵌入。
表2 交通语料库示例

Tab. 2 Example of traffic corpus

出行路线的路段序列 对应句子
路段123,路段456,路段789 bcd efg hij
路段10,路段23,路段45,路段67,路段89 ba cd ef gh ij

3.4 两阶段路段特征学习

3.4.1 第一阶段

首先应用Skip-gram模式训练语料库。相关参数如下:上下文窗口大小设为12,词嵌入长度设为64,训练周期设为50。训练完成后,保存各路段静态嵌入。接着,需要在聚类数和轮廓系数均较大的前提下获取初始聚类中心集合,因为较大的聚类数的集合能够为第二阶段的DC提供更多的初始条件,从而保证有关路段静态特征的信息在后续学习过程中能被更多地保留。经实验得知,当路段静态嵌入的聚类数设置为857时,聚类数较大,且轮廓系数较高,为0.721,因此获取该聚类数下的聚类中心集合。

3.4.2 第二阶段

在使用ELMo模型训练语料库时,将LSTM设为2层,各隐藏层维度均设为32,输出特征的维度设为64,批处理数量设为256,训练周期设为50,并使用交叉熵损失函数。当损失值收敛后,提取各路段的动态嵌入。将同一路段所有动态嵌入进行垂直堆叠后,能得到该路段的动态嵌入矩阵,其维度为n×64(n在1~1 047之间,n为对应路段在语料库中的出现次数)。
AP-DC的单轮训练过程如下:首先将各路段动态嵌入矩阵传入AP中,以得到各路段固定维度(1×64维)的特征向量。然后,对各路段特征向量进行DC(这里使用K-Means的可微分聚类形式),最后根据聚类结果计算相应损失函数。当AP-DC的损失值收敛时,输出最后一轮训练周期中AP生成的各路段特征向量,这些特征向量即为最终所需的各路段融合特征。

3.5 关键路段识别结果

对得到的路段融合特征进行K-Means聚类,其聚类中心即为关键路段。假设要识别出前3%的关键路段(约613条),设定聚类数为600~625,以寻找该范围内轮廓系数最高的聚类数。当聚类数为610时,其轮廓系数最高,为0.732。图8为该范围内轮廓系数的变化趋势。此时,所识别的关键路段如 图9所示。关键路段在交通流量较大的区域内分布较多,而交通流量较小的局部区域中也存在一定数量的相对关键路段。
图8 轮廓系数值变化趋势

Fig. 8 The trend of changes in the silhouette coefficient

图9 福州市三环内区域路网前3%关键路段识别结果

Fig. 9 Identification results of the top 3% critical road sections in the road network within the third ring road of Fuzhou

3.6 对比分析

此外,为验证本方法有效性,将本研究方法与如下方法进行对比:
(1) Apriori[2]:一种经典的用于挖掘频繁项集和关联规则的算法,可以通过处理交通语料库来识别关键路段。
(2) Node2Vec[19]:通过深度优先搜索获取各路段Node2Vec向量,用于识别关键路段。
(3) Word2Vec[14]:直接使用各路段Word2Vec静态嵌入来识别关键路段。
分别计算各方法识别结果的k阶交通流覆盖率、k阶局部交通流承担率和第k阶局部交通流关联性(以1 h为间隔,共有5个时间间隔的各路段交通流量数据参与计算)。这3项评价指标均为值越高,则说明识别结果的表现越好。各方法识别结果及其各评价指标对比如图10表3(加粗数值表示每个指标中的最佳表现)所示。本文对不同方法的关键路段识别结果进行展示。
图10 福州市三环内区域路网不同方法关键路段识别结果

Fig. 10 Identification results of critical road sections in the road network within the third ring road of Fuzhou by different methods

表3 不同方法的关键路段识别结果对比

Tab. 3 Comparison of critical road segment identification results by different methods

关键路段流量 方法 交通流覆盖率/% 局部交通流承担率/% 局部交通流关联性
1阶 2阶 3阶 1阶 2阶 3阶 第1阶 第2阶 第3阶
2% Apriori 27.94 39.13 49.19 20.32 8.71 4.44 0.528 0.356 0.288
Node2Vec 9.41 25.78 48.77 14.54 5.11 2.46 0.379 0.251 0.203
Word2Vec 8.10 21.08 38.11 18.01 6.31 2.99 0.374 0.217 0.153
本方法 19.76 38.83 59.32 20.04 8.76 4.73 0.523 0.388 0.339
3% Apriori 38.70 50.81 59.99 20.08 8.07 4.34 0.527 0.344 0.277
Node2Vec 15.80 41.85 71.78 14.74 5.21 2.55 0.396 0.273 0.225
Word2Vec 11.44 28.62 49.87 17.82 6.34 2.97 0.382 0.213 0.156
本方法 29.05 53.76 73.44 19.89 8.24 4.56 0.519 0.375 0.319
4% Apriori 42.53 54.38 62.82 19.84 8.25 4.71 0.523 0.338 0.268
Node2Vec 19.12 50.05 78.88 13.86 4.94 2.45 0.375 0.255 0.216
Word2Vec 14.56 36.29 60.78 17.44 6.19 2.90 0.374 0.215 0.154
本方法 35.24 61.01 80.28 20.31 8.61 4.68 0.539 0.378 0.323

注:加粗数值表示每个指标中的最佳表现。

表3图10可知,Apriori算法识别的关键路段大多为彼此相连且交通流量较高的路段,因此在某些指标上的表现更具优势。然而大部分路段相互连接,覆盖范围不够广泛。此外,该算法仅能挖掘频繁项集,因此基本无法识别交通流量较小区域内的相对关键路段。
由于Node2Vec对各路段均采用相同的随机游走策略,可能更关注于路段的相对位置和连接关系,未能将各路段间实际的交通关联纳入考虑。因此路网密度较高(如居民小区)的区域,节点(路段)之间的连接也就更为复杂和紧密,Node2Vec更容易在这些区域内多次访问和学习路段的特征表示。这导致在聚类过程中,这些高密度路网区域的路段Node2Vec向量显示出更高的聚类中心密度,进而识别的关键路段也就更多。
Word2Vec的结果也表现为关键路段更多地分布于在路网密度高的区域,其原因可能在于:Skip-gram模式注重在给定词周围预测上下文,而在高密度路网区域通常会有更多的上下文,因此导致这些路段在嵌入空间中更易被识别为重要特征,从而更有可能被视为关键路段。
图10可知,本方法识别的关键路段更多地分布于路网中交通流量较大的区域,同时也能识别出交通流量较小的区域内的相对关键路段。此外,从表中数据可以看出,在交通流覆盖率方面,本方法随着关键路段数量增加,该评价指标稳步提升,且在3阶时高于其他方法;在局部交通流承担率上,大部分情况下的表现优于Apriori,且相较于Node2Vec和Word2Vec具有较大优势;在局部交通流关联性方面,本方法在第2和第3阶的数值表现更为出色,说明其所识别的关键路段与邻近路段的联系更为紧密。本方法在关键路段识别上更优势的原因可能在于:注意力池化能加权整合同一路段多种动态嵌入,使得路段的多种动态表示得到合理平衡,避免了某种表示对池化结果产生过度影响。其次,通过可微分聚类的调整,融合静态和动态嵌入,使得最终识别的关键路段既考虑了路段间真实的连接关系,又反映了各路段在不同出行路线中的多种表示,从而避免了在高密度路网区域仅因连接关系复杂而过多地被识别为关键路段。

3.7 识别结果展示

为进一步证明本文方法能在交通流量较小的区域内识别出一定数量的相对关键路段,这里将4%关键路段识别结果中的几个相关区域进行展示。功能区的具体划分参考了相关研究[20],各区域地理位置分布情况如图11所示,详细的相对关键路段分布情况如图12所示。由于对大小交通流量区域的划分还尚未有统一的标准,这里借鉴了城市的功能区的定义对其进行划分,因为不同功能区对应不同的交通需求。例如,商业区白天的车流量较大,可将其视作交通流量较大的区域;而住宅区和工业区的车流量在相同时段内较小,可将其视为交通流量较小的区域。
图11 各区域地理位置分布示意图

Fig. 11 Diagram of the geographical distribution of each area

图12 各区域相对关键路段分布示意图

Fig. 12 Diagram of the distribution of relatively critical road segments in each area

4 结论与讨论

本文基于手机定位数据和路网数据获取出行路线集并构建交通语料库,通过自然语言处理方法提取各路段的静态和动态嵌入,并提出一种两阶段特征学习的方法来识别关键路段。然后,以福州市三环区域内路网为例,通过自行设计的3种指标来评价关键路段识别结果的合理性。主要结论如下:
(1) 识别结果图表明,本文方法所识别的关键路段在空间分布上较其他方法更为合理。此外,在各评价指标的整体表现上,本文方法也优于其他方法。上述2个方面有力地验证了本文方法识别结果的合理性。
(2) 基于AP-DC的两阶段特征学习方法具有以下2个方面的优势:① 对路段静态嵌入进行聚类得到的初始聚类中心能为DC提供一个相对稳定和有意义的起点,也降低了在初期陷入局部最优的风险,且能使其更快地收敛到一个合理的解。② 路段的动态嵌入相较于其静态嵌入能提供更为丰富多样的路段表示。因此将初始聚类中心作为先验知识,再对同一路段多种动态嵌入进行调整的做法较好地融合了路段的静态和动态嵌入。
(3) 由于AP-DC在训练过程中很有可能会导致初始聚类中心发生移动,因此其损失函数在保证最小化簇内距离与簇间距离比值的同时,还加入了一个项,该项计算当前聚类中心与初始聚类中心的移动距离,约束了聚类中心的移动量,能在参数优化过程中给聚类中心一定的移动空间,同时还能保持它们相对接近初始聚类中心的状态。
(4) 由识别结果图可知本文方法在交通流量较小的局部区域内也可以识别出一定数量的相对关键路段,这可能归因于路段多种动态表示通过AP得到了合理平衡,且融合静态和动态嵌入后的路段特征既考虑了路段间的真实连接关系,又反映了其在不同出行路线中的多种表示。
本研究需要进一步改进的方面包括:
(1) 进一步结合出租车GPS数据和真实路网监测数据,以获取各出行起讫点间更为精确的实际出行路线信息。
(2) 本文仅识别了单日的关键路段,未来应扩展至多日,以挖掘关键路段在不同日期内的变化规律,从而总结出适用于大多数日期的关键路段集合。
(3) 尽管BERT(一种基于Transformer的预训练深度学习模型)[21]在捕获上下文时具有强大优势,但由于BERT会将未知或罕见的单词分解为更小的子单元,且其生成的高维嵌入向量处理难度较大,因此本研究初步选用ELMo生成路段动态嵌入。未来应探讨融合BERT以更深入地捕捉路段的动态嵌入。
■ 本文图文责任编辑: 蒋树芳 黄光玉

利益冲突:Conflicts of Interest 所有作者声明不存在利益冲突。

All authors disclose no relevant conflicts of interest.

[1]
Li J, Ozbay K. Evaluation of link criticality for day-to-day degradable transportation networks[J]. Transportation Research Record: Journal of the Transportation Research Board, 2012, 2284(1):117-124. DOI:10.3141/2284-14

[2]
贾洪飞, 郭明雪, 罗清玉, 等. GPS数据下的城市路网关键路段识别[J]. 吉林大学学报(工学版), 2020, 50(4):1338-1343.

[ Jia H F, Guo M X, Luo Q Y, et al. Identifying critical links of urban road networks based on GPS data[J]. Journal of Jilin University (Engineering and Technology Edition), 2020, 50(4):1338-1343. ] DOI:10.13229/j.cnki.jdxbgxb20190675

[3]
苏飞, 董宏辉, 贾利民, 等. 基于时空相关性的城市交通路网关键路段识别[J]. 交通运输系统工程与信息, 2017, 17(3):213-221.

[ Su F, Dong H H, Jia L M, et al. Identification of critical section in urban traffic road network based on space-time correlation[J]. Journal of Transportation Systems Engineering and Information Technology, 2017, 17(3):213-221. ] DOI:10.16097/j.cnki.1009-6744.2017.03.031

[4]
Zhao J, Cheng P, Ge Q X, et al. Identifying critical congested roads based on traffic flow-aware road network embedding[C]// International Conference on Advanced Data Mining and Applications. Cham: Springer, 2023:598-613. DOI:10.1007/978-3-031-46661-8_40

[5]
Redzuan A A, Anuar A N, Zakaria R, et al. A method of identifying critical road segment: A case study of peninsular Malaysia Road network[J]. IOP Conference Series: Earth and Environmental Science, 2020, 479(1):012003. DOI:10.1088/1755-1315/479/1/012003

[6]
Chinthavali S. Identifying the Critical Links in Road Transportation Networks: Centrality-based approach utilizing structural properties[R]. Oak Ridge National Lab.(ORNL), Oak Ridge, TN (United States), 2016. DOI:10.2172/1329736

[7]
Almotahari A, Yazici M A. A link criticality index embedded in the convex combinations solution of user equilibrium traffic assignment[J]. Transportation Research Part A: Policy and Practice, 2019, 126:67-82. DOI:10.1016/j.tra.2019.06.005

[8]
万蔚, 黄雨晨, 王振华, 等. 突发状况下的道路网络故障演化分析——以通州市区道路网络为例[J]. 重庆交通大学学报(自然科学版), 2019, 38(11):14-20,40.

[ Wan W, Huang YC, Wang ZH, et al. Evolution Analysis of Road Network Faults under Emergency Conditions——Taking Tongzhou Urban Road Network as an Example[J]. Journal of Chongqing Jiaotong University(Natural Science), 2019, 38(11):14-20+40.] DOI:10.3969/j.issn.1674-0696.2019.11.03

[9]
李永成, 刘树美, 于尧, 等. 兼顾路段和交叉口的路网脆弱性识别机制[J]. 北京邮电大学学报, 2020, 43(1):14-20.

[ Li Y C, Liu S M, Yu Y, et al. Road network vulnerability identification considering the impact of road sections and intersections congestion[J]. Journal of Beijing University of Posts and Telecommunications, 2020, 43(1):14-20. ] DOI:10.13190/j.jbupt.2019-088

[10]
Chowdhary K R. Natural language processing[M]// Fundamentals of Artificial Intelligence. New Delhi: Springer, 2020:603-649. DOI:10.1007/978-81-322-3972-7_19

[11]
Hagberg A, Swart P, S Chult D. Exploring network structure, dynamics, and function using NetworkX[R]. Los Alamos National Lab.(LANL), Los Alamos, NM (United States), 2008.

[12]
Makariye N. Towards shortest path computation using Dijkstra algorithm[C]//2017 International Conference on IoT and Application (ICIOT). IEEE, 2017:1-3. DOI:10.1109/ICIOTA.2017.8073641

[13]
张德欣, 刘小明, 孙立光, 等. 基于大规模定位数据的出行方式模糊判别研究[J]. 交通信息与安全, 2011, 29(2):1-4.

[ Zhang D X, Liu X M, Sun L G, et al. Fuzzy classification of trip mode based on large scale location data[J]. Journal of Transport Information and Safety, 2011, 29(2):1-4. ] DOI:10.3963/j.ISSN1674-4861.2011.02.001

[14]
Ma L, Zhang Y Q. Using Word2Vec to process big text data[C]//2015 IEEE International Conference on Big Data (Big Data). IEEE, 2015:2895-2897. DOI:10.1109/BigData.2015.7364114

[15]
Ilic S, Marrese-Taylor E, Balazs J A, et al. Deep contextualized word representations for detecting sarcasm and irony[J]. arXiv preprint arXiv:1809.09795, 2018. DOI:10.18653/v1/W18-6202

[16]
Girdhar R, Ramanan D. Attentional pooling for action recognition[EB/OL]. 2017:1711.01467.

[17]
Zhou H C, He T T, Ong Y S, et al. Differentiable clustering for graph attention[J]. IEEE Transactions on Knowledge and Data Engineering, 2024, 36(8):3751-3764. DOI:10.1109/TKDE.2024.3363703

[18]
Jiang B. Street hierarchies: A minority of streets account for a majority of traffic flow[J]. International Journal of Geographical Information Science, 2009, 23(8):1033-1048. DOI:10.1080/13658810802004648

[19]
Grover A, Leskovec J. node2vec: Scalable feature learning for networks[J]. KDD: Proceedings International Conference on Knowledge Discovery & Data Mining, 2016,2016:855-864. DOI:10.1145/2939672.2939754

[20]
真诗泳, 林钦贤, 张露丹, 等. 基于多源数据的城市内部空间交互特征:以福州市主城区为例[J]. 科学技术与工程, 2023, 23(35):14937-14946.

[ Zhen S Y, Lin Q X, Zhang L D, et al. Spatial interaction characteristics based on multi-source data: A case of main urban area of Fuzhou city[J]. Science Technology and Engineering, 2023, 23(35):14937-14946. ] DOI:10.3969/j.issn.1671-1815.2023.35.005

[21]
Devlin J, Chang M W, Lee K, et al. BERT: Pre-training of deep bidirectional transformers for language understanding[EB/OL]. 2018:1810.04805.

Outlines

/