SA*: A Multi-thread Path Routing Algorithm

  • SUN Jingwei , 1 ,
  • SUN Guangzhong 1 ,
  • ZHAN Shiyan 1 ,
  • MAO Rui 2 ,
  • ZHOU Yinghua , *, 1
  • 1. School of Computer Science and Technology, University of Science and Technology of China, Hefei 230026, China
  • 2. College of Computer Science and Software Engineering, Shenzhen University, Shenzhen 518060, China
*Corresponding author: ZHOU Yinghua, E-mail:

Received date: 2018-01-02

  Request revised date: 2018-03-10

  Online published: 2018-06-20

Supported by

National Natural Science Foundation of China, No.61432016, 61303047

Guangdong Pre-national project, No.2014GKXM054

Guangdong Province Key Laboratory of Popular High Performance Computers, No.2017B030314073


Path routing problem is a fundamental problem in many applications on road networks. The A* algorithm is an efficient method to find the point-to-point path. Road networks with Cartesian coordinates can provide Euclidean distance as a heuristic function to guide the search direction of A*, then A* can simply and intuitively outperforms the classic Dijkstra's algorithm. However, Euclidean distance is a fairly relaxed lower bound of the real distance. It limits the potential of pruning more search space of A* on road networks. Higher performance is needed to fit the real-time requirement in the application on large-scale networks. Parallel computing is an effective approach to accelerate many algorithms. However, there are strong data dependencies between iterations of A*, and each iteration has little potential parallelism because of the low-dimensional property of road network. Thus, it is difficult to efficiently exploit the availability of multiple cores with the standard A* algorithm. In this paper, we propose Segmented A* (SA*) algorithm, which is more adaptable to modern multi-core CPU platform than A*. It selects some waypoints that split the required shortest path into several segments, then it searches on each segment separately and concatenates these segments as an approximate result. SA* performs better than A* on account of two factors. One is that sequential SA* can prune more search space than A*. The other is that the searches of SA* on segments can be parallelized, so SA* can make better use of multi-core CPU. The selection of waypoints has a key impact on both calculation performance and the accuracy of path. To exploit the benefit from segmented search and meanwhile reduce the performance overhead from this selection, we consider using some low-cost heuristic strategies to select the waypoints before handling each path routing sub-problem. At first, we rapidly calculate a rough path as a guidance, then select the nodes in this rough path that uniformly split the path to several segments. We can easily guarantee that each segment has the same number of nodes. This split has more possibility to lead to a balanced search space in parallel calculating each segment. In our experiments, using 16 cores, SA* can be 30 times faster than A* on a large-scale real-world road network with a loss of path accuracy less than 10%.

Cite this article

SUN Jingwei , SUN Guangzhong , ZHAN Shiyan , MAO Rui , ZHOU Yinghua . SA*: A Multi-thread Path Routing Algorithm[J]. Journal of Geo-information Science, 2018 , 20(6) : 753 -761 . DOI: 10.12082/dqxxkx.2018.180019

1 引言

路径规划问题是路网交通应用中的一个基础问题。通常情况下,路网可近似抽象为一个有向、强连通、稀疏、低分支、结点带有平面直角坐标的 图G=(V,E),其中V为结点集,不妨令|V|=n,E为边集,|E|=On)。结点通常代表道路交叉口或者其他有特定意义的地点,而边则代表结点之间的道路 链接。每个结点具有笛卡尔坐标,而每条边e具有非负的权值we),表示该边所代表的路段的长度或者通行时间。两点间的最短路径即连接给定的2个结点且权值和最小的一个边集合。本文主要讨论寻找路网上的点到点最短路径的方法。对于其他和路网有类似特征的场景,例如人工智能领域中的智能体规划、视频游戏等,本文的方法也同样适用。
最经典的路径规划算法为Dijkstra算法[1]和Bellman-Ford算法[2]。在使用了高效的优先级队列时[3],Dijkstra算法性能比Bellman-Ford更高效。 Dijkstra算法是针对一般化的图上的单源点最短路径问题的算法,不能充分利用路网的信息,同时对于求解点到点的路径而言产生了过多的不必要搜索操作,因此它在大规模的路网上实用性不高。
双向A*搜索给进一步提升A*的性能带来一些启发:将搜索划分成多段,可以同时从2个方面提升性能,即减少搜索空间和产生可并行性。PRS(Parallel Ripple Search )算法[7,8]体现出了这方面的思路。该算法通过在高级图(high level graph)上估计一些导航点(waypoints),将其连接作为所求的路径。高级图是通过Girvan-Newman分层聚类产生的原图的一个缩略骨架。导航点则是高级图上的可能被待求最短路径经过的结点。PRS算法进一步强化了分段搜索的技巧,但其相应的代价为非常高的预处理时间复杂度。该方法需要至少O(n^3)的时间来产生高级图,其中n为图的结点数。
本文提出一种基于分段搜索(segmented search)的A*算法,称之为SA*,用于寻找大规模路网上的两点间近似最短路径。该算法首先快速计算出一条从给定的起点到终点的粗略路径,选择该路径的k等分点作为导航点,然后并行执行k个A*搜索求得一条精度较高的路径。求得的路径长度相对于实际的最短路径长度的相对误差有一个松弛的理论上界。实验结果表明,在实际运行中产生的误差远远小于该上界。

2 启发式搜索

Fig.1 Comparison of search space of different algorithms

图1 不同算法的搜索空间比较

算法1 A*算法
输入: 图G,结点s, t
输出: 从s到t的最短路径path
1. f[]初始化为无穷大inf
2. 初始化优先级队列queue
3. S为空集
4. s入队列,f[s]=g[s]=0,u=s
5. while u!=t&&!queue.empty() do
6. u=queue.pop();
7. S=S∪{u};
8. for each u的邻居v do
9. h[v]=v到t的估计距离
10. if (g[u]+d(u, v)+h[v]<f[v])
11. g[v]=g[u]+d(u, v);
12. f[v]=g[v]+h[v];
13. path[v]=u;
14. return path;
当启发函数为可满足(admissible)和一致(consistent)时[4],A*算法可以返回最优解,即给定两点间的最短路径。可满足是指启发函数所估计的距离始终不会超过真实的最短距离。一致是指任意3个结点间启发函数的估计值满足三角不等式。使用欧氏距离是一个简单直观的可满足且一致的启发函数。然而,路网上2个点的欧式距离通常和实际距离有差距。在美国路网上随机抽取1000点对之后计算每对点之间欧式距离和实际距离的比值,其分布情况如图2所示。该路网数据来自9th DIMACS比赛的数据集[10-11]中的USA地图,其中距离使用的是抽象单位,不对应任何实际单位(m、km等)。
Fig. 2 The estimation accuracy using Euclidean distance

图2 使用欧氏距离进行估计的精度

双向A*搜索提供了从另外一个方向来提高A*性能的思路。该算法通过将搜索分成正向和反向 2个搜索,减少了总搜索空间,同时产生了一定的可并行性。图1(c)展示了双向搜索的搜索空间。然而双向A*只有至多2线程的并行规模,因此仍然难以完全利用目前常见CPU中的4核甚至8核的计算资源。

3 SA*分段搜索

本文提出Segmented A*(SA*)算法,尝试通过划分更多的搜索分段使A*算法获得更好的加速效果。SA*算法的整体框架如算法2所示。当给定源结点s和目标结点t之后,SA*从图中选择k+1个结点作为导航点,其中的m0m0分别指代源节点和目标结点。所选择的k+1个导航点将搜索分成了k段,每一段执行常规的基于欧氏距离的A*算法,最终拼接成一条路径作为结果输出。由于每一段的搜索相互之间不存在依赖关系,因此可以很直接地实现并行化。在共享内存并行系统上实现的SA*算法,每一段的搜索结果直接写入到Path的对应位置即可,拼接路径段的过程实际上并不需要做任何实际操作。
算法2 SA*算法
1. 产生导航点m0, m1 ,…, mk,其中m0=s,mk=t
2. parallel-do
3. 使用A*求解mi到mi+1的最短路径,0≤i<k
4. 将k段路径拼接并作为结果返回

3.1 按直线选择导航点

x i = x s + i × ( x t - x s ) / k y i = y s + i × ( y t - y s ) / k (1)
为了快速查找到s-t线段上k等分点附近的结点,需要记录其邻域内的结点。网格划分可以简单方便地确定一个结点的邻域。由于网格划分可以在载入图数据的同时完成,因此可以认为其开销忽略不计。确定网格边长L后,可以很容易通过结点(x, y)找到对应的网格(row, col)。令图数据的坐标下界为xminymin,则有:
row = ( y - y min ) / L col = ( x - x min ) / L (2)
Fig. 3 The search space of SA*

图3 SA*的搜索空间示意图

3.2 按路径选择导航点


4 实验验证与分析

4.1 实验设置

本节将通过实验来验证SA*算法。使用的机器配置为双路Intel Xeon E5-2680 v3 2.5GHz 12核,64GB DDR4 2133MHz ECC REG主存。实验程序使用C++编写,ICC 13.1.0编译,在CentOS 6.5上运行,使用OpenMP进行并行化。
实验数据选取了若干大规模真实路网数据。数据来自于9th DIMACS比赛的数据集[10,11]表1列出了本文所使用的数据集的信息。在该数据集中,边权值的单位为抽象单位,不对应任何实际使用的距离单位(如m、km等)。
Tab. 1 Basic information of dataset used in experiment

表1 数据集的基本信息

数据名 结点数 边数
USA 23 947 347 58 333 344
W 6 262 104 15 248 146
E 3 598 623 8 778 114
CAL 1 890 815 4 657 742
NE 1 524 453 3 897 636
NW 1 207 945 2 840 208

4.2 实验结果与分析

Tab. 2 Comparison of average calculation time cost (in milliseconds) using different methods

表2 不同方法的平均计算时间(ms)

A* N/A 105 129 178 318 423 1524
SA*(line) k=2 44 50 79 131 146 513
k=4 22 35 39 64 64 200
k=8 14 32 20 42 34 99
k=16 11 33 13 39 24 72
SA*(path) k=2 38 50 68 116 137 465
k=4 15 22 27 46 52 169
k=8 8 14 12 23 24 75
k=16 5 11 6 15 14 47
Tab. 3 Comparison of average relative error using different methods

表3 不同方法的平均相对误差(%)

SA*(line) k=2 6.5 6.4 6.5 4.5 5.1 1.9
k=4 17.0 13.3 17.0 12.2 13.4 5.5
k=8 36.5 26.2 36.5 23.1 30.1 12.5
k=16 66.8 49.1 66.7 45.5 61.2 33.1
SA*(path) k=2 3.2 1.4 3.1 1.7 2.5 1.8
k=4 5.8 3.3 5.8 3.6 4.7 3.4
k=8 7.7 5.2 8.2 5.5 6.9 5.3
k=16 9.4 7.1 10.1 7.4 8.8 7.1
Fig. 4 The trend of time cost with the increase of real distance

图4 各种方法的计算时间随结点的距离增长的变化趋势

Fig. 5 The trend of related error with the increase of real distance

图5 各种方法的相对误差随结点的距离增长的变化趋势

SA*的性能提升来自2个方面:① 分段导致搜索空间减少;① 并行带来的加速。表2的结果为这2个方面因素共同作用的结果。为了单独考察并行带来的加速效果,实验以USA图为例,测试了当 k=16时使用不同线程数下的运行时间。实验结果如图6所示。线程数为1时,性能提升完全来自于分段搜索所减少的搜索空间。16线程时,加速比约为3.2,从加速的效率上来说并不算高。相对于难以并行化的A*算法来说,SA*算法对现代CPU多核架构的利用率仍然有所提高。
Fig. 6 The time cost of SA*(k=16) in different parallel scale

图6 SA*(k=16)在不同线程下的计算时间

影响并行加速比的因素有2个方面:① 导航点选择的开销作为程序的串行部分开销,影响了整体的加速比;② 即使在粗略路径上选择划分结点,也仍然难以保证最终每一段的搜索量均衡。图7反应了串行开销对加速比的影响。可以看到,导航点的开销对加速比提升有一定的负面影响。
Fig. 7 Speedup ratios of SA*(k=16) with and without navigation point selection overhead

图7 SA*(k=16)的实际加速比和忽略导航点选择开销加速比


5 相关工作

Hart等[4]首先提出了A*算法用于有信息的图搜索。该算法使用启发函数将搜索引导至目标。启发函数通过利用图上的信息,估计当前状态到目标状态的代价的下界。路网上点到点路径规划问题可以作为有信息的图搜索问题处理,因此可以使用A*算法解决。通过路网结点的坐标可以计算欧几里得距离作为启发函数。Phol[5]提出了双向A*算法。Ikeda等[6]则在其基础上设计了一个新的启发函数用以提升双向A*的性能。这些算法在原图上从源结点执行一个正向搜索,同时在反向图上从目标结点执行一个反向搜索,因此称为双向搜索。Joint算法[12]和LPA*算法[12]是A*算法的变体,通过结果近似来获得一定的加速效果。Korf[13]提出的IDA*是一个深度优先的启发式搜索,可以获得较好的空间复杂度,但是由于会产生许多重复搜索而耗时较多。Bjornsson等[14]提出的Fringe Search算法通过复用搜索树来提高IDA*的性能。
Brand在文献[7]中提出PHS(Parallel Hierarchies Search)算法,可以利用多核CPU并行地进行路径搜索。在文献[8]中,Brand进一步提出改进算法PRS(Parallel Ripple Search)。PRS借助导航点将搜索划分为多个阶段,然后并行求解。导航点从预先生成的高级图上选择,然而高级图的生成需要较多的预处理时间,因此对于大规模图具有一定局限性。
一些算法通过较长时间的预处理,获得了非常高的在线性能。Goldberg等[15,16]通过预先选择地标结点,计算地标结点到其他结点的距离,在线计算时使用A*算法,利用三角不等式构造的启发函数,可以极大地减少搜索空间。Geisberger等[17]提出Contraction Hierarchies算法,算法不仅本身是较高效的路径规划算法,同时还可以作为有效的预处理手段进一步提高在线计算性能。目前性能最好的使用预处理的算法几乎都用到了Contraction Hierarchies算法,如Transit Node Routing[18], PHAST[19]以及Hub-based labeling[20]等。还有一些算法[21,22,23,24]采取了极端的预处理手段,通过预先计算出所有的最短路径并压缩存储,在线计算时直接查询返回所需的结果,从而获得很高的在线性能。

6 结论


