Spatial Similarity Assessment of Point Clusters in Multi-scale Map Spaces Based on Analytic Hierarchy Process

  • DUAN Xiaoqi , 1, 2, 3, * ,
  • LIU Tao 1 ,
  • WU Dan 1, 2
  • 1. Lanzhou Jiaotong University, Lanzhou 730070, China
  • 2. Gansu Provincial Engineering Laboratory for National Geographic State Monitoring, Lanzhou 730070, China
  • 3. Key Laboratory (Cultivate Base) of Highway Network Monitoring Gansu Province, Lanzhou 730070, China
*Corresponding author: DUAN Xiao qi, E-mail:

Received date: 2015-12-15

  Request revised date: 2016-04-14

  Online published: 2016-10-25


Similarity relation is one of the focal spatial relations in the community of geographic information science and cartography. The spatial similarity calculation in multi-scale map spaces is a research hot spot in Geographic Information Systems (GIS). Point cluster object contains plenty of structured information in its spatial distribution. Its similarity is widely used in the retrieval and query of spatial databases and is also used to analyze and process the spatial data, to recognize the spatial objects from image and to describe the spatial features on maps. Point clusters can be taken as a simple spatial object in geographic space and with studying its similarity we are able to evaluate the result of computer drawing and to calculate complex clusters' similarity, such as the spatial line clusters, the spatial polygon groups and a mixture of points, lines and polygons. Previous theoretical researches mainly focus on a single factor that could impact the point group target, then analyze the impact factor of the point clusters, and in the end, carry out a calculation model without considering the effect of mixing factors. However, so far these researches have hardly made any significant achievements. In this paper, with the consideration of the Gestalt principles from visual cognition, incorporating predecessors' research results, a calculation model is proposed to comprehensively grasp the point clusters similarity in detail. In order to calculate the similarity between different point clusters in the multi-scale map spaces, the main factors that could affect the similarities of point cluster objects were integrated, including the topological relation, the distribution range, the direction relation, the distance relation and the distribution density. Then, this paper discusses the calculation methods of the topological relation, direction relation, distance relation, distribution range and distribution density for point clusters in the multi-scale map spaces. According to the calculations of the five factors, this paper describes the topological relation using the concept of topological neighbor, represents the distribution range by stripping the outside triangles after triangulation, uses the trend of main skeleton for point clusters to express the direction relation, indicates the distance relation by calculating the mean distance between each point and the distribution center for each point cluster, and expresses the distribution range by the overall relative density. Their complete similarity calculation models were put forward respectively at the same time. Analytic Hierarchy Process (AHP) analysis method was adopted for weight assignment, which is a qualitative and quantitative method and can be systematic. Hierarchical analysis method of weighting factor was integrated to address the impact of weight problem. It only uses a small amount of quantitative information, with the help of mathematical methods, complex issues can be simplified. The importance of different factors were taken into account, and the topological relation weight, the direction relation weight, the distance relation weight, the distribution range weight and the distribution density weight were calculated. Finally, the integrated similarity calculation model with the influential factors' weights for point clusters in multi-scale map spaces was established. The validation results of an example shows that the model can accurately calculate the spatial similarity of point clusters in multi-scale map spaces, meanwhile the model is proved to be feasible and effective , which can be applied to evaluate the quality of map generalization.

DUAN Xiaoqi , LIU Tao , WU Dan . Spatial Similarity Assessment of Point Clusters in Multi-scale Map Spaces Based on Analytic Hierarchy Process[J]. Journal of Geo-information Science, 2016 , 18(10) : 1312 -1321 . DOI: 10.3724/SP.J.1047.2016.01312

1 引言

国内外学者在空间相似性方面做了许多探讨和实验,取得一些有价值的成果,如Krzysztof和Janowicz等探讨了空间相似性的语义相似性的问题[4];Schwering分析了几何模型、要素模型、网络模型等对于描述地理对象及其概念相似度的可能 性[5];毋河海利用凸壳原理对点群的分布范围进行说明[6];艾廷华等从保持点群的角度对点群的几何特征进行研究[7];丁虹进行了空间相似性理论的研究,建立了空间方向相似性、空间拓扑相似性、空间语义相似性和空间场景相似性的计算模型[8];郭庆胜提出了基于邻近图的点群层次聚类方法[9];闫浩文,褚衍东探讨了多尺度地图空间相似关系的分类体系[2]等。根据文献[10]所述,空间相似性问题揭示的是深层次的信息,需要复杂的分析过程和专业技能,但有些分析是不可计算的,在不同尺度下的相似程度可计算性较差[10],国内外在这方面的研究仍处于起步阶段。

2 点群相似度及其影响因子

2.1 空间相似度的定义

设有目标A,在比例尺为S1, S2,…, Sk的地图上分别表达为目标A1, A2,…, Ak,其相应特征集为C1,C2, …, Ck,且C1, C2,…,Ck均为非空。若C1 C2 Ck=Cn ,称相似特征集Cn为目标A在不同比例尺表达下的空间相似关系。
关于定义中的特征集,若考虑单一目标的空间相似度的计算,一般关注图形和属性变化2个方面;而空间群组目标的多尺度表达需要考虑空间关系的维护问题,即需要考虑群组目标相似度的影响 因子。

2.2 点群相似度的影响因子


3 不同尺度下点群目标相似度的计算方法

3.1 拓扑相似度

拓扑关系在点群目标的相似性关系中很重 要[13],点群目标中各点之间的拓扑关系主要是拓扑邻居关系。点作为0维目标,没有大小也没有方向,点的邻居采用定长距离K,即计算点的拓扑关系时,纳入度量信息,能够更好地描述点与点之间的空间分布情况。凸壳是度量的重要工具[6],凸壳直径作为凸壳两点之间的最长距离,也是点群目标中最长距离的量度,点群中点的拓扑邻居要小于凸壳直径。为了确定拓扑邻居(即K值的大小),可以用凸壳直径的长度与凸壳直径两侧凸壳上的点大致表示。能够方便的确定定长K,避免了对K赋值的不确定性。凸壳大小的确定如图1所示。其中定长距离K如式(1)所示。
K = L N (1)
Fig. 1 Convex hull and its diameter for the point clusters

图1 点群的凸壳与凸壳直径

P 1 = P S 1 S 2 (2)
式中:P1是综合之后点群目标点的数目;P是综合前点群点的数目;S1为综合前的尺度;S2为综合后的尺度。P1基于点状要素尺度变化的选取法则计算,点群目标在尺度变化后的拓扑邻居定长值为 式(3)。
K 1 = K S 1 S 2 (3)
根据上述描述,点群的拓扑邻居为拓扑圆内该点的邻居个数(如图2蓝色点10 000 m内的拓扑邻居为6个),点群目标的拓扑相似度计算如式(4) 所示。
SI M Topo = 1 - | D 1 - D 2 MAX D 1 , D 2 (4)
Fig. 2 Topological neighbors of a certain point

图2 点的拓扑邻居

3.2 分布范围相似度

点群的分布范围具有不确定性,选取何种多边形表示点群目标的分布范围,需符合人们的认知习惯。通常的方法用凸壳来表示点群目标的分布范围[6],但对于没有点覆盖的凹区域来说,用凸壳表示不够准确[15]。本文在生成点群目标Delaunay三角网的基础上,进行“剥皮”操作(图3),即删除那些位于外围的且三角形边长大于一定数值的三角形,逐层向里剥蚀,直到符合Gestalt邻近原则。根据文献[15]所述,“剥皮”的阈值设置过大,其结果更接近凸壳;设置过小,得到的多边形会陷入凹部弯曲越深,根据经验合理设定的阈值能够反映空间聚类的 结果。
Fig. 3 The rendering result of the gradual stripping of outside triangles

图3 点群逐步“剥皮”效果图

SI M Fb = 1 - | S 1 - S 2 MAX ( S 1 , S 2 (5)

3.3 方向关系相似度

主骨架线能反映点群目标的分布特征,主骨架线的分布方向可表示点群目标的分布方向。在3.2节计算得到点群范围的基础上,生成点群分布的主骨架线,如图4所示;并用构成主骨架线各个线段向量之和的指向表示为点群目标的分布方向,如图5所示,向量 α 与向量 β 的和为向量 γ
Fig. 4 Skeleton line of the point clusters

图4 点群的骨架线

SI M Dir = 1 - | θ 1 - θ 2 max ( θ 1 , θ 2 (6)
式中: θ 1 , θ 2 分别是点群目标主骨架线的方向角度, θ [ 0 , π ] θ 1 θ 2 之间的角度相差 π 2 时,两点群目标方向相似度为0;当 θ 1 θ 2 之间的角度相等或者相差 π 时,两点群目标间的方向相似度为1。
Fig. 5 The sum of two vectors

图5 2个向量之和

3.4 距离关系相似度

点群目标的距离关系,作为一种度量概念,反映点群目标的集中程度或离散程度。通过确定点群目标的分布中心( x ̅ , y ̅ ),点群目标中的各个点与分布中心距离的平均值,根据文献[1]、[2]的论述可知,分布中心是指一到多个局部相对密度较大的区域,可以反映点群目标的稳定性和分布的密集程度(图6)。因此,点群目标的距离关系相似度可以利用式(7)计算。
SI M Dis = 1 - | L 1 - L 2 max ( L 1 , L 2 (7)
式中: L = 1 n m = 1 n ( xi - x ¯ ) 2 + yi - y ¯ 2 ; x ¯ = 1 n i = 1 n xi ; y ¯ = 1 n i = 1 n yi ;n为点群中点的个数;( x ¯ , y ¯ )为点群目标的分布中心。
Fig. 6 Distribution center of the point clusters

图6 点群的分布中心

Fig. 7 Voronoi map of the point clusters

图7 点群的voronoi图

3.5 点群分布密度相似度

R m = R i i = 1 n R i (8)
式中:Ri= 1 Ai ;Ai为点所在的Voronoi图的面积;n为点的个数; i = 1 n R i 表示整个区域的局部绝对密度。
Tab. 1 Scales of the comparison results between two factors

表1 因子两两比较的标度

标度 定义
1 i因素与j因素同样重要
3 i因素比j因素略重要
5 i因素比j因素较重要
7 i因素比j因素非常重要
9 i因素比j因素绝对重要
2,4,6,8 为以上判断之间中间状态对应的标度值
倒数 j因素与i因素比较,得到的判断值为aji=1/aij
R n = n R t i = 1 n R i (9)
SI M Den = 1 - | Rn 1 - Rn 2 max ( Rn 1 , Rn 2 (10)
图7所示,阴影处为点群目标分布中心的 Voronoi图区域。

3.6 点群目标相似度的计算

SIM = ω 1 SI M topo + ω 2 SI M Fb + ω 3 SI M Dir + ω 4 SI M Dis + ω 5 SI M Den (11)
式中: ω 为不同指标间的权值。影响点群目标相似性的各个因子,其重要程度是不同的。为确定各个因子的影响程度,根据AHP方法计算各个权重 ωi

4 基于层次分析法确定各影响因子的权重


4.1 层次分析法


4.2 各影响因子的重要性分析


4.3 构建各个因子权值的判断矩阵

根据上述分析,建立层次分析模型。如图8所示,目标层用A表示,决策层中拓扑、距离、方向、分布范围和密度分别用D1、D2、D3、D4、D5表示。各影响因素权重参考了Satty的提议,使用1-9尺度原则[21],这是因为:(1)心理学的实验辨明,大多数人对不同事物在相同属性上差别的分辨能力在5-9级之间,采用1-9的标度反映了大多数人的判断能力;(2)1-9的比例标度已完全能区分引起人们感觉差别的事物的各种属性。根据文献[21]、[22]所述,一般层次不受限制,每一层的影响因素一般不超过9个。本文的影响因素为5个,并且5个因素之间的重要性存在差异。根据Satty的描述,Di相对Dj的重要程度大小,Dij =1,2,…,9及其互反数Dji=1,1/2,…,1/9。
Fig. 8 Map of AHP

图8 层次分析模型图

D = Topo Fb Dir Dis Den Topo 1 5 4 3 5 Fb 1 5 1 1 3 1 4 1 Dir 1 4 3 1 1 2 3 Dis 1 3 4 2 1 4 Den 1 5 1 1 3 1 4 1 (12)

4.4 计算结果

对于判断矩阵D,计算结果满足Dx= ℷ mx 的特征值和特征向量, ℷm 为最大特征值,x的分量即为相应的单排序权值。
dij ¯ = dij m = 1 n dmj i j = 1 , 2 , 3 , , n (13)
ω i = j = 1 n dij ¯ n (14)
通过计算得到: ω 1 =0.468, ω 2 =0.067, ω 3 =0.158, ω 4 =0.240, ω 5 =0.067。
(3)一致性检验。理论上,判断矩阵应该具有一致性,但由于评价过程中,评价者不可能对所有的因素的数值精确判断,导致判断矩阵的特征值会产生偏差。在构造判断矩阵时,并不要求判断具有完全一致性,但是检验结果如果控制在一定的范围内,其权值是可以接受的。其中,赋权和向量 ωi ¯ 最大特征值 ℷ mx 、一致性指标CR的计算如式(15)-(17)所示。一般认为,只要CR<0.1时,计算结果可以被接受。
ωi ¯ = D × [ ω 1 , ω 2 , ω 3 , ω 4 , ω 5 T (15)
max = m = 1 n ωni ¯ ωi n (16)
CR = ℷmax - n RI ( n - 1 (17)
式(16)中,RI是自由度指标,作为修正值,如表2 所示。
Tab. 2 Degrees of freedom

表2 自由度指标

维度(n 1 2 3 4 5 6 7 8 9
RI 0 0 0.58 0.96 1.12 1.24 1.32 1.41 1.45
维度表示决策层影响因子的个数,RI表示此维度下一致性检验的修正值。最后计算得到 CR =0.0318,CR<0.1,检验合格。因此,式(11)模型的权重分别为: ω 1 =0.468, ω 2 =0.158, ω 3 =0.067, ω 4 =0.067, ω 5 =0.240。
综上,得到点群目标的相似度计算公式为 式(18)。
SIM = 0.468 SI M topo + 0.067 SI M Fb + 0.158 SI M Dir + 0.240 SI M Dis + 0.067 SI M Den (18)

5 实验结果与分析

Fig. 9 Point cluster 1 (1:50 000 scale)

图9 点群1(1:5万)

Fig. 10 Point cluster 2 (1:100 000 scale)

图10 点群2 (1:10万)

Fig. 11 Point cluster 3 (1:250 000 scale)

图11 点群3(1:25万)

5.1 点群目标之间拓扑关系的计算与分析

Fig. 12 Topological relationships among the three point clusters

图12 3个点群目标的拓扑关系

Tab. 3 The measurement of topology relations for the three point clusters

表3 点群目标拓扑关系的度量

点群 拓扑邻居个数
点群1(1:5万) 11 018
点群2(1:10万) 10 344
点群3(1:25万) 9970

5.2 点群目标之间分布范围的计算与分析

表4可知,点群目标在比例尺减小的情况下,分布范围也在相应的减小,并且点群1到点群2减小的幅度,比点群2到点群3减少的幅度要大,说明比例尺变化的范围越大,分布范围变化的幅度也 越大。
Tab. 4 Measurement of target rangesfor the three point clusters

表4 点群目标之间分布范围的度量

点群1(1:5万) 6529327289066
点群2(1:10万) 6513135366243
点群3(1:25万) 6460226854835
Fig. 13 Distribution range of the three point clusters

图13 3个点群目标的分布范围

5.3 点群目标之间方向关系的计算与分析

Fig. 14 The main skeleton lines of the three points clusters

图14 3个点群目标的主骨架线

5.4 点群目标之间距离关系与分布密度的计算与分析

Tab. 5 The main skeleton lines’ angle measurements of the three point clusters

表5 三个点群目主骨架线度量值

点群 主骨架线角度
点群1(1:5万) 36.21
点群2(1:10万) 37.71
点群3(1:25万) 39.01
Tab. 6 Distribution density and distance measurement of the three point clusters

表6 点群的分布密度和距离关系度量值

点群 距离关系 分布密度关系
点群1 1022371.980 0.792
点群2 997499.395 0.739
点群3 1054575.400 0.703
Fig. 15 Voronoi maps of each point clusters

图15 各个点群目标的voronoi图

5.5 点群目标之间总体相似度的计算和分析

Tab. 7 Similarities for each factor between different groups of point clusters and the correspondingoverall similarities

表7 点群各因子的相似度及总体相似度

点群(1,2) 0.939 0.960 0.998 0.976 0.933 0.958
点群(1,3) 0.905 0.928 0.989 0.969 0.888 0.934
(4)点群目标之间分布密度相似度最小,由于在制图综合过程中对点主要是进行“删除”操作,对保持点群目标之间的分布密度相似度有一定的 影响。

6 结语


