A Variational Graph Convolutional Auto-encoder Model Supporting Similarity Retrieval of Building Groups Patterns

  • LING Zhenfei , 1, 2, 3 ,
  • LIU Tao , 1, 2, 3, * ,
  • DU Ping 1, 2, 3 ,
  • ZHAO Dan 1, 2, 3 ,
  • CHEN Puyi 1, 2, 3 ,
  • MA Tianen 1, 2, 3
Expand
  • 1. Faculty of Geomatics, Lanzhou Jiaotong University, Lanzhou 730070, China
  • 2. National-Local Joint Engineering Research Center of Technologies and Applications for National Geographic State Monitoring, Lanzhou 730070, China
  • 3. Gansu Provincial Engineering Laboratory for National Geographic State Monitoring, Lanzhou 730070, China
*LIU Tao, E-mail:

Received date: 2022-10-18

  Revised date: 2022-12-31

  Online published: 2023-06-30

Supported by

National Natural Science Foundation of China(42261076)

National Natural Science Foundation of China(42061060)

Major Projects for Science and Technology of Gansu Province(22ZD6GA010)

State Key Laboratory of Geo-Information Engineering and Key Laboratory of Surveying and MappingScience and Geospatial Information Technology of MNR, CASM(2022-03-03)

Abstract

To address the problems of weak model generalization and insufficient utilization of spatial information due to the strict constraints in the fusion method of geometric features and spatial relations and the spectral domain similarity metric in the current building group similar pattern retrieval, this paper proposes a similar retrieval model based on the variational graph convolutional auto-encoder. Firstly, the minimum spanning tree is used to construct the building group graph structure and embed the building description features into the graph nodes to realize the quantified representation of the building group pattern. Secondly, in the reparameterization module of the variogram self-encoder, the mixed noise is generated by fusing the four-dimensional hyperchaotic system and Gaussian distribution to improve the generalization ability of the model by increasing the randomness of sampling. Then the graph convolution and pooling are used instead of fully connected layer to retain more spatial information. And the low-dimensional features are processed to obtain the feature encoding of building group patterns. Finally, the cosine distance is used to obtain the similarity between the building group to be retrieved and the building group in the pattern encoding library, so as to achieve the similarity retrieval of building group patterns. The experimental results show that the proposed model can effectively extract the pattern features of building groups and realize end-to-end similar pattern retrieval of building groups through unsupervised learning, which provides a new idea and method for automatic classification and similarity retrieval of building group patterns.

Cite this article

LING Zhenfei , LIU Tao , DU Ping , ZHAO Dan , CHEN Puyi , MA Tianen . A Variational Graph Convolutional Auto-encoder Model Supporting Similarity Retrieval of Building Groups Patterns[J]. Journal of Geo-information Science, 2023 , 25(7) : 1405 -1417 . DOI: 10.12082/dqxxkx.2023.220803

1 引言

建筑群组模式分析是地图综合的重要步骤之一[1],旨在探测和挖掘群组内建筑物分布和排列的特定规律,这种规律可用于地图导航和空间推理。建筑群组相似模式检索作为建筑群组模式分析的一个核心任务,能够帮助用户检索与输入模板位置、方向、形状、尺寸和空间关系相似的建筑群组,并通过模板匹配和数据增强等技术更好地辅助地图综合任务[2-4]。此外,度量未知区域建筑群组模式与已知区域建筑群组模式之间的相似性,发掘结构和属性相似的建筑群,能够更好地辅助城市结构分析,提升城市智能管理的效率[5-6]
目前对建筑群组相似模式检索的研究大致可以分为两类。第一类是空间域方法,此类方法大多注重群组内建筑物之间的空间关系,包括距离关系、方向关系和拓扑关系等[7-8],通常利用图模型来实现建筑群组模式的形式化和定量化,进而结合图分析算法来实现建筑群组相似模式检索。例如,行瑞星[9]等分析同质二元组直线模式的认知特征,并利用Delaunay三角网构建建筑群组邻近关系,考虑邻近程度的异质性、直线性实现了直线模式提取;巩现勇等在提取的多连通直线模式基础上,结合极大完全子图、相交和连接等图运算实现了建筑群组网格模式的提取[10];Du等[11]提出了一种基于关系的方法,该方法使用关系或语法信息来准确评估建筑物的相似性。空间域方法能够识别具有相似空间结构和特征的建筑群组模式,但需要依靠手工定义一定的约束条件来实现。第二类是谱域方法,利用图傅里叶变换(Graph Fourier Transformation, GFT)所获得频域信号的偏差来获得相似度[5],但在空间域往谱域的变换过程中容易造成空间信息的丢失。因此,基于建筑群组构建的图数据,设计一种能够自动提取图特征,并通过推理或学习策略保留更多空间信息的模型成为一个亟待解决的问题。
随着深度学习的发展,在建筑群组相似检索领域出现了很多优秀的方法,特别是图卷积神经网络(Graph Convolution Neural Network, GCNN)。GCNN作为图深度学习方法的经典网络之一,是一种端到端的深度学习架构。不仅克服了传统建筑群组相似模式检索研究中需要为特定模式手动定义严格规则约束的问题,而且能够自动挖掘数据背后的隐藏信息,并采用学习策略(如非监督训练)不断优化模型,以获得最优的结果。GCNN已在建筑群组模式分类[12]、建筑物形状认知[13]等领域取得了丰硕的成果。根据是否依赖高质量的标签样本进行训练学习,可将其在建筑群组模式上的应用分为两类。一类是半监督学习方法,该方法建立在高质量样本标注的基础之上,如晏雄锋等利用图傅里叶变换、卷积定理和神经网络搭建了GCNN模型,并在建筑群组规则与不规则模式分类的任务中获得了令人满意的结果[12]。在此基础上,Zhao等[14]结合图卷积深度神经网络,设计并实现了一种识别任意建筑群组模式的方法。另一类方法是以图自编码器(Graph Auto-Encoder, GAE)为代表的无监督学习方法。例如,晏雄锋等[2,15]通过GAE实现建筑物的形状编码,进而实现形状相似检索。与半监督学习方法相比,基于GAE的建筑物形状分析方法不需要标注大量高质量的样本,不仅节省了时间成本,而且生成了合理的形状编码,在形状相似检索方面要显著优于其他方法。
综合来看,现有的建筑群组相似模式检索方法大多基于空间域和谱域方法,存在严格规则约束导致模型泛化能力较弱,且空间信息利用不足的问题。而利用GAE方法实现建筑群组相似模式检索一定程度上能够解决上述问题。因此,本文以建筑群组图数据为基础,结合Gestalt原则选取建筑物的描述指标,提出了一种用于建筑群组相似模式检索的变分图卷积自编码器(Variational Graph Convolution Auto-encoder, VGCAE)学习模型。该模型结合随机采样、图卷积、图池化等方法,获得建筑群组的模式特征编码,并利用余弦距离计算相似度,从而实现建筑群组相似模式的检索。

2 基于VGCAE模型的建筑群组相似 模式检索

2.1 技术路线

本文提出的建筑群组相似模式检索以VGCAE为核心,通过获得合理的建筑群组模式特征编码,实现建筑群组相似模式检索。该方法包括图数据构建、建筑群组模式特征提取、模式特征编码和建筑群组相似模式检索4部分(图1),具体描述如下:
图1 基于VGCAE的建筑群组相似模式检索模型

Fig. 1 Similarity retrieval model for building group patterns based on VGCAE

(1)图数据构建:通常利用Delaunay三角网、最小生成树(Minimum Spanning Tree, MST)和Voronoi图等几何模型来构建图数据。由于MST可以隐含地传达建筑群组线性形状,并有效顾及建筑物之间连续性的特点[12]。故本文采用MST构建建筑群组图数据来实现模式的形式化表达。
(2)建筑群组模式特征提取:在构建的建筑群组图数据的基础上,结合Gestalt认知理论和Bertin视觉变量,选择了方向、形状、尺寸等描述指标对建筑群组模式特征进行形式化和定量化表达。
(3)模式特征编码:以变分图卷积自编码器模型为基础,该模型由编码器(encoder)和解码器(decoder)组成。其中编码器利用GCN将复杂的图数据编码为特征向量。解码器通过编码器获得的特征向量的内积来重构输入。
(4)建筑群组相似模式检索:获得用于输入的模式特征编码后,使用余弦距离计算待检索建筑群组与模式编码库中建筑群组的相似度,然后通过相似度排序获得检索结果。

2.2 建筑群组图数据构建

利用VGCAE进行建筑群组相似模式检索的第一步是获得建筑群组图数据,以实现建筑群组模式的形式化和定量化。该过程不仅需要考虑建筑物之间的距离、方向、拓扑等关系的表达,还需要考虑建筑物的空间特征和语义属性[16,1]。由于MST对于建筑群组关系的表达不存在循环结构,在建筑物聚类和局部结构识别过程中极具价值[1]。而典型的建筑群组模式(直线、F型、T型和L型等)的识别过程中更加注重局部结构的识别。因此,本文使用MST来建模群组内部建筑物之间的邻近关系和距离关系。首先将建筑物质心表示为图节点,然后通过MST生成的线作为边,其中2个质心点的欧式距离作为边的权重,最终构建出的建筑群组图数据如 图2(b)所示。
图2 构建建筑群组图数据

Fig. 2 Constructing building group graph structure

2.3 建筑群组模式特征提取

建筑群组模式特征提取需要结合认知心理学领域的知识进行理解和解释[1]。Gestalt理论作为认知心理学的经典理论之一,由于集成了视知觉、注意、思维、抽象等认知过程,被广泛应用于建筑物模式分析中,并总结出了一系列的规律原则,如邻近律、相似律和连续律等[8,19-22]。同时,建筑群组模式认知还需要结合Bertin视觉变量(如位置、尺寸、方向、形状、数值、颜色、纹理)来构建定量化的 模型[12,14]。在已有的建筑物模式分析研究中,通常使用位置、尺寸、方向、形状对单个建筑物进行定量化描述。例如,在位置描述方面,建筑物多边形的位置通常用形心来描述[21]。在尺寸描述方面,建筑物作为二维面状实体,周长面积是常见的指标,半径也是量化尺寸的重要指标[1],可通过计算建筑物所有节点到其中心点的平均距离来获得。在形状描述方面,有基于边界的形状描述指标(如转角函数)[22]、基于区域的形状描述指标(如紧凑度)[23-24]和基于结构的形状描述指标[1]3种方式。本文所选指标及其含义的具体描述见表1
表1 建筑群组模式定量化描述指标

Tab. 1 Quantitative description indicators of building groups pattern

指标 计算公式 指标含义 公式编号
面积 Ab 建筑物的面积[1] (1)
周长 Pb 建筑物的周长[1] (2)
均半径 r = 1 N i = 1 N R i 建筑物的半径[1] (3)
分形维度 1 - l o g A b 2 l o g P b 面积与周长的对数关系[24] (4)
紧凑度 4 π A b P b 2 面积与周长的二次关系[24] (5)
方向 Ra 建筑物最小外接矩形方向 (6)
结构方向差异 Ry 同一个群组内建筑物最小外接矩形方向与y轴夹角的差异 (7)

注:式(3)中Ri表示建筑物第i个边界点到其中心点的距离,N表示建筑物边界点的数量,r表示建筑物边界点到其中心点的平均距离。

本文选择建筑物的质心点坐标描述建筑物的位置,选择面积、周长和半径3个指标来实现描述建筑物的尺寸,选择分形维度、紧凑度描述建筑物的形状。此外,本文从建筑群组图数据的结构出发,加入了整体方向与y轴夹角差异,来实现建筑群组模式结构方向差异的定量化表达。具体如图3图4所示。
图3 群组内建筑物最小外接矩形最长边方向与y轴夹角

Fig. 3 The angle between the direction of the longest side of the smallest external rectangle and the y-axis of the building in the cluster take linear, curvilinear, F-like as an example

图4 建筑物半径示意

Fig. 4 Schematic diagram of building radius calculation

2.4 模式特征编码

利用欧氏距离、余弦距离计算相似度时,通常要求向量的长度相同。本文提出了一种利用VGCAE,从建筑群组图数据的节点描述特征中学习获得模式特征编码,来实现建筑群组相似模式检索的方法。VGCAE模型与图自编码器(Graph autoencoder, GAE)结构相似,核心内容包括编码器(encoder)和解码器(decoder)两部分。编码器包括3个GCN层,第一个GCN层用于初步提取建筑群组模式图数据的特征,其余的2个GCN层用于学习模式特征编码向量的 u σ 2,作用是获得相同长度的模式特征编码。解码器的作用是通过模式特征编码向量的内积重构输入,重构越接近,则该模式特征编码对空间信息和属性信息的损失就越少。
经典的图自编码器学习到的隐层向量仅由一个固定函数所确定,邻接矩阵和特征矩阵一定时会产生确定的输出值[25]。与图自编码器不同的是,变分图自编码器的编码器部分输出的是潜在向量的平均值( u)和标准差( σ 2),其中 u是第一层GCN获得的结果, σ 2是第二层GCN获得的结果。然后通过重参数化进行随机采样从平均值和标准差中获得潜在的向量,最终通过解码器重构输入,利用VGCAE重构出的模式特征与原始输入特征越相似,其嵌入向量在向量空间中也就越接近。因此,本文使用变分自编码器作为建筑群组相似模式检索的基本网络结构,并加入归一化的混合噪声提高模型的泛化能力。此外,在获得模式特征编码时利用全连接层会损失一定的空间信息。为此本文在第一层GCN其余2层GCN之后添加了跳跃连接以增强空间信息的利用,并在特征编码时采用的是卷积层和池化层代替全连接层,以获得保留更多空间信息的模式特征编码。具体模型结构如图5所示。
图5 基于GCN的卷积变分图编码器模型架构

Fig. 5 GCN-based convolutional variational graph encoder model architecture

2.4.1 编码器

本文使用的编码器为三层GCN网络(原理如式(1)所示),首先通过一层GCN进行特征提取,之后使用2个GCN层分别进行学习,从而获得潜在向量的标准差( σ 2)和平均值( u),并对其进行随机采样得到建筑群组模式特征编码。在随机采样的过程中,通过一个特定的分布(如高斯分布)来重构输入,进而生成与输入相似的数据,其中编码器表示如下。
q ( Z X , A ) = i = 1 N q z i X , A μ = G C N ( X , A ) l o g σ = G C N ( X , A )
式中:A是图的邻接矩阵,X是图节点的特征矩阵, q z i X , A = N z i μ i , d i a g σ i 2μ是均值向量矩阵;类似地, l o g σ是标准差向量矩阵取对数后的结果。 2层GCN被定义为 G C N ( X , A ) = A ˜ R e L U A ˜ X W 0 W 1 , W i为权重矩阵,ReLU为激活函数; A ˜ = D - 1 / 2 A D - 1 / 2是对称归一化邻接矩阵。

2.4.2 解码器

解码器通过编码器生成模式特征编码向量之间的内积来重构输入(计算过程如式(2)所示)。为了减少空间信息的损失,本文使用图卷积层和池化层来获得模型的输出,并将其存入模式特征库中。
p ( A Z ) = i = 1 N j = 1 N p A i j z i , z j
式中: p A i j = 1 z i , z j = σ z i z j A i j A中的元素; σ是非线性激活函数; p表示计算的特征分布。

2.4.3 重参数化

重参数化的目的是从输入特征中利用一个固定的分布随机采样以实现特征重构。初始的VGCAE使用高斯分布进行随机采样,然而高斯分布产生的大部分数据总是在某一特定范围内,从而导致生成的数据损失了一定的信息。混沌系统由Shannon提出,并且对初始值和参数比较敏感,随机性较强,在数字地图安全、文字加密等领域应用广泛[26]。因此,本文引入四维超混沌系统来生成混沌噪声,将其与高斯噪声融合来扩大编码区域,以获得更好的编码能力,其计算公式如式(3)所示:
x ˙ = a y - x y ˙ = b x - y + e w - x z z ˙ = x y + x 2 - c z w ˙ = - d y
式中:x, y, z, w是4个变量即四维混沌序列;abcd是系统参数。经过多次实验,本文选a=10, b=28, c=8/3, d=1进行实验,对应的四维混沌系统的相位图、高斯噪声和混沌高斯混合噪声如图6所示。
图6 四维超混沌系统噪声与高斯噪声

Fig. 6 Four-dimensional hyperchaotic system noise with Gaussian noise

本文以建筑群组模式特征矩阵的行向量为单位,每行均采用不同的初始值和系统参数来生成噪声,从而增强采样的随机性。图6(a)表示四维超混沌系统的相位图,图6(b)、(d)、(e)分别表示图6(a)在x-y、x-z、x-w上的投影。从图6(f)可以看出四维超混沌系统生成的噪声比高斯噪声的数据分布更加分散,能够增强模型的泛化能力。由于高斯分布 ~(0,1),因此,四维超混沌系统生成的噪声也需要进行归一化处理,与高斯分布加权叠加获得混合 噪声。

2.4.4 损失函数

VGCAE采用无监督方式学习,学习目标是最小化重构输出和输入之间的差异,同时利用KL散度优化变分下限 L进行训练[27]。损失函数的作用是通过计算神经网络迭代过程中前向计算结果与真实值的差距,结合梯度下降来实现模型优化。因此,在VGCAE模型中损失函数值越小,代表模型输出与输入越接近,模型的性能越好,其计算公式如式(4)所示。
L A = E q Z | X , A l o g p A | Z - K L q Z | X , A p Z L x = M S E ( X , X ˆ ) L = L A + L x
式中: K L [ q ( ) p ( ) ]是分布 q ( )和分布 p ( )之间的KL散度; LA表示图重构的损失函数; Lx表示特征重构的损失函数; L表示模型总体的损失函数; X为原始输入图节点特征矩阵; X ˆ为重构后的节点特征矩阵。

2.5 建筑群组相似模式检索

建筑群组相似模式检索包括用户输入、相似度计算、相似检索3个步骤:
(1)用户输入:用户输入待检索建筑群组,通过建筑群组的编码学习得到模式特征编码。
(2)相似度计算:相似度是实体的相似程度,在计算的过程中通常用距离来计算,例如欧式距离、余弦距离等。其中,余弦距离注重的是空间向量方向上的差异,欧式距离注重的是位置上的差异。建筑群组模式编码学习的过程中生成的模式特征编码是多维的模式特征编码,从嵌入向量方向上计算差异更符合实际,故本文采用余弦距离进行相似度计算。
(3)相似检索:通过相似度计算模式特征库中的向量与用户输入待检索建筑群组编码之间的相似度,并通过降序排列选择相似度最高的k个建筑群组作为最终结果返回给用户,其中k根据实际情况确定。

3 实验与分析

本文采用Python语言,结合Pytorch深度学习框架与DGL图神经网络库,实现了变分图卷积自编码器模型,并对建筑群组模式进行编码学习,在GeForce GTX3080(GPU)、i7-10750H(CPU)的硬件平台上进行建筑群组相似模式的检索实验。

3.1 数据准备

本文从OpenStreetMap官网获取建筑物轮廓数据进行实验,在武汉市的所有建筑物轮廓数据中选择了6种典型的建筑群组模式,包括直线型、网格型、曲线型、T型、F型和L型。
VGCAE变分图卷积自动编码器的训练过程不需要事先做标签。但为了评估模型的性能,本文进行了标签样本的选取。由3个具有制图经验的志愿者手工选取,每类模包括300个样本,每类建筑群组模式作为一个训练样本,共1 800个样本,示例见表2
表2 训练样本中6种建筑群组模式部分示例

Tab. 2 Examples of some of the 6 building group patterns in the training sample

建筑群组
模式分类
直线型 曲线型 网格型 F型 T型 L型
待检索
建筑群组
训练样本

3.2 模型训练

根据多次实验效果,本文选择tanh激活函数,学习率设为0.001。训练时,考虑到模型中GCN层的隐藏层单元维度、混合噪声和高斯噪声随机采样可能对于模型性能的影响,下面通过具体的实验进行分析。
实验分别设置{8、16、32、64、128、224、256}共7种编码维度,依次在混合噪声和高斯噪声的模型中进行训练,由于模型获得的损失收敛值有一定差异,为了便于观察损失曲线的走势,本文将不同维度下的损失值均映射到(0,1)范围内。损失函数越小,表示模型重构生成的建筑群组图数据特征与输入越接近,但不能说明模式编码能力的优劣[16],其训练结果如图7所示。由图7(a)可以看出,使用高斯噪声的模型在隐藏层的单元维度设置为{224}、{256}时,损失曲线拟合速度最慢,收敛时所需的步长最长;隐藏层的单元维度设置为{128}时,损失曲线下降的速度有所减缓,但拟合效果仍然较差;隐藏层的单元维度设置为{8}、{32}、{64}时,损失曲线变化趋势较为一致,先是迅速下降然后趋于平缓,最后逐渐平稳;隐藏层的单元维度设置为{16}时,损失曲线的收敛速度最快,且最为平稳,模型的拟合效果最好。
图7 模型的训练损失曲线

Fig. 7 Training loss curve of the model

图7(b)可以看出使用混合噪声模型的损失曲线走势与图7(a)基本相同。不同的是,图7(b)中损失的收敛值随着编码维度的增加而增加,可能是由于编码维度越高,GCN生成的编码随机采样后更容易获得与编码差异较大的低维特征向量,从而导致模型较难重构。因此,本文选择HD=16进行编码学习,并获得模式特征编码。

3.3 单个特定模式的建筑群组相似模式检索

选择6种典型的建筑群组模式进行相似检索实验,分别输入6种模式的待检索建筑群组,在建筑群组模式编码特征库中进行检索,得出与待检索建筑群组相似度最高的4个检索结果,如图8所示(检索结果下方的数字表示与待检索建筑群组与实验样本之间的相似度,红线表示典型建筑群组模式的结构)。
图8 建筑群组模式检索结果

Fig. 8 Building groups Pattern retriveal results

图8可知,对于第2组网格型和第4组F型建筑群组模式,模式特征编码能够有效区分。对于第1组直线模式和第3组曲线模式,周围出现的零散建筑对于群组模式整体的结构不会产生较大的影响,通过模式特征编码可以有效识别。此外,从第5组L形和第6组T形的检索结果来看,对于不规则的建筑物呈现的模式仍然可以识别(如第5组L形第3、4号检索结果)。

3.4 完整数据集上的相似模式检索

上述实验结果表明,融合混合噪声的VGCAE模型可以较好的度量单个特定模式与单个待检测样本之间的相似程度。然而,建筑群组模式的相似检索往往需要从完整的真实数据集中识别和检索出特定的模式,而非单一模式之间的对比。因此,本文在3.1节中6种典型模式混合的完整数据集上,依次输入6种典型模式的待检索建筑群组进行检索。根据待检索建筑群组与实验样本之间的相似度,将相似度大于0.8的实验样本与待检索建筑群组归为一类,小于0.8的视为未检索出的建筑群组,并选用A、B 2个区域进一步分析模型的性能,结果如图9所示。对于F型、L型和T型的模式,由于局部结构的相似性,在检索结果中会出现同一建筑群组属于不同模式的情况。因此,本文采用多次检索结果中相似度最高的模板类别作为该建筑群组的最终归属类别。
图9 完整真实数据集中的建筑群组相似模式检索

Fig. 9 Similar pattern retrieval for building groups in complete real datasets

图9可以看出,VGCAE模型在A和B两个区域对于不同类型的模式均具有较好的区分度,但对于网格模式的检索效果较差(如图9中B区域红色虚线圈中的示例)。从图10(a)可以看出曲线模式的查全率最低,这是因为曲线模式与其他模式不同,其结构往往具有较大差异。从认知角度来看,直线模式的所有建筑物具有一种知觉倾向[18],而F型、L型、网格型、T型都是由相交的直线构成。因此,如何在保证查询准确率的情况下,进一步提升查询的完整性将成为本文未来的研究方向。
图10 VGCAE对于不同类型建筑群组模式的查全率与查准率

Fig. 10 Recall and precision of VGCAE for different types of building group patterns

建筑群组图数据是利用VGCAE进行检索的基础,探讨不同图结构对于检索结果的影响,对于建筑群组相似模式检索至关重要。本文也采用K最近邻图(K-nearest Neighbor Graph,KNNG)方法进行构图,并就最后检索结果的查准率和查全率与MST方法进行了对比。从图10(b)可以看出,当采用KNNG时,模型的查全率和查准率均有所下降,尤其是对于T型、F型、L型和网格型模式来说,下降幅度较大。这是因为利用KNNG对这3种模式定量化描述时,容易缺失一些重要的结构特征。而直线模式的查全率较高,则是因为对于其他的模式很可能也形成了一些直线结构(图11)。因此,未来的工作中仍需要探索建筑群组的构图方式,以尽可能的保留更多的结构信息,来实现建筑群组相似模式的检索。
图11 利用KNNG构建的L型和网格型建筑群组图数据

Fig. 11 L and grid building group graph data constructed with KNNG

3.5 方法比较

本文选择检索任务中常用的2个指数来评价模型的性能,这2个指标值越大,表明模型的检索性能越好。具体描述如下:
(1)FT(First tier, FT):FT表示(t-1)邻域范围内属于同一类型的建筑群组模式的百分比[13]。其中t是训练每类样本的总个数。
(2)归一化累计损失增益(Normalized Discounted Cumulative Gain, NDCG):对于一个输入模板,确定其与数据库中其他模式之间的相似度,并按降序排列。NDCG的值越大,检索效果越好,NDCG具体计算过程见文献[28]。
GFT将图信号从空间域转换到频域获得频谱,然后通过频谱之间的偏差来计算建筑群组模式相似度,在建筑物模式分析任务中应用较为广泛。因此,本文选择GFT(Graph Fourier Transform, GFT)作为对比模型[5],验证VGCAE模型的检索性能 (表3)。
表3 VGCAE模型使用高斯噪声和混合噪声的性能评估

Tab. 3 Performance evaluation of VGCAE model using Gaussian noise and mixed noise

模型 FT NDCG
VGCAE+高斯噪声 0.418 0.825
VGCAE+混合噪声 0.456 0.869
GFT 0.328 0.745
与VGCAE+高斯噪声相比,VGCAE+混合噪声模型的检索性能有所改善,可能是由于混沌噪声的加入使得模型扩大了编码区域,采样过程不再局限于高斯分布的固定范围。
因此,融合混合噪声之后,模型的泛化能力有所增强。GFT模型与VGCAE模型的性能差别较大,可能是因为GFT在空间域往谱域变换的过程中损失了一定的空间信息,而VGCAE模型以GCN为模型基座,在获得模式特征编码时用池化层替代了全连接层保留了图数据更多的空间信息,从而提高了建筑群组相似模式检索的性能。

4 结论与展望

建筑群组模式相似度量与检索是建筑群组模式分析的重要内容。本文提出了一种结合变分图卷积自编码器与相似度计算的深度学习网络(VGCAE)模型,以实现建筑群组相似模式检索,主要结论如下:
(1)相较于谱域相似度量方法GFT,VGCAE模型的检索性能有了一定程度的提高。
(2)VGCAE模型针对单个特定模式的相似检索具备良好的性能,并在不同类型建筑群组模式上的查全率和查准率较高,表明该模型具备良好的空间信息编码能力。
(3)VGCAE对于不同方法构建的图数据较为敏感,相比KNNG方法构建的图数据,本文选用的MST构建的图数据在利用VGCAE模型特征编码进行建筑群组相似模式检索时,查全率和查准率均有所提高。
相较于以往的深度学习模型,本文提出的深度学习网络(VGCAE)模型在图数据构建的基础上,进一步对编码器生成的模式特征编码添加混合噪声,在扩大编码区域的同时,还能够学习多种模式复杂的空间信息,从而提高了建筑群组相似模式检索的准确度。
本文研究工作仍存在一些改进方向。首先,本文仅采用了建筑物的几何属性,未能结合语义属性进行深入探讨。其次,本文采用无监督学习方法实现模式特征编码,对于数据质量的依赖性较强,下一步研究中可将依据先验知识获得的认知结果作为监督知识,从而更好地对模型进行改进。
[1]
晏雄锋. 深度卷积学习支持下的建筑物模式分析[D]. 武汉: 武汉大学, 2019.

[ Yan X F. Building Pattern Analysis Supported by Deep Convolutional Learning[D]. Wuhan: Wuhan University, 2019.]

[2]
Lee J, Jang H, Yang Je et al. Machine Learning Classification of Buildings for Map Generalization[J]. ISPRS International Journal of Geo-Information, 2017, 6(10):309. DOI:10.3390/ijgi6100309

DOI

[3]
Lüscher P, Weibel R, Burghardt D. Integrating ontological modelling and Bayesian inference for pattern classification in topographic vector data[J]. Computers, Environment and Urban Systems, 2009, 33(5):363-374. DOI: 10.1016/j.compenvurbsys.2009.07.005

DOI

[4]
Yu W, Ai T, Liu Pe et al. The analysis and measurement of building patterns using texton co-occurrence matrices[J]. International Journal of Geographical Information Science, 2016:1-22. DOI:10.1080/13658816.2016.1265121

DOI

[5]
Chen Z, Ma X, Yu et al. Measuring the similarity of building patterns using Graph Fourier transform[J]. Earth Science Informatics, 2021, 14(4):1953-1971. DOI:10.1007/s12145-021-00659-6

DOI

[6]
刘慧敏, 胡文柯, 唐建波. 顾及功能语义特征的建筑物空间分布模式识别方法[J]. 测绘学报, 2020, 49(5):622-631.

DOI

[Liu H M, Hu W K, Tang J B, et al. A method for recognizing building clusters by considering functional features of buildin gs[J]. Acta Geodaetica et Cartographica Sinica, 2020, 49(5):622-631.] DOI:10.11947/j.AGCS.2020.20190222

DOI

[7]
刘涛, 闫浩文. 空间面群目标几何相似度计算模型[J]. 地球信息科学学报, 2013, 15(5):635-642.

DOI

[ Liu T, Yan H W. Spatial group target geometric similarity calculation model[J]. Journal of Geo-Information Science, 2013, 15(5):635-642]. DOI:10.3724/SP.J.1047.2013.00635

DOI

[8]
刘涛. 空间群(组)目标相似关系及计算模型研究[D]. 武汉: 武汉大学, 2011.

[ Liu T. Research on the similarity relationship of spatial group objectives and computational model[D]. Wuhan: Wuhan University, 2011.]

[9]
行瑞星, 武芳, 巩现勇. 一种建筑群同质二元组直线模式的识别方法[J]. 测绘科学技术学报, 2021, 38(1):91-96.

[ Xing R X, Wu F, Gong X Y et al. A Recognition Method of Homogeneous Two-tuple Collinear Pattern in Building Groups[J]. Journal of Geomatics Science and Technology|J Geom Sci Technol, 2021, 38(1):91-96.]. DOI:10.3969.j.issn.1673-6338.2021.01.015

DOI

[10]
巩现勇, 武芳. 城市建筑群网格模式的图论识别方法[J]. 测绘学报, 2014, 43(9):960-968.

DOI

[Gong X Y, Wu F. The Graph Theory Approach to Grid Pattern Recognition in Urban Building Groups[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(9):960-968.] DOI:10.13485/j.cnki.11-2089.2014.0125

DOI

[11]
Du S, Luo L, Cao et al. Extracting building patterns with multilevel graph partition and building grouping[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2016, 122: 81-96. DOI:10.1016/j.isprsjprs.2016.10.001

DOI

[12]
Yan X, Ai T, Yang M et al. A graph convolutional neural network for classification of building patterns using spatial vector data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2019, 150:259-273. DOI:10.1016/j.isprsjprs.2019.02.010

DOI

[13]
Yan X, Ai T, Yang M et al. Graph convolutional autoencoder model for the shape coding and cognition of buildings in maps[J]. International Journal of Geographical Information Science, 2021, 35(3):490-512. DOI:10.1080/13658816.2020.1768260

DOI

[14]
Zhao R, Ai T, Yu W et al. Recognition of building group patterns using graph convolutional network[J]. Cartography and Geographic Information Science, 2020, 47(5): 400-417. DOI:10.1080/13658816.2020.1768260

DOI

[15]
Tang D, Liang D W, Jebara T, et al. Correlated variational auto-encoders[EB/OL]. 2019: arXiv:1905.05335. https://arxiv.org/abs/1905.05335

[16]
晏雄锋, 艾廷华, 杨敏. 地图空间形状认知的自编码器深度学习方法[J]. 测绘学报, 2021, 50(6):757-765.

DOI

[Yan X F, Ai T h, Yang M et al. Shape cognition in map space using deep auto encoder learning[J]. Acta Geodaetica et Cartographica Sinica, 2021, 50(6):757-765] DOI: 10.11947/j.AGCS.2021.20210046

DOI

[17]
高晓蓉, 闫浩文, 禄小敏. 多尺度地图空间居民地语义相似度计算方法[J]. 测绘学报, 2022, 51(1):95-103.

DOI

[Gao X R, Yan H W, Lu X M. Semantic similarit y measurement for building polygon aggregation in multi scale map space[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(1):95-103.] DOI:10.11947/j.AGCS.2022.20210074

DOI

[18]
巩现勇, 武芳, 钱海忠. 建筑群多连通直线模式的参数识别方法[J]. 武汉大学学报·信息科学版, 2014, 39(3):335-339.

[Gong X Y, Wu F, Qian H Z et al. The Parameter Discrimination Approach to Multi-connected Linear Pattern Recognition in Building Groups[J]. Geomatics and Information Science of Wuhan University, 2014, 39(3):335-339.] DOI:10.13203/j.whugis20120708

DOI

[19]
艾廷华, 郭仁忠. 基于格式塔识别原则挖掘空间分布模式[J]. 测绘学报, 2007(3):302-308.

[Ai T H, Guo R Z. Polygon Cluster Pattern Mining Based on Gestalt Principles[J], Acta Geodaetica et Cartographica Sinica, 2007(03): 302-308.] DOI:10.3321/j.issn:1001-1595.2007.03.011

DOI

[20]
艾廷华. 深度学习赋能地图制图的若干思考[J]. 测绘学报, 2021, 50(9):1170-1182.

DOI

[Al Tinghua. Some thoughts on deep learning enabling cartography[J]. Acta Geodaetica et Cartographica Sinica, 2021, 50(9):1170-1182.] DOI: 10.11947/j.AGCS.2021.20210091

DOI

[21]
Bourke P. Calculating the area and centroid of a polygon. Available from: http://www.seas.upenn.edu/-sys502/extra_materials/Polygon%20Area%20and%20Centroid.pdf[J]. 1988(C):3-5.

[22]
晏雄锋, 艾廷华, 杨敏. 居民地要素化简的形状识别与模板匹配方法[J]. 测绘学报, 2016, 45(7):874-882.

DOI

[Yan X F, Ai Tinghua, Yang M. A Simplification of Residential feature by the shape cognition and template matching method[J]. Acta Geodaetica et Cartographica Sinica, 2016, 45(7):874-882.] DOI:10.11947/j.AGCS.2016.20150162

DOI

[23]
Burghardt D, Steiniger S. Usage of Principal Component Analysis in the Process of Automated Generalisation[J]. Proceedings of 22nd international cartographic conference, 2005(September 2015):9-16.

[24]
Basaraner M, Cetinkaya S. Performance of shape indices and classification schemes for characterising perceptual shape complexity of building footprints in GIS[J]. International Journal of Geographical Information Science, 2017, 31(10):1952-1977. DOI:10.1080/13658816.2017.1346257

DOI

[25]
杨伟英. 基于生成对抗和图注意力的异质信息网络节点表示学习研究[D]. 长春: 吉林大学, 2021.

[ Yang W Y. Node Representation learning in Heterogeneous information networks based on generative adversarial and graph attention[D]. Changchun: Jilin University, 2021.]

[26]
Wang X, Yan H, Zhang L. Vector map encryption algorithm based on double random position permutation strategy[J]. ISPRS International Journal of Geo-Information, 2021, 10(5). DOI:10.3390/ijgi10050311

DOI

[27]
Kipf T N, Welling M. Variational Graph Auto-Encoders[J]. 2016: arXiv: 1611.07308. https://arxiv.org/abs/1611.07308.

Outlines

/