Map Building Shape Classification Method based on AlexNet

  • JIAO Yangyang , 1, 2, 3, * ,
  • LIU Pingzhi 2, 3 ,
  • LIU Ailong 2, 3 ,
  • LIU Songlin 2, 3
Expand
  • 1. Information Engineering University, Zhengzhou 450001, China
  • 2. State Key Laboratory of Geo-information Engineering, Xi'an, 710054, China
  • 3. Xi'an Research institute of Surveying and Mapping, Xi'an 710054, China
*JIAO Yangyang, E-mail:

Received date: 2021-07-14

  Revised date: 2021-09-09

  Online published: 2023-02-25

Supported by

National Natural Science Foundation of China(42071450)

National Natural Science Foundation of China(41801396)

National Natural Science Foundation of China(62101395)

Abstract

Shape of map objects plays an important role in the study of map generalization and spatial query. As the basis of simplification and typification of building, the recognition and classification of map building shapes has always been a hot issue in cartographic generalization research. At present, the traditional building shape recognition methods mainly rely on the description of the building boundary and a specific shape similarity calculation, which can only be applied to buildings with conventional shapes. The traditional methods have a strong dependence on the morphological characteristics of map surface elements such as buildings, and usually only play a good role in dealing with specific types of regular contours or rectangular contours, but has poor shape recognition ability for buildings with complex or unusual shapes. This study proposes a new method of map building shape classification method based on AlexNet. The shape classification problem of building data in vector map is transformed into the classification problem of building raster images, and the shape recognition of building is realized by completing the graphic classification of convolutional neural network. Firstly, this method constructs a series of typical shape types based on spatial cognition. Secondly, the raster images of individual buildings are sampled from OSM data by vector-raster transformation method, and the training samples of building shape classification are obtained through manual identification. Based on this, the classification model of AlexNet convolutional neural network is trained. Thirdly, this method uses the trained model to perform intelligent shape classification and recognition on large-scale building data. In this paper, the OSM building data of Beijing and Hong Kong were used as samples to train the building shape classification model, and the proposed method was verified using the OSM building data of some urban areas in Guangzhou. Compared with the traditional shape similarity measurement method, the recall rate of the proposed method increased by 2.48% (92.32%) for the classification of buildings in the experimental area. The precision rate of more complex shapes such as T shape and cross shape was also higher, which increased by 13.83% and 24.53%, respectively. The experimental results show that the proposed method can significantly improve the classification accuracy of building shapes, and can effectively classify common building shapes, which lays a foundation for the next step of the map generalization such as the simplification and topicalization of buildings.

Cite this article

JIAO Yangyang , LIU Pingzhi , LIU Ailong , LIU Songlin . Map Building Shape Classification Method based on AlexNet[J]. Journal of Geo-information Science, 2022 , 24(12) : 2333 -2341 . DOI: 10.12082/dqxxkx.2022.210396

1 引言

地图制图综合是指利用大比例尺地图数据缩编小比例尺地图数据的过程中,对地图数据进行概括和抽象的技术和科学,地图制图综合过程的复杂性和求解的困难性,使之成为现代地图学中最具挑战性的研究领域之一[1]。居民地要素是地图的重要内容,在大比例尺地图中,居民地要素通常是以建筑物的形式存在的。与其他地图要素一样,建筑物的综合也必须保证综合前后形状和总体结构的相似性,在剔除轮廓细节的同时,保留其整体形状特征[2]。而建筑物的形状识别正是建筑物化简、典型化等综合操作的基础,对综合后建筑物形态特征、空间分布、同类型建筑物形态一致性的保持,发挥着重要的作用。建筑物形状的正确识别与分类,也有利于保持一定范围内建筑物形状的相似性[3]和单个建筑物形态特征的象征性[4],保证地图制图综合的整体效果。
传统的建筑物形状识别方法中最常见的是模板匹配法,即将建筑物形状归纳为一些形态模板,通过度量建筑物要素与典型模板之间形状相似性的方法进行形状识别与分类,例如:Sabo等[5]采用矩形组合模板的旋转、缩放和定位完成建筑物形状的化简;刘鹏程等[6]利用简单几何图形的几何操作制作模板解决动态综合问题;Yan等[7]利用基于傅里叶变换计算形状相似度,完成建筑物的模板匹配。上述方法多依赖于一种形状相似性计算方法,只能应对一些常见的建筑物形状,对形状结构复杂、轮廓边界不常规等情况,不能有效地排除干扰、识别出建筑物的整体结构形态,相似性度量效果不好。
产生上述问题的主要原因在于:地图的自动综合通常需要抽象、总结出人工综合过程采用的规则和策略,但是人工综合往往伴随着制图人员的主观理解,这使得制图综合的规则和策略难以被准确、完整地描述[8]。同时,建筑物的形状也是人类空间认知的过程中的重要特征,是建筑物分布模式、空间结构等特征的认知结果[9]。大比例尺地图数据通常是以矢量形式存储和使用的,传统建筑物形状识别方法往往没有直接着眼于建筑物整体形状的识别,而是局限于描述矢量数据的细节轮廓,缺乏对人类视觉特征和空间认知规律的总结和利用。
近年来,随着卷积神经网络(Convolutional Neural Network, CNN)在人脸识别、手写字体识别、图像分类中取得了突出的成就[10-14],大大推动了机器视觉和人工智能的发展。为了解决自动综合对人工综合规则和人类空间认知规律的利用问题,利用深度学习技术从已有综合成果数据中直接学习综合知识的“自下而上”研究思路逐步发展起来[1]。目前,基于深度学习的建筑物综合研究正处于起步阶段。马磊[15]采用卷积自编码器编码建筑物,并利用模板匹配方法实现建筑物的化简;晏雄峰等[16]提取建筑物形状边界的描述特征,利用自编码学习模型实现对其形状的认知;Touya等[17]采用卷积神经网络学习建筑物的综合过程,直接得到整体综合结果;Feng等[18]利用残差Unet,优化了建筑物综合的效果;杜佳威等[19]将建筑物综合过程抽象为编解码过程,并对比分析了几种深度学习模型在建筑物综合的应用效果;刘远刚等[20]采用免疫遗传算法实现了建筑物群位移问题的最优化求解;Yang等[21]使用反向传播神经网络评估4种化简算法的结果,获得建筑物化简的最优解。上述方法在利用深度神经网络进行建筑物综合的方向上做了有益的探索,但是针对建筑物形状进行直接识别与分类的研究还较少,将机器视觉中成熟的深度卷积神经网络模型应用到建筑物形状的识别和分类中不失为有益的探索。
深度卷积神经网络一般采用大量栅格图像样本的训练,避免了陷于矢量数据细节描述的困境,利用多层神经网络实现从底层特征的提取到深层次形态特征的获取,具备类似人类视觉认知的抗干扰性、模糊性等特点。其中,Krizhevsky等[22]提出的深度拓展的卷积神经网络AlexNet模型在 ILSVRC 2012(imagenet large scale visual recognition challenge)的图像分类任务中获得巨大突破(相较传统手工设计特征架构,性能提升了10%),一举奠定了卷积神经网络在机器视觉领域的地位,该模型目前仍是图像分类的常用方法,可将其作为本文地图建筑物分类的方法基础。
通过以上分析,本文提出了一种AlexNet支持下的地图建筑物形状分类方法:将已经广泛应用的卷积神经网络AlexNet模型引入建筑物形状分类与识别中,不直接对建筑物的轮廓形状进行描述或相似性度量,而是将形状识别从矢量域引入栅格域,使用人工标记的建筑物栅格图形训练卷积神经网络,学习建筑物形状的深层次特征,获得用于形状分类与识别的卷积神经网络模型,进而利用该模型实现对建筑物的形状识别与分类。

2 卷积神经网络支持下的建筑物形状分类策略

本文设计的AlexNet支持下的地图建筑物形状分类策略解决思路为:① 依据地图数据特点和制图综合需求,结合现有建筑物形状模板构方法,选择适合的建筑物典型形状分类类型;② 利用矢量-栅格结合思路,从矢量数据中选择合适形状的建筑物转换为栅格图形,并进行人工分类标记从而获得训练样本;③ 利用合理设置参数的AlexNet模型进行图像分类训练,获得可用于建筑物形状分类的卷积神经网络模型;④ 利用训练好的模型进行建筑物栅格图像的分类,并将分类结果反馈到矢量数据,进而完成矢量地图建筑物数据的形状分类。形状识别与分类流程如图1所示。该思路主要特点在于不直接使用传统方法计算建筑物与典型形状类型(形状模板)之间的相似性,而是将矢量数据的形状分类转化为栅格图像的分类,利用卷积神经网络处理高度依赖视觉特征的分类问题。
图1 基于卷积神经网络的建筑物分类识别流程

Fig. 1 The building classification process by using CNN

2.1 用于建筑物形状分类的AlexNet模型设置

本文使用的AlexNet网络模型取自ImageNet(大规模图像数据集)中的开源Caffe CNN库。AlexNet网络模型采用5层卷积层和3个全连接层,神经元个数达到了650 k,分类数据可以达到1000类。主要训练过程可以概括为:训练迭代中经过样本特征图的卷积、池化、映射计算后得到分类预测值;再计算损失值loss,利用误差反向传播计算分类模型中参数的修正梯度值;经过不断迭代修正每层特征图、池化层权重、损失值等参数值,趋近全局最优解参数。其具体涉及公式本文不再赘述,详情请参考文献[22]。这里主论述在使用该网络模型尽心计算时需要注意的几点:
(1)卷积计算及激活函数
假设:第 l层的第 j个特征图为 X j l(输入层原始特征图 X 1 1), X j l的卷积操作如(1)所示。
$ X_{j}^{l}=f\left(\sum_{i \in M_{j}} X_{i}^{l-1} \times k_{i j}^{l}+b_{j}^{l}\right)$
式中: k i j l表示卷积层的权重参数,为输入第 i个特征图和输出第 j个特征图连接的卷积核; b j l表示偏置变量参数; M j表示选择输入特征图的组合。 f *是激活函数,主要完成特征值的映射。激活函数包括很多类型,本文采用AlexNet中常用的“ReLU”激活函数,其计算公式为 f x = m a x x , 0
(2)损失值计算
损失层(Loss Layer)是CNN的终点,接受CNN的预测值和样本真实标签2个输入数据。损失层运算后向CNN输出的损失值(loss),是评价收敛效果的重要指标,主要衡量模型分类真实值与估计值之间误差。loss越是趋近于0,表示该模型的分类效果越好。本文采用AlexNet中常用的Softmax计算损失值,目的是把所有输入项的值都压缩到0到1区间内。假设有K个分类标签,表示输入图像被分到每个标签的概率分布,Softmax计算如式(2)所示。
$ \operatorname{Soft} \max \left(a_{i}\right)=\frac{\exp \left(a_{i}\right)}{\sum_{j} \exp \left(a_{j}\right)}(i, j=0,1,2, \cdots, K-1)$
Softmax的计算结果表示为输入图像被分到某个标签的概率分布值, a i为该网络模型对于第 i个分类标签的预测值。假设图像正确分类为第x个标签,则loss的计算如式(3)所示,可看出loss的值就越小,正确分类为该标签的概率越高。
l o s s = - l o g S o f t m a x a x
其中,loss的计算结果可以作为AlexNet网络误差方向传播的起点,可通过链式求导传递回卷积层和池化层,同时还是 k i j l b j l等参数更新的依据。

2.2 建筑物的栅格化方法

基于AlexNet的图像分类与识别,其输入层为固定尺寸的二维图像,在训练模型之前,首先需要确定矢量数据栅格化样本的图像范围和尺寸等问题,设定合理的样本图像范围和尺寸,也有利于提高获取样本的质量及分类识别的效率和准确度。
(1)图形范围:即某一建筑物数据栅格化的范围。① 建筑物作为独立地物,有明确的边界范围;② 依据CNN网络模型要求,样本图像需要设定为正方形;③ 模拟人视觉认知的抗干扰性,消除采样范围内的其他要素;④ 采样范围相对建筑物轮廓范围适当扩展,以呈现建筑物的整体形态。基于以上4点考虑,将建筑物的质心作为采样范围中心,外接正方形边长(Extent-length)的104%为采样正方形边长(外接正方形四边分别向外适当扩展2%),如图2所示。
图2 建筑物栅格化图像示例

Fig. 2 Example of a rasterized image of a building

(2)图像尺寸:图像尺寸的大小直接影响数据内容表达的清晰程度。为了保持图形的清晰程度,并避免计算量过大。AlexNet模型需要不小于227像素×227像素的图像作为输入,通过对比200像素×200像素至300像素×300像素不同尺寸的图像,当尺寸为250像素×250像素时,建筑物的整体形态和轮廓细节均可清晰表达,建筑物图像不同采样尺寸效果如图3所示。
图3 不同采样尺寸样本示例

Fig. 3 Samples of different sampling size

2.3 典型建筑物形状的选择

选择合适的建筑物分类形状类型(形状模板),其关键在于其“形态易记性”和“典型代表性”,这主要是由地图的使用需求和制图综合需求决定的,本文参考已有基于模板匹配的建筑物化简方法中的模板构建方法,从基本图形、简单文字以及地理适应3种类型中选择合适的形状类型。其中,基本图形主要是圆形、正方形、长方形等,简单文字涵盖罗马字母、阿拉伯数字、汉字等,地理适应主要包含因地形、道路、河流等影响产生一定的弯曲和变形的建筑物。
(1)基本图元型
基本图元是地图符号的基本构成要素,本文主要采用正方形、长方形、平行四边形、梯形、圆形等基本图元进行简单的伸缩、拼接或组合构建基本图元型形状类型。基本图元型形状如图4所示。
图4 基本图元型

Fig. 4 Basic graph element

(2)简单文字型
简单文字型包括字母型、数字型和汉字型三类。其选择思路为:依据大比例尺地图中建筑物的表达特点,选取一些可以抽象为建筑物要素的字母如CDEFHIKLMNOSTUVXZ,数字如123456780,以及汉字如口、日、田、一、工、王、凹、凸、土、回、井等。简单文字型形状如图5所示。
图5 简单文字型

Fig. 5 Simple test

(3)地理适应型
客观环境中建筑物的形状不全是规则的,可能因地形、道路、河流等环境要素的影响产生一定的弯曲和变形以适应环境,同时产生一些特殊形状建筑物。地理适应型如图6所示。
图6 地理适应型

Fig. 6 Geographic adaptation

综合分析上述3种类型,会发现其中有一些通过简单变形就可以通用的形状,例如0和O、1和I、7和L等。

3 实验与分析

3.1 训练分类模型

(1)获取样本
本文选择北京、香港2个城市建筑物类型丰富的典型区域OSM数据作为训练样本来源,如图7所示,筛选符合条件的建筑物作为样本。OSM数据的比例尺通常大于1:5000,其中的居民地要素大都以建筑物的形式表达。通过2个城市的OSM数据,独立建筑物的长宽通常不会大于400 m。因此,本文将样本筛选标准设定为400 m,当建筑物的外接矩形长大于400 m时,视其为特殊大型建筑物(如体育场等),不作为本文形状分类的研究对象。
图7 OSM数据部分采样示意图

Fig. 7 Sampling form the OSM data

(2)确定分类类型
经过样本获取环节,获取了大量建筑物样本图像,通过对样本进行分析,依据3.2节方法选择了14个出现频率较高的典型形状分类类型,依据这些类型可以采集到大量的样本,14类建筑物典型形状对应样本示例如表1所示。经过整理,共采集到用于训练的样本共11 872个,其中训练集与测试集按照3:1的比例分配。
表1 14类建筑物典型形状对应样本示例

Tab. 1 Samples of typical shapes of 14 types of buildings

序号 典型形状类型 对应样本 序号 典型形状类型 对应样本
1 正方形 8 Z形
2 直线形 9 圆形
3 L形 10 廾字形
4 井字形 11 C形
5 十字形 12 H形
6 T形 13 梯形
7 U形 14 三叉形
(3)训练模型
本文使用在Caffe CNN库中的AlexNet模型文件进行训练。训练使用计算机环境为windows7 系统,CPU为i7-4770,内存为16 G,GPU为GTX1060。修改模型文件中的初始学习率(base lr)及学习率变化率(gamma)避免局部最优和极值点丢失等情况;调整权重衰减项(weight_decay)防止过拟合,经过测试设置为0.001;最大迭代次数(max_iter)依据模型复杂度及训练样本数量设定。结合本文样本数量和数据特点,将初始学习率设置为0.001,学习率变化率设置为0.1,迭代次数设置为1000次后,模型针对测试集的accuracy达到了0.9332,loss则仅为0.1917,整个分类模型收敛效果良好,训练耗时75 min。

3.2 形状分类实验与分析

(1)本文模型应用
本文选用广州部分城区的OSM数据进行分类实验,实验耗时53 s,如图8所示。
图8 实验数据

Fig. 8 Experimental data

局部分类识别效果如图9所示,图中给出了部分建筑物被识别为某一典型形状分类概率值(p),分类概率值(p)代表着待分类对象被识别为该类型的概率,数值范围是0~1,数值越大代表是该类型的可信度越高。本文将p的置信度阈值设置为0.71,当待分类建筑物目标某形状类型p值大于0.71时将其分为该类。部分建筑物分类识别效果如图9所示,图中列举了其中4个建筑物的形状分类类型及其p值,图中大部分建筑物分类识别效果良好。
图9 利用卷积神经网络分类模型对OSM数据进行分类

Fig. 9 Result of building classification of OSM data by CNN

实验结果中部分建筑物分类结果如图10所示,图中列出了部分建筑物目标分类概率值(p值)较高的3种典型形状及其p值。由分类结果可以看出,这类建筑物目标与对应典型形状的分类概率值均较高,分类效果较好。
图10 部分建筑物的分类结果

Fig. 10 Classification results of some buildings

同时,实验中也发现了一些不能被正确分类的建筑物,如图11所示。通过分析可以发现,这些建筑物的形状不属于本文所选择典型形状中的某一个特定类型,部分建筑物的形状还兼具多种典型形状的特点。
图11 错误形状分类示例

Fig. 11 Samples of the errors in shape classification

对分类结果进行人工识别和统计后,部分形状类型的识别结果如表2所示。其中查全率(Recall)代表该典型形状类型中正确分类的数量 N C占人工分类数量 N M的比例,计算公式见式(4);查准率(Precision)由该典型形状类型中正确分类的数量 N C占该类型典型形状分类总数 N A的比例,计算公式见式(5)。查全率(Recall)能够反映本文模型对于特定形状类型的识别比例,而查准率(Precision)则能反映对于该形状类型。
表2 形状分类实验数据统计

Tab. 2 Data statistics of shape classification experiment

分类方法 类型 人工判别数/个 分类数/个 正确分类数/个 查全率/% 查准率/%
本文方法 正方形 3586 4211 3320 92.58 78.84
T形 182 199 163 89.56 81.91
L形 56 67 49 87.50 73.13
十字形 120 133 109 90.83 81.95
传统方法 正方形 3586 3959 3262 90.96 82.39
T形 182 213 145 79.67 68.08
L形 56 60 47 83.93 78.33
十字形 120 155 89 74.17 57.42
R e c a l l = N C N M
P r e c i s i o n = N C N A
(2)对比与分析
为了验证本文模型的准确性,与文献[23]中基于数学计算的传统分类方法进行对比,具体做法为利用转角函数算法度量实验数据与典型形状构建起的模板数据之间的形状相似性,通过比较与各类典型形状之间的相似性值完成分类,分类耗时155 s。经过统计,该方法的分类统计结果如表2所示。
通过本次实验可以得出:
(1)从模型较高的查准率可以看出,本文建筑物形状分类与识别模型能进行深层次特征学习,针对正确形状类型给出较高的分类概率值。
(2)相较于传统方法,本文分类模型在较为复杂的形状(如T形、十字形)识别精度较高,查准率分别高13.83%和24.53%。
(3)虽然训练分类模型耗时较多,但是一旦模型训练完成,本文方法的分类效率优于传统方法,主要原因在于传统方法需要计算建筑物与每一种特定形状模板的相似性,降低了分类效率,由此可以看出本文方法更适合于大规模的形状分类。
(4)训练本文模型无需很强的专家经验和专业的特征设计,仅需确定合适的分类即可开展模型训练,并达到较好的分类效果。

4 结论与讨论

4.1 结论

针对传统形状相似性度量和分类方法在大比例尺地图建筑物数据形状识别与分类中存在的算法适应性差、准确率不高等问题,本文引入机器视觉领域中面向大规模图像分类效果突出的卷积神经网络AlexNet模型,提出了一种AlexNet支持下的地图建筑物形状分类方法。将矢量地图建筑物数据形状分类问题转化为栅格图像分类问题,利用AlexNet模型处理高度依赖视觉特征的分类环节,进而完成对建筑物形状的识别与分类,并利用广州部分城区的OSM建筑物数据进行了验证与分析。研究结果表明:
(1)相较于基于数学计算的相似性度量方法,AlexNet支持下的建筑物形状分类方法综合查全率提高了2.48%,达到92.32%,同时对T形、十字形的分类查准率分别提高了13.83%和24.53%;同时,该方法虽然在训练过程中耗时较多,达到了75 min,但是在实验数据的分类过程中耗时较短,仅耗时53 s,相较于传统方法的155 s有明显效率优势,更适合于同类型、大规模建筑物矢量数据的形状分类。
(2)本文使用的AlexNet卷积神经网络可以模拟人类视觉认知的模糊性,能够提取出深层次的形状特征,无需设计针对特定形状的相似性度量算法,训练简单,分类准确率较高,尤其对较为复杂特殊形状的分类效果较好。
(3) AlexNet支持下的建筑物形状分类方法中分类典型形状类型选择灵活,可依据典型形状类型选择方法选择合适的分类类型,分类的数量也可根据数据特点灵活调整,体现了本文方法对不同数据的适应性,同时无需为每一种典型形状类型设置相似度计算的模板数据,减少了复杂的人工设计环节。

4.2 讨论

本文提出的AlexNet支持下的建筑物形状分类方法在实验中的部分错误也表明该方法仍然有改进的空间,例如:目前归纳的14类典型形状所涵盖的建筑物比例还有不足,典型形状类型还需要进一步归纳和完善;目前仅采集了2个城市部分区域的OSM数据作为样本,样本规模还可以继续扩大。同时,可结合机器视觉领域的最新研究成果,使用更适合地图要素形态特征、精度更高的卷积神经网络,提高建筑物形状识别与分类的准确率,乃至解决制图综合中更多的难点问题。
[1]
武芳, 巩现勇, 杜佳威. 地图制图综合回顾与前望[J]. 测绘学报, 2017, 46(10):1645-1664.

[ Wu F, Gong X Y, Du J W. Overview of the research progress in automated map generalization[J]. Acta Geodaetica et Cartographica Sinica, 2017, 46(10):1645-1664. ] DOI:10.11947/j.AGCS.2017.20170287

DOI

[2]
王家耀. 普通地图制图综合原理[M]. 北京: 测绘出版社, 1993.

[ Wang J Y. General map mapping synthesis principle[M]. Beijing: Serveying and Mapping Press, 1993. ]

[3]
刘鹏程. 形状识别在地图综合中的应用研究[D]. 武汉: 武汉大学, 2009.

[ Liu P C. Applications of Shape Recognition in Map Generalization[D]. Wuhan: Wuhan University, 2009. ]

[4]
Mackaness W, Burghardt D, Duchêne C. Map generalisation: fundamental to the modelling and understanding of geographic space[M]// Lecture Notes in Geoinformation and Cartography. Cham: Springer International Publishing, 2014:1-15.

[5]
Sabo M N, Bédard Y, Moulin B, et al. Toward self-generalizing objects and on-the-fly map generalization[J]. Cartographica: The International Journal for Geographic Information and Geovisualization, 2008, 43(3):155-173. DOI:10.3138/carto.43.3.155

DOI

[6]
刘鹏程, 艾廷华, 胡晋山, 等. 基于原型模板形状匹配的建筑多边形化简[J]. 武汉大学学报·信息科学版, 2010, 35(11):1369-1372.

[ Liu P C, Ai T H, Hu J S, et al. Building-polygon simplification based on shape matching of prototype template[J]. Geomatics and Information Science of Wuhan University, 2010, 35(11):1369-1372. ]

[7]
Yan X F, Ai T H, Zhang X. Template matching and simplification method for building features based on shape cognition[J]. ISPRS International Journal of Geo-Information, 2017, 6(8):250. DOI:10.3390/ijgi6080250

DOI

[8]
Kent A. Trust me, I’m a cartographer: Post-truth and the problem of acritical cartography[J]. The Cartographic Journal, 2017, 54(3):193-195. DOI:10.1080/00087041.2017.1376489

DOI

[9]
李德仁, 王树良, 李德毅, 等. 论空间数据挖掘和知识发现的理论与方法[J]. 武汉大学学报·信息科学版, 2002, 27(3):221-233.

[ Li D R, Wang S L, Li D Y, et al. Theories and technologies of spatial data mining and knowledge discovery[J]. Editoral Board of Geomatics and Information Science of Wuhan University, 2002, 27(3):221-233. ]

[10]
Jia Y Q, Shelhamer E, Donahue J, et al. Caffe: convolutional architecture for fast feature embedding[C]// MM '14: Proceedings of the 22nd ACM international conference on Multimedia. 2014:675-678.

[11]
Zhu Q Q, Zhong Y F, Zhao B, et al. Bag-of-visual-words scene classifier with local and global features for high spatial resolution remote sensing imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2016, 13(6):747-751. DOI:10.1109/LGRS.2015.2513443

DOI

[12]
何小飞, 邹峥嵘, 陶超, 等. 联合显著性和多层卷积神经网络的高分影像场景分类[J]. 测绘学报, 2016, 45(9):1073-1080.

[ He X F, Zou Z R, Tao C, et al. Combined saliency with multi-convolutional neural network for high resolution remote sensing scene classification[J]. Acta Geodaetica et Cartographica Sinica, 2016, 45(9):1073-1080. ] DOI:10.11947/j.AGCS.2016.20150612

DOI

[13]
Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786):504-507. DOI:10.1126/science.1127647

DOI PMID

[14]
LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436-444. DOI:10.1038/nature14539

DOI

[15]
马磊. 基于机器学习的建筑物形状化简模型[D]. 兰州: 兰州交通大学, 2018.

[ Ma L. A simplification model for building shapes based on machine learning[D]. Lanzhou: Lanzhou Jiaotong University, 2018. ]

[16]
晏雄锋, 艾廷华, 杨敏, 等. 地图空间形状认知的自编码器深度学习方法[J]. 测绘学报, 2021, 50(6):757-765.

[ Yan X F, Ai T H, Yang M, et al. Shape cognition in map space using deep auto-encoder learning[J]. Acta Geodaetica et Cartographica Sinica, 2021, 50(6):757-765. ] DOI:10.11947/j.AGCS.2021.20210046

DOI

[17]
Touya G, Zhang X A, Lokhat I. Is deep learning the new agent for map generalization?[J]. International Journal of Cartography, 2019, 5(2/3):142-157. DOI:10.1080/23729333.2019.1613071

DOI

[18]
Feng Y, Thiemann F, Sester M. Learning cartographic building generalization with deep convolutional neural networks[J]. ISPRS International Journal of Geo-Information, 2019, 8(6):258. DOI:10.3390/ijgi8060258

DOI

[19]
杜佳威, 武芳, 行瑞星, 等. 几种具有编解码结构的深度学习模型在建筑物综合中的应用与比较[J]. 武汉大学学报·信息科学版, 2021,DOI:10.13203/j.whugis20200143.

DOI

[ Du J W, Wu F, Xing R X, et al. Trial and comparative study of some encoder-decoder based deep learning models for the automated generalization of buildings[J]. Geomatics and Information Science of Wuhan University, 2021. ] DOI:10.13203/j.whugis20200143

DOI

[20]
刘远刚, 李少华, 蔡永香, 等. 移位安全区约束下的建筑物群移位免疫遗传算法[J]. 测绘学报, 2021, 50(6):812-822.

[ Liu Y G, Li S H, Cai Y X, et al. An immune genetic algorithm to buildings displacement with constraint of safety zones[J]. Acta Geodaetica et Cartographica Sinica, 2021, 50(6):812-822. ]

[21]
Yang M, Yuan T, Yan X, et al. A hybrid approach to building simplification with an evaluator from a backpropagation neural network[J]. International Journal of Geographical Information Science, 2021(5):1-30. DOI:10.1080/13658816.2021.1873998

DOI

[22]
Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6):84-90. DOI:10.1145/3065386

DOI

[23]
晏雄锋, 艾廷华, 杨敏. 居民地要素化简的形状识别与模板匹配方法[J]. 测绘学报, 2016, 45(7):874-882.

[ Yan X F, Ai T H, Yang M. A simplification of residential feature by the shape cognition and template matching method[J]. Acta Geodaetica Et Cartographica Sinica, 2016, 45(7):874-882. ]DOI:10.11947/j.AGCS.2016.20150162

DOI

Outlines

/