A Method for Semiautomated Segmentation of Building Facade from Mobile Laser Scanning Point Cloud Based on Feature Images and SVM

建筑物立面是城市地物的重要组成部分,而移动激光扫描是获取城市地物三维信息的重要手段之一。本文提出了一种基于移动激光扫描点云的建筑物立面半自动提取算法。该方法首先构建研究区水平网格;然后计算局部点云几何特征,并且将特征投影到水平网格生成点云特征图像;接着基于支持向量机(Support Vector Machine,SVM)对建筑物立面网格进行粗提取;最后使用网格属性(形状系数、网格面积、最大高程)对粗提取结果进行过滤,并将结果反投影到三维空间中得到精确的建筑物立面。以卡内基梅隆大学的移动激光扫描点云进行试验后表明,本算法能够较好地提取出建筑物立面,提取精度为84%,召回率为90%,数据修正后精度为88%,召回率为91%。通过与现有算法对比,本文提出的算法具有较高精度。


Building facade is an important component of urban street features. Delineating and representing the building facade would benefit the urban building design and planning. As a new mobile mapping system, Mobile Laser Scanning (MLS) allows the quick and cost-effective acquisition of close-range three-dimensional (3D) measurements of urban street objects. This paper presents a semiautomated segmentation method for identifying the building facades from MLS point clouds data. The method consists of three major steps: (1) a horizontal grid system is built for the study area, and the multidimensional geometric features of 3D point clouds data, including the normal vector feature, omni-variance feature, geometric dimensionality of α1, α2 and α3, and eigen-entropy feature, are defined and calculated. Then, a feature image is created after projecting these features to the horizontal grid. (2) Building facades are roughly extracted using Support Vector Machine (SVM). (3) The rough extraction result is filtered according to the characteristics of grid including the shape coefficient, grid′s area, and the largest elevation. Two MLS point cloud datasets of Carnegie Mellon University (CMU) database were used in this study to estimate the feasibility and effectiveness of the method. It was found that this method performs well in extracting the building facades. The precision of the results is 0.88, and its recall rate is 0.90, which is better than some existing methods. Our method provides an effective tool for extracting building facades of streets from MLS point cloud data.

1 引言

随着三维空间信息获取技术的发展,激光扫描技术(Laser Scanning)已经成为获取城市地表三维空间信息最快最有效的手段之一。近年来,从激光扫描数据中提取建筑物点云已经成为计算机图形学和城市遥感的一个热点问题。
基于单个点几何形状特征的分类方法,首先通过计算点云维数特征将点云划分为线状(一维)、面状(二维)和簇状(三维),然后利用聚类算法或机器学习算法进行分类。例如,Lalonde等结合维数特征和高斯混合模型将点云分为线、面和簇3类,获得了较好的结果[5];考虑到直接使用固定邻域半径来估算维数特征存在较大的误差,Demantke等提出了通过最小化熵值来获得最佳邻域半径的方法[4];在该算法的基础上,Yang等增加了反射率信息获取了更佳的邻域半径,并使用支持向量机(Support Vector Machine,SVM)对点云进行分类,然后通过二次聚类的方法将不同的地物分开[16]
基于体元或超体元的分类方法目前已经有大量研究。由于点云数据的海量性,基于单个点几何形状特征的分类方法计算时间较长。为了减少计算量,一些学者引入体元(Voxel)和超体元(Super Voxel)的概念,通过将三维空间体元化,达到数据压缩的效果。此外,还能利用八叉树等数据结构来加快查询和计算速度。例如,Wu等首先使用体元组织点云数据,然后使用分层区域生长的算法来提取单株行道树[8],无论是计算速度还是提取精度都有所提升;Lim利用超体元来加速条件随机场(Conditional random field,CRF)的计算[7];Aijazi结合点云特征和体元生成超体元,然后使用连接链(link-chain)代替区域生长算法来进行地物识别和分类[6]
基于特征图像的分类方法虽然会损失一部分点云信息,但是相比于前2类算法的计算量更小。城市地物一般垂直于水平面,具有很强的2.5维特性,利用这一特点,部分学者提出了点投影算法,即在水平面构建一个虚拟的网格,采用正射投影的方法将三维点云投影到二维空间,形成一个二维的点云特征图像,再利用图像处理算法来进行点云的提取和分类。例如,史文中等提出了投影点密度法(Density of Projected Points,DoPP)来提取建筑物[12],但是这种算法很难设置一个合理的建筑物边界阈值;吴宾等对这种算法进行改进,提出了分层点密度法提取行道树[13]。高程是地物的一个很重要的特征,许多学者利用这一特点,将地物高程投影到二维平面生成高程特征图像[9-11]来进行粗分类。例如,杨必胜等对DoPP算法进行改进,认为每个网格的值应该由点云的高程和距中心点的水平距离决定,利用图像处理的算法提取单个地物[15],再使用PCA(Principal Component Analysis)等算法对地物进行分类和建筑物边界提取[14],对点密度投影法有较大的改进。

2 建筑物立面点云提取算法

Fig.1 Flow chart of the algorithm

图1 算法流程图

2.1 构建研究区域水平网格

对于给定的激光扫描点云数据 P Lidar = { p 1 , p 2 , , p n } 中的任意点 p k 都有 ( x k y k z k ) 三维坐标。首先定义二维平面网格大小长度 l 和宽度 w ,然后计算出研究区域最大和最小的三维坐标 X min X max Y min Y max Z min Z max 。网格原点在三维空间的坐标定义为 X min , Y min , Z min ,从而保证点云都在网格的正上方。
根据最大和最小 XY 坐标可将水平网格分割成 I 行和 J 列,用 g ( i , j ) 代表第 i 行、第 j 列的网格,如式(1)所示。如果网格 g ( i , j ) 柱面上存在激光点则为非空网格,标记为1,否则为空网格,标记为0,不参与后续计算。对于研究区域的水平网格系统 G ,有。定义非空网格 g ( i , j ) 的点集为 p m 1 m M , p m g ( i , j ) } ,其中 M 为点集中点的个数。对于 p m 所属的网格,同样可将横纵坐标 ( x m y m ) 代入式(1)进行计算。
i = int ( ( x - X min ) / l ) j = int ( ( y - Y min ) / w ) (1)

2.2 生成点云特征图像

城市环境非常复杂,许多地物(如树木、电线杆和路灯等)都和建筑物的高程相似,而不同建筑物高程差异也较大,同时很多情况下地物会相互遮挡,导致数据缺失,因此,在很多情况下直接使用高程进行地物分割并不适用。对于同一类地物的点,局部几何特征具有一定的相似性,所以本方法选取点云的6种特征,分别为法向量与水平面夹角 θ 、全方差 v 、维数特征 α 1 α 2 α 3 和特征根熵 E f ,生成点云特征图像,作为分类。
估算一个点法向量和特征根近似于估计一个相切面法线问题,可以找到该点最近点云,使用最小二乘法进行平面拟合。对于点云中的每个点 p k ,使用最近邻法到最近的 K 个点,然后计算这 K 个点的协方差矩阵 C (式(2)), p ̅ 为所有点的重心。
C = 1 K i = 1 K ( p i - p ̅ ) ( p i - p ̅ ) T (2)
式中 p ̅ K 个点三维坐标 ( x i y i z i ) 的算术平均。
通过数学变换可以发现,点 p k 的特征根为 λ k = ( λ 1 , λ 2 , λ 3 ) ,法向量估计近似于求取 C 最小特征根 λ 3 对应的特征向量 n k = e ̅ 3 = ( n x , n y , n z ) ,如式(3)所示。
C = e ̅ 1 e ̅ 2 e ̅ 3 λ 1 0 0 0 λ 2 0 0 0 λ 3 e ̅ 1 e ̅ 2 e ¯ 3 ( λ 1 λ 2 λ 3 ) (3)
建筑物立面垂直于地面,朝向并不固定,所以只需要提取点 p k 的法向量与水平面的夹角 θ 作为其局部几何特征之一,如式(4)所示。
θ = arccos ( n x 2 + n y 2 ) (4)
p k 的特征根在计算前必须使用式(5)进行归一化处理,归一化后的所有特征根之和为1,然后再使用归一化特征根来计算点局部几何特征。首先,根据式(6)计算点云的全方差 v ;然后使用维数特征 α 1 α 2 α 3 (式(7))表示点云属于线状、面状还是簇状;最后使用特征根熵 E f (式(8))描述点属于某一形状的概率。
λ i = λ i i = 1 3 λ i (5)
v = i = 1 3 λ i (6)
α 1 = ( λ 1 - λ 2 ) λ 1 α 2 = ( λ 2 - λ 3 ) λ 1 α 3 = λ 3 λ 1 (7)
E f = - λ 1 ln ( λ 1 ) - λ 2 ln ( λ 2 ) - λ 3 ln ( λ 3 ) (8)
综合上述所有特征,本文共构建了6维特征的向量 F (式(9))。对于任意一个包含了 m 个点的网格 g ( i , j ) ,将这 m 个点的6维特征分别进行加权平均便得到了网格特征 I i , j (式(10))。而对于整个网格系统 G ,一共可以生成6张特征图像 I = { I θ , I v , I α 1 , I α 2 , I α 3 , I E f }
F = θ , v , α 1 , α 2 , α 3 , E f (9)
I i , j = 1 m F ( p m ) , p m g ( i , j ) (10)

2.3 建筑物立面网格提取

点云特征通过网格化的方式生成了多维特征图像 I 。通过分析发现,建筑物的高程明显高于多数其它地物,而且建筑物立面与水平面的夹角较大,所以可使用线性分类器区分建筑物网格与非建筑网格。由于SVM相对于其他线性监督分类器能够较好地处理高维数据,并具有较好的稳定性[17],所以本文选用线性核函数的SVM来进行训练和分类。随机选取相同个数的建筑物立面与非建筑物立面网格点作为训练样本,训练建筑物网格分类模型;然后把六维特征图像 I 作为模型的输入特征,得到输出结果二值化图像 BI 。同时,直接使用SVM训练得到结果会出现很多错分类网格,必须使用建筑物立面网格的网格属性对非建筑物立面网格进行滤除。
(1)建筑物立面投影多为线状或者是折线状,所以定义了形状系数 CI (式(11))。如果网格区域为一个正圆形,则 CI 接近1;如果 CI 为线状,则 CI 接近0。设置阈值 C I 0 ,令第 k 个区域 C I k < C I 0 ;
(2)建筑物属于较大型的地物,因此网格区域应该较大,所以设定参数区域面积 A (式(12)),并且设定阈值 A 0 ,令第 k 个区域 A k > A 0 ;
(3)建筑物属于较高的人造地物,因此其最大高程值 MH 必须高于指定阈值 M H 0
CI = 4 π A P 2 (11)
A = n × l × w (12)
式中: P 为网格区域的周长; l w 分别为网格的长度和宽度。

3 实验结果与分析

3.1 数据源

本文采用美国卡内基梅隆大学的移动激光扫描点云数据库的3个数据集data-1、data-2和data-3,分别包含了943 596、999 466和1 032 542个点;每个数据集的研究区域覆盖范围分别是168 m×463 m、488 m×409 m和390 m×368 m。3个标准数据集预先通过人工精确分类,总共分为44小类(表1),主要为建筑物立面、地表、树木、行人和电线等。图2为实验数据的概览图,其中图例为点云的相对高程。
Tab.1 Labeled id and name of CMU Oakland 3-D point cloud dataset

表1 卡内基梅隆大学移动激光扫描点云数据库的分类编号和类别

编号 类别 编号 类别 编号 类别 编号 类别
1001 undet 1109 fire_hydrant 1202 ground 1401 wall
1002 linear_misc 1110 post 1203 paved_road 1402 stairs
1003 surf_misc 1111 sign 1205 curb 1408 fence
1101 wire_bundle 1113 bench 1206 walkway 1409 gate
1102 isolated_wire 1114 lamp 1300 foliage 1410 ceiling
1103 utility_pole 1115 traffict_lights 1301 grass 1411 facade_ledge
1104 crossarm 1116 traffic_lights_support 1302 small_trunk 1412 column
1105 support_wire 1117 garbage 1303 large_trunk 1413 mailbox
1106 support_pole 1118 crosswalk_light 1305 thick_branch 1500 human
1107 lamp_support 1119 parking_meter 1306 shrub 1501 vehicle
1108 transformer 1200 load_bearing 1400 facade 9999 legacy
Fig.2 Overview of CMU Oakland 3-D point cloud dataset.

图2 卡内基梅隆大学移动激光扫描点云数据库

3.2 点云特征图像生成

为了避免点云特征丢失,同时有效地保持非空网格的连通性,通过多次试验,网格最合适的宽度为0.25 m×0.25 m,计算点局部几何特征选取最近30个点,生成的特征图像如图3所示。图3(a)是人工分类的原始点云数据,其中青色表示建筑物立面,黄色表示道路,绿色表示树木,蓝色表示车辆;图3(b)原始点云网格化生成的点云类别图像,绿色为建筑物网格,深红色为非建筑物立面网格。从特征图像(图3(c)-(h))可看出,建筑物立面与地面夹角较大,同其他地物有较大区别,全方差较小,主要的几何维数特征表现为面状。
Fig.3 Feature images generated by 3D point clouds

图3 点云特征图像

3.3 建筑物点云提取结果

Tab.2 Precisions and recalls of classification based on the building grids by linear SVM

表2 建筑物网格粗提取精度和召回率

数据集 网格类型 精度/(%) 召回率/(%)
Data-1 建筑物立面网格 90.7 62.6
非建筑物立面网格 94.7 99.0
Data-2 建筑物立面网格 95.6 41.1
非建筑物立面网格 94.3 99.8
Data-3 建筑物立面网格 96.1 51.9
非建筑物立面网格 93.6 99.7
为了滤除误分类的建筑物网格,对每个研究区分别设定合适的网格属性(形状系数、网格面积和最大高程值)。建筑物属于较大型的地物,所以所占用的网格数一般较大,设置为网格面积为20-44;建筑物网格的形状系数较小,所以阈值设定为0.45-0.5之间;而建筑物高程值一般大于3 m。利用以上阈值对粗分类结果进行精分类后,得到建筑物立面提取结果(图4),云精度如表3所示。建筑物最终分类的精度均超过80%,分别为81.7%、89.8%和83.6%;召回率分别为89.4%、90.7%和90.0%。
Fig.4 Results of segmentation

图4 建筑物立面提取结果

Tab.3 Precisions and recalls of building facade segmentation from point clouds

表3 建筑物立面点云提取精度和召回率

数据集 A/m2 CI MH/m 精度/(%) 召回率/(%)
Data-1 1.25 0.45 3 81.7 89.4
Data-2 2.75 0.45 3 89.8 90.7
Data-3 1.25 0.45 3 83.6 90.0
Fig.5 The building which is not extracted from data-1

图5 data-1中未提取的建筑物

3.4 实验结果分析对比

为了验证本算法,选取了同样使用CMU数据集且较为先进的3种算法:S3DP(Stacked 3-D Parsing)[18]、LogR(K-class logistic regression)[18]和M3N(Max-Margin Markov Network)[19],其将点云数据分类为电线、杆状物、地面、植被、树干、建筑物和车辆7类,本文只针对建筑物这一类进行比较。由于分类结果在精度和召回率之间难以权衡,故设定综合评价指标F1(式(13)),F1较高时说明试验方法有效。
F 1 = 2 × P × R P + R (13)
式中: P 为精度; R 为召回率。对比结果汇总如表3所示。
表4可看出,LogR算法表现最差,综合评价指标 F 1 为0.8,远低于其他算法;S3DP算法表现最好,精度为83%,召回率为93%, F 1 为0.88。由于受上述不规则建筑物的影响,本方法的建筑物立面提取结果略低于S3DP算法,精度为84%,召回率为90%, F 1 为0.87。去除不规则建筑物影响后,精度为88%,召回率为91%, F 1 为0.9,较修正前结果有较大提升。所以,本算法在较规则的建筑物立面提取上有较好的提取结果。
Tab.4 Precisions/recalls of different methods

表4 不同方法建筑物立面提取结果比较分析

计算方法 精度/(%) 召回率/(%) F1
S3DP 83 93 0.88
M3N 80 92 0.86
LogR 74 87 0.80
本文方法 84 90 0.87
修正后本文方法 88 91 0.90

4 讨论

4.1 网格大小的选取

本文采用不同的网格大小对点云数据库data-2进行试验,试验结果如图6所示。结果表明网格大小为0.25 m×0.25 m和0.5 m×0.5 m的提取结果最好;网格大小为0.1 m×0.1 m的提取结果错分和漏分明显偏高;当网格较大(1 m×1 m)时,不同的地物会被分在一个网格中,不易区分,导致分类精度偏低。
Fig.6 The impact of grid size on the extraction results

图6 网格大小对提取结果的影响

4.2 网格属性的选取

网格属性的3个自由参数(形状系数、网格面积、最大高程)对最终结果也有一定影响。其中,建筑物的高程一般不会低于3 m,所以最大高程一般设置为3 m左右;形状系数和网格面积要根据研究区域而设定,如果取值过大,可能会滤除真正的建筑物,但是取值过小,达不到过滤的效果。根据实验得出,面积设置为1.5 m2,形状系数设置在0.45左右较为合适。

4.3 与同类型方法对比

Fig.7 Comparison of extraction results

图7 提取结果对比

5 结论


