Method of Automatic Shoulder Line Extraction in the Loess Hilly Area Based on Point Cloud Data

  • LI Min , 1, 2 ,
  • YANG Xin , 1, 2, * ,
  • CHEN Panpan 3 ,
  • XIONG Liyang 1, 2
  • 1. Key Laboratory of Virtual Geographic Environment of Ministry of Education, Nanjing Normal University, Nanjing 210023, China
  • 2. Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China
  • 3. Institute of Geographical Sciences, Henan Academy of Sciences, Zhengzhou 450052, China
*Corresponding author: YANG Xin, E-mail:

Received date: 2015-11-30

  Request revised date: 2016-01-25

  Online published: 2016-07-15


Shoulder line is one of the most distinguishing terrain structure lines in Loess Plateau. However, in the loess hilly area, the point cloud near the shoulder line is usually erased mistakenly while using the unified vegetation removal algorithm, which could result in the decrease of DEM accuracy in the terrain expression. Thus the shoulder line should be extracted firstly before removing the vegetation. This paper has proposed a novel shoulder line extraction method based on point cloud data using the multi-scale sampling and slope threshold segmentation. Firstly, a surface model was built based on the ground points selected by a proper filter window. Then, based on the constructed surface model, the slope was calculated and a significant difference near the shoulder line would emerge. Finally, the shoulder line was generated using the slope threshold segmentation. Through the multi-iterative experiments, the optimal filter sizes for each of the 8 sample areas were found, and a power function between the filter size and the point density was discovered. The correctness and reasonability of this correlation was verified in another 5 test areas. Then, the shoulder line of the whole area was generated by using this verified correlation. Using the overlay analysis over the manual identification result, the extracted shoulder line has an accuracy of 85% (within a 0.5 m buffer area). As a conclusion, this method could contribute to improve the accuracy of vegetation removal algorithm that uses the point cloud data for the loess hilly area.

LI Min , YANG Xin , CHEN Panpan , XIONG Liyang . Method of Automatic Shoulder Line Extraction in the Loess Hilly Area Based on Point Cloud Data[J]. Journal of Geo-information Science, 2016 , 18(7) : 869 -877 . DOI: 10.3724/SP.J.1047.2016.00869

1 引言

地面三维激光扫描技术已广泛应用于局部、精细地形的采集,具有数据精度高、密度大、周期短的特点[1-4]。获得的海量点云数据不仅记录了目标实体表面每一个点的三维信息,还包含了色彩信息和回光强度,能够精确地表达物体表面的位置和形态。然而,原始点云数据因为不仅有真实的地面点,还包含了如建筑物和植被等很多非地面点,所以给数字地形的制作带来了很多噪音。目前,去除点云地表噪音的方法主要有3种:基于点云的三维空间信息法[5-6]、点的回光强度法[7]以及点的几何信息和影像信息法[8-13]。这些方法逐渐应用于点云处理的商业软件中,如芬兰的Terrasolid公司的软件提供了基于不规则三角网(TIN)的渐进加密算法[14],奥地利Riegl公司的RiScan Pro软件提供了基于反射率算法[15]的滤波处理。它们均能够较好地实现地形的地面点和非地面点的自动分类,但在不同的地表形态下,去植被的效果差异明显。一般情况下,在地形变化起伏平缓的地区,效果较好;而对于具有陡变坡度的地区,则产生较大的误差甚至错误。针对该情况,李永强等提出双重滤波法,采用投影变换、粗滤波、地形点的区域增长和精滤波4个步骤对陡坡密集点云进行滤波处理[16]。该方法能有效地实现陡坡滤波,但是投影变换所使用的投影面与陡坡地形的空间形态有关,粗滤波在实际的操作过程中需要利用交互工具去除明显的非地面点,并且区域增长算法还会将少数非地形点误认为地形点。马鼎等提出基于激光回光强度衰减模型的植被滤波方法[17],能够克服坡度变化剧烈的不利影响,但是算法中的回光强度值因样区而异,因此现有方法的普适性还略显不足。
黄土高原丘陵沟壑区具有典型的沟沿线特征,即沟沿线以上坡面平缓(沟间地),沟沿线以下沟坡明显变陡(沟坡地),坡度变化差异显著(图1)。采用RiScan Pro软件进行自动去植被时,由于沟沿线上下很短的水平距离内的点云产生了很大的落差,其往往被当做噪声去除,大量坡面点云丢失,部分沟坡地的点云被去除,造成地形表达严重失真。图1中虽有些植被去除了(绿色框部分),但是沟沿线附近大范围的地面点被误删(蓝色框部分),造成地形表达的严重失真。因此,对该地形运用点云数据进行地形表面重建时,沟沿线成为去除植被前的重要分割线。此外,沟沿线是黄土地貌中一条重要的地形结构线,它将黄土地貌分为沟间地(正地形)和沟谷地(负地形),而正地形和负地形在地形特征、土壤侵蚀特征和土地利用方式存在明显不同[18-19],在地貌学研究和水土保持工作中具有重要的作用。目前沟沿线已成为黄土地貌研究的热点之一[20-22],基于DEM进行沟沿线提取方法也日趋成熟,均极大地丰富了相关研究成果[23-27]。然而,随着越来越多的点云数据的获取和应用,面向点云数据的高精度沟沿线的准确提取略显不足。
Fig.1 Comparison of the point cloud before and after using RiScan Pro software to remove the vegetation automatically

图1 利用RiScan PRO软件进行自动去植被前后的对比


2 研究区域与方法

2.1 研究区域

研究实验区位于陕西省榆林市靖边县麻地沟村,属于黄土丘陵沟壑区范围内的一条支沟(图2)。实验范围为该支沟及其集水区域,是一个完整小流域,包含沟间地和沟谷地。该区域属于黄土丘陵沟壑地貌,气候属温带半干旱大陆性季风气候,年均气温为7.8 ℃,年均降水量约为395 mm,光照充沛。点云区域为长约600 m的一条冲沟及其集水区域,实验区高差151 m。主沟为东西走向,沟的南北两侧发育大量切沟,北侧有3条较大的切沟,切沟下切侵蚀强烈,南侧切沟数量多,深度较浅,所有切沟的沟沿线明显。北侧坡面几乎没有浅沟,南侧坡面分布有较多的浅沟。沟两侧植被也有较大差别,北侧以灌丛为主,没有树木,南侧以草丛为主,有少量的树木。
Fig.2 The distribution map of point clouds data and the sample areas of Madigou

图2 麻地沟实验区点云数据及样区分布图

2.2 实验数据

数据为2014年8月在麻地沟实地测量获得。利用Rigle公司的VZ400三维激光扫描系统,共设置15个扫描站,测量面积约为0.23 km2,点云总数超6亿,点的平均密度约为2600个/m2。由于点云的数据量非常大,所以本文只以沟沿线附近的随机的小块区域且包含植被等噪声的点云数据作为研究单元。其中,8个点云样区(图2黑色方框,编号1-8)用于提取沟沿线,并探究提取沟沿线所用的网格大小与点云数据特征之间的关系;5个点云样区(图2黄色方框,编号t1-t5)用于验证二者之间关系的适用性。

2.3 沟沿线提取方法

Fig.3 The schema of shoulder line extractionbased on point cloud

图3 基于点云的沟沿线提取流程图

Fig.4 Select the ground points and simulate the land surface map

图4 选取地面点进行地表面模拟示意图

Fig.5 Illustration of the longest common side extraction

图5 提取最长公共边原理示意图


3 结果分析

3.1 精度评价

Fig.6 Point clouds of 8 test areas displayed in 3D

图6 8个样区的点云数据在三维显示

Fig.7 The hatch of two grades of shoulder lines in the test area 3

图7 样区3两级沟沿线剖面图

为了定量评价沟沿线的精度,使用手绘沟沿线缓冲区套合的方法,计算了8个样区自动提取沟沿线在一定距离的缓冲区内的长度与自身长度之比,表示自动提取沟沿线的偏移比率,以此作为精度评价的指标,结果如表1所示。大部分样区中,自动提取沟沿线分布在手动提取沟沿线的0.5 m缓冲范围内,与手动提取沟沿线较为匹配。只有样区4,由于沟坡地受植被点的影响较大,因此依据本方法自动提取的沟沿线有较长的一段并不属于真实的沟沿线,精度差异较大,但是目视判断自动提取沟沿线仍然与手动提取沟沿线有较多部分吻合。
Tab.1 Accuracy comparison of automatically and manually extracted shoulder lines

表1 自动提取沟沿线与手绘沟沿线精度对比

样区编号 0.1 m缓冲范围/(%) 0.5 m缓冲范围/(%) 1 m缓冲范围/(%)
1 82 100 100
2 42 92 100
3 68 90 100
4 37 70 73
5 43 100 100
6 21 76 88
7 7 53 99
8 43 99 100
Tab.2 Length comparison of automatically and manually extracted shoulder lines (unit: m)

表2 自动与手动提取的沟沿线长度分析(m)

样区编号 沟沿线长度L1(自动) 沟沿线长度L2(手动) L1/L2
1 5.13 4.21 1.22
2 46.90 16.86 2.78
3 31.96 7.20 4.44
4 34.37 12.74 2.70
5 15.32 10.25 1.49
6 42.43 32.91 1.28
7 118.47 83.59 1.41
8 44.08 20.56 2.14

3.2 采样格网尺度对沟沿线提取的影响

Fig.8 Shoulder lines extracted in multi-scale filter grids

图8 多尺度滤波格网下的沟沿线

通过对所有样区的反复试验发现,格网尺度的选择和点密度有一定的关系。分析8个样区点云数据的点数、面积与密度,并经过多次尝试,最终确定各样区相对最佳的格网尺度(表3)。样区8在进行样区选取的时候,选中了过多的坡度较大的沟坡地,计算的密度较大,因此排除样区8的异常值。通过对其余7个样区建立采样格网尺度与点密度的关系(图9)可看出,选取的最佳格网尺度与点密度存在幂函数关系: y = 20.42 x - 0.68 即格网尺度随着点密度的增大迅速减小,而后趋于平稳(图9)。
Fig.9 The relationship between optimal filter grid scale and point density

图9 最佳采样格网尺度与点密度的关系

Tab.3 The information statistics of 8 test areas and the testing best grid scales

表3 8个样区的信息统计及测试的最佳采样格网尺度

样区编号 点数/个 面积/m2 密度/(个/m2) 格网尺度/m
1 25 456 11.73 2170 0.10
2 74 954 76.34 982 0.15
3 80 365 31.98 2513 0.10
4 94 076 51.54 1825 0.15
5 110 384 34.11 3236 0.10
6 142 809 537.62 266 1.00
7 293 848 2173.08 135 0.50
8 310 510 112.36 2764 0.30
Tab.4 The optimal filter grid scale of each examination area

表4 5个测试样区最佳采样格网尺度

测试样区 点数/个 面积/m2 密度/(个/m2 格网尺度(计算)/m 格网尺度(测试)/m
1 19 876 59.01 337 0.12 0.12
2 20 682 60.07 344 0.12 0.15
3 48 913 487.99 100 0.52 0.5
4 151 305 606.13 250 0.17 0.2
5 556 679 975.03 571 0.06 0.1

3.3 实验区完整沟沿线提取结果

由于采集的点云数据数以亿计,远远超出普通计算机的运算负载,因此对采集的点云数据进行分块,每块大小为50 m×70 m。通过计算每个分块内的点密度,确定自动提取沟沿线的最佳格网,提取出每块样区内的精细沟沿线,然后再进行拼接处理。由于2个相邻样区沟沿线端点间的距离大部分都小于0.2 m,因此使用拓扑容差可以实现大部分端点的自动连接,其余手动完成拼接,最后拼接成完整的无拓扑错误的沟沿线。图10为自动提取的完整沟沿线及其与5 m分辨率DEM提取的沟沿线的对比,其中5 m分辨率DEM仍采用坡度分割的方法进行沟沿线的提取。
Fig.10 Comparison of the shoulder lines extracted automatically, manually and with the 5 m DEM

图10 完整区域沟沿线的自动提取、手动提取及5 m分辨率DEM提取套合

从2条沟沿线的套合情况来看,利用本方法基于点云数据提取的沟沿线精度达到85%,而利用5 m DEM提取的沟沿线精度只有16%。相比于5 m分辨率DEM提取的沟沿线简略、不准确的缺点,利用点云自动提取的沟沿线能够准确地表达样区内的沟沿线细节。但在某些沟沿线不明显的区域,也会提取出细节过于丰富的沟沿线,需要人工进行判别。

4 结论


