Individual Tree Crown Extraction of High Resolution Image Based on Marker-controlled Watershed Segmentation Method

Since the 1990s, a large number of trees in the Gudao forest area have been threatened by both the natural and human effects, which caused huge losses to the forestry development of the Yellow River Delta. Therefore, the more detailed and timely information of forests is required for improving the local forest management and ecosystem monitoring. Individual tree crown delineation has been demonstrated to be an efficient way to carry out forestry inventories at a fine scale, as the tree crown serves as the basic unit for biomass measurement, species recognition, or health monitoring, etc. The increasing availability and affordability of high spatial resolution remote sensing images provides great potential for accurately characterizing the tree crown. Current tree crown extraction methods based on the imagery were easily interfered by the background objects, especially when there were mixtures of trees, shrubs and grass. A conventional watershed segmentation approach could cause over-segmentation of the imagery because the branches in the imagery are similar to some small tree crowns in shape and scale. To overcome such issues, a new tree crown extraction method based on the object-oriented extraction and the marker-controlled watershed segmentation with the morphological filtering was presented in this paper to extract the individual tree crown from high spatial resolution image. Firstly, the tree crown area was separated from the background using the object-oriented method. After that, the morphological opening and closing operators were employed to smooth the image and remove the noises from the image. Then, we located the tree tops by detecting the local maximum. These tree tops were recognized as markers for the subsequent segmentation. Finally, the tree crowns were delineated through the marker-controlled watershed method. Based on the QuickBird image, we applied this method to the deciduous tree crown delineation of Gudao forest area in the Yellow River Delta. Both the sparse forest area and the dense forest area are tested in order to verify the universality and applicability. To evaluate the method proposed in this paper, we conducted a visual interpretation based on the original images of two plots, and the resulted manually delineated crown maps were then regarded as the reference maps. The delineation accuracies were assessed by comparing the spatial relationships of the automated delineated crowns and the reference crowns. The results showed that the overall extraction accuracy is 87.8% for the sparse forest area, and 65.5% for the dense forest area, which indicated that the tree crown extraction method proposed in this study is effective and promising.

1 引言

(1)先探测树冠顶点,再由树冠顶点描绘树冠轮廓,如先利用局部最大值法、3D模型方法等确定树冠顶点,再采取分水岭分割、爬坡法等探测树冠边界。Pouliot[1]首先进行局部最大值滤波,再从局部最大值点出发,发出若干条射线,探测光谱反射值最大变化率的发生点,即为树冠边界点。Chen等[2]运用高空间分辨率Lidar影像建立树冠高度模型,利用可变大小窗口搜索局部最大值,作为树冠顶点,然后利用标记控制分水岭分割方法提取树冠。Wang等[3]从光谱和几何2方面出发探测树冠顶点。假设树冠顶点既是光谱局部最大值,同时位置接近树冠几何中心。根据局部非最大值抑制探测的光谱最大值和基于形态学距离变换图像探测的局部最大值,取交集作为树冠顶点,然后运用标记控制分水岭算法分割树冠。Ke等[4]结合数学形态学,从光谱、形状以及专家知识3方面限制,获得树冠顶点。首先通过滑动窗口获得光谱局部最大值,然后以主动轮廓模型提取的树冠为模型,利用模板匹配法探测与模板重心相关性最高的位置,得到基于形状的局部最大值,修正光谱局部最大值。由于已知研究区人工林种植间隔为2 m×2 m,因此最终获得的树冠顶点间隔不得小于2 m,以此知识去除假树冠顶点。最后,利用爬坡法得到单木树冠。
自20世纪90年代以来,黄河三角洲孤岛林场受到自然和人为因素的影响,树木健康状况下降,许多地方出现大面积枯稍、甚至死亡,给黄河三角洲林业发展带来了巨大损失[10]。研究者从不同角度对黄河三角洲孤岛林场进行了一些研究:姚玲等[11]基于Landsat TM/ETM+数据结合各种植被指数对该地区人工刺槐林健康状况进行了分类和评价;刘庆生[12]等通过图像运算和ISODATA非监督分类对人工刺槐林林冠健康进行了有效检测;王红等[13]基于IKONOS和Landsat 8 OLI影像,结合光谱信息和空间纹理信息,对黄河三角洲人工刺槐林健康状况采用最大似然法分类;张珍珍等[14]首先结合植被指数利用决策树分类提取林区,然后基于IKONOS影像灰度共生矩阵对刺槐林健康状况采用最大似然法进行分类。黄河三角洲孤岛林场单木树冠提取对该地区林业和经济发展具有重要意义。上述研究初步得到了黄河三角洲人工刺槐林的健康状况,但仅针对成片林的评价结果对于黄河三角洲人工刺槐林管理、保护和更新来说还远远不够,需要针对单木树冠进行更详细的研究。

2 研究区概况及数据来源

黄河三角洲位于117°31′~119°18′E和36°55′~38°16′N之间,主要分布于山东省东营市和滨州市境内,受太平洋和欧亚大陆的共同作用,该地区四季分明、雨热同期,属于温带大陆性季风气候[15]。植被类型主要为暖温带落叶阔叶林,区内植被类型少、结构简单。植被的分布主要受地貌类型、土壤含盐量、水分、潜水矿化度等因素的制约和人类活动的影响,黄河三角洲地区共有40余科、160余种植物,其中以禾本科、菊科草本植物为主体。该区自然植被为草地植被,另外也分布着金合欢(Acacia farnesiana L. Willd)、柳树(S. matsudana)等落叶阔叶树。20世纪50年代开始进行刺槐(Robinia pseudoacacia L.)、白蜡(Fraxinus chinensis)等人工林的栽培和种植[16]。孤岛林场位于黄河三角洲地区,至1995年,林场总面积达到60 500 hm2,有人工刺槐林5466.7 hm2,天然林7800 hm2,其中,天然柳林1333.3 hm2,到1999年建成了华东平原地区最大的人工刺槐林地之一。但自20世纪90年代以来,受各种自然和人为因素的影响,许多地方的林地出现了枯梢或死亡的现象。
本文以QuickBird影像为数据源,获取一景覆盖试验区的QuickBird全色增强标准影像,拍摄时间为2003年10月11日02时26分12秒。空间分辨率为0.6 m,包括红(620~688 nm)、绿(499~594 nm)、蓝(447~512 nm)和近红外(755~874 nm)4个波段,采用3、2、1波段彩色合成影像。

3 研究方法

本文首先借助ENVI Feature Extraction(ENVI 特征提取,以下简称ENVI EX)模块,利用面向对象的方法对样地分类,提取出树冠范围,然后利用数学形态学方法获取树冠局部最大值作为标记,最后利用标记控制分水岭方法进行树冠分割,获得单木树冠。具体流程如图1所示。
Fig.1 The flowchart of the method used in this study

图1 研究方法流程图

3.1 预处理

传统的基于像元的分类方法是一种基于光谱特征统计的分类方法,是在对所选择的样本进行统计的基础上,根据统计的特征值对影像进行聚类的一种方法[17],随着遥感影像分辨率的提高,单个像元所包含的信息逐渐减少,从而给传统的基于像元的分类方法带来了新的挑战。面向对象的影像分析方法是指将影像对象作为基本单元,根据空间或光谱特征将影像分割成离散的区域或集合[18],更适合于信息丰富的高分辨率影像。本文借助(ENVI EX)模块进行面向对象分类。面向对象分类分为分割、合并和监督分类3个步骤。分割时采用基于边缘分割的算法,能够快速、准确地根据邻近像素亮度、纹理、颜色等特性产生多尺度分割结果。合并时采用Full Lambda-Schedule算法,该方法在结合光谱和空间信息的基础上迭代合并邻近的小斑块。尺度是指关于多边形对象异质性最小的阈值,它决定生成最小多边形的级别大小,过大的阈值会使特征类似的不同地物会分为一类,过小的阈值则使有些特征对象会分为多个部分。因此合理的尺度是分类成功的关键,分割和合并尺度的选择范围为0-100。对于疏林区影像,当尺度阈值小于50时,影像中产生很多碎斑,大树冠可能被分成多个部分;当尺度阈值大于50时,分割多边形较大,导致几个小树冠被识别为一个树冠,故本文设置分割尺度为50。针对密林区,经过多次试验得到最适合分割尺度为20。同样,合并时疏林区经反复试验后选取合并尺度为75,密林区选取合并尺度为60。本文经过反复试验选取分割和合并的最适参数,如表1所示。然后基于分割结果选取训练样本,采用K邻近法进行监督分类。若单纯地利用ENVI EX,大量相邻树冠没有被分开,因此需要进行进一步的分割。接着将分类后的林地作为掩膜,只提取样地中的林地部分,用于后续分割。
Tab.1 The selection of parameters in object-oriented classification

表1 面向对象分类参数选取表

样地 分割尺度 合并尺度
疏林区 50 75
密林区 20 60

3.2 标记控制分水岭分割

3.2.1 形态学滤波

形态学重建开闭运算能够去除细密纹理和噪声引起的伪局部极值,同时不会产生边界偏移,保留轮廓信息,因此本文采用形态学重建开闭运算作进一步的平滑处理。形态学重建开闭运算在测地腐蚀和测地膨胀的基础上,对图像 f ( x , y ) 和参考图像 r ( x , y ) 和圆盘形结构元素B,其测地学膨胀定义[20]如式(1)所示。
D B i + 1 ( f , r ) = Min [ ( D B i B ) , r ] D B i ( f , r ) = Min [ ( f B ) , r ] ( i = 1,2 , ) (1)
类似地, f ( x , y ) 的测地学腐蚀定义如式(2) 所示。
E B j + 1 ( f , r ) = Max [ ( E B j Θ B ) , r ] E B j ( f , r ) = Max [ ( f Θ B ) , r ] ( j = 1,2 , ) (2)
以上运算均为迭代运算,当迭代次数达到预定值或满足 D B i ( f , r ) = D B i + 1 ( f , r ) E B j ( f , r ) = E B j + 1 ( f , r ) 时,迭代终止。重建开运算是以原图像的腐蚀作为标记图像做膨胀重建,如式(3)所示;重建闭运算以原图像的膨胀作为标记图像做腐蚀重建,如式(4)所示。
O B ( rec ) ( f , r ) = D B ( rec ) [ ( f B ) , r ] (3)
C B ( rec ) ( f , r ) = E B ( rec ) [ ( f B ) , r ] (4)
式中: 分别代表形态学开和闭运算; D B ( rec ) E B ( rec ) 分别代表形态学测地膨胀和腐蚀收敛时的结果。形态学重建过程可恢复图像中那些没有完全被开(闭)运算所滤除的成分的边界,消除比结构元素小的高(低)灰度细节,并且不会产生新边界和边界偏移。同时,运用形态学开闭重建能够修正区域极大值和极小值,减少因细节和噪声干扰造成的分水线位置偏移和因局部极小值过多造成的分水岭过分割现象。
Fig.2 The result of regional maximum detection

图2 局部最大值探测结果图

3.2.2 标记生成
3.2.3 分割
分水岭算法一般针对梯度图像进行。由于图像灰度值在树冠边缘发生突变,因此利用梯度图像可以更好地探测树冠边缘。本文中利用Sobel算子进行水平和垂直2个方向的滤波,求取模值,产生梯度图像。然后利用经过上述步骤产生的标记图像,通过强制最小运算(Minima Imposition)进行梯度重建。强制最小运算是基于形态学中腐蚀算子的图像处理方法,其目的是使局部最小区域仅出现在标记的位置,而其他像元值相应地进行“上推”,进而删除其他的局部最小区域[23],然后对重建的梯度图像进行分水岭分割,得到最终结果。

4 实验结果及精度评价

4.1 实验结果

结合2幅郁闭度不同的QuickBird影像,首先利用ENVI EX 4.8软件,采用面向对象的方式将目标图像分为林地和非林地2类,提取出原始影像中的树用于后续的树冠提取。然后利用Matlab编程,实现本文所述的基于标记控制的分水岭变换,对林区图像进行分割。最终结果如图3、4所示。
Fig.3 The result for the sparse forest area

图3 疏林区树冠提取结果

Fig.4 The result for the dense forest area

图4 密林区树冠提取结果

4.2 精度评价

A d = Nc Nd × 100 % (5)
A r = Nc Nr × 100 % (6)
F = 2 A r A d A r + A d (7)
式中: A d 代表准确率; A r 代表召回率; F 代表F测度; Nc 表示被正确分割的树冠个数; Nr 表示参考图中树冠个数总数; Nd 代表自动分割结果中树冠个数总数。精度统计结果如表2所示。疏林区主要树种为旱柳,共分出29棵树冠,人工勾绘出35棵,其中匹配的树冠有26棵,接近匹配的有2棵,因此疏林区准确率达到96.6%,召回率达到80.0%,F测度为87.8%。密林区中主要树种为刺槐,共分出114棵树冠,人工勾绘出124棵树冠,其中匹配的树冠有75棵,接近匹配的有3棵,准确率达到68.4%,召回率达到62.9%,F测度为65.5%。
Tab.2 The accuracy statistics of different forest areas (%)

表2 精度统计表(%)

样地 匹配 接近匹配 丢失 合并 分割 目视解译
疏林 26 2 6 1 0 35
密林 75 3 38 5 2 124


5 结语


