Segmentation Method Using Optimized Merging for High Resolution Remote Sensing Images

  • SU Tengfei ,
  • ZHANG Shengwei , * ,
  • LI Hongyu
  • Water Conservancy and Civil Engineering College, Inner Mongolia Agricultural University, Hohhot 010018, China
Received date: 2015-04-01

Study on the segmentation method for high resolution remote sensing images is very important for the processing and application of remote sensing data. Image segmentation plays an important role in geographic object-based image analysis, and it is also very useful in GIS data management and remote sensing data compression. A new segmentation algorithm using optimized merging criteria is proposed in this paper. The proposed algorithm divides the merging process into two stages, including the local best merging and the global best merging. Hierarchical agglomerative clustering is used to implement the first stage to meet the main objective of increasing the running efficiency. The merging criterion in the first stage focuses on the regional geometric information to create the visually pleasing segments, and in addition, this criterion is constructed on the premise that the regions to be merged should be sufficiently similar in spectra. Thus, when designing the merging criterion of the local best merge, the spectral and geometric information are both taken into consideration. Moreover, Global Moran′s I is used to determine the ending condition for the first stage. After the local best merging, the region adjacency graph (RAG) is constructed to implement the global best merging, in which the spectral and edge information is taken into account. In this stage, the negative impact introduced by the regions′ scale is found throughout the experiments. Thus, the size information of each region is excluded from the merging criterion of the global best merging. In addition, a special binary search tree, which is called the red-black tree, is used in the implementation to rank the edges of RAG, so as to speed up the graph structure updating after a merging taking place. High resolution images acquired from OrbView3 are adopted to conduct the segmentation experiment, the results of which indicate that our algorithm can produce the satisfactory performance. The conclusions made in this paper may provide new insights for the studies on remote sensing image segmentation and the related researches.

SU Tengfei , ZHANG Shengwei , LI Hongyu . Segmentation Method Using Optimized Merging for High Resolution Remote Sensing Images[J]. Journal of Geo-information Science, 2016 , 18(7) : 931 -940 . DOI: 10.3724/SP.J.1047.2016.00931

1 引言

随着越来越多高分辨率(High Resolution,HR)遥感卫星(如GeoEye、IKONOS、QuickBird、OrbView)的发射升空,HR遥感影像的信息提取工作面临着严峻的挑战。影像分割作为基于地物影像分析(Geographic Object-Based Image Analysis,GEOBIA)的第一步[1],已被广泛应用于HR遥感数据的自动解译中,包括农业遥感[2]、陆地变化[3]、海岸带制图[4]、军事监测[5]等。而且影像分割在地理信息系统(Geographic Information System,GIS)中扮演重要角色,其可将栅格影像转化为矢量数据,从而方便遥感与GIS的无缝连接,以提高HR数据分析的自动化和实效性。此外,影像分割还有一个重要的应用是影像压缩,可改进影像压缩的效果[6]。随着遥感卫星的不断增多,遥感数据量正以几何级数逐年增长,如何高效地节省存储空间是遥感学界一个不容忽视的问题。因此,开展HR遥感影像分割算法的研究具有非常重要的意义。
目前,主流的HR遥感影像分割算法模型包括:马尔科夫随机场[6]、主动等值线演化模型[7]、分水岭[8]、区域生长[8-12]等。其中,区域生长算法的精度较高,实现较为简单,受到较多学者的关注。早在1989年,Beaulieu和Goldgerg[9]提出了一种基于层次逐步优化(Hierarchical Step-Wise Optimization,HSWO)的区域生长方法来解决影像分割问题。由于HSWO计算量巨大,Kurita[10]和Tilton等[11]对其进行了改进:前者利用一种高级数据结构——堆(heap),来优化HSWO搜索最优合并的速度;后者则实现了HSWO的并行策略,并将其命名为递归层次分割算法(Recursive Hierarchical Segmentation,RHSeg)。然而,以上算法的区域合并规则仅考虑了光谱信息,其分割结果的视觉效果往往不是特别理想。Baatz和Schape[12]提出了一种分形网演化算法(Fractal Net Evolution Algorithm,FNEA),将几何形状特征引入了区域合并规则中,从而显著提升了区域生长算法分割结果的视觉效果。FNEA被集成在商业遥感数据分析软件eCognition中,便于学者进行GEOBIA的相关研究[13-14]

2 HR遥感影像分割算法原理

2.1 算法流程

本算法主要分为2步:基于凝聚层次聚类(Hierarchical Agglomerative Clustering,HAC)[20]的局部最优合并,以及基于区域邻接图(Region Adjacency Graph,RAG)的全局最优合并,具体流程如图1所示。本文算法的合并规则有2种,分别是局部最优合并规则 ( C lo cal ) 和全局最优合并规则 ( C global )
Fig.1 Algorithm flowchart

图1 算法流程

2.2 局部最优合并

2.2.1 基于HAC的局部最优合并
HAC算法的详细过程可参考文献[20]。需要重点指出的是,本文HAC算法的终止条件是:当影像被足够地过分割后,即开始全局最优合并。本文采用了全局Moran指数(Global Moran′s I,GMI)来进行算法终止的判断。GMI是衡量空间自相关性的统计量,最早由P. Moran提出[22]。对于影像分割,其计算公式为(式(1)):
GMI = n s i = 1 n s j = 1 n s w ij g i - g g j - g i = 1 n s g i - g 2 w ij (1)
式中: n s 是区域数目; g 为图像均值; g i 为区域 i 的均值; w ij 是区域邻接系数,当且仅当区域 i j 邻接时, w ij = 1 ,否则 w ij =0。
(2)对于当前像元所在的区域 S i ,搜索与其邻接的所有区域,并将其存入列表 neb_list ;
(3)在 neb_list 中寻找与 S i 最适合合并的区域,然后将其与 S i 合并(HAC聚类操作);
(4)计算当前分割结果的 GMI ,若其值小于0.8,则终止算法,否则返回步骤(1)。
2.2.2 C lo cal 的设计
本文设计 C local 的准则是:对于2个相邻的区域,只要它们在光谱上足够相似,则说明可以被合并;但为了得到在视觉上较为美观的区域,需考虑形状信息。对于一个区域 S i 及其邻域 S j ,计算它们的光谱异质性变化值,如式(3)所示。
Δ H spec tr al i , j = n m σ m - n i σ i + n j σ j (2)
式中: σ 为区域内部像元光谱值的标准偏差,对于多波段图像,其 σ = ( 1 / B ) Σ b σ b B 为波段数; n 表示区域内部像元数; m 表示区域 i j 合并后的区域。此外式(2)也可用于从多光谱影像中提取的纹理特征影像。若 S i 与其邻域 S j 的光谱异质性变化值 ΔH ( i , j ) 小于阈值 T sl ,则将 S j 视为候选区域。在所有候选区域中,寻找与 S i 的紧凑异质性差异最小的区域,即为将与 S i 合并的区域。紧凑异质性变化值的计算式为式(3)。
Δ H compactness i , j = n m l m - n i l i + n j l j (3)
式中: l 为区域的边界长度。紧凑异质性变化量越小,合并后区域的形状越规则,即越接近圆形,因为圆形具有最小的紧凑性异质性。因此,在合并规则中考虑紧凑性异质性,可得到形状较为规则的斑块。 T sl 的计算式为式(4)。
T sl ( i , j ) = 1 2 B b B σ b l ln ( n i + n j ) (4)
式中: σ b l 为整景图像波段 b 的光谱标准差。式(4)是一个经验公式,可以保证灰度相似的2个区域被合并。式(2)、(4)都考虑了待合并的2个区域的大小信息,这是为了使较小区域之间的合并更容易发生,从而加快算法运算速度。式(4)采用对数函数,是因为这种函数增长率较小。当2个尺度较大的区域合并时,计算出的 T sl 并不太大,从而抑制错误合并的发生。

2.3 全局最优合并

2.3.1 基于RAG的全局最优合并
HAC局部最优合并结束后,整个图像被过分割,各个区域包含了一定数目的像元。相比于初始阶段,此时区域的数目减少了很多;另外,各个区域内的光谱异质性较大。为了提高合并的准确性,需要采用更为严谨的合并顺序和更为合理的合并规则。本文利用区域邻接图(Region Adjacency Graph,RAG)[23-24]来实现全局最优合并,以提高分割算法的精度。
RAG的实现包含2部分:节点 N M } (代表区域)和边 E = { e j j = 1,2 , , N E } (代表相邻区域之间的相似度),其中 N M N E 分别表示节点数和边数。由于RAG是无向图,任意2个相邻区域之间只存在一条边。一条边 e j = { m j 1 , m j 2 , w j 1 , j 2 } 包括连接的2个节点及表示它们相似程度的权值 w 。在合并过程中,对RAG的操作步骤为:
(3)若 e min 的权值 w min 小于阈值 T ,则先合并 e min 中的2个节点,再更新合并操作后的 M E ,最后返回步骤(2);否则,终止算法,输出结果。
其中,步骤(3)中的更新合并操作后的 M E 需要较多计算。本文采用了一种自平衡的二叉搜索树——红黑树(red-black tree)[25],将边 E 按其权值作为关键字进行排列,以提高更新 E 时边权值的搜索效率。红黑树将叶节点赋予红或黑的颜色属性。通过在插入或删除时对不同颜色节点位置的变换可使红黑树大致平衡,这保证了其搜索复杂度总是 O ( logn ) ,而普通二叉搜索树对于完全有序节点的搜索复杂度退化为 O ( n ) 图2显示了基于红黑树实现的全局最优合并算法,其中红黑树节点包含了3个变量:2个相邻区域的指针,以及这2个区域的相似度(式(5))。
Δ S dif ( i , j ) = 1 B b B ( μ bi - μ bj ) 2 (5)
式中: μ bi 表示区域 i 在波段 b 的光谱均值。
图2所示,构建red-black tree需要遍历RAG,并对相邻区域组成的节点进行插入操作。每完成一次合并,都需要把合并的节点从red-black tree中删除。不论是插入还是删除,都需要对红黑树进行搜索。由于红黑树的搜索复杂度为 O ( logn ) ,远低于一般数据结构的搜索复杂度 O ( n ) ,因此本文方法有效地提高了全局最优合并的计算效率。
Fig.2 The flowchart of global best merge based on red-black tree

图2 基于红黑树的全局最优合并算法流程图

2.3.2 C global 的设计
在全局最优合并阶段,由于各个区域要通过合并来逼近真实地物,故本文在 C global 中放弃了形状信息。HR遥感影像中真实地物的形状差异巨大,导致紧凑异质性的数值变化远超过式(2)或式(5)的结果。图3显示了S1分割过程中光谱与紧凑异质性变化量随合并次数的变化。由此可知,在合并阶段后期,紧凑异质性的变化过大,易导致错误。
Fig.3 The variation of spectral and compactness heterogeneity with the increase of the merge number

图3 光谱与紧凑异质性随合并次数增长的变化

C global 还考虑了区域之间的边界信息,以防光谱相近、但边界明显的区域被错误地合并。本文采用的边界强度提取方法参考文献[23],其步骤为:
(1)利用高斯差分滤波方法计算各个波段的水平、竖直方向的梯度,构成 B × 2 维矩阵。
G x , y = v g 1 v g B h g 1 h g B (6)
式中: v g 1 表示波段1的像元 ( x , y ) 在竖直方向的灰度梯度值。
(2)像元的边界强度是矩阵GTG的最大特征值,2个区域的边界差异值是其公共边的边界强度的平均值。在全局最优合并过程中,每次合并前,都要考察待合并区域之间的边界强度,若其阈值大于 T edge ,则合并被禁止。 T edge 的计算公式如式(7)所示。
T edge = μ edge + λ σ edge (7)
式中: μ edge σ edge 分别是边界强度图像的灰度均值和标准偏差。 λ 是调节系数,一般取值为3.0。
在全局最优合并中,阈值 T sg 控制了合并数目的多少。 T sg 越大,合并次数越多,算法计算时间越短,但错误合并的概率越高,因此 T sg 的设置需要因影像而异。经多次实验发现,对于光谱范围为[0,255]的HR遥感影像,可将该阈值设置为10-30,以避免光谱差异较大的区域被合并。

3 实例验证与分析

3.1 实验数据

本文利用OrbView3获取的HR遥感数据进行算法验证。OrbView3是一颗商业遥感卫星,于2003年6月升空,可提供空间分辨率1 m的全色影像和4 m的多光谱影像。多光谱影像包含近红外、红色、绿色和蓝色4个波段。美国国家地质调查协会(United States Geological Survey,USGS)的官网提供了部分OrbView3数据的免费下载。
Fig.4 Two scenes of the OrbView3 multispectral images adopted by the experiment used in this paper

图4 本文实验所采用的2景OrbView3多光谱影像

3.2 评价方法与参数设置

P = i = 1 n S S i S S ih G A (8)
式中: n S S 中区域的数目; S i S 表示S中的某个区域; S th G 表示在G中与 S i S 相匹配的区域; A G 中所有区域的面积和;| |表示集合的基数,即区域所包含的像元数目。R的定义为S和G中相匹配区域的交集与G中各个区域面积的比值(式(9))。
R = i = 1 n S S i S S th G S i S S th G S th G (9)
h = arg max j S i S S j G S i S S j G (10)
对于S中的某个区域 i ,当它与G中一个区域 j 的交集和并集的比值最大时,该区域就是 i 所匹配到的区域 h
F = ( β 2 + 1 ) P R β 2 P + R (11)
式中: β 为调节系数,本文取值为2。F值越接近1,说明算法的分割精度越高。
本文算法需要设置2个参数,分别为式(7)的 λ 和全局最优合并的阈值 T sg 。经多次试验,λ和 T sg 对于S1的最佳参数,分别为3.0和20;对于S2,分别为3.0和12。RHSeg需要设置尺度参数,经过多次实验,S1和S2的参数分别为4000和800。MRS需要给出形状、紧凑性和尺度参数,其中前2个参数都被分别设置为0.1和0.5;S1和S2的尺度参数分别为110和50。

3.3 结果与分析

为了进行精度对比,本文利用RHSeg[11]和eCognition Developer Trial 8.0中的多分辨率分割算法(Multi-Resolution Segmenation,MRS)[26]与本文方法进行了对比,得到定量的分割精度评价结果。
3.3.1 农田地区影像的分割实验
Fig.5 Segmentation results using the 3 algorithms for S1

图5 3种算法的S1分割结果

由于本文算法采用了优化的合并规则,在合并过程中充分考虑了几何、光谱和边界信息,使分割精度得到显著地提高。表1列出了3种算法的P、R、F值,本文算法的F值明显高于另外2种算法,RHSeg的精度略好于MRS。与其他2种算法不同,本文算法在光谱异质性较大的区域容易产生细碎区域,如图5(b)东侧的农田。这与 C global 中未考虑区域大小信息有关,但这些细碎的区域对整体分割精度的影响并不显著。另外,表1还列出了3种算法的运算时间。本文方法的时间最短,这主要归功于先局部、后全局的合并策略;此外,利用红黑树实现全局最优合并也显著提升了运算速度。需要说明的是,本文实验均是在同一台笔记本电脑上完成的,其配置为:CPU是Intel Core I5 4200 m(2.5 GHz),内存4 GB,操作系统为Windows 7。
Tab.1 Quantitative evaluation of the 3 algorithms for S1

表1 3种算法的S1定量评价

P R F 时间/s
本文方法 0.9512 0.8624 0.8788 0.52
RHSeg 0.8540 0.7979 0.8085 0.66
MRS 0.9319 0.7450 0.7761 0.82

3.3.2 城市地区影像的分割实验

图6展现了S2的分割结果。与S1截然不同的是,S2包含了更多细小的区域,这极大地增加了分割的复杂度。本文算法的 T sg 比S1的小一些,目的是为了使阴影和道路等光谱十分相近的区域能够被区分。本文方法较为完整地保留了海水区域,同时很多楼房、草坪等细小区域也被较为完整地分割出来。表2中本文方法的F值最高,而MRS的亚分割错误最明显,其R值最高也印证了这一点。由于城区包含地物多,RHSeg在搜索合并的过程中耗时多,导致其运算时间最长。相反,本文方法在全局最优合并阶段采用了红黑树来提高搜索效率,明显降低了运算时间。
Tab.2 Quantitative evaluation of the 3 algorithms for S2

表2 3种算法的S2定量评价

P R F 时间/s
本文方法 0.8037 0.8758 0.8603 0.44
RHSeg 0.8674 0.7035 0.7311 0.96
MRS 0.2498 0.9183 0.5981 0.80
3.3.3 复杂影像的分割实验
为了进一步验证本文方法的性能,本文又采用5景尺度更大、复杂度更高的OrbView3影像开展分割实验。由于篇幅有限,图7仅展现了本文算法对一景较有代表性的影像的分割结果。该影像包含了农田和城市区域,且尺度更大(1000像元×1000像元),因此分割难度更高。图7(d)清晰地展示了该图东部区域放大的分割结果,一些细小的道路、农田、建筑物等地物都被较好地分割出来。 T sg 被设置为较小的值10,避免了光谱相近的区域被错误地合并,但也导致了较多细小的斑块。因此,在实际应用中,建议用户根据实际情况来调节 T sg
Fig.6 Segmentation results using the 3 algorithms for S2

图6 3种算法的S2分割结果

对于图7,本文方法的运算时间为2.90 s,显著低于MRS的4.43 s,说明随着影像尺度的增大,本文方法优越的合并策略与数据结构会增加算法运算速度的优势。5景影像分割结果的定量评价与S1和S2接近,进一步说明了本文方法的优越性。
Fig.7 The segmentation of a scene with relatively good representativeness

图7 一景较有代表性的遥感影像的分割结果

4 结论


