地球信息科学学报  2018 , 20 (10): 1489-1499 https://doi.org/10.12082/dqxxkx.2018.180183

遥感科学与应用技术

基于光谱和形状的遥感图像分割质量评估方法

韦兴旺, 张雪锋, 薛云

西安邮电大学通信与信息工程学院,西安 710121

Remote Sensing Image Segmentation Quality Assessment Based on Spectrum and Shape

WEI Xingwang*, ZHANG Xuefeng, XUE Yun

Xi'an University of Posts & Telecommunications, School of Communication and Information Engineering, Xi'an 710121, China

通讯作者:  *Corresponding author: WEI Xingwang, E-mail: Thrive320@outlook.com

收稿日期: 2018-04-16

修回日期:  2018-07-23

网络出版日期:  2018-10-25

版权声明:  2018 《地球信息科学学报》编辑部 《地球信息科学学报》编辑部 所有

基金资助:  国家自然科学基金项目(61301091)陕西省自然科学基础研究计划项目(2017JQ6010、2015JQ6262)

作者简介:

作者简介:韦兴旺(1993-),男,硕士生,研究方向为图像分割。E-mail: Thrive320@outlook.com

展开

摘要

针对多尺度遥感图像的分割质量评估问题,提出了一种光谱和形状相结合的分割质量评估方法。首先,采用超像元方法对图像进行初始分割,将图像过分割为若干区域;其次,根据合并准则迭代合并相邻区域来生成各尺度图像,其中,使用尺度集结构来索引各尺度的区域,使用邻接图来记录各尺度下区域间关系;然后给出各尺度图像形状紧凑性和平滑性的计算公式,并结合各尺度图像光谱特征计算出各尺度图像的同质性和异质性;最后根据贝叶斯风险最小准则选择最优分割尺度。实验结果表明,该方法可以适应不同图像内对象特质,使得最优分割尺度的选择更合理,图像分割效果更佳。

关键词: 遥感图像 ; 光谱 ; 形状 ; 最优尺度 ; 区域

Abstract

With the continuous improvement of the spatial resolution of high-altitude platform remote sensing images, multi-scale information extraction methods have been used widely. The choice of optimal segmentation scale is a key technique in multi-scale remote sensing image segmentation. Aiming at the problem of segmentation quality assessment of multi-scale remote sensing image segmentation, a spectral and shape-based segmentation quality assessment method is proposed. Firstly, the image is initially segmented using the superpixel method, and the image is over-segmentated into several regions. Secondly, the multi-scale images are generated by iteratively merging the neighboring regions according to the merging criterion, and the scale-sets structure is used to index the regions of each scale. Adjacent graphs are used to record the relationship between the regions of each scale, then the formulas for the shape compactness and the shape smoothness of each scale are given by this paper, and the homogeneity and heterogeneity of each scale are calculated by combining the spectral features and the shape features of each scale; Finally, the optimal segmentation scale is automatically selected according to the Bayesian minimum risk criterion. The experimental results show that this method can adapt to the characteristics of regions in different images, and make the choice of optimal segmentation scale more reasonable and the image segmentation effect much better. The proposed algorithm selects the optimal segmentation scale based on standard of the global optimize, It is one of the development of multi-scale information extraction technology that how to make the object reach the best in every scale.

Keywords: remote sensing image ; spectrum ; shape ; optimal scale ; region

0

PDF (36087KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

韦兴旺, 张雪锋, 薛云. 基于光谱和形状的遥感图像分割质量评估方法[J]. 地球信息科学学报, 2018, 20(10): 1489-1499 https://doi.org/10.12082/dqxxkx.2018.180183

WEI Xingwang, ZHANG Xuefeng, XUE Yun. Remote Sensing Image Segmentation Quality Assessment Based on Spectrum and Shape[J]. Journal of Geo-information Science, 2018, 20(10): 1489-1499 https://doi.org/10.12082/dqxxkx.2018.180183

1 引言

随着遥感卫星和高空平台的快速发展和广泛应用,高空间分辨率遥感图像的应用也变得越来越普遍。从图像上自动识别地物类型并精确测量地物形状和大小,是遥感图像信息提取的热点和难点之一。

1976年,Kettig等[1]提出多尺度遥感图像分割方法,并广泛应用于高分辨率遥感图像中。多尺度遥感图像分割方法认为一个完整的图像可以看作是由互不叠加的若干区域拼接生成,每个区域表示一个分割对象,由这些区域表达的整幅图像作为图像的一个分割尺度。当相邻二个区域相互合并生成新的区域时,这二个相邻区域与新生成区域就形成父子关系。父区域与除子区域之外的其他区域,同样也构成了整个图像,这也是整个图像的一个分割尺度。如何合理表达图像的所有分割尺度,记录各区域父子关系,消除尺度间相同区域的冗余信息,是多尺度遥感图像分割方法的一个关键问题。

尺度集理论提出于2006年[2],有效地简化了多尺度遥感图像分割方法。尺度集结构保留图像初始分割的所有区域,利用二叉树来记录每二个相邻子区域与合并生成父区域的区域索引关系。尺度集理论使用尺度集结构记录了图像所有尺度下的分割结果,将图像分割中的最佳尺度选择留给了后续应用处理,使得图像多尺度表达与最佳尺度选择相互独立,简单高效。多尺度遥感图像分割方法每次只合并相邻的2个区域,来生成一个新的分割尺度,如果从单个像元开始合并,会使得生成一个完整尺度集结构的时间大大增加,所以多尺度遥感影像分割方法首先对图像进行一个初始分割,这样做可以在保证最终图像分割精度的情况下减少区域迭代合并时间,快速构建图像尺度集结构。超像元是指受一定相似性准则约束的分割区域,它可以获取图像的冗余信息,降低图像处理的复杂度,受到越来越多研究者的关注[3]。使用超像元对图像进行初始分割,可使图像分割区域具有大小均匀、形状紧凑平滑、边缘一致、单个区域连通不重叠等特点。Bergh等[4]提出的SEEDS算法,是一种基于能量驱动获取超像元的方法。SEEDS算法定义了一个基于超像元颜色分布直方图和超像元边界形状的能量函数,通过爬山算法最大化能量函数来获取超像元。Levinshtein等[5]提出TurboPixels算法,该算法描述了一种基于几何流的方法获取超像元,这种方法很好地保持了图像的局部边缘而且速度非常快,它的算法复杂度与图像的尺寸成线性关系。基于线性迭代聚类(Simple Linear Iterative Clustering, SLIC)的超像元分割方法综合了超像元间距离与边缘梯度,可以实现快速的图像分割[6]

多尺度遥感图像分割方法对于遥感图像信息提取至关重要。但是,许多最优分割尺度是使用试错法来选择,这使得分析图像变得主观和耗时。近年来,一些基于无监督的最优尺度选择方法被提出:何敏等[7]用对象内部标准差反应对象内部同质性,用全局空间相关性表示对象之间的异质性,通过对构成的分割质量函数进行线性插值得到最优分割尺度;殷瑞娟等[8]结合图像主成分来自动选择最优分割尺度;DräGuå£等[9]利用局部方差的演化来估计图像最优分割尺度,并开发了一个名为ESP的工具包;Grybas等[10]通过最小化对象内同质性和最大化对象间异质性指标来获得最优分割尺度;文献[11,12,13]采用不同目标函数来评估这2个图像分割质量指标,从而获得最优分割尺度。此类方法均将各分割尺度下对象内同质性和对象间异质性作为分割质量指标,但是,对于各尺度下这两个图像分割质量指标的定义却显单一。在衡量分割区域对象内部同质性的时候仅仅采用图像光谱方差作为标准,而遥感图像拥有丰富的空间结构信息和地理特征信息,如光谱、形状、纹理等。如何更加合理有效的利用图像的众多特征,已成为该领域的热点课题。

为此,本文在分析原有模型方法基础上,针对多尺度遥感图像分割中最优分割尺度选择问题,提出了一种光谱和形状相结合的分割质量评估方法,该方法通过区域对象的紧凑性和平滑性来表达形状特征,评估图像中分割区域形状和光谱的分割质量,获得更优的图像分割尺度,提高了分割质量和工作效率。

2 遥感图像分割算法

2.1 算法原理

文献[13]给出了无监督多尺度图像分割算法,该算法具有分割对象准确率高、分割边缘精确等特点。将本文提出的分割质量评估方法应用到文献[13]算法中,具体算法流程(图1):① 输入图像,并采用超像元方法将图像初始分割成若干个小区域;② 不断迭代合并相邻的两个区域生成新区域,直到所有区域被合并成一个区域,此区域即原图像。以此构建尺度集结构来记录所有合并的两个区域与新生成区域的父子关系;③ 本文给出各分割尺度的形状光滑度和紧凑度的计算公式,来计算各分割尺度的形状同质性。将形状同质性和光谱同质性相结合,并计算出各分割尺度的全局异质性;④ 使用贝叶斯模型根据各分割尺度的同质性和异质性来选择最优分割尺度。

图1   算法流程图

Fig. 1   Algorithm flowchart

对于图1中的迭代合并相邻区域并构建尺度 集[13],具体细化如下:① 初始化区域邻接图和尺度集结构,并计算各区域间相似性作为区域合并代价。区域邻接图用来记录各个区域的相邻关系,从而方便选择要合并的相邻二区域。尺度集结构用来记录图像每个分割尺度的区域索引,从而方便计算图像每个分割尺度的同质性和异质性;② 以选择区域间最小合并代价为准则,迭代合并相邻两个区域。每合并一次两个相邻的区域,就生成一个图像的分割尺度。计算更新合并后新生成区域与相邻区域的合并代价,更新区域邻接图并向尺度集结构中插入新的分割尺度;③ 当所有初始分割区域合并为一个区域时,迭代停止。区域迭代合并了多少次,图像就会生成多少分割尺度。初始分割的所有区域构成了图像的初始尺度。

2.2 区域邻接图和尺度集理论

在区域合并时,需要对区域之间的位置关系以及相互合并代价进行记录。要求每次迭代合并选取的两个区域是相邻的,并且在所有相邻区域中合并代价最小。区域邻接图采用无向图对区域邻接关系进行记录[14],其中每个节点对应一个区域,如果区域相连就会有一条边缘连接两个区域对应的节点,每一条边缘赋予一定的权重,记录与相邻区域的合并代价,并且每条边缘的存储在本区域节点中都是按照其权重从小到大进行排列,这样的表达方式可以在每次合并中快速索引到最小合并代价的两个区域,并且在合并之后可以更加简单的建立新生成区域的邻接关系。

对于一个初始分割为n个互不重叠区域的图像,设其初始尺度λ0下的分割结果为 Pλ0。本文的分割尺度为正整数,等于迭代次数,即λ0=1。第k次合并两个区域新生成一个区域,在尺度集结构中插入一个新的分割尺度λk-1,且λk-1=λk-2+1。在区域合并的过程中,分割尺度不断变大,且每合并一次区域总数减1,则构建一个完整的尺度集需要合并n-1次。由于第i次分割结果 Pλi和第j次分割结果 Pλj存在层次关系,设i小于j,且第i次分割结果可分为区域集合αβi,则第j次分割结果可分为区域集合αβj,其中αPλiPλj的相同区域集合,可以得到αβiβj中区域元素都是由初始分割区域两两合并生成,且βi中区域元素两两合并生成βj中区域元素。因此,可以只保留初始所有区域,利用尺度集构建后续新生区域层次索引关系,每个分割结果都可以被索引出来,这样节省了内存空间。

2.3 合并准则与贝叶斯风险决策

合并过程以初始分割区域开始,迭代合并最相似的相邻两个区域形成父区域,父区域与其他区域组成图像的一个分割尺度。最终,在仅留下一个区域时停止合并,得到图像的若干个分割尺度。区域合并最重要的问题是如何衡量合并两个相邻区域的代价,现已提出了众多标准,如信息理论和基于统计特征的标准[16,17]。这些标准的选择主要取决于图像类型和应用。本文使用光谱纹理模型[18]来衡量区域合并代价,该方法根据光谱、纹理与形状特征计算相邻区域之间的合并代价,被用于各种应用。对于相邻的两个区域mn,合并代价Cm,n)计算公式如下:

C(m,n)=SmSnSm+Sn·1||Lm,n||λ·CGC+ωTGT) (2)

式中:SmSn分别代表相邻两个区域的面积;Lm, n表示相邻两区域的公共边长;λ为调节因子;ωCωT是权重因子;GC是光谱直方图的统计值,GT是纹理直方图的统计值。对于M通道图像,其计算公式为:

ωC=minkm,kn(3)

k=1Mi=0Mmaxfi(4)

ωT=1-ωC(5)

式中:fi是图像在i通道上的光谱直方图除以图像总像元个数后的光谱直方图频率;max(fi)是图像在i通道上光谱直方图柱体的最大频率;kmkn是区域mnk值。

计算直方图距离的G统计法公式为[15]

Gm,n=m,ni=0t-1filogfi+m,ni=0t-1filogm,ni=0t-1fi-m,ni=0t-1filogi=0t-1fi-i=0t-1m,nfilogm,nfi(6)

式中:t为直方图中直方柱总个数;fi为直方图第i个柱体与直方图柱体值总和的比值。

本文中区域光谱直方图柱体一共32个,将像元值从0到255均匀等分为32个区间,统计每区间的像元值个数获得区域光谱直方图。区域纹理直方图是二维直方图,大小为36像元×16像元。其中,区域每个像元点有2个纹理值,一个是旋转不变LBP算子值[15],表示像元点的纹理结构,另一个是LC算子值[15],表示像元点的纹理强度。旋转不变LBP算子值一共存在36种值,可直接作为纹理直方图的一个维度。本文对像元点LC算子值先进行开方,得到其范围为0到127,然后均匀分为16个区间,作为纹理直方图的另一个维度。统计区域像元点落在二维纹理直方图二个维度区间的个数,得到区域二维纹理直方图。对于任何一个像元点,其旋转不变LBP算子值和LC算子值计算公式如下[15]

LBPP,R=min{ROR(LBPP,R,i)|i=0,1,,P-1}(7)

LCP,R=1pp=0P-1(gp-μ)2,whereμ=1pp=0P-1gp(8)

式中:R表示以该像元点为中心的窗口半径;P表示窗口内像元点个数;RORx,i)表示将x按位循环右移i位后的值;gp表示窗口内p位置处的像元点值。本文使用3×3的窗口大小,则R为1,P为8。

在尺度集框架中,可以得到n个分割尺度序列,然后从n个序列中根据一定条件找出最佳分割尺度。其中,文献[11]、[19]中最佳分割尺度是从预先设置的尺度中选择的。Johnson等[12]提出利用归一化后的莫兰指数(Moran's I,MI)和局部方差(Local Variance, LV)的F方法;Lu等[20]提出一种局部简化的方法,消除了大的同质区域,在处理平坦区域上效果更佳。本文采用基于区域的图像层次简化贝叶斯框架[13],在这个框架中,归一化的MI和LV被转变为过分割和欠分割的错误风险,并且进一步引入惩罚因子(Q)来平衡欠分割的消极影响。当Q大于1时,贝叶斯决策更多的惩罚欠分割,当Q小于1时,贝叶斯决策更多的惩罚过分割,此时分割出来的图像比较粗糙。当欠分割的风险等于过分割风险时,可以很容易的获得最优分割。对于分割尺度为k的图像,其贝叶斯风险大小r(k)的计算公式如下[13]

rk=βaaverQi=1kvi-vminvmax-vmin+i=k+1NMIi-MIminMImax-MImin(9)

式中:N为最大分割尺度;aaver为图像区域平均面积;β为与图像面积相关的调节因子。贝叶斯框架通过选择最小函数风险来确定最佳分割尺度。

3 分割质量度量

对于一个初始分割为n个区域的图像,每合并一次相邻的二个区域会新生成一个区域,这个新区域和剩余区域一起构成了图像的一个分割尺度。经过n-1次迭代合并相邻的二个区域生成n-1个分割尺度,这些分割尺度构成一个图像的尺度集结构。对于每个分割尺度的图像,其每个区域内部应该具有良好的同质性,并且每个区域之间应该保持良好的异质性[11]。同质性代表同一个区域内部具有一定的相似性,图像的每个区域代表了一个独立的表达对象,每个表达对象内部应该具有一定的相似性,这些相似性不仅在局部可以表现为区域内部光谱的相似性,而且在全局上表现为所有区域的形状的相似性,包括每个区域对象的平滑度和紧凑度。区域间的异质性是指在每个分割尺度的图像中,都应该使得区域间具有最大的不同。对于图像而言,可以将区域间的光谱作为参考点,用来衡量区域间的异质性。

3.1 光谱形状同质性度量

本文提出一种改进的图像分割质量同质性评价函数T,该函数包含光谱同质性和形状同质性。对于分割尺度为k的图像,其计算式为:

Tk=ωVk+1-ωSk(10)

式中:ω为权重因子,0≤ω≤1;V为光谱同质性;S为形状同质性。

定义区域图像光谱标准差为:

σ=1Mi=1Mσi(11)

式中:M是图像光谱通道数;σi是第i个通道的光谱标准差。

分割尺度为k的图像的光谱同质性可表示为:

Vk=1W×Hi=1Naiσi(12)

式中:WH分别表示图像的宽和高;N表示图像在该分割尺度下的区域总数;aiσi表示第i个区域的面积和标准差。全局同质性评估的权重与区域面积有关,大的区域要比小的区域权重更大。V越小,表明该分割尺度下图像的全局同质性越好。

分割尺度为k的图像的形状同质性S定义如下:

Sk=i=1NαScomptik+1-αSsmoothik(13)

式中:α为权重因子,0≤α≤1;ScopptSsmooth分别表示区域紧凑度和光滑度,计算公式如下:

Ssmooth=1W×Hi=1Nailibi(14)

Scompt=1W×Hi=1Nliai(15)

式中:l表示区域的边界长度;b表示区域最小外接矩形周长。对于图像中的任意区域,由于边界长度的最小取值是区域最小外接矩形长度,所以bl

3.2 全局异质性度量

使用全局莫兰指数来评估各分割尺度下图像的全局异质性[21]。其表达式如下:

MI=Ni=1Nj=1N,jidi,jxi-x̅xj-x̅i=1Nj=1Ndi,ji=1Nxi-x̅2(16)

式中:di, j用来衡量空间邻近度,当区域i和区域j相邻时di, j为1,不相邻则为0;xi表示区域i光谱均值; x̅为整幅图像的光谱均值。莫兰指数越小,说明区域间的异质性越高,其分割效果越好。

3.3 度量函数演化分析

归一化后的全局异质性、光谱同质性、形状同质性随尺度变化的演化曲线,如图2所示。

图2   质量函数演化曲线

Fig. 2   Quality function evolution curve

图2可知,随着尺度的增加,光谱同质性先增加缓慢,但最后由于面积很大且异质性很高的区域被合并,导致光谱同质性迅速增加,说明此时图像已经过度合并。形状同质性先随着尺度增加缓慢增加,之后增加迅速,由于最后合并阶段剩余的区域不多,统计不稳定造成了曲线有一些波动。随着区域的不断合并,全局异质性不断减小,这说明区域间异质性小的区域不断被合并。

4 实验仿真与分析

为验证本文方法的效果,采用3幅无人机遥感图像进行实验分析。其中,图3(a)和图7(a)是原始大小为1024像元×512像元的RGB波段组合图像,使用无人机拍摄于安徽合肥,图像中的主要分割对象有道路、农田、森林、房屋。图9(a)是原始大小为1024像元×717像元的RGB波段组合图像。为满足地表覆盖物的分类需求,本实验理想的分割目标是将同一地物分割在一起。本实验采用SLIC超像元分割算法进行初始分割[6],该方法可以保证在边缘准确的情况下产生密集均匀的超像元细胞。

图3   不同ω分割结果

Fig. 3   Segmentation results of different

4.1 参数对分割结果图像的分析

本文方法提出的评估分割质量函数中权重值ω控制着区域光谱同质性和形状同质性所占的比重大小,ω取值为0到1之间,ω越小形状同质性在分割质量中占得比重越大。ω=0时分割质量不考虑光谱同质性;ω=1时分割质量不考虑形状同质性。本文通过实验分析ω在不同取值时对分割结果的影响,实验时设置α=0.6。

图3所示,随着ω的增加,图像的最佳分割尺度选择越来越大,分割结果中对象越来越少。由于在本图像中森林颜色相近,房屋颜色也相近,而当ω比较大的时候,表示光谱同质性对分割质量的影像程度更强,故在分割大面积颜色相近对象的时候,分割质量更偏向于颜色都相同的区域进行合并,使得房屋和森林的内部形状权重低于颜色权重,结果大面积的分割颜色相同的区域合并在了一起,而忽略了内部形状。当ω减小以后,分割结果更受形状权重值影响,对于本图像来说,分割更加精细,使得森林和房屋的边界分割更加准确。

图4图3图像的贝叶斯风险变化曲线。,当ω=0.2时,a点为最小贝叶斯风险点,最佳分割尺度为2821。当ω=0.4时,b点为最小贝叶斯风险点,最佳分割尺度为3291。当ω=0.6时,c点为最小贝叶斯风险点,最佳分割尺度为3411。当ω=0.8时,d点为最小贝叶斯风险点,最佳分割尺度为3476。曲线贝叶斯风险值随着分割尺度的增加而不断减小,在到达各自最优分割尺度之后出现回升。这与预期结果相同,均由于在开始的时候合并了同质性比较高的区域,最后导致异质性比较高的区域被强迫合并导致。

图4   贝叶斯风险对比

Fig. 4   Comparison of bayesian risk

形状同质性包含区域光滑度和紧凑度。α控制紧凑度的权值大小。本次实验设置ω=0.2,来分析α取值对分割结果的影响。将ω设置较小是突出了形状对分割质量函数影响,从而可以使得在调节α时分割结果有更明显的变化。下面通过实验分析α取值大小对分割结果影响。

图5所示,随着α的增大,分割结果的最优分割尺度选择越来越小,分割结果中对象越来越多。α控制着区域形状的紧凑度,由于紧凑度的意义为区域边界长度和区域面积开根号的比值,区域面积一定时边界长度越大紧凑度越好,使得图像中不规则的形状区域被容易分割出来,导致结果选择偏向边界长度大的分割尺度,更多有形状的区域被分割出来。光滑度的意义为区域边界长度与最小外接矩形的周长比,α越大,分割结果光滑度越低,分割结果中更多的有形状的区域被分割出来。

图5   不同α分割结果

Fig. 5   Segmentation results of different α

图6图5图像的贝叶斯风险变化曲线,当α=0.2时,d点的贝叶斯风险最小,最优分割尺度为3512。当α=0.4时,c点贝叶斯风险最小,最优分割尺度为3474。当α=0.6时,b点贝叶斯风险最小,最优分割尺度为3281。当α=0.8时,a点贝叶斯风险最小,最优分割尺度为2782。4条曲线演化趋势与预期相同,由于合并开始的时候同质性相同的区域被合并,分割结果的贝叶斯风险不断下降。当到达最优尺度时,贝叶斯风险达到最小,之后异质性大的区域被迫合并,使分割结果的贝叶斯风险增大。

图6   贝叶斯风险对比

Fig. 6   Comparison of bayesian risk

图7   方法对比分割结果(安徽合肥)

Fig. 7   Methods compare the segmentation results in Hefei, Anhui

综上实验和分析,本文给出分割不同图像时的参数ω和参数α的调节规则。经过大量图像测试,当α=0.3和ω=0.5时,可使得大部分图像分割效果良好。当图像中分割对象以光谱信息为主时,应提高ω的取值,使得分割质量评估函数给予光谱因子更高的权重。当图像中有较多的有形状的对象时,应降低ω的取值。若图像的对象的形状不规则的偏多,则适当调大α,这样将会分割出更多的形状不规则的对象。若形状规则的对象多,则适当减小α

4.2 对照实验与分析

本文提出的图像质量分割评估方法应用到文献[13]的图像分割算法中,并与文献[13]中的分割效果进行比较。超像元分割方法SLIC被用于初始分割[6]。使用光谱纹理模型计算合并代价[18],其中实验参数λ=0.5,贝叶斯框架C=1。本文图像质量分割函数设置参数α=0.1,ω=0.5。

图7(c)、(d)可看出,本文方法和文献[13]方法在农田分割上区别较小,这是因为农田对象内部的形状不规则,分割质量函数中计算的形状特征远小于光谱特征。但是图7(d)中的房屋分割结果比图 7(c)中的房屋分割更加精细,这是由于房屋边缘明显,形状相比农田更突出,因而分割质量函数中的形状因子起到作用。评估分割质量不仅考虑了光谱的作用也考虑了形状的作用,使得房屋的分割更加的精准。图7(e)、(f)分别为文献[13]方法和本文方法分割结果的主要差异区域的放大,可以看出,图7(f)黄色方框内的房屋部分分割更加准确,说明评估分割质量函数使得房屋在边缘位置分割效果更佳。

图8图7图像的贝叶斯风险变化曲线,其中,红色曲线和蓝色曲线分别表示文献[13]方法与本文方法的贝叶斯风险曲线。从图中可看出,2个曲线增减趋势大致相同,均在刚开始的时候贝叶斯风险不断减小,在末尾处增大。这是由于在开始的时候初始分割是过分割,图像区域数量远远大于图像内实际对象数量,不断地有同质性区域被合并,生成更大的分割尺度图像,并且生成的分割尺度的图像分割质量更好,所以贝叶斯风险不断减小;到了后期,贝叶斯风险增大,是由于在图像合并到区域个数等于图像内实际对象个数的时候分割质量达到最佳,此时贝叶斯风险达到最小,继续合并会导致异质性高的区域被合并,因此往后再合并会导致贝叶斯风险增加。图8中,文献[13]方法贝叶斯风险最小的时候尺度为3411,本文方法贝叶斯风险最小时候尺度为3308。本文方法比较小,表明本文方法选择的最优分割尺度更靠前,从分割结果中可以看出本文方法选择的最优分割尺度在分割结果上更优。

图8   贝叶斯风险比较

Fig. 8   Comparison of bayesian risk

图9(c)、(d)可看出,本文方法比文献[13]的方法分割结果更精细,主要体现在道路和房屋的边缘部分。本文方法在公路和房屋的边缘部分分割更加准确,这主要是因为图像中的道路和房屋形状都比较规则,随着分割尺度增大,形状规则的区域均被分割到了一块。如果强行合并2个形状的区域,会导致形状同质性陡然增大,使合并的贝叶斯风险变大,此时算法就会保留2个形状区域不合并。而对于图9(c)和图9(d)中的森林部分,无明显差异。这主要是因为森林内部的形状特征很小,只有光谱特征在起主要作用,所以分割出来后的结果区别不大。图9(e)和图9(f)分别表示图9(c)和图9(d)中黄框区域的放大图。从图中可以看出,由于本文结合了区域的光谱和形状两种特征,所以图9(f)中的分割效果更加准确。

图9   方法对比分割结果(河南郑州)

Fig. 9   Method to compare segmentation results in Zhengzhou, Henan

图10图9图像的贝叶斯风险变化曲线。为了比较文献[13]方法与本文方法在最优分割尺度的选择上的差异,绘制从分割尺度大小为4000到5015间的贝叶斯风险随分割尺度大小的变化曲线。红色曲线表示随着分割尺度不断增大,文献[13]方法的贝叶斯风险曲线,蓝线曲线表示随着分割尺度不断增大,本文方法的贝叶斯风险曲线。从图中可以看出,2条曲线的变化趋势基本相同。到达最优分割尺度之前贝叶斯风险都是不断减小,且最优分割尺度靠后,在到达最优分割尺度之后贝叶斯风险逐渐增加。这是由于对图像开始的处理为过分割处理,使同质性区域被分割开来。而在区域合并过程中,同质性高的区域被合并,生成了分割尺度大的分割结果,此时的贝叶斯风险不断减小,当合并到最佳分割尺度时,贝叶斯风险达到最小,之后异质性高的区域被强迫合并,使贝叶斯风险又逐步增大。图中文献[13]贝叶斯风险最小的时候分割尺度大小为4956,本文方法贝叶斯风险最小的时候分割尺度为4869。本文方法选取的最优分割尺度要小于文献[13]方法选取的最优分割尺度,从图9可看出本文方法最终分割结果要优于文献[13]方法。

图10   贝叶斯风险比较

Fig.10   Comparison of bayesian risk

5 结论

最优分割尺度的选择是多尺度遥感图像分割中的关键技术,决定了最终分割结果。本文采用超像元方法对图像进行初始分割,以结合光谱与形状信息区域合并代价为准则迭代合并建立尺度集结构,合并过程中使用最近邻域图来优化区域关系,提出一种基于全局区域形状和光谱的分割质量评估函数,以图像区域对象紧凑性和平滑性来表达其形状特征。计算各分割尺度下的图像形状和光谱同质性,以及全局异质性,最后根据贝叶斯框架选择最优分割尺度。实验结果表明,本文方法分割不同图像时,可以根据图像内对象特质进行调节,使图像最佳分割尺度选择更合理。

The authors have declared that no competing interests exist.


参考文献

[1] Kettig R L, Landgrebe D A.

Classification of multispectral image data by extraction and classification of homogeneous objects

[J]. Geoscience Electronics IEEE Transactions on, 1976,14(1):19-26.

https://doi.org/10.1109/TGE.1976.294460      URL      [本文引用: 1]     

[2] Guigues L, Men H L.

Scale-sets image analysis

[J]. International Journal of Computer Vision, 2006,68(3):289-317.

https://doi.org/10.1007/s11263-005-6299-0      URL      [本文引用: 1]     

[3] Achanta R, Shaji A, Smith K, et al.

SLIC superpixels compared to state-of-the-art superpixel methods

[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012,34(11):2274-2282.

https://doi.org/10.1109/TPAMI.2012.120      URL      PMID: 22641706      [本文引用: 1]      摘要

Abstract Computer vision applications have come to rely increasingly on superpixels in recent years, but it is not always clear what constitutes a good superpixel algorithm. In an effort to understand the benefits and drawbacks of existing methods, we empirically compare five state-of-the-art superpixel algorithms for their ability to adhere to image boundaries, speed, memory efficiency, and their impact on segmentation performance. We then introduce a new superpixel algorithm, simple linear iterative clustering (SLIC), which adapts a k-means clustering approach to efficiently generate superpixels. Despite its simplicity, SLIC adheres to boundaries as well as or better than previous methods. At the same time, it is faster and more memory efficient, improves segmentation performance, and is straightforward to extend to supervoxel generation.
[4] Michael V D B, Boix X, Roig G, et al.

SEEDS: Superpixels extracted via energy-driven sampling

[J]. International Journal of Computer Vision, 2015,111(3):298-314.

https://doi.org/10.1007/s11263-014-0744-2      URL      [本文引用: 1]      摘要

Superpixel algorithms aim to over-segment the image by grouping pixels that belong to the same object. Many state-of-the-art superpixel algorithms rely on minimizing objective functions to enforce color homogeneity. The optimization is accomplished by sophisticated methods that progressively build the superpixels, typically by adding cuts or growing superpixels. As a result, they are computationally too expensive for real-time applications. We introduce a new approach based on a simple hill-climbing optimization. Starting from an initial superpixel partitioning, it continuously refines the superpixels by modifying the boundaries. We define a robust and fast to evaluate energy function, based on enforcing color similarity between the boundaries and the superpixel color histogram. In a series of experiments, we show that we achieve an excellent compromise between accuracy and efficiency. We are able to achieve a performance comparable to the state-of-the-art, but in real-time on a single Intel i7 CPU at 2.8 GHz.
[5] Levinshtein A, Stere A, Kutulakos K N, et al.

TurboPixels: fast superpixels using geometric flows

[J]. IEEE Trans Pattern Anal Mach Intell, 2009,31(12):2290-2297.

https://doi.org/10.1109/TPAMI.2009.96      URL      PMID: 19834148      [本文引用: 1]      摘要

We describe a geometric-flow-based algorithm for computing a dense oversegmentation of an image, often referred to as superpixels. It produces segments that, on one hand, respect local image boundaries, while, on the other hand, limiting undersegmentation through a compactness constraint. It is very fast, with complexity that is approximately linear in image size, and can be applied to megapixel sized images with high superpixel densities in a matter of minutes. We show qualitative demonstrations of high-quality results on several complex images. The Berkeley database is used to quantitatively compare its performance to a number of oversegmentation algorithms, showing that it yields less undersegmentation than algorithms that lack a compactness constraint while offering a significant speedup over N-cuts, which does enforce compactness.
[6] Achanta R, Shaji A, Smith K, et al.

SLIC superpixels compared to state-of-the-art superpixel methods

[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2012,34(11):2274-2282.

https://doi.org/10.1109/TPAMI.2012.120      URL      PMID: 22641706      [本文引用: 3]      摘要

Abstract Computer vision applications have come to rely increasingly on superpixels in recent years, but it is not always clear what constitutes a good superpixel algorithm. In an effort to understand the benefits and drawbacks of existing methods, we empirically compare five state-of-the-art superpixel algorithms for their ability to adhere to image boundaries, speed, memory efficiency, and their impact on segmentation performance. We then introduce a new superpixel algorithm, simple linear iterative clustering (SLIC), which adapts a k-means clustering approach to efficiently generate superpixels. Despite its simplicity, SLIC adheres to boundaries as well as or better than previous methods. At the same time, it is faster and more memory efficient, improves segmentation performance, and is straightforward to extend to supervoxel generation.
[7] 何敏,张文君,王卫红.

面向对象的最优分割尺度计算模型

[J].大地测量与地球动力学,2009,29(1):106-109.

Magsci      [本文引用: 1]      摘要

面向对象的影像分析方法适合高分辨率遥感影像信息提取,其核心问题在于实现对高分辨率遥感影像的多尺度分割。提出了一种针对面向对象分析方法中多尺度分割的最优分割尺度计算模型,并进行了影像分割实验。结果表明,此模型能快速地获取可靠的最优分割尺度。

[ He M, Zhang W J, Wang W H.

Optimal segmentation scalemodel based on object-oriented analysis method

[J]. Journal of Geodesy and Geodynamics, 2009,29(1):106-109.]

Magsci      [本文引用: 1]      摘要

面向对象的影像分析方法适合高分辨率遥感影像信息提取,其核心问题在于实现对高分辨率遥感影像的多尺度分割。提出了一种针对面向对象分析方法中多尺度分割的最优分割尺度计算模型,并进行了影像分割实验。结果表明,此模型能快速地获取可靠的最优分割尺度。
[8] 殷瑞娟,施润和,李镜尧.

一种高分辨率遥感影像的最优分割尺度自动选取方法

[J].地球信息科学学报,2013,15(6):902-910.

https://doi.org/10.3724/SP.J.1047.2014.00902      URL      Magsci      [本文引用: 1]      摘要

随着卫星遥感影像空间分辨率的不断提高,面向对象的地物信息提取技术发展迅速。图像分割作为面向对象分类的关键步骤之一,其分割尺度的参数设置目前仍以分类者的多次尝试和主观判断为依据,效率较低且分割结果因人而异。本文以WorldView2影像数据为例,结合当前现有的理论和方法,实现了一种计算机可自动进行主成分变换的高分辨率遥感图像全局最优分割尺度选取算法。改进后的算法以主成分变换所得的主成分影像作为图像分割的编辑层,主成分的特征值百分比作为计算异质性参数和分割质量评价值的权重,自动计算当分割尺度从20增至200时分割图像的分割质量评价值(GS),解决了人为确定图像分割编辑层的片面性问题,并利用三次样条插值选取出GS最高值所对应的尺度即为最优分割尺度。结果表明,该最优分割尺度选取方法可有效避免人为确定分割尺度的主观性、片面性和低效性,提升了高分辨率影像分割质量。

[ Yin, R J,

Shi R H, Li J Y. Automatic selection of optimal segmentation scale of high-resolution remote sensing images

[J]. Journal of Geo-information Science, 2013,15(6):902-910. ]

https://doi.org/10.3724/SP.J.1047.2014.00902      URL      Magsci      [本文引用: 1]      摘要

随着卫星遥感影像空间分辨率的不断提高,面向对象的地物信息提取技术发展迅速。图像分割作为面向对象分类的关键步骤之一,其分割尺度的参数设置目前仍以分类者的多次尝试和主观判断为依据,效率较低且分割结果因人而异。本文以WorldView2影像数据为例,结合当前现有的理论和方法,实现了一种计算机可自动进行主成分变换的高分辨率遥感图像全局最优分割尺度选取算法。改进后的算法以主成分变换所得的主成分影像作为图像分割的编辑层,主成分的特征值百分比作为计算异质性参数和分割质量评价值的权重,自动计算当分割尺度从20增至200时分割图像的分割质量评价值(GS),解决了人为确定图像分割编辑层的片面性问题,并利用三次样条插值选取出GS最高值所对应的尺度即为最优分割尺度。结果表明,该最优分割尺度选取方法可有效避免人为确定分割尺度的主观性、片面性和低效性,提升了高分辨率影像分割质量。
[9] DräGuå£ L, Csillik O, Eisank C, et al.

Automated parameterisation for multi-scale image segmentation on multiple layers

[J]. ISPRS J Photogramm Remote Sensing, 2014,88(100):119-127.

https://doi.org/10.1016/j.isprsjprs.2013.11.018      URL      PMID: 24748723      [本文引用: 1]      摘要

Abstract We introduce a new automated approach to parameterising multi-scale image segmentation of multiple layers, and we implemented it as a generic tool for the eCognition脗庐 software. This approach relies on the potential of the local variance (LV) to detect scale transitions in geospatial data. The tool detects the number of layers added to a project and segments them iteratively with a multiresolution segmentation algorithm in a bottom-up approach, where the scale factor in the segmentation, namely, the scale parameter (SP), increases with a constant increment. The average LV value of the objects in all of the layers is computed and serves as a condition for stopping the iterations: when a scale level records an LV value that is equal to or lower than the previous value, the iteration ends, and the objects segmented in the previous level are retained. Three orders of magnitude of SP lags produce a corresponding number of scale levels. Tests on very high resolution imagery provided satisfactory results for generic applicability. The tool has a significant potential for enabling objectivity and automation of GEOBIA analysis.
[10] Grybas H, Melendy L, Congalton R G.

A comparison of unsupervised segmentation parameter optimization approaches using moderate- and high-resolution imagery

[J]. Giscience and Remote Sensing, 2017,22:1-19.

[本文引用: 1]     

[11] B. Johnson and Z. Xie,

Unsupervised image segmentation evaluation and refinement using a multi-scale approach

[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2011,66(4):473-483.

https://doi.org/10.1016/j.isprsjprs.2011.02.006      URL      [本文引用: 3]      摘要

In this study, a multi-scale approach is used to improve the segmentation of a high spatial resolution (3002cm) color infrared image of a residential area. First, a series of 2502image segmentations are performed in Definiens Professional 5 using different scale parameters. The optimal image segmentation is identified using an unsupervised evaluation method of segmentation quality that takes into account global intra-segment and inter-segment heterogeneity measures (weighted variance and Moran’s I, respectively). Once the optimal segmentation is determined, under-segmented and over-segmented regions in this segmentation are identified using local heterogeneity measures (variance and Local Moran’s I). The under- and over-segmented regions are refined by (1) further segmenting under-segmented regions at finer scales, and (2) merging over-segmented regions with spectrally similar neighbors. This process leads to the creation of several segmentations consisting of segments generated at three different segmentation scales. Comparison of single- and multi-scale segmentations shows that identifying and refining under- and over-segmented regions using local statistics can improve global segmentation results.
[12] Johnson B A, Bragais M, Endo I, et al.

Image segmentation parameter optimization considering within- and between-segment heterogeneity at multiple scale levels: Test case for mapping residential areas using landsat imagery

[J]. ISPRS International Journal of Geo-information, 2015,4(4):2292-2305.

https://doi.org/10.3390/ijgi4042292      URL      [本文引用: 2]     

[13] Hu Z, Li Q, Zhang Q, et al.

Unsupervised simplification of image hierarchies via evolution analysis in scale-sets framework

[J]. IEEE Transactions on Image Processing, 2017,26(5):2394-2407.

https://doi.org/10.1109/TIP.2017.2676342      URL      [本文引用: 18]      摘要

Region-based hierarchical image representation is crucial in many computer vision applications. However, in practice, an image hierarchy is usually dense, and contains many less informative branches. It is expected that a hierarchy should be accurate and simplified, which is not only desirable for different applications, but also saves considerable computational load for the further analysis. To achieve this target, this paper proposes a novel approach for unsupervised simplification of regionbased image hierarchies, which employs the global and local evolution analyses of a hierarchy. Firstly, we introduce a global evolution analysis in the scale-sets framework, which provides clues for eliminating less informative branches. Moreover, a hybrid unsupervised simplification method is designed, utilizing the information from global and local evolution functions. A number of experiments on various images have shown that the proposed approach is effective and efficient in removing less informative nodes (averagely about 90% of the whole nodes), while preserving salient image details and retaining the accuracy.
[14] Haris K, Efstratiadis S N, Maglaveras N, et al.

Hybrid image segmentation using watersheds and fast region merging

[J]. IEEE Transactions on Image Processing, 1998,7(12):1684-1699.

https://doi.org/10.1109/83.730380      URL      PMID: 18276235      [本文引用: 1]      摘要

A hybrid multidimensional image segmentation algorithm is proposed, which combines edge and region-based techniques through the morphological algorithm of watersheds. An edge-preserving statistical noise reduction approach is used as a preprocessing stage in order to compute an accurate estimate of the image gradient. Then, an initial partitioning of the image into primitive regions is produced by applying the watershed transform on the image gradient magnitude. This initial segmentation is the input to a computationally efficient hierarchical (bottom-up) region merging process that produces the final segmentation. The latter process uses the region adjacency graph (RAG) representation of the image regions. At each step, the most similar pair of regions is determined (minimum cost RAG edge), the regions are merged and the RAG is updated. Traditionally, the above is implemented by storing all RAG edges in a priority queue. We propose a significantly faster algorithm, which additionally maintains the so-called nearest neighbor graph, due to which the priority queue size and processing time are drastically reduced. The final segmentation provides, due to the RAG, one-pixel wide, closed, and accurately localized contours/surfaces. Experimental results obtained with two-dimensional/three-dimensional (2-D/3-D) magnetic resonance images are presented
[15] Ojala T, Pietikainen M, Maenpaa T.

Multiresolution gray-scale and rotation invariant texture classification with local binary patterns

[J]. IEEE Trans Pattern Anal Mach Intell, 2002,7(24):971-987.

[本文引用: 4]     

[16] Calderero F, Marques F.

Region merging techniques using information theory statistical measures

[J]. IEEE Transactions on Image Processing, 2010,19(6):1567-1586.

https://doi.org/10.1109/TIP.2010.2043008      URL      PMID: 20215082      [本文引用: 1]      摘要

Abstract The purpose of the current work is to propose, under a statistical framework, a family of unsupervised region merging techniques providing a set of the most relevant region-based explanations of an image at different levels of analysis. These techniques are characterized by general and nonparametric region models, with neither color nor texture homogeneity assumptions, and a set of innovative merging criteria, based on information theory statistical measures. The scale consistency of the partitions is assured through i) a size regularization term into the merging criteria and a classical merging order, or ii) using a novel scale-based merging order to avoid the region size homogeneity imposed by the use of a size regularization term. Moreover, a partition significance index is defined to automatically determine the subset of most representative partitions from the created hierarchy. Most significant automatically extracted partitions show the ability to represent the semantic content of the image from a human point of view. Finally, a complete and exhaustive evaluation of the proposed techniques is performed, using not only different databases for the two main addressed problems (object-oriented segmentation of generic images and texture image segmentation), but also specific evaluation features in each case: under- and oversegmentation error, and a large set of region-based, pixel-based and error consistency indicators, respectively. Results are promising, outperforming in most indicators both object-oriented and texture state-of-the-art segmentation techniques.
[17] Li H, Gu H, Han Y, et al.

An efficient multiscale SRMMHR (Statistical Region Merging and Minimum Heterogeneity Rule) segmentation method for high-resolution remote sensing imagery

[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2009,2(2):67-73.

https://doi.org/10.1109/JSTARS.2009.2022047      URL      [本文引用: 1]     

[18] 巫兆聪,胡忠文,张谦,.

结合光谱、纹理与形状结构信息的遥感影像分割方法

[J].测绘学报,2013,42(1):44-50.

URL      Magsci      [本文引用: 2]      摘要

针对目前遥感影像分割中多特征利用的问题,提出一种综合利用光谱、纹理与形状信息的分割方法。该方法在进行初始分割的基础上,统计区域的光谱和LBP纹理特征;然后依据光谱、纹理与形状特征计算相邻区域之间的异质性,并以此为基础构建区域邻接图(region adjacency graph,RAG);最后在邻接图的基础上采用逐步迭代优化算法进行区域合并获取最终分割结果。采用QuickBird和SAR影像的分割试验,证明该算法能充分利用影像中地物的光谱、纹理与形状信息,分割效果良好,效率高。

[ Wu Z C, Hu Z W, Zhang Q, et al.

On combining spectral, textural and shape features for remote sensing image segmentation

[J]. Acta Geodaetica et Cartographica Sinica, 2013,42(1):44-50. ]

URL      Magsci      [本文引用: 2]      摘要

针对目前遥感影像分割中多特征利用的问题,提出一种综合利用光谱、纹理与形状信息的分割方法。该方法在进行初始分割的基础上,统计区域的光谱和LBP纹理特征;然后依据光谱、纹理与形状特征计算相邻区域之间的异质性,并以此为基础构建区域邻接图(region adjacency graph,RAG);最后在邻接图的基础上采用逐步迭代优化算法进行区域合并获取最终分割结果。采用QuickBird和SAR影像的分割试验,证明该算法能充分利用影像中地物的光谱、纹理与形状信息,分割效果良好,效率高。
[19] Lucian Drǎguţ, Dirk Tiede, Shaun R.

Levick. ESP: A tool to estimate scale parameter for multiresolution image segmentation of remotely sensed data

[J]. International Journal of Geographical Information Science, 2010,24(6):859-871.

https://doi.org/10.1080/13658810903174803      URL     

[20] Lu H, Woods J C, Ghanbari M.

Binary partition tree analysis based on region evolution and its application to tree simplification

[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2007,16(4):1131-1138.

https://doi.org/10.1109/TIP.2007.891802      URL      [本文引用: 1]     

[21] Moran P A P.

Notes on continuous stochastic phenomena

[J]. Biometrika, 1950,37(1-2):17-23.

https://doi.org/10.2307/2332142      URL      PMID: 15420245      [本文引用: 1]      摘要

Biometrika. 1950 Jun;37(1-2):17-23.

/