Extracting Canopy Four Geometric-optical Components by Incorporating Illumination Information into a Multi-scale K-means Cluster Method

  • FENG Yaowei , 1 ,
  • QU Yonghua , 1, 2, *
Expand
  • 1. Faculty of Geographical Science, Beijing Normal University, State Key Laboratory of Remote Sensing Science, Beijing Normal University, Beijing 100875, China
  • 2. Beijing Engineering Research Center for Global Land Remote Sensing Products,Institute of Remote Sensing Science and Engineering,Faculty of Geographical Science,Beijing Normal University,Beijing 100875, China
*QU Yonghua, E-mail:

Received date: 2022-06-28

  Revised date: 2022-08-17

  Online published: 2023-04-27

Supported by

National Natural Science Foundation of China(42192580)

National Natural Science Foundation of China(42192581)

Abstract

The vegetation and soil fraction in the sensor's field of viewing will be varied with different light and observation geometry, and such variation can be used by the remote sensing geometric-optical model to simulate canopy multi-angle reflectance. As a result, the four components, i.e., lit and shaded vegetation, as well as lit and shaded soil are important input parameters for the geometric-optical model. In this paper, an algorithm for extracting the four geometric-optical components with the combination of solar illumination information and multi-scale clusters derived from a k-means process was proposed. Firstly, the clustering space was formed by synthesizing a new color index, then the multi-scale image hierarchical model was constructed by using the lit and shaded component in the subgraphs of the images respectively, and then the k-means clustering was performed in the multi-scale image hierarchical model to obtain the vegetation component and soil component results. Finally, the obtained results in the above subgraphs were combined as the output to achieve the extraction of four geometric-optical components. Validation on the proposed method was conducted on fifty-two vegetation canopy images which were acquired under natural lighting conditions. We compared our results with those of OTSU threshold on ultra-green index, Fisher linear algorithm, and SHAR-LABFVC algorithm. The results showed that the proposed algorithm performed well in mapping accuracy and user accuracy in the classification of shaded components, and the highest Kappa coefficient (0.82) was achieved. Good and stable classification results were observed under the conditions of continuous changing canopy cover and solar altitude angle, and this promising result suggests that the proposed method has the potential in long-term vegetation monitoring as well as measuring vegetation four-component changes even in a single day. The advantages of this algorithm are to improve the classification accuracy of the shadow component and to solve the extraction problem of the four components under high vegetation coverage. However, reducing computational cost and thus to improve the applicability of this algorithm in complex scenes will need further efforts in the future work.

Cite this article

FENG Yaowei , QU Yonghua . Extracting Canopy Four Geometric-optical Components by Incorporating Illumination Information into a Multi-scale K-means Cluster Method[J]. Journal of Geo-information Science, 2023 , 25(5) : 1037 -1049 . DOI: 10.12082/dqxxkx.2023.220452

1 引言

遥感几何光学模型的核心是利用传感器视场内植被、土壤的光照与阴影比例结合光照与观测几何来模拟植被冠层多角度反射率[1]。植被、土壤、光照、阴影四个分量的组合构成了几何光学四分量,即光照植被、阴影植被、光照土壤、阴影土壤。除了机载与星载传感器以外[2-3],基于近地遥感观测平台的数字相机日益成为一种快速准确地提取植被冠层信息的观测手段,如Qu等[4]利用不同太阳高度角照射下所获得的数字图像的植被几何光学四分量信息实现了叶面积指数(Leaf Area Index, LAI)与叶倾角分布(Leaf Angle Distribution, LAD)的反演。现有数字相机植被监测应用均依赖于对图像中植被冠层、下垫面(土壤)在不同光照条件下的提取精度[5]。通过对冠层图像进行分类并得到准确的四分量信息是植被分析的第一步,决定了后续植被信息处理与反演的效果。
然而,自然条件下植被图像受光照角度、光照强度、土壤条件变化等多种因素影响,常常出现冠层颜色特征在一天内变化较大、植被冠层与土壤颜色特征分布不均等情况,为图像四分量的提取增加了困难。虽然有研究者指出应避免在强烈的阳光下拍照以弱化部分自然因素(光照)对植被分类的影响[6],但是,这种拍摄方式会使得图像失去四分量信息。而在自然光照条件下,多个时间连续观测的植被图像能够计算四分量比例与太阳高度角变化关系,利用这种变化关系,可以进一步推算植被的冠层结构参数,尤其是在植被冠层浓密的情况下,使用光照和阴影叶分数可以提供更多(结构)信息[7]
国内外学者对自然光照条件下植被冠层的分类问题进行了大量研究,现有的冠层分类算法主要分为监督分类和非监督分类两种。在监督算法的研究中,Zheng等[8]提出基于均值漂移的Fisher线性判别算法(MS-FLD),实现了植被冠层与土壤的分类。该算法运算效率高,分类准确率平均可达97%,但MS-FLD算法基于点-线-距离的加权策略仅适用于目标在颜色空间沿近似直线分布的分类。高泽宾等[5]基于卷积神经网络和阈值法实现了四分量的有效提取,但深度学习算法需要一定数量的训练数据,这将耗费大量的时间,并且当面对其他植被类型的数据时,需要扩充训练数据集。这种迁移性能的缺陷使得其无法发挥数字相机灵活布局,广泛应用的优势。
在非监督算法的研究中,Liu等[9]利用高斯模型在CIEL*a*b*颜色空间中自动寻找最优阈值,从而实现植被像元与土壤像元的分类。自动阈值法算法简单、运算速度快且对多种植被分类均有较好的效果,但是也存在着抗干扰性差,自然光照条件下分类效果不稳定等缺陷。李凯等[10]基于K均值算法与粒子群优化算法并结合特征空间的选择,实现了自然光照条件下棉花叶片的有效提取,为解决复杂土壤背景与光照条件下冠层的分类问题提供了思路,但该算法在处理高分辨率图像时,计算代价较大,误差增加。原因是图像的像元数目较大时,K均值算法需要进行更多次迭代运算,导致误差增大且严重影响算法性能。Li等[11]对比了21种作物分类算法,指出聚类算法具有准确率高但运算时间长的特点。而对于聚类空间的选择问题,Liu等[9]试验了多种颜色空间模型,得出选择合适的颜色空间可以有效提高分类算法准确性的结论。
综上所述,选择合适的颜色特征空间,并通过对原始图像进行多尺度分割处理,实现一种新的高效率K均值算法,将会克服自然条件下图像异质性大、像元数目较大时K均值算法误差和计算代价增大的问题,有望得到较好的四分量分类结果。在本文的研究中,提出了一种结合光照分量的多尺度K-均值植被几何光学四分量提取算法(Multi-scale K-means algorithm combined with illumination component,MSI-Kmeans)。使用MSI-Kmeans算法对自然光照条件下获取的玉米冠层图像进行了四分量提取,并与3种现有经典算法提取的四分量结果进行了对比分析,评估了MSI-Kmeans算法应用于长期植被监测和单日内连续监测植被四分量变化的能力,并提出了未来MSI-Kmeans算法的改进方向。

2 实验区概况与数据来源

本文的实验数据来源于两部分,如图1(a)所示,一部分来自中国科学院西北生态环境资源研究院在甘肃张掖的黑河遥感试验站(38°49'N,100°28' E)。黑河遥感试验站地处中国第二大内陆河黑河流域中游,气候类型为典型的温带大陆性气候,是我国干旱区内陆河流域的典型代表区域[12]。试验区地表类型主要包括玉米、居民区、蔬菜和果园等[13]。实验所使用的图像观测数据由无线网络传感器(Wireless Sensor Network, WSN)系统获得[5],系统结构如图1(b)所示。该系统由成像系统(CCD system)、图像采集与网络传输系统(Collector and GPRS System,C&G)以及图像接收系统(Receiver System)3部分组成。成像系统为包含R、G、B 3个通道的720×1280光学成像传感器,成像时相机白平衡和快门速度、曝光参数均采取自动模式。在工作时,网络传输系统能够实时接收成像系统的数据,实现图像定时采集并上传至网络服务器,而部署在服务器端的图像接收系统负责接收上传的数字图像并按照采集时间顺序储存。
图1 试验区区位与数据采集系统

Fig. 1 Research area and data collecting system

另一部分实验数据来自如图1(c)所示的北京师范大学,我们在校园内选择了7处采样地点进行植被图像获取,共获得了36幅植被图像,所获取图像中的植被类型包括玉簪、南瓜叶、辣椒叶、草等;背景类型包括干燥土壤、潮湿土壤以及枯黄的杂草等,地物类型较为丰富。在实验过程中,我们使用智能手机的相机传感器进行观测,传感器始终保持垂直向下,距离植物顶部约1.5 m,实验选择在阳光直射条件下进行,以验证算法对植被几何光学四分量的提取能力。
黑河遥感试验站图像采集日期为2020年5月27日—8月27日,这期间植被的覆盖率从0增长到0.8左右,覆盖了玉米从发芽期到成熟期的整个生长过程。观测过程中传感器始终保持垂直向下,距离地面约3 m。为了验证本算法对光照的敏感性,从所有图像中选择直射光光照条件良好,太阳高度角变化较大的图像作为研究对象,最终选出16 幅图像进行实验。
验证算法的真值数据来自人工目视解译结果。利用Photoshop软件对2个试验区所获得的共52幅数字图像分别进行手工勾画边界,然后提取四分量并填充不同的颜色。以目视解译得到的四分量作为真值,并以此为标准计算各分类算法精度。目视解译分类结果的示例如图2所示,其中 图2(a)为数字相机获得的一幅原始图像,图2(b)展示了对该图像进行人工目视解译的四分量结果。
图2 原始图像及目视解译结果示例

Fig. 2 The examples of raw images and visual interpretation results

3 研究方法

本文提出的MSI-Kmeans算法属于半监督分类算法,其核心理论基础为K-均值聚类算法。概括来说,首先用HSV颜色模型中的V通道值作为分类依据,将数字图像中所有像元分为光照与阴影两个分量,然后分别在光照和阴影子图中运行改进的K-均值聚类算法,得到每个子图中的植被与土壤分量,最后将以上分类结果组合输出得到整体图像的四分量分类结果。
在上述流程中,我们的主要工作是对现有K-均值算法进行改进,形成了多尺度K-均值算法(MSI-Kmeans)。MSI-Kmeans主要由聚类空间的选择和多尺度图像分层模型2个过程组成。在聚类空间选择环节,主要目标是找到能够有效表征冠层绿色信息、具有较强抗干扰能力的冠层特征指数[14-15]。在多尺度图像分层环节中,通过对原始图像不断地进行均匀四分割产生独立区块,根据分割的次数确定区块所在的层数,然后对每一层的区块进行升尺度处理得到多尺度图像分层模型。这样对原始图像进行多个层次分割,随着各计算单元尺度不断减小,使得单元内的光照条件更加相近,植被与土壤的颜色特征指数分布更均匀,从而提高K-均值聚类的效果。上述算法的流程图如图3所示。
图3 MSI-Kmeans算法流程

Fig. 3 The flow chart of MSI-Kmeans algorithm

3.1 光照分量与阴影分量分类

在一幅完整植被数字影像中,区分光照与阴影像元大多使用自动阈值法,其中OTSU算法曾被广泛应用于植被冠层信息的分类[16]。OTSU算法通过类间方差最大原则来确定图像前景与背景的分类阈值。但是,当图像前景与背景面积相差悬殊时,类间方差准则函数会出现双峰或者多峰,从而导致阈值向面积较小的一方移动[17-18]。因此,使用OTSU算法时,需要选择合适的分类特征,保证基于该特征的类间方差为单峰且目标与背景面积比例无非常悬殊的差别。已有研究表明[14],在自然光照条件下,植被冠层的光照分量与阴影分量在HSV颜色模型中V通道的类间方差呈现明显的双峰分布,并且由于植被具有立体冠层结构,数字图像中难以出现光照分量与阴影分量比例悬殊的情况。因此本文使用OTSU算法对图像经HSV变换后的V通道进行自动阈值分类,实现对原始图像的二分量提取,即光照分量(包括光照植被、光照土壤的集合)与阴影分量(包括阴影植被、阴影土壤的集合)的快速分类。

3.2 植被分量与土壤分量分类

在3.1节的分类结束以后,光照与阴影分量中既包括植被像元,又包括土壤像元,因此,需要分别在光照和阴影像元中对植被与土壤进行分离。在这个过程中,采用了改进的K-均值算法。该算法在传统的K-均值聚类基础上,选择合适的颜色指数构成聚类空间并构建多尺度图像分层模型,最后在选定的聚类空间中进行多尺度K-均值聚类分析从而实现植被与土壤的分类。

3.2.1 K-均值聚类

K-均值聚类算法是一种通过计算每个样本点与其聚类中心的几何距离,并不断改变聚类中心使得聚类结果的类间差异最大而类内差异最小的聚类方法[19]。该聚类方法基于“物以类聚”的思想,认为在同一类中的对象往往比不在同一类中的对象具有更高的相似性。K-均值聚类算法首先随机选取数据集中 k个样本点作为聚类中心,再计算每个样本点到 k个聚类中心的距离,并将样本点分配给距离最近的聚类中心,形成 k个簇。然后计算每个簇中样本的平均值作为新的聚类中心,如此循环直到聚类中心不再显著移动,得到最后的聚类结果。
为了解决K-均值聚类中常见的“均匀效应”[20],即当不同类别像元个数相差较为悬殊时,较大类中部分靠近小类中心的像元会被“均匀”到小类中,造成各类像元的强行均匀化,实验中对第一层的区块处理采用多中心策略,即不预设聚类中心的数目,通过式(1)计算CH(Calinski-Harabaz)指数的最大值来确定最佳分类簇数:
C H k = t r ( B k ) t r ( W k ) m - k k - 1
式中: m为训练集样本数; k为分类簇数; B k为聚类间的协方差矩阵; W k为聚类内部数据的协方差矩阵; t r为矩阵的迹。

3.2.2 选择聚类空间

对图像进行K-均值聚类时,首先要选择合适的颜色指数构成聚类空间,再将图像的像元值(包含R、G、B 3个分量)投影到聚类空间中进行聚类运算。因此,选择可以有效表征冠层绿度信息并能够抵抗复杂光照干扰的特征指数变得尤为重要。
超绿特征指数(Excess Green Index, EXG)是一种广泛应用于植被冠层分类的颜色指数,如公式(2)所示,通过赋予R、G、B通道不同的系数,增强图像中绿色通道的权重[21],从而将图像中的植被(绿色)与土壤(非绿色)像元分离。
E X G = 2 × G - R - B
式中:RGB分别为数字图像中红色、绿色、蓝色3个通道的值。
但是,当图像背景复杂时,使用超绿特征指数的分类效果往往不佳[11]。基于改变不同颜色通道权重的思路,Kataoka T等[22]提出了植被提取颜色指数CIVE(Color Index of Vegetation Extraction),计算过程如式(3)所示。
C I V E = 0.441 × R - 0.811 × G + 0.385 × B + 18.78745
式中:RGB分别为数字图像中红色、绿色、蓝色3个通道的值。
Kataoka等[22]研究发现,CIVE颜色指数具有良好的植被冠层分类效果。Li等[11]对比了21种冠层分类方法,结果表明基于CIVE颜色指数的算法在多种背景条件下都能取得良好的分类结果。但是,CIVE颜色指数在多云、阴暗或高亮的图像中分类结果表现不稳定。
为了解决复杂光照干扰所造成的颜色指数“失灵”问题,Bai等[23]试验了一种基于CIEL*a*b*颜色空间并结合形态学建模的作物分类方法,证明基于CIEL*a*b*颜色空间的冠层分类方法在野外复杂光照环境下具有较高的鲁棒性。CIEL*a*b*颜色空间是由国际照明协会提出的一种色彩模式标准,CIEL*a*b*颜色空间中L*代表亮度分量,a*代表红绿轴上的颜色分量(100为红色,-80为绿色),b*代表黄蓝轴的颜色分量(100为黄色,-80为蓝色)。本文所选的图像中,植被分量多为绿色(a*轴取值近 -80,b*轴取值近30),土壤分量多为黄棕色(a*轴取值近10,b*轴取值近60),b*-a*代表了像元绿色信息与黄色信息的差值,b*-a*的值越大,像元的颜色特征越接近植被分量,反之越接近于土壤分量。
综上所述,每一种颜色指数都有其特定的优势,并不存在某种颜色指数可以在任何条件下都表现良好。一般来说,基于单一颜色指数的阈值分类方法难以得到稳定的结果,在光线过强或者光线较差时,它们都不能很好地进行分类[8]。因为当单独使用某个颜色指数时,这些指标可能会产生过度分割或分割不足,而综合使用颜色指数则可以有效克服这一缺陷[24]
因此本文采用能够有效表征冠层绿度信息的EXG颜色指数、能够抵抗复杂背景影响的CIVE颜色指数以及在复杂光照条件下具有较高鲁棒性的b*-a*颜色指数,构成三维聚类空间,通过综合利用这些颜色指数弥补单个颜色指数的缺陷,实现优势互补。图4(a)展示了在图2(a)所示的原始图像中随机选取了四分量要素各30个像元在RGB空间中的位置分布,图4(b)展示了这些像元投影到三维聚类空间中的分布情况。通过对比图4(a)图4(b)可以看到,投影到三维聚类空间中后,图像中四分量像元的可分性更好。
图4 四分量要素在RGB空间与特征空间中的投影

Fig. 4 The projection of four component elements in RGB space and feature space

3.2.3 构建多尺度图像分层模型

多尺度图像分层模型通过逐层分割的方法保证最终分割单元内的光照条件和属于相同分量的像元颜色特征相对均一。为了在节省计算资源的同时尽量保留运算单元内不同分量之间的图像异质信息,本文对逐层分割所得的区块采用最近邻法进行升尺度处理,得到的多尺度图像分层模型如 图5所示。
图5 多尺度图像分层模型

Fig. 5 Multi-scale image hierarchical model

具体运算过程如下,首先在多尺度图像模型的第一层对光照分量进行聚类运算,得到每个区块的最佳聚类结果,然后计算各个区块聚类结果的不均匀度,若不均匀度高于预设值,说明该区块中环境条件变化较大,此聚类结果并不可靠,需要将该区块继续分割,即进入下一层图像模型的运算,直到区块内聚类结果的不均匀度小于预设值或者分割层数达到4层(设定最大分类层数为了减小计算代价,避免无意义的过度分层计算)。对光照分量的计算结束后,按照相同的方法对阴影分量进行处理,最后将计算结果组合输出,得到完整的图像四分量分类结果。
在多尺度图像分层模型中,理论上层数越高,单个聚类空间(区块)的尺度越小,其所包含的图像信息就越少,聚类结果就会更加均匀。我们使用公式(4)计算不均匀性指数NI(Nonuniformity Index),对聚类结果的不均匀度进行评价,并作为是否进入下一层运算的指标。
N I = x i C k x j C k | | x i - x j | | 2 / ( n k ( n k - 1 ) )
式中: x i x j为二次分类后类别 k的聚类中心; C k为二次分类得到聚类中心的集合; n k为类别中聚类中心的数量。
如果区块的不均匀度小于预设值,或者所属层数达到4层,则对其多中心的聚类结果实行预设值加近邻融合的方法进行二次分类,将结果划分为植被或土壤两类像元。预设值是通过对目视解译图像的几何光学四分量像元提取EXG、b*-a*、CIVE信息来确定。基于正态分布的拉依达准则[25],将各个特征指数的信息分别按照平均值加减三倍标准差的方法逐步剔除异常值,再以剩余像元信息的平均值加减三倍标准差作为预设值的上下限。对位于预设值上下限区间内的聚类中心可直接进行二次分类,对处于区间外或者重叠区间内的聚类中心,采用计算最小欧式距离的方法进行二次分类。最后,将光照与阴影分量中分别经过二次分类得到的植被与土壤像元组合输出,得到完整的植被几何光学四分量结果。
理论上分割后的子图像会对原图像的分类特征具有一定继承性。因此,为使K-均值聚类中心快速收敛,达到节省计算代价的目的,MSI-Kmeans算法将上一层的聚类中心作为下一层图像的初始聚类中心,以此类推直到算法规定的最大层数。

3.3 精度评价指标

为评价本算法在自然光照条件下对四分量的分类性能,使用图像的目视解译四分量结果作为评价基准,对算法分类结果的制图精度、用户精度以及Kappa系数进行评价。制图精度指像元真实属于某一类别,分类器能将像元归为这一类别的概率。制图精度越高,说明该分类方法对于该类别分类效果越好。用户精度指分类器将像元归为某一类别时相应的真实类别是这一类别的概率,用户精度越高,则说明该分类结果的可信度越高。最后使用Kappa系数对分类算法进行综合评价, Kappa系数计算公式如式(5)所示。
K a p p a = P o - P e 1 - P e
式中: P o是每一类正确分类的样本数量之和除以总样本数; P e的计算公式如式(6)所示。
P e = i k ( x i × y i ) n × n
式中: x i y i分别为 i类的实际像元个数与分类器预测像元个数; k为类的数目; n为总像元数。
本次实验比较了基于超绿指数的OTSU阈值分类(OTSU-EXG)算法、Fisher线性判别算法[8]、SHAR-LABFVC算法[26]以及MSI-Kmeans算法的分类结果。其中OTSU-EXG算法是一种应用广泛的植被提取非监督分类算法,通过计算EXG颜色指数并应用OTSU算法实现植被与土壤的分类;Fisher线性判别算法为监督分类算法,通过使用主成分分析法进行降维并使各类样本的投影轴之间距离尽可能远从而实现四分量的分类;SHAR-LABFVC算法是一种专门为区分植被和土壤而设计的分类算法,通过引入色相饱和度(Hue Saturation Intensity, HSI)来增强图像阴影部分的亮度,使其能够在植被覆盖率较高、阴影较深的情况下,获得良好的植被与土壤分类结果。

4 结果及分析

4.1 四分量分类精度对比

依据前文的评价指标,对4种算法的四分量结果进行定量评价。表1列出了4种算法对52幅图像进行四分量分类所得的平均制图精度,平均用户精度和Kappa系数,并绘制了如图6(a)图6(b)所示的柱状图。综合评价指标Kappa系数0.00~0.20表示算法分类效果差、0.21~0.40表示分类效果较差、0.41~0.60表示分类效果中等、0.61~0.80表示分类效果较好、0.81~1.00表示分类效果好。
表1 4种分类方法的分类结果精度评价

Tab. 1 Accuracy assessment of four classification results

制图精度 用户精度 综合评价指标
lv STD ls STD dv STD ds STD lv sTD ls sTD dv sTD ds sTD Kappa系数 STD
OTSU-EXG 0.98 0.03 0.58 0.05 0.91 0.07 0.42 0.11 0.15 0.23 0.99 0.02 0.32 0.16 0.95 0.03 0.53 0.12
SHAR-LABFVC 0.76 0.22 0.89 0.07 0.53 0.23 0.83 0.13 0.38 0.27 0.98 0.11 0.54 0.17 0.85 0.12 0.70 0.10
Fishcr 0.36 0.15 0.77 0.08 0.27 0.22 0.63 0.15 0.23 0.23 0.84 0.16 0.14 0.06 0.69 0.12 0.48 0.07
MSI-Kmeans 0.82 0.2 0.8 0.06 0.84 0.11 0.73 0.04 0.82 0.11 0.85 0.04 0.77 0.05 0.84 0.07 0.82 0.08

注:lv、ls、dv、ds分别为光照植被、光照土壤、阴影植被、阴影土壤; STD为标准偏差。

图6 不同算法分类结果精度对比

Fig. 6 The comparison of the results of the four algorithms accuracy

结果表明,MSI-Kmeans算法对四分量的分类结果均具有较高的制图精度与用户精度,除了阴影土壤的制图精度和阴影植被的用户精度大于0.7(分别为0.73和0.77),其余光学分量的制图精度与用户精度均大于0.8,说明MSI-Kmeans算法对四分量的分类均具有良好的分类精度与可信度,Kappa系数为0.82,综合分类效果好。图7展示了不同算法四分量分类结果的示例。
图7 不同算法四分量分类结果示例

Fig. 7 The examples of four component classification results of different algorithms

OTSU-EXG算法在光照植被与阴影植被的分类结果中表现出较高的制图精度(分别为0.98与0.91),说明该分类方法对植被分量进行了较为正确的分类,但是用户精度低(分别为0.15与0.32),说明该分类结果的可信度较低。图7(c)中OTSU-EXG算法将大量的光照土壤像元错分为光照植被,将大量阴影土壤像元错分为阴影植被,验证了其制图精度高、用户精度低的评价。OTSU-EXG算法综合评价指标Kappa系数为0.53,表明该算法分类效果中等。这是由于在自然光照条件下,图像中的植被与土壤像元难以形成适用于阈值分割的双峰结构,而往往表现为更为复杂的分布形式。
SHAR-LABFVC算法四分量结果在光照土壤和阴影土壤的分类中表现出较高的制图精度(0.89和0.83)与用户精度(0.98和0.85),说明其对于光照土壤和阴影土壤的分类结果相对可靠,Kappa系数为0.70,分类结果较好。其分类效果好于同为阈值分割法的OTSU-EXG算法,这可能是由于其引入色相饱和度(HSI)对阴影部分进行了增强,提高了阴影分量的分类效果。但是从图7(d)SHAR-LABFVC算法分类结果示例中可以看到,仍然存在将光照植被错分为光照土壤的现象。
Fisher线性判别算法在光照和阴影植被的分类结果中表现出较低的制图精度(分别为0.36与0.27)和较低的用户精度(分别为0.23与0.14),从 图7(e)可知,大量光照土壤像元被错分为光照植被,Kappa系数为0.48,分类效果中等。这是由于自然光照条件下光照的复杂变化使得四分量很少严格遵守近似线性分布,故难以达到理想的分类精度。
综上所述,MSI-Kmeans算法对于单幅图像中四分量分类结果的综合评价指标Kappa系数最高,分类效果最好。

4.2 时间序列观测结果对比

在植被生长监测以及遥感产品验证中,往往需要长时间序列的地面观测数据。为了探究MSI-Kmeans算法应用于长期植被监测的能力,模拟植被生长过程中冠层覆盖度从低到高的变化情况,将4种算法在不同冠层覆盖度下图像分类结果的Kappa系数进行对比并绘制了如图8所示的折线图。
图8 不同覆盖度下Kappa系数变化

Fig. 8 The Kappa coefficient variation diagram under different coverage

图8可知,基于传统阈值分类法的OTSU-EXG算法,其分类效果随着冠层覆盖度升高而不断下降; SHAR-LABFVC算法的分类效果则在高冠层覆盖度下表现出了Kappa系数的大幅变化;Fisher线性判别算法的分类效果虽然在高冠层覆盖度下有所上升,但整体分类效果较差;而MSI-Kmeans算法则可以在高冠层覆盖度下仍然保持较好的分类效果,其分类结果Kappa系数可以保持在0.7以上。
进一步验证了在太阳高度角连续变化的情况下,MSI-Kmeans算法可以有效提取植被四分量信息。为了较为直观地反映四分量变化情况,作为示例,选取了2020年6月28日9:30 — 17:30共9幅图像(覆盖度≈0.6)进行四分量提取并绘制了如图9所示的散点图。从散点图及拟合曲线可知,光照植被的占比随时间的推移先增大后减小,阴影植被的变化则相反,这与Qu等[4]所测量的四分量随太阳天顶角变化而变化的趋势一致。而光照土壤与阴影土壤分量则由于冠层立体结构的遮蔽,其变化表现为双峰的形式。以上的四分量变化又以植被和土壤分量区分,两两之间(光照植被和阴影植被、光照土壤和阴影土壤)表现出较高的对称性。说明MSI-Kmeans算法能够为单日内的四分量连续变化提供分类支持。
图9 单日内植被四分量变化

Fig. 9 The change of four component changes of vegetation in one day

5 讨论

5.1 长时序观测下算法的稳定性

在长时序观测实验中,植被覆盖度的连续变化对算法提取四分量的稳定性提出了更高的要求,如高覆盖度意味着植被具有复杂的冠层结构,在自然光照下容易造成所摄图像的光照不均匀。在图8所示的不同算法在长时序观测的分类效果比较中,OTSU-EXG算法提取四分量的效果随冠层覆盖度升高而不断下降,表明基于阈值分割的四分量提取算法难以应用于完整的时间序列[27];SHAR-LABFVC算法虽能够准确提取四分量,但复杂的冠层结构限制了其在植被具有高覆盖度下的分类稳定性。
MSI-Kmeans算法通过构建的多尺度图像分层模型将每一次聚类处理的范围局限于一个较为稳定的区块内,以克服噪声和光照条件变化所引起的灰度分布不均匀现象[28],保持局部结构的稳定性,最终分类结果表明MSI-Kmeans算法能够在高冠层覆盖度下保持较好的分类效果,即分类结果的Kappa系数均保持在0.7以上。

5.2 MSI-Kmeans算法改进方向

虽然MSI-Kmeans算法在自然光照条件下具有较好的四分量分类性能,但是从图7(b)中可以看到,MSI-Kmeans算法在图像中存在较大干扰斑块的情况下会出现一定程度的分类误差。造成该误差的主要原因可以从以下2个方面解释。①是由于自然条件下镜头污损所产生的图像模糊斑块,这些斑块在冠层覆盖度较高时折射冠层反射光从而表现出与冠层相近的颜色特征。这一影响在长期自然条件下的观测图像中难以避免。②是构建多尺度图像分层模型时升尺度运算导致部分细节信息被忽略,使得聚类单元内不均匀性相比实际偏低而无法进入下一层运算,例如空间一致性较好的模糊斑块经过升尺度处理后会被判断为均匀的某一类像元并输出。
针对MSI-Kmeans算法存在的问题,可以从以下几个方面进行改进: ①是选取对植被几何光学四分量敏感性更高的颜色指数,减小图像阴影分量特征提取的难度[29]。 ②是进一步改进升尺度算法,如结合小波变换[30]等图像变换方法,使多尺度图像分层模型可以保留更多的异质信息。此外,对于相机参数的合理设定将有效提高所采集图像的质量,减小后续处理的难度。或者使用图像增强算法如Retinex算法[31]和HDR技术[32]对图像进行增强,提高自然光照条件下的四分量分类精度。

6 结论

本文实现了一种多尺度K-均值植被几何光学四分量提取算法(MSI-Kmeans算法),该算法通过构建多尺度的图像分层模型并分别对光照与阴影分量进行聚类从而得到植被几何光学四分量。本文通过对比MSI-Kmeans算法、基于超绿指数的OTSU阈值分类算法、Fisher线性判别算法以及SHAR-LABFVC算法对52幅图像的分类结果来评价算法的分类性能。主要结论为:
(1)MSI-Kmeans算法通过综合利用颜色指数构成三维聚类空间并在聚类空间中进行聚类分析,能够克服单一颜色指数下分类效果不稳定的缺陷;通过构建多尺度图像分层模型克服了自然光照条件下数字图像中灰度分布不均匀的现象,保持了局部结构的稳定性。最终使得MSI-Kmeans算法提取四分量的结果表现出良好的制图精度与用户精度,尤其在阴影分量(阴影植被、阴影土壤)的分类中,分类精度高,分类结果稳定,综合评价指标Kappa系数达到0.82。
(2)MSI-Kmeans算法在不同冠层覆盖度下均可得到稳定的分类结果,对于太阳高度角连续变化条件下的图像四分量提取结果与实际变化相吻合,说明其具有应用于长期植被监测和单日内连续监测植被四分量变化的能力。
本文提出的MSI-Kmeans算法还存在一些不足,如对高分辨率图像处理需耗费大量时间,当图像中存在明显干扰项时分类精度有所下降。未来将持续优化算法的运算效率,开发基于多角度、高时间分辨率的地面植被监测系统的图像分类算法,以提高数字相机地面监测系统的通用性。
[1]
Li X W, Strahler A H. Geometric-optical bidirectional reflectance modeling of the discrete crown vegetation canopy: Effect of crown shape and mutual shadowing[J]. IEEE Transactions on Geoscience and Remote Sensing, 1992, 24(6):906-919. DOI:10.1109/36.134078

DOI

[2]
Cao C, Bao Y, Xu M, et al. Retrieval of forest canopy attributes based on a geometric-optical model using airborne LiDAR and optical remote-sensing data[J]. International Journal of Remote Sensing, 2011, 33(3):692-709. DOI:10.1080/01431161.2011.577830

DOI

[3]
王聪, 杜华强, 周国模, 等. 基于几何光学模型的毛竹林郁闭度无人机遥感定量反演[J]. 应用生态学报, 2015, 26(5):1501-1509.

[ Wang C, Du H Q, Zhou G M, et al. Retrieval of crown closure of moso bamboo forest using Unmanned Aerial Vehicle (UAV) remotely sensed imagery based on geometric-optical model[J]. Chinese Journal of Applied Ecology, 2015, 26(5):1501-1509. ] DOI:10.1328 7/j.1001-9332.20150302.001

DOI

[4]
Qu Y H, Gao Z B, Shang J, et al. Simultaneous measurements of corn leaf area index and mean tilt angle from multi-directional sunlit and shaded fractions using downward-looking photography[J]. Computers and Electronics in Agriculture, 2021, 180:105881. DOI:10.1016/j.compag.2020.105881

DOI

[5]
高泽宾, 屈永华. 自然光照条件下植被几何光学四分量的提取算法[J]. 中国图象图形学报, 2019, 24(10):1790-1800.

[ Gao Z B, Qu Y H. Algorithm for classifying four geometric-optical components from images in natural illumination conditions[J]. Journal of Image and Graphics, 2019, 24(10):1790-1800. ] DOI:10.11834/jig.180694

DOI

[6]
Liu J, Pattey E. Retrieval of leaf area index from top-of-canopy digital photography over agricultural crops[J]. Agricultural and Forest Meteorology, 2010, 150(11):1485-1490. DOI:10.1016/j.agrformet.2010.08.002

DOI

[7]
Mu X H, Hu R H, Zeng Y L, et al. Estimating structural parameters of agricultural crops from ground-based multi-angular digital images with a fractional model of sun and shade components[J]. Agricultural and Forest Meteorology, 2017, 246:162-177. DOI:10.1016/j.agrformet.2017.06.009

DOI

[8]
Zheng L Y, Shi D M, Zhang J T. Segmentation of green vegetation of crop canopy images based on mean shift and Fisher linear discriminant[J]. Pattern Recognition Letters, 2010, 31(9):920-925. DOI:10.1016/j.patrec.2010.01.016

DOI

[9]
Liu Y K, Mu X H, Wang H X, et al. A novel method for extracting green fractional vegetation cover from digital images[J]. Journal of vegetation science, 2012, 23(3):406-418. DOI:10.2307/23251074

DOI

[10]
李凯, 张建华, 冯全, 等. 复杂背景与天气条件下的棉花叶片图像分割方法[J]. 中国农业大学学报. 2018, 23(2):88-98.

[ Li K, Zhang J H, Feng Q, et al. 2018. Image segmentation method for cotton leaf under complex background and weather conditions[J]. Journal of China Agricultural University, 2018, 23(2):88-98. ]

[11]
Li Y N, Huang Z Y, Cao Z G, et al. Performance Evaluation of Crop Segmentation Algorithms[J]. IEEE Access, 2020, 8:36210-36225. DOI:10.1109/ACCESS.2020.2969451

DOI

[12]
中国科学院西北生态环境资源研究院. 中国科学院黑河遥感试验研究站[J]. 中国科学院院刊, 2020, 35(11):1424-1426.

[Northwest Institute of Eco-Environment and Resources, CAS. Heihe remote sensing experimental research station[J]. Bulletin of Chinese Academy of Sciences, 2020, 35(11):1424-1426,1429. ]

[13]
孙赛钰, 王维真, 徐菲楠. 黑河流域中上游水热通量足迹模型的对比分析[J]. 遥感技术与应用, 2021, 36(4):887-897.

[ Sun S Y, Wang W Z, Xu F N. Comparison of footprint models of surface heat and water vapor fluxes in the middle and upper reaches of Heihe river basin[J]. Remote Sensing Technology and Application, 2021, 36(4):887-897. ] DOI: 10.11873/j.issn.1004-0323.2021.4.0887

DOI

[14]
黄巧义, 樊小林, 张木, 等. 水稻冠层图像分割方法对比研究[J]. 中国生态农业学报, 2018, 26(5):710-718.

[ Huang Q Y, Fan X L, Zhang M, et al. Comparative study of image segmentation algorithms for rice canopy[J]. Chinese Journal of Eco-Agriculture, 2018, 26(5):710718. ] DOI:10.13930/j.cnki.cjea.170998

DOI

[15]
周俊, 王明军, 邵乔林. 农田图像绿色植物自适应分割方法[J]. 农业工程学报, 2013, 29(18):163-170.

[ Zhou J, Wang M J, Shao Q L. Adaptive segmentation of field image for green plants[J]. Transactions of the Chinese Society of Agricultural Engineering, 2013, 29(18):163170. ] DOI:10.3969/j.issn.1002-6819.2013.18.020

DOI

[16]
张智韬, 于广多, 吴天奎, 等. 基于无人机遥感影像的玉米冠层温度提取及作物水分胁迫监测[J]. 农业工程学报, 2021, 37(23):82-89.

[ Zhang Z T, Yu G D, Wu T K, et al. Temperature extraction of maize canopy and crop water stress monitoring based on UAV remote sensing images[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(23):82-89. ] DOI:10.11975/j.issn.1002-6819.2021.23.010

DOI

[17]
曾艳阳, 谢高森, 张建春. 基于截距直方图和Otsu融合的弱光图像分割[J]. 激光与光电子学进展, 2021, 58(20):219-227.

[ Zeng Y Y, Xie G S, Zhang J C. Weak-Light image segmentation based on intercept histogram and Otsu fusion[J]. Laser & Optoelectronics Progress, 2021, 58(20):219-227. ] DOI:10.3788/LOP202158.2010016

DOI

[18]
韩青松, 贾振红, 杨杰, 等. 基于改进的Otsu算法的遥感图像阈值分割[J]. 激光杂志, 2010, 31(6):33-34.

[ Han Q S, Jia Z H, Yang J, et al. Remote sensing image thresholding segmentation based on the modified Otsu algorithm[J]. Laser Journal, 2010, 31(6):33-34. ] DOI:10.3969/j.issn.0253-2743.2010.06.018

DOI

[19]
赵博, 宋正河, 毛文华, 等. 基于PSO与K-均值算法的农业超绿图像分割方法[J]. 农业机械学报, 2009, 40(8):166-169.

[ Zhao B, Song Z H, Mao W H, et al. Agriculture extra-green image segmentation based on particle swarm optimization and K-means clustering[J]. Transactions of the Chinese Society for Agricultural Machinery, 2009, 40(8):166-169. ]

[20]
Xiong H, Wu J J, Chen J. K-Means clustering versus validation measures: a data-distribution perspective[J]. IEEE Transactions on Systems, Man and Cybernetics. Part B (Cybernetics), 2009, 39(2):318-331. DOI:10.1109/TSMCB.2008.2004559

DOI

[21]
张志斌, 罗锡文, 臧英, 等. 基于颜色特征的绿色作物图像分割算法[J]. 农业工程学报, 2011, 27(7):183-189.

[ Zhang Z B, Luo X W, Zang Y, et al. Segmentation algorithm based on color feature for green crop plants[J]. Transactions of the Chinese Society of Agricultural Engineering, 2011, 27(7):183-189. ] DOI:10.3969/j.issn.1002-6819.2011.07.032

DOI

[22]
Kataoka T, Kaneko T, Okamoto H, et al. Crop growth estimation system using machine vision[C]. NJ: IEEE, 2003. DOI:10.1109/AIM.2003.1225492.

DOI

[23]
Bai X D, Cao Z G, Wang Y, et al. Crop segmentation from images by morphology modeling in the CIE L*a*b* color space[J]. Computers and Electronics in Agriculture, 2013, 99:21-34. DOI:10.1016/J.COMPAG.2013.08.022

DOI

[24]
Guijarro M, Pajares G, Riomoros I, et al. Automatic segmentation of relevant textures in agricultural images[J]. Computers and Electronics in Agriculture, 2011, 75(1):75-83. DOI:10.1016/j.compag.2010.09.013

DOI

[25]
张敏, 袁辉. 拉依达(PauTa)准则与异常值剔除[J]. 郑州工业大学学报. 1997, 18(1):87-91.

[ Zhang M, Yuan H. The PauTa criterion and rejecting the abnormal value[J]. Journal of Zhengzhou University (Engineering Science), 1997, 18(1):84-88. ]

[26]
Song W, Mu X H, Yan G J, et al. Extracting the Green Fractional Vegetation Cover from Digital Images Using a Shadow-Resistant Algorithm (SHAR-LABFVC)[J]. Remote Sensing, 2015, 7(8):10425-10443. DOI:10.3390/rs70810425

DOI

[27]
Hamuda E, Glavin M, Jones E. A survey of image processing techniques for plant extraction and segmentation in the field[J]. Computers and Electronics in Agriculture, 2016, 125:184-199. DOI:10.1016/j.compag.2016.04.024

DOI

[28]
周力凯, 江雨洋, 冯亚春, 等. 基于多尺度区域与类不确定性理论的局部阈值分割方法[J]. 计算机应用, 2020, 40(S2):66-72.

[ Zhou L K, Jiang Y Y, Feng Y C, et al. Local image thresholding method based on multiscale region and class uncertainty theory[J]. Journal of Computer Applications, 2020, 40(S2):66-72. ] DOI:10.11772/j.issn.1001-9081.2019111956

DOI

[29]
Rico-Fernández M P, Rios-Cabrera R, Castelán M, et al. A contextualized approach for segmentation of foliage in different crop species[J]. Computers and Electronics in Agriculture, 2019, 156: 378-386. DOI:10.1016/j.compag.2018.11.033

DOI

[30]
Ni A, Ma Y, Bao Y H. Image and spectral fidelity study of hyperspectral remote sensing image scaling up based on wavelet transform[C]. NJ: SPIE, 2015. DOI:10.1117/12.2204853

DOI

[31]
杨晓倩, 贾振红, 杨杰, 等. 基于小波变换和Retinex结合的遥感图像的薄云去除[J]. 激光杂志, 2019, 40(10):77-80.

[ Yang X Q, Jia Z H, Yang J, et al. Thin cloud removal of remote sensing images based on wavelet transform and Retinex[J]. Laser Journal, 2019, 40(10):77-80. ] DOI:10.14016/j.cnki.jgzz.2019.10.077

DOI

[32]
张淑芳, 刘孟娅, 韩泽欣, 等. 基于Retinex增强的单幅LDR图像生成HDR图像方法[J]. 计算机辅助设计与图形学学报, 2018, 30(6):1015-1022.

[ Zhang S F, Liu M Y, Han Z X, et al. Generation Method of High Dynamic Range Image from a Single Low Dynamic Range Image Based on Retinex Enhancement[J]. Journal of Computer-Aided Design & Computer Graphics, 2018, 30(6):1015-1022. ] DOI:10.3724/SP.J.1089.2018.16598

DOI

Outlines

/