Orginal Article

A Novel Pure Pixel Index Endmember Extraction Algorithm Based on the Maximum Distance

  • XU Jun , 1, * ,
  • XU Fuhong 2 ,
  • CAI Tijian 1 ,
  • WANG Cailing 3 ,
  • HUANG Dechang 1 ,
  • LI Weiping 1
Expand
  • 1. School of Information Engineering, East China Jiaotong University, Nanchang 330013, China
  • 2. Division of Planning and Finance, East China Jiaotong University, Nanchang 330013, China
  • 3. College of Computer, Xi'an Shiyou University, Xi'an 710065, China
*Corresponding author: XU Jun, E-mail:

Received date: 2013-12-09

  Request revised date: 2014-03-05

  Online published: 2015-01-05

Copyright

《地球信息科学学报》编辑部 所有

Abstract

In hyperspectral unmixing, PPI algorithm is a relatively mature algorithm, but each projection vector in PPI algorithm is generated randomly, and the endmembers extracted by PPI algorithm are not stable. That is, different endmembers can be obtained from the same image by repeatedly running PPI algorithm. This paper, based on the convex geometry description of linear spectral mixing model, utilized the feature that the endmembers are the endpoints of the single convex body enclosed in the hyperspectral image feature space, and proposed a novel pure pixel index algorithm for endmember extraction based on the maximum distance. The average of the spectral vectors of all the sample points is calculated and used as the center of a hypersphere. Next, we calculate the Euclidean distances of all the sample points to the center of the hypersphere, and design a radius of equal to or greater than the maximum distance for the hypersphere in the feature space to include all of the sample points. We evenly select the reference points on the surface of the hypersphere. The farthest sample point with respect to each reference point can be found by calculating the Euclidean distance. Subsequently, every sample point’s frequency of being the most distant to the reference points is recorded as an index to evaluate whether the sample point is an endmember or not. Finally, we use the AVIRIS data of Nevada Cuprite to testify this algorithm. The experimental results illustrate that the precision of the endmember extraction using the algorithm proposed in this paper is better than N-FINDR algorithm and VCA algorithm in general. Moreover, it has a good robustness and could overcome the instability of PPI algorithm caused by random projection.

Cite this article

XU Jun , XU Fuhong , CAI Tijian , WANG Cailing , HUANG Dechang , LI Weiping . A Novel Pure Pixel Index Endmember Extraction Algorithm Based on the Maximum Distance[J]. Journal of Geo-information Science, 2015 , 17(1) : 86 -90 . DOI: 10.3724/SP.J.1047.2015.00086

1 引言

混合像元分解是高光谱图像解译领域里的研究热点之一[1-3]。若某一个像元对应的地面区域内只包含一种地物,则称此像元为纯像元[4]。纯像元所记录的某种地物的光谱称为端元,端元提取是高光谱数据解混和解译的前提[5]。目前,发展较为成熟的端元提取算法主要是基于凸面几何学的PPI算法[6]、N-FINDR[7-8]算法和VCA算法[9-11]等。其中,PPI算法利用端元是特征空间中凸面单形体顶点的特点,在特征空间中随机产生若干直线,并将所有的样本点在这些直线上进行投影,每次投影都记录下落在直线两端的样本点,统计每个样本点投影落在直线两端的次数,称为纯像元指数,这个指数越高说明该像元成为端元的可能性越大。但PPI算法有一个明显的缺点,由于每次投影所用的直线都是随机选取的,投影向量在特征空间内的分布不一定是严格均匀的,在某次端元提取运算过程中某个方向上的投影向量特别密集,而在另一次端元提取过程中在另一个方向上投影又较多,充满不确定性。本文针对这一缺点,提出了基于最大距离纯像元指数的端元提取方法。由于样本点在特征空间中呈凸面单形体的空间结构,因此若在单形体外围任取一个参考点,则在所有样本点中,距离参考点最远的一个点必然是端元之一。而如果能在单形体外围有规律地选取参考点,并计录各样本点成为与这些参考点距离最大点的次数,将其作为纯像元指数,则能够有效地解决PPI算法多次运行后端元提取结果不稳定的问题。

2 最大距离纯像元指数

高光谱数据的样本点在特征空间中呈凸面单形体的结构,端元光谱为单形体的顶点(图1),端元e1,e2,e3分别为三角形的顶点,位于三角形内部的样本点为混合像元。
Fig. 1 The schematic diagram of endmember extraction algorithm based on maximum distance pure pixel index

图1 最大距离纯像元指数提取端元的原理示意图

文献[12]提出利用图像中所有像元的平均光谱向量作为初始值e0,在特征空间中距离e0最远的一个样本点即为端元光谱之一。受此启发,可知坐标原点与e0的距离为恒定值,因此,在特征空间中距离坐标原点最远的点必是端元之一。如果坐标原点围绕特征空间中的凸面单形体旋转,那么,通过计算样本点与坐标原点之间的最大距离得到的端元光谱也会随着变化。
实际上,对于单形体外的任意一点,样本点中与它距离最远的一点均可认定为端元。本文提出一种基于最大距离纯像元指数的端元提取方法,可以在单形体外围大量地选取参考点,找出数据集中与参考点距离最大的数据点。与PPI方法相似,记录数据集中成为距离最大点的频数作为纯像元指数,这个指数越大说明它是端元的可能性就越大。
在PPI算法中,由于每次的投影向量都是随机生成的,没有任何规律性,因此,每次运算后所提取端元的准确性无法保证,有可能出现对同一组高光谱图像多次运行PPI算法却得到不同端元的情况。为了避免这种情况,以二维空间为例,设计一个超球(图1),让整个单形体都包含在这个超球内部,在这个超球外壳上选择参考点,计算单形体中各样本点与这些参考点的最大距离纯像元指数,根据每个像元的纯像元指数的大小就可以判定端元。
具体的方法如下:
(1)选取特征空间中所有样本点的光谱均值作为超球的球心: O = X ̅ = 1 n i = 1 n X i i=1,2,…,n, n为特征空间中样本点的个数),O表示超球的球心, X i 表示特征空间中的样本点的光谱矢量;
(2)计算所有样本点到球心的欧氏距离 distance ( X i ) = X i - O 2 ;
(3)根据文献[12],与球心距离最大的样本点必是单形体的顶点之一,以等于或大于这个最大距离作为半径,将所有样本点包含在超球内部, R max [ dis tan ce E j - O 2 ] ( j=1,2,…,m, m为端元个数, E j 为端元);
(4)在超球面上均匀选择参考点,计算样本点与这些参考点之间的距离,记录每个样本点成为最大距离点的次数作为纯像元指数。
(5)针对上述的纯像元指数做出像元纯净图像,选择合适的阈值,提取其中的端元光谱。

3 超球面上均匀选择参考点

PPI算法中,由于投影向量的选取具有随机性,因此造成每次端元提取的结果不稳定。基于上述的最大距离纯像元指数,如果能在包围所有样本的超球面上均匀地选择参考点,就可避免随机无序选择参考点而给端元提取带来的不确定性。
图2仍以二维空间为例,在包围所有样本的超球面上,任取一个参考点a1,取经过该参考点和球心O的一条直线,该直线与超球面必然相交于另一点a2;过球心O做一条垂直于a1 a2的直线,与超球面相交于两个点b1b2;过a1 b1的中点和a2 b2的中点做一条垂线与超球面交于点c1c2,同时过a1 b2b1 a2的中点做一条垂线与超球面相交于点d1d2。依此类推,可以在超球面上继续寻找参考点e1,e2,f1,f2,g1,g2……。
Fig. 2 The schematic diagram of reference points selection based on hypersphere

图2 超球面上选择参考点的原理示意图

显然,用上述方法在样本空间中寻找参考点,可以保证各参考点在方位上做到比较均匀地排布,而避免了PPI算法中随机选取的大量投影向量方向趋同导致多次端元提取的结果不稳定。

4 算法验证与分析

采用美国内华达州Cuprite部分地区的AVIRIS数据[13]对本文提出的算法进行验证。该地区的假彩色合成图如图3所示,此地为沙漠地区,地表矿物没有植被覆盖。Swayze和Clark等人已经给出了该地区的地物真实分布的报告[14-15]。图像有400×350个像元,去掉信噪比太低或水吸收的波段(1~2,104~113,148~167,221~224),剩下188个波段的光谱图像用于算法验证。
Fig. 3 The false color composite image of the AVIRIS data of Cuprite area

图3 Cuprite区域的AVIRIS数据假彩色合成图

对图像进行MNF变换去噪并降维后[16-17],采用最大距离的纯像元指数方法对图像进行处理,将每个像元被标记为纯像元的次数作为该像元的DN值,获得一幅像元纯净影像(图4(a))。为了对比,同时用PPI算法对图像中各像元进行投影计算,并记录纯像元次数,得到像元纯净影像(4(b))。在这2幅影像中,像元的亮暗表示该像元成为纯净像元的可能性高低,较亮的像元更有可能是纯净像元,而暗像元则表示成为纯净像元的可能性很低。
Fig. 4 The pure pixel images obtained by the algorithm proposed in this paper and by the PPI algorithm

图4 本文算法及PPI算法生成的像元纯净影像

对比图4(a)、(b),可发现图4(a)图中各像元的DN值差距比较明显;而图4(b)中除了很亮的像元和很暗的像元外,还有很多DN值介于中间的灰色像元。图5(a)、(b)为对应图4(a)、(b)的灰度直方图。
Fig. 5 The histograms obtained from two pure pixel images

图5 像元纯净影像的灰度直方图

图5(a)可看出,像元的DN值主要集中于灰度级的两端,因此,便于选择一个阈值将DN值较大的像元提取出来,进而提取各端元;而图5 (b)中像元的DN值分布相对离散,给阈值的选取带来不便。
根据图5(a),显然可以将DN值在200以上的像元提取出来作为端元,提取这些纯像元的光谱矢量,进行简单聚类后可以得到9个端元。为了验证算法提取结果的稳定性和精确度,我们初始化端元数目为9,连续运行本文所提的端元提取算法和PPI算法各50次,对2种算法50次提取的9个端元分别求取平均值作为9个端元的提取结果,并与N-FINDR算法和VCA算法的端元提取结果对比分析。
利用上述4种算法提取的端元,分别通过全约束的最小二乘法进行光谱解混[18-19],将各丰度图与实地勘测报告比较,从而确定各端元对应的矿物,然后与美国地质调查局(USGS)光谱库[20]中相应 矿物的光谱进行对比,计算它们之间的光谱角 (表1)。
Tab. 1 The contrast of the algorithm proposed in this paper with N-FINDR and VCA

表1 本文算法与N-FINDR和VCA的对比

矿物 本文算法(50次均值) PPI(50次均值) VCA N-FINDR
皂石(Nortronite) 0.0568 0.0836 0.0713 0.0576
明矾石(Alunite) 0.0622 0.0829 0.0862 0.0635
蒙脱石(Montmorillonite) 0.0626 0.0743 0.0642 0.0961
玉髓(Chalcedony) 0.1048 0.1512 0.1243 0.1219
沙漠地表(Desert Varnish) 0.1022 0.1141 0.1081 0.1131
铵长石(Buddingtonite) 0.0939 0.1254 0.1056 0.0916
白云母(Muscovite) 0.0706 0.0982 0.0751 0.0808
高岭石(Kaolinite) 0.1295 0.1442 0.1348 0.1303
榍石(Sphene) 0.0612 0.0813 0.0627 0.0726
经过表1光谱角的定量对比,可知采用本文方法进行端元提取的结果全面优于PPI算法,除个别指标外,总体上提取精度也优于N-FINDR算法和VCA算法。这表明基于最大距离的纯像元指数端元提取算法精度较高,有很强的鲁棒性。

5 结论

PPI算法中由于投影向量的选择是随机的,故算法的鲁棒性不高,每次端元提取的结果并不稳定。本文提出了一种最大距离纯像元指数的概念,首先在特征空间中设计一个超球面包围所有样本点,在超球面上均匀地选择参考点,计算参考点与样本点的距离并记录最大者,统计每个样本点成为最大距离点的次数作为纯像元指数来提取端元。相比于传统的PPI算法随机生成投影向量,新的纯像元指数法选取参考点是均匀的、有规律的,因而算法的鲁棒性高,端元提取的结果也更直观和稳定。但由于本文算法需要在超球面上均匀选择参考点,跟PPI算法相比计算的复杂度和耗时有所增大。因此,如何定量地比较本文算法和PPI算法的计算复杂度和运行效率,在保证运算精度的前提下对本文算法进行优化以减少运算量,是今后需深入研究的课题。

The authors have declared that no competing interests exist.

[1]
Gillespie A R.Spectral mixture analysis of multispectral thermal infrared images[J]. Remote Sensing of Environment, 1992,42(2):137-145.

[2]
Foody G M, Cox D P.Sub-pixel land cover composition estimation using a linear mixture model and fuzzy membership functions[J]. Remote sensing, 1994,15(3):619-631.

[3]
Boardman J W.Geometric mixture analysis of imaging spectrometry data[C]//Geoscience and Remote Sensing Symposium, 1994. IGARSS'94 Surface and Atmospheric Remote Sensing: Technologies, Data Analysis and Interpretation, 1994, 4: 2369-2371.

[4]
Keshava N, Mustard J F.Spectral unmixing[J]. Signal Processing Magazine, IEEE, 2002,19(1):44-57.

[5]
Atkinson P M, Cutler M E J, Lewis H. Mapping sub-pixel proportional land cover with AVHRR imagery[J]. International Journal of Remote Sensing, 1997,18(4):917-935.

[6]
Bateson A, Curtiss B.A method for manual endmember selection and spectral unmixing[J]. Remote Sensing of Environment, 1996,55(3):229-243.

[7]
Winter M E.N-FINDR: an algorithm for fast autonomous spectral end-member determination in hyperspectral data[C]//SPIE's International Symposium on Optical Science, Engineering, and Instrumentation. International Society for Optics and Photonics, 1999:266-275.

[8]
Winter M E.A proof of the N-FINDR algorithm for the automated detection of endmembers in a hyperspectral image[C]//Defense and Security. International Society for Optics and Photonics, 2004:31-41.

[9]
Nascimento J M P, Dias J M B. Vertex component analysis: A fast algorithm to unmix hyperspectral data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005,43(4):898-910.

[10]
Chang C I, Wu C C, Liu W, et al.A new growing method for simplex-based endmember extraction algorithm[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(10):2804-2819.

[11]
Plaza A, Chang C I.Impact of initialization on design of endmember extraction algorithms[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006,44(11):3397-3407.

[12]
耿修瑞,童庆禧,郑兰芬.一种基于端元投影向量的高光谱图像地物提取算法[J].自然科学进展,2005,15(4):509-512.

[13]
AVIRIS. AVIRIS data-ordering free AVIRIS standard data products[DB/OL].2013.

[14]
Clark R N, Swayze G A.Evolution in Imaging Spectroscopy Analysis and Sensor Signal-to-Noise: d P. An Examination of How Far We Have Come[C]//Summaries of the sixth annual JPL airborne Earth science workshop. Sixth Annual JPL Airborne Earth Science Workshop, 1996.

[15]
Resmini R G, Kappus M E, Aldrich W S, et al.Mineral mapping with hyperspectral digital imagery collection experiment (HYDICE) sensor data at Cuprite, Nevada, USA[J]. International Journal of Remote Sensing, 1997,18(7): 1553-1570.

[16]
崔耀平,刘彤,赵志平,等.干旱荒漠区植被覆盖变化的遥感监测分析[J].地球信息科学学报, 2011,13(3):305-312.

[17]
Liu X, Zhang B, Gao L R, et al.A maximum noise fraction transform with improved noise estimation for hyperspectral images[J]. Science in China Series F: Information Sciences, 2009,52(9):1578-1587.

[18]
Heinz D C, Chang C I.Fully constrained least squares linear spectral mixture analysis method for material quantification in hyperspectral imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2001,39(3):529-545.

[19]
Ashton E A, Schaum A.Algorithms for the detection of sub-pixel targets in multispectral imagery[J]. Photogrammetric Engineering & Remote Sensing, 1998,64(7):723-731.

[20]
U.S Geological Survey Library. USGS Digital Spectral Library 06[DB/OL]. 2007.

Outlines

/