遥感科学与应用技术

基于不确定性分析的遥感分类空间分层及评估方法

  • 吴亚楠 , 1, 2 ,
  • 郭长恩 3 ,
  • 于东平 3 ,
  • 段爱民 3 ,
  • 刘玉 1 ,
  • 董士伟 , 1, * ,
  • 单东方 1 ,
  • 吴耐明 4 ,
  • 李西灿 2
展开
  • 1.北京市农林科学院信息技术研究中心,北京 100097
  • 2.山东农业大学信息科学与工程学院,泰安 271018
  • 3.山东省地质矿产勘查开发局八〇一水文地质工程地质大队,济南 250014
  • 4.北京北建大建筑设计研究院有限公司,北京 100044
* 董士伟(1984— ),男,山东泰安人,高级工程师,博士,主要从事时空数据分析研究。 E-mail:

吴亚楠(1996— ),女,山东东营人,硕士研究生,主要从事土地利用变化与遥感应用研究。E-mail:

收稿日期: 2022-04-13

  网络出版日期: 2022-11-25

基金资助

国家重点研发计划课题(2021YFD1500204)

国家自然科学基金项目(41801276)

Spatial Stratification and Evaluation Method of Remote Sensing Classification based on Uncertainty Analysis

  • WU Yanan , 1, 2 ,
  • GUO Chang'en 3 ,
  • YU Dongping 3 ,
  • DUAN Aimin 3 ,
  • Liu Yu 1 ,
  • DONG Shiwei , 1, * ,
  • SHAN Dongfang 1 ,
  • WU Naiming 4 ,
  • LI Xican 2
Expand
  • 1. Research Center of Information Technology, Beijing Academy of Agriculture and Forestry Sciences, Beijing 100097, China
  • 2. College of Information Science and Engineering, Shandong Agricultural University, Tai 'an 271018, China
  • 3. 801 Institute of Hydrogeology and Engineering Geology, Shandong Provincial Bureau of Geology & Mineral Resources, Jinan 250014, China
  • 4. Architectural Design and Research Institute of BUCEA Co. Ltd, Beijing 100044, China
* DONG Shiwei, E-mail:

Received date: 2022-04-13

  Online published: 2022-11-25

Supported by

National Key Research and Development Program of China(2021YFD1500204)

National Natural Science Foundation of China(41801276)

摘要

空间分层是准确度量遥感分类不确定性程度及其空间分布的基础与关键。本文提出了一种基于不确定性分析的遥感分类空间分层及评估方法,首先基于随机森林算法获取像元后验概率,确定分类不确定性度量指标;其次,采用模糊C均值进行空间分层;最后,对分层结果合理性进行定性与定量评估,并与同尺度数据产品精度评价结果及后验概率不确定性分层方法进行对比分析。以北京市顺义区Landsat 8 OLI遥感影像数据为例,研究结果表明:① 基于最大概率、模糊混淆指数和概率熵指标将顺义区分为不确定性大、中、小3层,相应的遥感数据层分类精度分别为62.28%、74.96%、79.31%;② 分类不确定性空间分层结果与度量指标大小的空间分布基本一致,错分地类图层与不确定性大层的地类空间分布基本一致;③ 遥感数据和数据产品的各层地类空间特征、层分类精度大小趋势一致,与总体分类精度相比,不确定性大层的层分类精度降低,不确定性小层的层分类精度提高;④ 与后验概率不确定性分层方法相比,本研究不确定性大层的层分类精度降低1.08%,不确定性中层提高3.58%,不确定性小层提高0.16%,q值由0.19提高到0.24,空间分异性更高。证实了研发的遥感分类不确定性空间分层结果的合理性。研究旨在提出适用于遥感分类的不确定性分层方案,用于优化遥感分类训练样本和精度评价验证样本的空间布设。

本文引用格式

吴亚楠 , 郭长恩 , 于东平 , 段爱民 , 刘玉 , 董士伟 , 单东方 , 吴耐明 , 李西灿 . 基于不确定性分析的遥感分类空间分层及评估方法[J]. 地球信息科学学报, 2022 , 24(9) : 1803 -1816 . DOI: 10.12082/dqxxkx.2022.220188

Abstract

Spatial stratification is the basis and key to accurately measure the uncertainty degree and spatial distribution of remote sensing classification. In this study, a spatial stratification and evaluation method of remote sensing classification was proposed based on uncertainty analysis. Firstly, the pixel posterior probability was obtained based on random forest algorithm, and measurement indices of classification uncertainty were determined. Secondly, spatial stratification was achieved using Fuzzy C-means. Finally, the rationality of the stratification results was qualitatively and quantitatively evaluated and compared with the stratification accuracy assessment results of data products at the same scale and the posterior probability uncertainty stratification method. Taking Landsat 8 OLI images of remote sensing data in Shunyi District of Beijing as an example, the results showed that: (1) The coverage of Shunyi District was divided into three strata including large, medium, and small uncertainties based on the indices of maximum probability, fuzzy confusion index, and probability entropy. The stratum classification accuracy of each stratum of remote sensing data was 62.28%, 74.96%, and 79.31%, respectively; (2) The spatial stratification results of classification uncertainty were basically consistent with the spatial distribution of the size of measurement indices, and the spatial distribution of misclassified stratum was basically consistent with that of large uncertainty stratum; (3) The spatial characteristics and classification accuracy of each stratum for remote sensing data and data products had the same trend. Compared with the overall accuracy of classification, the stratum classification accuracy of the large uncertainty stratum was reduced, and the stratum classification accuracy of the small uncertainty stratum was improved; (4) Compared with the posterior probability uncertainty stratification method, the stratum classification accuracy of the large uncertainty stratum decreased by 1.08%, and those of the middle uncertainty stratum and the small uncertainty stratum increased by 3.58% and 0.16%, respectively, and corresponding q value of the spatial method developed in this study increased from 0.19 to 0.24 with a higher spatial differentiation. This confirmed that the spatial stratification result of remote sensing classification developed in this study was reasonable. This study proposes an uncertainty stratification scheme for remote sensing classification to optimize the spatial layout of training samples for remote sensing classification and validation samples for accuracy evaluation.

1 引言

遥感分类的不确定性制约了遥感数据的产品化和实用化,受数据源特性、数据处理方式、自然环境复杂性及地类光谱相似性等多种因素干扰[1-2],致使多个地类存在较大的分类模糊性和不确定性。如何准确度量遥感分类的不确定性程度和空间分布状况[3],选择合适的方法对分类不确定性进行空间分层或分区,强化层内同质性,有利于遥感分类不确定性研究。
空间分层是指根据不同分层要素的相关性及其分异规律的比较研究与分析,建立区划指标,基于分层算法,如模糊C均值法[4]、k均值法[5]等,使得层内同质、层间异质,将总体划分为不同等级的区域系统[6-8]。根据应用需求,在分层结果基础上进行训练样本和验证样本的空间优化,可以提高样本的代表性,有助于改善遥感分类精度和保证评价结果的准确性。Tapia等[9]在植被系统测绘中采用模糊聚类和混淆指数划分不确定性区域,在不确定性大的区域通过加密采样进而优化采样方案设计;曾永年等[10]根据海拔高度、水热条件、土地利用方式等将青藏高原分为3个地理分区,基于地理分区获取训练样本并进行多源遥感综合分类;金佳鑫等[6]利用气象、高程等环境数据构建区划指标,使用k均值聚类进行生态地理分区,有效降低了分区单元内的土地覆被复杂程度。上述空间分层或分区主要考虑环境辅助数据进行生态地理分区,但从遥感数据分类不确定性程度进行空间分层,使用户根据研究目标在分层结果基础上进行样本优化或判别分层区域内分类结果是否适用更有价值[11-13]。遥感数据不确定性度量方式或指标主要体现在土地利用类别尺度和像元尺度[14-15]。类别尺度不确定度量指标主要有误差矩阵、粗糙集[16]、混合熵[17]等,代表各类别分类不确定性;像元尺度不确定度量指标主要是基于概率矢量[18]或模糊隶属度矢量[19]提出,如绝对不确定性、相对不确定性、概率熵等[11];概率矢量或模糊隶属度矢量可以从最大似然分类、随机森林、模糊聚类等算法分类过程中获取。现有研究主要在像元尺度和类别尺度上建立多尺度评价指标描述分类不确定性[14,17]或基于像元尺度建立评价指标模型描述分类的不确定性和模糊性,采用相等间隔划分指标进行不确定性分区[20],分析分类不确定性空间分布状况。像元尺度不确定性度量指标可以直观表现不确定性的空间分布结构、趋势等信息[21]
因此,本研究以2017年北京市顺义区Landsat 8 OLI遥感影像数据为例,基于随机森林算法从像元尺度上选择分类不确定性度量指标,使用模糊C均值聚类进行分类不确定性空间分层,计算最佳分层数目,并从定性和定量2个角度评估空间分层结果的合理性,旨在提出适用于遥感分类的不确定性分层方案,为遥感分类训练样本、精度评价验证样本的空间布设优化提供参考。

2 研究区概况与数据来源

2.1 研究区概况

本研究区为北京市顺义区,位于北京市东北部,40°00'N—40°18'N,116°28'E—116°59'E,地势北高南低,位于燕山南麓,气候属暖温带半湿润大陆性季风性气候,年均降雨量约625 mm,降水主要集中在夏季,主要的土地利用类型为耕地,林地,建设用地和水域等,境内大小河流20余条,呈南北走向。顺义区复杂的地势结构与气候属性造成多地类相互交错,错综复杂,地物分布空间异质性较大且光谱特征混杂,科学合理的空间分层可以保证遥感分类的准确性和精度评价的可靠性。

2.2 数据来源与预处理

研究采用2017年顺义区遥感影像数据及土地利用遥感数据产品,数据详情如下:
(1)Landsat 8 OLI数据:来源于中国科学院遥感与数字地球研究所(http://eds.ceode.ac.cn/),成像时间2017年9月28日,行号32,列号123,空间分辨率为30 m。参考全国遥感监测土地利用覆盖分类体系[22]和研究区的土地利用特征状况,最终确定6种土地利用类型,分别为耕地,林地,草地,水域,城乡、工矿、建设用地和未利用地。其中,顺义区不同遥感数据产品的水域类型统计面积占比较小,仅为1%~4%;水域内的亚类,如FROM-GLC10遥感数据产品中的湿地和水体占比均不足1%,中国土地利用现状遥感监测数据产品中的河渠、滩地、水库坑塘等分别约占2%、1%、1%,因此,本研究不区分水体和湿地,统一合并为水域类型。
(2)FROM-GLC10遥感数据产品:来源于清华大学( http://data.ess.tsinghua.edu.cn/),产品分类总体精度为72.76%[23]。基于随机森林分类算法对2017年10 m空间分辨率的Sentinel-2影像进行全球土地覆盖制图,包含10种土地利用类型,其中顺义区包含8种。将顺义区FROM-GLC10遥感数据产品重分类为耕地(耕地),林地(森林、灌木丛),草地(草原),水域(湿地、水体),城乡、工矿、建设用地(不透水层)和未利用地(裸地)6种土地利用类型,如图1(a)所示。
图1 2017年北京市顺义区遥感数据产品重分类结果

Fig.1 Reclassification results of remote sensing data products in 2017 for Shunyi District

(3)中国土地利用现状遥感监测数据产品:来源于中国科学院地理科学与资源研究所( https://www.resdc.cn/),2017年该产品在北京市的分类总体精度为71.08%[24]。基于人工交互目视解译方法对2017年30 m空间分辨率的Landsat 8卫星数据进行土地利用制图,包含6种一级土地利用类型和25种二级土地利用类型,其中顺义区包含14种二级土地利用类型。将顺义区土地利用现状遥感监测数据产品重分类为耕地(旱地),林地(有林地、灌木林、疏林地、其它林地),草地(高覆盖度草地、中覆盖度草地),水域(河渠、水库坑塘、滩地),城乡、工矿、建设用地(城镇用地、农村居民点、其他建设用地)和未利用地(沼泽地)6种土地利用类型,如 图1(b)所示。
不同来源的遥感数据产品都存在一定的分类不确定性,目前FROM-GLC10遥感数据产品和中国土地利用现状遥感监测数据产品精度相对可靠,具有很好的适用性[22,25]。因此,本研究将30 m Landsat 8 OLI数据作为待分类与待分层基础数据,10 m FROM-GLC10遥感数据产品的重分类结果作为参考数据进行精度评价;同时,选用30 m中国土地利用现状遥感监测数据产品的重分类结果作为对比数据,进一步评估不确定性空间分层结果的合理性。基于ArcGIS 10.6和ENVI 5.3软件实现图像裁剪、空间坐标系转换、训练样本数据选取、数据格式转换等处理,其中,所有遥感分类结果统一转换为矢量数据,便于定性分析和定量计算。

3 研究方法

分类不确定性空间分层的技术路线如图2所示,主要分为以下4部分:① 基于随机森林算法获取像元属于每个地类的分类后验概率,构建分类不确定性度量指标,利用模糊C均值聚类实现不确定性空间分层;② 基于最大分区函数F和熵函数H确定最佳分层数目;③ 从定性和定量2个角度评估空间分层结果合理性;④ 不确定性空间分层方法对比分析。
图2 分类不确定性空间分层的技术路线

Fig. 2 Technical roadmap for spatial stratification of classification uncertainty

3.1 遥感分类与精度评价方法

遥感分类主要分为二类:① 非监督分类,不需要训练样本,根据某种规则将图像进行分类;② 监督分类,需要训练样本,选择提取分类特征(如光谱特征、纹理特征等),输入数据到分类器中,从而把图像中的各个像元点划归到各个给定类中。遥感分类精度评价通常有2种方式[24]:① 基于空间抽样的评价方法,选择验证样本进行分类精度评估; ② 基于全局的逐像元遍历统计方法,选择全部像元进行分类精度评价。

3.2 分类不确定性度量指标

随机森林算法集成了多个决策树,并将决策树投票结果最多的类别作为像元地类属性[26],以随机森林投票数为依据基于Python编程语言计算像元属于每个类别的后验概率,基于后验概率确定分类不确定性度量指标。根据描述不确定性的相互关系将分类不确定性度量指标分为3大类:绝对不确定性、相对不确定性、混合不确定性。绝对不确定性指标突出了最大概率,在很大程度上反映了像元最终被赋予该类别时的可靠性,常见指标有最大概率、概率残差、相对最大概率离差等[7]。相对不确定性表达了像元在2个类别之间的分类不确定性,可描述像元在两大易混淆地类之间的模糊不确定性程度,常见指标有模糊混淆指数、混淆指数[9]、模糊指数等。混合不确定性考虑了像元属于每个类别的所有后验概率,充分反映所有后验概率间的相对关系及不确定性信息,常见指标有概率熵、相对概率熵等[9]。最大概率、模糊混淆指数、概率熵分别是上述3种类型的基础指标,其他指标是在基础指标上的变形发展,综合考虑全面性、互补性、科学性原则及各个指标值的范围、不确定性空间分布结构等因素,本研究选取了最大概率、模糊混淆指数、概率熵作为像元分类不确定性度量指标,用于度量每一像元分类不确定性。
最大概率指标反映了分类结果绝对意义上的不确定性,表示在某一分类体系下将像元赋予最大概率所代表的地类属性。最大概率越小,代表分类不确定越大,计算公式为:
P m a x = p m a x ( w i / x )
式中: P m a x为最大概率; p m a x ( w i / x )为像元x属于类别 w i的后验概率中的最大概率。
模糊混淆指数度量了最大和第二大概率对应地类之间的混淆程度。模糊混淆指数越大,最大和第二大概率越接近,代表分类不确定性越大,计算公式为:
F C I = p s e c m a x ( w i / x ) p m a x ( w i / x )
式中: F C I为模糊混淆指数; p m a x ( w i / x )为像元x属于类别 w i的后验概率中的最大概率; p s e c m a x ( w i / x )为像元x属于类别 w i的后验概率中的第二大概率。
概率熵反映了100%确定像元属于某一类别所需信息量,考虑了像元所有后验概率间的相对关系和不确定性信息。概率熵越大,代表分类不确定越大,计算公式为:
H p = - i = 1 M p w i / x × l o g 2 p w i / x
式中: H p为概率熵; p w i / x为像元x属于类别 w i的后验概率,i=1,2,…,M; M为总的类别数。

3.3 不确定性空间分层

基于模糊C均值聚类算法实现遥感分类不确定性空间分层。模糊C均值聚类算法需要指定聚类类别数,计算样本属于各类别的隶属度,通过最小化目标函数实现聚类,致使相同类内数据变异小,不同类间数据变异大[27],其中隶属度可以表示一个样本属于某一类的概率,取值范围为[0,1]。模糊加权指数,控制数据划分过程中的模糊程度,取值范围为[1.5,2.5],实际计算中通常取值为2[28]。模糊C均值聚类目标函数公式如下:
J = i = 1 c j = 1 N u i j m × d i j 2
式中: u i j为元素j对类别i的隶属度; d i j为元素j与类别中心i的欧氏距离;m为模糊聚类加权指数;c为类别数;N为元素总个数。
不同聚类数目,聚类效果不同,确定最佳分层数目非常关键。最大分区函数F和熵函数H结合可以确定空间分层数目:最大分区函数F[9]度量了空间分层的分离度及不确定性程度,F函数值越大,则代表分离度越大,分层的不确定性越小,分层效果越好;熵函数H[9]反映了像元属于某一分层类别所需要的信息量,H函数值越小,则代表分层所需的信息量越少,分层的不确定性越小。当最大分区函数F函数值取最大,熵函数H函数值取最小时对应的分层数为最佳分层数目。最大分区函数F和熵函数H计算公式分别为:
F = 1 N j = 1 N i = 1 c u i j 2 - 1 c 1 - 1 c
H = - 1 N j = 1 N i = 1 c u i j × l o g u i j - 1 + F l o g c - 1 + F
式中: u i j为元素j对层i的隶属度;c为类别数;N为元素总个数;F为最大分区函数;H为熵函数。

3.4 不确定性空间分层合理性评估

通过度量像元分类不确定性程度及其空间分布特征,进而提出适用于遥感分类的不确定性分层方案。评估空间分层结果的好坏通常采用2种方式:① 基于空间分层结果选择验证数据进行精度评估;② 借助评估参数或指标来验证空间分层效果[7]。由于同一遥感分类结果,参考评价数据不同,获得的总体分类精度也可能不同[23],因此,利用FROM-GLC10遥感数据产品作为参考数据,从定性和定量两个角度评估空间分层结果合理性。
分层合理性定性评估主要是分析各层地类空间特征,定量评估主要是比较分析各层层分类精度与研究区总体分类精度的关系,并与同尺度数据产品精度评价结果及传统空间分层方法进行对比分析。层分类精度为某层正确分类的像元数与该层总的像元数之比,计算公式如下:
φ = μ β × 100 %
式中: φ为层分类精度;μ为研究区分对的像元数目;β为研究区像元总数量。层分类精度越大,代表该层正确分类像元也就越多,错分像元数目越少,即像元大多不易误分,该层分类不确定性越小,反之,该层分类不确定性越大。理论上不确定性大层,其层分类精度应该小于总体分类精度;不确定性小层,其层分类精度大于总体分类精度。
地理探测器中的分异及因子探测器使用q值度量了因变量的空间分异性[29],q值计算公式如下:
q = 1 - 1 N σ 2 h = 1 L N h σ h 2
式中:q为空间分异性指数;Nh 为层h的单元数;N为全区的单元数; σ h 2为层h的NDVI值的方差; σ 2为全区的NDVI值的方差;L为空间分层总数目。q值值域为[0,1],q值越大则空间分层分异性越高,即空间分层效果越好。

4 结果与分析

4.1 不确定性空间分层结果

4.1.1 遥感分类及不确定性空间分层

对顺义区Landsat 8 OLI遥感影像数据进行监督分类,采用图像裁剪、图像增强等预处理,选择Landsat 8 OLI遥感影像数据的Band 7(红)、Band 6(绿)、Band 4(蓝)波段进行波段组合,并调整图像亮度、对比度、锐度等,采用线性拉伸进行图像增强,突出显示水体边界及建筑物和植被特征等。在大量实地调查的基础上,利用ENVI 5.3软件,参考同时期Google Earth影像,考虑到样本均衡性,以地物类别为基础,采用分层抽样方法获取不同类型的训练样本,并保证训练样本可分离度均大于1.80,相应耕地,林地,草地,水域,城乡、工矿、建设用地和未利用地的训练样本数比例为0.36:0.20:0.04:0.09:0.30:0.01。基于随机森林算法利用3个波段的光谱特征对顺义区Landsat 8 OLI遥感影像数据进行监督分类,随机森林分类器参数设置如下:最大决策树个数为100,树的最大深度为8,特征最大数量为0.20,进而获取遥感影像分类结果矢量数据。
顺义区分为耕地,林地,草地,水域,城乡、工矿、建设用地和未利用地6种土地利用类型,分类结果如图3(a)所示。将FROM-GLC10遥感数据产品重分类结果作为参考数据,基于全局的逐像元遍历统计方法进行精度评价。30 m Landsat 8 OLI遥感数据的1个像元对应10 m FROM-GLC10遥感数据的9个像元,选取9个像元所属地类的优势类型或主导类型作为真实参考类型,对该像元分类结果进行精度评价。经计算顺义区总体分类精度为72.56%,以此精度为基准比较各个不确定性空间分层的层分类精度结果。
图3 顺义区遥感分类及不确定性空间分层结果

Fig. 3 Remote sensing classification and spatial stratification of uncertainty results in Shunyi District

基于不确定性度量指标和模糊C均值聚类(模糊加权指数设定为2),设置不同分层数目,进行分类不确定性空间分层。考虑到研究区包含6种土地利用类型,排除不分层情况,设置最小分层数为2,最大分层数为6。利用最大分区函数F和熵函数H来确定最佳分层数目,当分层数目为2、3、4、5、6时获得的最大分区函数F及熵函数H的函数值如表1所示。F函数值在分层数目为2~6层时变化不大,且当分层数为2和3时,F函数值相对较大,而H函数值在分层数为3层时最小,因此确定最佳分层数目为3层。将顺义区按照分类不确定性程度划分为3个互相镶嵌的子区域:不确定性大层、不确定性中层、不确定性小层,如图3(b)所示,相应的面积占比分别为31.23%、32.73%、36.04%。
表1 F和H函数值

Tab. 1 F and H function values

分层数目 F函数值 H函数值
2 0.69 15.67
3 0.64 -1.45
4 0.60 -0.76
5 0.57 -0.50
6 0.56 -0.34

4.1.2 不确定性度量指标分层统计分析

定性分析各层不确定性度量指标的空间特征,指标大小空间分布图可直观展示区域遥感数据不确定性空间分布规律[30]。最大概率、模糊混淆指数、概率熵的最小值、最大值、均值计算结果如表2所示,其空间分布和分层统计特征分别如图4图5所示。
表2 不确定性度量指标统计分析

Tab. 2 Statistical analysis of uncertainty measurement indices

分层 指标 最大概率 模糊混淆指数 概率熵 面积比/%
不确定性大层 最小值 0.28 0.21 0.93 31.23
最大值 0.70 1.00 2.10
均值 0.55 0.72 1.24
不确定性中层 最小值 0.48 0.07 0.69 32.73
最大值 0.83 0.54 1.92
均值 0.72 0.30 1.09
不确定性小层 最小值 0.81 0.00 0.00 36.04
最大值 1.00 0.23 0.94
均值 0.92 0.07 0.46
图4 不确定性度量指标空间分布

Fig. 4 Spatial distribution of uncertainty measurement indices

图5 不确定性度量指标分层统计

Fig. 5 Stratified statistics of uncertainty measurement indices

最大概率的最小值、最大值、均值大小均为不确定性小层>不确定性中层>不确定性大层,模糊混淆指数和概率熵的最小值、最大值、均值大小均为不确定性大层>不确定性中层>不确定性小层。最大概率越小,模糊混淆指数和概率熵越大,分类不确定性越大,3个指标各层最小值、最大值、均值大小与各层不确定性程度相符;图3(b)分类不确定性空间分层结果与图4所显示的3个指标大小空间分布特征基本一致。

4.2 空间分层结果合理性评估

4.2.1 分层结果地类空间特征定性分析

顺义区遥感数据分类结果图3(a)与本研究图3(b)空间分层结果进行空间叠置分析,遥感数据各层分类结果如图6所示,不同土地利用类型在各分层中的面积比例详情如表3所示。
图6 不确定性空间分层地类空间分布

Fig. 6 Spatial distribution of land types for uncertainty spatial stratification

表3 地类不确定性定量统计

Tab. 3 Quantitative statistics of land type uncertainty (%)

统计 不确定性分层 耕地 林地 草地 水域 城乡、工矿、建设用地 未利用地
不同分层地类面积统计 大层 61.25 19.28 3.43 0.25 15.71 0.08
中层 62.35 10.93 3.02 0.38 23.21 0.11
小层 24.80 15.93 1.70 2.40 53.23 1.94
不同地类分层面积统计 大层 39.46 39.26 40.15 7.27 15.48 3.37
中层 42.09 23.32 36.94 11.79 23.96 4.62
小层 18.45 37.42 22.91 80.94 60.56 92.01
根据图6表3分析,空间特征分析如下:河流内部、建设用地内部、林地内部等主要分布在不确定性小层;耕地内部,零星建设用地等主要分布在不确定性中层;耕地、林地、草地与建设用地边界等主要分布在不确定性大层。错分地类大多分布在两两地类边界结汇处,且部分河流及林地等错分现象严重,可能是由于光谱特征、数据时相、地类边界等因素导致,如个别地类光谱特征相似,容易出现同谱异物等现象,不同植被或作物生长季不同,地表覆被季节变化大,且地物相互蔓延交叉,各地类间缺乏过渡性等。错分地类图层与不确定性大层的地类空间分布基本一致,错分地类主要分布在边界区域。

4.2.2 分层结果精度评价定量分析

分类不确定性越大,像元容易误分,更具分类模糊性,对分类结果影响越大,即分类不确定性程度越大,所在分层的层分类精度越小。比较各层的层分类精度与研究区总体分类精度的关系来定量评估空间分层合理性。顺义区遥感数据不确定性大、中、小层的层分类精度分别为62.28%、74.96%、79.31%,不确定性小层的层分类精度最高,不确定性中层次之,不确定性大层最小;与总体分类精度72.56%相比,不确定性大层的层分类精度显著降低,不确定性中层的层分类精度基本一致,不确定性小层的层分类精度明显提高,符合遥感分类不确定性空间分层的客观规律。

4.3 不确定性空间分层对比分析

4.3.1 与同尺度数据产品空间分层结果对比分析

设置与同尺度的土地利用遥感监测数据产品对比实验,从定性和定量两个角度对比评估本研究分类不确定性空间分层的合理性。将中国土地利用遥感监测数据产品重分类结果与本研究图3(b)空间分层结果进行叠加分析,数据产品各层分类结果如图7所示。
图7 同尺度数据产品不确定性空间分层的地类空间分布

Fig. 7 Spatial distribution of land types for uncertainty spatial stratification of data product at the same scale

数据产品分层结果地类空间特征定性分析如下:河流内部、建设用地内部、林地内部等主要分布在不确定性小层;零星的耕地内部、建设用地、河流等主要分布在不确定性中层;建设用地边界、河流边界、草地与林地边界等主要分布在不确定性大层。数据产品分类不确定性大、中、小层与遥感数据各层地类空间分布基本一致。数据产品错分地类图层与不确定性大层地类空间分布基本一致,错分地类主要分布在地类边界区域。
采用10 m FROM-GLC10遥感数据产品重分类结果作为参考数据,定量比较同尺度数据产品的总体分类精度和各层的层分类精度关系。结果表明数据产品的总体分类精度为63.59%,不确定性大、中、小层的层分类精度分别为60.86%、63.66%、65.89%,不确定性小层的层分类精度最高,不确定性中层次之,不确定性大层最小;与总体分类精度63.59%相比,不确定性大层的层分类精度降低,不确定性中层的层分类精度基本保持一致,不确定性小层的层分类精度提高。部分地类出现错分现象,尤其是水域和林地(图7)可能原因在于:① 遥感数据产品本身存在一定的不确定性。受植被空间混合结构、季节性变化特征及不同数据源之间的时相不一致等因素影响。② 可能受训练样本、分类器选择等技术因素,以及边界混合像元、数据时相、地类光谱信息等客观因素影响。③ 分类体系的差异性。不同数据产品对土地利用类型的命名及定义存在差异,对分类结果也造成一定的不确定性。因此,遥感数据与同尺度数据产品各层的层分类精度大小存在差异。

4.3.2 与传统空间分层方法对比分析

设置与传统的不确定性分层方法对比实验,从定性和定量两个角度对比评估本研究分类不确定性空间分层的合理性。选用后验概率不确定性空间分层方法,将像元属于每个类别的后验概率作为模糊C均值空间分层输入数据,设置分层数目为3,基于Python编程语言实现后验概率不确定性空间分层,采用10 m FROM-GLC10遥感数据产品重分类结果作为参考数据,计算不同土地利用类型在各分层中的面积比例及各层的层分层精度和q值,其计算结果分别如表4表5所示。
表4 地类不确定性定量统计

Tab. 4 Quantitative statistics of land type uncertainty (%)

统计 不确定性分层 耕地 林地 草地 水域 城乡、工矿、建设用地 未利用地
不同分层地类面积统计 大层 60.57 20.12 3.14 0.21 15.87 0.09
中层 61.48 11.70 3.35 0.44 22.93 0.10
小层 31.60 14.82 1.90 2.06 47.96 1.66
不同地类分层面积统计 大层 34.21 35.92 32.18 5.21 13.72 3.18
中层 37.95 22.82 37.48 12.41 21.65 3.80
小层 27.84 41.26 30.34 82.38 64.63 93.02
表5 不同分层方法的层分类精度与q值对比分析

Tab. 5 Comparative analysis of stratum classification accuracy and q value for different stratification methods

指标 本研究不确定性分层 后验概率不确定性分层 差值
不确定性大层/% 62.28 63.36 1.08
不确定性中层/% 74.96 71.38 3.58
不确定性小层/% 79.31 79.15 0.16
q 0.24 0.19 0.05
根据表4表5分析,后验概率不确定性分层方法的不确定性大、中、小层的层分类精度分别为63.36%、71.38%、79.15%,与本研究不确定性分层方法获得的不同土地利用类型在各分层中的面积占比趋势接近,两种分层方法获得的各层地类空间特征相似;然而,与后验概率不确定性分层方法相比,本研究不确定性大层的层分类精度降低1.08%,不确定性中层提高3.58%,不确定性小层提高0.16%,q值由0.19提高到0.24,空间分异性更高。结合地类不确定性定量统计结果分析,耕地、林地及草地主要分布在不确定性大层和中层,河流、建设用地及未利用地主要分布在不确定性小层;本研究不确定性分层的优势主要体现在准确度量耕地、林地和草地混淆的不确定性。
综上所述,本研究分类不确定性空间分层结果具有一定的合理性,与传统空间分层方法相比,优势在于能够更加准确度量不同地类混淆的不确定性,空间分异性更好,分层效果更佳。

5 讨论

(1)土地利用类别尺度度量分类不确定性,意味着假定某个类别中所有的像元都具有不确定性,是多个像元综合作用的结果[31],无法详细表达不确定性的空间分布;但本研究在像元尺度上确定度量指标评估分类不确定性,可直观地了解分类不确定性大小及分布的空间结构和趋势[32]。不确定性度量指标的选择兼顾了各种指标类型,通过构建最大分区函数F和熵函数H定量计算最佳分层数目,避免了分层数目选择的盲目性和主观性。与传统空间分层方式相比,本研究不确定性空间分层的空间分异性更好,分层效果更佳,可以为遥感分类训练样本、精度评价验证样本的空间布设优化提供参考。例如,训练样本选择时,对不确定性较大的层采取增加样本或单独训练的方式,降低分类不确定性,提高遥感图像总体分类精度。
(2)在训练样本及不确定性度量指标选择上还存在一定的不确定性。① 基于训练样本计算的后验概率,在一定程度上能够代表地类分类概率,但像元的后验概率与像元分类结果正确与否并不完全一致,可能会出现部分像元后验概率高但被误分的情况。此外,不同区域遥感分类结果的不确定性不具有可比性[3]。② 本研究基于绝对不确定性、相对不确定性、混合不确定性3个类别,在每一类别选择一个度量指标,虽然兼顾了各种类型,但选取的不确定性度量指标之间可能相关关联,存在一定相关性,且相互关系不明确,对分层结果可能会产生一定的误差[1],后续可能会考虑对指标进行主成分分析[33],以互不相关的主成分进行空间分层。
(3)精度评价过程的不确定性和分类体系的差异性。受植被空间混合结构、季节性变化特征、不同数据源之间的时相不一致等因素影响,研究区遥感数据产品在林地、耕地和草地之间存在一定的错分现象[4]。不同数据产品对土地利用类型的命名及定义存在差异,例如水域,两类数据产品对水域定义的相同之处在于都包括海洋、湖泊、水库坑塘和河流,水体面积随季节变化;不同之处在于中国土地利用遥感数据产品还包括永久性冰川雪地、滩涂和滩地。虽然二者对水域类型的定义存在一定的差异和不确定性,但是水域类型面积占比较小,亚类占比更低,整体上对本文研究结果影响不大。未来考虑综合集成数据产品、高分影像数据、标签数据库等,进一步消除精度评价过程中的不确定性和分类体系的差异性。

6 结论

合理的遥感分类不确定性分层设计,可以准确度量并获取遥感分类不确定性程度及其空间分布。本研究提出一种基于不确定性分析的遥感分类空间分层和评估方法:基于随机森林算法从像元尺度选择分类不确定性度量指标,使用模糊C均值聚类进行分类不确定性空间分层,并从定性和定量2个角度评估空间分层结果的合理性。以顺义区Landsat 8 OLI遥感影像数据为例开展研究,主要结论如下:
(1)基于随机森林算法获取像元属于每个类别的后验概率,确定了分类不确定性度量指标:最大概率、模糊混淆指数和概率熵,确定最佳分层数目为3,利用模糊C均值聚类方法将顺义区划分为不确定性大、中、小三层。
(2)顺义区分类不确定性空间分层结果与度量指标大小的空间分布基本一致,错分地类图层与不确定性大层地类空间分布基本一致;不确定性大、中、小层的层分类精度分别为62.28%、74.96%、79.31%,遥感数据和数据产品的各层地类空间特征、层分类精度大小趋势一致;与总体分类精度相比,不确定性大层的层分类精度降低,不确定性小层的层分类精度提高;与后验概率不确定性分层方法相比,本研究不确定性大层的层分类精度降低1.08%,不确定性中层提高3.58%,不确定性小层提高0.16%, q值由0.19提高到0.24。结果表明,研究的遥感分类不确定性空间分层结果具有一定的合理性和科学性,准确度量了不同地类混淆的不确定性,空间分异性更好,分层效果更佳。
(3)研发的不确定性空间分层可以为遥感分类训练样本、精度评价验证样本的空间布设优化提供参考,但在训练样本的代表性选取、度量指标的相关性消除、精度评价参考数据选择和分类体系差异性等方面存在一定的不确定性,未来考虑综合集成代表性空间抽样、主成分分析、不同类型多尺度数据产品、野外调查数据等,进一步降低或消除研究过程中的上述不确定性。
[1]
葛咏, 王劲峰, 梁怡, 等. 遥感信息不确定性研究[J]. 遥感学报, 2004(4):339-348.

[ Ge Y, Wang J F, Leung Y, et al. Study on the uncertainty of remote sensing information[J]. Journal of Remote Sensing, 2004(4):339-348. ] DOI: 10.3321/j.issn:1007-4619.2004.04.008

DOI

[2]
林禹, 赵泉华, 李玉. 一种基于深度传递迁移学习的遥感影像分类方法[J]. 地球信息科学学报, 2022, 24(3):495-507.

DOI

[ Lin Y, Zhao Q H, Li Y. A remote sensing image classification method based on deep transitive transfer learning[J]. Journal of Geo-information Science, 2022, 24(3):495-507. ] DOI: 10.12082/dqxxkx.2022.210428

DOI

[3]
柏延臣, 王劲峰. 遥感数据专题分类不确定性评价研究:进展、问题与展望[J]. 地球科学进展, 2005, 20(11):1218-1225.

DOI

[ Bo Y C, Wang J F. Assessment on uncertainty in remotely sensed data classification: progresses, problems and prospects[J]. Advances in Earth Science, 2005(11):66-73. ] DOI: 10.3321/j.issn:1001-8166.2005.11.008

DOI

[4]
郭燕, 田延峰, 吴宏海, 等. 基于多源数据和模糊k-均值方法的农田土壤管理分区研究[J]. 土壤学报, 2013, 50(3):441-447.

[ Guo Y, Tian Y F, Wu H H, et al. Zoning of soil management based on multi-sources data and fuzzy-k means[J]. Acta Pedologica Sinica, 2013, 50(3):441-447. ]

[5]
Chowdhury K, Chaudhuri D, Pal A K. An entropy-based initialization method of K-means clustering on the optimal number of clusters[J]. Neural Computing and Applications, 2021, 33(12):6965-6982. DOI: 10.1007/s00521-020-05471-9

DOI

[6]
金佳鑫, 王颖, 江洪, 等. 基于遥感和典范对应分析方法优化生态地理分区——以中国区域为例[J]. 中国科学:地球科学, 2016, 46(9):1188-1196.

[ Jin J X, Wang Y, Jiang H, et al. Improvement of ecological geographic regionalization based on remote sensing and canonical correspondence analysis: A case study in China[J]. Scientia Sinica(Terrae), 2016, 46(9):1188-1196. ] DOI: 10.1360/N072015-00216

DOI

[7]
吴亚楠, 董士伟, 肖聪, 等. 面向遥感分类精度评价的空间分层模式与分异性评估[J]. 农业机械学报, 2021, 52(8):147-153.

[ Wu Y N, Dong S W, Xiao C, et al. Spatial stratification mode and differentiation evaluation for accuracy assessment of remote sensing classification[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(8):147-153. ] DOI: 10.6041/j.issn.1000-1298.2021.08.014

DOI

[8]
Dong S W, Chen Z Y, Gao B B, et al. Stratified even sampling method for accuracy assessment of land use/land cover classification: A case study of Beijing, China[J]. International Journal of Remote Sensing, 2020, 41(16):6427-6443. DOI: 10.1080/01431161.2020.1739349

DOI

[9]
Tapia R, Stein A, Bijker W. Optimization of sampling schemes for vegetation mapping using fuzzy classification[J]. Remote Sensing of Environment, 2005, 99(4):425-433. DOI: 10.1016/j.rse.2005.09.013

DOI

[10]
曾永年, 靳文凭, 何丽丽, 等. 青海高原东部农业区土地利用遥感分类制图[J]. 农业工程学报, 2012, 28(16):225-231.

[ Zeng Y N, Jin W P, He L L, et al. Land use mapping using remote sensing for eastern part of Qinghai Plateau[J]. Transactions of the Chinese Society of Agricultural Engineering, 2012, 28(16):225-231. ] DOI: 10.3969/j.issn.1002-6819.2012.16.035

DOI

[11]
张华. 遥感数据可靠性分类方法研究[D]. 徐州: 中国矿业大学, 2012.

[ Zhang H. Study on the reliable classification methods based on remtely sensed image[D]. Xuzhou: China University of Mining and Technology, 2012. ]

[12]
张贵花, 王瑞燕, 赵庚星, 等. 基于物候参数和面向对象法的濒海生态脆弱区植被遥感提取[J]. 农业工程学报, 2018, 34(4):209-216.

[ Zhang G H, Wang R Y, Zhao G X, et al. Extraction of vegetation information in coastal ecological vulnerable areas from remote sensing data based on phenology parameters and object-oriented method[J]. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(4):209-216. ] DOI: 10.11975/j.issn.1002-6819.2018.04.025

DOI

[13]
奚旭, 张新长, 孙才志, 等. 不确定性条件下的下辽河平原地下水脆弱性评价及空间分布软区划[J]. 地理科学, 2017, 37(9):1439-1448.

DOI

[ Xi X, Zhang X C, Sun C Z, et al. Assessment and soft zoning of groundwater vulnerability in the lower reach of the Liaohe river plain under uncertainty condition[J]. Scientia Geographica Sinica, 2017, 37(9):1439-1448. ] DOI: 10.13249/j.cnki.sgs.2017.09.017

DOI

[14]
刘艳芳, 兰泽英, 刘洋, 等. 基于混合熵模型的遥感分类不确定性的多尺度评价方法研究[J]. 测绘学报, 2009, 38(1):82-87.

[ Liu Y F, Lan Z Y, Liu Y, et al. Multi-scale evaluation method for uncertainty of remote sensing classification based on hybrid entropy model[J]. Acta Geodaetica et Cartographica Sinica, 2009, 38(1):82-87. ] DOI: 10.3321/j.issn:1001-1595.2009.01.014

DOI

[15]
Koukoulas S, Blackburn G A. Introducing new indices for accuracy evaluation of classified images representing semi-natural woodland environments[J]. Photogrammetric Engineering and Remote Sensing, 2001, 67(4):499-510.

[16]
甘秀娜, 李明, 王月波. 基于信息粒化的区间值信息系统不确定性度量方法[J]. 计算机应用与软件, 2021, 38(8):107-114.

[ Gan X N, Li M, Wang Y B. Uncertainty measurement method of interval-valued information system based on information granulation[J]. Computer Applications and Software, 2021, 38(8):107-114. ] DOI: 10.3969/j.issn.1000-386x.2021.08.018

DOI

[17]
吴浩, 程志萍, 史文中, 等. 遥感云分类不确定性的多维混合熵模型评价[J]. 测绘科学, 2016, 41(5):50-54+176.

[ Wu H, Cheng Z P, Shi W Z, et al. Evaluation on uncertainty of RS cloud classification based on multidimensional hybrid entropy model[J]. Science of Surveying and Mapping, 2016, 41(5):50-54+176. ] DOI: 10.16251/j.cnki.1009-2307.2016.05.011

DOI

[18]
Goodchild M F, Sun G Q, Yang S R. Development and test of an error model for categorical data[J]. International Journal of Geographical Information Systems, 1992, 6(2):87-103.

DOI

[19]
谭磊, 赵书河, 罗云霄, 等. 基于对象特征的山东省丘陵地区多时相遥感土地覆被自动分类[J]. 生态学报, 2014, 34(24):7251-7260.

[ Tan L, Zhao S H, Luo Y X, et al. Application of object-oriented image analysis to land-cover classification in hilly areas[J]. Acta Ecologica Sinica, 2014, 34(24):7251-7260. ] DOI: 10.5846/stxb201310142476

DOI

[20]
徐慧. 遥感影像不确定性对分类结果可靠性影响模式研究[D]. 武汉: 武汉大学, 2020.

[ Xu H. Exploration of the influence model remote sensing image uncertainty on classification[D]. Wuhan: Wuhan University, 2020. ]

[21]
吴尚蓉, 刘佳, 杨鹏. 基于参数型指数混合熵模型的农业遥感分类不确定性评价[J]. 农业工程学报, 2013, 29(6):177-184+296.

[ Wu S R, Liu J, Yang P. Evaluation on uncertainty in agricultural remote sensing classification based on exponential hybrid entropy model in parametric form[J]. Transactions of the Chinese Society of Agricultural Engineering, 2013, 29(6):177-184+296. ] DOI: 10.3969/j.issn.1002-6819.2013.06.022

DOI

[22]
刘纪远, 匡文慧, 张增祥, 等. 20世纪80年代末以来中国土地利用变化的基本特征与空间格局[J]. 地理学报, 2014, 69(1):3-14.

[ Liu J Y, Kuang W H, Zhang Z X, et al. Spatiotemporal characteristics, patterns and causes of land use changes in China since the late 1980s[J]. Acta Geographica Sinica, 2014, 69(1):3-14. ]

[23]
Gong P, Liu H, Zhang M N, et al. Stable classification with limited sample: Transferring a 30-m resolution sample set collected in 2015 to mapping 10-m resolution global land cover in 2017[J]. Science Bulletin, 2019, 64(6):370-373. DOI: 10.1016/j.scib.2019.03.002

DOI

[24]
Dong S W, Gao B B, Pan Y C, et al. Assessing the suitability of FROM-GLC10 data for understanding agricultural ecosystems in China: Beijing as a case study[J]. Remote Sensing Letters, 2020, 11(1):11-18. DOI: 10.1080/2150704X.2019.1677966

DOI

[25]
陈逸聪, 邵华, 李杨. 多源土地覆被产品在长三角地区的一致性分析与精度评价[J]. 农业工程学报, 2021, 37(6):142-150.

[ Chen Y C, Shao H, Li Y. Consistency analysis and accuracy assessment of multi-source land cover products in the Yangtze River Delta[J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(6):142-150. ] DOI: 10.11975/j.issn.1002-6819.2021.06.018

DOI

[26]
马玥, 姜琦刚, 孟治国, 等. 基于随机森林算法的农耕区土地利用分类研究[J]. 农业机械学报, 2016, 47(1):297-303.

[ Ma Y, Jiang Q G, Meng Z G, et al. Classification of land use in farming area based on random forest algorithm[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(1):297-303. ]

[27]
肖满生, 肖哲, 文志诚, 等. 一种空间相关性与隶属度平滑的FCM改进算法[J]. 电子与信息学报, 2017, 39(5):1123-1129.

[ Xiao M S, Xiao Z, Wen Z C, et al. Improved FCM clustering algorithm based on spatial correlation and membership smoothing[J]. Journal of Electronics & Information Technology, 2017, 39(5):1123-1129. ] DOI: 10.11999/JEIT160710

DOI

[28]
Pal N R, Bezdek J C. On cluster validity for the fuzzy C-means model[J]. IEEE Transactions on Fuzzy Systems, 1995, 3(3):370-379. DOI: 10.1109/91.413225

DOI

[29]
Wang J F, Hu Y. Environmental health risk detection with GeogDetector[J]. Environmental Modelling & Software, 2012, 33:114-115. DOI: 10.1016/j.envsoft.2012.01.015

DOI

[30]
黄敬峰, 陈拉, 王晶, 等. 水稻种植面积遥感估算的不确定性研究[J]. 农业工程学报, 2013, 29(6):166-176,300.

[ Huang J F, Chen L, Wang J, et al. Uncertainty analysis of rice planting area extraction based on different classifiers using Landsat data[J]. Transactions of the Chinese Society of Agricultural Engineering, 2013, 29(6):166-176,300. ]

[31]
李三平, 葛咏, 李德玉. 遥感信息处理不确定性的可视化表达[J]. 国土资源遥感, 2006, 18(2):20-25,81.

[ Li S P, Ge Y, Li D Y. Visualizing presentation of the attribute uncertainty in classified remotely sensed imagery[J]. Remote Sensing for Natural Resources, 2006, 18(2):20-25,81. ] DOI: 10.3969/j.issn.1001-070X.2006.02.006

DOI

[32]
葛咏, 李三平. 遥感分类信息不确定性的可视化表达方法[J]. 地球信息科学, 2008, 10(1):88-96.

[ Ge Y, Li S P. Visualizing uncertainty in classified remote sensing images[J]. Journal of Geo-information Science, 2008, 10(1):88-96. ]

DOI

[33]
杨楠, 连雅, 夏新, 等. 典型区域土壤重金属空间变异与多变量均质性分区研究[J]. 农业环境科学学报, 2021, 40(7):1451-1459.

[ Yang N, Lian Y, Xia X, et al. Spatial variability and multivariate homogeneity division of soil heavy metals in typical areas[J]. Journal of Agro-Environment Science, 2021, 40(7):1451-1459. ] DOI: 10.11654/jaes.2020-1029

DOI

文章导航

/