Suitability Analysis on Behavior-based Aggregation of Land Use Classification in Yunnan Province

  • SUN Yunhua , 1, 2 ,
  • GUO Tao , 3, * ,
  • CUI Ximin 1 ,
  • CUI Weihong 2
  • 1. College of Geoscience and Surveying Engineering, China University of Mining & Technology, Beijing 100083, China
  • 2. Institute of Remote Sensing and Digital Earth, CAS, Beijing 100101, China
  • 3. School of Computer Science and Technology, Hunan University of Science and Technology, Xiangtan 411201, China
*Corresponding author: GUO Tao, E-mail:

Received date: 2015-05-30

  Request revised date: 2015-07-07

  Online published: 2016-03-10


Comparison of the same study area between two time points on the same categorical variable can reveal changes occurred among categories over time, such as transitions among land categories. Therefore, it is an effective method to aggregate a large number of categories into a smaller number of broader categories in order to simplify interpretation and give insights concerning categorical change over time. We use an algorithm to aggregate categories in a sequence of steps based on the categories' behaviors in terms of gross losses and gross gains. The behavior-based algorithm aggregates net gaining categories with net gaining categories, and aggregates net losing categories with net losing categories, but doesn't aggregates a net gaining category with a net losing category. The algorithm's steps are summarized into three phases. The first phase is the Exclusive Zero phase, when our algorithm aggregates pairs of Exclusive Zero categories until all Exclusive Zero categories are aggregated into one comprehensive Exclusive Zeroes category, which remains as one of the three categories at the end of the algorithm. The second phase is the Exclusive Loser and Gainer phase, when the algorithm aggregates pairs of Exclusive Gainer categories and pairs of Exclusive Loser categories. The third phase is the swapping phase. In this final phase, our algorithm computes the transition sum for every possible pair of categories that have the same direction of net change. Moreover, the behavior-based algorithm at each step in the sequence keeps the values of net change and maximizes swap change. This article introduces three mathematical principles and defines six aggregation behaviors. In the last section of this article, we present a case study, in which the data are obtained in Yunnan Province between 1990 and 2010 for 20 land categories, in order to prove the advantage and feasibility of this algorithm in terms of area change and intensity change. The results show that the behavior-based algorithm produces a set of 9 categories that retains almost the original amount of change, while giving a total area change of 5.10%, which is only 0.06% lower than the original change. In contrast, the common used classification system of 6 categories produces a total area change of 4.7%, which is 0.4% lower than the results of our algorithm. It has been found that the behavior-based algorithm is an effective method to retain land use dynamic change information.

SUN Yunhua , GUO Tao , CUI Ximin , CUI Weihong . Suitability Analysis on Behavior-based Aggregation of Land Use Classification in Yunnan Province[J]. Journal of Geo-information Science, 2016 , 18(3) : 396 -405 . DOI: 10.3724/SP.J.1047.2016.00396

1 引言


2 行为聚类算法

2.1 行为聚类的基本公式解释

式(1)-(6)分别定义了Lk,Gk,Tij,D,N,S.式(1)表示在时间间隔内地类k的总减少变化面积,Lk是地类jt时刻的总变化面积(括号内的公式)与主对角线保持不变地类面积Ckk的差值,J表示地类总数.式(2)表示在时间间隔内地类k的总增加变化面积,是地类i t + 1 时刻的总变化面积(括号内的公式)与主对角线保持不变地类面积Ckk的差值.式(3)的Tij表示关联表中除了对角线保持不变的地类面积,即地类i和地类j之间相互转变的总和;Cij表示某一时间间隔内由初始时刻的地类i转变为末期时刻地类j的面积;Cji表示某一时间间隔内由初始时刻的地类j转变为末期时刻地类i的面积.式(4)计算了在时间间隔 [ Y t , Y t + 1 ] 内,所有地类的总变化面积D,等于t时刻所有减少地类k的总面积,也等于在 t + 1 时刻所有增加地类k的总面积.式(5)定义了净变化N,来源于地类k的总增加面积Gk与总减少面积Lk之差的绝对值,除以2的原因是在t时刻地类k的总减少面积Lk t + 1 时刻总增加面积Gk同时存在.式(6)表示转变变化面积S等于总变化面积D与净变化面积N的差值.
L k = j = 1 J C kj - C kk (1)
G k = j = 1 J C ik - C kk (2)
T ij = C ij + C ji ( i > j ) (3)
D = k = 1 J L k = k = 1 J G k (4)
N = k = 1 J | L k - G k | 2 (5)
S = D - N (6)

2.2 行为聚类的3个原则

对于聚类前的遥感解译影像,利用任意2个地类之间聚类可能性,得到聚类后的结果.本文从数学角度对下述的原则1,2,3进行了证明,聚类后的总变化面积D,净变化部分面积N和转变变化部分面积S取决于聚类前遥感解译影像中的地类A与地类B之间是否存在相互转换,以及是否存在时间间隔 [ Y t , Y t + 1 ] 内地类A与地类B转变时表现为净减少或净增加.3个原则都是基于整个时间间隔内的总变化D等于净变化面积N和转变变化面积S之和(式(6)).因此,由聚类产生的整个时间间隔内总变化面积差值 ΔTota l M 等于净变化面积差值 ΔNe t M 和转变变化面积差值 ΔSwa p M 之和,如式(7)所示.
ΔTota l M = ΔNe t M + ΔSwa p M (7)
原则1可应用于所有情况,也是提出其他原则的基础,原则2和原则3应用于减少地类和减少地类合并或增加地类和增加地类合并的情况.原则2描述了对总变化中净变化部分面积聚类产生的影响,原则3描述了总变化中转变变化部分面积在 聚类过程中产生的影响.原则1和原则2证明了原则3.
原则1:假设对于任意相互发生转变的地类都可进行聚类,则聚类会使整个时间间隔内总变化面积减少,差值用 ΔTota l M 表示.式(8)从数学角度表达了任意地类i和地类j相互发生转变,对地类i和地类j进行聚类后,总变化面积差值为 ΔTota l M .
ΔTota l M = - ( C ij + C ji ) (8)
任意2种地类合并后,二者之间的转变由非主对角线元素转为对角线元素.地类ij的合并会减少总变化面积,其值变为总变化面积D减去 C ij + C ji ,原因是 C ij + C ji 转变为保持不变的面积,即转变为对角线元素.地类合并导致遥感解译地图上总变化面积减少.聚类后总变化唯一不会减少的特例是没有发生任何转变的地类进行合并,即 C ij + C ji = 0 .
原则2:假设净减少地类和净减少地类合并或净增加地类和净增加地类合并,聚类后的遥感影像的净变化面积N保持不变.用数学语言来讲,如果( C + i - C i + 0 C + j - C j + 0 )或( C + i - C i + 0 C + j - C j + 0 ).其中, C + i 代表末期类型i的总量; C + i 代表的是初期类型i的总量; C j + 代表末期类型j的总量; C j + 代表初期类型j的总量(式(9)).
ΔNe t M = 0 (9)
原则3:假设净减少地类和净减少地类合并或净增加地类和净增加地类合并,聚类后的遥感解译影像上的转变变化面积减少.从数学角度来看,如果 C + i - C i + 0 C + j - C j + 0 ,或 C + i - C i + 0 C + j - C j + 0 ,则表示为式(10):
ΔSwa p M = - ( C ij + C ji ) (10)
当合并的地类显示为净变化方向时,地类ij的合并会使转变变化部分面积减少了 C ij + C ji .式(10)是式(8),(9)取代式(7)的结果.因此,原则3是原则1,2产生的直接结果,因为所有涉及地类聚类的原则都有相同的净变化方向.原则3适用于原则2所适用的所有条件.

2.3 行为聚类的6种行为方式

(1)当总减少 L k > 0 且总增加 G k = 0 ,聚类后遥感影像地类k在某一空间位置出现总减少,把这种聚类行为定义为完全减少地类(Exclusive Loser);
(2)当 L k = G k = 0 ,聚类后的遥感影像地类k既不出现增加也不出现减少的现象,把这种聚类的行为方式定义为完全不变地类(Exclusive Zero);
(3)当 L k = 0 G k > 0 ,聚类后的遥感影像地类k在空间某一位置仅出现了总增加,把这种行为聚类方式定义为完全增加地类(Exclusive Gainer);
(4)当 L k > G k > 0 ,聚类后的遥感影像地类k在空间某一位置增加,在空间其他位置减少,且地类k的总减少大于总增加,地类k在空间位置发生了重新分配现象,把这种行为聚类方式定义为转变减少地类(Swapping Loser);
(5)当 L k = G k > 0 ,聚类后的遥感影像地类k在空间上发生了地类增加和地类减少,且减少地类和增加地类面积相同,则把这种地类的行为聚类方式定义为转变为零地类(Swapping Zero);
(6)当 G k > L k > 0 ,聚类后的遥感影像地类k增加和减少在空间位置发生分配,并且增加地类的面积大于减少地类的面积,把这种地类行为聚类方式定义为转变增加地类(Swapping Gainer).

2.4 行为聚类算法流程

Fig. 1 Methodological flow of the algorithm

图1 基于行为聚类的算法流程图

第1阶段是完全不变阶段(Exclusive Zero Phase),用该算法将所有完全不变(Exclusive Zero)的地类进行聚类,直到所有完全不变地类(Exclusive Zero)合并为一种综合的完全不变地类,在算法结束时仅保留3种地类中的一种.完全不变阶段通过选择具有最小变化信息的地类,决定了地类合并的先后次序.

2.5 地类的强度变化分析

式(11)给出了研究区域整个时间范围 [ Y 1 , Y T ] 的统一变化强度,分子中的Ctij表示t时刻从地类i转变到地类j的面积,Ctjj表示t时刻转移矩阵中保持不变地类的面积.对于特定时间间隔 [ Y t , Y t + 1 ] ,式(12),(13)分别给出了地类的年均观察增加变化强度和年均观察减少变化强度,也在每个特定时间间隔内为每种地类产生了一个输出结果.通过比较观察变化强度大小和统一变化强度,如果某地类的强度变化大于统一变化强度,就称该地类是活跃的;如果某地类的变化强度小于统一变化强度,就称该地类是沉寂的.
U = t = 1 T - 1 j = 1 J i = 1 J C tij - C tjj / j = 1 J i = 1 J C t ij Y T - Y 1 × 100 % (11)
G tj = i = 1 J C tij - C tjj / Y t + 1 - Y t i = 1 J C tij × 100 % (12)
L ti = j = 1 J C tij - C tii / Y t + 1 - Y t j = 1 J C tij × 100 % (13)

3 算法实验结果与分析


3.1 基于行为聚类结果

Tab. 1 Behavior-based aggregation sequence

表1 基于行为聚类方法的次序

地类数量 地类总变化/(%) 转变变化/(%) 净变化/(%) 聚类次序 聚类类型
20 5.16 3.60 1.56 湖泊,沼泽地 G/净增加,G/净增加
19 5.16 3.60 1.56 河渠,水库坑塘 G/净增加,G/净增加
18 5.16 3.60 1.56 冰川与永久积雪,裸地 L/净减少,L/净减少
17 5.16 3.60 1.56 低覆盖度草地,滩地 G/净增加,G/净增加
16 5.16 3.60 1.56 有林地,聚类18 L/净减少,L/净减少
15 5.16 3.60 1.56 聚类16,裸岩石砾地 L/净减少,L/净减少
14 5.16 3.60 1.56 旱地,聚类20 G/净增加,G/N净增加
13 5.15 3.59 1.56 聚类14,聚类17 G/净增加,G/净增加
12 5.15 3.58 1.56 水田,聚类 15 L/净减少,L/净减少
11 5.14 3.57 1.56 聚类13,聚类 19 G/净增加,G/净增加
10 5.12 3.56 1.56 聚类11,工交建设用地 G/净增加,G/净增加
9 5.10 3.53 1.56 聚类10,城镇 G/净增加,G/净增加
8 5.05 3.49 1.56 疏林地,中覆盖度草地 L/净减少,L/净减少
7 5.01 3.45 1.56 聚类12,灌木林地 L/净减少,L/净减少
6 4.64 3.08 1.56 其他林地,农村居民点 G/净增加,G/净增加
5 4.64 3.08 1.56 聚类7,聚类8 L/净减少,L/净减少
4 4.09 2.52 1.56 聚类5,高覆盖度草地 L/净减少,L/净减少
3 3.06 1.50 1.56 聚类9,聚类6 G/净增加,G/净增加
2 2.95 1.38 1.56
Fig. 2 Swap change and net change during 1990-2010 in terms of percentage on the study extent for the behavior-based aggregation sequence

图2 1990-2010年行为聚类次序地类转换和地类净变化面积百分比


3.2 1990-2010年6个和9个土地利用类型变化 面积和变化强度

图3(a)是1990-2010年6个土地利用类型分类结果变化面积,建设用地,林地和水域的增加面积大于减少面积,并且都大于零,属于转变增加地类(Swapping Gainer);耕地,草地和裸地的增加面积小于减少面积,但都大于零,属于转变减少地类(Swapping Loser).结合图3(a)和表2的转移矩阵可看出,建设用地和林地增加面积主要来自于耕地和草地,也存在耕地,草地和林地之间的相互转换.
Fig. 3 Percentage of area change of different land categories during 1990-2010

图3 1990-2010年土地利用类型变化面积百分比

Tab. 2 Cross-tab of six land categories during 1990-2010 in Yunnan Province (hm2)

表2 1990-2010年云南省6个一级类型的转移矩阵(hm2)

1990年 2010年
耕地 林地 草地 水域 建设用地 裸地 总减少
耕地 6 530 509 120 729 146 418 6122 99 727 1407 374 403
林地 104 013 21 606 562 239 751 5735 16 805 766 367 072
草地 211 137 299 079 8 216 116 5935 21 057 1644 538 852
水域 2156 1413 8898 270 013 784 158 13 409
建设用地 5597 1023 1362 645 170 057 473 9100
裸地 2234 1413 57 804 275 96 151 779 61 822
总增加 325 137 423 658 454 233 18 712 138 469 4448
图3(b)是1990-2010年行为聚类土地利用分类结果的变化面积,建设用地,园地,人工草地和水域的增加面积大于减少面积,并且都大于零,属于转变增加地类(Swapping Gainer);森林地,疏林地,耕地,天然牧草地和裸地的减少面积大于增加面积,并且都大于零,属于转变减少地类(Swapping Loser).从表3的转移矩阵可看出,建设用地的增加主要源于耕地的减少,园地的增加源于森林地和天然牧草地的减少.这也可看出,原始森林转为橡胶园茶园的面积逐年增加[18],并且随着桉树等速生经济林的广泛种植[19],虽然云南省林地总面积增加,但生物多样性降低,水源涵养性变弱,水土流失严重,干旱等自然灾害加重[20].
Tab. 3 Cross-tab of nine land categories during 1990-2010 in Yunnan Province (hm2)

表3 1990-2010年云南省行为聚类结果的转移矩阵(hm2)

1990年 2010年
耕地 森林地 疏林地 园地 天然牧草地 人工草地 水域 建设用地 裸地 总减少
耕地 6 529 142 81 532 19 346 19 823 144 086 2244 6088 99 711 1407 374 237
森林地 60 799 16 675 113 17 398 226 482 179 115 31 4218 11076 321 499 443
疏林地 38 126 68 825 4 406 585 44 312 57 316 63 1446 4352 403 214 843
园地 5079 1289 199 157 009 3139 32 43 1373 42 11 196
天然牧草地 210 692 197 730 22 972 76 378 7 948 931 2085 5888 20 270 1621 537 636
人工草地 419 1652 240 23 6920 254 358 26 785 23 10 088
水域 2147 980 295 138 5563 3335 268 223 781 158 13 397
建设用地 5597 479 356 188 1362 0 645 170 052 473 9100
裸地 2234 1413 0 0 12 124 45 540 275 96 151 324 61 682
总增加 325 093 353 899 60 806 367 344 409 625 53 330 18 629 138 444 4448 374 237
Fig. 4 Gross gain intensity and gross loss intensity of different land categories during 1990-2010

图4 1990-2010年土地利用类型增加强度和减少强度变化


3.3 分类结果对比分析

Fig. 5 Comparison between the 20 original categories, the 6 common used categories and the 9 behavior-based categories

图5 基于行为聚类,常用分类系统和原始分类系统结果比较

4 结论与讨论

致谢:感谢美国克拉克大学地理学院Robert Gilmore Pontius, Jr教授给予的指导.感谢中国科学院遥感与数字地球研究所张增祥研究员提出的宝贵意见.

