Mapping the Landslide Susceptibility Considering Future Land Use Dynamics Scenario

  • JIN Bijing , 1 ,
  • ZENG Taorui 2 ,
  • GUI Lei , 1, * ,
  • YIN Kunlong 1 ,
  • ZHU Yuhang 1 ,
  • LIU Yang 1
Expand
  • 1. Institute of Geological Survey, China University of Geosciences, Wuhan 430074, China
  • 2. Faculty of Engineering, China University of Geosciences, Wuhan 430074, China
*GUI Lei, E-mail:

Received date: 2024-01-05

  Revised date: 2024-02-10

  Online published: 2024-05-24

Supported by

National Natural Science Foundation of China(4187752)

National Natural Science Foundation of China(41601563)

National Key Research and Development Program of China(2023YFC3007201)

Abstract

The urbanization in mountainous areas will cause land use changes, thereby potentially altering the landslide susceptibility. However, there is a lack of research on landslide susceptibility under future land use dynamics in landslide hazard management at present. In this study, taking the towns along the Yangtze River in Wanzhou District, Chongqing City as an example, we first used the Patch-generating Land Use Simulation (PLUS) model to predict the dynamic factors of land use in 2025 and 2030. Then, combined with the static factors collected and landslide data in the study area, we constructed a database for susceptibility assessment. The Particle Swarm Optimization (PSO) algorithm was used to adjust the hyperparameters of the ensemble learning models based on the GBDT (Gradient Boosting Decision Tree) framework, including XGBoost, LightGBM, and CatBoost, and conduct dynamic susceptibility modeling. Finally, we mapped the landslide susceptibility under scenarios of future land use dynamics based on the optimal evaluation model. The results show that: (1) the land use change results based on the PLUS model can provide accurate basic data for predicting future landslide-prone areas; (2) by comparing the AUC results before and after the involvement of the PSO algorithm in the modeling, we found that the PSO-CatBoost model was able to better fit the nonlinear relationship between the landslide inventory and the triggering factor in the study area, and achieved an optimal modeling accuracy; (3) our research framework that integrates future land use dynamics and landslide susceptibility suggested that future development of building lands in townships along the Yangtze River will increase landslide susceptibility. The research approach proposed in this paper is of great practical significance for building a resilient and effective disaster prevention and reduction system in mountainous urban areas and can provide scientific guidance for the future planning of mountainous urban areas.

Cite this article

JIN Bijing , ZENG Taorui , GUI Lei , YIN Kunlong , ZHU Yuhang , LIU Yang . Mapping the Landslide Susceptibility Considering Future Land Use Dynamics Scenario[J]. Journal of Geo-information Science, 2024 , 26(6) : 1486 -1499 . DOI: 10.12082/dqxxkx.2024.240009

1 引言

滑坡作为世界上最为频繁的地质灾害之一,每年都会造成严重的人员伤亡,并威胁到社会经济环境的安全有效运行[1-2]。滑坡灾害的发生受多种外部因素的驱动,如:降雨、库水位变动及人类工程活动等[3-4]。随着三峡水库蓄水工程的开展,作为移民搬迁的主要安置地之一,万州城区面积在数十年内不断扩展。然而,在城市扩张的过程中不可避免的会对斜坡体原有的稳定性造成影响,如万州区内历史上发生变形的特大型滑坡:塘角1号滑坡、和平广场滑坡和枇杷坪滑坡等严重威胁着研究区人民的生命财产安全。
土地利用作为人类社会经济工程活动的表征之一,被视为衡量地区生态的重要因素,能够反映区域人类活动强度大小[5-6]。同时,土地利用会影响地表覆盖的情况,进而影响岩土体的水文与力学条件,从而改变斜坡体的稳定性状态[7-8]。近年许多研究认为,土地利用可能会增加滑坡发生的空间概率[9]。然而,在当前滑坡易发性的建模过程中少有学者考虑未来动态的土地利用变化对滑坡易发性分布所造成的影响,缺乏以未来的视角开展研究[10-11]。随着国土资源规划的需要,许多学者基于卫星遥感数据对土地利用进行提取分析,建立了一套准确的国家级土地利用数据库[12-13],为土地利用变化下滑坡易发性的空间分布提供了数据支撑。然而,现有的土地利用数据对于未来滑坡空间发育的贡献是有限的,动态的土地利用分布预测是滑坡易发性预测的关键[9-10]
目前,在土地利用预测的研究中常用模型有马尔科夫模型、系统动力学模型、元胞自动机等[14]。近年来,由斑块生成土地利用变化的模拟模型(Patch-generating Land Use Simulation Model,PLUS)被用于预测未来土地利用情景并取得了优异的效果[15]。牛统莉等[14]基于PLUS模型对长江流域土地利用变化进行多情景预测取得了较高的预测精度。林素丽等[16]利用PLUS模型对广州市2030年的用地格局进行了模拟,模拟结果表明在依据交通规划下城市未来用地格局模拟具有合理性。因此,在本论文的研究中基于PLUS模型来开展未来土地利用的预测。
随着计算机领域的发展和GIS平台的应用,许多机器学习模型被应用于易发性建模。广泛使用的模型包括支持向量机[17-18]、神经网络[19]、决策树 等[20-21]。然而,单一的学习器已经无法满足易发性评估中对高精度的要求[22]。GBDT集成框架基于boosting技术,通过结合许多准确率相对较低的弱学习器,以生成强大的集成学习模型[23]。以此为基础开发的XGBoost、LightGBM和CatBoost近年来被广泛运用到数据的挖掘任务中[24]。例如,Wang等[25]通过引入XGBoost、LightGBM和CatBoost,开发了有效的路堤边坡地震稳定性分析方法。Emrehan[26]通过利用XGBoost、LightGBM和CatBoost对土耳其Ulus地区的滑坡易发性进行建模分析,得到了精度较高的滑坡易发性制图结果。然而,此类集成学习模型具有许多严重影响模型预测准确性的超参数,当前的研究缺乏参数空间优化策略[27-28]。因此,基于优化技术对超参数进行适当调整至关重要。PSO算法因其在全局搜索中所具有的优秀性能被广泛运用到机器学习超参数的选取中[29]
基于此,本文综合考虑了一套创新性的滑坡易发性研究框架,即通过考虑未来土地利用动态情景下的滑坡易发性建模。在这一框架下本文首先根据所收集的2010年与2015年的土地利用类型数据对PLUS模型进行精度检验,随后对2025与2030年自然情景下的土地利用展开预测并对未来土地变化情况进行分析;进一步地利用PSO-XGBoost、PSO-LightGBM与PSO-CatBoost共3种基于GBDT框架的集成学习模型对研究区2020年的土地利用条件和滑坡清单进行易发性模型训练,得到最优评价模型;最后,基于PLUS模型预测所得到的2025年和2030年土地利用结果,采用最优评价模型获得研究区未来土地利用变化下的滑坡易发性分布结果。

2 研究思路与方法

2.1 研究思路

本文所采用的建模策略由3个阶段组成,流程图如图1所示。① 阶段一:收集整理历史土地利用数据,开展未来土地利用预测,获得易发性建模的动态因子;② 阶段二:收集滑坡易发性评价静态因子与滑坡数据,构建滑坡易发性评价GIS数据库与易发性评价模型;③ 阶段三:开展未来土地利用动态变化下的滑坡易发性分布制图研究。
图1 未来土地利用变化的滑坡易发性制图流程

Fig. 1 Flow chart of future land use changed-based landslide susceptibility mapping

2.2 PLUS模型土地利用预测

PLUS模型是一种在未来土地利用模拟(FLUS)模型基础上改进的元胞自动机(CA)模型,该模型于2021年由中国地质大学(武汉)梁迅等[14-16]开发并运用于土地利用变化的分析中。与其他土地利用模拟模型相比该模型所采用的用地扩张分析策略可以对土地利用变化机理进行更好的解释;同时应用多类土地利用斑块变化的机制,可以对地类的斑块级别演变进行模拟[14,16]。PLUS模型主要由用地扩张分析策略(LEAS)与基于多类随机斑块种子的元胞自动机模型(CARS) 2个部分组成。

2.2.1 LEAS模块

LEAS主要是通过对2期土地利用变化间各类用地扩张的部分进行提取,并基于随机森林算法对该时段各类用地扩张的贡献进行分析[15]。LEAS不仅能避免多地类分析时的复杂计算,而且对一定时间段内的土地利用变化机理展开分析[14]。利用随机森林进行分类的公式如下:
P i k d (x) = n = 1 M I h n ( x ) = d ) M
式中: P i k d为土地利用类型k在最终输出单元i处的增长概率,d取值为0或1,0表示其他任何不包含k在内的土地利用转换;1表示有其他土地利用类型改变为土地利用类型kx是由多个驱动因素组成的向量;I(∙)是决策树集合的指示性函数;hn(x)是向量x的第n个决策树的预测类型;M是决策树的总数。

2.2.2 CARS模块

CARS模块是一个修正的CA模型,包括基于土地利用的多类型随机种子的补丁生成机制。CA模型是一个场景驱动的土地利用模拟模型,它集成了“自上而下”(即全球土地利用需求)和“自下而上”(即地方土地利用竞争)效应。在模拟过程中,土地利用需求通过自适应系数影响当地土地利用竞争,推动土地利用量达到未来需求。邻域权重参数代表着不同用地类型的扩张强度,反映了各地类在空间驱动因子影响下的扩张能力[15],依据研究时段各地类斑块总面积(Total Area,TA)变化量设定,计算公式如下模型具体设置如下:
X i = Δ T A i - Δ T A m i n Δ T A m a x - Δ T A m i n
式中:Xi为某一地类i的邻域权重参数;为研究时段内该地类TA的变化量 Δ T A m a x Δ T A m i n分别为研究时段内 Δ T A的最大、最小变化量。
土地利用转移规则矩阵表示土地利用类型之间的转换规则,当一种土地利用类型不能换成另一种时,矩阵对应值为0,反之为1[14]。综合考虑到研究区社会经济发展与自然环境特点,本文设置了限制水系转化为其他用地发展情景,土地利用转移矩阵,如表1所示。
表1 土地利用转换情景矩阵(2020—2030年)

Tab. 1 Land use conversion scenario matrix (2020-2030)

耕地 林地 草地 水系 建设用地
耕地 1 1 1 0 0
林地 1 1 1 0 1
草地 1 1 1 0 1
水系 0 0 0 1 0
建设用地 1 1 1 0 1

2.2.3 土地利用预测精度检验

预测结果精度检验是研究的重要组成部分。基于预测结果建立如下混淆矩阵如图2,根据预测目标的不同利用总体分类精度(OA)与科恩卡帕(Kappa)系数对土地利用制图的精度进行检验[14,16]
图2 混淆矩阵

Fig. 2 Confusion matrix

总体分类精度(OA)为分类正确样本个数站所有样本个数的比例,如式(3)所示。
O A = T P + T N T P + F N + F P + T N
式中:TP为真正例,表示模型将滑坡预测为滑坡的次数;FN为假反例,表示模型将滑坡预测为非滑坡的次数;FP为假正例,表示模型将非滑坡预测为滑坡的次数;TN为真反例,表示模型将滑坡预测为滑坡的次数。
Kappa系数被广泛用于衡量观测一致性和偶然一致性之间的真实一致性,并成为评估图像分类准确性的标准方法[30]。其计算公式如下:
K a p p a = N i = 1 r x i i - i = 1 r ( x i + × x + i ) N 2 - i = 1 r ( x i + × x + i )
式中: r为误差矩阵中的行数和列数; N为所选取的总像素数量; xit为第i行和第i列中的观察数; xi+为第i列的边际总计; x+i为第i栏的边际总计; Kappa系数介于0~1。

2.3 易发性评价模型构建

2.3.1 GBDT算法

GBDT算法作为一种迭代的决策树算法,于1999年被Friedman提出[23]。该算法由多棵决策树组成,并基于boosting技术得到最终计算结果,具有良好的计算性能。基于此,本研究引入了基于GBDT改进的XGBoost、LightGBM与CatBoost 3类集成学习模型来进行易发性的建模。

2.3.2 XGBoost算法

XGBoost是一种先进的基于GBDT的方法,于2014年由陈天奇[31]提出后被研究人员广泛使用,并在各种机器学习任务中取得了显著的效果。XGBoost使用了梯度提升的一般思想,将弱学习者与强学习者相结合。然而,XGBoost在目标函数中使用额外的正则化项表现出更好的预测性能,这减少了过拟合并控制了模型的复杂性。目标函数的定义如式(5)所示。
o b j = i L ( y i , y i ) , + k Ω ( f k )
式中:obj为定义的整体损失函数; L ( y i , y i )表示单个树模型的损失函数; k Ω ( f k )表示正则项; k为树的个数。

2.3.3 LightGBM算法

LightGBM作为一种基于GBDT的集成算法,于2017年由微软发布。相较于GBDT、XGBoost算法而言引入了如直方图算法、Leaf-wise树生长策略、GOSS等不同框架;在实际计算中能够有效解决海量数据的处理问题,具有出色的学习能力[32]。LightGBM集成的CART回归树基模型如式(6)
f T ( X ) = t = 1 T f t ( X )             f t Ω
式中:t为决策树的棵数;Ω为对应所有决策树的集合;ft为第t次迭代产生的第t棵决策树,为函数空间Ω中的函数。

2.3.4 CatBoost算法

CatBoost作为一种基于GBDT的机器学习算法,于2017年由俄罗斯顶尖技术公司Yandex发布,该模型可用于不同的机器学习任务,如数据的分类,回归等[33]。与LightGBM和XGBoost相比,CatBoost的2个主要算法进步是有序增强框架和用于处理分类特征的创新算法[34]。通过以下的公式保证对类别特征的自动处理以及防止过拟合[35]
X i k = j = 1 n x j k = x i k Y j j = 1 n x j k = x i k X δ k , k = j = 1 p - 1 x δ j k = x δ p k Y δ j + α p j = 1 p - 1 x δ j k = x δ p k + α
式中:Xik是整个数据集的标签值的均值;xik表示第k个训练样本的第i个类别特征取值;Yj为目标变量的标签值(0和1);Xδk,k表示用来替换的数值;δ是随机排列数据集中所生成的随机排列序列;Pα是样本标签的先验值和先验值权重。在传统的GBDT中,梯度增强使用相同的样本来估计梯度和构建模型;因此,基于GBDT的算法在生成的模型中会出现预测偏移,从而导致一种特殊的目标泄漏问题。为了防止这种情况,CatBoost与其他现有的基于GBDT的算法的另一个不同之处在于,它使用了一种特殊类型的决策树“遗忘树”,而不是不对称树。遗忘树的体系结构由对称树和平衡树组成,它们在整个树级别上具有相同的拆分规则。这些树不太容易过拟合,可以显著提高测试时的执行速度。

2.3.5 粒子群算法(PSO)

1995年Kennedy和Eberhart[36]首次将PSO算法引入到机器学习的领域,并被广泛推广运用[27]。PSO源于对鸟群捕食行为的研究,其基本思想为:通过群体中个体之间的协作和信息共享来寻找最优解[29]。它依赖于对群体中个体(即个体或粒子)觅食行为的模拟,例如一群鸟或鱼群。PSO算法由于其有效性、易实现性和低计算成本等优点,引起了研究人员的极大关注,算法原理如下。
在多维(d)搜索空间中,表示每个粒子在时间t的位置和速度的公式分别为: X i t = ( X i , 1 t ,   X i , 2 t , X i , 3 t , , X i , d t ) V i t = ( V i , 1 t , V i , 2 t , V i , 3 t , , V i , d t ),并通过寻找当前粒子的个体最优值pbest与粒子群的全局最优值gbest来调整粒子的速度与位置,更新公式如下:
X i t + 1 = X i t + V i t + 1 V i t + 1 = w t V i t + c 1 r 1 ( p b e s t i t - X i t ) +                         c 2 r 2 ( g b e s t t - X i t )
式中:c1c2是加速度常数; r1r2是0和1范围内的随机变量;wt是控制速度变化的惯性权重。

2.3.6 超参数调整

XGBoost、LightGBM与CatBoost模型存在许多需要人工设置的超参数,如树的深度、树的棵数、学习率等,这些超参数对于模型的预测结果具有一定影响[24]。因此,在本研究中PSO被用于对XGBoost、LightGBM与CatBoost模型的超参数进行选择。PSO进化最大迭代次数设置为200次,当50次迭代过程结果不出现变化时提前终止。各模型优化情况如表2所示。同时,为进一步降低建模过程中所存在的不平衡性问题,随机选取1:1的滑坡与非滑坡样本进行模型的训练[19]
表2 PSO优化算法控制参数优化情况

Tab. 2 PSO optimization algorithm control parameter optimization table

模型 超参数 参数空间 PSO控制参数
CatBoost 基学习器 gbdt 种群大小:50
最大迭代次数:200
惯性权重:0.9
全局系数:2
局部系数:2
学习率 0.1
树的最大深度 10
过拟合检测阈值 0
达成优化后继续迭代次数 20
LightGBM 基学习器数量 100 种群大小:50
最大迭代次数:200
惯性权重:0.9
全局系数:2
局部系数:2
基学习器 gbdt
学习率 0.1
样本征采率 0.8
树特征采样率 0.8
叶子节点中样本的最小权重 0.75
树最大深度 10
叶子节点最小样本数 10
XGBoost 基学习器数量 100 种群大小:50
最大迭代次数:200
惯性权重:0.9
全局系数:2
局部系数:2
基学习器 gbtree
学习率 0.1
树最大深度 10
样本征采率 0.8
树特征采样率 0.8
叶子节点中样本的最小权重 0.75

2.3.7 易发性建模精度评价

接受者工作特征曲线(ROC)曲线和AUC常被用来评价一个二值分类器的优劣。目前,ROC曲线下的AUC值已被广泛运用于滑坡易发性制图精度评价的主要指标[18,37],曲线中的灵敏度(Sensitivity)和特异性(Specific)计算公式如下:
S e n s i t i v i t y   = T P T P + F N
S p e c i f i c = F P F P + T N

3 研究区概况及基础数据

3.1 研究区概况及滑坡清单

研究区域位于重庆市万州区长江沿岸(图3),范围为临近长江的22个乡镇及主城区;其地理范围约为108°14′00″E—108°38′00″E和30°25′00″N—30°58′00″N之间,面积约为1 500 km2。该地区属亚热带湿润季风区,气候温和,日照充足,雨量充沛,长江穿城而过。根据国家气象科学数据中心(http://data.cma.cn/)气象资料,研究区最高气温出现在7月和8月,最低气温出现在1月;年平均降水量为1 030~1 950 mm,主要集中在5—9月。研究区属于低山丘陵地貌,最高海拔为1 385 m,最低为57 m;总体形态呈台阶状,城市建设与人类工程活动多集中于较为低缓的长江沿岸。基于2015年与2020年研究区卫星遥感影像数据可以发现,人类工程活动区在 5年期间呈现出较为明显的扩张。境内出露地层多见于三叠系、侏罗系以及第四系;其中,分布广泛的第四系沉积物为堆积层滑坡的发育提供了丰富的物质来源。同时,为更为准确有效获得研究区滑坡边界,本文收集了研究区历史灾害点数据,基于无人机航测、现场调研、卫星遥感影像等多源手段对研究区内滑坡灾害点数据进行整理及边界划分。滑坡数据收集结果表明研究区内共有474个滑坡灾害点,其中库区内共有252个滑坡灾害点。
图3 研究区位置及滑坡分布

Fig. 3 Location and distribution of landslide in study area

3.2 土地利用预测基础数据

未来土地利用预测的基础数据主要包括:历史土地利用数据、社会经济数据及气候与环境数据。数据基本情况如表3所示。土地利用数据来自于中国科学院资源环境数据中心[38],基于研究区情况将其重分类为:耕地、林地、草地、水体和建设用地5类;社会经济数据主要包括人口、GDP、到道路的距离与到政府的距离;气候与环境数据包括:到水域距离、土壤类型、高程与坡度。其中高程与坡度数据是从12.5 m分辨率的数字高程模型(Digital Elevation Model,DEM)上提取的;年均温、年降水数据则来自于中国科学院资源环境数据中心。
表3 土地利用模拟数据来源

Tab. 3 Land use simulation data source

数据类型 数据名称 分辨率 数据来源
土地利用数据 2010年土地利用数据 30 m 中国科学院资源环境数据中心(https://www.resdc.cn)
2015年土地利用数据 30 m
2020年土地利用数据 30 m
社会经济数据 2020年人口 1 km OpenStreetMap (www.openstreetmap.org)
2020年GDP 1 km
2020年到一级道路距离 30 m
2020年到二级道路距离 30 m
2020年到三级道路距离 30 m
2020年到政府距离 30 m
气候与环境数据 2020年到水域距离 30 m 中国科学院资源环境数据中心(https://www.resdc.cn)
土壤类型 30 m
2010—2020年平均降水 1 km
2010—2020年平均温度 1 km
高程 12.5 m ASF Data Search (https://search.asf.alaska.edu)
坡度 12.5 m

3.3 易发性评价基础数据

滑坡的空间分布不仅受到内在的地质力学作用驱动,还受多种外在因素的耦合作用[1]。根据文献调研及研究区基础数据收集,本研究选择9类滑坡易发性的评价指标(图4)即:高程、坡度、坡向、起伏度、水库分区、距河流的距离、土壤类型、地层分布、土地利用类型[3-4,19]。各评价指标说明如下。
图4 滑坡易发性评价影响因子

Fig. 4 Landslide susceptibility evaluation influence factors

高程、坡度、坡向、起伏度4个指标均可根据DEM进行提取。其中,高程主要影响滑坡的临空条件及人类工程活动范围[4],依据研究区以往文 献研究将高程分为:0~350 m; 350~550 m; 550~750 m;750~950 m; 950~1 150 m; 大于1 150 m共 6类[20]。坡度通常会影响斜坡体松散物质的应力分布、堆积体的厚度,地表径流等[18],本研究将坡度分为4类:平坦至平缓(<10 °); 中度(10~20 °);陡峭(20~30 °);非常陡峭(>40 °)。坡向主要会对坡体的植被分布与地表蒸发情况产生影响[19];起伏度则主要对地面高差的变化进行描述,体现了斜坡体的陡缓状态[4]
受三峡库区水位周期性的动态调节,位于长江及其支流附近的斜坡体在水流侵蚀、动水压力等作用下稳定性会发生变化[3]。本研究中,库岸段为长江至第一道山脊的范围,距河流的距离则是由ArcGIS 10.6缓冲得到。地层岩性是地质灾害的物质基础,是滑坡灾害发生的内在条件[18]。研究区内主要分布的地层为J2s与J3s,其主要由砂岩和泥岩构成,遇水后易软化侵蚀加剧斜坡的不稳定性。土地利用会在许多方面影响土壤的力学行为和水文条件进而影响滑坡的变形与破坏[7-8]。同时为开展动态易发性的建模,收集了2010年(图4(i))、2015年(图4(j))与2020年(图4(k))3个不同时期下的土地利用数据。
基于研究区内所收集的滑坡样本及影响因子数据库,利用ArcGIS 10.6统一将各数据进行30 m×30 m的栅格化计算。栅格化计算结果显示研究区内一共有1 688 094个栅格,其中滑坡灾害点所占栅格为19 661个(标记为1),非滑坡为1 668 433个(标记为0)。

4 结果及分析

4.1 数据分析

基于所收集的研究区2010、2015与2020年土地利用数据,对研究区内不同时期下的土地利用变化情况进行分析,如图5(a)。基于图5(a)可以发现研究内主要的土地利用类型为耕地,其在2010—2020年从914.3 km2减少到872.2 km2;而建设用地面积则由2010年的41.63 km2增加到90.33 km2,增加了一倍多;林地、草地及水体则占比面积则在2010—2020年并无太大变化,这表明研究区内建设用地面积主要是由耕地所转化而来。
图5 数据分析结果

Fig. 5 Data analysis result

在进行滑坡易发性建模前需要对影响因子之间的相关性进行检验,以降低因子之间的共线性关系,增加建模计算的精度[19]。根据图5(b)的皮尔逊共线性检验结果可得坡度与起伏度之间的相关性为0.93,为降低后续计算因子之间的误差,综合考虑坡度与起伏度对滑坡实际发生的影响效果,将起伏度从影响因子中去除。在对影响因子的相关性进行分析后,基于3类机器学习中各影响因素的平均重要性对进行建模的8个影响因子重要性进行排序。如图5(c)可以发现研究区滑坡发生影响因素排序为:地层(19.6),距离水系的距离(14.4),坡度(14.3),土地利用(13.9),坡向(13.7),高程(9.9),土壤类型(9.6),水库分区(4.6)。

4.2 土地利用预测结果

基于2020年实际土地利用情况,对PLUS模型进行预测精度检验。根据2020年的预测结果可以发现各类土地利用类型占比与实际相差较小,最大差别为建设用地相差35.1 km2,最小为林地与水体相差0.2 km2。预测结果OA值为0.897,Kappa系数为0.825,模型预测结果精度较高。因此,可利用该模型对未来土地利用情况进行模拟。
根据图6(a)图6(b)未来土地利用结果可以得到从2020年到2030年,建设用地面积将从55.2 km2增加到163.8 km2(10.82%);水体将从6.4 km2增加到7.5 km2(0.5%);相比之下,耕地面积将从872.2 km2减少到820.9km2(54.19%);林地与草地面积将分别从328.2 km2和217.8 km2减少到322.6 km2(21.3%)和200.1 km2(13.21%)。从总体上看,建设用地与耕地面积会在未来一定时间内存在增长,耕地、林地与草地面积将会减少,而水体面积则相对较小并存在波动。为进一步对各类土地利用类型在未来向其他类型的转化的情况进行分析,绘制了如图6(c)的土地利用转化图。从图中可以得到在2020—2025年与2020—2025年,主要为耕地向其它类型发生了转化,大部分耕地转化为了建设用地与林地,少量转化为了草地与水体;同时,少量的林地与草地则向耕地进行转化;水体与建设用地几乎未向其它类型用地进行转化。
图6 未来土地利用预测结果

Fig. 6 The future land use prediction results

4.3 滑坡易发性建模结果

基于PSO-XGBoost、PSO-LightGBM与PSO-CatBoost对研究区土地利用变化下的滑坡易发 性进行建模制图,建模结果显示3种机器学习模型 的AUC值均大于0.9,如图7(a))所示。相较于未添加PSO算法的模型而言精度均有所提升(3.5%~5.0%),具有良好的预测效果。其中,PSO-CatBoost模型在3个时期中的易发性建模表现最优(AUC=0.923)。
图7 未来滑坡易发性分布结果

Fig. 7 The future landslide susceptibility distribution results

基于此,使用PSO-CatBoost模型和未来土地利用作为动态因素预测了2020、2025和2030年的滑坡易发性地图,各时期易发性分布结果如图7(b)所示。从图7(b)可以发现,在3个土地利用时期下的高与极高易发性主要集中分布在长江沿岸。其中以研究区东北部库岸最为集中,这也与研究区灾害点分布高度一致。对比图7(c)各个时期下易发性分区等级的占比可以发现,2020—2025年,低易发性分区占比下降了4.19%,中、高和极高的易发性占比分别上升了34.73%、23.22%和6.67%。2025年至2030年,研究区的低易发性分区占比下降了5.14%,中、高和极高的易发性占比分别上升了31.01%、16.49%和13.36%。

5 结论与讨论

在山区城镇建设的过程中,提前预知未来土地利用的基本情况可以更好地提高地质灾害的抵御能力,科学的规划城市工程建设活动。基于此,本文使用PLUS模型与优化的机器学习手段对未来的土地利用类型与滑坡易发性分布情况进行了预测,研究结果如下。
(1) 基于PLUS模型的土地利用预测显示了了较高的预测精度。未来土地利用预测结果显示,到2030年,建设用地与水体的面积将分别增加49.59%与7.91%;相比之下,耕地面积将减少3.03%;林地与草地面积将分别减少0.86%与4.24%。
(2) 相较于未添加PSO算法进行易发性建模的结果而言,PSO-XGBoost、PSO-LightGBM与PSO-CatBoost模型在易发性评价中展示了优异的评价性能。其中,PSO-CatBoost模型在建模评价中表现出最高的AUC值,表明其具有更好的泛化能力,对数据的训练预测适应性更佳[24]
(3) 未来土地利用动态变化下的滑坡易发性分布结果表明,山区滑坡的发生与土地利用的变化存在较为明显的联系。山区城镇化建设,可能会加剧滑坡灾害的发生。
随着人类社会的发展进步,土地利用在过去数年间发生着持续的变化。土地利用的变化情况影响着未来土地的自然属性与经济属性,这对于确定未来土壤、气候、植被及水文等多个系统的变化至关重要,定量的土地利用的变化评估对于确定未来由于自然资源枯竭所导致的环境问题意义非凡[14,16,38]。因此,一个具有未来视角的研究与超前规划对于山区城镇的建设而言至关重要。相较于以往的研究而言,本研究突破性的将易发性的研究视角转换到未来滑坡易发性的防治场景[1,22];并通过PSO算法对集成学习框架的超参数进行搜索,进一步拓展了滑坡易发性建模的思路。
基于未来土地利用情景下的滑坡易发性制图结果表明研究区滑坡易发性呈现出空间分布概率不断增大的趋势。值得说明的是,本文所进行的 3个时期易发性建模中仅土地利用发生了变化且建筑用地占比显著增加,表明了人类工程活动的建设区域的不断拓展可能增加发生滑坡灾害的概率,揭示了山区城市化建设前后对滑坡灾害发生的影响;这突出了土地利用变化在滑坡易感性评估中的重要性,在未来城市化的进程中应该更加重视正确的土地利用规划。同时,本文从中国科学院资源环境数据中心(https://www.resdc.cn)所收集的土地利用预测历史数据,在一定程度上已具有优异的空间识别效果[13]。然而,对于更为精细化的土地利用空间预测,未来可采用更高分辨率的光学影像数据,综合考虑政策规划、社会经济以及气候变化等因素展开研究。
本文图文责任编辑: 蒋树芳 黄光玉
[1]
Chen L X, Guo Z Z, Yin K L, et al. The influence of land use and land cover change on landslide susceptibility: A case study in Zhushan Town, Xuan'en County (Hubei, China)[J]. Natural Hazards and Earth System Sciences, 2019, 19(10):2207-2228. DOI:10.5194/nhess-19-2207-2019

[2]
Zhang J Q, Gurung D R, Liu R K, et al. Abe Barek landslide and landslide susceptibility assessment in Badakhshan Province, Afghanistan[J]. Landslides, 2015, 12(3):597-609. DOI:10.1007/s10346-015-0558-5

[3]
郭子正, 殷坤龙, 付圣, 等. 基于GIS与WOE-BP模型的滑坡易发性评价[J]. 地球科学, 2019, 44(12):4299-4312.

[Guo Z Z, Yin K L, Fu S, et al. Evaluation of landslide susceptibility based on GIS and WOE-BP model[J]. Earth Science, 2019, 44(12):4299-4312. ] DOI:10.3799/dqkx.2018.55

[4]
周超, 甘露露, 王悦, 等. 综合非滑坡样本选取指数与异质集成机器学习的区域滑坡易发性建模[J]. 地球信息科学学报, 2023, 25(8):1570-1585.

DOI

[Zhou C, Gan L L, Wang Y, et al. Landslide susceptibility prediction based on non-landslide samples selection and heterogeneous ensemble machine learning[J]. Journal of Geo-Information Science, 2023, 25(8):1570-1585. ] DOI:10.12082/dqxxkx.2023.220934

[5]
刘纪远. 国家资源环境遥感宏观调查与动态监测研究[J]. 遥感学报, 1997, 1(3):225-230.

[ Liu J Y. Study on national resources & environment survey and dynamic monitoring using remote sensing[J]. Journal of Remote Sensing, 1997, 1(3):225-230. ]

[6]
Henriques C, Zêzere J L, Marques F. The role of the lithological setting on the landslide pattern and distribution[J]. Engineering Geology, 2015, 189:17-31. DOI:10.1016/j.enggeo.2015.01.025

[7]
Parra E, Mohr C H, Korup O. Predicting Patagonian landslides: Roles of forest cover and wind speed[J]. Geophysical Research Letters, 2021, 48(23):EGU22-9548. DOI: 10.1029/2021gl095224

[8]
Löbmann M T, Geitner C, Wellstein C, et al. The influence of herbaceous vegetation on slope stability-A review[J]. Earth-Science Reviews, 2020,209:103328. DOI:10.1016/j.earscirev.2020.103328

[9]
Tyagi A, Tiwari R K, James N. Mapping the landslide susceptibility considering future land-use land-cover scenario[J]. Landslides, 2023, 20(1):65-76. DOI:10.1007/s10346-022-01968-7

[10]
Zeng T R, Guo Z Z, Wang L F, et al. Tempo-spatial landslide susceptibility assessment from the perspective of human engineering activity[J]. Remote Sensing, 2023, 15(16):4111. DOI:10.3390/rs15164111

[11]
Pacheco Quevedo R, Velastegui-Montoya A, Montalván-Burbano N, et al. Land use and land cover as a conditioning factor in landslide susceptibility: A literature review[J]. Landslides, 2023, 20(5):967-982. DOI:10.1007/s10346-022-02020-4

[12]
Yang J, Huang X. The 30m annual land cover dataset and its dynamics in China from 1990 to 2019[J]. Earth Syst. Sci. Data. 2021,13: 3907-3925. DOI:10.5194/essd-13-3907-2021

[13]
徐新良, 刘纪远, 张树文. 中国多时期土地利用遥感监测数据集(CNLUCC [Z]. 资源环境科学数据注册与出版系统(http://www.resdc.cn/DOI)[Z]. 2018

[ Xin Liang Xu, Ji Yuan Liu, Shu Wen Zhang. Multi-period remote sensing monitoring data set of land use in China (CNLUCC[Z]. Data registration and publication system of resources and environment science (http://www.resdc.cn/DOI). 2018. ]

[14]
牛统莉, 熊立华, 陈杰, 等. 基于PLUS模型的长江流域土地利用变化模拟与多情景预测[J/OL]. 武汉大学学报(工学版), 2023:1-16.(2023-03-14).

[Niu T L, Xiong L H, Chen J, et al. Land use simulation and multi-scenario prediction of the Yangtze River Basin based on PLUS model[J/OL]. Engineering Journal of Wuhan University, 2023:1-16.(2023-03-14).] DOI:10.14188/j.1671-8844.2024-02-001

[15]
Liang X, Guan Q F, Clarke K C, et al. Understanding the drivers of sustainable land expansion using a Patch-generating Land Use Simulation (PLUS) model: A case study in Wuhan, China[J]. Computers, Environment and Urban Systems, 2021,85:101569. DOI:10.1016/j.compenvurbsys.2020.101569

[16]
林素丽, 王枫. 基于PLUS模型并顾及交通规划的广州市土地利用情景模拟与分析[J]. 农业资源与环境学报, 2023, 40(3):557-569.

[Lin S L, Wang F. Simulation and analysis of land use scenarios in Guangzhou based on the PLUS model and traffic planning scenario[J]. Journal of Agricultural Resources and Environment, 2023, 40(3):557-569. ] DOI:10.13254/j.jare.2022.0352

[17]
黄发明, 陈佳武, 唐志鹏, 等. 不同空间分辨率和训练测试集比例下的滑坡易发性预测不确定性[J]. 岩石力学与工程学报, 2021, 40(6):1155-1169.

[Huang F M, Chen J W, Tang Z P, et al. Uncertainties of landslide susceptibility prediction due to different spatial resolutions and different proportions of training and testing datasets[J]. Chinese Journal of Rock Mechanics and Engineering, 2021, 40(6):1155-1169. ] DOI:10.13722/j.cnki.jrme.2020.1119

[18]
黄发明, 殷坤龙, 蒋水华, 等. 基于聚类分析和支持向量机的滑坡易发性评价[J]. 岩石力学与工程学报, 2018, 37(1):156-167.

[Huang F M, Yin K L, Jiang S H, et al. Landslide susceptibility assessment based on clustering analysis and support vector machine[J]. Chinese Journal of Rock Mechanics and Engineering, 2018, 37(1):156-167. ] DOI:10.13722/j.cnki.jrme.2017.0824

[19]
周超, 殷坤龙, 曹颖, 等. 基于集成学习与径向基神经网络耦合模型的三峡库区滑坡易发性评价[J]. 地球科学, 2020, 45(6):1865-1876.

[Zhou C, Yin K L, Cao Y, et al. Landslide susceptibility assessment by applying the coupling method of radial basis neural network and adaboost: A case study from the Three Gorges Reservoir Area[J]. Earth Science, 2020, 45(6):1865-1876. ] DOI:10.3799/dqkx.2020.071

[20]
杨永刚, 殷坤龙, 赵海燕, 等. 基于C5.0决策树-快速聚类模型的万州区库岸段乡镇滑坡易发性区划[J]. 地质科技情报, 2019, 38(6):189-197.

[Yang Y G, Yin K L, Zhao H Y, et al. Landslide susceptibility evaluation for township units of bank section in Wanzhou district based on C5.0 decision tree and K-means cluster model[J]. Geological Science and Technology Information, 2019, 38(6):189-197. ] DOI:10.19509/j.cnki.dzkq.2019.0622

[21]
黄发明, 石雨, 欧阳慰平, 等. 基于证据权和卡方自动交互检测决策树的滑坡易发性预测[J]. 土木与环境工程学报(中英文), 2022, 44(5):16-28.

[Huang F M, Shi Y, Ouyang W P, et al. Landslide susceptibility prediction modeling based on weight of evidence and Chi-square automatic interactive detection decision tree[J]. Journal of Civil and Environmental Engineering, 2022, 44(5):16-28. ] DOI:10.11835/j.issn.2096-6717.2021.254

[22]
林炫歆, 肖桂荣, 周侯伯. 顾及土地利用动态变化的滑坡易发性评估方法[J]. 地球信息科学学报, 2023, 25(5):953-966.

DOI

[Lin X X, Xiao G R, Zhou H B. Landslide susceptibility assessment method considering land use dynamic change[J]. Journal of Geo-Information Science, 2023, 25(5):953-966. ] DOI:10.12082/dqxxkx.2023.220567

[23]
Friedman J H. Greedy function approximation: A gradient boosting machine[J]. The Annals of Statistics, 2001, 29(5):1189-1232. DOI:10.1214/aos/1013203451

[24]
Demir S, Sahin E K. Predicting occurrence of liquefaction-induced lateral spreading using gradient boosting algorithms integrated with particle swarm optimization: PSO-XGBoost, PSO-LightGBM, and PSO-CatBoost[J]. Acta Geotechnica, 2023, 18(6):3403-3419. DOI:10.1007/s11440-022-01777-1

[25]
Wang L Q, Wu J H, Zhang W G, et al. Efficient seismic stability analysis of embankment slopes subjected to water level changes using gradient boosting algorithms[J]. Frontiers in Earth Science, 2021,9:807317. DOI:10.3389/feart.2021.807317

[26]
Sahin E. Comparative analysis of gradient boosting algorithms for landslide susceptibility mapping[J]. Geocarto International. 2020,2020:1-25. DOI:10.1080/10106049.2020.1831623

[27]
张俊, 殷坤龙, 王佳佳, 等. 基于时间序列与PSO-SVR耦合模型的白水河滑坡位移预测研究[J]. 岩石力学与工程学报, 2015, 34(2):382-391.

[Zhang J, Yin K L, Wang J J, et al. Displacement prediction of Baishuihe landslide based on time series and pso-svr model[J]. Chinese Journal of Rock Mechanics and Engineering, 2015, 34(2):382-391. ] DOI:10.13722/j.cnki.jrme.2015.02.017

[28]
姜宇航, 王伟, 邹丽芳, 等. 基于粒子群-变分模态分解、非线性自回归神经网络与门控循环单元的滑坡位移动态预测模型研究[J]. 岩土力学, 2022, 43(S1):601-612.

[Jiang Y H, Wang W, Zou L F, et al. Study on dynamic prediction model of landslide displacement based on particle swarm-variational modal decomposition, nonlinear autoregressive neural network and gated cycle unit[J]. Rock and Soil Mechanics, 2022, 43(S1):601-612. ] DOI:10.16285/j.rsm.2021.0247

[29]
Shafqat W, Malik S, Lee K T, et al. PSO based optimized ensemble learning and feature selection approach for efficient energy forecast[J]. Electronics, 2021, 10(18):2188. DOI:10.3390/electronics10182188

[30]
Rwanga S S, Ndambuki J M. Accuracy assessment of land use/land cover classification using remote sensing and GIS[J]. International Journal of Geosciences, 2017, 8(4):611-622. DOI:10.4236/ijg.2017.84033

[31]
Hen T, Guestrin C. XGBoost: A scalable tree boosting Ssystem[M]. 2016:785-794. DOI:10.1145/2939672.2939785

[32]
Ke G L, Meng Q, Finley T, et al. LightGBM: A highly efficient gradient boosting decision tree[C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. ACM, 2017:3149-3157. DOI:10.5555/3294996.3295074

[33]
Dorogush A, Ershov V, Gulin A. CatBoost: gradient boosting with categorical features support[M]. 2018.

[34]
Xiao W, Wang C B, Liu J M, et al. Optimizing faulting prediction for rigid pavements using a hybrid SHAP-TPE-CatBoost model[J]. Applied Sciences, 2023, 13(23):12862. DOI:10.3390/app132312862

[35]
Shi Y M, Cai Y, Lou S Y, et al. Explainable prediction of deposited film thickness in IC fabrication with CatBoost and SHapley Additive exPlanations (SHAP) models[J]. Applied Intelligence, 2024, 54(1):246-263. DOI:10.1007/s10489-023-05121-2

[36]
Kennedy J, Eberhart R. Particle swarm optimization[C]// Proceedings of ICNN'95 - International Conference on Neural Networks. IEEE, 2002:1942- 1948. DOI:10.1109/ICNN.1995.488968

[37]
郭子正, 殷坤龙, 黄发明, 等. 基于滑坡分类和加权频率比模型的滑坡易发性评价[J]. 岩石力学与工程学报, 2019, 38(2):287-300.

[Guo Z Z, Yin K L, Huang F M, et al. Evaluation of landslide susceptibility based on landslide classification and weighted frequency ratio model[J]. Chinese Journal of Rock Mechanics and Engineering, 2019, 38(2):287-300. ] DOI:10.13722/j.cnki.jrme.2018.0838

[38]
Sexton J, Urban D, Donohue M J, et al. Long-term land cover dynamics by multi-temporal classification across the Landsat-5 record[J]. Remote Sensing of Environment, 2013, 128:246-258. DOI:10.1016/J.RSE.2012.10.010

Outlines

/