地球信息科学理论与方法

顾及土地利用动态变化的滑坡易发性评估方法

  • 林炫歆 , 1, 2 ,
  • 肖桂荣 , 1, 2, * ,
  • 周侯伯 3, 4
展开
  • 1.福州大学 数字中国研究院(福建),福州 350108
  • 2.福州大学 空间数据挖掘与信息共享教育部重点实验室,福州 350108
  • 3.中国科学院城市环境研究所,厦门 361021
  • 4.中国科学院大学,北京 100049
*肖桂荣(1972— ),男,福建龙岩人,研究员,主要从事地理信息系统、空间信息网络服务、政务数据可视化研究。E-mail:

林炫歆(1999— ),女,福建福州人,硕士研究生,主要从事数据挖掘、机器学习与地质灾害风险评估研究。E-mail:

收稿日期: 2022-08-03

  修回日期: 2022-11-15

  网络出版日期: 2023-04-27

基金资助

中央引导地方科技发展专项(2020L3005)

中国科学院A类战略性先导科技专项(XDA23100504)

Landslide Susceptibility Assessment Method Considering Land Use Dynamic Change

  • LIN Xuanxin , 1, 2 ,
  • XIAO Guirong , 1, 2, * ,
  • ZHOU Houbo 3, 4
Expand
  • 1. The Academy of Digital China(Fujian), Fuzhou University, Fuzhou 350108, China
  • 2. Key Laboratory of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350108, China
  • 3. Institute of Urban Environment, Chinese Academy of Sciences, Xiamen 361021, China
  • 4. University of Chinese Academy of Sciences, Beijing 100049, China
*XIAO Guirong, E-mail:

Received date: 2022-08-03

  Revised date: 2022-11-15

  Online published: 2023-04-27

Supported by

The Central Guided Local Development of Science and Technology Project(2020L3005)

The Strategic Priority Research Program of the Chinese Academy of Sciences(Class A)(XDA23100504)

摘要

滑坡灾害成因复杂,滑坡易发性评估对灾害预警与防控管理具有重要意义。由于以往易发性制图研究中未顾及土地利用变化因素,本文提出考虑土地利用动态变化的滑坡易发性评估因子组合。采用滑坡频率比定量衡量土地利用变化与滑坡发育的相关关系,并基于逻辑回归模型(Logistic Regression, LR)对比引入土地利用变化因子前后的模型预测效果。在此基础上,构建决策树(Decision Tree, DT)、梯度提升树(Gradient Boosting Decision Tree, GBDT)与随机森林(Random Forest, RF)模型,利用AUC等指标对模型预测性能进行对比分析。最后以福建省三明市为研究区,以整个福建省为验证区,开展滑坡易发性评估研究。研究表明:土地利用变化因子与滑坡发育之间具有更强的关联特征,在滑坡易发性评估中引入动态变化因子具有必要性。RF模型比DT与GBDT具有更高的预测精度与准确率。滑坡高易发区主要分布在三明市西部与中部地区,该区域土地利用变化程度较大、受人类活动影响大;低易发区基本位于人类活动影响较小的高海拔区域。本研究为滑坡易发性评估提出一种新的研究角度,为探究人类对灾害形成的影响提供帮助。

本文引用格式

林炫歆 , 肖桂荣 , 周侯伯 . 顾及土地利用动态变化的滑坡易发性评估方法[J]. 地球信息科学学报, 2023 , 25(5) : 953 -966 . DOI: 10.12082/dqxxkx.2023.220567

Abstract

The causes of landslide disasters are complex, and landslide susceptibility assessment is of great significance for disaster warning, prevention, and control management. In the previous mapping studies on landslide susceptibility assessment, land use change factor was not considered. This paper proposed a combination of factors for landslide susceptibility assessment by considering land use dynamic change factor. The landslide frequency ratio was used to quantitatively measure the correlation between land use change and landslide development. And Logistic Regression (LR) model was used to compare the prediction ability of the model before and after the introduction of land use change factor. We constructed three machine learning models: Decision Tree (DT), Gradient Boosting Decision Tree (GBDT), and Random Forest (RF). We used AUC and other indicators to compare model performance. Finally, we took Sanming City of Fujian Province as the study area and the whole Fujian Province as the verification area to conduct the landslide susceptibility assessment research. The results show that there is a strong correlation between land use change factor and landslide development. The inclusion of land use change factor improves model prediction accuracy, which indicates that it is necessary to introduce dynamic factor in the assessment of landslide susceptibility. The verification results show that RF model has higher prediction accuracy than DT and GBDT. The high landslide prone areas are mainly distributed in the west and central of Sanming City, where the land use change degree is high, and the impact of human activities is great. The low landslide prone areas basically locate in the high-altitude areas with little influence of human activities. This study provides a new research perspective for landslide susceptibility assessment and helps to explore the impact of human activities on disaster formation.

1 引言

滑坡易发性是指在特殊地理地质条件下区域发生滑坡灾害的概率[1]。科学合理地选取滑坡影响因子是易发性评估的关键,国内外学者结合地形地貌、地质特征、自然地理因素以及人类活动因素进行了大量实验研究,并取得了较好的成果[2-7]。土地利用是衡量地区生态的重要因素,能够反映区域人类活动强度大小,通常作为静态因子被引入研究[8-10]。土地利用既是环境变化的驱使因素之一也是环境变化作用结果的主要表现形式,即使在短短几十年的时间里也会发生较大的变化,该变化可能导致滑坡易发性的强度和空间分布不同[11-14]。因此在滑坡易发性研究中应当充分考虑土地利用动态变化对滑坡发育的影响作用。目前对于土地利用变化与滑坡的相关研究已十分普遍,但这些研究往往将不同时相的土地利用影像看作是一个变化过程,侧重探讨滑坡易发性随时间的变化趋势,将土地利用变化直接作为动态因子的滑坡研究尚不丰富[15-22]。有学者将土地利用变化作为一个新的动态因子引入滑坡易发性评估,并得到较好的制图结果,但缺少土地利用变化与滑坡发育相关关系的定量分析,在引入动态因子的重要性以及制图有效性方面有待阐述[23]。目前有待建立土地利用变化与多方面滑坡影响因子的时空关联,为滑坡易发性提供新的研究角度,同时为土地利用变化作为动态因子引入滑坡易发性评估提供理论基础。
如今国内外滑坡易发性评估的常用模型可以分为经验模型、数理统计模型与机器学习模型三大类[24]。层次分析法[25]等经验模型虽然计算简单,但受主观因素影响较大。确定性系数法[26]、证据权法[27]等数理统计模型能够确定地质灾害与单一影响因子各区间的量化关系,但难以描述因子组合间的关联特征以及在高维空间中与灾害点的关系。机器学习模型属于典型的数据驱动模型,如逻辑回归[28]与决策树模型[29]等,它们因在预测中具有的鲁棒性而逐渐成为滑坡易发性研究中应用最广泛的模型[30]。随着软计算的快速发展,单一的学习器已经无法满足易发性评估中对高精度的要求。使用决策树作为基础学习器的集成模型,因其具有较高的预测精度和较强的泛化能力,在机器学习中脱颖而出[31]。常见的集成算法大致可以分为2类:bagging和boosting。随机森林[32]是采用bagging集成策略的经典模型之一,具有准确性高、抗噪声能力强等优势,在众多领域都取得了较好的应用效果;梯度提升树[33]作为典型的boosting算法集成模型,不仅能够更好地减小结果与真值间的偏差,而且能在较少的参数调优下获得更高的分类准确率,具有较强鲁棒性,但该模型在滑坡易发性制图方面的应用较少。目前对不同机器学习模型间的对比研究比较丰富,但对同样使用决策树作为基础学习器的集成模型的对比分析较少。
三明市多山地丘陵,土地利用类型丰富,是福建省滑坡灾害发生最频繁的地区之一。一些学者对该地区的单体滑坡进行了成因分析,但未见在全区范围内进行的滑坡易发性评估与区划制图研究。因此本文选取三明市作为研究区,提出顾及土地利用动态变化的滑坡易发性评估方法。引入土地利用变化作为动态因子,采用滑坡频率比定量衡量土地利用变化与滑坡发育之间的关系,并基于逻辑回归模型(Logistic Regression, LR)将引入动态因子的评估因子组合与传统土地利用类型因子组合进行对比。在此基础上,构建决策树(Decision Tree, DT)、梯度提升树(Gradient Boosting Decision Tree, GBDT)与随机森林(Random Forest, RF)模型,基于AUC等指标对3种模型进行性能比较与易发性分区制图。最后,以整个福建省作为验证区进行验证实验。

2 研究思路与方法

评估方法主要包括滑坡评估因子初选、引入动态因子与土地利用变化分析、滑坡易发性评估模型构建3个部分。具体技术路线如图1所示。
图1 顾及土地利用变化的滑坡易发性评估技术路线

Fig. 1 Technical route of landslide susceptibility assessment considering land use change

2.1 滑坡评估因子初选

本文研究综合考虑了地形因素、自然地理因素、地质因素以及人类活动因素4个方面,选取高程、坡度、坡向、降水量、到断裂距离、到水系距离、到道路距离、工程地质岩组、以及土地利用类型9个滑坡评估因子,构建评估因子数据库。

2.2 引入动态因子与土地利用变化分析

在初步选取9个评估因子的基础上,为了更好地探究土地利用变化对灾害空间格局的影响作用,本文将土地利用类型因子作为传统静态因子,引入20年土地利用变化因子作为动态因子。其中,传统静态因子包括2000年土地利用类型因子与2020年土地利用类型因子。对区域土地利用变化特征进行整体分析,并采用滑坡频率比定量衡量土地利用变化与滑坡发育之间的关系,进一步确定土地利用变化因子对滑坡易发性评估的重要性。
为保证因子间相互独立、提高模型预测的准确性,本文对所有因子进行相关性分析[34]与多重共线性分析[35]。采用皮尔逊相关系数衡量因子间的相关程度,当相关系数绝对值高于0.4时,认为因子间存在较高相关性,应予以剔除。在多重共线性分析中,TOL<0.1、VIF>10时,认为该因子存在较强共线性,应予以剔除。对连续型因子做归一化处理,对非连续型数据采用独热编码[36]处理。

2.3 滑坡易发性评估模型构建

基于除土地利用外的8个评估因子构建频率比模型,确定初步滑坡易发性分区。在频率比模型的极低易发区中随机提取与已知滑坡样本等量的负样本构成机器学习数据集。采用LR对引入土地利用变化因子前后的模型预测效果进行对比分析。最后,构建DT、GBDT以及RF模型,并采用AUC值[37]与频率比[38]对模型易发性预测结果进行定量评价与对比分析。

2.3.1 梯度提升树(GBDT)

梯度提升树是采用boosting算法集成的学习机器,由Jerome Friedman于2001年提出[39]。核心思想是构建多个弱分类器,经过多次迭代最终产生一个强分类器,每次迭代都在之前的结果之上进一步改进,减少模型残差[33,40]。涉及主要步骤与方程如下[33]
(1)假设一组训练样本,初始化弱分类器:
$f_0\bigl(x\bigr)=\arg\min_\gamma\sum_{i=1}^N L\bigl(y_i,\gamma\bigr)$
式中:训练样本在本研究中表示参与模型训练的3076个滑坡与非滑坡样本集;表示滑坡评估因子的输入向量;表示其对应的滑坡输出值,本文将滑坡样本的输出值设置为1,非滑坡样本的输出值设置为0;为初始模型;为损失函数;为损失函数在叶节点区域负梯度的最优拟合值,即针对每一个叶节点中的样本,当求出的损失函数最小时的最优输出值,在初始模型中可设置为样本的均值。
(2)对样本,计算负梯度:
$r_{im}=-\left[\dfrac{\partial L\left(y_i,f\left(x_i\right)\right)}{\partial f\left(x_i\right)}\right]_{f=f_{m-1}}$
式中:为负梯度;()表示迭代次数,为模型的最大迭代次数。
(3)将式(2)中的残差作为样本新值,把作为下一棵树的训练数据,计算新的弱分类器的最优拟合值:
$\begin{aligned}\gamma_{jm} =\arg\min_{\gamma}\sum_{x_i\in R_j\infty}L\bigl(y_i,f_{m-1}\bigl(x_i\bigr)+\gamma\bigr) \\\end{aligned}$
式中:表示第j棵树负梯度的最优拟合值;为第棵树对应的叶节点区域,J是第棵树的叶节点数。每一轮迭代的目标均是找到一棵树的弱分类器,使得本轮迭代的损失函数最小。
(4)重复步骤(2)—(3),直到满足最低误差要求,最终集成的强分类器为:
$f_m(x)=f_{m-1}(x)+\sum_{j=1}^{j_m}\gamma_{jm}I\big(x\in R_{jm}\big)$
式中:为最终生成的集成学习模型;为指示函数。

2.3.2 随机森林(RF)

随机森林是bagging算法的代表,由Breiman于2001年首次提出[41]。它由多个决策树组成,在构建决策树时,对训练数据进行有放回的随机采样(一般选取总样本的2/3),同时随机选取部分特征进行模型训练。其中,每次未被抽取的剩下1/3样本称为袋外数据(Out of Bag, OOB),其误差可以用来验证模型的拟合性能。随机森林的泛化误差可以定义为[42]
$P^*\leq\dfrac{\rho\left(1-s^2\right)}{s^2}$
式中:为决策树之间的相关度平均值;为决策树的平均强度。

3 研究区概况与数据处理

3.1 研究区概况

本文以三明市作为研究区域(图2),三明市地处东南沿海部内陆山区、闽中和闽西北的结合部位。经纬度位于25°30′N—27°07′N、116°22′E—118°39′E之间,属于中亚热带季风气候。该区地形以中低山脉与丘陵为主,地势总体上呈现西南部高、东北部低的特征。全区林地面积占土地总面积的82.5%,森林覆盖率76.8%,居全省第二。河网、道路纵横交错,是东南沿海地区与中西部地区的重要交通纽带。
图2 三明市滑坡空间分布

Fig. 2 Spatial distribution of landslides in Sanming City

大地构造上位于亚欧大陆型板块东南缘,横跨福建境内闽西北隆起带、闽西南坳陷带和闽东火山断坳带三大一级构造单元[43]。受新华夏构造控制,该区经历多期次大规模的构造活动,各旋回构造运动表现强烈。自下元古界至新生界地层单元均有发育,出露地层以古生界为主。三明地区滑坡灾害发育,历史滑坡灾害点多达1538处,居全省首位。

3.2 数据来源

滑坡易发性评估因子数据库主要包括滑坡空间分布数据、自然地理数据、地质数据以及土地利用数据等,主要来源见表1
表1 数据来源与数据类型

Tab. 1 Data source and data type

基础数据 数据来源 数据类型 数据年份 分辨率
滑坡空间分布数据 资源环境科学与数据中心
(https://www.resdc.cn/data.aspx?DATAID=290)
矢量 积累至2019年
数字高程影像 ASTER Global Digital Elevation Model V003
(https://search.earthdata.nasa.gov/search)
栅格 成像时间为2000年3月1日—2013年11月30日 30 m×30 m
自然地理数据 全国地理信息资源目录服务系统1:100万全国基础地理数据库
(https://www.webmap.cn/commres.do?method=result100W)
矢量 2021年
地形数据 从数字高程影像中提取 栅格 30 m×30 m
降水量数据 温室数据共享平台(http://data.sheshiyuanyi.com/) 文本 2000—2019年
地质数据 地质科学数据出版系统1:100万福建省地质图数据
(http://dcc.cgs.gov.cn/)
矢量 2017年
土地利用类型数据 1990—2021年中国30 m年土地覆被数据集及其动态( https://doi.org/10.5281/zenodo.5816591) 栅格 2000—2020年 30 m×30 m

3.3 滑坡评估因子处理

本研究选取的11个滑坡评估因子(图3)分别为高程、坡度、坡向、降水量、到断裂距离、到水系距离、到道路距离、工程地质岩组、2000年土地利用类型、2020年土地利用类型以及20年土地利用变化因子。其中:坡度、坡向因子直接从DEM数据中提取;降水量因子根据研究区境内11个气象站点观测记录的2000—2019年日均降水量数据通过克里金插值获取;工程地质岩组依据《工程岩体分级标准 GBT50218-2014》[44]经岩性分类与合并获得;到断裂距离、到水系距离与到道路距离因子由ArcGIS的欧氏距离分析工具得到;土地利用类型因子基于1990—2021年中国30 m年土地覆被数据,分为植被区域、农田、水体、裸地、不透水面五大类;20年土地利用变化因子基于2000年与2020年土地利用类型因子,通过ArcGIS的地图代数工具对植被区域、农田、水体、裸地、不透水面五个类别进行栅格赋值运算,得到包含19种土地利用变化类型的栅格图。
图3 滑坡评估因子

Fig. 3 Landslide assessment factors

以30 m×30 m作为基本单元,对所有评估因子进行相关性分析与多重共线性分析,结果显示(表2表3)各因子间仅存在弱相关性甚至不相关,且不存在多重共线性(将土地利用类型与土地利用变化因子分别设置对照组进行实验,因此图表中仅体现土地利用变化因子与其余8个评估因子间的相关关系),因子选取合理。
表2 因子相关性计算结果

Tab. 2 Results of factor correlation calculation

评估因子 高程 坡度 坡向 降水量 工程地
质岩组
到断裂距离 到水系距离 到道路距离 20年土地
利用变化
高程 1.0000 0.2510 0.0227 0.2012 -0.0861 0.1866 0.2701 0.3308 -0.2536
坡度 0.2510 1.0000 0.0363 0.0839 -0.0454 0.0378 0.0909 0.1345 -0.2725
坡向 0.0227 0.0363 1.0000 0.0047 -0.0061 -0.0003 0.0044 0.0083 -0.0182
降水量 0.2012 0.0839 0.0047 1.0000 0.1787 0.0899 0.0442 -0.0158 -0.0096
工程地质岩组 -0.0861 -0.0454 -0.0061 0.1787 1.0000 -0.1616 -0.0917 -0.0578 0.0961
到断裂距离 0.1866 0.0378 -0.0003 0.0899 -0.1616 1.0000 0.0607 0.1026 -0.0529
到水系距离 0.2701 0.0909 0.0044 0.0442 -0.0917 0.0607 1.0000 0.1630 -0.1508
到道路距离 0.3308 0.1345 0.0083 -0.0158 -0.0578 0.1026 0.1630 1.0000 -0.1626
20年土地利用变化 -0.2536 -0.2725 -0.0182 -0.0096 0.0961 -0.0529 -0.1508 -0.1626 1.0000
表3 因子多重共线性计算结果

Tab. 3 Results of factor multicollinearity calculation

评估因子 TOL VIF
高程 0.1138 8.7844
坡度 0.1715 5.8319
坡向 0.1749 5.7181
降水量 0.2970 3.3674
工程地质岩组 0.3091 3.2353
到断裂距离 0.3979 2.5134
到水系距离 0.3169 3.1551
到道路距离 0.3073 3.2540
20年土地利用变化 0.2533 3.9473

4 结果与分析

4.1 土地利用变化分析

从总体变化趋势上看(图4),2000—2020年,研究区土地利用类型发生变化的面积为1199.92 km2,占区域总面积的5.24%,其中分布有212个滑坡灾害点。区域主要变化类型为植被区域与农田。2000—2020年,植被区域面积减少了878.47 km2,而农田增加了731.84 km2。从地类间的转移特征来看,变化以植被区域与农田相互转换为主。农田的增加绝大部分来源于植被区域的转移,主要表现在原始农田边缘扩张以及城镇区边缘位置,前者主要受三明市土地利用总体规划(2006—2020年)影响,优先保证优质耕地与基本农田的保有量,使2020年农业用地范围在2000年基础上进一步呈现扩张趋势,后者主要是人类活动造成的。不透水面的面积增加主要来自于植被区域与农田的转变,空间分布上表现为在原有城镇区四周向外扩张。研究区土地利用类型不断向着人类活动增强的方向转变,能够在一定程度上间接引发地质灾害,其中5.24%的地类变化区域中分布有13.78%的滑坡灾害点,证明了土地利用的动态变化对滑坡空间分布具有较高的影响作用。
图4 2000—2020年三明市土地利用类型面积转移特征

Fig. 4 Characteristics of land use area transfer in Sanming City from 2000 to 2020

采用滑坡频率比值(FR)定量分析土地利用动态变化与滑坡发育之间的关系,对2020年土地利用类型以及20年间由其他地类转变为某一地类的滑坡比与FR进行统计。结果显示(表4):研究区植被区域的滑坡占比最高,为区域滑坡总数的72.4%,其次为农田。2020年土地利用类型的FR范围介于 0~2.785之间,且随着人类活动强度的增大,植被区域、不透水面和农田的FR依次增大。植被区域虽然滑坡占比较高,但表现出较低的滑坡发生概率,这是因为植被覆盖区虽然分布有大量滑坡灾害点,但该地类所占面积也较大,并且植被根系对斜坡稳定性具有正向加固作用,从一定程度上降低了滑坡发生的可能性。从不同土地利用类型变化中的滑坡占比来看,由其他地类转变为农田的区域滑坡占比最高,且FR值也最高。20年间发生变化的地类FR范围介于0~2.812之间,说明研究区内大量的植被区域转变为农田使得区域土地利用朝着人类活动增强的方向转变,容易破坏原有的地质环境,对原有斜坡的稳定性造成一定负面影响,在未来农业用地建设过程中应更加重视农田的整体性与周围斜坡的稳定性,加强农田扩张区的滑坡监测。并且,同一地类中,土地利用发生变化的区域FR普遍高于静态类型区域,说明土地利用动态变化与滑坡发育之间具有更高的相关性,在滑坡易发性评估中考虑土地利用动态变化具有必要性。
表4 土地利用类型与变化区域滑坡频率比计算结果

Tab. 4 Results of landslide frequency ratio between land use type and change area

2020年土地利用类型 滑坡比 FR 2000—2020年
地类变化
滑坡比 FR
植被区域 0.724 0.809 变为植被区域 0.014 2.541
农田 0.250 2.785 变为农田 0.113 2.812
水体 0.003 0.618 变为水体 0.001 1.073
裸地 0 0 变为裸地 0 0
不透水面 0.023 2.248 变为不透水面 0.010 1.689

4.2 模型精度分析

4.2.1 变化因子对比分析

将处理好的样本随机划分为80%的训练数据集与20%的测试数据集,构建LR,采用10折交叉验证对引入土地利用变化因子前后的各类数据集分类准确率与模型预测精度进行对比分析。结果显示(表5):引入土地利用变化因子代替传统土地利用类型因子在模型预测方面的应用较为合理。从模型预测精度上看,采用20年土地利用变化因子的数据集准确率略高于采用土地利用类型因子,能够在一定程度上说明土地利用变化因子对于模型预测起到一定的正向作用。
表5 LR精度计算结果

Tab. 5 Results of LR accuracy calculation

项目 LR
2000年土地利用类型 2020年土地利用类型 2000—2020年土地利用变化
训练数据集 0.9024 0.9037 0.9045
测试数据集 0.9042 0.9156 0.9156
完整数据集 0.9028 0.9060 0.9067
AUC值 0.9599 0.9611 0.9611

4.2.2 模型精度对比分析

为探究单一学习器与不同集成策略学习器的预测效果,基于20年土地利用变化因子组合构建DT、GBDT与RF模型。采用网格搜索的方式对模型进行优化,具体优化参数见表6。其中,GBDT的learning_rate默认为0.01。采用10折交叉验证对各类数据集分类准确率与预测精度AUC值进行统计,结果显示(表7):采用GBDT与RF的各类数据集分类准确率明显高于DT,说明集成学习器相比于单一学习器具有更高的分类预测精度,且RF的预测效果更优于GBDT。分别采用3个模型对全区易发性进行预测,利用ROC曲线对三者的预测精度进行评价(图5)。RF的AUC值为0.8596,高于GBDT与DT 模型,进一步说明RF在滑坡易发性评估中具有更高的准确率。
表6 模型参数设置

Tab. 6 Model parameter settings

预测模型 主要参数 搜索范围 搜索步长 最优结果
DT max_depth [2,10] 2 6
max_features [2,8] 1 6
max_leaf_nodes [2,8] 1 7
GBDT n_estimators [20,300] 20 300
max_depth [2,10] 2 6
max_features [2,8] 1 8
max_leaf_nodes [2,8] 1 7
RF max_depth [2,10] 2 10
max_features [2,8] 1 5
n_estimators [20,300] 20 280
表7 数据集分类准确率与模型精度计算结果

Tab. 7 Calculation results of data set classification accuracy and model accuracy

项目 DT GBDT RF
训练数据集 0.8829 0.9533 0.9634
测试数据集 0.8815 0.9481 0.9513
完整数据集 0.8826 0.9522 0.9610
AUC值 0.9315 0.9815 0.9922
图5 ROC曲线

Fig. 5 The ROC curve

4.3 滑坡易发性分析

基于引入20 年土地利用变化因子的评估因子组合,采用RF对三明市进行滑坡易发性预测与分区制图,并采用自然断点法将预测结果划分为极高、高、中、低、极低5个等级(图6)。三明市高易发区主要分布在西部的泰宁县、建宁县、宁化县以及中部地区,少数分布在东南部的大田县境内。这些区域基本覆盖城镇周边以及茶园、梯田等土地利用发生明显变化的位置,普遍具有海拔较低、人类活动强度大的特征,因此表现出更高的滑坡发生概率。低易发区主要分布于南部海拔较高的植被覆盖区域,这些区域地类单一、受人类活动影响较小,表现出相对较低的易发性。利用频率比对基于RF的易发性分区结果进行评价(表8),结果表明:RF的极高与高易发区中分布有86%的滑坡灾害点,仅有3%的滑坡灾害点落在极低易发区内,说明分区结果与实际滑坡分布之间具有较高的一致性。从频率比值来看,极高易发区频率比为1.95,说明其与滑坡灾害之间具有较强的关联性,对滑坡发生起到一定促进作用。并且,频率比值随易发性等级的升高而逐渐增大,分区结果较为合理。
图6 基于RF的三明市滑坡易发性分区

Fig. 6 Landslide susceptibility zoning in Sanming City based on RF

表8 基于RF的滑坡易发性分区统计

Tab. 8 Statistical results of landslide susceptibility zoning based on RF

易发性等级 滑坡点/数 滑坡比 面积比 频率比
极低 46 0.03 0.17 0.18
64 0.04 0.11 0.38
109 0.07 0.16 0.44
241 0.16 0.20 0.78
极高 1078 0.70 0.36 1.95

4.4 实验验证

4.4.1 验证区概况与评估因子

福建省位于东南沿海,气候湿润、雨量充沛,植被覆盖率居全国首位,境内滑坡灾害频发,分布有大量历史滑坡灾害点。根据区域特征并结合相关性分析与多重共线性分析,本文选取高程、坡度、坡向、工程地质岩组、到断裂距离、到水系距离、到道路距离7个评估因子与土地利用因子构建评估因子数据库,数据来源与研究区一致。

4.4.2 土地利用变化因子对比分析

采用FR定量分析验证区土地利用变化与滑坡发育之间的关系,结果显示(表9):福建省滑坡灾害点绝大部分分布在植被区域与农田,2020年土地利用类型因子的FR在0~1.639之间,农田最高。20年间地类发生变化的区域共分布有13.3%的滑坡灾害点,其中由其他地类转变为农田的滑坡比为0.099,FR为2.432,滑坡灾害点最多。
表9 滑坡频率比计算结果

Tab. 9 Calculation results of landslide frequency ratio

2020年土地利用类型 滑坡比 FR 2000—2020年
地类变化
滑坡比 FR
植被区域 0.740 0.900 变为植被区域 0.021 1.258
农田 0.226 1.639 变为农田 0.099 2.432
水体 0.002 0.321 变为水体 0.000 0.338
裸地 0.000 0.000 变为裸地 0.000 0.000
不透水面 0.032 0.989 变为不透水面 0.013 0.828
表9中也可以看出,在土地利用强度较大的农田与不透水面中,有近一半的滑坡灾害点分布在由其他地类转变为该类型的区域,说明土地利用向着强度增大的方向转变更易于滑坡灾害的发生。并且,验证区由植被区域转变为农田的面积居所有土地利用变化类型的首位,进一步说明验证区农田的扩张是土地利用类型变化的主要趋势,该变化类型能够在很大程度上降低区域内斜坡的稳定性,更容易出现滑坡灾害。
在此基础上,同样选择LR模型对采用动态因子与传统土地利用类型因子的模型预测精度进行比较(表10),得到采用动态因子的因子组合具有更高的数据集分类准确率与预测精度,表明引入土地利用变化动态因子进行滑坡易发性评估更有效,与4.2.1节的结果相符。
表10 LR模型精度对比

Tab. 10 LR model accuracy comparison

项目 LR
2000年土地利用类型 2020年土地利用类型 2000—2020年土地利用变化
训练数据集 0.7239 0.7183 0.7294
测试数据集 0.7331 0.7323 0.7417
完整数据集 0.7258 0.7211 0.7319
AUC值 0.8032 0.7913 0.8082

5 结论与讨论

本文提出了一种顾及土地利用动态变化的滑坡易发性评估方法,以福建省三明市为研究区,对区域土地利用变化特征与滑坡发育之间的关系进行分析。构建逻辑回归模型对比土地利用变化因子与传统土地利用类型因子的模型预测效果,并基于AUC等指标对决策树、梯度提升树以及随机森林的模型预测性能进行对比分析。最后,以整个福建省进行验证实验,得出以下结论:
(1)土地利用类型向着强度增大的方向转变时更容易发生滑坡灾害,将土地利用变化作为动态因子引入滑坡易发性制图研究具有必要性与可行性。实验结果表明,同一地类中,土地利用发生变化的区域滑坡频率比值普遍高于静态区域,并且以由其他地类转变为农田最为突出,说明土地利用变化与滑坡空间分布之间具有更强的关联特征。
(2)基于bagging集成策略的随机森林模型具有更高的分类预测精度。ROC曲线评价结果显示,随机森林的AUC值高于梯度提升树与决策树模型,并且其在各数据集分类准确率方面也具有较明显的优势,表明随机森林在滑坡易发性评估中效果更佳,且与实际滑坡分布之间具有更好的一致性。
(3)三明市滑坡高易发区主要分布在城镇周边、茶园、梯田等土地利用变化大、受人类活动影响较大的区域;而在人类活动相对较弱的高海拔植被覆盖区表现出较低的易发性。
本文的研究结果证明了土地利用变化动态因子对滑坡易发性评估与制图研究具有重要的影响作用。周侯伯等[45]经敏感性分析发现土地利用对福建省滑坡具有重要影响;叶润青等[19]、Soma等[23]探讨了滑坡发育与土地利用变化的关联性,认为土地利用变化对滑坡发育具有较大的影响作用,并且将土地利用变化因子引入易发性制图研究能够得到良好的制图效果,与本文结论相符。因此,本研究结果也表明了将动态因子纳入机器学习模型为滑坡易发性评估分析提供了一种新的视角,为在滑坡易发性制图中引入动态因子提供了科学依据。然而,由于高精度滑坡数据难以获取,本文所使用的滑坡数据缺少准确的时间尺度信息,并且在选取评估因子时未考虑坡面曲率、水文过程等影响因素。在后续工作中将进一步收集有效数据,开展考虑多种滑坡影响因素的研究。
[1]
杨城, 林广发, 张明锋, 等. 基于DEM的福建省土质滑坡敏感性评价[J]. 地球信息科学学报, 2016, 18(12):1624-1633.

DOI

[ Yang C, Lin G F, Zhang M F, et al. Soil landslide susceptibility assessment based on DEM[J]. Journal of Geo-Information Science, 2016, 18(12):1624-1633. ] DOI:10.3724/SP.J.1047.2016.01624

DOI

[2]
黄发明, 殷坤龙, 蒋水华, 等. 基于聚类分析和支持向量机的滑坡易发性评价[J]. 岩石力学与工程学报, 2018, 37(1):156-167.

[ Huang F M, Yin K L, Jiang S H, et al. Landslide susceptibility assessment based on clustering analysis and support vector machine[J]. Chinese Journal of Rock Mechanics and Engineering, 2018, 37(1):156-167. ] DOI:10.13722/j.cnki.jrme.2017.0824

DOI

[3]
黄发明, 陈佳武, 唐志鹏, 等. 不同空间分辨率和训练测试集比例下的滑坡易发性预测不确定性[J]. 岩石力学与工程学报, 2021, 40(6):1155-1169.

[ Huang F M, Chen J W, Tang Z P, et al. Uncertainties of landslide susceptibility prediction due to different spatial resolutions and different proportions of training and testing datasets[J]. Chinese Journal of Rock Mechanics and Engineering, 2021, 40(6):1155-1169. ] DOI:10.13722/j.cnki.jrme.2020.1119

DOI

[4]
刘艳辉, 方然可, 苏永超, 等. 基于机器学习的区域滑坡灾害预警模型研究[J]. 工程地质学报, 2021, 29(1):116-124.

[ Liu Y H, Fang R K, Su Y C, et al. Machine learning based model for warning of regional landslide disasters[J]. Journal of Engineering Geology, 2021, 29(1):116-124. ] DOI:10.13544/j.cnki.jeg.2020-533

DOI

[5]
Dou J, Yunus A P, Tien B D, et al. Assessment of advanced random forest and decision tree algorithms for modeling rainfall-induced landslide susceptibility in the Izu-Oshima Volcanic Island, Japan[J]. Science of the Total Environment, 2019, 662:332-346. DOI:10.1016/j.scitotenv.2019.01.221

DOI

[6]
Liu Z Q, Gilbert G, Cepeda J M, et al. Modelling of shallow landslides with machine learning algorithms[J]. Geoscience Frontiers, 2021, 12(1):385-393. DOI:10.1016/j.gsf.2020.04.014

DOI

[7]
Pham B T, Pradhan B, Tien B D, et al. A comparative study of different machine learning methods for landslide susceptibility assessment: A case study of Uttarakhand area (India)[J]. Environmental Modelling & Software, 2016, 84:240-250. DOI:10.1016/j.envsoft.2016.07.005

DOI

[8]
张洪吉, 赵铮, 陈建华, 等. 面向滑坡危险性评价的深度一维卷积神经网络方法——以四川省芦山县为例[J]. 自然灾害学报, 2021, 30(3):191-198.

[ Zhang H J, Zhao Z, Chen J H, et al. A deep one-dimensional convolutional neural network method for landslide risk assessment: A case study in Lushan, Sichuan, China[J]. Journal of Natural Disasters, 2021, 30(3):191-198. ] DOI:10.13577/j.jnd.2021.0321

DOI

[9]
Wang D, Hao M M, Chen S, et al. Assessment of landslide susceptibility and risk factors in China[J]. Natural Hazards, 2021, 108(3):3045-3059. DOI:10.1007/s11069-021-04812-8

DOI

[10]
Sur U, Singh P, Meena S R. Landslide susceptibility assessment in a lesser Himalayan Road corridor (India) applying fuzzy AHP technique and earth-observation data[J]. Geomatics, Natural Hazards and Risk, 2020, 11(1):2176-2209. DOI:10.1080/19475705.2020.1836038

DOI

[11]
纪秋磊, 梁伟, 傅伯杰, 等. 基于Google Earth Engine平台与复杂网络的黄河流域土地利用/覆被变化分析[J]. 生态学报, 2022, 42(6):2122-2135.

[ Ji Q L, Liang W, Fu B J, et al. Land use/cover change in the Yellow River Basin based on Google Earth Engine and complex network[J]. Acta Ecologica Sinica, 2022, 42(6):2122-2135. ]

[12]
王思, 张路路, 林伟彪, 等. 基于MODIS-归一化植被指数的广东省植被覆盖与土地利用变化研究[J]. 生态学报, 2022, 42(6):2149-2163.

[ Wang S, Zhang L L, Lin W B, et al. Study on vegetation coverage and land-use change of Guangdong Province based on MODIS-NDVI[J]. Acta Ecologica Sinica, 2022, 42(6):2149-2163. ] DOI:10.5846/stxb202104261100

DOI

[13]
乔治, 蒋玉颖, 贺曈, 等. 土地利用变化模拟研究进展[J]. 生态学报, 2022(13):5165-5176.

[ Qiao Z, Jiang Y Y, He T, et al. Land use change simulation: Progress, challenges, and prospects[J]. Acta Ecologica Sinica, 2022(13):5165-5176. ]

[14]
Pisano L, Zumpano V, Malek Ž, et al. Variations in the susceptibility to landslides, as a consequence of land cover changes: A look to the past, and another towards the future[J]. Science of the Total Environment, 2017, 601/602:1147-1159. DOI:10.1016/j.scitotenv.2017.05.231

DOI

[15]
Chen L X, Guo Z Z, Yin K L, et al. The influence of land use and land cover change on landslide susceptibility: A case study in Zhushan Town, Xuan'en County (Hubei, China)[J]. Natural Hazards and Earth System Sciences, 2019, 19(10):2207-2228. DOI:10.5194/nhess-19-2207-2019

DOI

[16]
Liu J, Wu Z, Zhang H W. Analysis of changes in landslide susceptibility according to land use over 38 years in Lixian County, China[J]. Sustainability, 2021, 13(19):10858. DOI:10.3390/su131910858

DOI

[17]
Persichillo M G, Bordoni M, Meisina C. The role of land use changes in the distribution of shallow landslides[J]. Science of the Total Environment, 2017, 574:924-937. DOI:10.1016/j.scitotenv.2016.09.125

DOI

[18]
Reichenbach P, Busca C, Mondini A C, et al. The influence of land use change on landslide susceptibility zonation: The briga catchment test site (Messina, Italy)[J]. Environmental Management, 2014, 54(6):1372-1384. DOI:10.1007/s00267-014-0357-0

DOI PMID

[19]
叶润青, 李士垚, 郭飞, 等. 基于RS和GIS的三峡库区滑坡易发程度与土地利用变化的关系研究[J]. 工程地质学报, 2021, 29(3):724-733.

[ Ye R Q, Li S Y, Guo F, et al. RS and GIS analysis on relationship between landslide susceptibility and land use change in Three Gorges Reservoir area[J]. Journal of Engineering Geology, 2021, 29(3):724-733. ] DOI:10.13544/j.cnki.jeg.2020-076

DOI

[20]
Rabby Y W, Li Y K, Abedin J, et al. Impact of land use/land cover change on landslide susceptibility in rangamati municipality of rangamati district, Bangladesh[J]. ISPRS International Journal of Geo-Information, 2022, 11(2):89. DOI:10.3390/ijgi11020089

DOI

[21]
Sur U, Singh P, Rai P K, et al. Landslide probability mapping by considering fuzzy numerical risk factor (FNRF) and landscape change for road corridor of Uttarakhand, India[J]. Environment, Development and Sustainability, 2021, 23(9):13526-13554. DOI:10.1007/s10668-021-01226-1

DOI

[22]
Bourenane H, Bouhadad Y. Impact of land use changes on landslides occurrence in urban area: The case of the constantine city (NE Algeria)[J]. Geotechnical and Geological Engineering, 2021, 39(6):1-21. DOI:10.1007/s10706-021-01768-1

DOI

[23]
Soma A S, Kubota T, Aditian A. Comparative study of land use change and landslide susceptibility using frequency ratio, certainty factor, and logistic regression in upper area of Ujung-loe watersheds south Sulawesi Indonesia[J]. International Journal of Erosion Control Engineering, 2019, 11(4):103-115. DOI:10.13101/ijece.11.103

DOI

[24]
李远远, 梅红波, 任晓杰, 等. 基于确定性系数和支持向量机的地质灾害易发性评价[J]. 地球信息科学学报, 2018, 20(12):1699-1709.

DOI

[ Li Y Y, Mei H B, Ren X J, et al. Geological disaster susceptibility evaluation based on certainty factor and support vector machine[J]. Journal of Geo-Information Science, 2018, 20(12):1699-1709. ] DOI:10.12082/dqxxkx.2018.180349

DOI

[25]
许冲, 戴福初, 姚鑫, 等. GIS支持下基于层次分析法的汶川地震区滑坡易发性评价[J]. 岩石力学与工程学报, 2009, 28(S2):3978-3985.

[ Xu C, Dai F C, Yao X, et al. GIS-based landslide susceptibility assessment using analytical hierarchy process in Wenchuan earthquake region[J]. Chinese Journal of Rock Mechanics and Engineering, 2009, 28(S2):3978-3985. ]

[26]
许冲, 戴福初, 姚鑫, 等. 基于GIS与确定性系数分析方法的汶川地震滑坡易发性评价[J]. 工程地质学报, 2010, 18(1):15-26.

[ Xu C, Dai F C, Yao X, et al. GIS platform and certainty factor analysis method based Wenchuan earthquake-induced landslide susceptibility evaluation[J]. Journal of Engineering Geology, 2010, 18(1):15-26. ]

[27]
杨华阳, 许向宁, 杨鸿发. 基于证据权法的九寨沟地震滑坡危险性评价[J]. 中国地质灾害与防治学报, 2020, 31(3):20-29.

[ Yang H Y, Xu X N, Yang H F. The Jiuzhaigou co-seismic landslide hazard assessment based on weight of evidence method[J]. The Chinese Journal of Geological Hazard and Control, 2020, 31(3):20-29. ] DOI:10.16031/j.cnki.issn.1003-8035.2020.03.03

DOI

[28]
张俊, 殷坤龙, 王佳佳, 等. 三峡库区万州区滑坡灾害易发性评价研究[J]. 岩石力学与工程学报, 2016, 35(2):284-296.

[ Zhang J, Yin K L, Wang J J, et al. Evaluation of landslide susceptibility for Wanzhou District of Three Gorges Reservoir[J]. Chinese Journal of Rock Mechanics and Engineering, 2016, 35(2):284-296. ] DOI:10.13722/j.cnki.jrme.2015.0318

DOI

[29]
田乃满, 兰恒星, 伍宇明, 等. 人工神经网络和决策树模型在滑坡易发性分析中的性能对比[J]. 地球信息科学学报, 2020, 22(12):2304-2316.

DOI

[ Tian N M, Lan H X, Wu Y M, et al. Performance comparison of BP artificial neural network and CART decision tree model in landslide susceptibility prediction[J]. Journal of Geo-Information Science, 2020, 22(12):2304-2316. ]

[30]
Pourghasemi H R, Sadhasivam N, Amiri M, et al. Landslide susceptibility assessment and mapping using state-of-the art machine learning techniques[J]. Natural Hazards, 2021, 108(1):1291-1316. DOI:10.1007/s11069-021-04732-7

DOI

[31]
Wei A H, Yu K N, Dai F G, et al. Application of tree-based ensemble models to landslide susceptibility mapping: A comparative study[J]. Sustainability, 2022, 14(10):6330. DOI:10.3390/su14106330

DOI

[32]
王世宝, 庄建琦, 樊宏宇, 等. 基于频率比与集成学习的滑坡易发性评价——以金沙江上游巴塘—德格河段为例[J]. 工程地质学报, 2022, 30(3):817-828.

[ Wang S B, Zhuang J Q, Fan H Y, et al. Evaluation of landslide susceptibility based on frequency ratio and ensemble learning—Taking the Batang-Dege section in the upstream of Jinsha River as an example[J]. Journal of Engineering Geology, 2022, 30(3):817-828. ] DOI:10.13544/j.cnki.jeg.2020-639

DOI

[33]
梁柱. 机器学习在浅层滑坡敏感性评价中的综合应用与研究[D]. 长春: 吉林大学, 2021.

[ Liang Z. Comprehensive application and study of machine learning in susceptibility evaluation of shallow landslides[D]. Changchun: Jilin University, 2021. ]

[34]
牛全福, 冯尊斌, 党星海, 等. 黄土区滑坡研究中地形因子的选取与适宜性分析[J]. 地球信息科学学报, 2017, 19(12):1584-1592.

DOI

[ Niu Q F, Feng Z B, Dang X H, et al. Suitability analysis of topographic factors in loess landslide research[J]. Journal of Geo-Information Science, 2017, 19(12):1584-1592. ]

[35]
王毅, 方志策, 牛瑞卿, 等. 基于深度学习的滑坡灾害易发性分析[J]. 地球信息科学学报, 2021, 23(12):2244-2260.

DOI

[ Wang Y, Fang Z C, Niu R Q, et al. Landslide susceptibility analysis based on deep learning[J]. Journal of Geo-Information Science, 2021, 23(12):2244-2260. ]

[36]
梁杰, 陈嘉豪, 张雪芹, 等. 基于独热编码和卷积神经网络的异常检测[J]. 清华大学学报(自然科学版), 2019, 59(7):523-529.

[ Liang J, Chen J H, Zhang X Q, et al. One-hot encoding and convolutional neural network based anomaly detection[J]. Journal of Tsinghua University (Science and Technology), 2019, 59(7):523-529. ] DOI:10.16511/j.cnki.qhdxxb.2018.25.061

DOI

[37]
Swets J A. Measuring the accuracy of diagnostic systems[J]. Science, 1988, 240(4857):1285-1293. DOI:10.1126/science.3287615

DOI PMID

[38]
郭子正, 殷坤龙, 黄发明, 等. 基于滑坡分类和加权频率比模型的滑坡易发性评价[J]. 岩石力学与工程学报, 2019, 38(2):287-300.

[ Guo Z Z, Yin K L, Huang F M, et al. Evaluation of landslide susceptibility based on landslide classification and weighted frequency ratio model[J]. Chinese Journal of Rock Mechanics and Engineering, 2019, 38(2):287-300. ] DOI:10.13722/j.cnki.jrme.2018.0838

DOI

[39]
Friedman J H. Greedy function approximation: A gradient boosting machine[J]. The Annals of Statistics, 2001, 29(5):1189-1232. DOI:10.1214/aos/1013203451

DOI

[40]
宋英旭. 基于空天地一体化监测的滑坡风险动态评价研究[D]. 武汉: 中国地质大学, 2019.

[ Song Y X. Dynamic evaluation of landslide risk based on integrated monitoring of satellite, airborne and ground-based data[D]. Wuhan: China University of Geosciences, 2019. ]

[41]
Breiman L. Random forests[J]. Machine Learning, 2001, 45(1):5-32. DOI:10.1023/A:1010933404324

DOI

[42]
吴润泽, 胡旭东, 梅红波, 等. 基于随机森林的滑坡空间易发性评价:以三峡库区湖北段为例[J]. 地球科学, 2021, 46(1):321-330.

[ Wu R Z, Hu X D, Mei H B, et al. Spatial susceptibility assessment of landslides based on random forest: A case study from Hubei section in the Three Gorges Reservoir area[J]. Earth Science, 2021, 46(1):321-330. ]

[43]
韦德光, 揭育金, 黄廷淦. 福建省区域地质构造特征[J]. 中国区域地质, 1997, 16(2):162-170.

[ Wei D G, Jie Y J, Huang T G. Regional geological structure of Fujian[J]. Regional Geology of China, 1997, 16(2):162-170. ]

[44]
中华人民共和国住房和城乡建设部. 工程岩体分级标准:GB/T 50218—2014: 北京: 中国计划出版社, 2015.

[ Ministry of Housing and Urban-Rural Development of the People's Republic of China. GB/T 50218—2014[S]. Beijing: China Planning Press, 2015. ]

[45]
周侯伯, 肖桂荣, 林炫歆, 等. 基于特征筛选与差分进化算法优化的滑坡危险性评估方法[J]. 地球信息科学学报, 2022, 24(12):2373-2388.

DOI

[ Zhou H B, Xiao G R, Lin X X, et al. Landslide hazard assessment method based on feature screening and differential evolutionalgorithm optimization[J]. Journal of Geo-information Science, 2022, 24(12):2373-2388. ] DOI:10.12082/dqxxkx.2022.220158

DOI

文章导航

/