顾及土地利用动态变化的滑坡易发性评估方法
林炫歆(1999— ),女,福建福州人,硕士研究生,主要从事数据挖掘、机器学习与地质灾害风险评估研究。E-mail: linxuanxin0928@163.com |
收稿日期: 2022-08-03
修回日期: 2022-11-15
网络出版日期: 2023-04-27
基金资助
中央引导地方科技发展专项(2020L3005)
中国科学院A类战略性先导科技专项(XDA23100504)
Landslide Susceptibility Assessment Method Considering Land Use Dynamic Change
Received date: 2022-08-03
Revised date: 2022-11-15
Online published: 2023-04-27
Supported by
The Central Guided Local Development of Science and Technology Project(2020L3005)
The Strategic Priority Research Program of the Chinese Academy of Sciences(Class A)(XDA23100504)
滑坡灾害成因复杂,滑坡易发性评估对灾害预警与防控管理具有重要意义。由于以往易发性制图研究中未顾及土地利用变化因素,本文提出考虑土地利用动态变化的滑坡易发性评估因子组合。采用滑坡频率比定量衡量土地利用变化与滑坡发育的相关关系,并基于逻辑回归模型(Logistic Regression, LR)对比引入土地利用变化因子前后的模型预测效果。在此基础上,构建决策树(Decision Tree, DT)、梯度提升树(Gradient Boosting Decision Tree, GBDT)与随机森林(Random Forest, RF)模型,利用AUC等指标对模型预测性能进行对比分析。最后以福建省三明市为研究区,以整个福建省为验证区,开展滑坡易发性评估研究。研究表明:土地利用变化因子与滑坡发育之间具有更强的关联特征,在滑坡易发性评估中引入动态变化因子具有必要性。RF模型比DT与GBDT具有更高的预测精度与准确率。滑坡高易发区主要分布在三明市西部与中部地区,该区域土地利用变化程度较大、受人类活动影响大;低易发区基本位于人类活动影响较小的高海拔区域。本研究为滑坡易发性评估提出一种新的研究角度,为探究人类对灾害形成的影响提供帮助。
林炫歆 , 肖桂荣 , 周侯伯 . 顾及土地利用动态变化的滑坡易发性评估方法[J]. 地球信息科学学报, 2023 , 25(5) : 953 -966 . DOI: 10.12082/dqxxkx.2023.220567
The causes of landslide disasters are complex, and landslide susceptibility assessment is of great significance for disaster warning, prevention, and control management. In the previous mapping studies on landslide susceptibility assessment, land use change factor was not considered. This paper proposed a combination of factors for landslide susceptibility assessment by considering land use dynamic change factor. The landslide frequency ratio was used to quantitatively measure the correlation between land use change and landslide development. And Logistic Regression (LR) model was used to compare the prediction ability of the model before and after the introduction of land use change factor. We constructed three machine learning models: Decision Tree (DT), Gradient Boosting Decision Tree (GBDT), and Random Forest (RF). We used AUC and other indicators to compare model performance. Finally, we took Sanming City of Fujian Province as the study area and the whole Fujian Province as the verification area to conduct the landslide susceptibility assessment research. The results show that there is a strong correlation between land use change factor and landslide development. The inclusion of land use change factor improves model prediction accuracy, which indicates that it is necessary to introduce dynamic factor in the assessment of landslide susceptibility. The verification results show that RF model has higher prediction accuracy than DT and GBDT. The high landslide prone areas are mainly distributed in the west and central of Sanming City, where the land use change degree is high, and the impact of human activities is great. The low landslide prone areas basically locate in the high-altitude areas with little influence of human activities. This study provides a new research perspective for landslide susceptibility assessment and helps to explore the impact of human activities on disaster formation.
表1 数据来源与数据类型Tab. 1 Data source and data type |
基础数据 | 数据来源 | 数据类型 | 数据年份 | 分辨率 |
---|---|---|---|---|
滑坡空间分布数据 | 资源环境科学与数据中心 (https://www.resdc.cn/data.aspx?DATAID=290) | 矢量 | 积累至2019年 | — |
数字高程影像 | ASTER Global Digital Elevation Model V003 (https://search.earthdata.nasa.gov/search) | 栅格 | 成像时间为2000年3月1日—2013年11月30日 | 30 m×30 m |
自然地理数据 | 全国地理信息资源目录服务系统1:100万全国基础地理数据库 (https://www.webmap.cn/commres.do?method=result100W) | 矢量 | 2021年 | — |
地形数据 | 从数字高程影像中提取 | 栅格 | — | 30 m×30 m |
降水量数据 | 温室数据共享平台(http://data.sheshiyuanyi.com/) | 文本 | 2000—2019年 | — |
地质数据 | 地质科学数据出版系统1:100万福建省地质图数据 (http://dcc.cgs.gov.cn/) | 矢量 | 2017年 | — |
土地利用类型数据 | 1990—2021年中国30 m年土地覆被数据集及其动态( https://doi.org/10.5281/zenodo.5816591) | 栅格 | 2000—2020年 | 30 m×30 m |
表2 因子相关性计算结果Tab. 2 Results of factor correlation calculation |
评估因子 | 高程 | 坡度 | 坡向 | 降水量 | 工程地 质岩组 | 到断裂距离 | 到水系距离 | 到道路距离 | 20年土地 利用变化 |
---|---|---|---|---|---|---|---|---|---|
高程 | 1.0000 | 0.2510 | 0.0227 | 0.2012 | -0.0861 | 0.1866 | 0.2701 | 0.3308 | -0.2536 |
坡度 | 0.2510 | 1.0000 | 0.0363 | 0.0839 | -0.0454 | 0.0378 | 0.0909 | 0.1345 | -0.2725 |
坡向 | 0.0227 | 0.0363 | 1.0000 | 0.0047 | -0.0061 | -0.0003 | 0.0044 | 0.0083 | -0.0182 |
降水量 | 0.2012 | 0.0839 | 0.0047 | 1.0000 | 0.1787 | 0.0899 | 0.0442 | -0.0158 | -0.0096 |
工程地质岩组 | -0.0861 | -0.0454 | -0.0061 | 0.1787 | 1.0000 | -0.1616 | -0.0917 | -0.0578 | 0.0961 |
到断裂距离 | 0.1866 | 0.0378 | -0.0003 | 0.0899 | -0.1616 | 1.0000 | 0.0607 | 0.1026 | -0.0529 |
到水系距离 | 0.2701 | 0.0909 | 0.0044 | 0.0442 | -0.0917 | 0.0607 | 1.0000 | 0.1630 | -0.1508 |
到道路距离 | 0.3308 | 0.1345 | 0.0083 | -0.0158 | -0.0578 | 0.1026 | 0.1630 | 1.0000 | -0.1626 |
20年土地利用变化 | -0.2536 | -0.2725 | -0.0182 | -0.0096 | 0.0961 | -0.0529 | -0.1508 | -0.1626 | 1.0000 |
表3 因子多重共线性计算结果Tab. 3 Results of factor multicollinearity calculation |
评估因子 | TOL | VIF |
---|---|---|
高程 | 0.1138 | 8.7844 |
坡度 | 0.1715 | 5.8319 |
坡向 | 0.1749 | 5.7181 |
降水量 | 0.2970 | 3.3674 |
工程地质岩组 | 0.3091 | 3.2353 |
到断裂距离 | 0.3979 | 2.5134 |
到水系距离 | 0.3169 | 3.1551 |
到道路距离 | 0.3073 | 3.2540 |
20年土地利用变化 | 0.2533 | 3.9473 |
表4 土地利用类型与变化区域滑坡频率比计算结果Tab. 4 Results of landslide frequency ratio between land use type and change area |
2020年土地利用类型 | 滑坡比 | FR | 2000—2020年 地类变化 | 滑坡比 | FR |
---|---|---|---|---|---|
植被区域 | 0.724 | 0.809 | 变为植被区域 | 0.014 | 2.541 |
农田 | 0.250 | 2.785 | 变为农田 | 0.113 | 2.812 |
水体 | 0.003 | 0.618 | 变为水体 | 0.001 | 1.073 |
裸地 | 0 | 0 | 变为裸地 | 0 | 0 |
不透水面 | 0.023 | 2.248 | 变为不透水面 | 0.010 | 1.689 |
表5 LR精度计算结果Tab. 5 Results of LR accuracy calculation |
项目 | LR | ||
---|---|---|---|
2000年土地利用类型 | 2020年土地利用类型 | 2000—2020年土地利用变化 | |
训练数据集 | 0.9024 | 0.9037 | 0.9045 |
测试数据集 | 0.9042 | 0.9156 | 0.9156 |
完整数据集 | 0.9028 | 0.9060 | 0.9067 |
AUC值 | 0.9599 | 0.9611 | 0.9611 |
表6 模型参数设置Tab. 6 Model parameter settings |
预测模型 | 主要参数 | 搜索范围 | 搜索步长 | 最优结果 |
---|---|---|---|---|
DT | max_depth | [2,10] | 2 | 6 |
max_features | [2,8] | 1 | 6 | |
max_leaf_nodes | [2,8] | 1 | 7 | |
GBDT | n_estimators | [20,300] | 20 | 300 |
max_depth | [2,10] | 2 | 6 | |
max_features | [2,8] | 1 | 8 | |
max_leaf_nodes | [2,8] | 1 | 7 | |
RF | max_depth | [2,10] | 2 | 10 |
max_features | [2,8] | 1 | 5 | |
n_estimators | [20,300] | 20 | 280 |
表7 数据集分类准确率与模型精度计算结果Tab. 7 Calculation results of data set classification accuracy and model accuracy |
项目 | DT | GBDT | RF |
---|---|---|---|
训练数据集 | 0.8829 | 0.9533 | 0.9634 |
测试数据集 | 0.8815 | 0.9481 | 0.9513 |
完整数据集 | 0.8826 | 0.9522 | 0.9610 |
AUC值 | 0.9315 | 0.9815 | 0.9922 |
图6 基于RF的三明市滑坡易发性分区Fig. 6 Landslide susceptibility zoning in Sanming City based on RF |
表8 基于RF的滑坡易发性分区统计Tab. 8 Statistical results of landslide susceptibility zoning based on RF |
易发性等级 | 滑坡点/数 | 滑坡比 | 面积比 | 频率比 |
---|---|---|---|---|
极低 | 46 | 0.03 | 0.17 | 0.18 |
低 | 64 | 0.04 | 0.11 | 0.38 |
中 | 109 | 0.07 | 0.16 | 0.44 |
高 | 241 | 0.16 | 0.20 | 0.78 |
极高 | 1078 | 0.70 | 0.36 | 1.95 |
表9 滑坡频率比计算结果Tab. 9 Calculation results of landslide frequency ratio |
2020年土地利用类型 | 滑坡比 | FR | 2000—2020年 地类变化 | 滑坡比 | FR |
---|---|---|---|---|---|
植被区域 | 0.740 | 0.900 | 变为植被区域 | 0.021 | 1.258 |
农田 | 0.226 | 1.639 | 变为农田 | 0.099 | 2.432 |
水体 | 0.002 | 0.321 | 变为水体 | 0.000 | 0.338 |
裸地 | 0.000 | 0.000 | 变为裸地 | 0.000 | 0.000 |
不透水面 | 0.032 | 0.989 | 变为不透水面 | 0.013 | 0.828 |
表10 LR模型精度对比Tab. 10 LR model accuracy comparison |
项目 | LR | ||
---|---|---|---|
2000年土地利用类型 | 2020年土地利用类型 | 2000—2020年土地利用变化 | |
训练数据集 | 0.7239 | 0.7183 | 0.7294 |
测试数据集 | 0.7331 | 0.7323 | 0.7417 |
完整数据集 | 0.7258 | 0.7211 | 0.7319 |
AUC值 | 0.8032 | 0.7913 | 0.8082 |
[1] |
杨城, 林广发, 张明锋, 等. 基于DEM的福建省土质滑坡敏感性评价[J]. 地球信息科学学报, 2016, 18(12):1624-1633.
[
|
[2] |
黄发明, 殷坤龙, 蒋水华, 等. 基于聚类分析和支持向量机的滑坡易发性评价[J]. 岩石力学与工程学报, 2018, 37(1):156-167.
[
|
[3] |
黄发明, 陈佳武, 唐志鹏, 等. 不同空间分辨率和训练测试集比例下的滑坡易发性预测不确定性[J]. 岩石力学与工程学报, 2021, 40(6):1155-1169.
[
|
[4] |
刘艳辉, 方然可, 苏永超, 等. 基于机器学习的区域滑坡灾害预警模型研究[J]. 工程地质学报, 2021, 29(1):116-124.
[
|
[5] |
|
[6] |
|
[7] |
|
[8] |
张洪吉, 赵铮, 陈建华, 等. 面向滑坡危险性评价的深度一维卷积神经网络方法——以四川省芦山县为例[J]. 自然灾害学报, 2021, 30(3):191-198.
[
|
[9] |
|
[10] |
|
[11] |
纪秋磊, 梁伟, 傅伯杰, 等. 基于Google Earth Engine平台与复杂网络的黄河流域土地利用/覆被变化分析[J]. 生态学报, 2022, 42(6):2122-2135.
[
|
[12] |
王思, 张路路, 林伟彪, 等. 基于MODIS-归一化植被指数的广东省植被覆盖与土地利用变化研究[J]. 生态学报, 2022, 42(6):2149-2163.
[
|
[13] |
乔治, 蒋玉颖, 贺曈, 等. 土地利用变化模拟研究进展[J]. 生态学报, 2022(13):5165-5176.
[
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
叶润青, 李士垚, 郭飞, 等. 基于RS和GIS的三峡库区滑坡易发程度与土地利用变化的关系研究[J]. 工程地质学报, 2021, 29(3):724-733.
[
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
李远远, 梅红波, 任晓杰, 等. 基于确定性系数和支持向量机的地质灾害易发性评价[J]. 地球信息科学学报, 2018, 20(12):1699-1709.
[
|
[25] |
许冲, 戴福初, 姚鑫, 等. GIS支持下基于层次分析法的汶川地震区滑坡易发性评价[J]. 岩石力学与工程学报, 2009, 28(S2):3978-3985.
[
|
[26] |
许冲, 戴福初, 姚鑫, 等. 基于GIS与确定性系数分析方法的汶川地震滑坡易发性评价[J]. 工程地质学报, 2010, 18(1):15-26.
[
|
[27] |
杨华阳, 许向宁, 杨鸿发. 基于证据权法的九寨沟地震滑坡危险性评价[J]. 中国地质灾害与防治学报, 2020, 31(3):20-29.
[
|
[28] |
张俊, 殷坤龙, 王佳佳, 等. 三峡库区万州区滑坡灾害易发性评价研究[J]. 岩石力学与工程学报, 2016, 35(2):284-296.
[
|
[29] |
田乃满, 兰恒星, 伍宇明, 等. 人工神经网络和决策树模型在滑坡易发性分析中的性能对比[J]. 地球信息科学学报, 2020, 22(12):2304-2316.
[
|
[30] |
|
[31] |
|
[32] |
王世宝, 庄建琦, 樊宏宇, 等. 基于频率比与集成学习的滑坡易发性评价——以金沙江上游巴塘—德格河段为例[J]. 工程地质学报, 2022, 30(3):817-828.
[
|
[33] |
梁柱. 机器学习在浅层滑坡敏感性评价中的综合应用与研究[D]. 长春: 吉林大学, 2021.
[
|
[34] |
牛全福, 冯尊斌, 党星海, 等. 黄土区滑坡研究中地形因子的选取与适宜性分析[J]. 地球信息科学学报, 2017, 19(12):1584-1592.
[
|
[35] |
王毅, 方志策, 牛瑞卿, 等. 基于深度学习的滑坡灾害易发性分析[J]. 地球信息科学学报, 2021, 23(12):2244-2260.
[
|
[36] |
梁杰, 陈嘉豪, 张雪芹, 等. 基于独热编码和卷积神经网络的异常检测[J]. 清华大学学报(自然科学版), 2019, 59(7):523-529.
[
|
[37] |
|
[38] |
郭子正, 殷坤龙, 黄发明, 等. 基于滑坡分类和加权频率比模型的滑坡易发性评价[J]. 岩石力学与工程学报, 2019, 38(2):287-300.
[
|
[39] |
|
[40] |
宋英旭. 基于空天地一体化监测的滑坡风险动态评价研究[D]. 武汉: 中国地质大学, 2019.
[
|
[41] |
[42] |
吴润泽, 胡旭东, 梅红波, 等. 基于随机森林的滑坡空间易发性评价:以三峡库区湖北段为例[J]. 地球科学, 2021, 46(1):321-330.
[
|
[43] |
韦德光, 揭育金, 黄廷淦. 福建省区域地质构造特征[J]. 中国区域地质, 1997, 16(2):162-170.
[
|
[44] |
中华人民共和国住房和城乡建设部. 工程岩体分级标准:GB/T 50218—2014: 北京: 中国计划出版社, 2015.
[ Ministry of Housing and Urban-Rural Development of the People's Republic of China. GB/T 50218—2014[S]. Beijing: China Planning Press, 2015. ]
|
[45] |
周侯伯, 肖桂荣, 林炫歆, 等. 基于特征筛选与差分进化算法优化的滑坡危险性评估方法[J]. 地球信息科学学报, 2022, 24(12):2373-2388.
[
|
/
〈 | 〉 |