A Potential Gully Debris Flows Hazard Assessment Method: A CNN Model based on Multi-source Data Fusion

  • XU Fanshu , 1 ,
  • WANG Baoyun , 2, 3, * ,
  • HAN Jun 1
Expand
  • 1. School of Information, Yunnan Normal University, Kunming 650500, China
  • 2. School of Mathematics, Yunnan Normal University, Kunming 650500, China
  • 3. Key Laboratory of Modeling and Application of Complex Systems in Universities of Yunnan Province, Kunming 650500, China
* WANG Baoyun, E-mail:

Received date: 2022-07-14

  Revised date: 2022-08-22

  Online published: 2023-04-19

Supported by

National Natural Science Foundation of China(61966040)

Abstract

Gully debris flows frequently occur in mountainous regions. Hazard investigation in large area is always hampered by the rugged mountains. In this paper, a convolutional neural network named Residual-Shuffle-Dense residual Net (RSDNet) based on remote sensing, DEM, soil, lithology, and vegetation data was proposed to conduct large-scale territorial surveys. First, shallow features were extracted by modified residual structure using maximize pooling. Then, feature fusion was conducted to strengthen the correlation between the underlying features of various data. Next, dense residual structure was applied to make further feature extraction from underlying features and identify the impact of interaction between various features on potential debris flow hazard. Finally, the potential hazard level of a valley was given. During the training process, a joint loss function based on cross entropy loss and modified focal loss was used to make the model better distinguish the morphological and disaster-causing characteristics of various valleys. In this study, the valley classification achieved a precision rate of 0.92 by using RSDNet. In the potential hazard assessment of all valleys in Nujiang Prefecture, 122 out of 132 historical debris flow valleys were judged to be dangerous or very dangerous. Results indicate that the proposed model performs well, and this work would offer new ideas for potential debris flows hazard assessment.

Cite this article

XU Fanshu , WANG Baoyun , HAN Jun . A Potential Gully Debris Flows Hazard Assessment Method: A CNN Model based on Multi-source Data Fusion[J]. Journal of Geo-information Science, 2023 , 25(3) : 588 -605 . DOI: 10.12082/dqxxkx.2023.220514

1 引言

泥石流是一种多发于山区沟谷的自然灾害。泥石流破坏作用强,发生突然,难以预测,因此严重威胁着山区居民的人身安全[1]。为保护山区人民的生命财产安全,对山区沟谷进行合理的危险性评价成为了近年来研究的重点。泥石流灾害危险性是指在一定区域内泥石流灾害发生的可能性[2]。目前,常见的危险性评价方法大致可分为三类:基于统计学理论的方法、基于数值模拟的方法以及基于机器学习的方法。
基于统计的方法首先统计历史泥石流沟谷的各项属性,包括流域面积,坡度,植被覆盖率等;之后通过某个定权方法确定各属性的权重;最后选择合适的函数拟合各属性之间的关系,将拟合得到的函数作为评价函数。对未知沟谷进行评价时,将待测沟谷的相关属性输入评价函数,就可得到评价结果。该方法是目前应用最为广泛的方法。灰色关联法被用于北川县泥石流的分析[3]。层次分析法被用于新疆的泥石流危险性评价[4]。模糊综合评价法也是该类方法中较为常见的一种,该方法被用于汶川县的单沟泥石流危险性评价[5-6]。基于统计的方法存在的主要问题有二点:①作为模型输入的各参数值往往只是统计量,无法全面反映某一沟谷的具体属性。如两条主沟长度相近的沟谷,其几何形态可能存在巨大差异。②不同方法甚至相同方法在考察同一地区的泥石流沟谷危险性时,在评价因子的选取上存在较大出入。例如同样对汶川县的沟谷进行危险度评价,文献[5]和文献[6]分别将泥沙补给长度比和沟壑密度纳入评价指标。出现这种情况的主要原因是各专家在因子选择上存在一定的主观性,这导致了该类方法无法取得很好的泛化效果,不利于大面积的国土排查工作。
基于数值模拟的方法先选定用于模拟的动力学模型,之后将某条沟谷的具体信息,如降雨强度、屈服应力等输入模型进行数值模拟,最后根据模拟得到的泥石流流速、冲出量等参数评价沟谷的危险性。该类方法国内运用较广的有FLO-2D[7]、MassFlow[8]等,国外运用较广的有FLO-3D[9]、DAN3D[10]、Debris2D[11]等。数值模拟方法存在的问题在于,输入模型的参数除了主沟长度,坡度等统计量外,还需要一些通过实地考察才能获得的数据,如集水点位置。而这类数据不易在地形复杂的山区获得。因此,这类方法往往只能对几条沟谷进行评价,无法快速地对成百条沟谷进行危险性评估。
目前,基于机器学习的泥石流沟谷危险度评价方法还处于起步阶段,大多数方法均先设定好用于危险度评价的因子,之后从历史泥石流沟谷中计算这些因子的值,使用这些因子数据调整模型参数,调参后的模型可用于沟谷的危险度评价。BP神经网络[12]、多分类支持向量机[13]、随机森林模型[14]均被尝试用于沟谷泥石流的危险性评价。尽管这些方法都取得了一定的效果,但仍然需要手动选择用于危险度评价的因子。
近年来,随着卫星遥感与地质调查技术的快速发展,地质调查领域积累了全面且大量的地质观测数据。以卷积神经网络(CNN)模型为代表的新一代机器学习技术日渐发展成熟,且在地质灾害领域崭露头角。刘佳等[15]以遥感数据为基础,使用CNN模型对滑坡进行识别,CNN模型已被用于全球各地的滑坡的易发性评价[16-18]。地震震级的估算也可通过CNN模型完成[19]。然而,通过文献检索,发现几乎没有研究者使用CNN对沟谷泥石流进行危险性评价。使用CNN模型,不需要预先设定用于危险性评价的因子,所输入模型的为连续的图像数据,而非孤立的统计量,能更好地反映沟谷特性。模型能自适应地从各类数据中挖掘特征,并分析这些特征间的关系,从而给出沟谷的潜在泥石流危险性评价。
本文提出了一个基于多源数据融合的CNN模型RSDNet (Residual-Shuffle-Dense residual Net),并使用该模型对怒江州境内的所有沟谷进行潜在泥石流危险性评价。该模型具有以下特点:① 通过改进残差结构,在数据量较少的情况下,实现了对不同类型数据的底层特征提取;② 实现了不同类型数据的融合,尤其是岩性、土壤和植被数据的加入,使得模型的评价结果更全面;③ 引入了分组融合机制,提升多源融合效果的同时简化了模型结构;④ 设计了一种新的损失函数,使得模型能更好地区分潜在危险性高的沟谷与危险性低的沟谷之间的特征差异。

2 多源数据融合的沟谷泥石流潜在 危险性评价方法

本研究以遥感数据、DEM数据、岩性、土壤和植被数据为基础,以每一条沟谷为研究对象,通过构建的卷积神经网络模型RSDNet对沟谷潜在泥石流危险性进行评价。实验首先从原始数据中提取出各条沟谷的相关数据。之后通过资料检索和人工判断选取出发生过泥石流和未发生泥石流的沟谷。接着按照高程差、主沟长度和面积将这些已知沟谷又分为了6类(类别编号0~5)。这些沟谷被分为训练集和测试集对网络进行训练和测试。最后,使用训练后的网络,对怒江州内的未知沟谷进行泥石流潜在危险性评价。数据提取与分类的相关细节见3.2节。本研究的技术路线图见图1
图1 多源数据融合的潜在泥石流危险性评价技术路线

Fig. 1 Flow chart of multi-source data fusion for potential hazard assessment of debris flows

本文所提出的RSDNet整体结构见图2。RSDNet主要由两部分组成,浅层特征提取部分与数据特征融合部分。浅层特征的提取主要通过对各类数据分别使用最大池化改进的残差模块(Pooling-Residual, PR)完成,详见2.1节。在数据特征融合部分,首先借鉴ShuffleNet[20],使用了通道重排技术(Channel Shuffle),以加强各底层特征间的关联性。之后基于DenseNet[21]的密集残差连接,设计了数据融合模块(Fuse Block, FB),具体细节见2.2节。模型最后通过全连接,输出未知沟谷与各类已知沟谷的特征相似度,用于潜在危险性评价。此外,在整个模型的训练过程中,本文基于焦点损失(Focal Loss, FL)[22]的设计理念,构建了一个新的用于强化正负样本特征差异的损失函数Enhance Loss(EL),该损失函数将在2.3节详细讨论。沟谷潜在危险性的评价方式详见2.4节。
图2 RSDNet整体结构

Fig. 2 Structure diagram of the RSDNet

2.1 基于改进残差结构的多源数据特征提取模块

使用CNN对沟谷的底层特征进行提取的主要困难在于数据量过少。常规的神经网络动辄需要上万张图片进行训练,而可用于训练测试的沟谷数据只有数百张。仅通过数据增强来增加数据量是不可行的,还需要对网络结构精心设计以解决因数据量过少而引起的模型过拟合问题。为此,在底层特征提取阶段使用了在小样本问题上表现优异残差结构[23]。本文所设计的改进残差结构见图3
图3 使用最大池化改进的残差结构

Fig. 3 Modified residual structure by maximize pooling

F i ( . )表示第 i层的卷积操作, o i表示第 i层的输出, o i - 1表示前一层的输出,
则对于原始的残差模块,第 i层的输出为:
o i = F i o i - 1 + o i - 1
本文基于最大池化改进了残差连接,设 P ( . )表示池化操作,则修正后的残差结构在第 i层的输出 o i为:
o i = F i o i - 1 + P o i - 1
地质专家在考察某一沟谷的危险性时,会重点关注高差更大,坡度更大,植被覆盖更差的部分[1-5]。这些部分往往是某条沟谷被认为较为危险的主要原因。本文参考这一模式,使用最大池化,使模型能对这些特征值更高的部分具有更强的响应。同时通过残差连接,在强化这些重点部分的同时,也不要忽视沟谷的整体特征,从而得到较为准确全面的底层特征,作为后续特征融合的基础。
在具体的实现上,由于DEM、土壤、岩性和植被数据均为二维数据,因此构建了使用二维卷积的PR-2D模块。而遥感数据的不同波段间往往存在一定的关联特征,因此设计了同时对多波段数据进行特征提取的PR-3D模块。在图3的模型整体结构中,由于DEM与遥感数据所具有的特征较为丰富,如曲率、坡度、坡向、NDVI等,而岩性、土壤和植被数据反映的特征较为单一,故对DEM和遥感数据使用了连续2个PR模块,对岩性、土壤、植被数据仅使用一个PR模块。

2.2 基于通道重排和密集残差的多源特征融合模块

在CNN中,通道指卷积核的输入和输出,其中输出通道包含了所提取的特征。由于沟谷的潜在危险性是多种因素的综合体现,因此特征融合部分主要考虑如何充分利用已提取出的底层特征,挖掘各类特征之间的关联。在进行特征融合操作之前,使用ShuffleNet中的通道重排,将各类数据的底特征重新拼接,可以加强各类信息的流动,使得在后续的融合模块中能让模型更好地学习到各类特征间的关系。具体的实现上,将5类提取出的基本特征各自均等地划分为5份,之后从各类特征中分别取出1份,将它们拼接起来,这样就得到了5份有着各类底层特征的拼接后数据。通道重排的示意图见图4上半部分。
图4 通道重排与特征融合模块

Fig. 4 Channel shuffle and data fusing block

通道重排之后,为了尽可能地融合这些底层特征,借鉴密集残差连接,反复使用残差连接构建了FB,具体结构见图4下半部分。与底层特征提取不同,进入FB的数据为底层特征的组合,因此每一步特征提取操作都要考虑到前一层特征间的关联。密集残差连接可以充分利用所有层的信息,将每一层的特征不断累积到后面的层中,融合浅层特征与深层特征,用于沟谷潜在危险性的综合评价。设输入融合模块的数据为 d i P s表示大小为 s × s的最大池化, d i为上一层的输出,则下一层密集残差的输出 d i + 1为:
d i + 1 = F i + 1 d i + P 2 d i
第三层密集残差的输出 d i + 2为:
d i + 2 = F i + 2 d i + 1 + P 2 ( d i + 1 ) + P 4 o i
式(4)密集残差的输出 d i + 2包含了各部分的融合特征,适宜用于沟谷潜在危险性的综合评价。

2.3 基于交叉熵与改进焦点损失的联合损失函数

RSDNet的设计目的在于对不同形态的沟谷作合理的潜在危险性评价。因此在使用沟谷分类任务训练网络时,不仅要求模型能区分各类沟谷间的形态上的差异,也要求模型能够区分正负样本间的特征差异。神经网络的参数是通过反向传播进行优化的,而损失函数对优化的方向和过程起着控制作用。
对于沟谷的形态特征区分问题,使用了较为稳定的交叉熵(Cross Entropy, CE)。本文中沟谷共分为6类,设 p表示RSDNet输出的结果, p i ( i = 0 , , 5 )表示输入沟谷与第 i类沟谷的特征相似度。当沟谷属于第 i类时 y i = 1,否则 y i = 0。于是沟谷多分类交叉熵损失可表示为:
C E ( p ) = - i = 0 5 y i l o g p i
对于正负样本特征间的区分,参照FL的设计思路:用权重因子来强化较少或较难样本的损失,迫使网络更加关注这类样本特征。本文提出一种强化沟谷正负样本特征差异的损失函数Enhance Loss,该函数的形式为:
E L (p) = - α l o g i = 0 2 p i l { 0,1 , 2 } - α l o g i = 3 5 p i l { 3,4 , 5 }
式中: α为惩罚系数,为可调节的超参数,该值越大表示越重视正负样本间的差异。通过实验发现 α = 2时模型效果最好。 l { 0,1 , 2,3 , 4,5 }为沟谷的真实类别。假设样本为易发灾害的沟谷,那么其 l { 0,1 , 2 }。若此时模型输出沟谷与正样本0,1,2类特征相似度较高,可知 i = 0 2 p i 1,即 l o g i = 0 2 p i 0,则几乎不会有损失;若此时模型输出该沟谷与负样本3,4,5类的相似度较高,可知 i = 0 2 p i 0 - α l o g i = 0 2 p i + ,即EL会对这种判定施加较大的惩罚。
综上,为综合各形态沟谷间的特征差异和正负样本间的特征差异,本研究最终选定的损失函数为:
L o s s = C E p + E L p

2.4 潜在危险性计算

根据模型输出的待测沟谷与各类别沟谷的特征相似度,可以计算该条沟谷的潜在危险性。设模型的输出为 { x 0 , x 1 , x 2 , x 3 , x 4 , x 5 },先通过softmax将输出转化为概率分布,用 s i表示,再计算沟谷与正样本的特征相似概率总和 S
s i = e x i k = 0 5 e x k
S = i = 0 2 s i
由于0、1、2三类为发生过泥石流的沟谷,因此若待测沟谷与这三类沟谷的特征相似度越高,则通过式(9)计算得到的与0、1、2三类沟谷的特征总相似度 S就越大,即该沟谷的潜在危险性更高。由于 s i是归一化的结果,因此显然有 S [ 0,1 ]。最后,根据 S所属的范围,给出沟谷危险性等级。本文将沟谷潜在危险性划分为5个等级:极高、高、中、低和极低。具体评价方式为:
0.8 S 1 0.6 S < 0.8 0.4 S < 0.6 0.2 S < 0.4 0 S < 0.2

3 研究区域与数据来源

3.1 研究区域

怒江傈僳族自治州(25°33′N—28°23′N, 98°09′E—99°39′E,简称怒江州)位于中国西南边境,是一个典型的泥石流高发区。该地有独龙江、怒江、澜沧江由北至南贯穿而过,形成了三山夹两江的高山峡谷地貌。研究区域面积约14 585 km2。研究区及历史泥石流灾害点见图5
图5 研究区域以及历史泥石流灾害点

Fig. 5 Study area and historical debris flow disaster

怒江州是一个典型的山区,98%以上的地形为高山峡谷,坡度大于25°的地形占到总面积的76.6%,山体最大高差约4.4 km。气候上,境内干湿季分明。干季降水稀少,加速岩体土壤风化,成为了泥石流的潜在物源条件;雨季降雨集中,多为暴雨或连续性强降雨,且呈局部单点性强降水,是绝大多数泥石流的触发因素[24]
此外,怒江州位处班公湖-怒江缝合带,新构造运动活跃。其中怒江流域南北向深大断裂发育,海拔5000 m以上的区域常年有冰雪覆盖,冻融等物理风化作用强烈,且该区域为境内地壳抬升最强烈区域[25],因此极易发生滑坡,泥石流等地质灾害。澜沧江流域位于滇西北横断山脉纵谷区和滇西高山峡谷地貌区。流域内岩体破碎,多为软弱岩体,外动力地质作用强烈。再加之公路、铁路等基础设施的建设和矿产、水利等资源的开发,在雨季极易诱发地质灾害。怒江州是泥石流的重灾区,有多次重大泥石流发生,尽管近些年来随着政府和居民防治能力与意识的提升,伤亡人数有所减少,但仍难以免除巨大的经济损失。仅2020年,泥石流就造成了约12 000万元的直接经济 损失。

3.2 数据提取与分类

在山区发生的泥石流可分为坡面型泥石流与沟谷型泥石流。相较于坡面泥石流,山区发生的泥石流多为沟谷型泥石流,且危害更大[26]。因此,本文以每一条沟谷作为危险性评价的对象。为了全面地评价沟谷的潜在危险性,本文选取了数字高程数据(DEM)、遥感数据、岩性、土壤及植被数据这五类与泥石流的形成密切相关的数据作为数据源。其中DEM数据来自美国地质勘查局(USGS)在2008年发布的SRTM,空间分辨率为30 m;遥感数据来自高分一号卫星(GF-1),拍摄时间为2021年。该数据共有4个波段,空间分辨率为16 m;岩性、土壤及植被数据来源于国际土壤参比与信息中心(ISRIC)在2008年发布的SOTER (Soil an Terrain)数据集,分辨率为90 m。各类数据的具体信息如图6所示。
图6 用于沟谷提取的数据源

Fig. 6 Data source for valley extraction

对于泥石流的形成而言,有3个基本条件:一定的地形地貌条件、充足的松散物源以及大量的降水。其中,地形地貌条件与物源条件是发生泥石流的决定性条件[27]。因为凡是具备地形地貌与物源条件的沟谷,都有发生泥石流的风险;反之,若是不具备这2个条件,降雨强度再大都很难形成泥石流。本文重点关注沟谷本身所具备的潜在孕灾危险性,故使用了能反映地形地貌特征的DEM和遥感数据以及与物源相关的岩性、土壤和植被数据。
各沟谷的各类数据提取流程见图7。提取方法可概括为使用沟谷的DEM图像掩膜提取其它各类数据。每个沟谷的DEM数据提取方式如下:首先对原DEM图进行填洼和流向计算,之后使用Strahler河网分级法[28]得到各个沟谷的分水岭,最后按分水岭提取出各沟谷的DEM。这些数据将用于后续其它各类数据的掩膜提取。在提取遥感数据的过程中,先使用DEM对原始遥感数据进行正射校正以修正遥感图像在拍摄过程中存在的扭曲和失真,以保证所提取数据的完整性。每条沟谷所提取出数据的均包含1图层的DEM、4图层的遥感数据、1图层的岩性数据、1图层的土壤数据和1图层的植被数据。
图7 实验数据提取流程

Fig. 7 Flow chart of data extraction

依照上述方法,共提取出怒江州境内沟谷672条,下面详细论述对所提取数据的分类方式和依据。所有沟谷中,167条用于模型的训练和测试,剩余505条未知沟谷用于潜在危险性评估。用于训练测试的167条沟谷又分为正负样本。82条正样本为发生过泥石流的沟谷,85条负样本为未发生过泥石流的沟谷。正样本的获取方式如下:通过检索《云南减灾年鉴(2010—2018)》、查阅论文以及搜索相关新闻报道,共检索到有位置记录的泥石流132条,其中可精确定位的有82条,于是将这82条沟谷作为正样本。对于负样本,由于不存在相关记录,于是人工选择了附近有村庄农田,且主沟几乎无冲刷痕迹,植被覆盖较为完好的沟谷,共计85条作为负样本。这种负样本的选择方式基于以下两点考虑:① 对于没有人类活动痕迹的沟谷,其是否发生过泥石流是未知的,极有可能发生过泥石流,而未被观测到;② 若沟谷附近有人类活动,而又不存在泥石流灾害记录,那么有较大把握可以判定该条沟谷未发生过泥石流。
为了更好地区分各种易发泥石流的沟谷,本研究又按照高程差、主沟长度和流域面积将正负样本各分为3类。一方面,许多研究均指出流域面积大小与高程差和沟谷危险性的强相关 性[3-4,25]。姚振国等通过对泥石流易发沟道按不同流域面积所得的沟谷条数,与其面积进行双对数的相关分析,发现两者具有良好相关性[29],这说明流域面积对泥石流的形成起主要控制作用。另一方面,尽管流域面积较大的沟谷(>10 km2)造成的灾害后果一般更严重,但仍存在“小沟大灾”现象。胡凯衡等[30]发现,流域面积<5 km2且主沟长度仅在1 km左右的沟谷,仍然会暴发规模比较大的泥石流。综上,为了更合理地区分形态各异的沟谷在潜在危险性方面存在的特征差异,同时避免在分类时可能存在的主观性,研究中使用K-means聚类方法,以高程差、主沟长度和流域面积为指标,分别将正负样本各分为了3类。
聚类后共得到6类数据,其中0、1、2类为正样本,3、4、5类为负样本。由于发生过泥石流灾害的沟谷面积分布不均,因此这6类样本存在着严重的数据不平衡现象,不利于神经网络的训练。为解决数据不平衡问题,同时考虑到沟谷的几何形态包含着孕灾的关键信息,故在实验中采用了旋转、翻转等不破坏数据几何形态的方式进行数据增强。
分类结果及详细参数见表1表1中0—5类的类别编号对应着图4中0—5类的分类结果。数据的分类及增强过程见图8
表1 研究区已知沟谷K-means分类结果

Tab. 1 Classification results of known valleys by K-means

所属类别 类别编号 条数/条 高程差/km 主沟长度/km 流域面积/km2
正样本 0 51 (1.1, 2.9) (2.3, 15.4) (1.0, 24.0)
1 22 (1.5, 3.2) (9.8, 18.8) (26.0, 64.0)
2 9 (2.5, 3.1) (18.0, 27.0) (69.0, 95.1)
负样本 3 42 (0.3, 2.4) (2.3, 7.1) (1.0, 7.4)
4 29 (0.7, 2.9) (4.9, 15.6) (7.5, 19.2)
5 14 (1.3, 3.2) (9.1, 16.9) (21.7, 46.0)
图8 数据获取、分类及增强流程

Fig. 8 Flow chart of data collection, classification, and enhancement

4 实验结果与讨论

4.1 模型性能及对比试验

实验使用Pytorch 开源框架,采用批量训练的方法将训练集与测试集分为多个批次(batch)进行,批次大小设定为4,遍历一次训练集中的所有数据作为一次迭代(epoch),最大迭代次数设置为150以保证模型的训练能够收敛。学习率设置为0.5×10-4。优化方法为随机梯度下降(Stochastic gradient descent)。模型的初始化方法为凯明初始化[31]
下面先给出RSDNet与其它各个经典模型在沟谷6分类任务上的性能指标,包括总体精度(OA)、平均精度(AA)、精准率(Precision, P)、召回率(Recall rate, R)以及kappa系数。各项性能指标均为10折交叉实验得到的平均结果。
表2中的结果表明,所设计的RSDNet有较强的沟谷特征识别能力。高达89.7%的精准率说明模型既能精确提取潜在危险性较高的沟谷特征,又能区分各类沟谷的特征而不做误判。80.6%的召回率说明模型能捕获到大部分易发泥石流的沟谷特征。对沟谷泥石流潜在孕灾危险性评价而言,高召回率意味着模型对易发泥石流沟谷的特征敏感度高,适宜用于大面积的排查工作。
表2 各模型性能指标

Tab. 2 Experiment result of different model

网络名称 OA/% AA/% P/% R/% kappa
RSDNet 84.7 83.6 89.7 80.6 0.82
ResNet18[23] 74.7 74.6 76.8 74.8 0.71
ResNet34[23] 72.7 72.9 72.8 77.1 0.67
ShuffleNet[20] 72.9 73.0 73.3 74.5 0.68
DenseNet[21] 76.2 77.1 75.7 76.6 0.72
ResNext[32] 75.0 74.2 76.4 77.2 0.70
MobileNet[33] 70.3 74.4 75.1 69.5 0.69
EfficientNet[34] 70.7 70.2 77.4 71.5 0.66
InceptionV1[35] 73.3 73.5 72.9 75.0 0.68
通过表2可以发现,有着更多残差结构以及有着更深网络层数的其它模型,其特征识别能力均弱于RSDNet。这一方面可能是因为RSDNet先用不同的通道提取了各类数据的底层特征后再融合,因而能把握到更多的底层特征,另一方面可能是由于样本量较少,同时更深更复杂的模型需要更多的数据来拟合参数,因此最终的结果较差。

4.2 潜在危险性评价与分析

用训练后的模型对怒江州的所有672条沟谷进行潜在危险性评价。评价结果为:极高危险153条,高危险65条,中等危险87条,低危险189条,极低危险178条。根据以上结果,绘制了研究区沟谷泥石流潜在危险性评价图。评价结果与历史泥石流灾害记录有较高一致性。132条历史泥石流沟谷中,有122条位于极高危险或高危险区。危险性评价图见图9
图9 怒江州沟谷潜在泥石流孕灾危险性评价

Fig. 9 Potential hazard map of Nujiang Prefecture

从沟谷条数来看,极高危险性的沟谷条数占总沟谷条数的22.8%,而从所占面积来看,该类沟谷占比为56.5%。从图9中可以发现,怒江州的极高危险性沟谷以面积较大的沟谷为主,这类沟谷集中分布于怒江的两岸。怒江流域地处中国自然地势第一阶梯与第二阶梯的过渡带,地质活动频繁。且流域内沟谷高差大,岩体破碎,一直以来均为沟谷泥石流的高发区。
为进一步分析各类常见地质因子与怒江州沟谷潜在危险性的关系,选取了主沟长度、流域面积、高差、纵比降、形状系数与Melton指数6个因子,绘制箱线图,具体结果见图10。从主沟长度,面积以及高差这3个最直观的地形因子来看,潜在危险性等级与这3个因子有较强的正相关性。随着这3个的平均值升高,沟谷的潜在危险性呈上升趋势。但是,在主沟长度和高差图中,均出现了较多离群值;在流域面积中,危险性各异的沟谷面积最小值几乎一致,这说明研究区内存在小沟大灾的现象。从纵比降的箱线图图中,可以发现若纵比降过高,则难以形成泥石流。这是因为纵比降过高,水流就难以在沟谷中汇聚,而是直接排出。根据实验结果,纵比降在175‰左右的沟谷具有更高的潜在危险性,与我国有利于泥石流形成泥石流的沟床比降在100‰~200‰的一般结论相符[36]。形状系数为流域面积与流域长度的平方之比,该值越低则表明流域越狭长。根据箱线图,怒江州内潜在危险性较高的沟谷形状大多为较为狭长。Melton指数为流域高差与流域面积的平方根之比,该值越大,表示泥沙运输主要以泥石流为主。研究区内高危险区平均Melton为0.8,易发生泥石流。
图10 不同危险性等级的沟谷与各类常见地质因子的关系

Fig. 10 Relationship between different valleys and common geological factors

4.3 案例分析与网络特征可视化

为更好地说明RSDNet对沟谷孕灾特征的提取能力,该小节以发生了8·18特大泥石流的东月各沟谷为例,结合神经网络中层特征可视化,对该沟谷的危险性进行分析。该次泥石流共造成39人遇难,53人失踪,造成短时堵河,直接经济损失1.4亿元。图11给出了该沟谷的图像。
图11 东月各沟谷图像

Fig. 11 Image of Dong yuege valley

东月各河沟位于普拉底乡,沟口坐标为98°43'57″E, 27°38'14″N。该条沟谷主沟长度约14.7 km,流域面积约45 km2,而平均宽度仅3.3 km。相对高差最高达到2854 m,坡度在25°~50°的面积占到整沟面积的80%,且大多位于沟道上半部,沟床平均比降为212.12‰。整条沟谷呈狭长树叶形,上游呈扇形,两侧沟谷剖面为典型的V型沟谷。这些均利于水流的汇聚和洪峰的形成。
图12给出了网络中层捕获到的该沟特征。其中(1)和(2)捕获到了控制汇流方向的坡向特征,图12(c)中红色部分主要对应北向坡向,图12(d)中红色部分主要对应南向坡向。图12(c)图12(d)有明显的互补关系,共同对应了通过DEM生成的坡向图(图12(a))。图12(f)图12(g)分别为水流动力指数(Stream Power Index, SPI)[37]和地形湿度指数(Topographic Wetness Index, TWI)[38],这2个指数的计算方式分别为:
S P I = I n A × t a n S
T W I = I n A t a n S
式中: A表示上游流域面积; S表示坡度。SPI可用于衡量流水侵蚀力;TWI反映了局部地形对径流流向的累积影响。由于这2个指标计算方式相近,因此计算生成的图像仅在数值上有较大区别,在图形上区别不大。但在神经网络的特征图图12(h)中,RSDNet依然能捕获到类似的特征。
图12 地质因子与网络中层特征

Fig. 12 Geological factors and feature maps

图12(b)为平面曲率,指垂直于最大斜率方向的曲率。该特征会影响水流的汇聚和分散。可以看到,曲率较高的部分也能被神经网络所提取,如图12(e)中所示。进一步地,由于曲率是通过坡度计算得到的,因此可以推断,RSDNet应当是先捕捉到了DEM中的坡度特征,再进一步获取到了曲率特征。
通过对沟谷的几何形态与神经网络所提取到的特征进行对比分析可以发现,在CNN的工作过程中,网络捕获到的不仅仅是形状,面积等直观的简单特征,还有许多连续的深层特征。这些特征一般要通过简单特征经过一定的计算得到。这些深层特征对于泥石流的形成和发育往往起着控制作用。
另一个由神经网络提取到的有趣特征为水流的演进过程,见图13图13水流演进(1)到(9)可以看作是水流从沟谷的源头不断汇聚并流出沟谷的过程。这一过程也可视为模型对不同阶段沟谷泥石流演进过程的特征提取,即:在沟源的形成区不断汇聚水流,水流沿主沟向沟口流出。水流沿流通区冲下,携带碎石泥沙等物源形成泥流,最后在沟口排出,形成了堆积区(堆积扇)。图13的网络可视化结果很好的拟合了这一过程。
图13 RSDNet捕获到的水流演进过程

Fig. 13 Evolution of water flow captured by RSDNet

从物源条件来看,一方面,在图11中可以看到,东月各源头有冰川分布。在高海拔常年被冰雪覆盖的地区,寒冬风化作用对冰碛物的形成十分有利,这一特征被神经网络所捕获到。另一方面,该沟中上游的主要岩石为石英岩、花岗岩、大理岩,受该地干湿分明的气候影响,岩体破碎风化严重,为泥石流的形成提供了物源条件。这些信息能在遥感影像和土壤岩性数据中表现出来。
结合上述分析,可以发现东月各沟谷具有极佳的形成泥石流的潜在条件,包括利于水流汇集和加速的几何形态以及丰富的物源。结合历史记录,2010年8月,普拉底乡平均气温为28.6 ℃,超过了历史均值27.7 ℃,这导致了部分冰川融水和上游冰碛物的失稳。此外,在17日21时的强降雨达到 11 mm/h,远高于历史均值。高强度的降水突破了土壤的抗剪切强度极限。冰川融水,大气降水携带着冰碛物和沟道中的沙石,在有利的地形条件下形成了强大的泥流,造成了巨大的灾害。RSDNet对该沟谷的评价结果如表3所示。最终沟谷危险性评分为0.993,潜在危险极高。
表3 RSDNet对东月各沟谷的潜在危险性评价结果

Tab. 3 Potential hazard assessment result of Dong yuege valley by RSDNet

类别 0 1 2 3 4 5 S
相似度( x i) 0.001 0.489 0.503 0.0 0.0 0.07 0.993

4.4 损失函数的进一步讨论

实验中所使用的EL需要设置超参数 α,该参数的大小表示对正负样本特征差异的关注程度。通过取不同的 α值进行实验,发现当 α = 2时模型性能最优,具体实验结果如图14所示。
图14 不同 α值得对比实验

Fig. 14 Comparative test of different α

可以看出,当不使用EL或 α值较小时,模型对正负样本间的差异认识较弱,因此准确率较低。随着 α升至2,模型既能很好地区分形态各异的沟谷特征差异,又能充分挖掘正负样本间的特征差异。而当进一步加大 α,会使得模型趋向于将沟谷分类问题视为二分类问题,尽管二分类准确率尚可,但会忽视不同形态沟谷的特征差异,因此不再适合于本实验。

5 结论

本文构建了一种基于多源数据融合的CNN模型RSDNet用于沟谷泥石流的潜在危险性评价。在模型构建中使用了最大池化改进的残差连接、密集残差连接、通道重排等多个结构以更好地提取融合各类数据中的特征。此外,新设计了损失函数EL用于强化易发泥石流的沟谷特征。使用RSDNet对怒江州全境的沟谷进行潜在危险性评价,得出以下结论:
(1)使用CNN模型对沟谷泥石流潜在孕灾危险性进行评价是可行且有效的。该方法能减少进行危险性评价时因子选择上的主观性,填补了研究方法上的空白。
(2)使用CNN模型进行多源数据融合时,先提取各类数据的底层特征再进行融合得到的效果优于将所有数据一同输入。最大池化改进残差结构能加强模型的特征识别能力;联合使用通道重排和密集残差连接有利于各类数据特征的融合。
(3)中层特征可视化结果表明, RSDNet能捕获到坡向、曲率、物源等沟谷致灾关键特征,甚至包括水流演进过程。模型精准率可达89.7%,可信度高。
(4)使用RSDNet对怒江州全境沟谷进行潜在孕灾危险性评价,发现主沟长度,面积以及高差与沟谷泥石流的潜在危险性存在较强正相关性;危险性极高的沟谷其纵比降集中于100‰~300‰,平均形状系数在0.18左右,沟体形态狭长。上述结果说明几何形态对沟谷泥石流发育起着较强的控制作用。
尽管验证了CNN模型在多源数据融合方面的能力及对沟谷泥石流潜在危险性评价可行性,但模型在构建时未考虑降雨这一激发因子,在一定程度上制约了模型的泛用性,在后续的工作中应考虑如何将这一因子合理地加入到CNN模型中,以取得更好的评价效果。
[1]
刘传正. 中国崩塌滑坡泥石流灾害成因类型[J]. 地质论评, 2014, 60(4):858-868.

[Liu C Z. Genetic types of landslide and debris flow disasters in China[J]. Geological Review, 2014, 60(4):858-868.] DOI:10.16509/j.georeview.2014.04.017

DOI

[2]
程维明, 夏遥, 曹玉尧, 等. 区域泥石流孕灾环境危险性评价——以北京军都山区为例[J]. 地理研究, 2013, 32(4):595-606.

[Cheng W M, Xia Y, Cao Y Y, et al. Regional hazard assessment of disaster environment for debris flows: Taking Jundu Mountain, Beijing as an example[J]. Geographical Research, 2013, 32(4):595-606.]

[3]
魏斌斌, 赵其华, 韩刚, 等. 基于灰色关联法的地震灾区泥石流危险性评价——以北川县泥石流为例[J]. 工程地质学报, 2013, 21(4):525-533.

[Wei B B, Zhao Q H, Han G, et al. Grey correlation method based hazard assessment of debris flow in quake-hit area—Taking debris flows in Beichuan as an example[J]. Journal of Engineering Geology, 2013, 21(4):525-533.]

[4]
任光明, 张涛. 基于层次分析法与可拓法的新疆某泥石流危险性评价[J]. 水电能源科学, 2013, 31(9):144-147.

[Ren G M, Zhang T. Risk assessment of debris flow in Xinjiang based on AHP and extension method[J]. Water Resources and Power, 2013, 31(9):144-147.]

[5]
杨涛, 唐川, 朱金勇, 等. 四川省汶川县绵虒镇小流域泥石流危险性评价[J]. 长江科学院院报, 2018, 35(10):82-87.

[Yang T, Tang C, Zhu J Y, et al. Hazard assessment of debris flow in small watershed of miansi town, Wenchuan, Sichuan Province[J]. Journal of Yangtze River Scientific Research Institute, 2018, 35(10):82-87.] DOI:10.11988/ckyyb.20170411

DOI

[6]
王毅, 唐川, 李为乐, 等. 基于GIS的模糊数学模型在泥石流敏感性评价中的应用[J]. 自然灾害学报, 2017, 26(1):19-26.

[Wang Y, Tang C, Li W L, et al. Application of GIS-based fuzzy mathematics model to sensitivity evaluation of debris flow[J]. Journal of Natural Disasters, 2017, 26(1):19-26.] DOI:10.13577/j.jnd.2017.0103

DOI

[7]
张浩韦, 刘福臻, 王军朝, 等. 基于FLO-2D数值模拟的工布江达县城泥石流灾害危险性评价[J]. 地质力学学报, 2022, 28(2):306-318.

[Zhang H W, Liu F Z, Wang J C, et al. Hazard assessment of debris flows in Kongpo Gyamda, Tibet based on FLO-2D numerical simulation[J]. Journal of Geomechanics, 2022, 28(2):306-318.]

[8]
乔渊, 刘铁骥, 陈亮, 等. 基于Massflow模型的甘肃省岷县二马沟泥石流危险性评价[J]. 水利水电技术, 2020, 51(4):184-192.

[Qiao Y, Liu T J, Chen L, et al. Massflow Model-based hazard assessment on Erma Gully Debris Flow in Minxian County of Gansu Province[J]. Water Resources and Hydropower Engineering, 2020, 51(4):184-192.] DOI:10.13928/j.cnki.wrahe.2020.04.022

DOI

[9]
Kim M, Lee S, Kwon T H, et al. Sensitivity analysis of influencing parameters on slit-type barrier performance against debris flow using 3D-based numerical approach[J]. International Journal of Sediment Research, 2021, 36(1):50-62. DOI:10.1016/j.ijsrc.2020.04.005

DOI

[10]
Choi S K, Kwon T H. A case study on the closed-type barrier effect on debris flows at Mt. woomyeon, Korea in 2011 via a numerical approach[J]. Energies, 2021, 14(23):7890. DOI:10.3390/en14237890

DOI

[11]
Hsu Y C, Liu K F. Combining TRIGRS and DEBRIS-2D models for the simulation of a rainfall infiltration induced shallow landslide and subsequent debris flow[J]. Water, 2019, 11(5):890. DOI:10.3390/w11050890

DOI

[12]
陈刚, 何政伟, 杨斌, 等. 遗传BP神经网络在泥石流危险性评价中的应用[J]. 计算机工程与应用, 2010, 46(3):228-231.

[Chen G, He Z W, Yang B, et al. Application of genetic BP Neural Network on risk assessment of debris flow[J]. Computer Engineering and Applications, 2010, 46(3):228-231.] DOI:10.3778/j.issn.1002-8331.2010.03.070

DOI

[13]
李秀珍, 孔纪名, 李朝凤. 多分类支持向量机在泥石流危险性区划中的应用[J]. 水土保持通报, 2010, 30(5):128-133,157.

[Li X Z, Kong J M, Li C F. Application of multi-classification support vector machine in regionalization of debris flow hazards[J]. Bulletin of Soil and Water Conservation, 2010, 30(5):128-133,157.] DOI:10.13961/j.cnki.stbctb.2010.05.010

DOI

[14]
刘永垚, 第宝锋, 詹宇, 等. 基于随机森林模型的泥石流易发性评价——以汶川地震重灾区为例[J]. 山地学报, 2018, 36(5):765-773.

[Liu Y Y, Di B F, Zhan Y, et al. Debris flows susceptibility assessment in Wenchuan earthquake areas based on random forest algorithm model[J]. Mountain Research, 2018, 36(5):765-773.] DOI:10.16089/j.cnki.1008-2786.000372

DOI

[15]
刘佳, 伍宇明, 高星, 等. 基于GEE和U-net模型的同震滑坡识别方法[J]. 地球信息科学学报, 2022, 24(7):1275-1285.

DOI

[Liu J, Wu Y M, Gao X, et al. Image recognition of co-seismic landslide based on GEE and U-net neural network[J]. Journal of Geo-Information Science, 2022, 24(7):1275-1285.]

[16]
武雪玲, 杨经宇, 牛瑞卿. 一种结合SMOTE和卷积神经网络的滑坡易发性评价方法[J]. 武汉大学学报·信息科学版, 2020, 45(8):1223-1232.

[Wu X L, Yang J Y, Niu R Q. A landslide susceptibility assessment method using SMOTE and convolutional neural network[J]. Geomatics and Information Science of Wuhan University, 2020, 45(8):1223-1232.] DOI:10.13203/j.whugis20200127

DOI

[17]
Hakim W L, Rezaie F, Nur A S, et al. Convolutional neural network (CNN) with metaheuristic optimization algorithms for landslide susceptibility mapping in Icheon, South Korea[J]. Journal of Environmental Management, 2022, 305:114367. DOI:10.1016/j.jenvman.2021.114367

DOI

[18]
Youssef A M, Pradhan B, Dikshit A, et al. Landslide susceptibility mapping using CNN-1D and 2D deep learning algorithms: Comparison of their performance at Asir Region, KSA[J]. Bulletin of Engineering Geology and the Environment, 2022, 81(4):1-22. DOI:10.1007/s10064-022-02657-4

DOI

[19]
位栋梁, 王延伟, 王自法, 等. 基于卷积神经网络的地震震级快速估算方法[J]. 地震学报, 2022, 44(2):316-326.

[Wei D L, Wang Y W, Wang Z F, et al. A fast estimation method of earthquake magnitude based on convolutional neural networks[J]. Acta Seismologica Sinica, 2022, 44(2):316-326.]

[20]
Zhang X Y, Zhou X Y, Lin M X, et al. ShuffleNet: an extremely efficient convolutional neural network for mobile devices[C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2018: 6848-6856. DOI:10.1109/CVPR.2018.00716

DOI

[21]
Iandola F, Moskewicz M, Karayev S, et al. DenseNet: implementing efficient ConvNet descriptor Pyramids[EB/OL]. 2014: arXiv: 1404. 1869. https://arxiv.org/abs/1404.1869

[22]
Lin T Y, Goyal P, Girshick R, et al. Focal loss for dense object detection[C]// 2017 IEEE International Conference on Computer Vision. 2017: 2999-3007. DOI:10.1109/ICCV.2017.324

DOI

[23]
He K M, Zhang X Y, Ren S Q, et al. Deep residual learning for image recognition[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition. 2016:770-778. DOI:10.1109/CVPR.2016.90

DOI

[24]
樊辉, 何大明. 怒江流域气候特征及其变化趋势[J]. 地理学报, 2012, 67(5):621-630.

DOI

[Fan H, He D M. Regional climate and its change in the nujiang river basin[J]. Acta Geographica Sinica, 2012, 67(5):621-630.] DOI:10.11821/xb201205005

DOI

[25]
李益敏, 谢亚亚, 蒋德明, 等. 怒江州斜坡地质灾害孕灾环境因素敏感性研究[J]. 水土保持研究, 2018, 25(5):300-305.

[Li Y M, Xie Y Y, Jiang D M, et al. Study on sensitivity in disaster-pregnant environmental factors of slope geological hazards in nujiang prefecture[J]. Research of Soil and Water Conservation, 2018, 25(5):300-305.] DOI:10.13869/j.cnki.rswc.2018.05.043

DOI

[26]
阳友奎, 周迎庆, 姜瑞琪. 坡面地质灾害柔性防护的理论与实践[M]. 北京: 科学出版社, 2005.

[Yang Y K. Zhou Y Q, Jiang R Q. Theory and practice of flexible protection against slope geological disasters[M]. Beijing: Science Press, 2005.]

[27]
朱渊, 余斌, 亓星, 等. 地形条件对泥石流发育的影响——以岷江流域上游为例[J]. 吉林大学学报(地球科学版), 2014, 44(1):268-277.

[Zhu Y, Yu B, Qi X, et al. Topographical factors in the formation of gully type debris flows in the upper reaches of Minjiang River[J]. Journal of Jilin University (Earth Science Edition), 2014, 44(1):268-277.] DOI:10.13278/j.cnki.jjuese.201401204

DOI

[28]
Strahler A N. Quantitative analysis of watershed geomorphology[J]. Eos, Transactions American Geophysical Union, 1957, 38(6):913-920. DOI:10.1029/TR038i006p00913

DOI

[29]
姚振国, 刘建周, 牛贝贝, 等. 流域面积对沟道泥石流发育的影响分析[J]. 资源环境与工程, 2019, 33(2):217-219.

[Yao Z G, Liu J Z, Niu B B, et al. Influence of drainage area on development of debris flow in gully[J]. Resources Environment & Engineering, 2019, 33(2):217-219.] DOI:10.16536/j.cnki.issn.1671-1211.2019.02.014

DOI

[30]
胡凯衡, 游勇, 庄建琦, 等. 北川地震重灾区泥石流特征与减灾对策[J]. 地理科学, 2010, 30(4):566-570.

[Hu K H, You Y, Zhuang J Q, et al. Characteristics and countermeasures of debris flows in beichuan's meizoseismal area[J]. Scientia Geographica Sinica, 2010, 30(4):566-570.] DOI:10.13249/j.cnki.sgs.2010.04.012

DOI

[31]
He K M, Zhang X Y, Ren S Q, et al. Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification[C]// 2015 IEEE International Conference on Computer Vision. 2015: 1026-1034. DOI:10.1109/ICCV.2015.123

DOI

[32]
Xie S N, Girshick R, Dollár P, et al. Aggregated residual transformations for deep neural networks[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition. 2017: 5987-5995. DOI:10.1109/CVPR.2017.634

DOI

[33]
Howard A G, Zhu M L, Chen B, et al. MobileNets: efficient convolutional neural networks for mobile vision applications[EB/OL]. 2017: arXiv: 1704.04861. https://arxiv.org/abs/1704.04861

[34]
Tan M, Le Q. Efficientnet: Rethinking model scaling for convolutional neural networks[C]. International Conference on Machine Learning, 2019:6105-6114

[35]
Szegedy C, Liu W, Jia Y Q, et al. Going deeper with convolutions[C]// 2015 IEEE Conference on Computer Vision and Pattern Recognition. 2015: 1-9. DOI:10.1109/CVPR.2015.7298594

DOI

[36]
唐邦兴, 周必凡, 吴积善, 等. 中国泥石流[M]. 北京: 商务印书馆, 2000.

[Tang B X, Zhou B F, Wu J S, et al. Debris Flows in China[M]. Beijing: The Commercial Press, 2000.]

[37]
Moore I D, Grayson R B, Ladson A R. Digital terrain modelling: A review of hydrological, geomorphological, and biological applications[J]. Hydrological Processes, 1991, 5(1):3-30. DOI:10.1002/hyp.3360050103

DOI

[38]
Beven K J, Kirkby M J. A physically based, variable contributing area model of basin hydrology/Un modèle à base physique de zone d'appel variable de l'hydrologie du bassin versant[J]. Hydrological Sciences Bulletin, 1979, 24(1):43-69. DOI:10.1080/02626667909491834

DOI

Outlines

/