引入集水区复杂网络的中国地貌识别研究
戚 梦(1997— ),女,安徽宿州人,硕士生,主要从事数字地形分析研究。E-mail: qimeng008005@163.com |
收稿日期: 2022-09-21
修回日期: 2022-12-14
网络出版日期: 2023-04-27
基金资助
国家自然科学基金项目(41771423)
Geomorphic Recognition of China Considering Complex Network of Catchments
Received date: 2022-09-21
Revised date: 2022-12-14
Online published: 2023-04-27
Supported by
National Natural Science Foundation of China(41771423)
地貌识别已经成为地貌学研究的关键一环,而基于集水区的地貌单元研究成为了地貌识别领域的研究热点。前人的研究衍生出以下新的问题,能否从基于局部集水区地貌的特征对大尺度地貌类型进行识别,对何种地形描述方法适应性更强等。由此本文选取岩溶地貌、黄土地貌、冰缘地貌、风成地貌、流水地貌这五种代表中国主要地貌类型的样区,引入复杂网络理论方法,以复杂网络指标、地形指标为基本数据源,使用LightGBM、XGBoost、RF 3种典型机器学习方法对中国主要地貌类型进行自动识别的研究。实验结论如下:集水区复杂网络结构和地形特征都对地貌具有一定的解释力和识别效果,总体识别精度分别为77.5%和72.5%,在本文选取的地貌类型中,LightGBM、XGBoost、RF 3种机器学习方法对冰缘地貌的识别精度最高,最高可达100%;2种地貌描述方法结合的地貌识别效果相较单一地貌描述方法具有显著提高,总体精度比单一复杂网络指标和单一地形指标,分别提高了5%和10%;同时LightGBM对于复杂网络量化因子和地形指标特征集的结合具有更好的适应性,总体精度可达82.5%。总体而言,本研究工作拓展了基于集水区地貌识别方法的应用区域和应用范畴,为基于集水区的地貌识别研究提供了新的思路。
戚梦 , 陈楠 , 林偲蔚 , 周千千 . 引入集水区复杂网络的中国地貌识别研究[J]. 地球信息科学学报, 2023 , 25(5) : 909 -923 . DOI: 10.12082/dqxxkx.2023.220712
Landform recognition has become a key part of geomorphological research, which has been widely concerned by scholars. The research of geomorphic units based on catchment has become a hotspot in the field of landform recognition. Previous studies have generated a series of new questions, such as whether large-scale landform types can be identified based on local catchment landform features, which landform description methods are more adaptable, and what is the knowledge bottleneck of current landform recognition methods based on the catchment. So, in this paper, we selected sample areas representing five major landform types in China, including karst, loess, periglacial, aeolian, and fluvial. Based on the complex network theory, we took the complex network indicators and the topographic metrics as the basic data sources. Three typical machine learning methods, i.e., LightGBM, XGBoost, and RF, were used to automatically identify the main geomorphic types in China. Results show that both the complex network structure and the terrain features of the catchment have certain explanatory power and recognition effect on landforms, and the overall recognition accuracy is 77.5% and 72.5%, respectively. Among the five geomorphologic types selected, LightGBM, XGBoost, and RF machine learning methods have the highest recognition accuracy (up to 100%) on periglacic geomorphology. Compared to a single geomorphic description data source, the geomorphic recognition effect that combines the two data sources is significantly improved. The overall accuracy using two data sources is 5% and 10% higher than that using the single complex network dataset and the single topographic dataset, respectively. Moreover, LightGBM has better adaptability to the combination of complex network and terrain factor feature sets, and the overall accuracy can reach 82.5%. In general, this study expands the application area and scope of catchment landform recognition methods, and provides a new idea for the research of catchment landform recognition.
Key words: China; landform recognition; watershed; DEM; complex network; terrain feature; machine learning
表1 复杂网络指标含义与相关计算方法Tab. 1 Description of complex network indicators and related calculation methods |
指标名称 | 指标公式 | 公式参数说明 | 地学意义 | 公式编号 |
---|---|---|---|---|
平均度 | 为复杂网络中第i个网络节点的度数;n是集水区复杂网络中的节点总数 | 反映了集水区网络中某一类型节点所占的比重 | (1) | |
平均加权度 | 为复杂网络中第i条网络边的权重;N为集水区复杂网络中的节点总数 | 反映了集水区复杂网络中某一类型节点对应边的权重情况 | (2) | |
网络直径 | 为网络直径;集水区复杂网络中节点i到j的距离 为连接这两个节点间最短路径的边数 | 表达了网络中各节点之间的距离 | (3) | |
网络密度 | 在集水区复杂网络中,用网络中实际拥有的连线书与最多可能存在的连线总数之比表示 网络密度,m是网络中实际拥有的连接数;n是网络节点总数 | 反映了集水区复杂网络中各节点间联络的紧密程度 | (4) | |
平均路径长度 | 对于一个集水区复杂网络,2个特征点之间存在多条集水区特征点连通且存在多种连通方式,则两个特征节点i与j之间的距离 就是两节点之间最短路径经过的其他集水区特征节点的平均数量。 为网络节点总数, 为平均路径长度 | 反映了复杂的集水区网络中节点之间的分离程度 | (5) | |
网络结构熵 | 为第i个节点的重要度;n为网络节点总数; 表示第i节点的度 | 从整体角度衡量了集水区复杂网络系统演化的发展趋势 | (6) | |
分形维数 | 对于任意一个集水区复杂网络,采用边长为r的正方形盒子覆盖,会出现一些盒子是包含图形,其余为空盒子的情况。随着盒子边长的增加,则包含图形的盒子数目逐渐减少。 将边长为r(r=1,2,3,…,M)的正方体覆盖网络,会出现包含图形的盒子和空盒子 。在适当的范围内,对r选取一系列不同的值,以 为横坐标, 为纵坐标,利用最小二乘法对其进行线性回归,对其斜率取负即为集水区复杂网络的分形维数 | 刻画了集水区复杂网络系统的复杂程度,反映了集水区复杂网络系统的相似性 | (7) |
表2 地形指标含义和相关计算方法Tab. 2 Topographic index meaning and related calculation methods |
指标名称 | 指标公式 | 公式参数说明 | 地学含义 | 公式编号 |
---|---|---|---|---|
坡向/° (Aspect) | 为东西方向上的高程变化率; 为南北方向上的高程变化率 | 描述了集水区上坡面的朝向 | (8) | |
坡度/% (slope) | 为东西方向上的高程变化率; 为南北方向上的高程变化率 | 描述了集水区地表单元的陡缓程度 | (9) | |
粗糙度 (SR) | 为集水区地形坡度 | 描述了集水区地势起伏的复杂程度 | (10) | |
坡向变率 (SOA) | 为正地形计算的坡向变率; 为负地形计算的坡向变率 | 描述了地表局部范围内坡向的变化情况 | (11) | |
平面曲率 (Curve) | 为东西方向上的高程变化率; 为南北方向上的高程变化率; 是东西方向上的高程变化率的变化率; 是东西方向的高程变化率在南北方向的变化率; 是南北方向的高程变化率的变化率 | 集水区地形曲面在水平方向的曲率,描述了地面等高线的弯曲程度 | (12) | |
剖面曲率 (SOS) | 描述了坡度的变化 程度 | (13) | ||
地表切割深度/m (SCD) | 为集水区高程的平均值; 为该集水区最小高程值 | 反映了地表被侵蚀切割的情况 | (14) | |
高程变异系数 (ECV) | 为集水区高程标准差; 为该集水区高程的平均值 | 反映了地貌特征的差异性 | (15) |
表3 基于集水区加权复杂网络的LightGBM混淆矩阵Tab. 3 LightGBM confusion matrix based on catchment weighted complex network |
岩溶地貌 | 黄土地貌 | 冰缘地貌 | 风成地貌 | 流水地貌 | 精准度/% | 召回率/% | F1值 | |
---|---|---|---|---|---|---|---|---|
岩溶地貌 | 5 | 1 | 1 | 71 | 83 | 77 | ||
黄土地貌 | 1 | 5 | 1 | 71 | 83 | 77 | ||
冰缘地貌 | 8 | 100 | 80 | 90 | ||||
风成地貌 | 7 | 1 | 88 | 78 | 83 | |||
流水地貌 | 2 | 6 | 75 | 86 | 81 | |||
总体精度/% | 77.5 |
表4 基于地形指标的LightGBM混淆矩阵Tab. 4 LightGBM confusion matrix based on terrain index |
岩溶地貌 | 黄土地貌 | 冰缘地貌 | 风成地貌 | 流水地貌 | 精准度/% | 召回率/% | F1值 | |
---|---|---|---|---|---|---|---|---|
岩溶地貌 | 5 | 1 | 1 | 71 | 83 | 77 | ||
黄土地貌 | 1 | 6 | 86 | 75 | 81 | |||
冰缘地貌 | 7 | 1 | 88 | 88 | 88 | |||
风成地貌 | 5 | 2 | 71 | 83 | 77 | |||
流水地貌 | 1 | 6 | 86 | 75 | 81 | |||
总体精度/% | 72.5 |
表5 基于集水区综合指标的LightGBM混淆矩阵Tab. 5 LightGBM confusion matrix based on catchment comprehensive index |
岩溶地貌 | 黄土地貌 | 冰缘地貌 | 风成地貌 | 流水地貌 | 精准度/% | 召回率/% | F1值 | |
---|---|---|---|---|---|---|---|---|
岩溶地貌 | 5 | 2 | 71 | 83 | 77 | |||
黄土地貌 | 7 | 1 | 1 | 78 | 70 | 74 | ||
冰缘地貌 | 8 | 100 | 89 | 95 | ||||
风成地貌 | 1 | 6 | 1 | 75 | 86 | 81 | ||
流水地貌 | 1 | 7 | 88 | 88 | 88 | |||
总体精度/% | 82.5 |
:特别感谢中国科学院地理科学与资源研究所的程维明研究员,提供了中国陆地地貌10种成因类型空间分布数据集华中地区的部分数据集。
[1] |
|
[2] |
|
[3] |
陈楹, 李安波, 姚蒙蒙, 等. 基于空间结构模式匹配的褶皱地貌类型自动识别[J]. 地球信息科学学报, 2016, 18(11):1500-1512.
[
|
[4] |
张福浩, 朱月月, 赵习枝, 等. 地理因子支持下的滑坡隐患点空间分布特征及识别研究[J]. 武汉大学学报·信息科学版, 2020, 45(8):1233-1244.
[
|
[5] |
曹伟超, 陶和平, 孔博, 等. 青藏高原地貌形态总体特征的GIS识别分析[J]. 水土保持通报, 2011, 31(04):163-167,247.
[
|
[6] |
|
[7] |
曹伟超, 陶和平, 孔博, 等. 利用最佳地形特征空间进行地貌形态自动识别——以西南地区为例[J]. 武汉大学学报·信息科学版, 2011, 36(11):1376-1380.
[
|
[8] |
钟业勋, 魏文展, 李占元. 基本地貌形态数学定义的研究[J]. 测绘科学, 2002, 27(3):16-18,2.
[
|
[9] |
汤国安, 李发源, 熊礼阳. 黄土高原数字地形分析研究进展[J]. 地理与地理信息科学, 2017, 33(4):1-7.
[
|
[10] |
|
[11] |
朱红春, 汤国安, 李永胜. 黄土沟谷特征点簇及其空间结构模型研究[J]. 地理科学, 2015, 35(9):1170-1175.
[
|
[12] |
朱红春, 汤国安, 吴良超, 等. 基于地貌结构与汇水特征的沟谷节点提取与分析——以陕北黄土高原为例[J]. 水科学进展, 2012, 23(1):7-13.
[
|
[13] |
汤国安, 李发源, 杨昕. 黄土高原数字地形分析探索与实践[M]. 北京: 科学出版社, 2015.
[
|
[14] |
|
[15] |
|
[16] |
张红, 何晶, 杨婕, 等. 基于复杂网络的道路网拓扑结构信息度量[J]. 地理与地理信息科学, 2017, 33(2):1-6.
[
|
[17] |
武鹏飞, 宫辉力, 周德民. 基于复杂网络的官厅水库流域土地利用/覆被变化[J]. 地理学报, 2012, 67(1):113-121.
[
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
贺卓文, 陈楠. 复杂网络理论在黄土高原沟谷地貌特征研究中的应用[J]. 地球信息科学学报, 2021, 23(7):1196-1207.
[
|
[26] |
田剑, 汤国安, 赵明伟. 流域地形景观系统的复杂网络描述[J]. 地理与地理信息科学, 2014, 30(4):22-26.
[
|
[27] |
林偲蔚, 陈楠, 刘奇祺, 等. 基于DEM小流域复杂网络的黄土高原地貌自动识别研究[J]. 地球信息科学学报, 2022, 24(4):657-672.
[
|
[28] |
贺中华, 梁虹, 黄法苏, 等. 基于DEM的喀斯特流域地貌类型的识别[J]. 大地测量与地球动力学, 2008, 28(3):46-53.
[
|
[29] |
|
[30] |
|
[31] |
王乐, 周毅, 李阳. 面向子流域单元的典型黄土地貌分类研究[J]. 干旱区研究, 2019, 36(6):1592-1598.
[
|
[32] |
张艳可, 王金亮, 苏怀, 等. 基于CART决策树的双尺度流域单元地貌分类研究——以北回归线(云南段)地区为例[J]. 地理与地理信息科学, 2021, 37(2):84-92.
[
|
[33] |
|
[34] |
|
[35] |
刘双琳, 李发源, 蒋如乔, 等. 黄土地貌类型的坡谱自动识别分析[J]. 地球信息科学学报, 2015, 17(10):1234-1242.
|
[36] |
蒋圣. 基于DEM的黄土高原地形纹理研究[D]. 南京: 南京师范大学, 2020.
[
|
[37] |
曹泽涛, 方子东, 姚瑾, 等. 基于随机森林的黄土地貌分类研究[J]. 地球信息科学学报, 2020, 22(3):452-463.
[
|
[38] |
|
[39] |
|
[40] |
周成虎, 程维明, 钱金凯, 等. 中国陆地1∶100万数字地貌分类体系研究[J]. 地球信息科学学报, 2009, 11(6):707-724.
[
|
[41] |
程维明, 周成虎, 李炳元, 等. 中国地貌区划理论与分区体系研究[J]. 地理学报, 2019, 74(5):839-856.
[
|
[42] |
|
[43] |
汪凯, 陈楠. 顾及空间特征的地形特征点提取方法[J]. 测绘科学, 2021, 46(2):192-202.
[
|
[44] |
谢轶群, 朱红春, 汤国安, 等. 基于DEM的沟谷特征点提取与分析[J]. 地球信息科学学报, 2013, 15(1):61-67.
[
|
[45] |
杨晓平, 王萍, 李晓峰, 等. 地形坡度和高程变异系数在识别墨脱活动断裂带中的应用[J]. 地震地质, 2019, 41(2):419-435.
[
|
[46] |
|
[47] |
|
[48] |
|
[49] |
张捷, 包浩生. 分形理论及其在地貌学中的应用──分形地貌学研究综述及展望[J]. 地理研究, 1994, 13(3):104-112.
[
|
/
〈 | 〉 |