Automatic Extraction of River Source Region Boundary based on Multi-Characteristic Indexes and Hierarchical Cluster Analysis

  • DENG Yawen , 1, 2 ,
  • HOU Peng 3 ,
  • JIANG Weiguo , 1, 2, * ,
  • PENG Kaifeng 1, 2 ,
  • LI Zhuo 1, 2 ,
  • DENG Yue 1, 2
Expand
  • 1. State Key Laboratory of Remote Sensing Science, Faculty of Geographical Science, Beijing Normal University,Beijing 100875, China
  • 2. Beijing Key Laboratory for Remote Sensing of Environment and Digital Cities, Faculty of Geographical Science, Beijing Normal University, Beijing 100875, China
  • 3. Satellite Environment Centre, Ministry of Ecology and Environment, Beijing 100094, China
*JIANG Weiguo, E-mail:

Received date: 2021-06-14

  Request revised date: 2021-08-12

  Online published: 2022-05-25

Supported by

National Natural Science Foundation of China(42071393)

National Key Research and Development Program of China(2016YFC0500206)

National Key Research and Development Program of China(2017YFC0506506)

Copyright

Copyright reserved © 2022

Abstract

The boundary of river source region is a kind of important and fundamental national geographical information. Apart from the available river source region boundary information for major rivers such as the Yangtze river and the Yellow River, many middle and small-sized river basins in China still lack explicit and detailed river source region boundary information at present. Thus, it is necessary to scientifically and reasonably delineate the river source region boundary to support the implementation of water-related ecological protection and compensation policy. In this paper, based on established principles for identifying river source region, we proposed a method for river source region boundary demarcation based on multi-characteristic indexes and hierarchical clustering analysis. The Qinhe River Basin was taken as a case study area. Firstly, we utilized mean change point analysis to determine the optimal quantile threshold (0.15%) of flow accumulation to extract sub-catchments units of Qinhe River Basin. Then, the boundary of its river source region was determined by hierarchical clustering analysis based on the multi-characteristic indexes of sub-catchments. The method was also applied to the Yangtze River and Yellow River basins for verification analysis. The results are as follows: (1) The area of the source area of Qinhe River basin based on multi-characteristic indexes and hierarchical cluster analysis was between that obtained by the slope inflection point and hydrological station method; (2) In the Yangtze river basin and the Yellow River basin, the IoU (Intersection over Union) results of this method reached 85.40% and 79.99%, respectively, which indicates that this method is applicable to the extraction of source regions. To summarize, the automatic extraction method for river source region boundary information we proposed could simply and efficiently identify large, middle, and small river source regions’ boundary, which provides scientific support for the identification of ecological security barriers and the implementation of water resources protection policies in China's river source regions.

Cite this article

DENG Yawen , HOU Peng , JIANG Weiguo , PENG Kaifeng , LI Zhuo , DENG Yue . Automatic Extraction of River Source Region Boundary based on Multi-Characteristic Indexes and Hierarchical Cluster Analysis[J]. Journal of Geo-information Science, 2022 , 24(3) : 469 -482 . DOI: 10.12082/dqxxkx.2022.210334

1 引言

河源区作为一种重要的生态功能区,具有极高的水源涵养服务功能和良好的生态效益,可以为中下游地区提供生态保障[1],在我国流域生态保护中具有重要地位,也是全国生态状况调查精细化评估的重点区域。对河源区的生态保护对整个流域水安全有重要战略意义[2],因此厘清河源区的范围对于江河源头区水生态保护相关政策的规划与实施具有重要意义,同时河源区边界也是研究河源区内生态系统服务的基础地理信息数据。目前除去长江、黄河、澜沧江流域等大江大河流域具有较为公认且明确的河源区范围外,我国众多中小流域及部分大型流域仍缺乏公开确切的河源区范围边界信息,这限制了河源区内生态系统评价及水资源定量分析制图等相关研究以及源头区水生态保护等相关政策的规划,如何实现流域内河源区范围边界信息的自动提取是本文重点关注的研究问题。
通过文献调研发现许多河源区相关研究侧重于社会关注度高的大江大河源头区[3,4,5]与河源区内部气象、水文、植被等要素的时空变化趋势及生态系统评估等方面[6,7,8,9],而关于河源区边界划分方法或划分依据的研究很少,当前国内外学者大多基于先验知识结合地形地貌单元、水文站点、河流特征等信息来划定河源区范围,缺乏统一的定量化标准与规范,存在一定的主观性和不便捷性。例如,文萌等[10]将江河源头至河底比降拐点(即河流底部高程变化剧烈的点)之间河段的集水区域作为初步划定的江河源头区范围;王浩等[11]根据我国DEM数字高程图,参照我国主要山脉分布并叠加我国水资源分区图和水土保持分区图将我国源头区分为八大类;Miller等[12]基于河流自源头至下游的特征差异将其流经区域划分为源区、过渡区和漫滩区;另外有许多研究将水文站点对应的集水区域作为源头区范围,如长江源区以直门达水文站[13,14]、黄河源区以唐乃亥水文站[15,16]
针对目前对河源区范围划分研究中存在着主观性的问题,为更客观、自动化地划定河源区边界,本文耦合多源遥感及地理空间数据,以黄河流域内的沁河三级流域为研究案例开展研究。本文首先基于DEM数据使用均值变点法计算最佳汇流累积量阈值,自动提取出符合实际状况的子流域边界作为河源区划分的基础单元。其次,综合考虑河源区水文、地形地貌特征、生态环境及社会经济等要素并参考相关文献基于河源区划分原则构建了河源区划分多特征指标体系,并基于此提出了一种基于层次聚类分析法的河源区边界自动划分方法,提取出所有子流域中属于河源区的子流域集合作为河源区范围,从而实现流域内的河源区范围自动划分。最后,将存在明确河源区边界的长江流域、黄河流域作为验证区侧面证明该方法的可靠性与适用性。

2 研究方法

2.1 基于多特征指标和层次聚类分析的河源区边界划分流程

本研究基于多特征指标和层次聚类分析进行河源区边界自动划分的总体流程图如图1所示,主要包括3个步骤:① 通过均值变点法确定最佳汇流累积量阈值以提取流域内子流域单元,以此作为层次聚类提取河源区的基本数据样点单元(具体见2.2节);② 在确立河源区划分原则、明确划分依据的基础上构建针对河源区划分的多特征指标作为层次聚类分析的输入变量(具体见2.3节);③ 在步骤①和步骤②得到的子流域基本单元和多特征指标的基础上,运用层次聚类分析对子流域基本单元进行聚类,将不同聚类个数下的得到的河源区划分结果进行耦合,以被划定为河源区的频次为评判指标来耦合聚类结果,最终得到流域的河源区边界范围(具体见2.4.1节)。
图1 河源区范围划分流程

Fig. 1 The flow chart of extracting river source region boundary

2.2 河源区划分基本单元选取

由于河源区划分需要保证分水岭边界的完整性[17],故河源区划分需要建立在子流域提取的基础上,即基于流域内多个子流域提取出属于河源区的子流域单元集合作为河源区范围。其中最佳汇流累积量阈值的确定是子流域自动提取过程的关键环节。目前基于DEM确定最佳汇流累积量阈值的方法主要包括分形法、河网密度法、流域宽度法等[18,19,20],虽然这些方法可以较准确地提取最佳河网阈值,但存在一定的主观性,因此本研究使用统计学上的均值变点分析法[21,22],以快捷求取最佳集水面积阈值实现子流域的自动化提取,使其结果符合实际情况。
研究基于SRTM DEM数据利用ArcGIS中的水文分析工具集实现子流域提取,主要流程包括填洼、流向、汇流累积量计算、河网提取及连接分级等操作[23]。其中河网提取步骤中对于汇流累积量阈值的设置决定了提取得到的子流域的数量与面积,汇流累积量阈值越小,提取出的子流域数量越多、面积越小,反之亦然。而提取子流域的关键在于汇流累积量阈值的选取,本文采用的汇流累积量阈值为栅格的数目,采用均值变点分析法通过河网密度随汇流累积量阈值变化曲线变点确定提取子流域单元的最佳阈值。
均值变点分析法[21,22]是一种对非线性数据进行处理的数理统计方法,该方法对恰有一个变点的检验最为有效。根据河网形态学理论,确定平均河网密度随着汇流累积量阈值变化曲线的变点存在且唯一[21],因此按以下步骤运算得到变点。
(1)令i=2, …, n,对每个i将样本 x i分为两段: x 1, x 2, …, x i - 1 x i, x i + 1, …, x n,分别计算每段样本的算术平均值 x 1 ¯ x 2 ¯,统计量 S i计算公式如下:
S i = t = 1 i - 1 x t - x 1 ¯ 2 - t = i n x t - x 2 ¯ 2
式中: S i为两段样本的离差平方和之差;n为总样本个数。
(2)计算总体样本的算术平均值 X -和离差平方和S,当S S i的差距最大时对应的分段样本即为变点所在。
平均河网密度变化由陡变缓处所在点对应的累积栅格数即为要寻找的最佳汇流累积量阈值,基于变点对应的最佳汇流累积量阈值进行流域内子流域提取。

2.3 河源区划分多特征指标体系构建

2.3.1 多特征指标体系构建原则
明确河源区的概念与区域特征是划定河源区边界的前提,本文基于文献资料收集调查研究我国主要江河源头区的自然地理和社会经济特征,并参考已有文献[10]、[17]、[24-26],将某流域的河源区定义为该流域内河流干流的发源区域,其区域特征一般包括以下:① 地形地貌多为高山、山地、丘陵和中低山,地势起伏相对较大,水流湍急;② 自然资源和生物多样性丰富,植被覆盖度一般较高;③ 人口较为稀少、区域社会经济发展相对滞后;④ 内部生态环境要素异质性较小。
河源区边界划定具有复杂性、模糊性和不确定性的特点,且目前学界关于河源区边界划定还没有统一的指标体系,为了从模糊复杂的关系中较为全面准确地反应河源区的特征,使河源区划分更合理客观,研究在建立河源区划分指标体系时遵循了相应原则(表1)。
表1 河源区划分原则

Tab. 1 Principles for identifying river source region

河源区划分原则 具体说明
保证河源区包含河流源头[24,25] 河流源区的界定首先要弄清楚其源头,源头的判定一般考虑河流支流中流量最大、集水面积最大、河流最长者确定为主流,其源头确定为正源,河源区应该包含河流的源头
地形地貌单元的完整性[17] 这一原则突出了河源区范围的界定要便于生态环境的研究,且地形地貌对水文水系分布特征影响较大
生态环境主成分的趋同性[17] 河源区内部的气候、植被等生态环境要素差异不能过大,在进行河源区划分时必须全面考虑构成其生态环境的各种要素的相似性,保证所划分出的河源区域是一种具有自身特点的综合体
共轭性原则[26,27] 这一原则要求划分出的区域是连续的地域单元,不能有空间上存在于某区域之外,但又属于该区的分区单元
保持分水岭边界的完整性[17] 考虑到河源区与水系分布密切相关,因而首先考虑保持分水岭边界的完整性,故研究中以流域内子流域单元为基本河源区基本划分单元
2.3.2 多特征指标体系构建
在河源区划分多特征指标体系构建原则的指导下,综合考虑河源区的水文特征、气候、地貌、植被等自然环境要素、人类活动强烈程度对生态环境的影响[17,27]以及数据的可得性与可靠性,从水文条件、地形地貌条件、自然条件、生态条件以及社会经济条件5个方面设计河源区边界划定的评价指标体系如表2所示。
表2 河源区划分多特征指标体系

Tab. 2 Multi-characteristic Indexes for river source region boundary extraction

分类 指标名称 指标含义或说明
水文条件 汇流累积量 区域内每点的汇流累积栅格数量
河网密度/(km/km²) 单位面积内的河网长度
地形地貌条件 高程/m 某点到基准面的距离
坡度/° 坡面的垂直高度和水平方向距离的比值
自然条件 年降水量/mm 一年中降水量的总和
年平均气温/℃ 一年气温的平均值
生态条件 植被覆盖面积比重/% 林地、草地和灌木面积占土地总面积比重
NDVI(归一化差值植被指数) 近红外通道与可见光通道反射率之差与之和的商
社会经济条件 人口密度/(人/km²) 人口总量/土地总面积
GDP总产值/万元/km² GDP总产量/土地总面积
由于不同指标要素的数据的单位和量纲不同,其数值变异可能很大,从而会对分类结果产生影响,为消除各指标量纲之间的差异,使指标数据具有可比性,需将原始指标数据进行标准化处理,研究采用最大值最小值标准化法方法进行无量纲化处理,公式如下:
X = x - x min x max - x min
式中: x max x min分别为指标 x i的最大值和最小值,各指标标准化后的数值范围为[0, 1]区间内。

2.4 河源区划分方法

2.4.1 层次聚类分析法
聚类分析是研究“物以类聚”的一种科学有效的方法,本研究中以2.2节中得到的子流域单元为基本聚类单元,使用层次聚类分析将具有河源区特征的子流域单元类别集合作为河源区域。
层次聚类分析法是应用较广泛的一种聚类算法,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树,创建聚类树有自下而上合并和自上而下分裂2种方法。本文采取自下而上合并的方法来创建聚类树。其基本思路为:在聚类的开始,每个样本自成一类,然后选择某种方法度量所有样本之间的相似程度,并把其中最相似的样本先聚成一小类,再度量该小类和剩余样本间的相似程度,并将当前最相似的样本或小类再聚成一类,如此反复,直到所有样本聚成一类为止[27]。研究以基于均值变点法提取得到的子流域单元为样本,运用层次聚类分析方法进行河源区划分,具体步骤如下:
(1)计算相似度:采用欧氏距离法计算各子流域之间的相似性系数,即两样本(i, j)之间的距离是各样本每个变量值之差的平方和的平方根。其计算公式如下:
d ij = 1 m k = 1 m x ik - x jk 2 i , j = 1,2 , , n
式中: d ij代表样本i和样本j之间的相似性系数;m代表变量个数;n代表样本个数; x ik代表样本i的第k个变量的值; x jk则代表样本j的第k个变量值。
(2)聚类方法
聚类方法主要有直接聚类法、最短距离聚类法、ward聚类分析法等,研究拟采用ward聚类分析法进行河源区划分,该方法在实际应用广泛且效果较好。ward法[28,29]又称离差平方和法,即以平方欧式距离度量两类之间的距离,先将集合中每个样本自成一类,在进行类别合并时,计算类重心间的方差,首先合并离差平方和增加幅度最小的两类,再依次将所有类别逐级合并,研究拟采用ward聚类分析法进行河源区划分,其具体算法如下:
首先将N个样本点分为k类,表示为G1, G2, …, Gk,定义第i类的离差平方和为:
S i ( k ) = j = 1 N i x ij - x - i T x ij - x - i
式中: x - i为样本 x ij的均值;Ni为第i类的样本数量。设样本中有Gp,Gq两类,若把Gp,Gq合并为Gk类,则合并后增加的离差平方和为:
D pq 2 = S k - S p + S q
式中: S p S q S k分别为GpGqGk类的离差平方和,增量越小说明合并愈合理。
(3)河源区类别的判定:总结考虑河源区的内涵与区域特征,将高程参数均值最大的子流域聚类类别作为河源区。此外,不同聚类个数下得到的河源区划分结果也不同,为耦合多个聚类结果,将聚类个数设为2~9,以聚类为河源区类别的频率为评判标准,将8次聚类结果中被判断为河源区类别的频率为50%以上的子流域单元组合作为最终确定的河源区。
2.4.2 与其他方法结果对比
研究将基于多特征指标和层次聚类分析法划分的河源区范围与基于河流河底比降拐点方法[10]及基于水文站点截面方法[4,5,6]得到的河源区结果进行对比分析。其中,基于河流河底比降拐点方法是通过选取河底比降有明显变化的河段作为河源区的划分点,将划分点河段以上的集水区域作为河源区范围;基于水文站点截面方法是河流源头附近区域的某个水文站点为截面界点,将该水文站以上的集水区域作为河源区。本研究中的试验区和验证区流域均有可参考文献中的水文站点截面可作为划分依据。

3 实验区概况、数据来源与预处理

3.1 实验区概况

沁河属于黄河一级支流,干流总长485 km,发源于山西省长治市沁源县霍山东麓的二郎神沟(图 2),沁河流域地处我国东部季风区,大陆性季风气候显著,四季分明,雨热同期,是我国的一个三级流域。研究区内的海拔高度范围约为0~2500 m,大部分区间属于山区型峡谷,坡陡流急,水多沙少,河道平均纵坡为3.8‰,水能资源丰富[1]。山区是我国大多数河流的发源地,山区面积约占我国70%,我国降水也相对集中于山区[2],而沁河流域是山区中小型流域(二、三级流域)的一个典型代表,同时考虑到我国众多中小型流域的研究关注度较少,其河源区范围信息缺失情况较多,将沁河作为试验区同时具有流域地貌特征和空间尺度的代表性;此外,沁河流域是本文在文献调研过程中发现的为数不多的具有基于水文站点定义出河源区明确范围的三级流域,因此研究将沁河流域作为应用河源区自动划分方法的试验区以进行具体流程展示与结果对比分析。
由于黄河和长江的河源区范围已被许多学者充分研究并明确,在众多已有研究中认同度较高且一致性好,选择将其作为验证区在评价本文方法的合理可靠性时具有相对较好的说服力,其地理位置如图2(a)、2(b)所示。
图2 沁河流域和长江、黄河流域地理位置

Fig. 2 Geographical location of Qinhe River Basin, the Yangtze River and Yellow River basin

3.2 数据来源与预处理

研究使用的水文条件指标数据利用ArcGIS基于DEM数据进行水文分析计算得到;地形地貌条件指标数据来源于美国地质勘探局(USGS)公开发布的SRTM DEM数据(https://earthexplorer.usgs.gov/),其空间分辨率为90 m;自然条件、生态条件中的NDVI指标和社会经济条件指标数据均为2015年1 km空间分辨率的栅格数据,来源于中国科学院资源环境科学数据中心(http://www.resdc.cn/);生态条件指标中的植被覆盖面积比重指标则是基于2015年生态环境保护部卫星应用中心生产的90 m空间分辨率土地利用数据计算获取。大部分指标数据的空间分辨率为1 km,且本文方法主要针对缺失河源区边界信息的一、二、三级流域进行应用,该分辨率对结果的精度影响较小,故为保持一致性,将各特征指标数据均重采样至1 km空间分辨率,并统一投影至Albers坐标系。

4 结果及分析

4.1 最佳子流域提取分位数阈值分析

为增强该子流域自动提取过程在不同空间尺度流域的适用性与可扩展性,研究选取0.0005,0.001,0.0015,……,0.0095,0.01一系列汇流累积量分位数阈值来探讨不同汇流累积量与河网密度的变化关系,以获取汇流累积量分位数阈值对应的河网密度变化曲线(图3),并使用均值变点分析法确定子流域提取的最佳阈值。由图3的曲线走势可知,随着集水面积阈值的增加,起初河网密度变化较剧烈,随着汇流累积量分位数阈值继续增大河网变化逐渐变缓。给河网密度与汇流累积分位数阈值的关系曲线添加趋势线,发现河网密度随着汇流累积分位数阈值的增大呈幂函数趋势减小,相关性系数为0.9986,拟合度很高,说明其适用于均值变点法寻找变点。
图3 河网密度随汇流累积量分位数阈值变化拟合曲线

Fig. 3 Fitting curve of river network density changing with the quantile threshold of flow accumulation

根据变点分析法,变点的存在会使S S i差距增大,由图4易知第3个序列点即为所要求的变点。进而可反推出汇流累积量分位数阈值为0.0015即为由陡变缓的点,因此得到最佳汇流累积量分位数阈值为0.0015,其对应的汇流累积栅格数为190。将该阈值处提取的河网结果与2017年1:25万国家基础地理信息数据库中实测河网进行对比发现主干河网拟合较好(图5),支流部分基于DEM提取河网的细节信息更丰富,且山区精度高于平原区。此时该分位数阈值下提取沁河流域的子流域单元数量为443个,本文中后续河源区划分的各指标取值以子流域单元为基本单元,通过计算子流域内部对应指标的栅格数据均值获取。
图4 SSi的差值变化曲线

注:S为总体样本的离差平方和, S i为两段样本的离差平方和之差。

Fig. 4 Change curve of the difference of S and Si

图5 基于SRTM DEM提取河网与1:250 000基础地理信息中河网对比

Fig. 5 Comparison between river network extracted based on SRTM DEM and 1:250 000 basic geographic information

4.2 最佳特征指标因子组合

由于所选取的多特征指标因子之间存在相关性,直接选取所有因子可能会造成计算的冗余和复杂,因此可以基于相关性分析选取最佳河源区特征指标因子组合。研究对10个指标因子进行相关性分析,通过计算所有变量两两间的斯皮尔曼相关系数,得到相关系数矩阵以聚类热力图的方式进行可视化如图6所示,可以直观看出自然条件中的年平均气温和年降水量的相关性很强,这是因为沁河流域地大陆性季风气候显著,四季分明,雨热同期,但温度和降水的关系随着区域空间位置的变化存在变异性较大,因此这个2个因子共同保留下来以表征自然环境要素特征。社会经济条件中的人口密度和GDP总产量呈显著正相关关系,这是由于人口聚集程度高的区域经济活动也越发达。为避免计算冗余,本文将植被覆盖率特征去除,选取NDVI作为子流域内生态条件的代表特征指标,其余指标保留。
图6 河源区划分各指标因子相关系数热点图

注:右侧数值表示变量间的斯皮尔曼相关系数。

Fig. 6 Heat map of correlation coefficients of multi-characteristic indexes

4.3 河源区边界划定

4.3.1 层次聚类法划分结果
采用层次聚类分析法对沁河流域河源区范围进行自动提取,图7为河源区划分过程中的层次聚类树构建过程以及多特征指标最大最小值标准化后的热力分布图,在子流域单元自下而上进行聚类合并的过程中,多个特征指标值分布相近的子流域单元会优先聚为一类,此后逐层合并聚为不同类别。
图7 河源区划分层次聚类过程及多特征指标热力图

Fig. 7 Hierarchical clustering process and multi-characteristic indexes thermal map of river source region

实际操作中,分类数一般设置为最终分类数的2倍以上[27],针对河源区划分问题,可以根据河流从上游至下游的特征大致可以分为源区、过渡区和河漫滩平原区,故为探究聚类数量对聚类结果的影响,使聚类个数从2~9递增,分别得到的不同聚类个数下的河源区范围结果如图8所示,可见聚类个数为2、3、4、5、6时的划分的河源区范围保持一致,说明聚类结果具有一定的稳定性。最终将8种聚类结果进行耦合,选取不同聚类数量下被划分为河源区类别的频率大于50%的子流域单元进行组合,将其作为最终划分得到的河源区范围,以减少河源区提取结果的不确定性与误差。
图8 不同聚类个数k下层次聚类分析法划分的河源区范围结果

Fig. 8 The results of river source region boundary extracted by hierarchical clustering analysis under different clustering numbers(k represents for the number of clustering)

4.3.2 与基于河流河底比降拐点及水文站点方法结果对比
沁河主河道的高程及比降变化如图9(a)、图9(b)所示,从上游至下游过程中高程以相对稳定地速率逐渐减小,再变得平缓,随之在拐点处剧烈下降,该拐点与河底比降值最高点吻合,说明该处主河道河底比降变化剧烈,将此河段作为源头区的划分点,划分点至上游间的集水区域作为基于河底比降拐点法划分的江河源头区范围(图9(c)),此时划分的河源区面积占沁河流域总面积的64.07%。
图9 基于河底比降拐点的河源区范围提取

注:样点编号从左至右为源头至下游。

Fig. 9 Extraction of river source region based on inflection point of river bottom slope

基于孔家坡水文站[1]对应的集水区域得到沁河流域河源区范围如图10(b)所示,该水文站点的选取根据已有文献[1]确定,但原始文献中未提及选择该水文站点作为河源区范围划分点的依据。对比3种方法得到河源区范围,发现基于河底比降拐点法得到的河源区面积最大,本文方法划分的河源区面积次之,而基于水文站点得到的河源区面积最小。由于沁河流域内山地面积占比大,且地形地势起伏较为剧烈,而沁河主河道河底比降变化与地形起伏密切相关,故基于河底比降拐点方法得到的河源区范围也占比较大,说明这一方法受流域内地形地貌影响良多。基于水文站点方法划分得到河源区边界范围的重点在于如何选取水文站,当某一流域上游存在几个位置较为相近、或将其作为划分点确定的河源区区域性质差异不显著的水文站点时,选取水文站点具有较大的不确定性与主观性,沁河流域基于水文站点得到的河源区结果在此处具有一定的参照性,但是其合理性支撑依据较薄弱。本文方法则主要基于河源区特征以及区域内部要素趋同性来划分沁河流域河源区范围,在原理和方法上具有一定理论基础,且受人为因素影响较小,应用简捷高效,可以作为缺失河源区边界信息的流域进行河源区划分的方法参考。此外,本文对不同河源区识别方法的优点和局限性及适用场景进行总结归类如表3所示。
图10 3种方法得到的河源区范围对比

Fig. 10 Comparison of the river source region boundary obtained by the three methods

表3 不同河源区识别方法对比分析

Tab. 3 Comparison and analysis of different river source region boundary identification methods

方法 主要原理 优点 局限性 适用场景
基于河底比降拐点 河底高程剧烈变化处为断点 地形地貌特征表征程度强 在某些流域不具有 适用性 河底比降变化明显的山丘区流域
基于水文站点 水文站点对应的集水区域 简单直观 主观性强,不确定性 较大 较为公认的流域河源区,用于河源区河流、流量径流分析
本文方法 基于多特征指标与层次聚类分析 较为客观、简捷高效、自动化识别 未进行更多流域的验证、存在一定不确定性 山丘区、平原区域中未确定河源区范围的流域

4.4 长江、黄河流域河源区划分中的应用

将本文方法应用于黄河和长江流域,该方法提取结果与已有分别以直门达和唐乃亥水文站为划分点确定的长江和黄河源区范围整体较为一致(图11),计算该方法划分结果与长江和黄河已有河源区面积范围的交并比(即二者面积范围交集与并集的比例)分别为85.40%和79.99%,效果较为理想。
图11 黄河、长江流域河源区自动提取验证结果

Fig. 11 Verification results of river source region automatic extraction for the Yellow River and Yangtze River basins

空间分布上,黄河源区边界差异较大的区域分布在源区北部,由于该区域的地形地貌同样以山地为主,且其余特征指标较为相似,故被划分为黄河源区;长江源区范围差异主要分布在源区东南部。此结果说明本文提出的河源区边界自动划分方法在大型流域适用性较好,从侧面间接验证了该方法进行流域内河源区划分的科学合理性。此外,在尝试使用河底比降拐点法确定长江和黄河源区时,由于其主河道过长,且主河道河底高程变化过程中存在多个剧烈变化的拐点,无法较客观确定长江、黄河流域的河源区范围。

5 结论与讨论

5.1 结论

准确的河源区边界范围信息是源头区水生态保护等相关政策规划实施以及源头区水资源定量分析制图等研究的基础与前提。本文以河源区区域特征和划分原则为切入点,探讨了一种基于多特征指标和层次分析聚类的河源区范围自动划分方法,并以沁河三级流域作为试验区进行河源区自动划分方法流程展示。首先,基于DEM数据应用均值变点法确定汇流累积量最佳阈值实现子流域自动提取;其次,参考相关文献并综合考虑河源区自然地理、生态环境和社会经济条件等多要素构建河源区划分多特征指标体系;接着,使用层次聚类分析法基于构建的多特征指标将子流域单元样本进行类别划分,并以DEM值作为判断指标识别出属于河源区的子流域样本类别作为最终提取出的河源区范围;最后,将该方法应用于存在明确河源区边界的长江流域、黄河流域进行方法合理性验证分析。本文研究得出的主要结论有:
(1)子流域自动提取最佳汇流累积量阈值确定。基于DEM数据提取子流域边界的关键参数为汇流累积量阈值,研究需要使提取结果尽量贴近实际情况,同时不需要人为设置阈值参数,因此本文通过均值变点分析法决定汇流累积量最佳分位数阈值为0.0015,其对应的汇流累积栅格数为190。
(2)河源区划分多特征指标体系构建。通过参考已有研究并结合河源区特征,本研究从水文特征、地形地貌、自然环境、生态和社会经济条件角度进行分析,总结出河源区划分的多特征指标体系,并针对这些指标特征筛选出可以描述河源区区域特征的DEM、土地利用、GDP等数据组成指标体系。
(3)河源区范围边界自动划分。本文提出一种基于多特征指标和层次聚类分析法自动划分河源区范围边界的方法,并耦合多次聚类结果提取河源区边界信息,降低了实验过程中的主观性且减少了误差。从划分结果可以看出,河源区分布于高程值大的区域,且内部异质性较小。将验证区该方法的河源区提取结果与已有范围叠加对比可以发现,交并比分别达到85.40%和79.99%,说明本文方法提取的河源区范围较为合理,符合实际情况。
(4)以沁河流域为例,将本文结果与已有方法结果进行对比,证明了本文方法的优越性;本文方法的创新性和优势在于能够较为客观全面地综合多方面自然地理要素与社会经济要素实现流域内河源区范围自动化划分,对比文萌等[10]通过河底比降变化剧烈的拐点来划定河源区范围,该方法客观性和泛用性更强。

5.2 讨论

本文仍存在一些不足与问题,需要进一步进行完善与改进,具体概括为以下4点:
(1)由于数据获取限制和计算复杂度约束等因素,研究中建立的河源区划分多特征指标体系有待进一步完善,例如引入植被覆盖度等相关特征指标。此外,不同特征指标间的组合对河源区划分结果的影响也可以进行一步探究;
(2)我国平原区流域受人类活动干扰较多,且流域内高程变化不明显,本文方法未在在平原区流域进行应用,可考虑对平原区流域应用该方法识别河源区范围,以验证该方法的可行性与普适性,并对该方法在平原区流域以及其他不同类型流域的适用性作进一步探讨;
(3)由于地理空间异质性的存在,本文目前的方法设计在其他地区应用中可能会出现河源区识别结果中出现“空洞”(被识别为非河源区的子流域)现象,因此需要对识别结果进行进一步人工目视检查以确保其合理性。同时对于地理邻近因素如何在河源区范围识别中有效地表达也是今后研究中重点关注的内容。
(4)研究的试验区和验证区的空间尺度差异使得该方法的合理性缺乏一定支撑,但综合考虑方法的实现原理与实验结果,该方法整体上能够较为客观地实现河源区边界自动划分。
[1]
郭新亚, 杜世勋, 宁婷, 等. 沁河源区水源涵养功能辐射效益研究[J]. 水土保持研究, 2018, 25(6):365-369,376.

[ Guo X Y, Du S X, Ning T, et al. Study on radiation benefit of water conservation function in the headstream area of the Qinhe basin[J]. Research of Soil and Water Conservation, 2018, 25(6):365-369,376. ]

[2]
王浩, 王琳. 我国江河源头区水生态保护战略[J]. 中国水利, 2017(17):15-18.

[ Wang H, Wang L. Strategic measures of ecological conservation for river source region in China[J]. China Water Resources, 2017(17):15-18. ] DOI: 10.3969/j.issn.1000-1123.2017.17.013

[3]
Jin J L, Wang G Q, Zhang J Y, et al. Impacts of climate change on hydrology in the Yellow River source region, China[J]. Journal of Water and Climate Change, 2020, 11(3):916-930. DOI: 10.2166/wcc.2018.085

DOI

[4]
Zhang L W, Xia X H, Liu S D, et al. Significant methane ebullition from alpine permafrost rivers on the East Qinghai-Tibet Plateau[J]. Nature Geoscience, 2020, 13(5):349-354. DOI: 10.1038/s41561-020-0571-8

DOI

[5]
Jiang C, Zhang L B. Ecosystem change assessment in the Three-river Headwater Region, China: Patterns, causes, and implications[J]. Ecological Engineering, 2016, 93:24-36. DOI: 10.1016/j.ecoleng.2016.05.011

DOI

[6]
Gao B, Li J E, Wang X S. Impact of frozen soil changes on vegetation phenology in the source region of the Yellow River from 2003 to 2015[J]. Theoretical and Applied Climatology, 2020, 141(3/4):1219-1234. DOI: 10.1007/s00704-020-03266-5

DOI

[7]
Wang R, Dong Z B, Zhou Z C. Different responses of vegetation to frozen ground degradation in the source region of the Yellow River from 1980 to 2018[J]. Chinese Geographical Science, 2020, 30(4):557-571. DOI: 10.1007/s11769-020-1135-y

DOI

[8]
Meng F C, Su F G, Yang D Q, et al. Impacts of recent climate change on the hydrology in the source region of the Yellow River Basin[J]. Journal of Hydrology: Regional Studies, 2016, 6:66-81. DOI: 10.1016/j.ejrh.2016.03.003Get

DOI

[9]
陈琼, 张镱锂, 刘峰贵, 等. 黄河流域河源区土地利用变化及其影响研究综述[J]. 资源科学, 2020, 42(3):446-459.

[ Chen Q, Zhang Y L, Liu F G, et al. A review of land use change and its influence in the source region of the Yellow River[J]. Resources Science, 2020, 42(3):446-459. ]

[10]
文萌, 张新华, 黄火建, 等. 江河源头区范围划定方法研究[J]. 水力发电, 2019, 45(12):1-6.

[ Wen M, Zhang X H, Huang H J, et al. Study on the method of determining the scope of river source area[J]. Water Power, 2019, 45(12):1-6. ] DOI: 10.18402/resci.2020.03.04

[11]
王浩. 江河源头区水生态保护战略:上蓄、限牧、调农、补偿[J]. 中国水利, 2017(17):10.

[ Wang H. Strategic measures of ecological conservation for river source region in China: Upper storage, limited grazing, agricultural adjustment and compensation[J]. China Water Resources, 2017(17):10. ] DOI: 10.3969/j.issn.1000-1123.2017.17.007

[12]
Spoolman-S Miller J T. Living in the environment: Principles, connections, and solutions[M]. Canada: Brooks/Cole Pub Co, 2012.

[13]
Liu G S, Wang G X. Insight into runoff decline due to climate change in China's Water Tower[J]. Water Supply, 2012, 12(3):352-361. DOI: 10.2166/ws.2012.003

DOI

[14]
李贝贝, 李志威, 胡旭跃, 等. 长江源区河网纵剖面分析[J]. 山地学报, 2018, 36(3):470-481.

[ Li B B, Li Z W, Hu X Y, et al. Longitudinal profile of river networks in the Yangtze River source region[J]. Mountain Research, 2018, 36(3):470-481. ]

[15]
陈利群, 刘昌明, 郝芳华, 等. 黄河源区气候对径流的影响分析[J]. 地学前缘, 2006, 13(5):321-329.

[ Chen L Q, Liu C M, Hao F H, et al. Impact of climate on runoff in the source regions of the Yellow river[J]. Earth Science Frontiers, 2006, 13(5):321-329. ] DOI: 10.3321/j.issn:1005-2321.2006.05.006

[16]
Luo D L, Jin H J, Jin R, et al. The extraction of watershed characteristics of the Source Area of Yellow River based on SRTM DEM with ArcGIS[C]// 2011 International Conference on Remote Sensing, Environment and Transportation Engineering. IEEE, 2011:1799-1802. DOI: 10.1109/RSETE.2011.5964645

[17]
丁永建, 杨建平, 刘时银, 等. 长江黄河源区生态环境范围的探讨[J]. 地理学报, 2003, 58(4):519-526.

[ Ding Y J, Yang J P, Liu S Y, et al. Exploration of eco-environment range in the source regions of the Yangtze and Yellow Rivers[J]. Acta Geographica Sinica, 2003, 58(4):519-526. ] DOI: 10.11821/xb200304005

[18]
孔凡哲, 李莉莉. 利用DEM提取河网时集水面积阈值的确定[J]. 水电能源科学, 2005, 23(4):65-67,93.

[ Kong F Z, Li L L. Determination of river drainage area threshold for extraction of drainage network by DEM[J]. Hydroelectric Energy, 2005, 23(4):65-67,93. ] DOI: 10.3969/j.issn.1000-7709.2005.04.020

[19]
杨锦玲. 基于分形的数字水系集水面积阈值确定研究[J]. 测绘科学, 2011, 36(4):33-34.

[ Yang J L. Digital determination of catchment area threshold based on fractal dimension[J]. Science of Surveying and Mapping, 2011, 36(4):33-34. ]

[20]
杨邦, 任立良. 集水面积阈值确定方法的比较研究[J]. 水电能源科学, 2009, 27(5):11-14,171.

[ Yang B, Ren L L. Identification and comparison of critical support area in extracting drainage network from DEM[J]. Water Resources and Power, 2009, 27(5):11-14,171. ] DOI: 10.3969/j.issn.1000-7709.2009.05.004

[21]
赖晗, 芮小平, 梁汉东, 等. 基于均值变点分析的三峡库区河网提取研究[J]. 测绘科学, 2012, 37(5):173-175.

[ Lai H, Rui X P, Liang H D, et al. Extraction of drainage network in Three Gorge reservoir area based on mean change point method[J]. Science of Surveying and Mapping, 2012, 37(5):173-175. ]

[22]
常直杨, 王建, 白世彪, 等. 均值变点分析法在最佳集水面积阈值确定中的应用[J]. 南京师大学报(自然科学版), 2014, 37(1):147-150.

[ Chang Z Y, Wang J A, Bai S B, et al. Determination of accumulation area based on the method of applying mean of change-point analysis[J]. Journal of Nanjing Normal University (Natural Science Edition), 2014, 37(1):147-150. ] DOI: 10.3969/j.issn.1001-4616.2014.01.027

[23]
徐新良, 庄大方, 贾绍凤, 等. GIS环境下基于DEM的中国流域自动提取方法[J]. 长江流域资源与环境, 2004, 13(4):343-348.

[ Xu X L, Zhuang D F, Jia S F, et al. Automated extraction of drainages in China based on Dem in gis environment[J]. Resources and Environment in the Yangtze Basin, 2004, 13(4):343-348. ] DOI: 10.3969/j.issn.1004-8227.2004.04.009

[24]
冯永忠, 杨改河, 杨世琦, 等. 江河源区地域界定研究[J]. 西北农林科技大学学报(自然科学版), 2004, 32(1):11-14.

[ Feng Y Z, Yang G H, Yang S Q, et al. Definition on the source regions of Yangtse river, Yellow River and lantsang river[J]. Journal of Northwest Sci-Tech University of Agriculture and Forestry, 2004, 32(1):11-14. ] DOI: 10.3321/j.issn:1671-9387.2004.01.003

[25]
陈进, 许珍. 以三江源为例探讨江河源头确定原则[J]. 长江科学院院报, 2016, 33(3):23-28.

[ Chen J, Xu Z. Principles of determining river source: Case study on the sources of three rivers[J]. Journal of Yangtze River Scientific Research Institute, 2016, 33(3):23-28. ] DOI: 10.11988/ckyyb.20160021

[26]
冯永忠, 朱芬萌, 王得祥, 等. 江河源区生态地理区划[J]. 西北农林科技大学学报(自然科学版), 2004, 32(2):1-4.

[ Feng Y Z, Zhu F M, Wang D X, et al. Eco-geographic scheme in the source regions of Yangtse River, Yellow River and Lantsang River[J]. Journal of Northwest Sci-Tech University of Agriculture and Forestry, 2004, 32(2):1-4. ] DOI: 10.3321/j.issn:1671-9387.2004.02.001

[27]
陈晓红, 王玉娟, 万鲁河, 等. 基于层次聚类分析东北地区生态农业区划研究[J]. 经济地理, 2012, 32(1):137-140.

[ Chen X H, Wang Y J, Wan L H, et al. Study on the eco-agriculture regionalization based on hierarchical cluster analysis in northeast China[J]. Economic Geography, 2012, 32(1):137-140. ]

[28]
杨志恒. 基于Ward法的区域空间聚类分析[J]. 中国人口·资源与环境, 2010, 20(S1):382-386.

[ Yang Z H. Region spatial cluster algorithm based on ward method[J]. China Population,Resources and Environment, 2010, 20(S1):382-386. ]

[29]
刘超楠, 王山东. 基于Ward法的马鞍山市规划单元聚类分析[J]. 测绘与空间地理信息, 2015, 38(3):114-116.

[ Liu C N, Wang S D. Cluster analysis of Ma'anshan city planning unit based on ward method[J]. Geomatics & Spatial Information Technology, 2015, 38(3):114-116. ] DOI: 10.3 969/j.issn.1672-5867.2015.03.036

Outlines

/