Application of Random Forest Algorithm in Regional Ecotourism Suitability Assessment

  • TAN Cui , 1, 2 ,
  • HUANG Qin 1, 2 ,
  • YANG Bo , 1, 2, * ,
  • LI Tao 1, 2 ,
  • LEI Jihua 1, 2
Expand
  • 1. School of Geographical Sciences, Hunan Normal University, Changsha 410081, China
  • 2. Hunan Key Laboratory of Geospatial Big Data Mining and Application, Hunan Normal University, Changsha 410081, China
*YANG Bo, E-mail:

Received date: 2023-04-16

  Revised date: 2023-07-03

  Online published: 2024-03-27

Supported by

National Natural Science Foundation of China(41171342)

Key Project of Hunan Provincial Education Department(17A127)

Abstract

The ecotourism suitability assessment is the basis and a crucial reference for evaluating development potential, formulating plans, and implementing exploitation in ecotourism. In this study, we first analyze the feasibility of machine learning methods for modeling ecotourism suitability, and the Random Forest (RF) algorithm is selected for conducting an empirical study in the Wuling Mountain area in Hunan Province. In the study area, there are abundant tourism resources with an urgent need for ecotourism development, which can not only consolidate and expand the achievements of poverty alleviation, but also effectively connect with rural revitalization, thereby promoting sustainable development of tourism. The results show that: (1) Machine learning, as a new regional ecotourism suitability assessment approach, provides new insights and solutions for further improvement of suitability assessment; (2) The RF algorithm as a typical machine learning method can be effectively applied in the regional ecotourism suitability assessment. The optimized RF model achieves an average testing accuracy of 86.49%, with an area under the curve (AUC) of 0.95. These results also indicate the ecotourism suitability of the Wuling Mountain area in Hunan Province; (3) The ranking of feature importance reveals that land use type contributes most to the model, accounting for 28.98%, followed by other significant factors including population density (16.34%), distance from scenic spots (12.2%), and biological richness (10.65%). The above factors should be all considered in ecotourism development efforts; (4) The ecotourism suitability results show a high proportion of highly and moderately suitable areas, suggesting significant potential for ecotourism development in the study area. Based on the ecotourism suitability assessment, different development directions are proposed: A protective pattern and experiential education-oriented ecotourism are well-suited in highly suitable areas; a joint pattern and supportive ecotourism are appropriate for moderately suitable areas; a restrictive pattern is recommended for marginally suitable areas; and for unsuitable areas, the development should be prohibited. Finally, we present a new development strategy known as "two centers, one belt, and one plate," providing theoretical and technical guidance for ecotourism development and the consolidation of poverty alleviation achievements in the Wuling Mountain area of Hunan Province.

Cite this article

TAN Cui , HUANG Qin , YANG Bo , LI Tao , LEI Jihua . Application of Random Forest Algorithm in Regional Ecotourism Suitability Assessment[J]. Journal of Geo-information Science, 2024 , 26(2) : 318 -331 . DOI: 10.12082/dqxxkx.2024.230198

1 引言

近年来,传统旅游活动的范围和强度逐渐超出了自然环境的承载能力,破坏了旅游景点的生态环境,阻碍了旅游业可持续发展。生态旅游作为一种可持续的旅游形式,逐渐受到大众的关注。生态旅游是依托于生态环境,致力于生态资源的可持续发展和生态知识与文化传承,并能给当地带来经济利益的旅游活动[1-6]。生态旅游适宜性评价是对特定区域能否开发生态旅游地与开展生态旅游活动进行判断,对区域适宜性进行分区,从而为开发规划及区域可持续发展提供科学理论依据。生态旅游适宜性评价是进行旅游规划和开发的前提条件,如何在生态环境承载能力内最大限度地发展生态旅游并带动当地经济发展及效益提升,对实现保护和开发协调发展具有重要意义。
在类型上,国内在研究内容上多集中于对湿地及自然保护区等生态旅游景区的生态旅游适宜性评价。在研究区域上,国内对以省、市为研究区域的生态旅游适宜性评价进行了探索。在研究方法上,从定性分析向层次分析法(AHP)、模糊层次分析法(FAHP)、灰色多层次分析法和神经网络等多种定量分析方法转变。黄圣霞[7]应用AHP建立了广西十万大山森林生态旅游养老适宜性评价指标体系,定量评估其生态旅游养老适宜性;石丹等[8-9]运用模糊层次分析法,对吉林省4个典型森林生态旅游景区进行了开发潜力评价,还构建了基于多层次灰色模型的生态旅游发展潜力模型,对吉林省进行了分析;周秋文等[10]以地理信息系统(GIS)和神经网络为评价手段,从生态旅游资源、环境承载力、旅游基础条件和社会经济4方面出发,对川西高原进行生态旅游适宜性评价。生态旅游标准确定及潜在生态旅游地选址研究方面,国外多采用遥感(RS)与地理信息系统(GIS)相结合的方法[11-13],而在生态旅游开发适宜性评价方面,多将GIS与多标准决策分析方法(MCDA)相结合,最常用的方法为AHP[14-15]。也有将AHP方法与其他方法结合加以改进[16-19]。Dashti等[16]综合运用GIS、FAHP与加权线性组合(WLC)方法,对伊朗格什姆岛生态旅游适宜性进行了评价,确定了生态旅游的适宜地点;Mahdavi等[20]使用德尔菲法确定了评价标准的权重,并比较了AHP与FAHP 2种方法对霍拉姆-阿巴德县生态旅游适宜性评价结果;Bali等[17]基于AHP、FAHP和GIS开发了一个简单的空间决策支持系统(SDSS),用于优化里海混交林生态区的生态旅游选址;Zabihi等[18]将GIS与FAHP相结合,评估自然、环境和社会经济因素对生态旅游适宜性的影响,并以伊朗巴宝勒地区为例进行了实证研究。
在指标体系的构建上,现有研究多从自然环境、资源、经济3方面条件进行考虑[21-23]。廉同辉等[24]以广西猫儿山国家自然保护区为例确定了自然保护区生态旅游开发潜力评价体系,构建了生态旅游开发潜力评价模型并得到总体评价等级;赵希勇等[25]建立了自然保护区生态旅游开发适宜性尺度评价体系和计算模型,明确了开发的尺度与标准,并以图牧吉自然保护区为例进行了实证研究;吕建树等[26]从资源禀赋、旅游开发、生态环境和客源市场4个方面建立了一套包括42个指标的指标体系,对鲁北滨海湿地生态旅游资源开发潜力进行评价;从东来等[27]以资源质量、人口与经济、城镇依托和交通可达性为指标构建指标体系,以黑龙江省79处湿地为例对湿地资源生态旅游适宜性进行了评价;周彬等[28]基于生态位理论,从旅游资源、环境、社区、市场、区位和交通6个方面构建了生态旅游潜力生态位评价指标体系,对黑龙江省中俄界江进行了生态旅游潜力评价。
综上,虽然国内外对生态旅游适宜性评价方面研究较为深入,但在研究区域方面,对于像武陵山片区这一典型山区区域的研究较少,在评价方法方面还是囿于现有方法,没有新的突破。现有评价方法存在指标权重分配方面的主观性以及在指标权重计算方面的复杂性,本文引进了机器学习方法,经过建模及优化使模型通过学习得到预测结果,避开主观确定指标权重,弥补现有方法不足。
本文采用随机森林算法对湖南武陵山片区生态旅游适宜性评价展开实证研究,从自然环境、资源禀赋和开发条件三方面构建特征矩阵,运用随机森林算法得到适宜性程度,并对各不同适宜性程度的区域进行影响因素分析,可为湖南武陵山片区生态旅游开发和可持续性发展提供依据与支持,为巩固脱贫成果提供理论与技术指导。

2 研究方法

2.1 理论分析

机器学习方法通过非线性拟合建立特征变量与已知样本类别之间的关系,即建模过程,运用构建好的模型预测未知样本的分类结果。该方式进行预测不要求完备的指标体系,避开了数据量纲不一致、特征因子相关性和权重设置等问题,提升预测结果的可靠性。且它的一系列模型优化策略,使得它的训练结果稳定且不容易出现过拟合现象。
机器学习基于特征矩阵得到预测结果的研究思路与传统方法基于构建指标体系并对指标赋值的研究方式具有相似性,将机器学习引入适宜性评价领域具有一定的理论可行性。且在数据处理与建模过程中,不用进行过多的数据预处理工作,还可以评估变量(特征)的重要性程度,运算效率与分类精度均较高,模型泛化能力强,这为它使用在适宜性评价方面提供了基础,避开了人为主观因素对变量权重确定的影响,增加了预测结果的客观性。

2.2 数据关系映射

将机器学习模型引入到生态旅游适宜性评价方面,需将适宜性评价中的评价指标与机器学习中的训练模型相结合,建立一种数据关系映射。生态旅游的适宜性程度即评价结果映射为机器学习中已知样本的标签或未知数据的预测分类结果,所有对生态旅游适宜性产生影响的因子映射为机器学习中的特征变量。

2.3 随机森林算法

随机森林(Random Forest, RF)算法是一种以决策树为基本单元的集成学习Bagging算法[29],通过非线性拟合建立特征与样本类别之间的关系。在构建决策树时,有放回的在训练数据中抽取部分特征样本进行 K轮训练,每棵树使用的特征样本不同,可得到不同的训练结果,得出不同的训练模型,即基评估器。进行预测时,在分类问题中选择多数分类结果,在回归问题中取多个回归结果的平均值作为集成评估器的预测结果。本研究将影响生态旅游适宜性的因子作为随机森林算法中的特征因子,将生态旅游适宜性结果作为随机森林算法最终预测结果,本研究使用Python中的scikit-learn库开展相关实验。图1为本研究技术路线图。以下为本研究随机森林的算法步骤:
图1 湖南武陵山片区生态旅游适宜性评价技术路线

Fig. 1 Technology roadmap of ecotourism suitability of Wuling Mountain area in Hunan

(1)利用Bootstrap重抽样方法从由已知景点样本与非景点样本构成的原始训练数据集 N中随机抽取 n个样本,形成新的训练样本集;
(2)共有M个特征因子,随机选取mmM)个特征,形成特征子集;
(3)在新的样本集与特征子集上构建决策树,在生长过程中选择最佳分割属性进行节点分裂;
(4)重复前3个步骤 K次,构建 K棵决策树,得到 K个基评估器;
(5)组合 K棵决策树,形成随机森林。模型按照投票方式来判别测试样本即未知样本的类别:
G x = a r g m a x y i = 1 k I ( g i x = Y )
式中: x为特征集合; G x表示模型最终预测结果,即每一个栅格的生态旅游适宜性概率值; g i为第 i棵决策树分类器(基评估器); I为示性函数; Y为输出变量,即单棵决策树的预测结果。

3 实证分析

3.1 研究区概况

武陵山片区是长江流域重点水源涵养、水土保持和生态安全屏障功能区,也是国家重点生态功能区和生物多样性保护区,包括湖北、湖南、重庆、贵州四省市相交地带的71个县(市、区),如图2所示。湖南武陵山片区包括湘西州、张家界市、常德市、怀化市、邵阳市、娄底市和益阳市部分所辖37个县(市、区),总面积9.49万 km2,占湖南省总面积的43.8%。区内自然生态旅游资源丰富,有2处世界自然遗产,9个国家级自然保护区、22个国家森林公园、3个5A级景区以及38个4A级景区。然而,湖南武陵山片区经济发展缓慢,旅游业仍然以大众旅游为主,造成资源的破坏,亟需生态旅游资源的充分开发利用。2020年湖南武陵山片区贫困县全部实现脱贫摘帽后,现在面临的主要任务是巩固脱贫成效,有效衔接乡村振兴。将湖南武陵山片区生态旅游资源作为载体,以保护自然、享受自然及促进经济发展为目的开展区域生态旅游是促进乡村振兴的新举措与新方案。
图2 湖南武陵山片区地理分布

Fig. 2 Geographical distribution of Wuling Mountain area in Hunan

3.2 数据来源

本文涉及到多源异构地理空间数据,涵盖遥感、气象、基础地理数据等,具体包括POI、DEM、人口、遥感影像、路网、河流水系、土地利用、气象、行政区划和生态系统服务价值数据等,数据的获取来源如表1所示。
表1 数据来源

Tab. 1 Data Sources

数据类型 数据年份 数据来源 数据描述
景点、居民点POI数据 2022 百度地图API数据开放接口 经数据清洗得到255个景点
DEM数据 2019 地理空间数据云
http://www.gscloud.cn/
ASTER GDEM V3
30 m空间分辨率,反映区域高程信息
人口数据 2020 WORLDPOP全球高分辨率人口计划项目数据集
(www.worldpop.org/)
空间分辨率为3弧度,在赤道处约为100 m
遥感数据 2020 地理空间数据云
(http://www.gscloud.cn/)
30 m Landsat 8 OLI_TIRS 数据,用以计算归一化植被指数(NDVI)
路网数据 2020 OSM(www.openstreetmap.org) 反映交通状况,计算道路密度与距道路距离
河流水系数据 2020 全国地理信息资源目录服务系统
http://www.webmap.cn
反映水系状况,计算距水域距离与水系密度
土地利用数据 2020 30 m全球地表覆盖数据GlobelLand30
(http://www.globallandcover.com/)
30 m空间分辨率,反映地表覆盖状况
行政区划数据 2020 中国科学院资源环境科学数据中心
http://www.resdc.cn/
研究区行政边界,通过矢量底图掩膜出各特征因子栅格
气象数据 2020 中国气象要素年度空间插值数据集
(http://www.resdc.cn/DOI)
多年平均气温、降水数据
生态系统服务价值数据 2020 中国陆地生态系统服务价值空间分布数据集
(http://www.resdc.cn/DOI
生物丰富度、美学景观价值数据

3.3 特征矩阵构建与数据处理

3.3.1 旅游适宜性影响因素

生态旅游适宜性评价结果受到多因素影响,在选择影响适宜性的因素时,需综合考虑选择的特征指标,不仅要全面也要避免选择相关性高的特征,同时也要充分考虑特征的可获得性。通过阅读文献,将影响生态旅游适宜性的因素归纳为以下3个主要方面:
(1)自然环境
自然生态环境是进行生态旅游的前提条件,限制着旅游开发方向与承载力水平。自然环境主要表现在地形、地貌、坡度、植被、气候、水系等方面。地形地貌是构成自然生态景观格局的重要元素,同时也会影响到其他地理要素[30];森林植被对生态环境有着重要的保护作用,是生态旅游重要组成部分[31];气温和降水不仅会影响生态景观的形成,同时也影响到游客进行生态旅游的舒适度[31];水域可以改善环境,调节气候,不仅是旅游基础设施建设基础,也是构成生态景观的重要元素;空气质量会影响到游客游玩的体验感[32]
(2)资源禀赋
资源禀赋是一个地区进行生态旅游的基础条件,制约着生态旅游的发展。土地利用类型不同,直接影响到其环境承载力[26];生物丰富度反映了一个地区的生物多样性价值,直接影响到该地的生态旅游价值[33];生态旅游资源是进行开发生态旅游的基础,现有景区能加速生态旅游发展进程[33];美学景观价值反映旅游景观的价值,是生态旅游的重要组成部分[25]
(3)开发条件
生态旅游开发条件是进行生态旅游的必要条件。为生态旅游的开发提供资源,并促进生态旅游稳定发展的外部支撑。人口影响到生态旅游地区的接待能力[34];交通将客源地与旅游目的地连接起来,同时将生态旅游景点相连,是影响生态旅游开发的重要因素[31];区域经济发展水平直接影响到生态旅游资金投入与产品开发[32];政府资金投入与政策力度通过影响技术、人才和设施等资源要素影响生态旅游开发与发展[35]

3.3.2 模型特征矩阵构建

结合现有研究成果,参考数据的科学性与可获得性,从生态旅游自然环境、生态旅游资源禀赋和生态旅游开发条件3个方面选取相应的特征因子,构建湖南武陵山片区生态旅游适宜性特征矩阵(表2)。
表2 湖南武陵山片区生态旅游适宜性特征选择

Tab. 2 Features selection of ecotourism suitability of Wuling Mountain area in Hunan

影响因素 特征选取 特征说明 计算方法
生态旅游自然环境 NDVI 反映区域的植被覆盖程度,值越大
表示自然环境越好
ENVI 5.3 处理遥感影像波段得到:
NIR(近红外)-IR(红外波段)/NIR+IR
地形起伏度 影响自然景观形态特征 ArcGIS 邻域分析DEM得出
坡度 影响植被生长,坡度越缓越适宜 ArcGIS 坡度分析
坡向 影响自然生态景观格局 ArcGIS 坡向分析
高程 影响气候因子与人类活动 DEM值
水系密度 水系是构成自然生态景观的重要元素 水系密度=水系长度/区域面积,利用ArcGIS 进行计算
距水域距离 反映利用水源的便利程度,对休闲旅游有重要作用 ArcGIS 距离分析工具,采用欧式距离
气温 多年平均气温,影响舒适度及停留时间 从已出版数据集获取
降水 多年平均降水,影响停留时间与路线选择 从已出版数据集获取
生态旅游资源禀赋 土地利用类型 不同土地利用类型其环境承载力不同 从已有数据集中获取
生物丰富度 生物丰度越高,生态旅游资源越丰富 从已出版数据集获取
生态旅游资源密度 生态旅游资源密度越大资源禀赋越高 ArcGIS 点密度计算工具
美学景观价值 反映自然景观的美学价值,价值越高资源禀赋越高 从已出版数据集获取
生态旅游开发条件 人口密度 反映区域的接待能力与消费规模 从已有数据集中获取
距居民点距离 反映区域的偏远程度,距离居民点越近,
越有利于获得相关设备设施服务,更好的区位依托
ArcGIS 距离分析工具,采用欧式距离
GDP 人均GDP,反映经济发展水平,是开发的重要条件 从已有数据集中获取
路网密度 反映区域公路发展水平及交通的良好互联,
密度越大交通越便利
路网密度=道路长度/区域面积,利用ArcGIS 进行计算
距道路距离 距道路越近,可达性越强,越利于开发 ArcGIS 距离分析工具,采用欧式距离
距景点距离 反映对现有景点的依托能力,距现有景点越近,
依托能力越强,利于开发
ArcGIS 距离分析工具,采用欧式距离

3.3.3 数据处理

本文基于随机森林算法对湖南武陵山片区进行生态旅游适宜性评价,首先,将选取的影响生态旅游适宜性的特征因子,进行投影操作统一到相同投影坐标系,利用研究区矢量边界将特征因子原始数据掩膜,得到相同范围的特征因子,并通过重采样将特征因子统一为100 m×100 m大小的栅格;其次,导入到Python中作为随机森林模型的特征因子;提取生态旅游景点POI正类样本和相同数量的非景点负类样本所对应的特征因子值构建训练数据集;最后,将特征因子构成的特征矩阵导入训练好的随机森林模型进行分类预测,得到每个网格适宜性概率及特征重要性排序,并进行生态旅游适宜性制图。部分特征因子如图3所示。
图3 湖南武陵山片区生态旅游适宜性评价部分特征因子

Fig. 3 Part of the characteristic factors for evaluating the suitability of ecotourism in the Wuling Mountain area of Hunan Province

3.4 结果与分析

3.4.1 模型可靠性评估

混淆矩阵是二分类问题的多维衡量指标,直观的描述了模型预测结果类型与测试数据真实属性之间的关系,是评估分类器可靠性的一种常用方法。基于混淆矩阵选择精确度(Precision)、召回率(Recall)和F1分数来评估模型性能。
P r e c i s i o n = T P T P + F P
R e c a l l = T P T P + F N
F 1 = 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l
式中: T P表示实际为正类被预测为正类的样本数量,即将景点样本正确预测为景点样本的数量; F P表示实际为负类被预测为正类的样本数量,即将非景点样本预测为景点样本的数量; F N表示实际为正类被预测为负类的样本数量,即将景点样本预测为非景点样本的数量。 F 1分数是精确度和召回率的调和平均值, F 1分数越高,模型越稳健。
受试者工作特征曲线(Receiver Operating Characteristic Curve, ROC)将预测值作为判断阈值,以假阳性率(1-特异度)为横坐标,真阳性率(敏感度)为纵坐标绘制ROC曲线,该曲线与横坐标围成的封闭几何图形的面积即为AUC(Area Under ROC Curve)值,该值的大小反映了模型的准确度,数值越接近于1说明模型准确度越高。ROC曲线与AUC面积能客观的衡量模型本身的性能,在机器学习算法可靠性评估中应用广泛。本文使用混淆矩阵、ROC曲线及AUC面积来综合评估模型可靠性。
为了提高模型的泛化能力,本文使用了十折交叉验证来降低模型过拟合风险,将样本数据平均分为10份,每次提取其中一份作为测试数据集,剩余九份作为训练数据集,分别计算精确度、召回率和 F 1分数的平均值。由实验结果可知,十折交叉验证平均精确度为86.49%,召回率为88.28%, F 1分数为87.56%,AUC面积达0.95,模型性能表现优秀。ROC曲线如图4所示。
图4 模型ROC曲线图及AUC面积

Fig. 4 ROC curve and AUC area

3.4.2 生态旅游适宜性分析

利用训练好的随机森林模型对湖南武陵山片区特征因子进行预测,得到各网格预测概率值,概率值的大小代表每个网格进行生态旅游的适宜性程度,值越大生态旅游适宜性越高,反之,概率值越低,生态旅游适宜性越低。利用MATLAB进行栅格转换后导入ArcGIS 10.6中进行自然断点法重分类,结合实地情况得出适宜性概率临界值,划分出高度适宜、适度适宜、边际适宜、不适宜4个生态旅游适宜性等级,如图5所示,从研究区北部、中部和南部分别进行了适宜性制图。
图5 湖南武陵山区生态旅游适宜性等级分布

Fig. 5 Distribution of ecotourism suitability levels in Wuling Mountain Area of Hunan Province

(1) 生态旅游高度适宜区
适宜性概率0.69~0.90,面积38 679.73 km2,占研究区总面积的44.96%。
① 空间分布上,高度适宜区分布均衡,研究区北部、中部和南部均有成片分布。研究区北部的各县市中,主要分布在石门县北部与中部、桑植县北部、慈利县南部、龙山县东部、永顺县西北部和东南部、永定区西部与南部及武陵源区大部分区域。研究区中部的各县市中,主要分布在保靖县的西北部、吉首市西部与南部、泸溪县中部、辰溪县东北部、溆浦县北部与中部、新化县西部、新邵县北部、芷江市北部、洪江市中部和东部、洞口县北部、隆回县中东部和中西部、古丈县、沅陵县、安化县大部分区域。研究区南部的各县市中,主要分布在绥宁县中部和南部、会同县北部与东部、新宁县南部、靖州县、通道县和城步县的大部分区域。
② 旅游资源分布方面,高度适宜区分布着张家界、天门山、天泉山、罗溪、嵩云山、南华山、矮寨、百里龙山、大熊山国家森林公园,猛洞河、仙阳湖、五强溪、峒河、潕水、思蒙、雪峰湖、五龙潭、白云湖、玉带河、花园阁国家湿地公园,张家界红石林、长梯隘、云台山、雷峰山、鸡公岩国家石漠公园,张家界世界地质公园、凤凰、崀山、万佛山国家地质公园等高级别旅游景区,以及多个省级旅游资源及旅游景区。
高度适宜区植被覆盖度高,水资源丰富,气候适宜,生物多样性高,生态旅游资源丰富,资源品位高,美学价值高,自然生态景观完整,环境承载力强,景点分布集中,知名度高,景区接待能力强,且交通路网发达,基础设施完善。高度适宜区内生态旅游开发应当与环境保护理念结合,以生态保护为主,打造教育型及体验型生态旅游,使游客在享受旅游的过程中提高环境保护与可持续发展的意识,突出发展高品质生态旅游活动。
(2)生态旅游适度适宜区
适宜性概率位于0.53~0.69,面积为23 714.77 km2,占总面积的27.57%。
空间分布上,主要分布于高度适宜区邻近区域,与高度适宜区交替分布。该区内有着常德石门文庙、龙王洞、五雷山、大峡谷、一线天、黄龙洞、红岩、辰龙观、三道坑、荆坪古村、清江湖、湄江等3A级及以上旅游景区。这些区域植被覆盖度较高,但其较高度适宜区来说,坡度较大,有一定的水土流失风险,生态旅游资源较丰富,同时距离核心景区近,具有便利的交通条件和良好的城镇依托。该区域是当前政府重点发展生态旅游的核心区域,政府应加快旅游基础设施建设,积极响应生态旅游促进乡村振兴,加快适度适宜区生态旅游开发进程。
(3)生态旅游边际适宜区
适宜性概率位于0.36~0.53,面积为13 550.4 km2,占总面积的15.75%。主要分布于北部、中部及东南部,分布较为稀疏,区域植被覆盖度较低,气温较高,降水较少,水源不足,生物多样性相对较低,优秀生态旅游资源较少,分布分散,知名度不高,交通设施不够完善,基础设施少,客源市场较窄,旅游资源后续发展的开发潜力相对有限,该区应坚持保护优先,未来可在少数具有资源特色的地方进行适度开发作为高度适宜区和适度适宜区的缓冲区域。
(4)生态旅游不适宜区
适宜性概率位于0.15~0.36 ,面积为10 079.13 km2,占总面积的11.72%,主要分布于研究区北部,西部以及东南方向,位于边际适宜区的中心区域,呈集中块状分布。具体来看,包括石门县南部,慈利县中部、桑植县南部、龙山县西北部、永定区北部和中部、永顺县北部与南部、保靖县中部、花垣县东部、鹤城市、中方县、洪江县及新宁县部分区域,麻阳县、辰溪县、芷江县以及东南部的新化县、涟源县、新邵县、隆回县、邵阳县、洞口县、武冈县等县市大部分区域。区域植被覆盖率低,包括了大部分城镇区域及永久基本农田,生态旅游资源匮乏,品位低,生态环境脆弱,受人类活动影响显著,加之落后的社会经济条件无力推动生态旅游产业的发展,生态旅游意识不高,旅游基础设施少,上述因素决定了该区域不适宜发展生态旅游,应当严格管控此区域的开发。
将生态旅游资源与高度适宜区分布相结合得出湖南武陵山片区不同区域生态旅游的发展定位,提出了“两中心一带一板块”开发策略,如图6所示。
图6 湖南武陵山片区生态旅游开发策略:“两中心一带一板块”示意图

Fig. 6 Ecotourism development strategy in Wuling Mountain Area of Hunan Province: Schematic diagram of "Two Centers, One Belt, One Plate"

两个中心:① 以张家界市为核心的北部自然生态旅游中心。集合了武陵源风景名胜区、张家界世界地质公园、天门山国家森林公园等高级别旅游景区,凭借极具优势的自然条件、资源禀赋和完善的旅游基础设施,可辐射至壶瓶山、八大公山、乌龙山、猛洞河及小溪自然保护区等,将这些自然旅游资源串联起来形成北部自然生态旅游线,带动石门、龙山及永顺县高度适宜区生态旅游,实行优先开发,联动发展;② 以国家历史文化名城凤凰古城为核心的中部人文生态旅游中心。少数民族风情浓郁,历史文化悠久,周边分布着乾州古城、侗文化城、矮寨奇观、十八洞、苗人谷-老家寨等民族历史人居建筑,凤凰之窗文化旅游产业园、神凤文化景区等民俗文化区,红色景区滕代远纪念馆和芷江抗战受降纪念旧址等诸多人文生态旅游资源。充分发挥凤凰古城的驱动力,将这些人文生态旅游资源作为基础,连接凤凰县周边县市高度适宜区进行开发,充分突出人文资源优势,打造具有湘西特点的人文生态旅游中心。
一个区域带:雪峰山综合生态旅游带。沿雪峰山生态旅游资源类型丰富,有借母溪、六步溪、鹰嘴界等自然保护区,大熊山、中坡、罗溪、龙山等国家森林公园,雪峰湖、龙湾、思蒙、潕水、渠水、花园阁、魏源湖等国家湿地公园,红色景点向警予纪念馆,民俗历史文化古村阳雀坡古村落、高椅古村、寨市古镇和黔阳古城等,名人故居魏源故居等,其他类型如佳麓山庄农业生态旅游区、紫鹊界梯田等。中部生态旅游高度适宜区沿雪峰山一带集中分布,开发雪峰山综合生态旅游带,可为中部县市生态旅游注入活力,通过生态旅游带动经济发展。
一个板块:南部自然人文生态旅游板块。聚集着万佛山国家地质公园、南山、崀山国家风景名胜区、玉带河、白云湖、夫夷江、五龙潭国家湿地公园等自然生态旅游资源与地笋苗寨、岩脚侗寨、转兵纪念馆等人文生态旅游资源。靖州、通道、新宁及城步四县高度适宜区分布广泛,资源条件优异,开发条件优良,将这四县联合成一个生态旅游板块整体开发。
“两中心一带一板块”开发策略为研究区生态旅游开发明确了开发方向,制定了开发目标,可促进湖南武陵山区生态旅游开发进展,为相关政府部门制定区域生态旅游发展政策提供科学依据与参考。同时可为类似欠发达山区开展生态旅游活动提供理论指导,进而助力中国生态旅游的良性健康发展。
通过模型返回的特征重要性排序如图7所示,由图可知,影响湖南武陵山片区生态旅游适宜性的主要因子是土地利用类型,不同土地利用类型其环境承载力不同,其次,人口密度、距景点距离和生物丰富度等因子贡献也较大,人口密度影响旅游市场的消费规模,也影响生态旅游的开发强度;距景点距离越近,越容易受到高级别旅游景点的辐射,在空间分布上也符合地理学第一定律;生物丰富度越高,生态旅游资源越丰富,这是进行生态旅游开发的基础条件。这4个特征从侧面反映出资源禀赋与社会经济发展水平对进行生态旅游开发有着巨大的影响,所以其对模型的贡献率较大。坡向、水系密度和路网密度等特征重要性较小,对模型的贡献率较小,这与现有生态旅游景点的空间分布有直接关联。模型从这些特征中学习不到足够的异质性,因而其对模型的贡献率低。
图7 各特征重要性度量

Fig. 7 Proportion of each feature importance

4 结论与讨论

4.1 结论

本研究以湖南武陵山片区为研究对象,融合多源空间数据,创新地将机器学习算法应用到生态旅游适宜性评价方面,利用随机森林模型对湖南武陵山片区生态旅游适宜性开展实证研究,得出以下结论:
(1)将机器学习算法引入到区域生态旅游适宜性评价领域作为一种新方法,规避了传统评价方法中权重设置的主观性与计算的复杂性,在客观性与准确性上有着巨大的优势。这是本文最大的创新之处。可为之后改进生态旅游适宜性评价方法提供新思路与新方案。
(2)随机森林算法可以有效应用在区域生态旅游适宜性评价方面,可作为适宜性评价方面的一种新方法。通过构建19维特征矩阵,利用随机森林模型对已知的生态旅游景点进行建模,经过模型训练与优化,得到每个网格生态旅游适宜性概率。模型的精度达86.49%,AUC面积达0.95,具有较好的性能,能够准确地反映湖南武陵山片区生态旅游适宜性。
(3)湖南武陵山片区生态旅游开发潜力巨大。适宜性结果划分为高度适宜、适度适宜、边际适宜和不适宜4个等级,面积分别占总面积的44.96%、27.57%、15.75%和11.72%。区域评价结果主要以高度适宜与适度适宜为主,不适宜最少,这说明研究区开发潜力巨大且需重点考虑高度适宜与适度适宜区生态旅游开发与开展。
(4)土地利用类型是影响湖南武陵山片区生态旅游适宜性程度最大的特征因子,占比达到28.98%。人口密度、距景点距离和生物丰富度等因子的影响也较大,分别为16.34%、12.2%和10.65%。
(5)根据适宜性评价结果,提出生态旅游开发方向。研究区两处世界自然遗产以及多个国家自然保护区、森林公园、湿地公园和高级别景区都分布在高度适宜与适度适宜区。高度适宜区分布均衡,研究区北部、中部和南部均有成片分布,在高度适宜区发展生态旅游应以环境保护作为指导理念,走保护性开发模式,打造体验-教育型生态旅游,发展高品质生态旅游活动;适度适宜区分布于高度适宜区邻近区域,是发展生态旅游的重点区域,应与高度适宜区加强联系,走联合性开发模式,打造支撑型生态旅游,加快高度适宜区生态旅游开发进程;边际适宜区主要分布在北部、中部及东南部,分布较为稀疏,开发潜力相对有限,走限制性开发模式,未来可作为缓冲区域进行适度开发;不适宜区主要分布在北部、西部和东南部,呈集中块状分布,区内生态环境脆弱,不适宜开展生态旅游活动,应当禁止开发。

4.2 讨论

随机森林算法应用在生态旅游适宜性评价中,克服了传统方法中权重设置的主观性干扰因素,利用已知样本实现对未知大规模样本的预测,符合适宜性评价的工作实际。且基于数据映射,有着较强的可行性,评价结果可为域内生态旅游开发布局提供支撑。
同时,本文也存在以下不足及改进之处:① 由于数据的可获取性,本文构建的特征矩阵还需进一步完善,未来可考虑加入环境质量因子如PM2.5浓度值、生态敏感区因子如自然保护区数据以及旅游消费水平等特征;② 可探索欠发达山区生态旅游适宜性的关键影响因素,筛选出重要关键的特征因子,达到精简特征、优化模型的目标;③ 不局限于空间尺度的分析,可加入时间维数据,探索生态旅游适宜性的时空演变规律;④ 目前基于机器学习方法的生态旅游适宜性评价研究还有待深入,未来可进行不同机器学习方法之间的对比分析。
[1]
Boo E. Ecotourism: the potentials and pitfalls[M]. Washington, D.C.: World Wildlife Fund, 1990.

[2]
Ross S, Wall G. Ecotourism: Towards congruence between theory and practice[J]. Tourism Management, 1999, 20(1):123-132. DOI:10.1016/S0261-5177(98)00098-3

[3]
Weaver D. Ecotourism as mass tourism: Contradiction or reality?[J]. The Cornell Hotel and Restaurant Administration Quarterly, 2001, 42(2):104-112. DOI:10.1016/S0010-8804(01)80022-7

[4]
Fung T, Wong F K K. Ecotourism planning using multiple criteria evaluation with GIS[J]. Geocarto International, 2007, 22(2):87-105. DOI: 10.1080/10106040701207332.

[5]
Bunruamkaew K, Murayama Y. Land use and natural resources planning for sustainable ecotourism using GIS in surat thani, Thailand[J]. Sustainability, 2012, 4(3):412-429. DOI:10.3390/su4030412

[6]
Jeong J S, García-Moruno L, Hernández-Blanco J, et al. An operational method to supporting siting decisions for sustainable rural second home planning in ecotourism sites[J]. Land Use Policy, 2014, 41:550-560. DOI:10.1016/j.landusepol.2014.04.012

[7]
黄圣霞. 基于AHP的广西十万大山森林生态旅游养老适宜性评价[J]. 河池学院学报, 2018, 38(3):53-59.

[ Huang S X. Evaluation of endowment suitability of forest ecotourism in Guangxi Shiwandashan based on analytic hierarchy process[J]. Journal of Hechi University, 2018, 38(3):53-59. ]

[8]
石丹, 刘晓霞. 基于模糊层次分析法的森林生态旅游景区开发潜力评价——以吉林省4个典型森林生态景区为例[J]. 桂林理工大学学报, 2021, 41(2):465-470.

[ Shi D, Liu X X. Development potential evaluation of forest ecotourism attraction based on fuzzy analytic hierarchy process: take 4 typical forest ecotourism attractions in Jilin as examples[J]. Journal of Guilin University of Technology, 2021, 41(2):465-470. ] DOI:10.3969/j.issn.1674-9057.2021.02.030

[9]
石丹, 杨慧. 基于多层次灰色方法的生态旅游发展潜力评价及实证研究[J]. 中国农业资源与区划, 2019, 40(2):40-48.

[ Shi D, Yang H. Research on evaluation model of the ecotourism development potential and its empirical analysis based on the multi-level grey evaluation method[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2019, 40(2):40-48. ] DOI:10.7621/cjarrp.1005-9121.20190206

[10]
周秋文, 方海川, 苏维词. 基于GIS和神经网络的川西高原生态旅游适宜度评价[J]. 资源科学, 2010, 32(12):2384-2390.

[ Zhou Q W, Fang H C, Su W C. Evaluation of ecotourism suitability for the western Sichuan Plateau based on GIS and the artificial neural network[J]. Resources Science, 2010, 32(12):2384-2390. ]

[11]
Oladi J, Bozorgnia D. Evaluating the ecotourism potentials of Naharkhoran area in Gorgan using remote sensing and geographic information system[C]// SPIE Proceedings","Earth Resources and Environmental Remote Sensing/GIS Applications. SPIE, 2010, 7831:299-308. DOI:10.1117/12.860095

[12]
Pareta K. Remote sensing and GIS based site suitability analysis for tourism development[J]. International Journal of Advanced Research in Engineering and Applied Sciences, 2013, 2(5):43-58.

[13]
Agnes D, Nandatama A, Isdyantoko B A, et al. Remote sensing and GIS-based site suitability analysis for tourism development in Gili Indah, East Lombok[J]IOP Conference Series: Earth and Environmental Science, 2016, 47(1):012013. DOI:10.1088/1755-1315/47/1/012013

[14]
Mobaraki O, Abdollahzadeh M, Kamelifar Z. Site suitability evaluation for ecotourism using GIS and AHP: A case study of Isfahan Townships, Iran[J]. Management Science Letters, 2014, 4(8):1893-1898. DOI:10.5267/j.msl.2014.6.038

[15]
Dhami I, Deng J, Burns R C, et al. Identifying and mapping forest-based ecotourism areas in West Virginia-Incorporating visitors' preferences[J]. Tourism Management, 2014, 42:165-176. DOI:10.1016/j.tourman.2013.11.007

[16]
Dashti S, Monavari S, Hosseini S, et al. Application of GIS, AHP, fuzzy and WLC in island ecotourism development (case study of Qeshm Island, Iran)[J]. Life Science Journal, 2013, 10(1):1274-1282

[17]
Bali A L, Monavari S M, Riazi B, et al. A spatial decision support system for ecotourism development in caspian Hyrcanian mixed forests ecoregion[J]. Boletim De Ciências Geodésicas, 2015, 21(2):340-353. DOI:10.1590/s1982-21702015000200001

[18]
Zabihi H, Alizadeh M, Wolf I D, et al. A GIS-based fuzzy-analytic hierarchy process (F-AHP) for ecotourism suitability decision making: A case study of Babol in Iran[J]. Tourism Management Perspectives, 2020, 36:100726. DOI:10.1016/j.tmp.2020.100726

[19]
Çetinkaya C, Kabak M, Erbaş M, et al. Evaluation of ecotourism sites: A GIS-based multi-criteria decision analysis[J]. Kybernetes, 2018, 47(8):1664-1686.

DOI

[20]
Mahdavi A, Niknejad M. Site suitability evaluation for ecotourism using MCDM methods and GIS: Case study- Lorestan Province, Iran. J. Bio[J]. Environmental Science. 2014, 4(6):425-437.

DOI

[21]
李悦铮, 牟方元, 梁娟. 湿地旅游资源评价指标体系构建与应用[J]. 经济地理, 2019, 39(1):192-197.

[ Li Y Z, Mu F Y, Liang J. Construction and application of evaluation index system for wetland tourism resources[J]. Economic Geography, 2019, 39(1):192-197. ] DOI:10.15957/j.cnki.jjdl.2019.01.023

[22]
莫莉秋. 海南省乡村旅游资源可持续发展评价指标体系构建[J]. 中国农业资源与区划, 2017, 38(6):170-177.

[ Mo L Q. Analysis of sustainable development of rural tourism resources system in Hainan[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2017, 38(6):170-177. ] DOI:10.7621/cjarrp.1005-9121.20170624

[23]
李莹. 浙江省农业生态旅游资源评价指标体系构建[J]. 中国农业资源与区划, 2018, 39(11):178-182.

[ Li Y. The construction of evaluation index system of agricultural ecotourism resources in Zhejiang Province[J]. Chinese Journal of Agricultural Resources and Regional Planning, 2018, 39(11):178-182. ] DOI:10.7621/cjarrp.1005-9121.20181125

[24]
廉同辉, 王金叶, 程道品. 自然保护区生态旅游开发潜力评价指标体系及评价模型——以广西猫儿山国家级自然保护区为例[J]. 地理科学进展, 2010, 29(12):1613-1619.

DOI

[ Lian T H, Wang J Y, Cheng D P. Research on the index system and the models for evaluating the ecotourism development potential of nature reserves: An example of maoer mountain nature reserve in Guangxi[J]. Progress in Geography, 2010, 29(12):1613-1619. ]

DOI

[25]
赵希勇, 闫金娟, 马建章, 等. 自然保护区生态旅游开发适宜性尺度评价模型及其应用[J]. 野生动物学报, 2016, 37(1):67-71.

[ Zhao X Y, Yan J J, Ma J Z, et al. Nature reserve eco-tourism development suitability scale evaluation model and application[J]. Chinese Journal of Wildlife, 2016, 37(1):67-71. ] DOI:10.19711/j.cnki.issn2310-1490.2016.01.013.

[26]
吕建树, 刘洋, 张祖陆, 等. 鲁北滨海湿地生态旅游资源开发潜力评价及开发策略[J]. 资源科学, 2011, 33(9):1788-1798.

[ J S, Liu Y, Zhang Z L, et al. Evaluation of exploitation potential and formulation of development strategy of eco-tourism resources in coastal wetlands of northern Shandong Province[J]. Resources Science, 2011, 33(9):1788-1798. ] DOI:10.3724/SP.J.1011.2011.00211

[27]
丛东来, 于少鹏, 孟博, 等. 湿地资源生态旅游适宜性评价——以黑龙江省79处重点调查湿地为例[J]. 国土与自然资源研究, 2019(4):63-67.

[ Cong D L, Yu S P, Meng B, et al. Eco-tourism suitability evaluation of wetland resource—Using 79 examples of major investigation wetlands in Heilongjiang[J]. Territory & Natural Resources Study, 2019(4):63-67. ] DOI:10.16202/j.cnki.tnrs.2019.04.020

[28]
周彬, 钟林生, 陈田, 等. 基于生态位的黑龙江省中俄界江生态旅游潜力评价[J]. 资源科学, 2014, 36(6):1142-1151.

[ Zhou B, Zhong L S, Chen T, et al. The ecotourism potential of the sino-russian border river of Heilongjiang based on niche theory[J]. Resources Science, 2014, 36(6):1142-1151. ]

[29]
徐枫, 王占岐, 张红伟, 等. 随机森林算法在农村居民点适宜性评价中的应用[J]. 资源科学, 2018, 40(10):2085-2098.

DOI

[ Xu F, Wang Z Q, Zhang H W, et al. Application of random forest algorithm in suitability evaluation of rural residential land[J]. Resources Science, 2018, 40(10):2085-2098. ]

DOI

[30]
王洪桥, 袁家冬, 孟祥君. 东北地区A级旅游景区空间分布特征及影响因素[J]. 地理科学, 2017, 37(6):895-903.

DOI

[ Wang H Q, Yuan J D, Meng X J. Spatial distribution and its influencing factors of level-a scenic spots in northeast China[J]. Scientia Geographica Sinica, 2017, 37(6):895-903. ] DOI:10.13249/j.cnki.sgs.2017.06.011

[31]
陆保一, 张恩伟, 明庆忠. 云南省A级旅游景区空间演化特征及其驱动机制[J]. 山地学报, 2019, 37(6):879-890.

[ Lu B Y, Zhang E W, Ming Q Z, et al. Spatial evolution characteristics and driving mechanism of A-class tourist attractions in Yunnan Province, China[J]. Mountain Research, 2019, 37(6):879-890. ] DOI:10.16089/j.cnki.1008-2786.000478

[32]
方叶林, 程雪兰, 王芳. 空气污染与旅游经济的时空关系及影响机理[J]. 经济管理, 2020, 42(1):140-154.

[ Fang Y L, Cheng X L, Wang F. The time-space relationship of air pollution between tourism economy and its influence mechanism[J]. Business and Management Journal, 2020, 42(1):140-154. ] DOI:10.19616/j.cnki.bmj.2020.01.009

[33]
李会琴, 侯林春, 肖拥军, 等. 基于RS、GIS的黄土高原环境脆弱区生态旅游适宜度评价——以山西省中阳县为例[J]. 测绘科学, 2009, 34(6):300-302.

[ Li H Q, Hou L C, Xiao Y J, et al. Evaluation on ecotourism suitability in frangile environment of loess plateau based on RS and GIS-exampled on Zhongyang Country, Shanxi Province[J]. Science of Surveying and Mapping, 2009, 34(6):300-302. ]

[34]
陈晓艳, 徐冬, 黄睿. 浙江省县域旅游经济增长的空间溢出效应[J]. 地理科学进展, 2020, 39(9):1512-1521.

DOI

[ Chen X Y, Xu D, Huang R, et al. Spatial spillover effects of county-scale tourism economic growth in Zhejiang Province[J]. Progress in Geography, 2020, 39(9):1512-1521. ]

DOI

[35]
龙飞, 刘家明, 朱鹤. 长三角地区民宿的空间分布及影响因素[J]. 地理研究, 2019, 38(4):950-960.

DOI

[ Long F, Liu J M, Zhu H, et al. Spatial distribution of homestay and its influencing factors in the Yangtze River Delta of China[J]. Geographical Research, 2019, 38(4):950-960. ]

DOI

Outlines

/