地球信息科学理论与方法

基于居住区识别和改进随机森林的山地城市人口 空间化方法

  • 唐思怡 , 1, 2 ,
  • 闵婕 , 1, 2, 3, *
展开
  • 1.重庆师范大学,重庆 401331
  • 2.重庆师范大学地理与旅游学院,重庆 401331
  • 3.重庆师范大学GIS应用研究重庆市高校 重点实验室,重庆 401331
* 闵 婕(1978— ),女,四川南充人,博士,教授,主要从事土地利用与地理信息系统应用相关研究。 E-mail:

唐思怡(2000— ),女,重庆南岸人,硕士生,主要从资源环境遥感与GIS应用相关研究。E-mail:

Copy editor: 黄光玉 , 蒋树芳

收稿日期: 2024-12-17

  修回日期: 2025-01-09

  网络出版日期: 2025-03-25

基金资助

国家自然科学基金项目(42071277)

重庆市自然科学基金项目(CSTB2023NSCQ-MSX0643)

A Spatialization Method for Mountain Urban Population Based on Residence Identification and Improved Random Forest

  • TANG Siyi , 1, 2 ,
  • MIN Jie , 1, 2, 3, *
Expand
  • 1. Chongqing Normal University, Chongqing 401331, China
  • 2. School of Geography and Tourism, Chongqing Normal University, Chongqing 401331, China
  • 3. Chongqing Key Laboratory of GIS Application Research, Chongqing Normal University, Chongqing 401331, China
* MIN Jie, E-mail:

Received date: 2024-12-17

  Revised date: 2025-01-09

  Online published: 2025-03-25

Supported by

National Natural Science Foundation of China(42071277)

Chongqing Natural Science Foundation of China(CSTB2023NSCQ-MSX0643)

摘要

【目的】地形导致了山地城市人口空间分布差异极大。山地城市的人口空间分布信息对科学研究和地区的政策制定、资源配置、灾害评估与防护等领域具有重要意义。【方法】为准确反映山地城市人口分布,本文提出了一种基于居住区识别和改进随机森林的山地城市人口空间化方法。该方法先识别了居住区格网并应用到特征提取阶段,避免了将人口分配到非居住区。然后,构建了山地城市特征变量数据集,考虑了山地城市人口分布的空间异质性和复杂性,通过GMM聚类算法对特征变量集进行聚类。采用Bootstrap采样法从各类中随机抽取等量的数据形成新的特征变量集并作为训练数据构建随机森林模型,实现了传统随机森林模型的改进。为验证该方法的有效性,本文以山地城市重庆市为实验区,得到了重庆市150 m格网人口空间化结果,将本方法模拟结果与传统随机森林模型、WorldPop数据集和LandScan数据集进行对比,并基于随机森林模型对各特征变量进行了重要性度量。【结果】本文方法的模拟结果整体精度达到82.9%,比传统随机森林模型的模拟结果提高了2.7%,比WorldPop数据集和LandScan数据集分别提高了2.94%和10.91%。在整个实验区,与WorldPop数据集和LandScan数据集相比,本文方法的MAE分别降低了212.63和35.11,RMSE分别降低了1 354.34和524.54;在高密度丘陵区和山地地区,本文方法的精度更好,展现出本文方法对山地城市人口空间化的有效性。【结论】此外,本文方法的模拟结果在不同人口密度区和不同地形区表现出比2个已开放的人口数据集更明显的人口分布异质性特征,展现了更为丰富的人口密度信息。

本文引用格式

唐思怡 , 闵婕 . 基于居住区识别和改进随机森林的山地城市人口 空间化方法[J]. 地球信息科学学报, 2025 , 27(4) : 900 -914 . DOI: 10.12082/dqxxkx.2025.240692

Abstract

[Objectives] The spatial distribution of the urban population in mountainous cities varies significantly due to the topography of the area. Information on the spatial distribution of populations in mountainous cities is crucial for scientific research, regional policymaking, resource allocation, and disaster assessment and protection. [Methods] Therefore, to accurately address the population distribution in these cities, this paper proposes a spatialization method based on residential identification and an improved random forest model. This method accounts for the spatial heterogeneity of population distribution in mountainous cities. To avoid assigning populations to non-residential areas, the grid of residential areas is first identified, and this grid is used during the feature variable selection stage. Next, a dataset of feature variables that reflect the characteristics of mountain cities is constructed. The spatial heterogeneity of population distribution is considered, and the feature variable set is clustered using the Gaussian Mixture Model algorithm. The Bootstrap sampling method is then used to randomly select an equal number of feature variables from each category, merging them into a new feature variable set, which is used as the training data to construct the Random Forest Model, thereby improving the traditional random forest approach. To verify the validity of the method, this paper uses Chongqing Municipality, a mountainous city, as the experimental area. The population spatialization results for Chongqing Municipality, based on a 150m grid, are obtained. These results are compared with those from the traditional random forest model, the WorldPop dataset, and the LandScan dataset. Additionally, the importance of each characteristic variable is measured using the random forest model. [Results] The experimental results show that the overall accuracy of the proposed method is 82.9%, which is 2.7% higher than that of the traditional random forest model and 2.94% and 10.91% higher than those of the WorldPop and LandScan datasets, respectively. Across the entire experimental area, compared to the WorldPop and LandScan datasets, the MAE (Mean Absolute Error) is reduced by 212.63 and 35.11, and the RMSE (Root Mean Square Error) is reduced by 1 354.34 and 524.54, respectively. In high-density hilly areas and mountainous regions, the proposed method yields better accuracy, demonstrating the effectiveness of the method in spatializing population data in mountainous cities. [Conclusions] In addition, the simulation results exhibit more distinct population distribution heterogeneity across different population density zones and topographic areas compared to the two open population datasets, offering richer insights into population density.

1 引言

人口数据作为一种基础的地理数据,在地理相关研究中发挥着重要的作用,也常用于城市规划与开发[1]、灾害风险评估与救援[2]、公共卫生安全[3]等领域。随着全球城市化的进程不断推进,城市人口数量激增、城市所面临的资源环境压力日益增强。人口的空间分布状况能直观地反映人类活动,快速准确地获取人口空间分布信息对解决城市资源环境问题至关重要[4]。传统的人口数据通常通过行政区进行人口普查等统计手段获取,存在更新周期长、可视化和空间分析困难等问题[5]。伴随着GIS、遥感等技术快速发展,人口数据空间化逐渐成为学术界重要的研究方向之一。
人口空间化是基于一定的数学方法将行政单元的人口数据映射到地理格网上,实现信息表达载体的转换,模拟出现实中人口的地理分布[6]。目前,国内外学者就人口空间化开展了诸多研究,并取得丰硕成果。由早期的定性探讨逐渐发展为用半定量或定量的手段来探究人口的空间分布规律[7]。随着遥感技术和计算机科学的发展,人口空间化的研究逐渐深入,为提高人口空间化细粒程度和估算精度,数据源已从单一的遥感数据过渡到多源数据融合[8-9]。而后大数据时代的到来,人口空间化方法也从最初的区域插值法[7,10]过渡到回归建模法,包括多元线性回归[11]、多因素融合模型[12]、随机森林[13],深度学习[14]等。相对于区域插值,回归建模能综合考虑影响人口分布的多种复杂因素,通过模型和计算,将结果迁移到其他区域[15]。其中,随机森林算法能较好地避免数据过拟合,数据支持性强,对异常值和噪声具有较高的容忍度[16],近年来,常被用于人口空间化模拟。但是,人口分布受地理环境、经济条件等多种因素的影响,表现出非均衡性。用该算法直接进行有放回的随机抽样后得到的训练数据集会缺少代表性,导致密集区人口数被过高估计,稀疏区人口数被过低估计[17]。山地城市地形地貌结构复杂,开发多结合地区的本底条件,依山就势、顺水而建,形成多种多样的组团结构。其人口分布受自然山水条件制约和社会经济发展的驱动,在水平空间和垂直空间都表现出比平原城市更显著的差异性和复杂性。目前,对山地城市的人口空间化研究多侧重于通过多因素融合模型定量描述因子与人口分布的关系[12,18],但存在权重确定过程复杂的问题;也有通过对比来分析不同数据集模拟山地城市人口的适宜性[19],但模拟结果仍存在明显高估和明显低估的区域,并未能准确反映山地城市的人口分布。
针对上述问题,本文提出了一种基于居住区识别和改进随机森林的山地城市人口空间化方法。该方法首先利用不透水面数据和夜间灯光数据识别了人口居住区,考虑了区域差异下实际人口的分布问题。然后,以识别的居住区格网为基础,根据山地城市的地形特征和经济发展状况构建了山水自然特征和社会经济特征变量数据集。为提高模型预测精度,利用高斯混合模型(Gaussian Mixture Model, GMM)对特征变量集进行聚类,Bootstrap采样法从各类中随机抽取等量的数据,形成新的特征数据集并作为训练数据构建随机森林模型,考虑了山地城市人口分布的空间异质性和复杂性,实现了传统随机森林模型的改进。最后,为验证该方法的有效性,本文以典型山地城市重庆市为实验区,实现了重庆市150 m格网人口空间化,与传统随机森林模型、WorldPop数据集、LandScan数据集在乡镇(街道)尺度进行精度对比,并讨论了不同特征变量在随机森林模型中对人口空间化的重要性程度。

2 研究方法

为了提高模型预测精度,准确反映山地城市人口分布情况,本文提出了一种基于居住区识别和改进随机森林的山地城市人口空间化方法。该方法先识别了居住区格网并应用到特征提取阶段,避免了将人口分配到非居住区;然后,在模型构建阶段考虑到山地城市复杂的地形特征以及经济发展因素对人口分布的影响,构建了山水自然特征和社会经济特征变量数据集;相对于传统随机森林模型,该方法考虑了山地城市人口分布的空间异质性和复杂性,结合GMM聚类和Bootstrap采样法改进了原特征数据集的不平衡性,提升了模型精度(图1)。
图1 本文方法总体流程

Fig. 1 Flowchart of the proposed method

2.1 数据预处理

数据预处理主要包括投影转换与重采样、格网构建、POI(Point of Interest)分类和增强植被指数(Enhanced Vegetation Index, EVI)提取。首先将前文所述所有空间数据统一投影为WGS-1984-Albers坐标系。其次,为避免将最小居住单位全部落入同一个格网,参考相关文献[20-21],本文以实验区最小乡镇(街道)面积的10%构建格网,即格网大小设置为150 m×150 m。然后,将空间数据重采样到格网大小。另外,为方便数据处理和分析,本文从居民生产生活、社会发展、精神文明需求等视角对已爬取的13类POI进行再次分类(表1)。最后,采用最大值合成法[22]合成2020年多时相EVI图像,并重采样为150 m。
表1 POI分类及描述

Tab. 1 Classification and description of POI

分类 POI类型 描述
生产服务 公司企业、金融服务 指与生产过程紧密相关、为生产提供支持和保障的POI类型
住宅及社区服务 住宅区、餐饮、住宿服务、生活服务 指居住区POI和与居住社区配套、为社区居民日常需求提供服务的POI类型
休闲娱乐服务 体育休闲、购物、旅游景点 指满足公众空闲时间休闲和娱乐需求的POI类型
基础设施服务 公共设施、交通道路设施 指服务公众的公共基础或公共交通的设施类POI
公共事业服务 科教文化、医疗保健 指满足公众教育、医疗、文化等基本需求的公共服务类POI

2.2 居住区识别与提取

山地城市的人口分布极不均匀。随着城市化进程的加快,城市的发展与人口资源、自然环境之间的不适配问题凸现[21],住房空置现象也日益严重。为避免将人口分配到无人居住区,本文参考住房空置的估算模型[8,23-24],将居住区定义为用地类型为不透水面且夜晚可以监测到灯光的区域,并基于夜间灯光数据和不透水面数据进行了居住区识别。具体步骤如下:
(1)不透水面像元占比计算:由于数据之间存在空间分辨率不同的问题,本文先将30 m不透水面数据重采样为10 m,再与夜间灯光数据进行叠置(图2)。可以看出,500像素×500像素的夜间灯光像元可完整包含2 500个10像素×10像素的不透水面像元,由此,能尽量避免重采样步骤的信息损失。然后,计算出不透水面像元占比。公式如下:
U A R = N d N t
式中:UAR为不透水面层占夜间灯光像元的比例;Nd为一个夜间灯光像元内所包含的不透水面像元数;Nt为一个夜间灯光像元所包含的最大不透水面像元数,本文的Nt为2 500。
图2 不透水面像元占比计算流程

Fig. 2 Flow chart for calculating the pixel proportion of impervious area

(2)非居住像元灯光去除:夜间灯光数据包括居住区灯光和非居住灯光。其中,非居住区灯光包括公园、公路等会影响居住区灯光的亮度值。因此,需要去除居住区中非居住区灯光的影响。首先,本文选取了一定数量的非居住区样本像元查看其不透水面像元占比,总结发现这些样本像元的不透水面像元占比大多数低于0.2,与相关研究结果一致[8]。因此,本文将不透水面像元占比小于0.2的看作非居住区像元,其余像元看作混合像元,并以非居住区像元灯光值对混合像元进行处理,具体公式如下[25]
A L I = k = 1 N n o n - r e s i   N T L i N n o n - r e s i
N T L M A = F N T L ,   A L I                     U A R 0 . 2 N U L L                                                
F N T L ,   A L I = N T L U A R 0.2 - A L I U A R < 0.2                   N T L U A R 0.2 > A L I U A R < 0 . 2 0                                                                                                    
式中: Nnon-resi为非居住区像元个数; NTLi为第i个非居住区像元的灯光亮度值; NTLMA为去除了非居住区灯光影响之后混合像元的灯光亮度值; NTLUAR≥0.2为去除非居住区灯光影响之前混合像元的灯光亮度值; ALIUAR<0.2为非居住像元的平均灯光亮度值。
(3)对去除非居住像元影响的灯光数据和不透水面数据进行二值化处理,然后相减,得到居住区格网,最后将居住区格网重采样为150 m。

2.3 山地城市特征指标构建

2.3.1 山水自然特征构建

山地城市的地形地貌制约其人口分布格局。针对山地城市地形的复杂性,本文选定DEM、坡度和人类居住指数(Human Settlement Index, HSI)来反映山水自然环境对人口分布的影响。其中,DEM经数据预处理后直接提取,坡度由DEM数据计算并提取。
人类居住指数由夜间灯光数据和增强植被指数构建[26],表示以像元为单位的人类居住区比例,可以反映人口分布情况。夜间灯光和增强植被指数之间有互补特性,一般而言,像元中居民点所占比例越高,灯光亮度值越高,增强植被指数值越低,人类居住指数值越高。计算公式如下[27]
L n o r = L L m a x
H S I = 1 - E V I m a x + L n o r 1 - L n o r + E V I m a x + L n o r × E V I m a x
式中: Lnor为标准化后的夜间灯光数据; Lmax为夜间灯光亮度最大值; HSI为人类居住指数; EVImax为增强植被指数的年最大值。
为解决山地城市无灯光区人类居住指数高估的问题,需要对HSI进行修正。将研究区各乡镇(街道)平均高程与人口密度进行回归分析可知,高程600 m以下对人口分布的影响较小,这一结果也与相关研究一致[28]。因此,利用高程数据对高程大于600 m的乡镇(街道)进行人类居住指数修正。计算公式如下[29]
H S I n = 1 - E V I m a x + L n o r 1 - L n o r + E V I m a x + L n o r × E V I m a x × e α D E M
式中: HSIn为修正后的人类居住指数; α为e指数函数的DEM系数。

2.3.2 社会经济特征构建

社会经济发展与人口分布存在密切的相互关系。因此,本文选取灯光亮度值、路网密度、建筑面积指数(Building Area Index, BAI)和邻域格网POI特征来反映社会经济状况与人口分布的关系。其中,灯光亮度值由夜间灯光数据经数据预处理后直接提取。
(1)路网密度
路网密度与人口分布密切相关。路网密度的计算公式如下[30]
R S D i = 3 × N r i + 3 × N n e i + 2 × N p e i + N c r i + 0.4 × N t r i A
式中: RSDi为第i个格网的路网密度/(km/km2); NriNneiNpeiNcriNtri分别为第i个格网内铁路、国道、省道、县道和乡道的长度,3、3、2、1、0.4分别对应各自的换算系数; A为格网面积。
(2)建筑面积指数
建筑面积指数指某一区域建筑面积与该区域的面积之比,可以反映与人口的聚集程度。建筑面积指数计算公式如下[21]
B A I i = A i A
式中: BAIi为第i格网的建筑面积指数; Ai为第i个格网的建筑面积; A为格网面积。
(3)邻域格网POI特征提取
POI可以直观地反映城市要素间的空间分布情况,与人类活动密切相关。然而,提取POI信息时,仅考虑单个格网,会导致格网之间的空间关联被割裂[15]。因此,本文选用密度函数较为平滑且使用场景较为广泛的高斯核[31]作为核函数来刻画邻域格网POI特征,并对核密度带宽选取进行了实验讨论。

2.4 随机森林模型的构建与改进

随机森林(Random forests, RF)算法具有模型较简单、抗过度拟合、数据支持性强、有效处理非线性问题等优点。该算法通过Bootstrap方法有放回的从数据集中随机抽样选取样本,体现了该算法的随机性,但也加剧了数据集的不平衡性[17]。同时,人口的空间分布差异性极大,且山地城市的人口主要围绕区域的山水布局特点,呈现不同的组团式分布,在空间上比平原城市更具复杂性和多样性。因此,用Bootstrap方法直接采样后的训练集缺少代表性,导致模型的预测精度降低。基于此,本文在构建模型时考虑了山地城市的人口分布特征,利用GMM聚类算法和Bootstrap采样法对模型输入的特征变量数据集进行了重构,实现了随机森林算法的改进,具体包括以下3个步骤。
(1)模型构建。为减小跨尺度的误差,本文先将各特征变量提取到居住区格网,再汇总到乡镇(街道)单元。以乡镇(街道)的人口密度为因变量,11个特征变量为自变量输入样本。
(2)高斯混合模型聚类算法。采用GMM聚类算法对输入的特征变量进行聚类处理。GMM聚类是空间聚类方法的一种,它能够灵活处理各种形状的簇,适用于对具有复杂结构的重叠数据集进行聚类。具体而言,本文先用DB指数(Davies-Bouldin Index, DBI)确定最佳聚类数目[32],然后用GMM聚类算法对输入的特征变量集聚为k簇。
(3)改进随机森林模型。利用Bootstrap方法从k簇中分别随机抽取相等数目的数据,形成新的变量数据集,以此替代原始变量数据集进行采样,弥补原始变量数据集不平衡的特点。最后将新变量数据集放入随机森林模型进行训练并决策,得到格网人口密度预测值,并基于袋外估计值(Out-of-Bag, OOB)采用平均基尼系数下降法对特征变量进行重要性度量。

2.5 人口分配与精度验证

2.5.1 人口分配

由改进随机森林模型得到的格网人口预测值需要根据实际区域人口数进行总量控制,本文按照格网与区县的映射关系进行计算,公式如下:
P i = T j × W i W j
式中: ij分别代表每个格网和每个区县; Pi为第i个格网分配后的人口数; Tj为第i个格网所在的第j个区县的人口总数; Wi为第i个格网根据模型预测的人口数; Wj为第i个格网所在的第j个区县内所有格网的模型预测人口数之和。

2.5.2 精度验证

本文将经过人口分配后的格网人口数汇总到乡镇(街道)尺度,采用平均绝对值误差(Mean Absolute Error, MAE)、均方根误差(Root Mean Square Error, RMSE)和决定系数(R2)3个指标来衡量精度。其中,MAE为预测误差的绝对值,RMSE表示预测值与真实值的偏差度,R2反映预测值与真实值的拟合度[15]。具体计算公式如下:
M A E = 1 n i = 1 n P i - R i
R M S E = 1 n i = 1 n P i - R i 2
R 2 = 1 - i R i - P i 2 i R i - R - 2
式中: n为乡镇(街道)总数目; Pi为乡镇(街道)i的预测人口值; Ri为乡镇(街道)i的真实人口值; R -为所有乡镇(街道)的真实人口的平均值。

3 实验区概况与数据来源

3.1 实验区概况

重庆市位于中国的西南部(图3),在105°11′ E—110°11′ E,28°10′ N—32°13′ N之间,总面积8.24万km2,是西南地区和长江上游最大的经济中心城市。重庆市自然资源丰富,地势起伏大,地貌类型多样,素有山城之称。作为中国西部人口重要的聚居地之一,重庆市人口众多,2023年末常住人口已达到3 100多万。其人口主要集中分布在浅山丘陵的中西部地区,而位于大巴山山脉和巫山山脉的东北部地区以及武陵山脉的东南部地区的人口分布较为稀疏。作为典型的山地城市,重庆市的山地和丘陵占全市总面积的98%,各区县人口规模及密度差异极大。因此,选择重庆市作为实验区域开展人口空间化具有典型性。
图3 重庆市地理位置及土地利用图

注:该图基于自然资源部标准地图服务网站下载的审图号为GS(2019)3266号的标准地图制作,底图无修改。

Fig. 3 Study area geographic location and land use map

3.2 数据来源

本文使用的数据如表2所示,具体包括: ① NPP/VIIRS夜间灯光数据,来源于全球变化数据仓储电子杂志(中英文)上发布的中国长时间序列夜间灯光数据集[33-34],采用的是异常值处理后的2020年1—12月的NPP/VIIRS月度数据; ② 全球不透水面(Global Artificial Impervious Area, GAIA)数据,来源于中国农业大学土地科学与技术学院的城市环境监测及建模团队[35],平均总体精度高于90%; ③ 土地覆被数据(China Land Cover Ddataset, CLCD),来源于杨杰和黄昕[36],整体准确率达到了79.31%; ④ 增强植被指数数据来源于美国国家航空航天局,由MOD13Q1通过当月每天最大值合成法合成本文的250 m月数据; ⑤ 数字高程模型来源于地理空间数据云的ASTER GDEMV2; ⑥ 建筑屋顶矢量数据来源于国家青藏高原数据中心的中国90个城市的矢量化屋顶面积数据[37-38],数据总体精度为97.95%; ⑦ 道路空间分布数据来源于中国科学院资源环境科学与数据中心,采用的道路类型包括高速公路、铁路、国道、省道和县道共5类; ⑧ 高德POI数据使用Python语言网络爬取,共 3类; ⑨ 人口普查数据由重庆市各区县第七次人口普查公报收集; ⑩ 人口数据集包括2020年的WorldPop数据集和LandScan数据集。
表2 数据来源及属性

Tab. 2 Data sources and attributes

数据类型 数据来源 年份 描述
NPP/VIIRS夜间灯光 https://www.geodoi.ac.cn/doi.aspx?DOI=10.3974/geodb.2022.06.01.V1 2020 空间分辨率500 m
全球不透水面数据 https://www.x-mol.com/groups/li_xuecao/dongtaizhitu 2020 空间分辨率30 m
土地覆被数据 https://zenodo.org/records/4417810 2020 空间分辨率30 m
增强植被指数 https://ladsweb.modaps.eosdis.nasa.gov/ 2020 空间分辨率250 m
数字高程模型 地理空间数据云(https://www.gscloud.cn/) 2020 空间分辨率30 m
建筑屋顶矢量数据 国家青藏高原数据中心(https://cstr.cn/18406.11.Geogra.tpdc.271702) 2020
道路空间分布数据 中国科学院资源环境科学与数据中心(https://www.resdc.cn/) 2020
POI 高德地图 2020 13类POI,包括餐饮、旅游景点、交通道路设施、公共设施、公司企业、购物、金融服务、科教文化、生活服务、住宿服务、居民小区、体育休闲、医疗保健
第七次人口普查数据 重庆市人民政府网(https://www.cq.gov.cn/) 2020
WorldPop数据集 https://www.worldpop.org/ 2020 空间分辨率100 m
LandScan数据集 https://landscan.ornl.gov/ 2020 空间分辨率1 km

4 实验结果与分析

4.1 居住区识别

基于夜间灯光数据和不透水面数据对实验区的居住区识别结果如图4所示,其分布呈现明显的空间差异性。将居住区与高程进行叠置分析,可以发现居住区集中分布在地势平缓的浅山丘陵区,随着高程的增加,地势起伏度变大,居住区逐渐减少。其中,位于政治和经济发展中心的中、西部地区,居住区分布较为密集,且以中部中心城区的居住区分布最广、最集中;北部的居住区主要分布在地势相对平坦的山岭之间;而地形相对崎岖、山体较多,离政治经济中心较远的东北部和东南部区域的居住区分布则较为稀疏,这也与实验区重庆市人口分布现状相符。
图4 重庆市居住区识别结果

Fig. 4 Results of the identification of residential areas in Chongqing

4.2 核密度带宽验证选取实验

不同类型的POI的服务范围不同,且带宽为核密度估计的主要参数[39]。为选取最佳带宽,提高模型精度,本文通过实验探究了9种不同带宽对模型精度的影响。实验设置的带宽范围为200~5 000 m,其中200~1 000 m带宽之间的间距为200 m, 1 000~5 000 m带宽之间的间距为1 000 m。在每种带宽下,分别单独采用每一类POI构建邻域核密度作为特征变量,进入模型训练并进行精度评价。实验结果如图5所示。
图5 POI带宽选取实验结果

Fig. 5 Experimental results of POI bandwidth selection

图5可知,不同类型的POI的最佳服务范围不同,且在各自的最佳带宽内,各类POI都对模型精度有所提高。将图5(a)与其余的图进行对比可知,在每类POI的最佳带宽范围内引入该类POI的邻域核密度特征,均可以提高R2,即引入邻域核密度特征可以提高模型精度。从相对最佳带宽的选择来看,住宅及社区服务(图5(b))和休闲娱乐服务(图5(c))的相对最佳带宽较小,均为2 km,说明这2类POI的空间服务范围不大;而生产服务(图5(d))和公共事业服务(图5(e))的MAERMSE随带宽的增加而变化不大,说明这2类POI对带宽的选择对模型精度影响较小;图5(f)的基础设施服务的相对最佳带宽较大,说明这类POI服务的辐射范围较大。最终,各类POI的相对最佳带宽取值分别为:住宅及社区服务选用2 km带宽、休闲娱乐服务选用2 km带宽、生产服务选用3 km带宽、公共事业服务选用1 km带宽,基础设施服务选用5 km带宽。

4.3 人口空间化实验结果

4.3.1 模型构建与人口空间化结果

本文以实验区重庆市乡镇(街道)的人口密度为因变量,11个特征变量为自变量对模型进行训练。从数据集中抽取70%的样本作为训练集,剩余30%的样本为袋外数据进行验证。为提高模型预测精度,先将训练集的数据用GMM聚类算法进行聚类。选用DBI作为聚类效果评价指标,确定聚类数为5时,DBI的值最小,聚类效果最优。然后用Bootstrap采样法从5簇中分别随机抽取相等数目的数据形成新的训练集进入模型训练,完成改进随机森林模型的构建。最后将生成的改进随机森林模型应用到150 m的格网中,实现了重庆市150 m格网的人口空间化。
由改进随机森林模型学习及人口分配后得到2020年重庆市150 m格网空间分辨率的人口分布图(图6)。整体来看,重庆市的人口呈现以中部地区集聚,周边多核分布的空间结构。其中,人口主要集中分布在长江、嘉陵江沿岸的中部区域,以渝中区、江北区、渝北区西南部、沙坪坝区东南部和南岸区西部为中心向四周渐次减少;西部区域的人口以多中心的结构分散分布在中部区域周围;北部人口主要分布在平行岭谷区,以开州区、万州区和云阳县的人口较为集中;东北部和东南部人分布稀疏,因为其山体较多,地形崎岖且离经济发展中心的中部较远,人口较少,只有东北部的巫山县和巫溪县、东南部的黔江区和秀山县人口相对较多。
图6 2020年重庆市150 m格网空间分辨率的人口分布

Fig. 6 Population distribution of Chongqing Municipality in 2020 at 150 m grid spatial resolution

4.3.2 精度验证

由于山地城市人口空间分布与地形密切相关,且对于不同人口的区域,其人口建模特征的空间分布也存在差异,人口空间化结果也会呈现不同的情况。因此,本文基于坡度和人口密度2个指标对实验区进行二次分区。考虑到重庆市特有的山地地形,以坡度25°为阈值,大于25°划为山地,小于25°划为丘陵;在此基础上,以丘陵地区人口密度的平均值为阈值,高于平均值的划分为高密度丘陵,低于平均值的划分为低密度丘陵。将本文的改进随机森林模型结果与传统随机森林模型结果、WorldPop数据集、LandScan数据集在整个重庆市、高密度丘陵、低密度丘陵和山地分别进行对比,结果如图7所示。
图7 精度检验指标计算结果

Fig. 7 Accuracy assessment result

从整个实验区重庆市来看,本文模拟结果的MAE为944.104、RMSE为3 090.29、R2为82.9%,其中,MAERMSE均低于其余3个数据集,R2均高于其余3个数据集。与传统随机森林模型相比,本文模拟结果的R2增加了2.7%;与WorldPop数据集和LandScan数据集相比,本文模拟结果的MAE分别减少了212.63和35.11,RMSE分别降低了1 354.34和524.54,R2分别提高了2.94%和10.91%,说明改进随机森林模型提高了整体的模拟精度。在低密度丘陵区,本文的模拟精度高于WorldPop数据集和LandScan数据集,略低于传统随机森林模型。这可能是由于实验区的低密区丘陵主要为经济发展水平一般的区县乡镇(街道),人口分布稀疏,数据特征点相对较少,GMM模型难以准确地将数据划分为不同的簇,导致聚类效果不佳,最后精度略低于传统随机森林模型。此外,由不同分区的验证精度指标MAERMSE可以看出,4个数据集的人口模拟结果在低密丘陵区和山地较好,在高密度丘陵区误差相对较大。主要是因为实验区的高密度丘陵主要为中心城区和少数经济发展较好的区县县城,且中心城区的地形被四大山脉和两大水系切割,塑造出复杂且多样的人口分布格局。因此,在进行人口模拟时,误差会相对较大。但相比而言,本文的模拟精度均优于传统随机森林模型和其余2个人口数据集。
为进一步比较不同数据集在不同分区的空间化结果,本文分别选取了高密度丘陵、低密度丘陵和山地的乡镇(街道)进行空间化结果展示,如图8所示,从上到下依次为渝中区解放碑街道、合川区草街街道和奉节县鹤峰乡。整体来看,人口密度的分布趋势在4个数据集中大致一致,但本文相对于WorldPop数据集和LandScan数据集展现了更为丰富的人口密度信息,在不同密度和不同地形的区域反映出更明显的人口分布异质性,同时也减少了人口在非居住区的数量,更加符合山地城市人口的分布情况。
图8 4个数据集在不同分区区域的空间显示效果

Fig. 8 Display four datasets in the space of different partitioned areas

4.4 因子重要性排序

本文基于随机森林模型的袋外估计值,采用平均基尼系数下降法对特征变量因子的重要性进行度量。得到的值越大,说明该变量因子对随机森林回归的作用越大。各特征变量对人口空间化的重要性程度如图9所示。
图9 随机森林模型特征变量重要性结果

Fig. 9 Variable importance of random forest regression

图9可知,POI是模拟人口分布最重要的特征变量,路网密度、建筑面积指数和坡度对人口分布也具有较为重要的作用。POI与人类活动密切相关,能很好地反映城市内部的人口分布。其中,公共事业服务类和休闲娱乐类的POI最为重要。公共事业服务类POI包括医疗服务和科研教育,休闲娱乐类POI包括购物、体育休闲和旅游,这些都与城市的公共服务发展程度和精神文化建设息息相关。反映出随着经济发展到一定水平,人们从对基本物质生活的满足过渡到对优良医疗、教育资源的需求和丰富精神生活的追求,并将其作为居住地选择的重要条件。随着城市的快速扩张,城市的道路交通逐步完善,建设用地形成建成区,建筑越来越多,建筑周边设施的逐渐齐全并吸引了人口的集聚。随着迁入居民的增加,为了出行便捷路网会愈加完善,因此路网密度和建筑面积指数是反映人口分布较为重要指标。同时,山地城市的扩张也要考虑地形坡度的影响,因此坡度对人口分布也较为重要。但总的来说,与自然因素相比,社会经济因素与人口分布的相关性更高。夜间灯光数据常用于人口估计,但在本文的重要性相对不高,可能是像元的溢出效应和过饱和现象限制了其精确估计人口分布方面的作用[40],同时空间分辨率的限制也是夜间灯光数据重要性低的原因之一。

5 结论与讨论

5.1 结论

为了提高模型预测精度,准确反映山地城市人口分布情况,本文基于不透水面数据和夜间灯光数据识别了居住区,根据山地城市的地形特征和经济发展状况构建了山水自然特征和社会经济特征变量集,利用GMM聚类算法和Bootstrap采样法从数据处理的角度改进了传统随机森林模型,实现了一种基于居住区识别和改进随机森林的山地城市人口空间化方法。将本文方法应用于重庆市,实现了重庆市150 m格网的人口空间化,并与传统随机森林模型结果、WorldPop数据集、LandScan数据集进行对比,可得出以下结论:
(1)本文的居住区识别结果呈现明显的空间差异性,与实验区的人口空间分布特征相符合。由邻域POI带宽实验可知,引入邻域核密度特征提高了模型的精度。
(2)本文方法应用于整个实验区,得到的模拟结果精度达到82.9%,与传统随机森林模型模拟结果相比,精度提高了2.7%;与WorldPop数据集和LandScan数据集相比,本文方法的MAE分别减少了212.63和35.11,RMSE分别降低了1 354.34和524.54, R2分别提高了2.94%和10.91%。因此,本文方法具有较好的预测效果。
(3)与平原城市不同,山地城市的人口主要集中在地势相对平缓的丘陵地区,且围绕地域山水布局特征呈现不同的组团式分布;但在地势起伏较大的山地地区,人口分布又较为稀疏。因此,在山地城市实现准确的人口空间化比平原城市更具复杂性。本文方法应用在实验区的高密度丘陵区和山地地区的精度均高于传统随机森林模型和2个已开放的人口数据集,说明本文方法相较于常规人口空间化方法的有效性。同时,与2个开放的人口数据集相比,本文方法的结果在不同人口密度区和不同地形区表现出更加明显的人口分布异质性特征,展现了更为丰富的人口密度信息。

5.2 讨论

尽管本文基于夜间灯光数据和不透水面数据对居住区进行了提取,但是由于方法、数据精度等的限制,本文的居住区主要指用地类型为不透水面且夜晚可以监测到灯光的区域。由于夜间灯光数据的分辨率较低且城市存在职住分离的现象,可能导致城市居住区与灯光区不一定完全重合。因此,后续的研究可以考虑用高分辨率遥感影像结合多源数据识别城市功能区,将工业、商业、学校用地等与居住区做出严格划分,提高数据精度。另外,本文的改进随机森林模型的精度结果较好,但在低密度丘陵区的模拟精度还是不够理想,后续的研究可采用分区建模的思想,针对不同实验区的地形特征和人口密度进行灵活分区建模,并根据分区特点完善特征变量数据集。
利益冲突: Conflicts of Interest
所有作者声明不存在利益冲突。
All authors disclose no relevant conflicts of interest.
作者贡献: Author Contributions
唐思怡和闵婕参与实验设计;唐思怡完成实验操作;唐思怡参与论文的写作和修改。所有作者均阅读并同意最终稿件的提交。
The study was designed by TANG Siyi and MIN Jie. The experimental operation was completed by TANG Siyi. The manuscript was drafted and revised by TANG Siyi. All the authors have read the last version of paper and consented for submission.
[1]
Aubrecht C, Özceylan D, Steinnocher K, et al. Multi-level geospatial modeling of human exposure patterns and vulnerability indicators[J]. Natural Hazards, 2013, 68(1):147-163. DOI:10.1007/s11069-012-0389-9

[2]
Yao Y, Liu X P, Li X, et al. Mapping fine-scale population distributions at the building level by integrating multisource geospatial big data[J]. International Journal of Geographical Information Science, 2017, 31(6):1220-1244. DOI:10.1080/13658816.2017.1290252

[3]
Jia P, Sankoh O, Tatem A J. Mapping the environmental and socioeconomic coverage of the INDEPTH international health and demographic surveillance system network[J]. Health & Place, 2015, 36:88-96. DOI:10.1016/j.healthplace.2015.09.009

[4]
王珂靖. 统计型人口数据多尺度空间化模型研究[D]. 上海: 华东师范大学, 2015.

[Wang K J. Research on multi-scale spatialization model of statistical population data[D]. Shanghai: East China Normal University, 2015.]

[5]
杨瑞红, 董春, 张玉. 地理国情普查数据支持下的人口空间化方法[J]. 测绘科学, 2017, 42(1):76-81.

[Yang R H, Dong C, Zhang Y. Method of population spatialization under the support of geographic national conditions data[J]. Science of Surveying and Mapping, 2017, 42(1):76-81.] DOI:10.16251/j.cnki.1009-2307.2017.01.015

[6]
Martin D. Mapping population data from zone centroid locations[J]. Transactions, 1989, 14(1):90-97. DOI:10.2307/622344

[7]
范一大, 史培军, 辜智慧, 等. 行政单元数据向网格单元转化的技术方法[J]. 地理科学, 2004, 24(1):105-108.

[Fan Y D, Shi P J, Gu Z H, et al. A method of data gridding from administration cell to gridding cell[J]. Scientia Geographica Sinica, 2004, 24(1):105-108.] DOI:10.3969/j.issn.1000-0690.2004.01.018

[8]
陈佐旗. 基于多源夜间灯光遥感影像的多尺度城市空间形态结构分析[D]. 上海: 华东师范大学, 2017.

[Chen Z Q. Multi-scale urban spatial morphological structure analysis based on multi-source night lighting remote sensing images[D]. Shanghai: East China Normal University, 2017.]

[9]
Guo W, Zhang J Y, Zhao X S, et al. Combining Luojia1-01 nighttime light and points-of-interest data for fine mapping of population spatialization based on the zonal classification method[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2023, 16:1589-1600. DOI:10.1109/JSTARS.2023.3238188

[10]
吕安民, 李成名, 林宗坚, 等. 人口统计数据的空间分布化研究[J]. 武汉大学学报(信息科学版), 2002, 27(3):301-305.

[Lv A M, Li C M, Lin Z J, et al. Spatial distribution of statistical population data[J]. Geomatics and Information Science of Wuhan University, 2002, 27(3):301-305.] DOI:10.3969/j.issn.1671-8860.2002.03.014

[11]
郭雨臣, 黄金川, 林浩曦. 多源数据融合的中国人口数据空间化研究[J]. 遥感技术与应用, 2020, 35(1):219-232.

DOI

[Guo Y C, Huang J C, Lin H X. Spatialization of China's population data based on multi-source data[J]. Remote Sensing Technology and Application, 2020, 35(1):219-232.] DOI:10.11873/j.issn.1004-0323.2020.1.0219

[12]
曹伟超, 陶和平, 谭理, 等. 基于多源空间数据的山区人口分布模拟[J]. 国土资源遥感, 2012, 24(2):61-67.

[Cao W C, Tao H P, Tan L, et al. Simulation of mountain population distribution based on multi-source spatial data[J]. Remote Sensing for Natural Resources, 2012, 24(2):61-67.] DOI:10.6046/gtzyyg.2012.02.12

[13]
Wang M Q, Wang Y L, Li B Z, et al. A population spatialization model at the building scale using random forest[J]. Remote Sensing, 2022, 14(8):1811. DOI:10.3390/rs14081811

[14]
李银兴. 基于XGBoost模型和多源数据的人口空间化研究[D]. 重庆: 重庆邮电大学,2021 [ Li Y X. Research on population spatialization based on XGBoost model and multi-source data

[ D. Chongqing: Chongqing University of Posts and Telecommunications, 2021.] DOI:10.27675/d.cnki.gcydx.2021.000530 ]

[15]
吴京航, 桂志鹏, 申力, 等. 顾及格网属性分级与空间关联的人口空间化方法[J]. 武汉大学学报(信息科学版), 2022, 47(9):1364-1375.

[Wu J H, Gui Z P, Shen L, et al. Population spatialization by considering pixel-level attribute grading and spatial association[J]. Geomatics and Information Science of Wuhan University, 2022, 47(9):1364-1375.] DOI:10.13203/j.whugis20200379

[16]
谭敏, 刘凯, 柳林, 等. 基于随机森林模型的珠江三角洲30 m格网人口空间化[J]. 地理科学进展, 2017, 36(10):1304-1312.

DOI

[Tan M, Liu K, Liu L, et al. Spatialization of population in the Pearl River Delta in 30 m grids using random forest model[J]. Progress in Geography, 2017, 36(10):1304-1312.] DOI:10.18306/dlkxjz.2017.10.012

[17]
江雪梨, 熊永良, 郭红梅, 等. 改进随机森林模型在人口空间化中的应用[J]. 测绘通报, 2023(6):155-160.

DOI

[Jiang X L, Xiong Y L, Guo H M, et al. Application of improved random forest model in population spatialization[J]. Bulletin of Surveying and Mapping, 2023(6):155-160.] DOI:10.13474/j.cnki.11-2246.2023.0186

[18]
王春菊, 汤小华. 基于GIS的福建省人口统计数据空间化[J]. 地理与地理信息科学, 2004, 20(4):71-74.

[Wang C J, Tang X H. GIS-based specialization of population census data in Fujian Province[J]. Geography and Geo-information Scien-ce, 2004, 20(4):71-74.] DOI:10.3969/j.issn.1672-0504.2004.04.017

[19]
胡云锋, 赵冠华, 张千力. 基于夜间灯光与LUC数据的川渝地区人口空间化研究[J]. 地球信息科学学报, 2018, 20(1):68-78.

DOI

[Hu Y F, Zhao G H, Zhang Q L. Spatial distribution of population data based on nighttime light and LUC data in the Sichuan-Chongqing Region[J]. Journal of Geo-Information Science, 2018, 20(1):68-78.] DOI:10.12082/dqxxkx.2018.170224

[20]
颜清梅. 基于格网的人口空间分布特征分析[D]. 成都: 四川师范大学, 2013.

[Yan Q M. Analysis of spatial distribution characteristics of population based on grid[D]. Chengdu: Sichuan Normal University, 2013.]

[21]
韩用顺, 王文娟, 张东水, 等. 一种基于分区和识别真实居住区的人口空间化方法——以雅砻江流域为例[J]. 山地学报, 2022, 40(2):303-316.

[Han Y S, Wang W J, Zhang D S, et al. A population spatialization method based on regional differentiations in population and actual housing vacancy—Taking the yalong river basin of China as an example[J]. Mountain Research, 2022, 40(2):303-316.] DOI:10.16089/j.cnki.1008-2786.000673

[22]
Yang X C, Yue W Z, Gao D W. Spatial improvement of human population distribution based on multi-sensor remote-sensing data: An input for exposure assessment[J]. International Journal of Remote Sensing, 2013, 34(15):5569-5583. DOI:10.5555/2487495.2487514

[23]
Letu H, Hara M, Yagi H, et al. Estimating energy consumption from night-time DMPS/OLS imagery after correcting for saturation effects[J]. International Journal of Remote Sensing, 2010, 31(16):4443-4458. DOI:10.1080/01431160903277464

[24]
王彤. 基于珞珈一号提取住房空置率的研究[D]. 武汉: 武汉大学, 2020.

[Wang T. Study on extraction of housing vacancy rate based on Luojia No. 1[D]. Wuhan: Wuhan University, 2020.] DOI:10.27379/d.cnki.gwhdu.2020. 000557

[25]
董磊磊, 潘竟虎, 冯娅娅, 等. 基于夜间灯光的中国房屋空置的空间分异格局[J]. 经济地理, 2017, 37(9):62-69,176.

[Dong L L, Pan J H, Feng Y Y, et al. Spatial difference pattern of house vacancy in China from nighttime light view[J]. Economic Geography, 2017, 37(9):62-69,176.] DOI:10.15957/j.cnki.jjdl.2017.09.008

[26]
徐甜雨, 赵学胜, 陈芳馨, 等. 基于多元分区建模指标优化的“一带一路”人口空间化研究[J]. 国土资源遥感, 2021, 33(2):153-161.

[Xu T Y, Zhao X S, Chen F X, et al. Research on the spatialization of population on the Belt and Road based on optimization of multi- divisional modeling indexes[J]. Remote Sensing for Land and Resources, 2017, 33(2):153-161.] DOI:10.6046/gtzyyg.2020193

[27]
Lu D S, Tian H Q, Zhou G M, et al. Regional mapping of human settlements in southeastern China with multisensor remotely sensed data[J]. Remote Sensing of Environment, 2008, 112(9):3668-3679. DOI:10.1016/j.rse.2008.05.009

[28]
祝汉收. 基于GIS和多源数据的山地城市人口空间化模拟[D]. 重庆: 重庆师范大学, 2018.

[Zhu H S. Spatial simulation of population in mountain cities based on GIS and multi-source data[D]. Chongqing: Chongqing Normal University, 2018.]

[29]
杨续超, 高大伟, 丁明军, 等. 基于多源遥感数据及DEM的人口统计数据空间化——以浙江省为例[J]. 长江流域资源与环境, 2013, 22(6):729-734.

[Yang X C, Gao D W, Ding M J, et al. Modeling population density using multi-sensor remote sensing data and Dem: A case study of Zhejiang province[J]. Resources and Environment in the Yangtze Basin, 2013, 22(6):729-734.]

[30]
柏中强, 王卷乐, 杨雅萍, 等. 基于乡镇尺度的中国25省区人口分布特征及影响因素[J]. 地理学报, 2015, 70(8):1229-1242.

DOI

[Bai Z Q, Wang J L, Yang Y P, et al. Characterizing spatial patterns of population distribution at township level across the 25 provinces in China[J]. Acta Geographica Sinica, 2015, 70(8):1229-1242.] DOI:10.11821/dlxb201508004

[31]
肖锐, 郭宇翔, 李星华. 基于主题模型的城市地块活动语义动态提取[J]. 遥感技术与应用, 2023, 38(3):649-661.

DOI

[Xiao R, Guo Y X, Li X H. Dynamic semantic extraction of urban blocks activity based on topic model[J]. Remote Sensing Technology and Application, 2023, 38(3):649-661.] DOI:10.11873/j.issn.1004-0323.2023.3.0649

[32]
刘妍, 孙延宁, 陈传法, 等. 城区数字高程模型修正方法:顾及空间异质性的可解释随机森林模型[J]. 地球信息科学学报, 2024, 26(4):978-988.

DOI

[Liu Y, Sun Y N, Chen C F, et al. Improving urban digital elevation models based on iinterpretable random forest method considering spatial heterogeneity[J]. Journal of Geo-information Science, 2024, 26(4):978-988.] DOI:10.12082/dqxxkx.2024.230590

[33]
仲晓雅, 闫庆武, 李桂娥. 中国长时序夜间光数据集(2000-2020)

[ J/DB/OL. 北京:全球变化数据仓储电子杂志(中英文), 2022.]

Zhong X Y, Yan Q W, Li G E. Time series nighttime light dataset of China (2000-2020)

[ J/DB/OL. Digital Journal of Global Change Data Repository, 2022.] DOI:10.3974/geodb.2022.06.01.V1 ]

[34]
仲晓雅, 闫庆武, 李桂娥. 中国长时间序列夜间灯光数据集的研发(2000—2020)[J]. 全球变化数据学报(中英文),2022,6(3):416-424.

[Zhong X Y, Yan Q W, Li G E. Development of time series of nighttime light dataset of China (2000-2020)[J]. Journal of Global Change Data & Discovery, 2022, 6(3):416-424,593-601.]

[35]
Gong P, Li X C, Wang J, et al. Annual maps of global artificial impervious area (GAIA) between 1985 and 2018[J]. Remote Sensing of Environment, 2020,236:111510. DOI:10.1016/j.rse.2019.111510

[36]
Yang J, Huang X. The 30 m annual land cover dataset and its dynamics in China from 1990 to 2019[J]. Earth System Science Data, 2021, 13(8):3907-3925. DOI:10.5194/essd-13-3907-2021

[37]
南师大智慧城市感知与模拟实验室. 中国90座城市建筑物屋顶矢量数据集(2020)[DB/OL].国家青藏高原科学数据中心,2021. https://cstr.cn/18406.11.Geogra.tpdc.271702.

Smart City Sensing and Simulation Laboratory, Nanjing Normal University. Vectorized rooftop area data for 90 cities in China (2020)[DB/OL]. National Tibetan Plateau / Third Pole Environment Data Center, 2021. https://cstr.cn/18406.11.Geogra.tpdc.271702.] DOI:10.11888/Geogra.tpdc.271702

[38]
Zhang Z X, Qian Z, Zhong T, et al. Vectorized rooftop area data for 90 cities in China[J]. Scientific Data, 2022, 9(1):66. DOI:10.1038/s41597-022-01168-x

PMID

[39]
禹文豪, 艾廷华, 杨敏, 等. 利用核密度与空间自相关进行城市设施兴趣点分布热点探测[J]. 武汉大学学报(信息科学版), 2016, 41(2):221-227.

[Yu W H, Ai T H, Yang M, et al. Detecting “hot spots” of facility POIs based on kernel density estimation and spatial autocorrelation technique[J]. Geomatics and Information Science of Wuhan University, 2016, 41(2):221-227.] DOI:10.13203/j.whugis20140092

[40]
高雪梅, 杨续超, 陈柏儒, 等. 基于随机森林模型的环渤海地区人口空间化模拟[J]. 地球信息科学学报, 2022, 24(6):1150-1162.

DOI

[Gao X M, Yang X C, Chen B R, et al. Spatialization of population in the Bohai rim region using random forest model[J]. Journal of Geo-information Science, 2022, 24(6):1150-1162.] DOI:10.12082/dqxxkx.2022.210524

文章导航

/