

  • 胡云锋 , 1, * ,
  • 赵冠华 1, 2 ,
  • 张千力 1, 2
  • 1. 中国科学院地理科学与资源研究所,北京 100101
  • 2. 中国科学院大学,北京 100049


收稿日期: 2017-04-30

  要求修回日期: 2017-08-25

  网络出版日期: 2018-01-20



Spatial Distribution of Population Data Based on Nighttime Light and LUC Data in the Sichuan-Chongqing Region

  • HU Yunfeng , 1, * ,
  • ZHAO Guanhua 1, 2 ,
  • Zhang QianLi 1, 2
  • 1. Institute of Geographic Sciences and Natural Resources, Chinese Academy of Sciences, Beijing 100101, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author: HU Yunfeng, E-mail:

Received date: 2017-04-30

  Request revised date: 2017-08-25

  Online published: 2018-01-20

Supported by

National Key Research and Development Program of China, No.2016YFB0501502, 2016YFC0503701;Key Project of High Resolution Earth Observation System, No.00-Y30B14-9001-14/16.


高精度的人口空间分布数据是开展小尺度人口活动变化规律研究的关键数据。夜间遥感影像对于反映人类社会活动具有独特的能力,因而被广泛的应用于社会经济领域的空间数据挖掘。本研究以DMSP/OLS夜间灯光数据、NPP/VIIRS夜间灯光数据、常住人口统计数据、土地利用数据为数据源,在县级尺度上建立逐步回归模型,构建川渝地区人口空间分布数据;并随机抽取研究区内500个乡镇,以常住人口统计数据为真实数据,对人口空间化结果进行精度检验。结果表明:① 2种夜间灯光数据与人口均有较高的相关性,相关系数均在0.76以上,NPP/VIIRS夜间灯光数据与人口的相关性要高于DMSP/OLS,且受拟合模型的影响不大。② 与人口相关性较高的土地利用类型有多种,耕地、林地对人口空间分布也有影响,在建模时不应只考虑建成区。③ 在2种夜间灯光数据分别与土地利用与土地覆被数据(Land Use/ Land Cover, LUC)结合时,使用DMSP/OLS夜间灯光数据和NPP/VIIRS夜间灯光数据得到的逐步回归模型的复相关系数R2分别为0.796、0.817,模型拟合率较高,而基于NPP/VIIRS夜间灯光数据得到的人口空间化结果分辨率(500 m)相比DMSP/OLS提高了一倍(1 km),中心城区与周边城区人口密度变化更加自然,更符合实际人口分布情况。④ 与LUC数据结合时,使用NPP/VIIRS夜间灯光数据得到的人口空间化结果精度要高于DMSP/OLS夜间灯光数据,表明NPP/VIIRS夜间灯光数据相比DMSP/OLS更适用于人口数据空间化研究。


胡云锋 , 赵冠华 , 张千力 . 基于夜间灯光与LUC数据的川渝地区人口空间化研究[J]. 地球信息科学学报, 2018 , 20(1) : 68 -78 . DOI: 10.12082/dqxxkx.2018.170224


Spatial distribution data of the population with high-precision is the important data to study the law of the variation of population activity at small-scale. Remote sensing images of nighttime light have the unique ability of reflecting human social activities. Thus, they were widely used in spatial data mining of the socio-economic field. In this study, DMSP/OLS nighttime light data, NPP/VIIRS nighttime light data, resident population data and land use data were used as data sources. Then, we used these data to build the stepwise regression at county scale. The spatial distribution data of population in Sichuan and Chongqing area were established based on the stepwise regression model. Finally, we took the resident demographic data of the randomly selected 500 townships as the practical data to assess the accuracy of spatial distribution data of the population. The analysis shows that: (1) both of the two nighttime light data have high correlation with the population. The correlation coefficients are both above 0.76. The correlation of NPP / VIIRS night light data and population is higher than DMSP / OLS. The fitting model does not change the results. (2) There are many types of land use that are highly relevant to population. Farmland and woodland can also affect the spatial distribution of population. Thus, built area should not be considered as the only type of land use for building the population distribution model. (3) When the two nighttime lights were combined with LUC( Land Use/ Land Cover), the complex correlation coefficient (R2) of the stepwise regression model using DMSP / OLS nighttime light data and NPP / VIIRS night light data is 0.796 and 0.817 respectively, and the model fitting rate is higher. Compared with the results based on DMSP/OLS (1 km), the spatial resolution of population based on NPP/VIIRS nighttime light data increases to 500 m. The change of population density is more natural from the central city to the surrounding urban area, and the population distribution is more real. (4) When combined with LUC data, the results obtained with NPP / VIIRS nighttime light data were more accurate than DMSP / OLS nighttime light data, indicating that NPP / VIIRS nighttime light data is more suitable for the research of spatial distribution of population than DMSP / OLS.

1 引言

人口空间分布信息可以由人口数据空间化或人口密度格网化技术获取得到。近年来,人口空间化研究发展较快,其中夜间灯光作为综合指示因子来进行社会经济数据空间化模拟得到越来越多的应用[8,9,10,11]。早期研究大多使用美国国防气象卫星(Defense Meteorological Satellite Program, DMSP)搭载的业务线扫描系统传感器(Operational Line Scan System, OLS)获取的夜间灯光数据,由于该数据空间分辨率较低(约为1 km),因此在大、中尺度(国家、省、州)上的相关研究较为适用[12,13,14],小尺度的估算适用性较低。2011年10月,美国新一代极轨运行环境卫星系统预备项目卫星(National Polar-orbiting Operational Environmental Satellite System Preparatory Project,NPP)发射成功,NPP携带的可见光红外线成像辐射仪(Visible Infrared Imaging Radiometer Suite,VIIRS)可得到接收22个波段的影像数据,其中白天/夜间波段(Day/Night Band, DNB)能够识别微弱灯光源。相较于DMSP/OLS夜间灯光数据,VIIRS传感器采用星上定标,可以得到更高精度的数据[15],新型夜间灯光数据空间分辨率的提高(500 m)也为小尺度级别的数据空间化研究提供了技术支持。目前有关NPP/VIIIRS夜间灯光的研究主要集中在模拟GDP[8,16-17]、电力消耗估算[18]、油气平台识别[19]等经济领域,而在人口空间化方面应用的较少。高义等[20]对比分析了2种夜间灯光数据在我国沿海地区人口空间化结果,研究表明,NPP/VIIRS夜间灯光数据反演人口的精度要高于DMSP/OLS夜间灯光数据,但是得到的结果精度并不是很高。因此,如何有效地借助NPP/VIIRS夜间灯光数据得到更高精度的人口空间化结果还需进一步研究。

2 研究区概况与数据源

2.1 研究区概况

川渝地区地处青藏高原与长江中下游平原的过渡地带,位于东经97°22′~110°12′、北纬26°02′~34°18′之间,总面积为56.74万km2,平均海拔2500 m左右,地势西高东低,区域地貌主要有高原、盆地、山地、丘陵、平原等。受地貌和季风环流的影响,川渝地区气候主要表现为西部的高原大陆性气候和东部的亚热带湿润季风气候。2013年,川渝地区常住人口为1.11亿,辖区包括18个地级市、3个自治州,共计218个县级行政区。川渝地区的地理位置及行政区划如图1所示。
Fig. 1 Location and elevation distribution of Sichuan-Chongqing region

图1 川渝地区位置及其高程分布图


2.2 数据源

(1)DMSP/OLS数据:本研究使用的DMSP/OLS夜间灯光数据来自于美国国家地球物理数据中心(NGDC)发布的2013年夜间非辐射定标平均稳态数据(stable_light.avg_vis data)(图2(a)),该数据经过了去云处理,并且消除了背景噪声及短时光数据(火山气体、森林火灾、极光等)。像元灰度值介于0-63之间。数据下载地址https://www.ngdc.noaa.gov/eog/dmsp/downloadV4composites.html。
Fig. 2 DMSP/OLS and NPP/VIIRS nighttime light data of Sichuan-Chongqing region in 2013

图2 2013年川渝地区DMSP/OLS夜间灯光和NPP/VIIRS夜间灯光修正数据

(2)NPP/VIIRS数据:美国新一代极轨运行卫星系统预备项目(National Polar-orbiting Operational Environmental Satellite System Preparatory Project, NPP)卫星携带的VIIRS传感器共有22个波段,其中白天/夜间波段(Day/Night Band, DNB)星下地面分辨率为375 m,灰度区间(16 bit)大于DMSP/OLS(6 bit),可以识别微弱的灯光源,对地表照明分布的刻画更为准确(图2(b))。但该数据没有经过处理,还存在森林火灾、极光、火山等短时光数据和山顶积雪、干涸床等背景噪声。数据下载地址https://www.ngdc.noaa.gov/eog/viirs/download_monthly.html。
Fig. 3 LUC and population density at county level of Sichuan-Chongqing region

图 3 川渝地区土地利用类型图与县级人口密度分布图

Tab. 1 Data sources

表 1 数据来源表

数据类型 年份 数据来源 比例尺/分辨率
行政区划边界 2012 国家基础地理信息中心 1:25万
人口统计资料 2013 统计年鉴以各地区统计公报 县、乡镇
LUC 2013 中科院资源环境科学数据中心 1:10万/1 km
DMSP/OLS 2013 美国国家地球物理数据中心 1 km(采样后)
NPP/VIIRS 2013 美国国家地球物理数据中心 0.5 km(采样后)

2.3 数据预处理

首先对原始夜间灯光影像进行剪切、投影、重采样处理,采用双线性插值法分别将DMSP/OLS和NPP/VIIRS夜间灯光数据的空间分辨率重采样为 1 km和500 m,2种夜间灯光数据均转换为Albers等积圆锥投影(大地基准为WGS-84,中央经线为105°E,双标准纬线分别为25°N和47°N,起始原点为0°)。
A_R = 1 n i = 1 12 R i (1)
式中:A_R为夜间灯光反射率平均值;Rii月夜间灯光反射率。由于6月的夜间灯光数据缺失非常严重,因此不参与计算,其中: i≠6,n=11。

3 分析方法

3.1 人口空间化方法

在SPSS软件下,以各区县常住人口统计数据作为因变量,各区县内不同土地利用类型下的夜间灯光亮元数、暗元数及灯光总亮度为自变量(影像中亮度值为0的像元作为暗元,亮度不为0的像元作为亮元),进行逐步回归分析,得到模型自变量及回归系数,最后根据建立的模型对人口进行空间化。考虑到分别提取掩膜进行计算过程较为复杂,为方便计算,本研究采用格网计算的方法,对LUC数据和夜间灯光数据进行叠加,具体方法为:首先分别建立川渝地区500 m和1000 m的格网矢量数据,以此来统计各格网上的对应的土地利用类型、亮元数、暗元数、灯光总亮度;然后与县级行政区划边界进行叠加分析,得到各县各土地利用类型上的灯光亮元数、暗元数、灯光总亮度。人口空间化流程如图4所示。
Fig. 4 Spatial distribution of population based on nighttime light data and LUC

图 4 基于夜间灯光数据和土地利用数据的人口空间化流程图

3.2 逐步回归建模

P i = P 0 + j = 1 M a j × N U ij + b j × N L ij + c j × L E ij (2)
P ijk = P 0 N i + j = 1 M a j × N U ijk + b j × N L ijk + c j × L E ijk (3)
P ijk ' = P ijk × P i ¯ P i (4)
式中: P ijk ' 为最终栅格人口; P i ¯ 为第i县统计人口; P i 为第i县所有像元值之和。

3.3 精度评价

对于模拟得到的人口需要进行精度评价和误差分析,本研究选取了相关系数(R)、均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean relative Error,MRE)来进行评价。具体公式如下:
R = i = 1 n P i - P ̅ P E i - PE ¯ i = 1 n P i - P ̅ 2 i = 1 n P E i - PE ¯ 2 (5)
RMSE = i = 1 n P E i - P i 2 n (6)
MAE = 1 n i = 1 n P E i - P i (7)
MRE = 1 n i = 1 n P E i - P i P i (8)
R E i = P E i - P i P i (9)
式中:Pi代表i行政单元内统计人口数;PEi表示i行政单元内人口的估计数;n代表行政单元的个数; P ̅ 代表统计人口数平均值; PE ¯ 表示人口的估计数平均值。

4 结果与讨论

4.1 人口与夜间灯光的相关性

Fig. 5 Correlation between population density at county level and mean nighttime light data

图5 川渝地区区县常住人口密度与平均夜间灯光指数相关关系 ||||注:黑线是线性回归模型;红线是多项式回归模型;蓝线是幂函数模型

4.2 人口与LUC的相关性

图6可以看出,川渝地区主要土地利用类型 为林地(20.1万km2)、草地(17.2万km2)和耕地 (15.6万km2)3类,其分布与地形密切相关。由图3可以看出,耕地主要分布在中东部的盆地地区,草地主要分布在西北高海拔地区,林地主要分布在西南和东部中低海拔地区。城乡、工矿、建设用地面积为0.71万km2,主要集中在成都市和重庆市及其周围区县。进一步,通过统计川渝地区各土地利用类型面积,并在SPSS中分别计算各区县常住人口与各土地利用类型覆被面积的相关性,分析结果表明土地利用分布与人类活动关系密切。由表2可以看出,各类型土地利用数据与人口的相关性强弱依次为耕地、城乡工矿居民用地、草地、林地、未利用土地、水域,相关系数分别为0.62、0.57、-0.45、-0.44、-0.3、0.08。其中,耕地和城乡工矿居民用地与人口呈现显著(P=0.01)正相关关系,林地、草地、未利用土地与人口呈现显著(P=0.01)负相关关系。在使用土地利用数据参与人口空间化研究过程中,考虑人口分布的实际情况,水域和未利用土地类型不参与人口空间化计算。
Fig. 6 Land use area of Sichuan-Chongqing region in 2013(104km2

图 6 2013年川渝地区土地利用面积图(104km2

Tab. 2 Correlation analysis between land use and population in Sichuan-Chongqing region

表 2 川渝地区各土地利用与人口的相关性分析

耕地 林地 草地 水域 城乡、工矿、居民用地 未利用土地
相关性(R) 0.62** -0.44** -0.45** 0.08 0.57** -0.30**


4.3 人口空间化结果

4.3.1 模型参数
Tab. 3 Regression coefficients of the model

表3 模型回归系数表

系数 Sig. 系数 Sig.
耕地 NU 392.399 0.000 95.736 0.000
NL 442.249 0.000 163.979 0.000
林地 LE 29.270 0.024 85.934 0.028
城镇及建设用地 LE 106.833 0.000 71.042 0.000
常数 Con 39 848.898 0.050 45 683.36 0.017
R2 0.796 0.817
4.3.2 川渝地区人口空间化结果
图7(a)、(b)显示了基于2种夜间灯光数据和LUC数据的川渝地区人口空间化结果。为方便直观地对比2种空间化结果,本文对500 m人口空间化结果的单位进行了换算,将基于NPP/VIIRS 500 m分辨率影像所得人口空间密度估算成果的单位转化为人/km2,可以看出,得到的人口空间分布情况大致相同,人口主要集中在居民地和城镇建设用地上,各区县的人口密度高值区主要集中在县城所在地,其中重庆市和成都市人口最集中,密度最高。川渝地区的常住人口分布是以重庆市和成都市为2个中心分布,重庆市是自治区,经济发展较快,成都市是四川省的省会城市,城市化进程明显,人口大量聚集,人口密度极高。
Fig. 7 Spatial distribution of population in Sichuan-Chongqing region in 2013

图 7 2013年川渝地区人口空间化结果

对比重庆市人口空间化结果(图7(c)、(e))可以发现,2种模拟结果大致空间分布格局相同,即人口密度呈现中心城区高,四周低的分布情况。人口密度最高的区域为渝中区,1 km2人口超过25 000人,与实际情况(28 515.2人/km2)相符。对于成都市(图7(d)、(f))来说,可以看出高密度人口区域主要集中在金牛、青羊、武侯、成华、锦江5个区,周围人口密度较低,同样的基于NPP/VIIRS夜间灯光数据得到的人口空间化结果分辨率比基于DMSP/OLS夜间灯光数据得到的结果高,能反映出同一区县内人口分布的变化情况。同时,中心城区与周边城区人口密度变化更加自然,更符合实际人口分布情况。

4.4 精度检验

表4表示的是基于2种夜间灯光数据和LUC数据模拟得到的空间分布人口的3种误差指标:MAE、MRE、RMSE。由表4可以看出,基于NPP/VIIRS夜间灯光数据得到的人口空间误差在3种误差上都要小于DMSP/OLS夜间灯光数据,具体表现为:① 在MAE方面,基于DMSP/OLS夜间灯光数据得到的误差为10 851,而基于NPP/VIIRS夜间灯光数据得到的误差为10 450;② 在MRE方面,基于DMSP/OLS夜间灯光数据得到的误差为46.3%,而基于NPP/VIIRS夜间灯光数据得到的误差为44.62%;③ 在RMSE方面,基于DMSP/OLS夜间灯光数据得到的误差为637 518,而基于NPP/VIIRS夜间灯光数据得到的误差为587 170。对比发现,基于NPP/VIIRS夜间灯光数据得到的人口空间化结果精度要高于DMSP/OLS夜间灯光数据。
Tab. 4 Statistics of spatial distribution of population errors

表 4 人口空间化误差统计表

MAE 10 851 10 450
MRE/% 46.3 44.62
RMSE 637 518 587 170
Tab. 5 Statistics of relative error classification

表 5 相对误差分级统计表

夜间灯光 严重低估 一般低估 较准确估计 一般高估 严重高估
(-100%,-50%] (-50%,-20%] (-20%,20%] (20%,50%] (50%,100%]
DMSP/OLS 35 129 166 94 76
NPP/VIIRS 28 116 188 83 85
Fig. 8 Statistics of relative error ratios

图 8 相对误差占比统计图


5 结论

(2)各类型土地利用数据与人口的相关性强弱依次为耕地、城乡工矿居民用地、草地、林地、未利用土地、水域,相关系数分别为0.62、0.57、-0.45、-0.44、 -0.3、0.08。建模结果表明除了建设用地,其他类型用地(耕地、林地)对人口分布会有影响,在对人口进行建模时不应该只考虑建成区。
(3)在2种夜间灯光数据分别与LUC结合时,使用DMSP/OLS夜间灯光数据和NPP/VIIRS夜间灯光数据得到的逐步回归模型的复相关系数R2分别为0.796、0.817,且进入模型的变量的回归系数都经过了正数检验和显著性检验。模型拟合率较高,基于DMSP/OLS得到的人口空间化结果分辨率为1 km,基于NPP/VIIRS夜间灯光数据得到的人口空间化结果分辨率为500 m,相比DMSP/OLS夜间灯光数据提高了一倍。
(4)在夜间灯光数据与LUC数据结合得到的川渝地区人口空间化结果中,使用NPP/VIIRS夜间灯光数据得到的结果精度要高于DMSP/OLS夜间灯光数据,具体表现为:① 在MAE方面,基于NPP/VIIRS夜间灯光数据得到的结果误差为10 450,基于DMSP/OLS夜间灯光数据得到的结果误差为10 851;② 在MRE方面,基于NPP/VIIRS夜间灯光数据得到的结果误差为44.62%,基于DMSP/OLS夜间灯光数据得到的结果误差为46.3%;③ 在RMSE方面,基于NPP/VIIRS夜间灯光数据得到的结果误差为587 170,基于DMSP/OLS夜间灯光数据得到的结果误差为637 518;④ 在相对误差方面,基于NPP/VIIRS夜间灯光数据得到的结果较准确估计的乡镇个数(188个)要多于DMSP/OLS(166个),在相对误差较大的等级中,除严重高估的乡镇个数(85个)略高于DMSP/OLS(76个),其余误差较大的乡镇中,NPP/VIIRS夜间灯光数据都要少于DMSP/OLS。

