地球信息科学理论与方法

集成土地利用数据和夜间灯光数据优化人口空间化模型

  • 陈晴 , 1, 2 ,
  • 侯西勇 , 1, *
展开
  • 1. 中国科学院烟台海岸带研究所,烟台 264003 2. 中国科学院大学,北京 100049
*通讯作者:侯西勇(1975-),男,山东泰安人,研究员,博士生导师,主要从事海岸带土地利用变化监测、海岸线变化监测、海岸带脆弱性评价、海岸带综合管理等研究。E-mail:

作者简介:陈 晴(1989-),女,湖南长沙人,硕士生,主要从事海岸带地理信息系统研究。E-mail:

收稿日期: 2015-01-09

  要求修回日期: 2015-03-14

  网络出版日期: 2015-11-10

基金资助

中国科学院战略性先导科技专项“应对气候变化的碳收支认证及相关问题”(XDA05130703)

国家自然科学基金项目(31461143032)

中国科学院烟台海岸带研究所“一三五”项目(Y254021031)

An Improved Population Spatialization Model by Combining Land Use Data and DMSP/OLS Data

  • CHEN Qing , 1, 2 ,
  • HOU Xiyong , 1, *
Expand
  • 1. Yantai Institute of Coastal Zone Research, Chinese Academy of Sciences, Yantai, 264003, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author: HOU Xiyong, E-mail:

Received date: 2015-01-09

  Request revised date: 2015-03-14

  Online published: 2015-11-10

Copyright

《地球信息科学学报》编辑部 所有

摘要

人口统计数据空间化是解决统计数据与自然要素数据融合分析的有效途径。随着RS和GIS技术的发展,人口统计数据空间化方法推陈出新,其中,土地利用数据、夜间灯光数据是人口空间化研究中普遍利用的数据源,但各有优、缺点:土地利用数据中的城镇用地、农村居民点能准确表示人口分布的空间范围,却不能反映其内部的人口密度差异特征;夜间灯光数据的强度信息能体现人口分布的疏密程度,但其像元溢出问题显著夸大人口分布范围,像元过饱和现象也影响着人口数据空间化结果的精度。本研究以中国大陆沿海区域为例,尝试集成土地利用数据和夜间灯光数据优化人口空间化方法,设计了基于精度阈值和动态样本的渐进回归与分区建模的方法,获得了中国沿海2000、2005、2010年1 km分辨率人口空间化数据。结果表明,优化模型显著提高了研究区整体的精度,尤其适用于人口空间结构内部差异较为显著的区域。

本文引用格式

陈晴 , 侯西勇 . 集成土地利用数据和夜间灯光数据优化人口空间化模型[J]. 地球信息科学学报, 2015 , 17(11) : 1370 -1377 . DOI: 10.3724/SP.J.1047.2015.01370

Abstract

Population spatialization could effectively remove the obstacles for data fusion between census data and geographic data. With the rapid development of RS and GIS techniques, the research methods of population spatialization have been updated greatly, and among them, both land use data and DMSP/OLS data are the most widely used data sources for population spatialization. However, both of them have advantages and disadvantages, in specific, the patches of cities and rural settlements in land use data indicate the area of population distribution accurately, but land use data lacks detailed features of population distribution, especially for that existing in the same type of land use; DMSP/OLS data manifests the spatial variations of population density, however it often overestimates the distribution area of population due to its 'overglow' effect, and at the same time, the problem of pixel saturation in DMSP/OLS data also impairs the fitness of this data. In this paper, land use data and DMSP/OLS data are combined together to distinguish the night light data value of populated area, and the methodologies of population spatialization are improved by introducing the precision threshold and dynamic regionalization method. Census data in 2000, 2005 and 2010 for China’s coastal area are taken as examples to test the outcomes of the improved methodologies for population spatialization. The results show that: (1) due to the prominent spatial heterogeneity of population distribution in China’s coastal area, unitary model based on DMSP/OLS data for the whole study area exhibits very poor precision, therefore, land use maps are utilized to distinguish the populated and non-populated area based on DMSP/OLS images. Compared with the threshold method, land use maps more effectively removes the ‘overglow’ effect of DMSP/OLS data; (2) precision threshold of the regression model is adopted to dynamically divide the whole study area into several sub-regions, in specific, only counties that meet the testing accuracy defined by the precision threshold could retain in the regression model, otherwise, they should be regrouped into a new set of samples and be fitted by a new regression model. It is named as ‘dynamic regionalization’ method in this paper. The results show that this method further improves the overall accuracies of population spatialization data.

1 引言

人口问题是当今影响可持续发展的重大问题,将人口数据与资源、环境、生态、社会等方面的数据综合集成,已成为国内外多学科研究的基本模式和发展趋势[1]。我国人口数据一般是以基层行政区为基本单元,通过普查、抽样统计等方式,经逐级汇总形成二维表格,具有权威、系统、规范等特点[2],但这种统计方式数据空间分辨能力低,在实际应用中存在不足。人口数据空间化是将以行政区域为单元的人口统计数据按照一定的原则,采用某种技术手段合理地分配到统计单元内部一定尺寸的规则格网上的过程,旨在将人口数据与自然生态数据耦合使用,满足多种空间分析、统计和建模的需求[3]。应用较为普遍的空间化方法有空间插值模型、土地利用/覆被影响模型、多源数据融合模型及遥感反演等[4]。其中,空间插值模型难以考虑地理环境因素对人口分布的影响,仅适用于小范围[5];土地利用/覆被影响模型着重探究人口分布与不同用地类型的关系,对同种用地内部的空间异质性考虑不足[6];多源数据融合模型综合土地利用、高程、交通网络等多种环境因子,分析各个因子影响人口分布的权重,建立空间化的统计模型,但面临各因子之间存在关联、因子权重难以判定的挑战[7-9];遥感反演法主要是提取遥感影像中与人口分布有关的信息,进而建立反演模型模拟人口的空间分布[10],较成熟的方法是利用夜间灯光数据实现人口数据的空间化[11-12],但夜间灯光数据存在像元过饱和、像元溢出现象,对其应用有不利的影响[13-15]。鉴于上述各种空间化方法的优劣,集成2种或多种空间化方法建立更精确的人口空间化模型,已成为当前研究的重要趋势之一[16-18]
中国的人口空间化研究大多基于全国或地区尺度[11, 19-20],针对沿海区域的研究相对较少。沿海是人口、城市、经济最密集,人流、物流、资金流、信息流最活跃的地带,同时又是生态环境脆弱带(ECOTONE)。海陆气的相互耦合作用、全球气候变化及人类活动的影响,导致沿海区域生态环境的脆弱化,使之成为地球表层多种自然灾害频发的地带[21]。因此,获取空间分辨率更高的沿海人口分布数据,不仅是灾害风险管理的基础,也是提升和促进海岸带综合管理能力的重要前提[22]。鉴于中国沿海人口空间分布差异显著、不同空间化方法均存在一定不足,本文旨在通过集成土地利用数据和夜间灯光数据,改进人口空间化建模方法,建立中国大陆沿海区域更加准确的1 km栅格人口空间分布数据。

2 研究区背景与数据源

(1)中国海岸线北起鸭绿江口,南抵北仑河口,海岸带跨14个省、市、区。本文选取中国大陆沿海地级市辖区为研究区,某些地级市虽不靠海,但辖区离海域很近,也纳入研究区范围(图1),因此,共包括62个地级市和直辖市的市区、101个县级市和138个县,合计301个统计单元。该区域平均海拔低于500 m,处于中国地势的第三级阶梯,总面积为48.37万km2,占全国国土面积的5%。该区域人口增长迅速,由2000年的2.72亿增长到2010年的3.18亿,净增加4856万,增长率为16.85%;占全国人口总数的比例由21.01%上升至23.20%。沿海区域人口分布及变化的空间差异显著,大量人口集中在京津冀都市圈、长江三角洲和珠江三角洲地区[23],且集中的趋势在不断加剧。
(2)研究数据主要包括2000、2005和2010年的人口数据、土地利用与夜间灯光数据等。
① 2000、2005、2010年中国大陆沿海地级市范围人口信息,分别来源于“2000年人口普查分县资料”、“2005年中国全国分县市人口统计资料”,以及“2010年人口普查分县资料”。
② 2000、2005、2010年中国沿海土地利用矢量数据(1:10万),由Landsat TM/ETM+影像解译得到最小图斑覆盖4~8个像元,分类精度达95%[24],分类系统包含8个一级类型、24个二级类型。
③ 2000、2005、2010年夜间灯光数据,来源于美国国家地理数据中心(http://ngdc.noaa. gov/eog/dmsp/downloadV4composites.html),选用2010年发布的第4版DMSP-OLS夜间稳定灯光值数据,已经滤除闪电、天然气燃烧、火光和渔船等偶然灯光。数据值域是0-63,0为黑暗背景区域,大于0的区域为灯光区域。
Fig. 1 Location of China’s coastal area

图1 研究区位置与范围

3 优化人口空间化方法

3.1 基于土地利用数据提取人口聚居区的夜间灯光指数

基于夜间灯光数据建立人口空间化模型,通常是确定某个阈值来提取夜间灯光数据中的人口聚居区。但是,对于较大范围的空间区域(如本文的中国大陆沿海区域),由于区域内部的空间差异性,统一的阈值难以确定,也并不合理。土地利用的空间格局能客观反映人口的空间分布与活动特征[25],绝大部分人口聚居在一定类型的用地区域。因此,基于中国沿海土地利用数据,提取城镇用地和农村居民点类型作为人口聚居区,用其分割夜间灯光指数数据,可避免阈值法的不确定性,保证人口聚居区的准确性。具体过程为:建立覆盖研究区的1 km矢量格网,将土地利用矢量数据与其叠加,统计每一格网单元中城镇用地及农村居民点的分布面积,得到1 km格网的城镇用地(Au)和农村居民点(Ar)2类土地利用类型的面积分布数据,计算二者之和(Au+Ar),得到能表征人口空间分布范围的1 km格网人口聚居区栅格数据;进而,依据式(1)提取人口聚居区的夜间灯光指数。
L ' nig h t = L nig h t ( A u + A r > 0 ) 0 ( A u + A r = 0 ) (1)
式中, L ' nig h t 表示修订后的人口聚居区夜间灯光指数;Lnight表示修订前的夜间灯光指数。

3.2 基于修订的夜间灯光数据在县域统计单元回归建模

大量研究表明,人口数量与夜间灯光指数具有较好的相关性[15, 17, 26]。本研究利用SPSS软件分析沿海区域各县级行政单元人口聚居区的夜间灯光指数值与统计人口的相关性分析表明,一次、二次线性函数及幂函数能较好地体现它们的相关性,但3种建模方法在人口密度较高或较低的区域模拟效果均欠佳。试验表明,通过动态分区,对人口密度较高或较低的区域单独分析人口与灯光数据的关系,线性模型效果更佳。所以,本研究采用线性函数建立空间化模型(式2)。
po p c = k × L ' nig h t + b (2)
式中, popc是建模区域县级行政单元的人口数;k是待定的回归系数; L ' nig h t 是对应的县级行政单元内人口聚居区的灯光指数值之和;b为常数项,考虑到k值非负,而且沿海区域存在无人口分布的聚居区,如空心村[27]、鬼城,因此,回归过程中将b设为0(空心村或鬼城的灯光指数为0,将b设为0,则无论k为多少,模拟的人口总为0,与现实相符)。

3.3 基于精度阈值和动态样本的渐进回归和分区建模

基于县级行政单元的数据样本,计算出回归系数k,将k应用于1 km分辨率人口聚居区的夜间灯光数据(式3),得到1 km分辨率的人口空间分布数据。
po p 1 km = k × L ' nig h t (3)
式中, pop1 km表示1 km格网的人口分布模拟数据; L ' nig h t 表示人口聚居区的夜间灯光指数。
中国大陆沿海区域人口密度差异较大,例如,2010年长江三角洲、珠江三角洲人口密度均高于1000人/km2,而辽宁沿海、北部湾区域人口密度则低于500人/km2。试验表明,这种差异性显著影响线性回归模型的精度:在人口密集的区域,人口密度被低估,而人口稀疏的区域,人口密度则被高估[28-29]。因此,本研究设计了基于精度阈值和动态样本的渐进回归和分区建模方法,以提高区域整体的精度:针对初始模拟结果,筛选县域尺度相对误差(式(4))的绝对值较小的县域(阈值设定为|δ|<20%)保留初始模拟结果;而剩余误差较大(|δ|≥20%)的县域数量,如超出总样本的10%(本文中约为30),则将这些县域组成新样本再次进行回归分析,得到新的方程,按照同样的阈值进行判断,可实现更进一步的分区;经过多次反复,将获得一组方程,能保证90%以上的县域满足|δ|<20%,而剩余不足10%的县域则保留最后一次回归所得的模型,如此实现了县域层面整个研究区的动态分区建模;将1 km分辨率的夜间灯光数据代入这些分区模型,计算得到1 km尺度人口空间化栅格数据。
δ = po p mo - po p sta po p sta × 100 % (4)
式中, popmo表示某县模拟的空间化人口数据;popsta表示某县统计的人口数据。
上述方法的技术路线如图2所示。
Fig. 2 Flowchart of population spatialization

图2 人口空间化技术路线图

4 人口空间化模拟结果及分析

4.1 人口空间化模型

2000、2005、2010年沿海区域县级单元统计人口及夜间灯光数据建立的初次回归方程的确定性系数均大于0.8,回归模型较为可靠。但是,随着县级单元之间人口规模差异的增大,确定性系数逐渐减小。根据初次建模结果县级单元模拟人口数的相对误差(δ),将研究区分成2类区域:保留区域 (-20%<δ<20%)、需重组样本再次建模区域(δ≥20%或δ≤-20%),后者区分δ≥20%或δ≤-20%分别重新回归建模,随着建模次数的增加,回归方程的确定性系数总体不断提高,趋近于1,表明回归方程拟合精度越来越高(表1)。
Tab. 1 Linear models and R2 for population spatialization

表1 人口空间化线性回归模型及确定性系数

年份 建模区域 确定性系数(R2) 回归系数(k) 模型精度及动态分区情况
│δ│< 20% δ ≤-20% δ ≥20%
2000 所有县级单元 0.906 97.753 保留结果 A1 C1
A1 0.920 119.871 保留结果 A2 不存在
A2 0.914 210.124 保留结果 A3 不存在
A3 0.916 341.578 保留结果 A4 不存在
A4 0.932 480.864 保留结果 A5 不存在
A5 0.934 675.961 保留结果 样本少,保留结果 样本少,保留结果
C1 0.975 69.462 保留结果 不存在 C2
C2 0.983 53.194 保留结果 不存在 样本少,保留结果
2005 所有县级单元 0.847 85.079 保留结果 A1 C1
A1 0.916 120.028 保留结果 A11 A12
A11 0.910 543.291 保留结果 A13 不存在
A12 0.953 343.717 保留结果 不存在 不存在
A13 0.928 771.784 保留结果 A14 不存在
A14 0.967 1112.758 保留结果 样本少,保留结果 不存在
C1 0.941 61.178 保留结果 不存在 C2
C2 0.975 42.487 保留结果 不存在 样本少,保留结果
2010 所有县级单元 0.829 75.130 保留结果 A1 C1
A1 0.954 107.403 保留结果 A2 不存在
A2 0.968 145.739 保留结果 A3 不存在
A3 0.939 195.424 保留结果 A4 不存在
A4 0.943 265.406 保留结果 样本少,保留结果 不存在
C1 0.917 50.343 保留结果 不存在 C2
C2 0.973 37.562 保留结果 不存在 C3
C3 0.990 33.162 保留结果 不存在 样本少,保留结果
中国大陆沿海区域2000、2005、2010年人口空间化最终结果如图3所示。总体而言,10 a间人口分布的总体格局稳定少变:人口密度较低的区域包括辽宁省的丹东市、盘锦市、葫芦岛市,浙江-福建内陆一侧,粤西及广西沿海区域;人口密度较高的区域包括上海市及紧邻的苏南、浙北地区,浙南的台州市和温州市靠海的区域,闽东南的福州-厦门沿海一带,粤东的潮州市至汕尾市大部分区域,粤中临海城市等。但是,随着经济的快速增长,资源、环境等条件更好的区域对人口产生了较大吸引力,带动了自身及周边地区人口的增长,使得人口密集的区域逐渐蔓延(图4),这种区域尺度较为细微的人口分布变化特征是基于行政区划的“面板”人口统计资料难以体现的。
Fig. 3 Population spatialization map in China’s coastal area

图3 中国大陆沿海人口空间化分布图

Fig. 4 Comparison of population spatialization maps for Yangtze River Delta in 2000, 2005 and 2010

图4 2000、2005、2010年长江三角洲人口空间分布对比图

4.2 精度分析

按照动态样本分区建模,90%以上的县级单元模拟人口的|δ|应低于20%。统计表明(表2),2000、2005、2010年模拟人口的|δ|小于20%的县级单元的数量比例分别高达94%、92%和93%;并且|δ|的标准差较小,表明其分布较集中,模拟的整体精度较高。
Tab. 2 Statistics for interval distribution of |δ|

表2 模拟人口的|δ|分布区间统计表

年份 不同|δ|分布区间对应的县级行政单元(个数) |δ|的
标准差
0-0.1 0.1-0.2 0.2-0.4 > 0.4
2000 160 122 11 8 0.17
2005 165 111 16 9 0.15
2010 156 125 11 9 0.17
另外,对比初次建模及最终结果的模拟误差(图5),可显示出动态样本分区建模在精度改善方面的效果:初次建模的相对误差总体偏大且较为离散,而通过动态样本分区和渐进回归则显著提高了模拟的精度。
Fig. 5 Scatter plots of relative errors of modeled population in the research area

图5 模拟人口相对误差的散点图

5 结论

本研究针对中国大陆沿海区域,集成土地利用数据和夜间灯光数据,采取精度阈值和动态样本控制的渐进回归与分区建模方法,显著提高了人口空间化模型的整体精度,获得了中国大陆沿海2000、2005和2010年高质量的1 km栅格人口空间分布数据。研究表明:
(1) 夜间灯光数据能反映居民点、交通道路、产业结构等多种信息,是进行人口数据空间化建模的理想数据源之一。但是,夜间灯光数据具有像元溢出的特点,多数学者采取先设定阈值的方法,以便提取人口分布的空间范围,即人口聚居区,进而选择聚居区的夜间灯光数据,与人口统计数据做相关分析,缓和像元溢出对空间化模型带来的影响,并最终建立人口空间化模型[18]。本研究则直接利用高精度的土地利用数据提取城镇用地、农村居民点2类用地作为人口分布的聚居区,可更有效地解决像元溢出带来的影响,排除了非人口聚居区的夜间灯光指数值对模型的误差。
(2) 夜间灯光数据的像元过饱和特征显著影响人口密度较高区域的建模精度,例如,不同地区夜间灯光数据的最大值相差无几,都对应当地人口最密集的区域,但不同地区之间相比,人口密度的最大值相差悬殊,夜间灯光数据并不能反映这种实际差异;此外,中国大陆沿海区域人口分布的空间异质性极为显著,包括南北差异、海陆梯度及城乡差异等,单次建模的结果存在大量被显著高估或低估的区域,尤其是人口密度处于“两极”的县域,误差非常大,即便进一步基于县域单元总人口进行栅格数据像元尺度的线性调整,也不能进一步改善人口空间展布的特征。因此,本研究依据精度阈值确定动态样本和分区建模,将前次模拟误差较大的县域重组样本再次建模,实质是对人口密度格局差别较大的空间区域进行分区和单独建模,将人口密度特征相近的区域划分在一起,成为研究区的子区域,各个子区域采用同一个空间化模型,但不同的子区域空间化模型不同。这种建模方法的过程相对简单,并且很好地解决了上述空间异质性的问题。但在农村区域,尤其是山区,夜间灯光暗淡,本文的动态分区建模方法能在一定程度上缓解灯光不足带来的模拟误差,但是夜间灯光数据本身难以较好地反映山区人口的分布,这将对模拟精度有一定的影响。

The authors have declared that no competing interests exist.

[1]
林丽洁,林广发,颜小霞,等.人口统计数据空间化模型综述[J].亚热带资源与环境学报,2010,5(4):10-16.人口统计数据空间化是人口信息 与其他资源环境、社会经济等信息进行空间集成的基础.本研究对国内外人口统计数据空间化研究进行总结,归纳了水热条件、地形地貌、土地利用、交通廊道、夜 间灯光等不同建模参考因素对人口空间分布的影响,并分析比较了10个主要的人口统计数据空间化模型,进而对当前人口统计数据空间化研究中存在的问题做了总 结,并讨论未来的研究方向.综述认为人口统计数据空间化的研究将向数据获取多源化、建模因素综合化、模拟格网精细化、模型应用实用化等方向发展;目前需要 改进的问题包括:1)统一的人口数据统计标准;2)人口结构特性相关的空间化,特别是流动人口的空间分布特征识别;3)城市街区尺度的空间化方法研 究;4)多源数据与人口动态信息综合中的时相匹配;5)统一的空间化指标量化方法;6)模型参数优化与精度验证方法完善.

DOI

[2]
胡云锋,王倩倩,刘越,等.国家尺度社会经济数据格网化原理和方法[J].地球信息科学学报,2011,13(5):573-578.空间信息获取和处理技术,可将传统关系型社会经济数据转变为空间化的矢量或者格网数据。首先,分析了传统关系型社会经济数据库的不足,并对社会经济数据格网化理论研究及格网数据库建设的历史做了回顾;在明确社会经济数据格网化基本概念的基础上,提出了社会经济数据格网化的3个基本要求,即时间可比、空间一致和逻辑自洽;同时提出了一个包括24个关键指标的国家尺度社会经济格网数据库的指标体系,认为社会经济格网数据库生产过程的主要步骤为逻辑检查、空间匹配、代码匹配、空间离散和检查校验;研究对国家尺度社会经济指标的空间离散过程和离散模型、不同层级社会经济数据的整合和离散策略进行了重点分析。研究最后就社会经济数据格网化过程中存在的主要问题进行了总结。

DOI

[3]
闫庆武,卞正富.基于GIS的社会统计数据空间化处理方法[J].云南地理环境研究,2007,19(2):92-97.社会统计数据的空间化是当前地理科学和社会科学共同研究的热点问题之一,根据社会统计数据的特点可以将其分为和值(extensive)变量型统计数据和均值(intensive)变量型统计数据两种类型。分析了这两类社会统计数据在区域拆分与合并时的特点,并尝试将网格单元面积权重内插(GCA帅法引入社会统计数据的空间化的工作中,提出了确定网格单元大小的原则和采用图像平滑技术改进空间化结果的方法。以徐州市人均GDP数据(均值变量型统计数据)空间化为研究实例,采用网格单元面积权重内插法实现了徐州市人均GDP数据的空间化,而且运用图像平滑技术得到了比较满意的结果。

DOI

[4]
李飞,张树文,杨久春,等.社会经济数据空间化研究进展[J].地理与地理信息科学,2014,30(4):102-107.由于传统的社会经济数据在地学研究和使用中存在着数据结构不一致、空间单元不匹配和数据在空间单元内均一化等问题,因而需要对社会经济数据进行空间化,使 其满足科学研究的需求.国内外社会经济数据空间化的研究主要集中在人口数据空间化和GDP数据空间化两方面,而其他社会经济数据空间化的研究尚不多见.经 过数十年的发展,国内学者提出了至少10余种社会经济数据空间化模型.该文按照其思想及方法的不同将其归为空间插值法、土地利用/土地覆被影响模型、多源 数据融合法及遥感反演法四类,分别对其做了详细介绍,并评述了各种方法的优缺点;指出了今后对社会经济数据空间化结果应用的两个方向:用于分析社会经济数 据对生态交错带时空变化的影响和根据社会经济数据空间化的结果进行土地利用历史重建.

DOI

[5]
丁文秀,赵伟,左德霖,等.基于土地利用分类模型和重力模型耦合的人口分布模拟——以武汉市人口数据为例[J].大地测量与地球动力学,2011,31(增刊):127-131.将土地分类模型和重力模型耦合形成新模型,并以武汉市人口数据为例,用耦合后的新模型模生成武汉市人口网格数据.经数据验证表明,耦合后的新模型在计算精度方面有了较大的提高.

DOI

[6]
易玲,熊利亚,杨小唤.基于GIS技术的GDP空间化处理方法[J].甘肃科学学报,2006,18(2):54-58.利用基于LANDSAT TM信息获取的1∶10万比例尺的土地利用/覆盖数据,建立与统计型GDP数据的多元相关关系模型,计算各种土地利用类型中的GDP系数,在G IS支持下计算出西部12省区1 km2格网GDP空间分布数据.

DOI

[7]
刘梦鑫,邬群勇,鲁毅敏.加权人口密度连续分布模拟模型[J].地球信息科学学报,2014,16(2):199-206.人口分布是人文科学的重要研究对象。如何在数据不足的情况下获得较为符合实际的人口分布数据是业界的一大难题。为了解决这个问题,本文依照人口分布的规律,以人口统计数据、高程、海岸线、城市中心、河流和行政区划为影响因子,通过距离计算、重分类、加权计算等方法,建立了加权人口密度连续分布模拟模型,并进行了改进。基于2011年的福建省县级人口统计数据,本文在ArcGIS平台上模拟了该省的人口密度空间分布,模拟结果表明:各县人口总数误差与平均人口误差在40%以下的百分比分别为89%与84%,突出了福建省在城市中心、沿海、沿江,以及平原地区的人口聚集规律;各个县级行政区域内的数据集中,相对独立;县与县之间的区分边界数据又相互联系,变化连续,符合人口分布的实际情况。该模型相比于其他的人口模型易于理解,结构简单,可应用于各省的人口密度分布模拟,能有效地解决人口数据不足的问题。

DOI

[8]
杨妮,吴良林,郑士科.基于GIS的县域人口统计数据空间化方法[J].地理空间信息,2013,11(5):74-77.以GIS技术和SPSS软件为工具,根据巴马瑶族自治县人口统计数据,分析了该县各乡镇平均 人口密度与地形指数、土地利用、主要道路和河流水系等因素的相关关系。通过分析各影响因子对人口分布的影响权重,运用多源数据融合技术进行了人口统计数据 的空间化。结果显示,通过数据融合产生的人口密度与巴马县各乡镇的实际人口密度的相关性大于0.9,最终生成的栅格人口密度数据不但与巴马县统计型人口数 据保持一致,还反映了各乡镇内部人口分布的空间变化。

DOI

[9]
Yang X H, Huang Y H, Dong P L, et al.An updating system for the gridded population database of China based on remote sensing, GIS and spatial database technologies[J]. Sensors (Basel), 2009,9(2):1128-1140.sensors

DOI PMID

[10]
Azar D, Graesser J, Engstrom R, et al.Spatial refinement of census population distribution using remotely sensed estimates of impervious surfaces in Haiti[J]. International Journal of Remote Sensing, 2010,31(21):5635-5655.Previous research on the relationship between impervious surfaces and population has focused on limited areas. This paper considers the relationship for an entire country. Multiple spatial resolution optical imagery was integrated with census data to refine the spatial distribution of population in Haiti. A classification and regression tree (CART) methodology was used to create a percent impervious-area layer based on ten high-resolution training chips and a Landsat Enhanced Thematic Mapper (ETM+) mosaic. This estimate then became an input for a dasymetric mapping approach, where population was distributed proportionately to impervious areas with input from ancillary data sources. Haiti's section boundaries (third administrative level) provided the mapping base because a strong relationship between imperviousness and population was observed at this administrative level. The accuracy of the technique was tested for a set of 110 municipalities in Haiti, making use of recent census data. The potential usefulness of imagery-based population estimates for areas where census data do not exist was also tested by dividing Haiti into northern and southern portions and using one to predict the other. 漏 2010 Taylor & Francis.

DOI

[11]
卓莉,陈晋,史培军,等.基于夜间灯光数据的中国人口密度模拟[J].地理学报,2005,60(2):266-276.lt;p>人口密度网格化比人口密度行政单元化更接近人口的实际分布,而且是实现人口数据与其他社会经济统计数据、资源数据、环境数据复合,提高人口、资源、环境综合管理能力的重要途径之一。选用专门针对亚洲地区开发的DMSP/OLS非辐射定标夜间灯光平均强度遥感数据模拟了中国的人口密度:基于灯光强度信息模拟了灯光区内部的人口密度,基于人口&mdash;距离衰减规律和电场叠加理论模拟了灯光区外部的人口密度,是应用DMSP/OLS夜间灯光数据模拟人口密度研究的拓展和深入,研究结果与其他研究基本一致,但所需数据量较少,更适合于大尺度人口密度的快速估算,为决策提供参考依据。结果表明,DMSP/OLS夜间灯光强度数据具有实现人口以及其他社会经济数据空间网格化的巨大潜力。</p>

[12]
梁友嘉,徐中民.基于夜间灯光辐射数据的张掖市甘州区GDP空间分布建模[J].冰川冻土,2013,35(1):249-254.lt;p>尽管近年来统计数据的生成技术有了很大提高, 但可用的详细GDP空间分布数据始终难以得到满足. 以夜间灯光辐射数据、 官方统计数据和已有空间化人口分布数据构建了一种GDP空间化建模方法, 得到张掖市甘州区2000年的GDP空间分布. 首先, 分析基于乡镇单元的GDP与对应的夜间灯光辐射数据DN值之间的关系, 得到GDP模拟模型; 然后结合人口空间分布数据和三次产业的比例, 得到基于500 m&times;500 m栅格的GDP空间分布图. 各乡镇的GDP平均值为372&times;10<sup>4</sup>元, 标准差为34&times;10<sup>4</sup>元.</p>

DOI

[13]
陈晴,侯西勇,吴莉.基于土地利用数据和夜间灯光数据的人口空间化模型对比分析——以黄河三角洲高效生态经济区为例[J].人文地理,2014,29(5):94-100.人口统计数据空间化是解决统计 数据与自然要素数据融合分析的有效途径。随着RS和GIS技术的发展,人口空间化方法推陈出新,但不同的方法各有优缺点,方法选择和精度保证是两个重要的 问题。本文以黄河三角洲高效生态经济区2010年县(市、区)单元人口统计信息为案例,分别基于土地利用数据和夜间灯光数据建立1km栅格的人口空间化模 型,再分别以县(市、区)和乡(镇、街道办)为验证单元,比较两种方法模拟人口分布的优缺点。结果表明,基于土地利用数据的人口空间化模型整体优于基于夜 间灯光数据的人口空间化模型,且前者更适合于模拟人口总数居中的县(市、区),后者在人口密度梯度较大的城镇边缘有更好的模拟效果,在人口较少的地区二者 的模拟效果均不太理想。本研究能够为获取高精度的区域人口空间化模型提供参考。

[14]
Zeng C Q, Zhou Y, Wang S X, et al.Population spatialization in China based on night-time imagery and land use data[J]. International Journal of Remote Sensing, 2011,32(24):9599-9620.ABSTRACT

DOI

[15]
Townsend A C, Bruce D A.The use of night-time lights satellite imagery as a measure of Australia's regional electricity consumption and population distribution[J]. International Journal of Remote Sensing, 2010,31(16):4459-4480.in size is included.

DOI

[16]
张建辰,王艳慧.基于土地利用类型的村级人口空间分布模拟——以湖北鹤峰县为例[J]. 地球信息科学学报,2014,16(3):435-442.lt;p>在人口分布及其相关研究中,常常会遇到小尺度人口数据部分缺失的问题。本文以湖北省鹤峰县为例,在分析土地利用与人口分布关系的基础上,从全局与局部、线性回归与非线性回归考虑,基于土地利用类型,分别利用地理加权回归(GWR)方法、格网方法、BP神经网络方法对缺失数据的行政村人口数据进行模拟,并进行了多角度精度对比验证。研究结果表明:(1)各种土地利用类型中,耕地、林地、城镇村及工矿用地、交通用地是影响研究区村级人口分布的主要因素;(2)30个调查村中,3种方法模拟的人口总数误差小于3%,通过每个村的模拟值与实际值相比,BP神经网络方法能更好地模拟研究区村级人口的分布,格网方法次之,GWR方法最差;(3)研究区各村人口分布呈现较高的空间正相关性,各乡镇的人口密度在空间上并不独立,而是呈现紧密的集聚特征。</p>

DOI

[17]
梁友嘉,徐中民.基于LUCC和夜间灯光辐射数据的张掖市甘州区人口空间分布建模[J]. 冰川冻土,2012,34(4):999-1006.尽管近年来统计数据的生成技术有了很大提高, 但可用的详细人口数据始终难以得到满足.在一些自然-人文要素耦合的建模研究中, 如生态经济集成建模、 环境和健康分析等都需要基于区域尺度的栅格人口分布建模方法.随着GIS和RS技术的发展, 上述建模方法已有较大进步.利用GIS技术, 基于夜间灯光辐射数据和LUCC在象元栅格水平上构建张掖市甘州区人口空间分布. 首先对DMSP夜间灯光辐射数据进行重采样, 通过普通克里金插值获得灯光数据; 然后与LUCC叠加分析, 利用回归分析的方法获取研究区土地利用、 灯光辐射指标和人口统计数据之间的定量关系, 完成空间化.并在乡镇尺度上进行模型检验, 模型总体的调整<i>R</i><sup>2</sup>为0.88, 标准误差为400, 为下一步开展时空变化分析提供支持.

[18]
曹丽琴,李平湘,张良培.基于DMSP/OLS夜间灯光数据的城市人口估算——以湖北省各县市为例[J].遥感信息,2009 (1):83-87.城市人口数据是了解城市发展的重要园素,对研究城市环境等方面也有重要意义.随着GIS和遥感技术的发展,利用大面积、多时相的遥感数据研究城市人口的技术也日渐成熟.本文借助遥感数据和GIS手段分析2000年湖北省各县市DMSP/OLS卫星的夜间灯光数据亮度值与各县市城镇人口之间的关系,建立相应的模型模拟湖北省2002年76个县市城区人口,其结果预测吻合度为98.94%,平均相对误差为10.95%,说明利用夜间灯光数据对城镇人口做短期的预测可以达到很好的效果.

[19]
凡宸,秦建桥,高洋,等.基于GIS数据的县域人口密度空间降尺度模拟——以广东省惠东县为例[J].中国人口·资源与环境,2014,24(3):26-230.人口调查统计以行政区划为基本单元,数据精度不能满足栅格尺度上的空间结构分析,也难以与生态环境综合研究中的自然地理数据相匹配,而人口数据降尺度空间模拟是解决这一问题的有效途径。本文基于统计学方法和GIS技术,对惠东县乡镇人口数据与空间因子进行相关性分析,并筛选出建设用地指数、高程、到居民点距离等因子用于回归分析,分别采用一元和两种多元回归方法建立人口密度数据空间化模型,最终在GIS平台中实现人口密度的降尺度模拟,获取200m×200m栅格尺度的人口密度数据。一元回归分析中,建设用地指数因子的模拟结果最优,R2为0.734,可作为快速、粗略模拟惠东县人口密度的模型;多元回归分析中,逐步和向后回归模型的R2分别达到0.775和0.886,模拟结果均较为理想。通过对模型的分析可知:①多元模型明显优于一元模型;②向后回归模型优于逐步回归模型。研究结果表明此人口密度模拟方法具有较强的操作性,可为县域尺度人口密度空间化的应用研究提供借鉴。

[20]
叶靖,杨小唤,江东.人口数据空间化的格网尺度效应分析[J].地球信息科学学报,2010,12(1):1-8.分布式、异构科学数据的整合集成与&quot;一站式&quot;共享服务是科学数据共享的关键和难点。首先,提出&quot;创建地球系统科学数据共享联盟,共建、共享&quot;的分散数据资源整合理念和按&quot;总中心&mdash;分中心&mdash;数据资源点&quot;三个层次的整合架构,然后,在组织模式上保障分布式数据资源的有效整合。即通过&quot;元数据集中管理,数据体分散存储&quot;的策略,从技术上保障分布式数据资源的快速整合。针对地球系统科学不同学科数据资源的特性,设计了地球系统科学数据核心元数据标准及扩展方案,利用MVC(元数据标准模型&mdash;显示视图&mdash;操作函数)模式实现多标准地学元数据的统一管理和自适应显示。最终,研究面向SOA的分布式地球系统科学数据共享平台,通过&quot;一个总中心,认证中心和若干个分中心&quot;形成物理上分布、逻辑上统一的分布式服务网络,从而为用户提供&quot;一站式&quot;的数据共享服务。

[21]
朱晓东,李杨帆,桂峰.我国海岸带灾害成因分析及减灾对策[J].自然灾害学报,2001,10(4):26-29.近年来海岸带灾害越来越成为制 约海岸带──我国最重要的经济带社会、经济和环境可持续发展的重要因素.本文在全球变化和人类活动影响的背景下,分析探讨了我国海岸带灾害的基本成因,并 提出了相应的概念性减灾对策框架.海岸带主态环境的脆弱性,全球变化(相对海平面变化、气候导常)和人类活动是导致我国海岸带灾害的3个主要方面.据此. 认为减灾的关键在于合理规范人类行为,保护和改善本已十分脆弱的海岸带生态环境;使人与自然界和谐相处;对于全球变化诱发的灾害,则力求基于科学认识与预 测,在海岸带开发中合理规划建设,做到未雨绸缪.实现海岸带社会经济可持续发展.

DOI

[22]
高义,王辉,王培涛,等.基于人口普查与多源夜间灯光数据的海岸带人口空间化分析[J].资源科学,2013,35(12):2517-2523.我国海岸带区域是台风、风暴潮、地震海啸和海岸侵蚀等海洋灾害的重灾区,精细空间分辨率的人口数据,能够有效服务海岸带灾害风险管理.本文基于我国第六次 人口普查资料、OLS/DMSP和NPP/VIIRS DNB两种夜间灯光数据及Landsat卫星遥感影像,综合利用遥感与地理信息系统理论与技术,进行了我国海岸带人口空间化方法与应用研究.利用建筑物与 裸地增强指数法(EBBI)基于Landsat卫星遥感影像提取了我国沿海区县建成区数据,作为人口分布的空间控制因素,以普查人口数与夜间灯光数据回归 函数关系为依据,对人口进行空间化处理.反演得到了我国海岸带区县1km×1km和0.5km×0.5km两个空间尺度的人口格网数据.并利用福建省沿海 乡镇人口数据对人口空间化结果进行了精度评价.研究结果表明NPP/VIIRS DNB夜间灯光数据适用于人口空间化研究,且其反演精度整体优于基于DMSP/OLS传统夜间灯光数据反演的人口格网模型.通过本文实践,可以发现NPP /VIIRS DNB夜间灯光数据具有实现人口和社会经济数据空间化的巨大潜力.

[23]
牛海燕. 中国沿海台风灾害风险评估研究[D].上海:华东师范大学,2012.

[24]
Di X H, Hou X Y, Wang Y D, et al. Spatial-temporal characteristics of land use intensity of coastal zone in China during 2000-2010[J]. Chinese Geographical Science, doi:10.1007/s11769-014-0707-0.Based on remote sensing and GIS techniques, land use maps in 2000, 2005 and 2010 in China’s coastal zone were produced, and structural raster data of land use were further generated to calculate land use intensity comprehensive index (LUICI) for analyzing land use spatial-temporal characteristics at 1 km scale. Results show that: 1) from the perspective of spatial patterns of landforms at a macro scale, there is a significant difference in land use intensity between the north and the south of China’s coastal zone. Hotspots of changes mainly concentrated in metropolitan areas, estuaries and coastal wetlands; 2) elevation is an important factor that controlling land use spatial patterns at local scale. Land use intensity is much higher within areas below the elevation of 400 m and it decreased significantly as the elevation increasing; 3) there is a significant land-ocean gradient for land use intensity, which is low in island and near-shore areas, but high in the regions that 4–30 km far away the coastline because of much intensive human activities; however, in recent decades land use intensity had been promoted signi

DOI

[25]
江东,杨小唤,王乃斌,等.基于RS、GIS的人口空间分布研究[J].地理科学进展,2002,17(5):734-738.人口的空间分布问题涉及人口学、经济学、地理学等多个学科,统计型人口数据的空间化是"数字地球"的重要研究内容.阐述了人口地域分布的基本理论,回顾了 人口空间分布的研究进展,结合研究实践,提出了在遥感、GIS技术支持下,统计型人口数据空间化的研究思路和技术流程,并对该方法的特点和应用前景做了展 望.

DOI

[26]
Small C, Elvidge C D.Night on Earth: Mapping decadal changes of anthropogenic night light in Asia[J]. International Journal of Applied Earth Observation and Geoinformation, 2013,22: 40-52.The defense meteorological satellite program (DMSP) operational linescan system (OLS) sensors have imaged emitted light from Earth's surface since the 1970s. Temporal overlap in the missions of 5 OLS sensors allows for intercalibration of the annual composites over the past 19 years (Elvidge et al., 2009). The resulting image time series captures a spatiotemporal signature of the growth and evolution of lighted human settlements and development. We use empirical orthogonal function (EOF) analysis and the temporal feature space to characterize and quantify patterns of temporal change in stable night light brightness and spatial extent since 1992. Temporal EOF analysis provides a statistical basis for representing spatially abundant temporal patterns in the image time series as uncorrelated vectors of brightness as a function of time from 1992 to 2009. The variance partition of the eigenvalue spectrum combined with temporal structure of the EOF5 and spatial structure of the PCs provides a basis for distinguishing between deterministic multi-year trends and stochastic year-to-year variance. The low order EOF5 and principal components (PC) space together discriminate both earlier (1990s) and later (2000s) increases and decreases in brightness. Inverse transformation of these low order dimensions reduces stochastic variance sufficiently so that tri-temporal composites depict potentially deterministic decadal trends. The most pronounced changes occur in Asia. At critical brightness threshold we find an 18% increase in the number of spatially distinct lights and an 80% increase in lighted area in southern and eastern Asia between 1992 and 2009. During this time both China and India experienced a similar to 20% increase in number of lights and a similar to 270% increase in lighted area - although the timing of the increase is later in China than in India. Throughout Asia a variety of different patterns of brightness increase are apparent in tri-temporal brightness composites - as well as some conspicuous areas of apparently decreasing background luminance and, in many places, intermittent light suggesting development of infrastructure rather than persistently lighted development. Vicarious validation using higher resolution Landsat imagery verifies multiple phases of urban growth in several cities as well as the consistent presence of low DN (<similar to 15) background luminance for many agricultural areas. Lights also allow us to quantify changes in the size distribution and connectedness of different intensities of development. Over a wide range of brightnesses, the size distributions of spatially contiguous lighted area are consistent with power laws with exponents near -1 as predicted by Zipf's Law for cities. However, the larger lighted segments are much larger than individual cities; they correspond to vast spatial networks of contiguous development (Small et al., 2011). (C) 2012 Published by Elsevier B.V.

DOI

[27]
刘彦随,刘玉.中国农村空心化问题研究的进展与展望[J].地理研究,2010,29(1):35-41.lt;p>改革开放以来,中国快速城镇化和人口非农化,在促进农民就业和增收的同时,加快了农村空心化发展,致使空心村问题日趋严峻。本文通过梳理国内农村空心化的研究进展,简要分析了相关研究的主要特点与不足,探讨了今后针对农村空心化与空心村问题的创新研究领域和方向。在国家坚守18亿亩耕地红线、推进社会主义新农村建设和促进城乡统筹发展的时代背景下,系统分析空心化村庄用地结构与潜力、类型及演进规律,深入研究农村空心化情景模拟与调控、空心村整治规划示范与配套政策,以及空心化村庄整治与管理决策支持系统等,既是推进乡村地域系统的理论创新和深化实证研究的需要,也是面向国家战略需求提供科技决策服务的需要。</p>

DOI

[28]
Harvey J T.Estimating census district populations from satellite imagery: Some approaches and limitations[J]. International Journal of Remote Sensing, 2010,23(10):2071-2095.ABSTRACT Small-area population densities and counts were estimated for Australian census collection districts (CDs), using Landsat TM imagery. A number of mathematical and statistical refinements to previously reported methods were explored. The robustness of these techniques as a practical methodology for population estimation was investigated and evaluated using a primary image for model development and training, and a second image for validation. Correlations of up to 0.92 in the training set and up to 0.86 in the validation set were obtained between census and remote sensing estimates of CD population density, with median proportional errors of 17.4% and 18.4%, respectively. Total urban populations were estimated with errors of +1% and-3%, respectively. These results indicate a moderate level of accuracy and a substantial degree of robustness. Accuracy was greatest in suburban areas of intermediate population density. There was a general tendency towards attenuation in all models tested, with high densities being under-estimated and low densities being over-estimated. It is concluded that the level of accuracy obtainable with this methodology is limited by heterogeneity within the individual CDs, particularly large rural CDs, and that further improvements are in principle unlikely using the aggregated approach. An alternative statistical approach is foreshadowed.

DOI

[29]
Liu Q, Sutton P C, Elvidge C D.Relationships between nighttime imagery and population density for Hong Kong[J]. Proceedings of the Asia-Pacific Advanced Network, 2011,31:79-90.Nighttime imagery is an unusual remote sensing data source that offers capabilities to represent human activities on the Earth鈥檚 surface through the observation of artificial lighting at night. Previous analyses of images of the earth at night derived from the Defense Meteorological Satellite Program-Operational Linescan System (DMSP-OLS) have revealed a striking correlation between city-lights and human population density. Nighttime light photographs taken by astronauts aboard the International Space Station (ISS) may have the potential of offering more sophisticated representations of population density with finer spatial and spectral resolution than the DMSP-OLS imagery. The objective of this study is to analyze and map the relationships between the city lights of Hong Kong, China, and representations of population and population density, through comparing two types of nighttime imagery (DMSP-OLS satellite image and ISS photograph) to census population and population density derived from the LandScan population dataset.

DOI

文章导航

/