Fine-grained Population Estimation and Distribution Characteristics in Shanghai

  • LI Mingxiao , 1, 2 ,
  • CHEN Jie , 1, * ,
  • ZHANG Hengcai 1 ,
  • QIU Peiyuan 1 ,
  • LIU Kang 1, 2 ,
  • LU Feng 1
  • 1. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Natural Resources Research, Chinese Academy of Sciences, Beijing 100101, China
  • 2. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author: CHEN Jie, E-mail:

Received date: 2016-08-01

  Request revised date: 2016-10-20

  Online published: 2017-06-20


Urban population distribution and its dynamic changes have been playing a key role in urban planning and management. Currently, the wide use of information communication technology (ICT) provides an opportunity to support fine-scale studies by acquiring accurate individual positioning data. By extracting regular individual trajectories from a mobile communication signaling dataset, this study established an estimation procedure of urban population distribution and quantitatively analyzed spatiotemporal characteristics of population distribution and migration in Shanghai. The results indicated that, firstly, mobile communication signaling data had the ability to describe the dynamic characteristics of urban population and to estimate the real population size of a city in a quantitative and relatively an authentic way by taking its advantages of wide sample coverage, high spatial resolution, good timeliness and multiple spatiotemporal scales. Secondly, population distribution of Shanghai on the whole is stable all day long. Comparatively, population at the daytime showed a more remarkable spatial agglomeration phenomenon than population at night. Thirdly, the population migration between urban functional areas and other areas is rare. During the rush hour in the morning and evening, the population migration was mainly depicted as a relatively equally both-way movements between central urban area and other new urban functional areas. Within each functional area, more than half of its population is not moving out. In conclusion, this study can be useful for urban planning, emergency management and public traveling information services.

Cite this article

LI Mingxiao , CHEN Jie , ZHANG Hengcai , QIU Peiyuan , LIU Kang , LU Feng . Fine-grained Population Estimation and Distribution Characteristics in Shanghai[J]. Journal of Geo-information Science, 2017 , 19(6) : 800 -807 . DOI: 10.3724/SP.J.1047.2017.00800

1 引言

现有人口分布的研究方法包括基于自然、社会经济数据推导的人口分布研究[2-4],基于多源遥感影像反演的人口分布研究[5-7]和基于移动目标(居民和交通工具等)离散出行轨迹或通讯频度推导的人口分布研究[8-12]。上述方法各有特色:① 基于自然、社会经济数据推导的人口分布研究虽然具有良好的空间覆盖度,但其空间尺度粗放,虽能在一定程度上提高人口分布估计的空间精度,但存在数据时效性滞后、更新周期长等问题。此外,当把社会经济数据与人口普查数据二者结合使用,存在的数据间时相不匹配、多统计口径不一致、数据拆分等问题会极大地影响人口分布估计精度。② 基于多源遥感数据反演的人口分布研究大幅提高了空间精度和时效性,但遥感数据获取受卫星过境时间限制,仅能反映部分时刻的人口分布情况,难以掌握人口分布特征的动态变化过程。③ 基于移动目标离散出行轨迹或通讯频度推导的人口分布研究通过获取大量用户的出租车轨迹、社交网络定位结果或移动通讯行为发生时所在基站位置,反映地理单元上人口分布的变化情况。该类数据仅能获取用户出行轨迹的片段,且获取的人口仅为人口总体中的一部分,存在人口采样偏差问题。
随着移动通讯技术的发展,移动通讯设备的 普及率已达到极高比例。截止2013年底,中国移 动电话用户数达11.06亿,移动设备普及率约81.3%,其中上海等特大城市移动设备普及率已达到126%[13-14]。移动通讯信令数据准确记录了移动通讯用户在移动通讯网络中活动时的通讯基站位置和活动的相关信息。当移动通讯终端产生开关机、通话或收发短信、访问移动互联网、甚至基站切换行为时,用户所关联的蜂窝基站及时间将被保存在信令数据中,辅之以蜂窝基站的精确坐标及其多个基站的信号交会方法,可以获取误差范围在市区500 m、郊区1000 m以内的用户位置信息[13,15]。移动通讯信令数据较全面地反映了用户的连续出行轨迹,具有样本数量庞大、样本相对其他数据源无 偏性较好,且支持定位精度以上多时空尺度自由切分的数据特点。移动通讯信令数据为精细时空尺度下人口分布动态特征分析提供了全新、优质、可靠的数据源,能有效支持动态人口分布估算及特征研究[13,16]
上海市是中国人口集聚能力最强的城市之一,城市人口长期保持净流入状态。目前,已有大量关于上海市人口分布变化时空特征的研究成果,包括都市区人口增长与分布规律[17-18]、人口未来情景预测[19]、就业空间格局变化[18,20-23]、城市空间结构演 变[13]、流动人口变化及聚集区空间分布规律[24-25]等。上述研究对于增进上海市人口分布时空特征及变化规律的认识具有重要价值,但已有研究多依据区县尺度分析,缺乏对精细时空尺度下的动态人口分布的系统认知,且无法全面、准确地反映上海市全天人口分布及时空变化特征。

2 研究区与数据源

2.1 研究区概况

本文以上海市为研究区。上海市是中国的经济、金融、贸易、航运中心。2010年11月完成的全国第六次人口普查结果显示上海市常住人口为2301.91万人。2015年上海市GDP为24 964.99亿元,蝉联中国城市第一。依据上海市“十一五”经济社会发展纲要,上海市城镇体系按照中心城和郊区2条主线,构建“1个中心城”和“9个新城”共10个城市功能承载区,如图1所示。
Fig.1 Urban functional areas in Shanghai

图1 上海城市功能承载区示意图

2.2 数据预处理

本文所用数据为匿名化处理后的某工作日上海移动通讯信令轨迹数据。该数据空间覆盖全上海市域,用户数逾1700万,信令数据记录量超过10亿条。每条记录包括用户ID、记录时间、所在位置经纬度及通讯事件类型。对于每个用户而言,一天的轨迹为 T = ( ( x 1 , y 1 , t 1 , e 1 ) , ( x 2 , y 2 , t 2 , e 2 ) , , ( x n , y n , t n , e n ) ) ,其中ti为记录时间,(xi, yi)为地理坐标, e i 为事件类型。该数据的空间定位精度为上海市移动基站小区,基站小区空间覆盖范围半径在市区约 100~500 m、郊区约400~1000 m[15],平均时间间隔约30 min。
本文面向全上海市域人口分布研究需求,以公里格网为空间单元、一小时为时间间隔,对轨迹进行时空重采样,生成用户轨迹表示为 T = ( Gi d 1 , t 1 , Gi d 2 , t 2 , , Gi d 24 , t 24 ) 。对重采样后各空间单元移动通讯信令轨迹数进行统计,同时依据上海市移动公司市场渗透率对各空间单元手机用户数进行反演,将手机用户数近似为人口规模,获取城市人口分布时空图谱,并在此基础上开展上海市人口分布时空特征分析。

3 上海市人口分布时空特征

3.1 上海市总体人口规模估算


3.2 上海市人口分布时空演化

Fig. 2 Spatio-temporal mapping of population density in Shanghai (one weekday)

图2 上海市人口密度一日时空图谱(某工作日)

3.3 上海市昼夜人口空间分布

Tab.1 The day and night population size of central urban area and new urban areas in Shanghai

表1 上海市中心城区及各新城昼夜人口规模

区域 白天人口/万人 夜间人口/万人 昼夜人口比/%
中心城区 1109.30 1061.71 104.48
南桥新城 28.30 28.09 100.75
松江新城 92.87 89.67 103.57
闵行新城 145.16 152.73 95.04
嘉定新城 39.44 35.11 112.33
青浦新城 45.00 42.31 106.36
宝山新城 38.25 40.36 94.77
城桥新城 5.75 5.72 100.52
金山新城 18.94 19.54 96.93
临港新城 21.05 20.52 102.58

4 上海市人口移动时空特征


4.1 上海市功能承载区内外人口移动特征

由上海市中心城区和各个新城构成的城市功能承载区在上海市人口聚集中占据了重要位置。依据基于移动通讯信令反演获取的人口分布结果,城市功能承载区土地面积仅占上海市全市面积的31.38%,而24 h人口占比稳定且高达72.61%~73.51%。基于移动通讯信令数据较全面地反映用户的连续出行轨迹的数据特性,本文借鉴人口学中迁移率[26]概念,计算各个时刻上海市城市功能承载区与其它区域之间的人口移动率,结果如图3所示。其中,红色代表人口由其他区域流入城市功能承载区,蓝色代表人口由城市功能承载区流入其它区域。可以看出,城市功能承载区内外人口移动呈现明显的早晚双峰结构。此外,各时刻人口流出、人口流入比率大致相当,且总流动率均小于10%,表明上海市城市功能承载区与其他区域之间人口移动很少。
Fig. 3 The ratios of inflow and outflow population between urban functional areas in Shanghai

图3 上海市城市功能承载区内外的人口移动率

4.2 上海市功能承载区内人口移动特征

Fig. 4 The population movement within urban functional areas in Shanghai

图4 上海市城市功能承载区内部人口移动

Tab.2 The unbalanced factor of the main channels of population movement in Shanghai

表2 上海市人口移动主要通道不平衡系数

主要通道 不平衡系数(早高峰) 不平衡系数(晚高峰)
中心城区-闵行新城 1.352 1.389
中心城区-宝山新城 1.269 1.166
中心城区-松江新城 1.181 1.144
中心城区-嘉定新城 1.582 1.518
中心城区-青浦新城 1.366 1.378
中心城区-南桥新城 1.022 1.071
中心城区-临港新城 2.115 2.174
闵行新城-南桥新城 1.111 1.049
闵行新城-松江新城 1.236 1.172

5 结论与讨论

城市精细尺度的人口分布状况对于理解城市社会、经济、环境的发展现状及规划其未来发展方向均具有十分重要的意义。移动通讯信令数据记录了城市人口移动行为,具有时空精度高,样本覆盖面广,且支持定位精度以上多时空尺度自由切分的数据特点,为研究精细时空尺度城市人口分布提供了新的研究方案。本文依据移动通讯信令的轨迹数据,依托时空重采样,实现了城市精细尺度人口分布时空估算的方法流程,通过搭建大数据并行计算平台以实现TB级移动通讯信令数据管理。同时,以上海市为研究区,定量化地分析了上海市人口分布特征及人口移动过程。结果表明:① 在数据方面,基于移动通讯信令数据估算城市人口分布的方式样本覆盖广、时空精度高、支持时效性较强且时空尺度灵活多变的应用研究需求,能够定量地描述城市人口分布时空动态特征且能推算城市真实人口规模;② 在人口分布时空特征方面,在全市域尺度上,上海市各时段人口空间分布分布较为稳定且差异较小;在中心城区,日间人口较夜间人口呈现更为显著的空间集聚特征;③ 在人口移动时空特征方面,城市功能承载区与其他区域之间人口移动很少;早晚高峰期间,各城市功能承载区之间人口移动均体现为中心城区与其它新城之间的移动,且2个方向移动人数较为平衡;各城市功能承载区内均有超过半数的人口全天仅在其所在城区内部活动。本文通过精细时空尺度下城市人口分布与移动的动态感知及量化分析,为上海城市规划、应急管理、交通出行等提供更精准的科学依据。
目前,有关精细尺度下的城市人口分布研究仍处于发展探索阶段:① 在研究数据的代表性方面,仅获取上海市移动公司信令数据,在估算人口时采用上海市移动公司市场渗透率进行估算,以手机用户数近似为实际人口规模,暂未考虑各通讯公司在不同区域市场渗透率的差异和低龄幼儿、高龄老人等非潜在手机用户群体对人口规模的影响;② 在研究数据的预处理过程中,如何彻底去除因移动通讯信令“乒乓效应”所致的定位误差、如何识别同一用户携带多部手机所致的数据冗余等问题有待更合理地解决;③ 在研究尺度的选择方面,移动通讯信令数据定位精度受基站密度影响,在城市核心区域定位精度较高,而郊区定位精度较低。如何兼顾不同区域的定位精度、选择合适的时空尺度开展人口分布研究需要深入探索;④ 在数据抽样规模方面,大数据时代为城市精细尺度人口分布研究带来了机遇,然而海量时空轨迹数据的快速处理并非易事。本文选取的某一工作日的移动通讯信令数据在多大程度上表征一般性的人口分布时空特征,还有待进一步验证。

