2017年中国地理信息科学理论与方法学术年会优秀论文专辑

城市邻近基站间人群流动时空变化同步性分析

  • 朱菁玮 , 1 ,
  • 方志祥 , 1, 2, * ,
  • 杨喜平 3 ,
  • 尹凌 4
展开
  • 1. 武汉大学测绘遥感信息工程国家重点实验室,武汉 430079
  • 2. 地球空间信息技术协同创新中心,武汉 430079
  • 3. 陕西师范大学地理科学与旅游学院,西安 710119
  • 4. 中国科学院深圳先进技术研究院,深圳 518055
*通讯作者:方志祥(1977-),男,博士,教授,博士生导师,主要从事轨迹大数据时空行为、时空GIS行人智慧导航,交通地理分析研究。E-mail:

作者简介:朱菁玮(1993-),女,硕士生,主要从事时空地理信息科学研究。E-mail:

收稿日期: 2017-11-20

  要求修回日期: 2018-03-18

  网络出版日期: 2018-06-20

基金资助

国家自然科学基金项目(41231171、41771473)

中央高校基本科研业务费专项资金项目(2042017kf0235、

Flow Synchronization of Mobile Communication Network in Cities Areas

  • ZHU Jingwei , 1 ,
  • FANG Zhixiang , 1, 2, * ,
  • YANG Xiping 3 ,
  • YIN Ling 4
Expand
  • 1. State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University, Wuhan, 430079, China
  • 2. Collaborative Innovation Center of Geospatial Technology, Wuhan 430079, China
  • 3. School of Geography and Tourism, Shaanxi Normal University, Xi′an, 710119, China;
  • 4. Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China.
*Corresponding author: FANG Zhixiang, E-mail:

Received date: 2017-11-20

  Request revised date: 2018-03-18

  Online published: 2018-06-20

Supported by

National Natural Science Foundation of China, No.41231171, 41771473

The Fundamental Research Funds for the Central Universities, No.2042017kf0235, GK201803049

Copyright

《地球信息科学学报》编辑部 所有

摘要

不同区域人群流量随时间的变化可以反映城市结构的空间差异。现有对于城市人群空间分布特性的研究大都以人群密度计算为基础,注重时空切片尺度,但是不能有效刻画邻域空间单元间流量变化的时空过程同步特性。本文提出一种基于基站间流量变化过程相似度的城市邻域基站流量变化同步性度量方法,量化分析不同区域的人群进出流量过程的相似程度,研究城市中具有相同人群流量变化过程的同步性区域空间分布规律。以深圳市为例,对城市同步性区域的空间分布与特点进行剖析。实验发现:计算同步性时参数选择需根据城市本身基站分布及流量特点分析,一般研究中,城市基站平均距离可作为邻近区域半径d,描述基站间流量变化相似度的特征阈值λ选取与邻近区域半径有关,半径越小,阈值取值越小。通过基站人群流量同步性得到的城市同步区域的空间分布不同于行政区域划分结果,同步区域面积小,划分更为精细;且规划级别越高的中心区,其范围内基站同步区域数目越多。最后,将同步区域结果与流量密度图对比,发现该方法不仅能够发现流量变化大的同步区域,并且能够发现城市中流量变化小的同步区域。本文提出的方法能量化衡量区域流量变化同步性并发现具有不同流量变化特点的同步性整体区域,对城市人群空间变化特点进行分析,可用于指导和评价城市规划与实际人群活动区域效果,以及城市服务设施布局等。

本文引用格式

朱菁玮 , 方志祥 , 杨喜平 , 尹凌 . 城市邻近基站间人群流动时空变化同步性分析[J]. 地球信息科学学报, 2018 , 20(6) : 844 -853 . DOI: 10.12082/dqxxkx.2018.170550

Abstract

Distribution and movement of people in urban areas are important information for studying urban dynamics and crowd displacement rhythm. The temporal variation of people flow between different spatial regions shows how people interact with physical locations and is highly related to its function and structure in the city. Previous researches usually use density-based approaches to investigate the temporal variation of people flows in different spatial regions. This kind of approach can present time slice-based hot-spot maps but cannot reflect the consistency of changing processes. Therefore, this paper proposes an approach of synchronization measurement to fill in this gap. Our method is designed to measure the similarity of temporal people flow processes between stations in the 3D feature space and quantify property of synchronization of communication network areas based on the average similarity. An experiment of measuring synchronization was conducted using a dataset of mobile phone data in Shenzhen. The people flow processes within this city was derived from the mobile phone dataset. The results show: firstly, the neighboring-area radius and feature space threshold depend on the distribution of mobile station and flow process in corresponding serving areas. In most cases, the neighboring-area radius can be set as the average distance between mobile stations. The feature space threshold depends on the neighboring area radius, and the smaller the radius, the smaller the threshold should be. Secondly, different from administrative areas, the synchronized areas show the characteristics of human dynamics in the city with a smaller spatial unit. We found that the centers with higher level of planning have more synchronized regions with relatively small area in them. Finally, compared with the density map result, our approach indicates that the synchronized regions not only exist in the city centers with high flow changes but also in rural areas with relatively small flow changes. Combined with additional information such as land use attributes, the synchronized areas clarify the spatial structure of the population and its aggregated boundary effect in the city. This approach can be used to assess the output of urban planning and optimize the distribution of service facilities such as emergency management and transportation network design.

1 引言

人类活动作为影响城市设施空间区域分布的重要因素,其活动性建模是GIS研究的前沿问题之一。城市人群活动在空间分布上的同步性规律研究,可为理解和解决城市问题提供的可操作性的资源配置决策,对建设和管理智慧城市有重要意义。已有研究主要集中在3个方面:① 人群活动的获取。传统的人类移动空间特性研究主要利用交通日志以及调查数据,样本少,费时费力,且往往不能真实反映全部城市人群活动的规律;随着信息通讯、定位以及网络技术的发展,手机、社交签到等数据对大规模人群活动信息获取成为可行的方案。② 人群活动规律研究。人群空间移动行为模拟[1,2],人群出行规律的发现[3,4,5]与可视化[6],不同时段城市中的人群空间分布[7],通过核密度对城市密度热点区域发现[8,9],以及通过群体行为的规律与地理环境的关联分析[10],反映居民日常行为社会分异的时空关系[11,12]。③ 人群活动应用研究。由于城市空间结构反映了城市资源分布和人类在城市活动中对于资源的利用情况[13,14],利用人群空间活动特点发现城市扩张变化、区域联系以及评价区划合理性[15],开展人群异常事件预测以及预警[16,17,18]、公共资源配置等应用研究。目前这些研究为人群活动的分析提供了初步的研究方法与结论,但是在面向城市问题的时空资源配置时,还缺乏区域性的人群流动时空同步规律,无法从宏观上掌握区域性的人群流动变化特征,难以做出有针对性的城市时空资源配置的科学决策,在解决通讯资源的优化调度、警力资源布局与快速响应、人群踩踏等异常事件预警与应对等现实问题时存在较大难度。
本文提出基于特征空间轨迹相似度的邻域人群流动同步性分析方法,以邻近空间内手机基站流量变化的时空过程为例,分析城市尺度上基站区域间人群流量同步性性能及空间分布规律,为城市日常与应急管理、人群活动功能识别、区域交通与空间规划等提供群体性的人群流动分析与决策方法支撑。

2 基于特征空间轨迹相似度的邻域 人群流动同步性

为了衡量不同区域人群流量变化的同步性,本文利用手机数据,提出一种特征空间轨迹相似度的邻域人群流动同步性分析方法,来反映基站间人群流动的同步性规律。该同步性是指邻域空间(如基站区域)人群流入流出在时间维度上呈现类似的变化趋势。该类同步性分析受基站间人群流动量时空变化的相似性,以及不同邻域内空间人群流动量的一致性等影响,需要二者整合起来反映同步性能。

2.1 基站间人群流动量变化时空过程的相似性度量

本文在已有研究[19,20,21]的基础上,建立基于特征流量空间的表达方式,对基站间人群流动量时空变化过程相似性进行度量。
特征流量空间由人群流入量、人群流出量和时间维等组成,图1中的x轴表示人群流入量,y轴表示人群流出量,z轴表示时间。在该特征空间中,任意一个基站P在某一时段的人群流动量都可以用一点(xP,yP)表示(图1(a)中的点),随着时间的延伸,每个基站都可以形成一条时空轨迹(图1(b)中由连点形成的线)。此时的时空轨迹能够表示基站人群流入量与人群流出量的相对变化关系。
Fig. 1 Diagrams of flow feature space

图1 流量特征空间示意图

在某个时刻,任何2个基站间(如图1(a)中的PQ1, Q2)的人群流入流出特征相似性被定义为式(1)所示。
S P , Q 2 = 0 , D PQ > λ 1 , D PQ λ (1)
式中: S P , Q 2 P点和Q点之间的人群流入与流入特征相似性;DPQ是2个基站之间的特征距离;λ是特征空间的距离阈值,若2个点之间的距离小于λ(即DPQ<λ),基站相似度为1,2个基站流量相似(如图中PQ1);若2个点之间的距离大于λ(即DPQ>λ),基站相似度为0,2个基站不相似(如图中PQ2)。λ的选择跟要分析的问题和空间尺度有关,在应用的时候需要慎重取值。根据定义,相似基站人群流入量范围在[xP-λ, xP+λ],人群流出量范围在[yP-λ, yP+λ],表示在这个特征范围以内,可认为某个时刻2个基站人群的流入流出特性相似。
从不同时间长度分析单元来分析两个基站人群流入和流入量的相似性,则通过时空轨迹的相似性度量来分析。如图1(b)所示,表示t时刻基站P人群流入流出量,那么k时段内该基站的人群流量变化过程表示为序列TrjP(1,k)=(P1,P2,…,Pk)。图中黑色圆点为中心基站P各个时刻人群流动量,红色圆点为基站Q相对于基站P相似时刻流量,蓝色圆点为不相似时刻流量。2个基站的人群流量变化特征的相似度SP,Q由流量特征空间中的相同采样时刻的加权空间距离之和与总的特征空间距离的比值来衡量,如式(2)、(3)所示。
S P , Q = t = 1 k D P t D t W P t D t t = 1 k D P t D t (2)
W P t Q t = 0 , D P t D t > λ 1 , D P t D t λ (3)
式中: W P t Q t 是距离累加时的权值,当流量特征空间内基站Q与基站P的距离小于或等于λ时,距离权值 W P t Q t 为1,否则为0。k是等长时间单位的数目。 D P t Q t PtQt在流量特征空间t时的距离。式(2)能够对任意两基站在任意长度时间段内人群流量变化过程的相似度进行描述,计算结果区间是[0,1]。当基站相似度为0时,表示在设定的阈值λ条件下在研究的时段内基站人群流量变化过程在任何时间单元内都不相似;当其为1是,则表示任何时间单元内其人群流量变化特征都处于邻近状态,非常相似。

2.2 基站邻域人群流动同步性

基站邻域人群流动同步性研究,能够辨识在人群流动特性上具有空间邻近和时间相似的区域,区分出具有相同人群流动特性的连续空间区域,对建立精细区域以应对的时空资源配置与管理服务提供关键的空间分析方法。根据地理学第一定律,空间越接近,其相关性越大,这里根据空间距离来对基站进行加权,从而计算出一定区域范围内的同步性。如图2所示,中心基站P的邻近基站为以基站P为中心,d为半径的圆所覆盖的空间区域内的所有基站。其邻域基站人群流量变化同步性定义为:中心基站与邻近区域内所有基站的基站相似度的反距离加权平均计算结果,如式(4)所示。
C P ( d , r ) = k = 1 n S P , Q k 1 d P , Q k k = 1 n 1 d P , Q k (4)
Fig. 2 Diagram of neighboring mobile base station

图2 邻近基站示意图

式中:n是邻近基站个数; S P , Q k 是中心基站P与邻近基站Qk的人群流量变化相似度。CP(d,r)计算值的范围在[0,1]之间。周围基站与中心基站P的人群流量变化过程的相似度越高,则基站P的同步性值越接近1,该区域的流量变化同步性就越好;反之,其同步性越差。

3 实验分析

本文利用2011年深圳市某工作日约1600万用户,5952个基站流量变化数据,进行邻域基站流量变化同步性分析。基站流量数据采用主动式方式收集,采样间隔为1 h。基站间最小距离为1 m,最大距离为2790 m,99%的基站与最邻近基站的距离在1000 m之内,93%的基站与其最邻近基站距离小于500 m。对基站人群流量进行分析,一天内基站最大的流入流量为23 974人次,最大流出流量为17 106人次;90%以上的基站的每小时人群流入或者流出流量均值小于3000人次。本研究对每个基站不同时段进出流量进行统计,处理得到1-24 h的以小时为时间单元的23个连续时段数据,并根据其最大人群流入量与流出量进行归一化处理。

3.1 不同参数下的结果敏感性分析

本文提出的方法对于基站同步性的计算涉及 2个变量:中心基站的邻近空间区域半径d,以及特征流量空间中相似阈值λ。首先对dλ分别取值进行计算,分析这些参数的敏感性。依据该手机数据集中的基站相邻距离分布,d的取值设定为200、300、400、500、600、700、800、900、1000 m;阈值λ的取值范围0.025,0.03,0.035,0.04,0.045。图3给出不同参数组合下基站最大邻域范围内基站的同步性分布。其中,图3(a)是不同参数设置下的同步性的均值,可以发现:整体上随着d增加,其同步性呈现增大趋势,但当d>600 m之后,即使半径增大,其平均同步性增加较小、趋于稳定,说明邻域半径参数选择小于600 m对结果影响比较大。本文统计了不同阈值λ条件下每个基站取最大同步性值时所采用的邻域半径,针对这些邻域半径值进行统计,得到不同邻域半径下的基站数目,如图3(b)所示,当d=200 m时,邻域内的基站平均数目为1.55个,大部分基站只有1个相邻基站,邻域设置范围过小。由于邻近基站近且少,流量特征相似,容易得到较大的同步值,因此d=200 m的结果不能准确反映区域真实的同步规律结果。当d=400 m时,平均邻域基站为6个,区域范围设置合理,同步性的计算能够考虑到足够的基站表达区域特性。根据已有研究[22],深圳市基站之间平均距离为375 m,因此依据平均距离来设置参数时合理的。综上,在对深圳市的研究中,d=400 m是合适的邻近区域范围半径设置,这时该实验区域的大多数基站都取得最大的同步性。另外,本文还统计了不同邻域半径d条件下每个基站取最大同步性值时所采用的阈值λ,针对这些阈值进行统计,得到不同阈值下的基站数目,如图3(c)所示,当要保障大多数基站取得最大同步性值时,特征空间阈值的选取与邻近区域半径紧密相关,半径越小,特征阈值选择就要越小,半径越大,特征阈值就要较大。具体地,在λ取最小值0.025或者0.045时取得最大同步性的基站数目多于其他中间值,但是在具体数值差异较大。当邻域半径d=200 m,λ取0.025时取得最大同步性的基站数目多于λ取0.045的结果,主要由于邻域半径d取值较小,基站间空间距离近,基站相似度高。在邻域半径d一定时,邻近区域基站数目一定,当基站间相似度高时,增加特征阈值λ对基站相似度影响小,同步性影响小。当邻域半径d=1000 m,λ取0.025时取得最大同步性的基站比0.045少。主要由于此时邻域半径d较大,邻近区域范围增大,区域内基站较多,平均数目为31.9个,基站相似度差异较大。当λ取0.025时相似基站流量相似标准要求严格,区域内流量相似度低的基站数目较多,同步性低;当λ取0.045时相似基站流量相似标准较为宽松,整体基站相似度增加,同步性增加。除了最大最小情况,当特征阈值λ取中间值0.3-0.4之间时,得到最大同步性的基站数目较稳定,特别是邻域半径d为400~1000 m。
Fig. 3 Average synchronization and maximum synchronization of different parameters

图3 不同参数下同步均值统计和基站最大邻域基站同步分布

综上所述,增大区域半径d和特征阈值λ都会使得基站总体同步性数值增大。邻近区域半径d主要影响邻域内的基站数目与考虑的范围,半径越小,区域越小,基站间的差异越小;半径越大,考虑范围越大,基站间差异越大。特征阈值λ影响基站相似度的判断,阈值越大,基站相似度越高,同步性越高。不论是λ还是d,具体选择需要与城市本身特点以及研究范围结合分析。在参数的选择时,若城市中基站布设较密集,可以选择较小的邻近区域范围d和较小的空间阈值λ,这时能够精细的同步性单元。邻近区域范围和空间阈值的结果能够在一定程度上体现城市区域内人群移动基本单元特点。但对一般研究来说,可以根据以该城市的平均基站距离为参考依据来设定参数d
根据基站同步性结果,本文利用ArcGIS做出基于同步性的等高线,对结果进行可视化表达得到同步性高的区域。如图4所示,带有颜色区域是深圳市具有较好的同步性的空间区域。不难发现:这些区域的空间分布不均和形状大小不同,与行政区域边界没有必然的联系,说明城市中同步性区域与基本城市规划有一定的差别。对区域进行统计分析,发现dλ取值不同,城市区域内同步性区域数目及平均面积不相同,主要呈现两种基本变化:区域数目变化和面积变化。图4(a)-(b)主要表现基站同步区域的数目增加,图4(c)-(d)主要表现同步区域的面积增加。
Fig. 4 Synchronized areas of different parameters

图4 不同参数下基站同步区域空间分布结果

对于不同组合条件结果进行统计,不同参数条件下的同步性区域的数目和面积结果如表1所示。当邻近区域半径 d 一定,λ从0.025增加到0.03时,所有同步区域的数目和面积增加,此时特征阈值较小,其增加主要使得同步区域继续扩大。当λ继续从0.03增加到0.045时,邻近空间半径较小的区域特别是半径为300~600 m的区域其数目开始减小,但是面积增加,同步性提高使得具有相似同步性的区域开始聚集。而邻近空间定义较大的区域由于覆盖范围较大,区域内流量时空相似度有大有小,对于特征空间阈值设定较为敏感,因此同步区域面积和数目变化较为复杂。随着λ继续增加,邻近空间定义范围较小的区域持续聚合。
Tab. 1 Statistical result of synchronized area

表1 不同参数设置基站同步区域的数目和面积(104 m2

d/m λ
统计 0.025 0.03 0.035 0.04 0.045
200 数目 312 327 338 334 340
面积 18.63 21.05 23.30 26.42 28.91
300 数目 350 362 356 336 329
面积 26.13 31.77 38.34 46.04 52.60
400 数目 329 364 349 324 280
面积 43.82 46.68 54.79 68.42 87.11
500 数目 334 338 317 289 258
面积 48.21 57.95 76.13 98.03 103.47
600 数目 320 349 299 293 292
面积 57.25 62.11 70.36 66.23 73.33
700 数目 336 339 323 292 295
面积 56.52 47.55 47.03 49.74 57.72
800 数目 315 326 309 300 308
面积 44.12 48.85 53.84 63.26 70.57
900 数目 314 324 346 327 320
面积 50.19 61.41 57.70 56.31 58.89
1000 m 数目 312 334 315 322 321
面积 47.51 49.40 52.27 55.14 39.33
城市不同区域的人群流量随时间变化不同,可以通过计算邻域基站同步性以及形成的区域体现。不同λd的取值影响基站间流量相似度的大小以及邻域基站的范围,其变化过程和区域分布呈现不同的特点。综上所述,基站同步性区域空间位置和数目应具有一定的稳定性或者连续变化,反映区域本身流量变化区域特点。结合结果分析,对于深圳市,当时大量基站能取得其相似度最大值,而对不同dλ=0.035之后同步区域识别也趋于聚合而不是简单增加,因此选择d=400 m和λ=0.035的同步区域结果进行后续分析。

3.2 不同行政区域范围内的基站人群流量同步性 差异

图5(a)是《深圳市总体规划(2010-2020)》[23]的行政区边界图,体现3个主中心,5个副中心,8个城市组团的“多中心”城市发展体系。5(b)是计算城市同步性区域划分结果,其参数取值为λ=0.035和d=400 m。表2给出了不同行政区基站同步区域统计结果,包括同步区域的个数和平均面积。结合两者,分析结果发现:该市区域规划中心的级别越高,所呈现的基站同步性区域数目越多,而人群流动同步性区域划分粒度越小,区域面积也较小。比如:南山、罗湖和福田的同步性区域较多,均在40个以上,且平均面积较小,在20×104~70×104 m2之间,说明该区域的功能区域集中、结构紧凑;城市规划的副中心,除盐田区外,基站同步区域数目在13~24个之间,数目略少于规划的主中心区域,整体比组团中心区域多,光明和坪山区域的同步区域较多且平均面积较大,平均面积在120×104 m2以上,龙岗和龙华是区域交通枢纽区域,人流量大,同步区域数目较多;组团中心区域除沙井和航空城(人流量大产生的同步区域较多),其他同步区域均在在20个以下,整体最少。这些研究所发现的同步区域范围大,在配置通讯资源的时候,可以把整个同步区域的基站作为组群,做同步的带宽配置、应急通讯措施等处理,就能满足其服务要求;而针对所发现的同步区域面积较小而且破碎程度较大的区域,其内人群流动规律不明显,因此这些区域的通讯资源配置不能简单的做组群化处理,需要建立破碎区域间的覆盖能力动态协调机制,才能保障这些区域的通讯覆盖能力。
Fig. 5 Shenzhen's city planning map and synchronized area results

图5 深圳市区域规划和基站同步结果图

Tab. 2 Statistical results of synchronized area in different administrative district

表2 不同行政区基站同步区域统计结果

中心级别 中心区名称 数量/个 平均面积/104 m2
主中心 福田 53 37.129 13
罗湖 36 21.741 72
南山 42 65.253 07
副中心 光明新城 24 143.683 70
龙岗 28 104.982 20
龙华 38 56.657 80
坪山新城 18 128.857 20
盐田 13 75.796 65
组团中心 布吉 18 123.960 40
观澜 13 81.174 19
航空城 41 27.042 90
横岗 8 175.219 70
葵涌 4 72.110 76
平湖 6 156.920 10
沙井 25 28.574 77
松岗 13 56.319 55

3.3 与密度图分析方法的对比

密度图是常用的空间离散化分析方法,能够反映人群数量的空间分异特征。本文将深圳市划分为1000 m×1000 m的格网,采用每个格网区域内所有基站的归一化净流量作为统计量,在ArcGIS中做出密度图,依据流入和流出特性将其分为11级,越接近1级,表示区域流出流量越多,越接近11级,表示流入流量越多,6-7级表示变化最小。图6给出了4个代表时间段t=1, t=8, t=12和t=20时城市人群密度结果进行分析。根据分类结果,图6(a)的时间段是1时,该时间段内人群没有明显移动;图6(b)为7-8时上班时段,城市中部人群减少,南部区域,特别是南山、罗湖和福田等中心区域人群密度迅速增加。图6(c)为中午12时午休时段,人群有少量的移动,但是范围和流量密度变化都不大。图6(d)为晚上19-20时下班时段,人群开始从南部区域向城市中部及周围区域移动。
Fig. 6 Density map of Shenzhen′s population

图6 深圳市人流变化密度图

同步性体现区域本身流量的变化特点,我们将区域基站同步性结果与深圳市空间区域流量密度图的结果进行对比。将不同格网中所有基站的同步性值取平均,得到每个格网的同步性,并将同步性结果根据取值为0-1的范围平均分为10级,分级结果如图7所示。级别越接近10,格网同步性越高。对于不同同步级别格网与其对应的所有23个时段的归一化净流量级别进行统计,结果如表3所示。由表3可知,流量密度级别高的格网,其同步性级别较低。具体来说,首先大部分格网的净流量级别处于在6-7级,说明城市中大部分时间大部分区域净流量密度较小。流量密度级别高的格网(小于4或大于9)其同步性级别不会太高,一般处于7级以下,即同步性值小于0.7。图8将密度图与同步区域对比分析,图中黑色区域为同步区域,红色为流量密度较高的区域。可以看到,同步区域是具有相似流量变化过程的区域,因此其不仅处于城市中心流量密度较大区域,并且存在于城市周边流量密度较小但具有相似流量变化的区域。在深圳市南边的南山区、福田区和罗湖区,流量密度较大,该方法得到的同步区域的面积小且紧密。其他区域(如龙华和坪山)虽然流量密度较低,但也存在具有相似流量变化的同步区域,且这些同步区域的面积较大。对于不同区域流量特点和空间分布进行分析,不仅可以对于密度大区域的交通和设施进行管控和分析,而且对于流量稳定的同步区域也可进行评估和规划。
Fig. 7 Map of synchronization level in Shenzhen

图7 深圳市同步性级别分布图

Fig. 8 Comparison between density map and synchronization map in Shenzhen

图8 密度图与同步区域对比

Tab. 3 Statistical result in different synchronized area levels

表3 不同同步级别区域一天内流量密度变化

同步级别 流量级别
1 2 3 4 5 6 7 8 9 10 11
1 0 0 13 22 72 5099 5153 34 1 3 0
2 4 1 6 8 35 1209 1259 37 5 9 4
3 0 2 6 17 53 1236 1304 67 17 14 0
4 0 3 8 13 62 1395 1502 72 17 11 0
5 1 2 4 16 75 1297 1326 69 9 7 0
6 0 3 4 8 48 1072 1054 54 4 7 0
7 0 0 0 0 6 653 712 9 0 0 0
8 0 0 0 0 1 465 451 3 0 0 0
9 0 0 0 0 2 328 335 2 0 0 0
10 0 0 0 0 1 699 772 0 0 0 0
综上所述,密度图反映的是城市不同时段人群密度大的区域,而同步区域反映的是城市具有相同流量变化(包括流入流量和流出流量)过程的区域。对比二者可发现,同步性区域不仅仅能够发现密度变化较大的区域,同时能发现密度小但具有相同流量变化特征的区域,并且能够较为清晰的将区域边界表示出来,有助于区域的功能评价和变化分析。利用密度图对于不同时段不同区域人流量变化能够进行一定的表示,但是并不能表示其变化过程特点与区域的相关性;同步性检测的结果反映城市人群流量变化的空间特点,能更好地发现人群区域的同步变化规律。

4 结论

本文通过基站间人群流动量变化时空过程的相似性度量和基站邻域人群流动同步性的定义,提出了一种基于流量变化过程的城市同步性区域计算与区域发现算法。利用深圳市一天内所有基站的流量数据,结合城市规划的多中心结构,对城市结构中的这一天内的同步性区域特性进行研究,实验发现:该方法能够对城市基站邻域人群流动变化的同步性进行研究,并对于城市同步区域进行发现。基站邻域人群流动同步性受参数邻域半径d和相似阈值λ的影响,一般研究中,城市的平均基站距离可作为参考依据来设定参数d,相似阈值λd有关,d越小,λ可取较小值。同步区域的分布区别于行政区的规划,其面积较小,划分精细,能够在一定程度上描述城市的结构与中心功能。深圳市所规划的层次较高的中心区域,所呈现的基站同步区域数目较多,人群流动的区域结构划分复杂。除此之外,通过同步区域与城市流量密度图的对比,结果发现该方法不仅能发现城市中心具有较高流量的同步区域,并且能够发现城市周边流量较低的同步区域。
该方法利用邻近区域半径和相似阈值的设置,可对不同城市的同步性区域进行发现和研究。通过这些区域空间位置分布以及流量变化的研究,能够帮助我们更好的了解不同区域对于公共资源的需求大小以及特点,帮助我们针对区域的分布特点升级或增加设施布设,并根据不同时段人流流入流出的特点,调整公共资源调配以及意外事件的监控。例如:对于城市中心商业集中区根据同步区域大小以及公车站的服务范围调整站点的位置以及数量,或增加公共单车点。对于人流活动大的区域以及时段,加强同步区域内交通路口以及停车场的监控等。文章所提出的方法能够比较好地帮助理解城市中人群活动变化的一致性,下一步的工作将结合更多时段的数据发现和验证一周内不同时间的同步性区域变化及特点,并探究不同城市功能区域内人群的同步特性及其演变规律,对城市规划和公共设施建设等方面有较好的参考价值。

The authors have declared that no competing interests exist.

[1]
张仁军,Daniel Z Sui,惠红.多粒度的人群移动模拟通用模型及其应用[J].地理与地理信息科学,2011,27(2):11-15.

[ Zhang R J, Daniel Z S, Hui H.A general model for people movements based on multi-granularity and its application[J]. Geography and Geo-information Science, 2011,27(2):11-15. ]

[2]
宋宏权. 区域人群状态与行为的时空感知方法[D].南京:南京师范大学,2013.

[ Song H Q.Spatial-temporal perception methods for regional crowd[D]. Nanjing: Nanjing Normal University, 2013. ]

[3]
徐赞新,王钺,司洪波,等.基于随机矩阵理论的城市人群移动行为分析[J].物理学报,2011,60(4):53-59.

[ Xu Z X, Wang Y, Si H B, et al.Analysis of urban mobility behavior based on random matrix theory[J]. Acta Physica Sinica, 2011,60(4):53-59. ]

[4]
Calabrese F, Diao M, Di Lorenzo G, et al.Understanding individual mobility patterns from urban sensing data: A mobile phone trace example[J]. Transportation research part C: Emerging technologies, 2013,26:301-313.Large-scale urban sensing data such as mobile phone traces are emerging as an important data source for urban modeling. This study represents a first step towards building a methodology whereby mobile phone data can be more usefully applied to transportation research. In this paper, we present techniques to extract useful mobility information from the mobile phone traces of millions of users to investigate individual mobility patterns within a metropolitan area. The mobile-phone-based mobility measures are compared to mobility measures computed using odometer readings from the annual safety inspections of all private vehicles in the region to check the validity of mobile phone data in characterizing individual mobility and to identify the differences between individual mobility and vehicular mobility. The empirical results can help us understand the intra-urban variation of mobility and the non-vehicular component of overall mobility. More importantly, this study suggests that mobile phone trace data represent a reasonable proxy for individual mobility and show enormous potential as an alternative and more frequently updatable data source and a compliment to the conventional travel surveys in mobility study. (C) 2012 Elsevier Ltd. All rights reserved.

DOI

[5]
Wang Y, Li L, Yu J, et al.Identifying the urban transportation corridor based on mobile phone data[C]. Smart Cities Conference (ISC2), 2015 IEEE First International, 2015:1-6.

[6]
包婷,章志刚,金澈清.基于手机大数据的城市人口流动分析系统[J].华东师范大学学报(自然科学版),2015(5):162-171.分析城市人口流动行为有助于合理分配社会资源,有效应对交通压力、维护社会公共治安等.传统的人工分析方法,如问卷调查、座谈访问等,成本高昂且低效率.智能手机的不断发展与普及在为人们日常生活带来极大便利的同时,所产生的用户移动轨迹数据为有效分析城市人口流动行为提供了可能.然而,海量、低质的轨迹数据给查询分析工作带来了诸多挑战.文中提出了一个分布式人口流动分析框架,采用多节点处理任务,从而提升了算法的执行能力和可扩展性.利用手机运营商提供的手机轨迹数据,分析城市人口流动情况,建立了多个模型,包括进出城市的人口流动行为分析模型、市内各区县间的人口流动行为分析模型、居民工作地/居住地人口分析模型.与传统方法相比,本方案的成本更低,效率更高,覆盖人群更广.

DOI

[ Bao T, Zhang Z G, Jin C Q.Into digitization: Some concepts and methods of Chinese historical geographic information system[J]. Historical Geography, 2002(5):162-171. ]

[7]
秦昆,周勍,徐源泉,等.城市交通热点区域的空间交互网络分析[J].地理科学进展,2017,36(9):1149-1157.

[ Qin K, Zhou Q, Xu Y Q,et al.Spatial interaction network analysis of urban traffic hotspots[J]. Progress in Geography, 2017,36(9):1149-1157. ]

[8]
班雷雨,霍欢,徐彪.基于移动数据的人群活动热点区域的发现[J].中国科学技术大学学报,2015,45(10):829-835,863.移动数据记录了人群活动位置和时间的变化,反映了关于人类移动的语义知识.从区域语义分析移动人群频繁访问的热点区域,对理解区域特色在智慧城市方面的应用,具有重要意义.对于如何发现热点区域以及如何限制其覆盖范围,首先对人群位置序列进行分析,用网格作为空间数据索引结构并结合Top-k排序;然后提出了基于核函数的热点区域发现方法,并给出了热点区域发现算法;最后在真实数据集上,验证了该方法的可行性和有效性.

DOI

[ Ban L Y, Huo H, Xu B.Discovery of hot regions about crowd activities based on mobility data[J]. Journal of University of Science and Technology of China, 2015,45(10):829-835,863. ]

[9]
丁亮,钮心毅,宋小冬.利用手机数据识别上海中心城的通勤区[J].城市规划,2015,39(9):100-106.用手机数据识别了用户的日间驻留地、夜间驻留地,从中提取出日间在上海中心城内驻留用户、夜间在中心城内驻留用户,分别计算出其通勤范围。根据其夜间驻留地、日间驻留地的分布密度识别出上海中心城的通勤圈,并将其转换为以街道行政边界为空间单元的中心城通勤区。在中心城及通勤区内,超过97%的居民实现了职住平衡。研究表明上海市域空间结构在“中心城”和“郊区”之间还存在一个“中心城通勤区”层次。中心城通勤区以内、以外区域存在较显著差异。中心城通勤区的识别结果可加深对上海市域空间结构的认识,为在市域范围内分层次、分区域制定有针对性的规划政策提供依据。

DOI

[ Ding L, Niu X Y, Song X D.Identifying the commuting area if shanghai central city using mobile phone data[J]. Urban Planning, 2015,39(9):100-106. ]

[10]
刘瑜. 社会感知视角下的若干人文地理学基本问题再思考[J].地理学报,2016,71(4):564-575.近年来,不同类型大数据在地理研究中得到了越来越多的重视,许多学者基于手机、社交媒体、出租车等数据开展了大量实证研究。社会感知概念刻画了地理空间大数据基于大量人的行为时空模式获取地理环境特征的的技术手段,该手段有助于重新审视地理学研究中的一些基本问题,因而本文选择了空间分布和空间交互这两个基本地理概念以及定性方法和定量方法这两个人文地理基本研究方法展开讨论。大数据从微观个体和宏观群体两个层面同时感知空间分布和空间交互,可以定量分析其中的距离以及尺度效应。进而,由于小样本访谈人群和场所是定性研究的基础,而大数据可以通过定量方法识别特定人群和场所并进行刻画,因此,社会感知手段为集成定性和定量研究方法,构建混合地理学奠定了基础。

DOI

[ Liu Y.Revisiting several basic geographical concepts: A social sensing perspective[J]. Acta Geographica Sinica, 2016,71(4):564-575. ]

[11]
萧世伦,方志祥.从时空GIS视野来定量分析人类行为的思考[J].武汉大学学报·信息科学版,2014,39(6):667-670.从面向城市科学发展所必须的人类行为研究需求出发,从时空GIS的视野来看人类行为研究的基础问题与研究方法,剖析时空GIS对定量分析人类行为研究中的理想与现实间的鸿沟,以及所存在的理论与方法挑战,总结了时空GIS支撑人类行为研究的能力与不足,为大数据时代的人类行为研究前沿探索拓展思路。

DOI

[ Shaw S L, Fang Z X.Rethinking behavior research from the perspective of space-time GIS[J]. Geomatics and Information Science of Wuhan University, 2014,39(6):667-670. ]

[12]
郭璨,甄峰,朱寿佳.智能手机定位数据应用于城市研究的进展与展望[J].人文地理,2014,29(6):18-23.移动信息时代与大数据时代的到来,促使城市研究方法趋于多元化。随着智能手机出现和手机功能不断发展,手机普及率大大提高,基于位置服务应用的智能手机数据成为最具研究意义的大数据来源之一,为智慧城市建设和城市问题的研究提供了新的思路与方法。本文对该数据特征和以往其应用于城市研究领域的方法进行了总结;结合该数据特征和智慧城市研究领域,从城市居民行为研究、城市空间结构研究、城市生态环境研究和城市管治四个方面介绍了智能手机定位数据在城市研究中的应用。文章的最后对手机定位数据在城市研究中的应用前景进行了探讨,并强调手机定位数据研究应与规划实践相结合。

[ Guo C, Zhen F, Zhu S J.Progress and prospect of the application of smart phone LBS data in urban researches[J]. Human Geography, 2014,29(6):18-23. ]

[13]
王富臣.论城市结构的复杂性[J].城市规划汇刊,2002(4):26-28,78-79.

[ Wang F C. On complexity of urban structure[J]. Urban Planning Forum, 2002(4):26-28,78-79. ]

[14]
Liu X, Kang C, Gong L, et al.Incorporating spatial interaction patterns in classifying and understanding urban land use[J]. International Journal of Geographical Information Science, 2016,30(2):334-350.Land use classification has benefited from the emerging big data, such as mobile phone records and taxi trajectories. Temporal activity variations derived from these data have been used to interpret and understand the land use of parcels from the perspective of social functions, complementing the outcome of traditional remote sensing methods. However, spatial interaction patterns between parcels, which could depict land uses from a perspective of connections, have rarely been examined and analysed. To leverage spatial interaction information contained in the above-mentioned massive data sets, we propose a novel unsupervised land use classification method with a new type of place signature. Based on the observation that spatial interaction patterns between places of two specific land uses are similar, the new place signature improves land use classification by trading off between aggregated temporal activity variations and detailed spatial interactions among places. The method is validated with a case study using taxi trip data from Shanghai.

DOI

[15]
Ratti C, Frenchman D, Pulselli R M, et al.Mobile landscapes: using location data from cell phones for urban analysis[J]. Environment and Planning B: Planning and Design, 2016,33(5):727-748.

[16]
戴蓉蓉,朱海红,李霖.基于ARIMA模型的市内人群移动预测[J].测绘工程,2016,25(2):38-41.城市内部人群移动模式的研究在城市规划、交通量预测和疾病的防控等领域具有重要的应用价值。已有研究多基于出行数据探索人群移动模式,文中基于新浪微博位置签到数据,从时间序列建模角度结合ARIMA模型,建立武汉市人群移动的季节性模型实验表明,模型ARIMA(3,0,2)(1,1,0)12能较好地拟合并预测武汉市人群移动趋势,对城市规划和决策具有重要参考价值。

[ Dai R R, Zhu H H, Li L.Intra-urban human mobility prediction based on ARIMA model[J]. Engineering of Surveying and Mapping, 2016,25(2):38-41. ]

[17]
Candia J, González M C, Wang P, et al.Uncovering individual and collective human dynamics from mobile phone records[J]. Journal of Physics A: Mathematical and Theoretical, 2008,41(22):224015.

DOI

[18]
张仕学,李石君,余伟,等.突发事件人群异常聚集热点区域预测[J].中国安全科学学报,2015,25(9):159-164.

[ Zhang S X, Li S J, Yu W, et al. Prediction on hot region of crowd abnormal gathering on unexpected event[J]. China safety Science Journal, 2015,25(9):159-164. ]

[19]
Dodge S, Weibel R, Laube P.Trajectory similarity analysis in movement parameter space[C]. Processing of 19th GIS Research UK Annual Conference, 2011:27-29.

[20]
Gao S, Liu Y, Wang Y, et al.Discovering spatial interaction communities from mobile phone data[J]. Transactions in GIS, 2015,17(3):463-481.In the age of Big Data, the widespread use of location-awareness technologies has made it possible to collect spatio-temporal interaction data for analyzing flow patterns in both physical space and cyberspace. This research attempts to explore and interpret patterns embedded in the network of phone-call interaction and the network of phone-users090005 movements, by considering the geographical context of mobile phone cells. We adopt an agglomerative clustering algorithm based on a Newman-Girvan modularity metric and propose an alternative modularity function incorporating a gravity model to discover the clustering structures of spatial-interaction communities using a mobile phone dataset from one week in a city in China. The results verify the distance decay effect and spatial continuity that control the process of partitioning phone-call interaction, which indicates that people tend to communicate within a spatial-proximity community. Furthermore, we discover that a high correlation exists between phone-users090005 movements in physical space and phone-call interaction in cyberspace. Our approach presents a combined qualitative-quantitative framework to identify clusters and interaction patterns, and explains how geographical context influences communities of callers and receivers. The findings of this empirical study are valuable for urban structure studies as well as for the detection of communities in spatial networks.

DOI

[21]
Keogh E.Fast similarity search in the presence of longitudinal scaling in time series databases[C]. Processing on 9th IEEE International Conference-Tools with Artificial Intelligence, 1997:578-584.

[22]
汪伟,尹凌.基于频繁活动点集的手机位置数据隐私保护方法[J].计算机应用研究,2017,34(3):867-870.大规模手机位置数据在为人类活动研究带来新的前景的同时,数据中蕴涵的个体活动点可能导致用户重识别,即隐私信息泄露。针对个体的频繁活动点集合,计算手机位置数据中的个体重识别风险,通过点集匹配策略实现高风险个体敏感位置信息的隐匿;利用交通流分析来评价隐私保护后的数据可用性损失。基于深圳市大规模手机位置数据实验,结果表明提出的方法在降低整体隐私泄露风险和确保隐私保护后的数据可用性方面皆具有良好效果。研究成果对大规模手机位置数据隐私保护具有重要的促进作用,有助于保障此类大规模个体轨迹数据的安全应用以及相关法律法规的合理制定。

DOI

[ Wang W, Yin L.Privacy protection method for mobile phone location data based on matching point sets of frequent activity locations[J]. Application Research of Computer, 2017,34(3):867-870. ]

[23]
深圳市城市总体规划(2010-2020)》[EB/LO].

[ The comprehensive Plan of Shenzhen City [EB/LO]. ]

文章导航

/