Exploring Urban Human Spatio-temporal Convergence-Dispersion Patterns: A Case Study of Shenzhen City

People′s movement in a city is driven by purpose. Moreover, the distribution of urban spatial structure can cause the phenomenon of human convergence or dispersion, and this phenomenon is always changing over time. Therefore, understand the spatio-temporal patterns of human convergence and dispersion could provide us a good knowledge of human travel demand in the urban context, so that the better decisions can be carried out to meet the demands of citizens. With the rapid development and widespread use of location-aware devices, it becomes relatively easy to collect the large-scale human sensor datasets and to bring new opportunities and challenges to the study of urban human mobility. Especially in recent years, mobile phone data has become a rich resource for research and it is widely used to study the human mobility patterns from various aspects, with regard to its advantage in tracking the long-term and large-volume of urban citizens with low cost. In this paper, taking Shenzhen City as an example, we firstly extracted the origin-destination flow matrix from the mobile phone location data and employed Local Moran′s I to identify people’s convergence or dispersion areas. And then a time series matrix was constructed according to the temporal signatures of these areas. SOM algorithm was selected to cluster the matrix into nine typical human convergence-dispersion patterns. Based on the land use data, we have calculated the percentage of different land use types for each pattern to explain the human convergence-dispersion phenomenon, thus we could understand the relationship between human mobility patterns and urban spatial function. This study helps us to acquire a good knowledge of the daily human convergence and dispersion patterns within different urban functional areas. The findings derived from this study could give us the insights about where and when the convergence and dispersion of people would occur in Shenzhen. This knowledge is helpful for the city planners to improve the urban local planning and makes it more suitable for human mobility applications, such as making targeted adjustments to optimize the urban transportation facilities to improve their service efficiency.

1 引言


2 数据与预处理

实验数据为深圳市某工作日的手机位置数据,用户数约1600万,每一条记录包括用户ID、记录时间以及所在基站的经纬度,其中,用户ID经过隐私处理,采样时间间隔约为1 h。手机数据通过手机基站进行定位,共提取出5952个基站,每个基站赋予唯一编号TowerID。由于基站在城市中分布不均匀,在郊区分布较稀疏,在市中心基站分布较密集,一些基站间的距离甚至小于10 m,基站间信号跳动会产生定位误差,为了尽量减少这种误差带来的影响,用500 m×500 m的网格对深圳市进行划分,排除不包含基站的网格(这些网格主要位于山地、水系等人群活动稀少的区域),共得到2801个网格,如图1所示,对每个网格赋予唯一编号GridID。
Fig. 1 Grid area containing cell phone towers in Shenzhen

图1 深圳市包含手机基站的网格区域

对每个用户而言,一天的轨迹为 T = ( ( x 1 , y 1 , t 1 ) , ( x 2 , y 2 , t 2 ) , , ( x i , y i , t i ) ) ,其中 t i 为记录时间, ( x i , y i ) 为基站的坐标。对于2条相邻时间的记录 ( x i , y i , t i ) ( x i + 1 , y i + 1 , t i + 1 ) ,如果 x i x i + 1 y i y i + 1 ,即2个相邻记录的基站坐标不一样,则认为该用户发生了移动,产生一个OD对记录为 ( UserID , FromID , ToID , T ) 。其中, FromID 为起点的基站编号, ToID 为终点的基站编号, T 为时段,由于手机定位数据的采用间隔约为1 h,一天共有24个记录,每相邻2 h可以提取出移动的OD矩阵,将每相邻2 h看作一个时段,则一天共有23个时段。综合所有手机用户在时段 T 的OD对,得到该时段城市中任意2个基站间人群移动的OD矩阵记为 ( FromID , ToID , Count , T ) , Count 表示人数。排除掉起点和终点位于同一个网格的OD,则可将基于基站的人群移动OD矩阵综合成以网格为单元的OD矩阵,记为 ( FromGrid , ToGrid , Gcount , T ) ,其中 FromGrid 为起点网格编号, ToGrid 为终点网格编号, Gcount 为流动的人群总量。而对于单个网格GridID而言,可以求出其在时段 T 的人群进去流 Inflow 和出去流 Outflow ,则定义该时段的净流量为Netflow=Inflow-Outflow,表示在该时段这个网格的人群变化量,本文主要关注网格净流量。

3 城市人群集聚消散时空模式应用分析

3.1 模式分析方法

3.1.1 局部自相关分析
局部自相关反映要素与其相邻要素之间的相关程度,不仅可识别出变化比较显著的要素,还可识别出在空间位置上的高值集聚和低值集聚区 域[14,16-17]。本研究采用Anselin Local Moran′I来进行局部自相关分析,其计算公式为式(1)。
I i = x i - x ̅ S 2 j = 1 , j i N w ij ( x j - x ̅ ) (1)
式中: I i 为局部自相关指标;xi为空间单元要素的属性值,在本文中采用每个网格的Netflow作为要素分析属性; x ̅ xi的平均值;wij为空间权重矩阵[18]
3.1.2 自组织图聚类(SOM)

3.2 城市人群聚集消散时空模式应用结果与分析

(1) 人群聚集消散区域分析
采用网格的 Netflow 属性作为输入值,运用ArcGIS 10.1空间统计模块中Anselin Local Moran′s I方法对每个时段人群流进行局部空间自相关分析,不仅可识别每个时段城市中人群净流量 Netflow 变化显著的网格,而且可以得到这些显著的网格在城市中不同空间上的集聚分布情况。同时,该方法可将这些人群变化显著的网格分为4类:HH、HL、LH和LL。其中,HH和HL表示中心网格人群净流量 Netflow 较大,即进去流大于出去流,则该中心网格中人群正在聚集(增加);相反LL和LH表示中心网格人群的出去流大于进去流,认为该中心网格中人群正在消散(减少)。图2为早上通勤时间(07:00-09:00)和下午下班后(17:00-19:00)2个时段城市中人群聚集和消散在城市中的空间分布。
Fig. 2 Distribution of convergence and dispersion

图2 聚集与消散区域分布

(2) 聚散变化时间序列聚类
首先排除一天中所有时段都不显著的网格,得到1216个网格,每个网格一天中有23个时段。为了采用SOM法聚类,如果网格在某个时段人群正在聚集则赋值1,人群正在消散则赋值-1,如果网格人群 Netflow 不显著则赋值0,如图3所示,这样组成了一个1216×23的时间序列矩阵。采用SOM法对该矩阵进行训练,使用Davis-Bouldin指数进行聚类数判断,发现当聚类数为9时该指数最小,因此9类为最适合的聚类数。图4为这9种(C1,…,C9)聚散模式在城市中的空间分布。
Fig. 3 Time series matrix

图3 时间序列矩阵

Fig. 4 Spatial distribution of nine convergence-dispersion patterns

图4 9种聚散模式的空间分布

为了清晰地分辨出每种聚散模式人群随时间的变化特点,对每种模式的时间序列进行可视化,借用时间地理学概念[23-25],使用ArcScence在三维空间中显示,如图5所示。其中,Z轴表示时间,二维平面空间坐标(x, y)用相应的网格的中心坐标表示,蓝色表示人群聚集,红色表示人群消散,棕色表示人群变化不显著。
Fig. 5 The time variations of convergence and dispersion for each pattern

图5 每种模式人群的聚散时间变化

图5可清晰地看出每种模式的人群聚散时间变化特点:C1在早上6:00-10:00之间出现人群持续消散,而在下午16:00后会出现人群聚集且一直持续到凌晨;C2在一天中大部分时段都出现了人群聚集的现象;C3在早上7:00左右出现了人群聚集现象,但只持续了一个时段左右,在下午下班后并没有出现人群消散的现象,而在晚上20:00后会出现人群消散的现象,一直持续到凌晨;C4在早上 7:00-9:00出现了人群消散现象,在下午下班后17:00-19:00之间出现人群聚集的现象,C9与C4具有相反的人群聚散活动;C5在早上7:00左右出现人群聚集的现象,而C7在早上7:00出现了人群消散现象,在中午12:00左右,C5和C7同样出现相反的人群聚散活动,C5是先散后聚,C7是先聚后散;C6在凌晨1:00-3:00出现人群消散,在白天6:00-13:00会出现人群聚集现象,而从下午16:00开始会出现人群消散并且一直持续到凌晨;C8并没有出现明显的人群在某一时段聚集和消散现象,但这不是说明C8没有任何人群活动,只是人群聚散的时间段不集中而已。理解城市不同区域人群的这些聚散模式可帮助管理者进行交通管理、规划等。例如,公交公司可以根据这些聚散的时空模式,调整公交的运营时间或者优化公交站点分布以更好服务人群;出租车公司可根据不同区域人群聚散时间,实时地调度出租车帮司机尽快找到客源。
Fig. 6 The land use condition of each convergence-dispersion pattern

图6 聚散模式的平均土地利用分布

图6可看出,C1、C4和C7平均每个网格中居住用地比例最大,分别为50.44%,45.42%和39.66%,可见这3种聚散模式主要发生在城市中的居住区,在早上通勤时间大量人群离开居住地去上班,因此产生了人群消散现象,在下午下班后会出现人群聚集。这3种模式人群聚散持续时间存在差异,在土地利用上C7的工业用地(18.65%)比C1(10.39%)和C4(8.56%)多,C7主要分布在深圳市的工业园区,居住在这些区域的人群大多都在附近的工厂内上班,所以,C7类人群在早上消散持续的时间最短,约1 h左右,并且在中午12:00左右会出现先聚后散的现象,这是由于人群吃午饭活动引起的。C1与C4在空间分布上临近且土地利用状况相似,可能由于人群的工作性质不同或通勤距离差异导致C1(3 h及以上)在聚集和消散的持续时间上比C4(2 h左右)长。
Fig. 7 Spatial distribution of C2, C6 and C9

图7 C2、C6和C9的空间分布

C5和C9类土地利用都是以工业用地为主,分别为35.99%和33.28%,与C7类似,C5主要分布在深圳市的工业园区,这些工业园区工人主要在工厂附近,早上会出现人群的聚集且持续时间较短(1 h左右),并且在中午12:00左右会出现先散后聚的现象。C9的交通用地、公共用地和商业用地比C5多,主要覆盖了城市中IT高新科技企业(位于IT科技园内的腾讯、富士康、华为等),如图7所示,由于这2类区域的工作性质和通勤距离的不同,C9人群出现聚集或消散的时间持续时间(2 h左右)比C5长。C6类的交通用地(33.83%)比例最大,同时与其他类相比,其商业用地和公共用地是所有模式中占的比例也最多,分别为18.92%和17.03%,C6类区域主要分布在深圳市中最繁华的区域,如图7所示。该区域包括市民中心、车公庙、香蜜湖、华强北和老街商业区等,因此在白天大多数时间会吸引大量的人群,出现人群聚集现象,而在下午16:00后开始出现人群消散现象,一直持续到凌晨。

4 结论


