地球信息科学理论与方法

基于居民出行特征的北京城市功能区识别与空间交互研究

  • 陈泽东 ,
  • 谯博文 ,
  • 张晶 , *
展开
  • 1. 首都师范大学三维信息获取与应用教育部重点实验室,北京100048;2. 首都师范大学资源环境与旅游学院,北京100048
*通讯作者:张 晶(1966-),女,教授,研究方向为地理信息系统与应用。E-mail:

作者简介:陈泽东(1993-),男,硕士生,研究方向为空间分析与数据挖掘。E-mail:

收稿日期: 2017-11-11

  要求修回日期: 2018-01-17

  网络出版日期: 2018-03-20

基金资助

虚拟现实技术与系统国家重点实验室开放基金(01117220010020)

Identification and Spatial Interaction of Urban Functional Regions in Beijing Based on the Characteristics of Residents' Traveling

  • CHEN Zedong ,
  • QIAO Bowen ,
  • ZHANG Jing , *
Expand
  • 1. MOE Key Lab of 3D Information Acquisition and Application, Capital Normal University, Beijing 100048, China; 2. College of Resource Environment and Tourism, Capital Normal University, Beijing 100048, China
*Corresponding author: ZHANG Jing, E-mail:

Received date: 2017-11-11

  Request revised date: 2018-01-17

  Online published: 2018-03-20

Supported by

The Open Fund of National Key Laboratory of Virtual Reality Technology and Systems, No.01117220010020.

Copyright

《地球信息科学学报》编辑部 所有

摘要

受区域功能分化影响,城市居民出行呈现出特定的时序特征,因而不同的出行时序特征可以反映区域功能的差异性。同时,区域功能的交互特征可以通过居民出行的空间交互活动体现。大数据时代的到来,使得以GPS数据为代表的个体时空大数据可以从微观视角反映居民出行特征。本文采用个体时空大数据,应用数据挖掘方法,从居民感知视角研究城市区域功能的差异性与联系性。以北京六环为研究区域,采用规则格网划分城市地块,通过北京市3个月的出租车GPS数据提取地块的居民出行时序特征。采用期望最大化算法进行聚类分析,并结合兴趣点数据和居民出行调查实现功能区识别,识别出居住区、商业娱乐区等6类功能区。从距离和时间2个维度分析功能区之间的空间交互特征,发现功能互补性在一定程度上削弱了空间交互强度的距离衰减效应,同时功能交互呈现出显著的时序差异。

本文引用格式

陈泽东 , 谯博文 , 张晶 . 基于居民出行特征的北京城市功能区识别与空间交互研究[J]. 地球信息科学学报, 2018 , 20(3) : 291 -301 . DOI: 10.12082/dqxxkx.2018.170531

Abstract

Affected by the differentiation of regional functions, the urban residents' activities presents specific timing characteristics. Different traveling patterns could indicate differences in regional functions. Meanwhile, the interactive features of regional function can be reflected by the spatial interaction activities of residents' trips. The advent of the big data era makes the individual geographical big data represented by the GPS data feasible to reflect residents' trip characteristics from the micro perspective. In this paper, the individual geographical big data and data mining method are employed to study the diversities and connections of urban regional functions under the perspective of residential perception. The study area enclosed by the Sixth Ring Road in Beijing is divided into regular grids, for the convenience of extracting timing characteristics of residential activities from 3 months' GPS data on taxis. Specifically, the cluster analysis based on expectation maximization algorithm, the point of interest and the daily traveling characteristics of residents are used to identify functional regions into six types, such as residential districts and commercial entertainment districts. Finally, the spatial interaction characteristics between functional areas are analyzed from two dimensions of distance and time, revealing that functional complementation weakens the influence of distance on the spatial interaction strength and the functional interaction indicates significant temporal differences.

1 引言

在土地利用和经济活动的共同影响下,同类经济活动在空间上呈现高度聚集,因而形成了功能分区。同时,为满足城市居民的居住、工作、娱乐等不同生活需求,城市内部逐渐形成了居住区、工作区、商业区等不同的功能单元[1]。不同功能区的空间分布和组合模式是城市空间结构的重要组成部分, 反映着城市中各物质要素在空间上的分布和组合规律[2]
城市功能区是城市地理和城市规划者共同关注的焦点,传统研究的出发点都是从人口、用地、产业布局等宏观层面研究城市功能,通过土地利用、统计调查等方法对城市功能进行划分[3,4,5,6,7]。传统方法数据获取成本高,周期长,受主观判断影响较大。同时,缺乏人地交互,较少从居民感知的视角来划分具有共性特征的城市单元[8]。随着城市信息化的发展,以GPS数据和社交媒体数据为代表的,具有个体标记和时空语义信息的个体时空大数据[9],可以对居民的时空间活动进行观测[10]。个体时空大数据起初广泛应用于动态刻画居民在城市空间的时空活动和出行模式[11,12,13]。随着城市时空模式研究的深入,研究表明居民活动与城市空间结构之间有着紧密的联系[14,15]。城市空间的居民活动量的变化一定程度上反映了该区域承担的城市功能,即相似功能区域具有相似的居民活动模式。因此居民出行时序特征被应用于城市功能分区的系列研究中[16,17,18],从居民感知的视角对城市功能区进行划分。Liu等[19]通过城市不同地点出租车活动强度的变化,利用聚类方法发现了6类功能区域。Yuan等[20]利用出租车数据量化区域间的人的流动,分析出行时序特征,结合POI数据建立DMR模型来发现城市的不同功能区。王波等[21]借助微博数据,从时间、空间、活动分析城市活动空间的动态变化,并对城市空间进行区域功能划分。
城市地块在城市空间内部不可能孤立的存在,其必以物质、能量、人员和信息的形式发生着作用和联系,这种地理过程称为空间交互[22]。Liu等[23]从空间交互的视角出发,根据城市地块间的交互模式的相似性进行聚类分析,对城市土地利用进行分类。空间交互产生的重要条件之一为互补性[24],空间上彼此分离的城市功能区因功能互补需求,通过空间交互作用实现彼此间的联系,成为相互联系的有机整体。但现有的研究对不同功能区之间的空间交互特征探究较少。在此背景下,本研究以 500 m规则格网对北京六环区域划分城市地块,基于北京出租车GPS数据分析地块居民出行量时序特征。采用期望最大化算法对地块进行聚类分析,并结合兴趣点和居民出行特征,对聚类结果进行诠释,从居民感知视角实现不同区域功能的识别。与此同时,通过出租车上下车点对(OD)数据分析功能区之间的空间交互特征,从距离和时间两个维度探究功能区之间的联系性。研究结果对于了解北京城市功能区域分布和空间联系具有一定的理论和实践价值。

2 研究区域与数据源

2.1 研究区概况

本文以北京市六环为边界划定研究区域,其中包括传统的北京城六区,以及通州、大兴、顺义、房山等周边地区的部分区域。此区域作为北京主要的城镇区域,拥有大量的常住人口,且交通网络发达。本文考虑到北京城市空间布局以及区域功能混合性,选择以500 m规则格网对研究区域进行地块划分,最终将北京六环内区域划分为9286个规则地块,作为基本空间单元(图1)。
Fig. 1 Division results of urban land within the sixth ring road of Beijing

图1 北京六环地块划分结果

2.2 数据源

2.2.1 出租车数据
原始出租车GPS数据为2016年北京市5-7月约1.5万辆出租车的运营轨迹,由北京市多家出租车运营公司提供。其中,每条轨迹包含:出租车编号、经纬度坐标、是否空载(1载客,0为空载)、GPS采样时间(10 s间隔)、路程长度。原始数据经过空载轨迹清除、六环内非空载轨迹上下车坐标提取等数据清洗过程,共得到约2000万条上下车点对序列,数据格式如表1所示。
Tab. 1 Pick-ups and drop-offs of taxi GPS

表1 出租车GPS上下车点对序列

出租车
编号
出行
日期
上车点
时间
上车点
坐标
下车点
时间
下车点
坐标
111 2016-05-02 8:8:35 116.69 °E
39.85 °N
8:22:21 116.67 °E
39.88 °N
116 2016-05-03 6:56:21 115.97 °E
40.44 °N
7:29:05 115.97 °E
40.45 °N
通过对上下车点进行统计分析和居民出行调查,周一至周五工作日期间,居民出行时间和空间弹性较小,出行时序特征较为相似。周六和周末休息日期间,居民出行特征与工作日相比有较大差异。统计3个月内工作日和休息日期间,每个时刻的居民平均上下车数目(图2),对比发现相应时间段的出租车上下车数目在工作日和休息日呈现显著差异。如图2所示,0:00-5:00时段休息日的上下车量略高于工作日,其余时段工作日的出行量均高于休息日。工作日的上下车量随时间波动较为明显,8:00-9:00为出行的早高峰时期,12:00-13:00出现一个低谷值,13:00-14:00又迎来一个出行的高峰值。相比工作日,休息日的居民出行时间弹性较大,8:00-21:00上下车量随时间波动较为平缓,无特定出行时间倾向。
Fig. 2 The comparison of daily average amount of pick-ups and drop-offs between weekdays and weekends

图2 工作日和休息日每时刻平均上下车数量对比

2.2.2 兴趣点数据
兴趣点(Point of Interest,POI)是指可以抽象为点的,与人们生活密切相关的地理实体,是导航、智能交通、基于位置服务等应用的一种重要基础数 据[18],包含名称、类别、经纬度3方面信息。本研究通过百度地图开放平台(① 百度地图开放平台,拥有六大基础开放能力:定位、影像、出行、轨迹、数据、分析。百度地图API接口位置服务地址http://lbsyun.baidu.com/。),采集北京市2016年POI数据。由于POI数据的坐标信息进行了加密,需要对坐标进行转换。本文选取六环区域内共 352 471条数据,划分为74个小类。根据城市功能区域的基本属性,将POI数据合并为住宅、办公、教育等10个大类(图3)。
Fig. 3 Classification statistics of POIs within the sixth ring road of Beijing in 2016

图3 2016年北京六环内兴趣点分类统计

3 研究方法

本研究以出租车GPS数据和POI数据为基础,建立功能区识别模型。首先对研究区域进行格网化划分,并在Postgres数据库中进行存储。其次,提取出租车上下车点,统计分析各地块的居民出行时序谱线。之后,采用期望最大化算法对地块进行聚类分析,并结合POI功能指数和居民出行特征调查,实现功能区识别。最后,在功能分区的基础上,利用居民出行出租车上下车点对(OD),分析城市功能区的时空关联性,从距离和时间2个维度分析功能区之间的空间交互特征。

3.1 人流吸纳量时序谱线

由于出租车数据历时周期为3个月,时间复杂度较高,因此需要对原始数据进行简化处理。由上下车量时间分布特征可以看出,工作日和休息日具有显著的差别。因此将原始数据分为工作日和休息日两种情况,从轨迹数据提取出租车上下车点信息。同时将研究区域进行格网化并存储到Postgres数据库中,通过程序统计出每个地块每个小时的上下车量。上车量代表活动区域内人流流出量,下车量代表流入量。采用下车剩余活动量(式(1))来刻画某一时刻某一地块的人流吸纳量:
R i , j = D i , j - U i , j (1)
式中: i 为地块编号( i =1, 2, …, 9286); j 为时刻,包含工作日和休息日( j =1, 2, …, 48); R 为出租车下车剩余活动量; D 为下车量; U 为上车量。
由此可生成研究区域每个地块的人流吸纳量的时序谱线,对时序谱线采用Z-Score标准化处理,利用地块的时序谱线的相似性,通过聚类分析,实现功能区的识别。

3.2 地块聚类分析

聚类分析是把一个数据对象划分成子集的过程,每个子集是一个簇(cluster),使得簇中的对象彼此相似[25]。城市空间结构研究中,聚类算法被广泛的应用于城市功能区的识别,如K均值[26]、K中值[27]和OPTICS[18]聚类方法。基于本研究地块时序谱线的高维特征,采用在高维数据聚类中表现较好的期望最大化(EM)算法[28]。EM算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量[29]。例如,对于2个数据对象集x=(x1, …, xn)和y=(y1, …, yn)的联合概率 P ( x , y ; θ ) ,参数θ可以通过最大似然法进行估计。当y为隐藏变量,可以用初始的θ来计算y的期望值,该过程为E步,此后可以通过y值来计算参数θ的最大似然值即为M步。E步和M步不断进行迭代,直到收敛。本研究的地块聚类过程,首先E步计算每个城市地块的人流吸纳量的时序谱线的相似性,M步将地块聚为K类并赋予地块类别属性,不断迭代直至收敛,输出聚类结果。其中,聚类数目K值的确定需要综合考虑数据本身特征、分类的目的以及聚类效果的有效性,本研究主要采用轮廓系数Silhouette[30]和误差平方和SSE 2种指标来选择最优的聚类数目。首先筛选出活动量为0的地块单独划为一类,对其它城市地块计算聚类轮廓系数值和SSE值如图4所示。轮廓系数从K=2开始呈下降趋势,误差平方和SSE在K=6时迎来拐点。聚类过程中,Silhouette越大且SSE越小,可以得到较优的聚类结果。因此综合考虑,K=6是最优的聚类数目。
Fig. 4 The changes of Silhouette and SSE results with respect to different K values

图4 轮廓系数和误差平方和与K的关系

3.3 地块功能识别

根据地块人流吸纳量时序谱线对地块聚类分析后。可通过建立POI功能指数,并参照城市居民出行特征,构建功能区识别模型,对城市地块进行功能识别。
3.3.1 POI功能指数
居民出行时序特征可以反映出城市地块类别的差异,但无法了解其具体的功能类型。因此POI功能指数可作为识别城市地块功能的重要参数,统计分析由聚类得到的城市地块内部功能占比,计算每种功能区的频数密度(Frequency Density, FD)即每类POI在每类功能区内的密度,计算公式如下:
FD = 每类 POI 的数量 每种功能区域面积 (2)
根据POI数据合并结果,住宅有61 757个,餐饮有56 733个,而文化旅游只有6746个。不同类别POI数量级的差异会影响频数密度的准确性,因此对频数密度进行Min-max标准化(式(3))处理。
F D nor ( i , j ) = F D i , j - mi n i , j ma x i , j - mi n i , j (3)
式中: i 为功能区类别编码( i =1, 2, …, N); j 为POI类型编码( j =1, 2, …, 10); F D i , j 为功能区POI频数密度; mi n i , j 为密度最小值; ma x i , j 为密度最大值; F D nor ( i , j ) 则为标准值,同时计算功能区的频数密度百分比(Frequency Density Percentage,FDP)。
FDP = 标准化后每种功能区的每类 POI 频数密度 标准化后每种功能区所有 POI 频数密度之和 × 100 % (4)
3.3.2 城市居民出行特征
依据《2014年北京市交通发展年度报告》,2013年北京市中心城区日均出行总量为2779万人次,其中,出租车日均出行量为181万人次。六环内居民出行早高峰为7:00-8:00,晚高峰为17:00-18:00,而出租车出行高峰出现在8:00-9:00,到达峰值为9:00-10:00,比一般早高峰时间延迟1 h左右。刚性出行(上下班,上下学)仍是居民主要的出行目的,占出行量的44.25%,生活类出行(购物、就餐、休闲娱乐)达到37.12%(② 北京市交通发展研究中心,《2014年北京市交通发展年度报告》,2014。)。通过居民出行小样本调查,居民出行目的在工作日和休息日具有明显的差异,工作日主要为刚性出行,而休息日主要为生活类出行[31]

4 功能区识别结果

4.1 地块聚类结果

通过EM算法对地块时序谱线进行聚类分析,多次迭代得到6个具有明显差异的簇(C1-C6),显示出北京城市功能区有一定的分布规律,中心城区呈集聚分布,周边区域分布则较为离散。同时由于部分地块出租车GPS数据过少,且多为山地、森林等非城镇区域,故未能在聚类分析中有效识别,因此部分地块呈现空值,如图5所示。
Fig. 5 The results of parcel clustering

图5 地块聚类结果

4.2 功能识别结果

通过以上地块聚类结果,结合功能区POI功能指数分布(表2)以及工作日/休息日,功能区居民出行流量特征(图6),对聚类结果进行功能区识别。将城市区域功能发展程度和混合性较高的地块归纳为成熟建成区,反之为一般建成区。C1位于城市边缘地区且功能不完善、人流较少,为待开发地区;C2-C4主要位于中心城区,功能完善,人流较大,为成熟建成区;C5、C6分布于城市郊区及过渡地带,为一般建成区。
Tab. 2 POI exponential distribution of functional regions

表2 功能区POI指数分布

POI类别 C1 C2 C3 C4 C5 C6
FDnor FDP FDnor FDP FDnor FDP FDnor FDP FDnor FDP FDnor FDP
住宅 0.0000 0.00 0.8731 13.48 1.0000 22.32 0.4755 5.28 0.5479 32.49 0.3079 10.95
交通 0.0000 0.00 0.9231 14.25 0.2514 5.61 1.0000 11.07 0.1677 9.94 0.4402 15.65
办公 0.0000 0.00 0.7378 11.39 0.3532 7.88 1.0000 11.07 0.1050 6.22 0.3519 12.51
餐饮 0.0000 0.00 0.4702 7.26 0.2729 6.09 1.0000 11.07 0.1089 6.46 0.1461 5.20
酒店 0.0000 0.00 0.7792 12.03 0.4608 10.28 1.0000 11.07 0.1577 9.35 0.2488 8.85
教育 0.0000 0.00 0.7631 11.79 1.0000 22.32 0.5565 6.16 0.2359 13.99 0.3104 11.04
购物 0.0000 0.00 0.3473 5.36 0.1754 3.91 1.0000 11.07 0.0609 3.61 0.1281 4.56
生活服务 0.0000 0.00 0.5352 8.26 0.4275 9.54 1.0000 11.07 0.1690 10.02 0.1803 6.41
文化旅游 0.0000 0.00 0.6990 10.79 0.3230 7.21 1.0000 11.07 0.0537 3.18 0.5810 20.66
休闲娱乐 0.0000 0.00 0.3502 5.39 0.2165 4.84 1.0000 11.07 0.0800 4.74 0.1172 4.17

注:FDnor为频数密度;FDP为频数密度百分比/%

Fig. 6 Residents travel flow of six functional areas between weekdays and weekends

图6 工作日/休息日六种功能区居民出行流量

(1)待开发地区(C1)。此功能主要位于五环外城市外延区域,人流量极少,且基础设施建设不够健全,处于城市建设开发阶段,为城市待开发地区。
(2)成熟居住区(C2)。此功能区具有大量成熟高级住宅区,占据城市中心大部分区域,且为居民生活提供服务的交通、教育、文化休闲等设施配套均衡。同时人流出行量极大,工作日出行高峰分别出现在9:00-10:00、13:00-14:00的上班时间段和18:00-20:00的下班时间段。同时,相对于工作日,休息日没有出现明显的出行高峰时段,呈现出明显的居住区出行模式。
(3)科教文化区(C3)。该区域POI分布比例最高的是住宅和教育,说明该区域主要承担的是教育和居住的职能,同时生活服务等配套设施也较为健全。大学生出行时间比较自由,20:00-22:00有一段返程高峰,比一般居民返程高峰延迟2个小时。
(4)成熟商业娱乐区(C4)。该功能区具有大量的办公、餐饮、购物、酒店和休闲娱乐等设施,白天的出行流量比较平稳,19:00-20:00为出行下车高峰,说明晚间有大量的消费购物行为,21:00-22:00迎来上车量的高峰。
(5)新兴居住区(C5)。该功能区主要分布在离中心城区相对偏远的郊区,居住占据主要的功能,同时具有一定的生活服务配套设施。由于处于较为偏远的郊区,多为公共交通出行为主,出租车出行量较低。工作日(22:00-23:00)出现下车量高峰,多为上班族晚上打车回家。
(6)文化旅游区(C6)。从该区域POI数据分布特征可以看出,文化旅游功能处于首要位置。在空间上分布广泛且较为分散,休息日出行流量呈均匀分布。
从识别结果上看,待开发区主要为新建城区,位置比较偏远,基础设施不够完善;成熟居住区主要分布于五环内的住宅小区,基础配套设施完善;科教文化区主要分布于海淀区,多为大学的集聚地,如北京大学、清华大学等;部分典型的商业娱乐区能被较好的识别出,如西单、王府井、三里屯等北京中心商务区,以及一些较为分散的商业娱乐中心;新兴居住区相对于成熟居住区距城市中心较远,多分布于五环外,较为明显的区域有回龙观、天通苑以及通州新区等居住区;文化旅游区分布较为分散,多为公园、文化景点等旅游区域,如故宫、颐和园、圆明园、朝阳公园等。

5 功能区空间交互特征

功能互补性是功能区之间产生空间交互的重要前提,空间上彼此独立的功能区因此成为一个有机的整体。基于之前功能区划分结果,利用出租车的上下车点对(OD),通过判别居民上下车位置所处地块的功能属性,分析北京城市6种功能区之间的空间交互特征,从距离和时间2个维度进行分析。

5.1 空间交互距离特征

在空间交互中,交互强度随着距离的增长相应减弱,称为距离衰减。本研究中,根据下车点对(OD)的位置,采用欧式距离度量功能地块之间的距离长度。对所有功能区之间的交互强度进行全局分析,发现功能区之间空间交互强度随距离呈现指数衰减(图7),可用单指数函数进行拟合,R2为0.9976,如式(5)所示。
y = A 1 × exp - x t 1 + y 0 (5)
式中: A 1 为振幅; t 1 为时间常数; y 0 为偏正系数; 1 / t 1 为衰减系数,衰减系数越高表明距离对交互强度的影响越大。
Fig. 7 Interaction strength with distance distribution of functional areas

图7 功能区交互强度与距离分布

对每类功能区内部和与其存在交互的其它功能区之间的空间交互强度进行分析,发现也呈现距离衰减效应,可用单指数函数较好的拟合,同时衰减系数呈现一定的差异性。为了更好的体现距离衰减的差异性,通过单对数坐标系体现功能区之间的交互强度随距离的分布(图8)。
Fig. 8 Interaction strength with distance distribution between six functional areas

图8 6种功能区之间交互强度与距离分布

6种功能区之间空间交互的距离衰减时间常数(衰减系数为其倒数)如表3,发现相同功能内部的衰减系数基本为最高值,距离对空间交互强度的影响较大。相异功能区之间的衰减系数较小,体现功能互补在一定程度上削弱了空间交互强度的距离衰减效应。成熟居住区(C2)与待开发区(C1)、新兴居住区(C5),成熟商业娱乐区(C4)与科教文化区(C3)、文化旅游区(C6)的衰减系数偏小,说明其在功能互补性上较强。较强的功能互补需求,在一定程度上克服了距离的衰减阻力作用。
Tab. 3 Time constants of distance attenuation fitting between six functional areas

表3 6种功能区交互距离衰减时间常数

C1 C2 C3 C4 C5 C6
C1 4103 19 740 8115 3624 4232
C2 19 740 4518 5542 5935 14 370 5466
C3 8115 5542 4103 10 029 5516 5043
C4 5936 10 029 3817 8431
C5 3624 14730 5516 2502 4431
C6 4232 5466 5043 8431 4431 3116
注:∞为非单指数衰减系数

5.2 空间交互时间特征

分析所有功能区之间的日均交互次数随着时间的变化规律(图9),可以发现空间交互强度在凌晨4:00时为一天中的最低谷,之后呈快速上升趋势,9:00时达到高峰。同时工作日与休息日呈现较大的差异性,工作日出现3个明显的峰值(8:00- 9:00,13:00-14:00,21:00-22:00),波动幅度较大,具有明显的时序特征,休息日除在19:00时出现波谷外,整体的波动幅度较小,进一步探究每类功能区与其它功能区之间交互的时序规律(图10)。
Fig. 9 Interaction strength with time distribution of functional areas

图9 功能区交互强度与时间分布

Fig. 10 Interaction strength with time distribution between six functional areas

图10 6种功能区之间交互强度与时间分布

(1)待开发地区(C1)与成熟商业娱乐区(C4)之外的各功能区的交互强度在工作日8:00-9:00达到峰值,随后随时间显著下降,在休息日峰值较为平稳。
(2)成熟居住区(C2)交互时序规律与待开发地区(C1)相类似,但与科教文化区(C3)以及新兴住宅区(C5)交互强度在21:00达到峰值。
(3)科教文化区(C3)与其余各功能区交互强度规律相一致,工作日和休息日,从8:00-22:00都维持了一个高峰,整体波动幅度较小,交互强度受时序影响较小。
(4)成熟商业区(C4)与不同功能区之间存在时间交互模式差异,与成熟居住区(C2)在工作日 9:00-10:00达到峰值,休息日较为延后,10:00-11:00达到峰值。与科教文化(C2)和新兴住宅区在 20:00-21:00达到峰值,休息日则更为延后。
(5)新兴住宅区(C5)除与待开发区(C1)外,各项功能区交互强度在工作日呈现8:00-9:00和 21:00-22:00的双峰型,而在休息日峰值较为平稳。
(6)文化旅游区(C6)与其它功能区交互强度整体波动幅度较小,工作日与休息日趋于一致,无明显差异。

6 结论

本文从居民出行特征出发,利用出租车GPS个体时空大数据,提取城市地块人流吸纳量时序变化曲线,采用EM方法根据相似性进行地块聚类分析,以POI和居民出行特征调查为辅助,从居民感知的视角对北京六环内城市功能区进行识别,得到6类功能区,分别为待开发区、成熟居住区、科教文化区、成熟商业娱乐区、新兴居住区和文化旅游区。通过识别结果发现,五环内主要以成熟居住、科教文化、商业娱乐、旅游文化为主要功能区,而新兴居住、待开发区主要分布于五环以外区域。北京城市功能逐渐往周边扩展,北部地区城市功能较南部地区更为完善,城市化发展水平更高。同时,东部通州地区与中心城区的联系更加紧密,区域功能也愈加成熟完善。
同时,利用出租车OD点对分析6类功能区之间的空间交互特征,探究功能区之间的时空关联性,从距离特征和时间特征展开讨论。功能区之间的交互强度随距离呈现指数衰减现象,功能互补性在一定程度上削弱了交互强度的距离衰减效应。如商业娱乐区与文化旅游区、成熟居住区与待开发区之间的距离衰减系数较小,反映其功能互补需求较大。同时,功能区之间交互强度因功能互补的时间差异性而呈现不同的时间规律,具有明显的时序差异性。如成熟商业娱乐区与成熟居住区交互的高峰期在工作日为9:00-10:00,而与科教文化区和新兴住宅区的高峰期为20:00-21:00,存在明显功能互补时序差异。
由于数据和方法等因素的影响,本次研究仍有不足之处。出租车作为居民日常出行方式,能在一定程度上反映居民出行模式,但与实际情况存在一定偏差,未来应结合公交数据、手机数据等多源时空大数据来更好地刻画居民出行模式。此外,地块功能混合是广泛存在的,面状单元作为基本地理单元可能会出现可变面积单元的问题。因此,选择线状单元,例如在街道视角上开展城市问题研究是否更加有效合理,需要进一步的分析和研究。

The authors have declared that no competing interests exist.

[1]
周干峙. 城市及其区域——一个典型的开放的复杂巨系统[J].城市轨道交通研究,2009,26(12):1-4.

[Zhou G Z.A city and its region: A typical huge system of open complexity[J]. Urban Mass Transit, 2009,26(12):1-4.]

[2]
胡俊.中国城市:模式与演进[M].北京:中国建筑工业出版社,1995.

[Hu J.Chinese cities: pattern and evolution [M]. Beijing: China Building Industry Press, 1995.]

[3]
Tian G, Wu J, Yang Z.Spatial pattern of urban functions in the Beijing metropolitan region[J]. Habitat International, 2010,34(2):249-255.The morphology of a city affects its ecological and socioeconomic functions, and thus how a city is spatially structured has important bearings on urban sustainability. The paper analyzes the spatial pattern of Beijing in relation to its urban functions. Our results show that the 6 concentric ring-roads in Beijing provide a basic framework for the city's overall spatial pattern, and also give its apparent resemblance to the classic concentric zone theory. The paper identifies 5 concentric zones for Beijing based on a suite of urban functions. However, there are significant differences between the urban spatial pattern of Beijing and that depicted in the classic concentric zone theory. The study sheds new light on the urban morphology of one of the major Chinese cities, and provides needed information for developing plans to diffuse urban functions in Beijing.

DOI

[4]
吴文恒,徐泽伟,杨新军.功能分区视角下的西安市发展空间分异[J].地理研究,2012,31(12):2173-2184.

[Wu W H, Xu Z W, Yang X J.Spatial development differentiation in Xi'an from the perspective of urban functional zoning[J]. Geographical Research, 2012,31(12):2173-2184.]

[5]
王慧. 城市"新经济"发展的空间效应及其启示——以西安市为例[J].地理研究,2007,26(3):155-167.以知识为基础、以计算机与信息技术为依托、技术与制度创新驱动、兼跨第二与第三产业并以服务业居重、高度外向而趋于全球化的当代"新经济"的兴起,正从诸多方面影响和改变着城市.本文以西安市为实证分析案例,依据对"新经济"内在禀赋特性的认识,从城市"产业区"格局重构、城市办公楼宇设施增长、高新技术产业区的CBD化、产业与居住功能分区的模糊化、城市经济与社会空间的极化等方面对城市"新经济"发展的空间影响效应进行了分析,并就其对于城市规划与决策的启示予以探讨.

DOI

[Wang H.Spatial impacts of new economies and the implications for city planning and decision-making[J].Geographical Research,2007,26(3):155-167.]

[6]
辜寄蓉,陈先伟,杨海龙.城市功能区划分空间聚类算法研究[J].测绘科学,2011,36(5):65-67.随着经济的发展,城市化建设中的土地资源的粗放式利用对经济发展的制约日益明显,集约评价作为一种有效的管理手段越来越受到重视。城市土地集约评价中城市功能区划分是其研究基础。本文在城市地籍数据库的基础上,以城市宗地为基础研究单元,分析并确定国土资源部的《城市土地集约利用潜力评价规程(试行)》中对功能区划分的约束条件,研究城市功能区自动划分方法,采用Delaunay三角剖分和格雷厄姆算法建立城市功能区的自动划分算法。在.NET和Geomedia平台上进行软件实现,为城市土地集约利用的研究提供参考。

[Gu J R, Chen X W, Yang H L.Multi-source argo data sharing and visualization based on web service[J]. Science of Surveying and Mapping, 2011,36(5):65-67.]

[7]
王艳,宋振柏,吴佩林.城市功能分区的空间聚类方法研究及其应用——以济南市为例[J].地域研究与开发, 2009,28(1):27-31.

[Wang Y, Song Z B, Wu P L.A study on spatial clustering of urban function partition: A case study of Jinan[J]. Areal Research and Development, 2009,28(1):27-31.]

[8]
秦萧,甄峰.基于大数据应用的城市空间研究进展与展望[C]// 2013中国城市规划年会,2013.

[Qin X, Zhen F.Progress and prospect of urban space research based on large data application[C]//2013 Annual Meeting of China's Urban Planning, 2013.]

[9]
Lu Y, Liu Y.Pervasive location acquisition technologies: Opportunities and challenges for geospatial studies[J]. Computers Environment & Urban Systems, 2012,36(2):105-108.The rapid development and increasing availability of various location acquisition technologies provide geospatial studies with both opportunities and challenges. These opportunities and challenges are discussed in this paper focusing on the following three aspects: the massive acquisition of location data and data quality, the analysis of massive location data and pattern discovery, and privacy protection for massive location data. This paper examines the current status of and the potential opportunities for geospatial research in these three areas and notes the major challenges. Finally, the development of this special issue is described, and the four articles included in this special issue are presented.

DOI

[10]
刘瑜,肖昱,高松,等.基于位置感知设备的人类移动研究综述[J].地理与地理信息科学,2011,27(4):8-13.每个人在地理空间内的移动看似随机而没有规律,然而一个较大规模人群的移动却隐藏着特定的模式.为了研究某些地理问题,如交通、疾病传播等,可以从个体行为出发,在地理信息系统的支持下,发现人类移动模式,并构筑基于个体的模拟模型,从而建立微观和宏观之间的桥梁,并支持相应的决策过程.信息通讯技术的发展,一方面改变了人们的空间行为模式,另一方面使得基于位置感知设备获取海量人类移动数据成为可能.近年来,上述研究一直是地理信息科学及相关领域的热点,该文对此进行了总结和评述.

[Liu Y, Xiao Y, Gao S, et al.A review on morphological rehabilitation based on rule-oriented classification[J]. Geography and Geo-Information Science, 2011,27(4):8-13.]

[11]
Reades J, Calabrese F, Ratti C.Eigenplaces: Analysing cities using the space - time structure of the mobile phone network[J]. Environment & Planning B Planning & Design, 2009,36(5):824-836.Several attempts have already been made to use telecommunications networks for urban research, but the datasets employed have typically been neither dynamic nor fine grained. Against this research backdrop the mobile phone network offers a compelling compromise between these extremes: it is both highly mobile and yet still localisable in space. Moreover, the mobile phone’s enormous and enthusiastic adoption across most socioeconomic strata makes it a uniquely useful tool for conducting large-scale, representative behavioural research. In this paper we attempt to connect telecoms usage data from Telecom Italia Mobile (TIM) to a geography of human activity derived from data on commercial premises advertised through Pagine Gialle, the Italian ‘Yellow Pages’. We then employ eigendecomposition—a process similar to factoring but suitable for this complex dataset—to identify and extract recurring patterns of mobile phone usage. The resulting eigenplaces support the computational and comparative analysis of space through the lens of telecommuniations usage and enhance our understanding of the city as a ‘space of flows’.

DOI

[12]
Andres Sevtsuk, Carlo Ratti.Does urban mobility have a daily routine? Learning from the aggregate data of mobile networks[J]. Journal of Urban Technology, 2010,17(1):41-60.Does the distribution of Rome's population follow routine hourly, daily, or weekly patterns? And if it does, how do such patterns vary in different parts of the city? This paper reports on our investigation of the aggregate patterns of urban mobility in Rome, Italy for which we used novel data from a mobile phone operator. Unlike research that chartered urban mobility through individual travel surveys, our research determined the aggregate distribution of Rome's population over time by using the volume of call activity in mobile network cells as the unit of spatial analysis. In this paper, we first illustrate and confirm that there is significant regularity in urban mobility at different hours, days, and weeks. We then show how mobility between network cells differs at various times, and we account for the differences by using demographic, economic, and (built) environment indicators.

DOI

[13]
龙瀛,张宇,崔承印.利用公交刷卡数据分析北京职住关系和通勤出行[J].地理学报,2012,67(10):1339-1352.基于位置服务(Location Based Service,LBS)技术为研究城市系统的时空动态规律提供了新的视角,已往多基于移动通讯(GSM)、全球定位系统(GPS)、社会化网络(SNS)和无线宽带热点(Wi-Fi)数据开展研究,但少有研究利用公交IC卡刷卡数据进行城市系统分析。普遍存在的LBS数据虽然具有丰富的时间和空间信息,但缺乏社会维度信息,使其应用范围受到一定限制。本文基于2008年北京市连续一周的公交IC卡(Smart Card Data,SCD)刷卡数据,结合2005年居民出行调查、地块级别的土地利用图,识别公交持卡人的居住地、就业地和通勤出行,并将识别结果在公交站点和交通分析小区(TAZ)尺度上汇总:①将识别的通勤出行分别从通勤时间和距离角度,与居民出行调查数据和其他已有北京相关研究进行对比,显示较好的吻合性;②对来自3大典型居住区和去往6大典型办公区的通勤出行进行可视化并对比分析;③对全市基于公交的通勤出行进行可视化,并识别主要交通流方向。本研究初步提出了从传统的居民出行调查和城市GIS数据建立规则,用于SCD数据挖掘的方法,具有较好的可靠性。

DOI

[Long Y, Zhang Y, Cui C Y. Identifying commuting pattern of Beijing using bus smart card data[J]. Acta Geographica Sinia, 2012,67(10):1339-1352.]

[14]
M F G, B K, D G J.A factorial model of aggregate spatio-temporal behavior: Application to the diurnal cycle[J]. Geographical Analysis, 1993,25(4):277-294.The cross-sectional nature of much social data, coupled with the static view provided by maps and current spatial data handling software, have produced a tradition of research on urban spatial structure that is largely two-dimensional and derived from residential locations. The paper presents an analysis of a space-time diary data set collected in Halifax, Nova Scotia. A series of transformations are used to convert the individual diary records to a three-mode matrix of intensities, which is then analyzed using the PARAFAC three-mode factor model. Home/work is found to be the strongest organizing dimension of the urban space-time, followed by entertainment, shopping, and education / work. We show how these dimensions appear to varying degrees in different locations, time periods, and human activities. The paper argues for a dynamic view of urban spatial structure in which only the physical facilities remain static.

DOI

[15]
钮心毅,丁亮,宋小冬.基于手机数据识别上海中心城的城市空间结构[J].城市规划学刊,2014(6):61-67.

[Niu X Y, Ding L, Song X D.Identifying urban spatial structure of downtown Shanghai based on mobile phone data[J]. Urban Planning Forum, 2014(6):61-67.]

[16]
Qi G, Li X, Li S, et al.Measuring social functions of city regions from large-scale taxi behaviors[C]// IEEE International Conference on Pervasive Computing and Communications Workshops. IEEE, 2011:384-388.

[17]
韩昊英,于翔,龙瀛.基于北京公交刷卡数据和兴趣点的功能区识别[J].城市规划,2016,40(6):52-60.城市在其发展过程中逐渐形成居住区、工业区和商业区等不同的功能区。识别这些功能区并理解其分布特征,对于把握城市结构以及制定和使用科学合理的规划具有重要作用。本研究基于2008年4月北京市连续一周的7797余万条公交IC卡刷卡数据,将其转换为每个公交站台流量的二维时间序列数据,结合居民日常出行行为研究,利用数据挖掘技术,构建了基于公交刷卡数据和兴趣点的城市功能区识别模型,并将识别结果在交通分析小区尺度上汇总。研究结果显示,利用城市功能区识别模型,通过冗余数据的筛除和特征的创建实现对数据的有效降维,并选用期望最大化算法对处理后的数据进行聚类分析,结合居民日常出行相关特征和兴趣点分布数据对聚类结果进行诠释,可以快速有效地识别出与北京市土地利用现状地图具有一定匹配度的北京市各功能区。本研究的方法可以辅助规划人员和公众有效识别和理解复杂的城市空间结构,对城市地理及规划研究具有重要的理论和实践价值。

DOI

[Han H Y, Yu X, Long Y.Identifying urban functional zones using bus smarts card data and points of interest in Beijing[J]. City Planning Review, 2016,40(6):52-60.]

[18]
陈世莉,陶海燕,李旭亮,等.基于潜在语义信息的城市功能区识别——广州市浮动车GPS时空数据挖掘[J].地理学报,2016,71(3):471-483.

[Chen S L, Tao H Y, Li X L, et al.Discovering urban functional regions using latent semantic information: Spatiotemporal data mining of GPS data of floating cars in Guangzhou[J]. Acta Geographica Sinia, 2016,71(3):471-483.]

[19]
Liu Y, Wang F H, Xiao Y.Urban land uses and traffic 'Source-Sink Areas': Evidence from GPS-Enabled taxi data in Shanghai[J]. Landscape and Urban Planning, 2012,106(1):73-87.Most of the existing literature focuses on estimating traffic or explaining trip lengths from land use. This research attempts to reveal intraurban land use variations from traffic patterns. Using a seven-day taxi trajectory data set collected in Shanghai, we investigate the temporal variations of both pick-ups and drop-offs, and their association with different land use features. Based on the balance between the numbers of drop-offs and pick-ups and its distinctive temporal patterns, the study area is classified into six traffic ‘source-sink’ areas. These areas are closely associated with various land use types (commercial, industrial, residential, institutional and recreational) as well as land use intensity. The study shows that human mobility data from location aware devices provide us an opportunity to derive urban land use information in a timely fashion, and help urban planners and policy makers in mitigating traffic, planning for public services and resources, and other purposes.

DOI

[20]
Yuan J, Zheng Y, Xie X.Discovering regions of different functions in a city using human mobility and POIs[C]// ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ACM, 2012:186-194.

[21]
王波,甄峰,张浩.基于签到数据的城市活动时空间动态变化及区划研究[J].地理科学, 2015,35(2):151-160.lt;p>借助新浪微博,引入位置服务大数据,以南京市为例,从时间、空间、活动3个方面分析城市活动空间的动态变化,并在掌握变化规律的基础上进一步划分城市活动区域.研究发现:传统的作息规律仍然支配着人们的签到活动,时间与活动内容间的对应关系仍然存在;居民活动在工作日、休息日与节假日,以及主城与外围地区存在差异;城市活动空间在一天内经历了相对分散-集聚-进一步集聚-分散-相对集聚的动态变化;城市活动区域可以划分为就业活动区、居住活动区、休闲活动区、夜生活活动区,及综合活动区;活动功能区呈现出混合化与边界模糊化的特征.</p>

[Wang B, Zhen F, Zhang H. Study on the dynamic changes of urban spatiotemporal activity and activity zoning based on check-in data[J]. Scientia Geographica Sinica, 2015,35(2):151-160.]

[22]
Ullman E.A theory of location for cities[J]. American Journal of Sociology, 1941,46(6):853-864.Many studies have shown that cities are not scattered over the earth illogically, but a general theory of location has been lacking. The orderly spacing of towns as service centers forms a basis for a settlement-distribution theory. Service centers range in size from hamlets performing a few simple functions up to large cities providing specialized services for a large tributary region composed of the service areas of smaller towns. Thus, in an entirely uniform land the larger the town, the larger its tributary area should be. On the basis of a South German "norm" of areal organization Christaller has worked out deductively the central-place theory for distribution of settlements. He sets up typical settlements sizes, determines the normal number of towns in each class, as well as the spacing of the centers, and the area and population of their tributary areas. The theory applies better to agricultural areas than to industrial districs. It is not static but changes to fit changes in underlying conditions, particularly transportation. The system also varies from place to place in the world in line with population density, type of agriculture, governmental organization, and many other factors. These underlying regional differences make possible comparisons between central-place systems in the United States and elsewhere. After further refinement some form of the theory should provide a logical framework for study of existing distributions and perhaps for planning optimum spacing of new settlements.

DOI

[23]
Liu X, Kang C, Gong L, et al.Incorporating spatial interaction patterns in classifying and understanding urban land use[J]. International Journal of Geographical Information Science, 2016,30(2):334-350.Land use classification has benefited from the emerging big data, such as mobile phone records and taxi trajectories. Temporal activity variations derived from these data have been used to interpret and understand the land use of parcels from the perspective of social functions, complementing the outcome of traditional remote sensing methods. However, spatial interaction patterns between parcels, which could depict land uses from a perspective of connections, have rarely been examined and analysed. To leverage spatial interaction information contained in the above-mentioned massive data sets, we propose a novel unsupervised land use classification method with a new type of place signature. Based on the observation that spatial interaction patterns between places of two specific land uses are similar, the new place signature improves land use classification by trading off between aggregated temporal activity variations and detailed spatial interactions among places. The method is validated with a case study using taxi trip data from Shanghai.

DOI

[24]
许学强,周一星,宁越敏.城市地理学-第2版[M]. 北京: 高等教育出版社,2009.

[Xu X Q, Zhou Y X, Ning Y M.Urban geography, second edition[M]. Beijing: Higher Education Press, 2009.]

[25]
JiaweiHan, MichelineKamber, JianPei,等.数据挖掘概念与技术[M].北京:机械工业出版社,2012.

[JiaweiHan, MichelineKamber, JianPei, et al. Data Mining Concepts and Techniques[M]. Beijing: China Machine Press, 2012.]

[26]
Víctor Soto.Automated land use identification using cell-phone records[C]// ACM International Workshop on Mobiarch. ACM, 2011:17-22.

[27]
程静,刘家骏,高勇.基于时间序列聚类方法分析北京出租车出行量的时空特征[J].地球信息科学学报,2016,18(9):1227-1239.lt;p>受城市资源配置、区域功能分化的影响,城市中居民的出行往往呈现出特定的模式和规律,而这种出行模式的背后反映出城市的功能结构。城市车辆GPS导航的广泛使用,以及车辆轨迹数据的大量获取,为分析城市居民出行模式及理解城市功能结构提供了数据支撑。本文以道路分割城市得到的地块为研究单元,利用北京市一个月的出租车轨迹数据,对北京居民的出行模式及城市功能格局进行分析。在轨迹数据分析中,本文从轨迹数据中提取每个地块的出行量时间序列信息,然后采用结合时间序列距离度量和时间序列自身相关性的聚类方法,对出行量时间序列数据进行聚类分析,从而研究乘客出行的时空分布特征,最后结合北京市POI数据,探讨了不同区域乘客出行规律和区域功能类型的相互关系。结果表明,出租车出行量时间序列模式在工作日和周末间存在明显差异。此外,工作日的2个出行高峰与通常的通勤早晚高峰不同。由出行量所得的区域聚类结构,除具有重要交通枢纽功能的地块外,总体上以市中心为圆心大致呈同心圆分布,且距离市中心越远出行量越小。研究结果对于分析北京市居民出行行为、辅助城市交通规划具有一定的意义。</p>

DOI

[Cheng J, Liu J J, Gao Y.Analyzing the spatio-temporal characteristics of Beijing′s OD trip volume based on a clustering method of time series[J]. Journal of Geo-information Science, 2016,18(9):1227-1239.]

[28]
于翔. 基于城市公交刷卡数据和兴趣点的城市功能区识别研究[D].杭州:浙江大学,2014.

[Discovering zones of different functions using bus smart card data and points of interest: A case study of Beijing[D]. Hangzhou: Zhejiang University, 2014.]

[29]
Do C B.What is the expectation maximization algorithm?[J]. Nature Biotechnology, 2008,26(8):897-899.Nature Biotechnology journal featuring biotechnology articles and science research papers of commercial interest in pharmaceutical, medical, and environmental sciences.

DOI PMID

[30]
Rousseeuw P J.Silhouettes: A graphical aid to the interpretation and validation of cluster analysis[J]. Journal of Computational and Applied Mathematics, 1987,20:53-65.A new graphical display is proposed for partitioning techniques. Each cluster is represented by a so-called silhouette, which is based on the comparison of its tightness and separation. This silhouette shows which objects lie well within their cluster, and which ones are merely somewhere in between clusters. The entire clustering is displayed by combining the silhouettes into a single plot, allowing an appreciation of the relative quality of the clusters and an overview of the data configuration. The average silhouette width provides an evaluation of clustering validity, and might be used to select an ‘appropriate’ number of clusters.

DOI

[31]
刘冬梅,齐彤岩,张可,等.北京市居民出行时间小样本调查分析[J].交通运输系统工程与信息,2009,9(2):23-26.为了了解北京市居民出行时间相关特征,特别是出行时间成本的数值情况,组织了一次小样本出行时间特征调查,得到1 305份有效样本.首先介绍了调查方案的设计,包括调查指标的选择、样本量的估算、调查地点的选择等,然后对样本数据按方式、出行目的分别进行了出行时间均值的统计计算,离散系数较小表明了均值的代表性较好.在调查得到各出行方式对应的人均工资、出行时间、出行目的的数据基础上,计算出单次出行各方式、各目的对应的平均出行时间成本.结果表明,以小汽车、公共交通为出行方式的工作、商务出行,其单次出行时间成本约为10~17元.说明如果提高整个路网的交通系统效率,全社会节约的时间成本是相当可观的.

DOI

[Liu D M, Qi T Y, Zhang K, et al.A survey of Beijing residents' traveling time in small samples[J]. Journal of Transportation Systems Engineering and Information Technology, 2009,9(2):23-26.]

文章导航

/