  中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室,北京 100101
  中国科学院大学资源与环境学院,北京 100049
  北京联合大学应用文理学院,北京 100191
  江苏省地理信息资源开发与利用协同创新中心,南京 210023
Identifying Functional Regions Based on the Spatio-temporal Pattern of Taxi Trajectories

Supported by

National Natural Science Foundation of China, No.41590845, 41771477, 41671165

Key Programs of the Chinese Academy of Sciences, No.QYZDY-SSW-DQC007

Innovation Project of State Key Laboratory of Resources and Environment Information System.


出租车数据作为城市大数据重要来源,其上车行为和下车行为直接反映城市人群出行行为特征,帮助城市规划者发现城市人群出行规律和城市功能结构。但是出租车数据隐含多维度信息,一维或者二维模型不足以表达和挖掘其蕴含的多维信息,因此本文选择可以承载多维数据的张量模型对出租车OD(上车/下车)数据进行时空模式挖掘。本文将北京六环区域划分为500 m×500 m格网,采用北京市2012年11月1-16日的出租车OD数据,分别构建O点和D点张量,利用张量分解模型从日尺度、时段尺度揭示出租车用户出行时间模式,同时获取不同时段对应的出租车用户出行空间模式,并推测空间模式包含的语义属性。本文结合城市兴趣点(Point of Interest, POI)数据,提高空间模式语义属性推测的准确性,识别出租车用户出行功能区。结果表明:出租车用户出行时间符合工作日和休息日的早高峰、日间、晚高峰以及夜间模式;对应8种时间模式,出租车用户出行包含8种空间模式,每一种空间模式都是对应时间模式下的上下车热点区域,因此空间模式的变化表明城市人群在不同的时间点,到达不同的场所,进行不同的活动,间接表达空间功能的动态变化;区域的功能不是单一静态的,而是随着时间在不断地变化,是不同时段功能的组合。本文揭示出租车OD数据中隐含的出租车用户出行模式和空间功能动态变化,对利用人类行为时空模式研究区域空间功能结构具有科学参考价值。


刘菊 , 许珺 , 蔡玲 , 孟斌 , 裴韬 . 基于出租车用户出行的功能区识别[J]. 地球信息科学学报, 2018 , 20(11) : 1550 -1561 . DOI: 10.12085/dqxxkx.2018.180164


Under the influence of time, position and purpose, people move between different places in a city for various activities. The spatio-temporal data recording human trajectories implicate the functions of different regions in the city. Taxi is an important way that people travel in a city. The trajectories of taxis record spatio-temporal characteristics of taxi passengers' trips, from which corresponding functions of regions can be detected. This paper tries to figure out dynamic functions of regions where passengers take in or take off taxis by analyzing the regular pattern of ODs (origins and destination) of taxi trajectory data. However, taxi data always contain multi-dimensional information, one-dimensional or two-dimensional model is not enough to express the multi-dimensional information. As a result, we use tensor decomposition model to handle the taxi OD data from multiple dimensions, including day dimension, hour dimension and space dimension, and reveal the pattern of passengers' trips. We divide the region that covers the urban area within Sixth Ring Road of Beijing into 11 663 grids of 500 m×500 m in size. The Os and Ds of taxi trajectories are mapped into the grids and the number of Os and Ds in each grid is counted by hour and day separately. Then, we build 3-rd order tensors of Os and Ds, respectively. The result of tensor decomposition contains three matrixes which show hour patterns, day patterns and spatial patterns of Os and Ds and a core tensor which shows the intensity of relations between the three matrixes. The tensor decomposition found 8 temporal patterns of Os and Ds: morning rush pattern, daytime pattern, evening rush pattern and night pattern on weekdays and weekends separately. Mapping the temporal patterns of Os and Ds into space, 8 spatial patterns of Os and Ds were detected which reveals people's different activities in space during different time periods. By analyzing the patterns in each dimension and the relations between different dimensions, the functions of grids can be identified. Combined with points of interest (POI), more specific functions can be identified. This study demonstrate that the function of a region is not static but dynamic with changes with the need of people. The paper reveals the hidden real-time information of taxi data, which can provide a scientific reference for city planners.

1 引言

作为城市流动人群的主要代步工具,出租车的运营状况和上下车点在很大程度上反映出人群移动的时空规律。相对于出租车完整轨迹路线的随机性,出租车OD数据更能反映出乘客的行为特征,并且出租车OD数据包含轨迹移动的空间信息和时间信息,可以反映出租车用户在不同时段中上车点与下车点对应的热点区域,揭示城市在不同时段中热点区域的空间分布与人群集聚现象,表达城市区域的动态性。而目前利用手机通讯、出行轨迹等大数据研究城市功能的研究中大多只考虑静态的区域功能,未反映出区域功能的动态变化[12-13,20-21]。本文利用北京市出租车OD数据,对北京市出租车用户的出行行为与活动进行分析,推测出行目的及其对应的城市空间功能,并结合兴趣点(Point of Interest, POI)的分布,提高推测的准确性。为解决多维度信息的表达和挖掘,本文选择张量模型;为避免相同区域模式的地理聚集现象,本文使用出租车OD数据分别构造上车张量和下车张量,通过张量分解,发现出租车用户上下车行为在不同维度的时空特征,获取不同时段对应的空间模式,实现出租车用户出行的功能区动态识别。

2 研究区和数据源

2.1 研究区域概况

本文实验数据包括北京市六环路网数据、出租车轨迹数据和POI数据,统一坐标系为WGS 1984 UTM Zone 50 N(WGS84椭球体的通用横轴墨卡托投影第50分度带),研究区域范围:X[422 211.60 m, 475 711.60 m],Y[4 393 462.30 m, 4 447 962.30 m],研究区域在指定投影坐标系下为53.5 km×54.5 km的矩形区域。本实验将研究区域划分为500 m×500 m格网,不仅简化问题模型,而且降低计算的复杂度,划分结果如图1所示,总计11 663个格网,表现为109行×107列,格网编号为从上至下、从左到右依次编号为0-11 662。
Fig.1 The study area

图1 研究区域

2.2 实验数据与预处理

本研究出租车轨迹数据时间范围为2012年 11月1-16日,从轨迹数据中提取出租车OD数据,删除重复、不完整以及范围超限数据,其中六环区域内有效轨迹为2 531 618条记录,将每一条出租车轨迹的O点与D点映射到格网中,每一条出租车轨迹记录字段见表1
Tab.1 The fields of taxi trajectory data

表1 出租车轨迹数据字段

序号 字段 数据类型 说明
1 ID 字符串 轨迹唯一标识
2 出租车ID 字符串 出租车唯一标识
3 起点时间 日期 轨迹开始时间
4 终点时间 日期 轨迹结束时间
5 轨迹时间 浮点型 乘客轨迹时间/s
6 轨迹距离 浮点型 乘客轨迹距离/m
7 起点经度 浮点型 WGS84地理坐标
8 起点纬度 浮点型 WGS84地理坐标
9 终点经度 浮点型 WGS84地理坐标
10 终点纬度 浮点型 WGS84地理坐标
11 起点编号 整型 起点对应格网编号
12 终点编号 整型 终点对应格网编号
城市POI数据泛指一切可以抽象为点的地理对象,尤其是与人们生活密切相关的地理实体,可以反映出城市空间区域的功能属性。本文加入北京六环区域的POI数据识别城市功能区特征。本文POI数据通过高德地图开发平台提供的API获取,该平台默认将POI数据分为23大类,263个小类。根据实验目的与需求,本文筛选、拆分与合并不同类别的POI数据,最终获取总计760 200条,总计13个类别(餐饮服务、购物服务、生活服务、体育休闲服务、住宿服务、风景名胜、住宅、政府机构、科教文化、交通设施、金融保险和公司企业),每条记录包括POI名称、经度、纬度、行政区与类别属性。

3 研究方法

张量是一种多维数组,不同的维度可以具有不同的坐标系统。一阶张量是一个向量,二阶张量是一个矩阵,三阶及以上阶数的张量则是高阶张量,图2是一个三阶张量X∈$\mathbb{R}^{I\times J\times K}$。
Fig. 2 A third-order tensor

图2 三阶张量

3.1 张量分解

张量分解为奇异值分解和主成分分析的高阶推广,主要包括Tucker分解和CP (Canonical Polyadic Decomposition)分解。其中Tucker分解是一种高阶主成分分析,它把一个张量分解为一个核心张量沿着每一个模乘上一个因子矩阵,每个模上的因子矩阵称为张量在每个模上的基矩阵或者主成分。以3阶张量X∈$\mathbb{R}^{I \times J\times K}$为例,对其进行Tucker分解,分解模数为(P×Q×U)(式(1)),分解结果如图3,其中核心张量G∈$\mathbb{R}^{P\times Q\times U}$,因子矩阵包括A∈$\mathbb{R}^{I\times P}$,B∈$\mathbb{R}^{J\times Q}$,C∈$\mathbb{R}^{K\times U}$。如果P,Q,U分别小于I,J,K,G可以看作是X的压缩,压缩之后的核心张量存储空间明显小于原始张量存储空间,从而达到高维数据的降维,起到数据压缩与特征提取的作用。因子矩阵的每一列为一个主成分,代表该因子特征空间的一种模式,每一行为某一事物在不同模式的值,表示这一事物与不同模式的相关程度,模式值越大相关性越大。核心张量表示因子矩阵之间的相互作用或者联系强度; X ˆ 为核心张量与三个因子矩阵的乘积,是一个近似张量[14]
X X = G × A 1 × B 2 × C 3 = p = 1 P q = 1 Q r = 1 R g p , q , r a p × b q × c r = G , A , B , C (1)
Fig. 3 Tensor decomposition-Tucker model

图3 张量分解-Tucker模型

3.2 张量分解的计算

张量分解求解问题为:给定一个张量X∈$\mathbb{R}^{I\times J\times K}$,求解核心张量G∈$\mathbb{R}^{P\times Q\times U}$和因子矩阵A∈$\mathbb{R}^{I\times P}$,B∈$\mathbb{R}^{J\times Q}$,C∈$\mathbb{R}^{K\times U}$,使X与 X ˆ 差距最小。KLKullback-Leible)离散度可以量化相似结果的质量,KL离散度越小,2个相似结果越接近。X X ˆ KL离散度定义如式(2)。
式中:Xi, j, k表示张量中的元素值, X ˆ i , j , k 表示近似张量中的元素值。因此求解问题转化为最优化KL离散度 D ( X | | X ˆ ) 问题。
张量分解的核心张量与因子矩阵中的元素 可为正或负,从数学角度观点看,分解结果中存在负值是正确的,但是负值在实际问题中可解释性差,通常是没有意义的,同时张量分解结果不具有唯一性。为解决以上问题,Mørup等[22]提出SN-TUCKER (稀疏非负Tucker分解),该模型在张量分解过程中加入非负约束与稀疏约束。对于任意一个非负张量X,SN-TUCKER通过非负约束可以分解出非负核心张量和非负因子矩阵;通过稀疏约束,对核心张量和因子矩阵进行降维,从而减少张量分解结果的歧义性。SN-TUCKER利用乘法更新规则迭代求解,从而保证G,A,BC的非负性。SN-TUCKER利用1-范数实现稀疏约束,使结果尽可能的稀疏以获取主要特征,从而减少分解结果的歧义性。

4 实验分析

4.1 实验流程

本实验首先进行数据预处理,然后通过张量 分解获取北京六环区域的区域模式。划分到同一种模式中的区域在一天的某个时间段内,具有相似的上下车量,城市居民在相邻的时间段出行或者在相邻的位置上下车,对应的出行模式可能存在一定的相似性,即在某一个时间段内,上车点所在区域或者下车点所在区域具有相似的功能特征;在此理论基础上结合区域活跃时间段和POI分布进行出租车用户出行的功能区特征识别,实验流程如图4所示。
Fig. 4 The flowchart of experiment

图4 实验流程图

4.2 张量构造与参数设置

4.2.1 张量构造
本实验构造上车张量XO = (上车点,时段,日),维数为11 663×24×16,如图5所示,总计16张天切面,每张切面共有11 663行24列,其中每一张垂直切面表示一天;垂直切面的每一行表示一个区域,每一列表示24 h中的一个时段,其中0时段对应 0-1点,其它时段以此类推;垂直切面中格网元素值表示某个区域在某个时段中的出租车上车量。同理构造下车张量XD = (下车点,时段,日)。
Fig. 5 Tensor construction

图5 张量构造

4.2.2 张量分解参数设置
本文对张量X进行分解,求解核心张量G,因子矩阵:A区域模式矩阵、B时段模式矩阵和C日模式矩阵。在进行张量分解之前,需要确定张量分解的分解模数和稀疏约束参数。“时段”模数参考其它文献[4,18-19]和经验确定为4,即早高峰时段、日间时段、晚高峰时段以及夜间时段。“日”分解模数可以根据数据特点,即工作日和休息日确定为2。“区域”分解模数即为不同类别区域数量k,如果k过小致使不同类别区域冗杂在一起,如果k过大则会使同一类别区域分在不同的模式中;在同一组参数下 SN-TUCKER分解结果歧义性减少,但是仍然具有不唯一性。综上所述本实验对XO与XD选择k[3,18]分别进行五组张量分解实验,结果如图6所示,在[3,8]区间中,随着k值的增大,图6(a)和图6(b)中的目标函数呈下降趋势,在[8,18]区间中,目标函数趋于稳定,因此本实验选取k=8,此时目标函数基本达到[3,18]区间的最小值,且具有较强的可解释性,综上所述,本文的张量分解模数确定为8×4×2。经过实验发现,当对AB进行稀疏约束,不对G和C进行稀疏约束,可获取张量分解理想结果。
Fig. 6 The change of objective function with k

图6 目标函数随着k值的变化

4.3 张量分解结果分析

本文使用出租车OD数据分别构造上车张量XO和下车张量XD,通过SN-TUCKER分解,将张量XO和XD分别分解为一个核心张量和3个因子矩阵: A∈$\mathbb{R}^{11 663\times 8}$、B∈$\mathbb{R}^{24\times 4}$和C∈$\mathbb{R}^{16\times 2}$的乘积形式,ABC可以被认为是每一特征维度的主成分,即空间维度、时段维度与日维度的主成分;因子矩阵的每一列分别代表特征空间的一种模式,即区域模式、时段模式与日模式;A每一行代表某一空间格网与对应的8种区域模式相关程度,B每一行代表每一时段与对应的4种时段模式相关程度,C每一行代表每一天与对应的2种日模式相关程度,模式值越大相关程度越大。下面分别对每个特征模式的结果进行分析。
4.3.1 日模式
日维度的因子矩阵C∈$\mathbb{R}^{16\times 2}$有2种模式,如图7,其中2012-11-03(周六)、2012-11-04(周日)、2012-11-10(周六)和2012-11-11(周日)是休息日。图7(a)中,红线在休息日的模式值接近0,在工作日的模式值是高值且平稳状态,表明红线在工作日特征信息较明显;蓝线在休息日的模式值达到高峰,而在工作日模式值接近0,表明蓝线在休息日特征信息较明显,因此红线是工作日模式,蓝线是休息日模式。同理,图7(b)中,红线是工作日模式,蓝线是休息日模式。
Fig. 7 Day patterns

图7 日模式变化规律

4.3.2 时段模式
时段维度的因子矩阵B∈$\mathbb{R}^{24\times 4}$具有4种模式,如图8图8(a)蓝线与图8(b)蓝线在时段7-8达到高峰期,因此图8蓝线对应早高峰模式。图8(a)紫线与图8(b)紫线在时段9-16期间达到高峰期,图 8(a)紫线在时段12存在低谷现象,图8(b)紫线在时段13存在低谷现象,低谷现象是由于人们处于午休时段,出租车需求略微下降,因此图8紫线对应日间模式。图8(a)红线与图8(b)红线在17-21时达到高峰状态,因此图8红线对应晚高峰时段。图 8(a)绿线与8(b)绿线在时段0附近达到高峰,因此图8绿线为夜间模式。
Fig. 8 Hour patterns

图8 时段模式变化规律

4.3.3 区域模式
张量分解结果中的因子矩阵A∈$\mathbb{R}^{11663\times 8}$,表示每个格网中对应的8种上下车模式,每个模式值表示对应的模式在该格网中的贡献值,该值与格网的上车量成正比,即格网上车量越大,贡献值越大。由于每个网格的上下车量本身存在很大差异,导致无法直接比较不同格网的模式值,因此本实验对因子矩阵A在行方向进行归一化处理,如式(3)所示。
A p , q ' = A p , q p N A p (3)
矩阵AO归一化后,得到矩阵 A O ' ∈$\mathbb{R}^{11663\times 8}$,表示 8种模式在对应格网中的贡献比例,比例越大,说明对应的模式在该格网中越突出。根据 A O ' 中每一行的值,可获取每个格网中区域模式组成,部分格网以1种模式为主,部分格网包括多种模式。将属于每种模式的所有格网在地图上显示出来,得到上车点的8种区域模式,如图9,每一区域模式中的上车点具有相似的时间特征。同理,可获取下车点的8种区域模式,如图10所示。
Fig. 9 Spatial patterns of Os

图9 上车点区域模式分布

Fig. 10 Spatial patterns of Ds

图10 下车点区域模式分布

4.3.4 核心张量分析
通过张量分解得到的上下车时间模式,可以判断出租车用户的行为时间特征。结合核心张量,建立时间模式和区域模式的对应关系,可初步推断出租车用户的行为空间功能特征。核心张量Go∈$\mathbb{R}^{8\times 4\times 2}$与GD∈$\mathbb{R}^{8\times 4\times 2}$,如表2表3,分别表示8种上车点/下车点模式、4个时段模式和2个日模式之间的联系强度。根据表2表3可确定上车点和下车点之间的相互作用,建立同一个时段中活跃的上车点与下车点的映射关系(表4),从可而进一步判定上车点所在区域与下车点所在区域对应的功能。
Tab. 2 The core tensor of Os

表2 上车张量分解的核心张量

早高峰模式 日间模式 晚高峰模式 夜间模式
工作日 休息日 工作日 休息日 工作日 休息日 工作日 休息日
O1 0.000 0 0.000 0 0.000 0 0.000 0 0.162 0 0.280 4 0.000 0 0.000 0
O2 0.048 6 0.000 0 0.219 3 0.000 0 0.215 4 0.000 0 0.000 0 0.071 0
O3 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.334 7 0.146 4
O4 0.000 0 0.000 0 0.000 0 0.363 1 0.000 0 0.000 0 0.000 0 0.000 0
O5 0.366 9 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0
O6 0.000 0 0.272 5 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0
O7 0.000 0 0.000 0 0.004 6 0.000 0 0.372 5 0.000 0 0.011 6 0.000 0
O8 0.000 0 0.000 0 0.424 5 0.000 3 0.000 0 0.000 0 0.000 0 0.000 0
Tab. 3 The core tensor of Ds

表3 下车张量分解的核心张量

早高峰模式 日间模式 晚高峰模式 夜间模式
工作日 休息日 工作日 休息日 工作日 休息日 工作日 休息日
D1 0.000 0 0.000 0 0.000 0 0.000 0 0.236 0 0.265 2 0.000 0 0.000 0
D2 0.000 0 0.000 0 0.028 8 0.000 0 0.394 2 0.000 0 0.000 0 0.000 0
D3 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.171 2 0.288 1
D4 0.000 0 0.240 7 0.000 0 0.012 5 0.001 0 0.000 0 0.000 0 0.000 0
D5 0.323 9 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0 0.000 0
D6 0.000 0 0.000 0 0.432 5 0.000 9 0.000 0 0.000 0 0.000 0 0.000 0
D7 0.000 0 0.000 0 0.000 0 0.000 0 0.000 9 0.000 0 0.361 1 0.000 0
D8 0.000 0 0.000 0 0.000 0 0.353 4 0.000 0 0.000 0 0.000 0 0.000 0
Tab. 4 Interaction between spatial patterns

表4 区域模式交互

工作日 休息日
时段 O区域 D区域 O区域 D区域
早高峰模式 O5 D5 O6 D4
日间模式 O8、O2 D6 O4 D8
晚高峰模式 O7、O2、O1 D2、D1 O1 D1
夜间模式 O3 D7、D3 O3 D3
休息日早高峰时段,O6与D4较活跃,休息日早晨人们活动起点通常是居住地,目的地为景区或者机场车站,推测O6为居住区,D4对应景区或者机场车站。休息日日间时段,O4与D8较活跃,白天人流较大且活动范围较广,推测O4与D8为餐饮购物、交通、景区、教育、医疗等多种功能混合区域。休息日晚高峰时段,O1与D1较活跃,上文可知O1为景区,D1为居住区/娱乐区混合区域。休息日夜间时段,O3与D3较活跃,上文可知O3为娱乐区, D3为居住区/娱乐区混合区域。

4.4 出租车用户出行功能区识别

4.4.1 区域模式功能特征
本文计算每种区域模式(图9图10)下的POI频数密度值(Frequency Density,FD),计算公式见式(4),其中Ni, j表示第i种区域模式的第j类POI数量,Si表示第i种区域模式总面积。
F D i , j = N i , j S i (4)
F D nor ( i , j ) = F D i , j - F D min F D max - F D min (5)
Tab. 5 The normalized frequency density of POIs in each spatial pattern of Os

表5 上车点区域模式的POI归一化频数密度

O1 O2 O3 O4 O5 O6 O7 O8
餐饮服务 0.000 0 0.992 9 1.000 0 0.463 2 0.600 9 0.250 6 0.373 9 0.478 0
购物服务 0.000 0 1.000 0 0.889 2 0.621 8 0.390 8 0.287 3 0.525 2 0.659 0
生活服务 0.000 0 1.000 0 0.487 3 0.560 8 0.487 8 0.317 8 0.452 9 0.518 6
体育休闲 0.000 0 1.000 0 0.833 8 0.572 7 0.240 6 0.064 0 0.433 2 0.589 8
医疗服务 0.000 0 1.000 0 0.476 2 0.375 2 0.630 4 0.308 7 0.542 0 0.599 7
住宿服务 0.000 0 1.000 0 0.775 8 0.544 9 0.292 9 0.135 1 0.427 7 0.541 1
风景名胜 0.682 3 1.000 0 0.758 5 0.474 9 0.199 3 0.000 0 0.469 7 0.660 0
住宅 0.000 0 1.000 0 0.396 4 0.345 7 0.746 6 0.435 3 0.573 3 0.616 4
政府机构 0.000 0 1.000 0 0.402 7 0.367 1 0.465 4 0.146 4 0.540 7 0.599 1
科教文化 0.000 0 1.000 0 0.343 1 0.331 0 0.630 2 0.077 1 0.466 5 0.571 9
交通设施 0.000 0 1.000 0 0.629 8 0.659 5 0.492 0 0.113 5 0.541 7 0.630 7
金融保险 0.000 0 1.000 0 0.819 4 0.607 5 0.332 7 0.120 7 0.499 9 0.670 0
公司企业 0.021 8 1.000 0 0.709 0 0.522 1 0.325 2 0.000 0 0.485 9 0.660 9
Tab. 6 The normalized frequency density of POIs in each spatial pattern of Ds

表6 下车点区域模式的POI归一化频数密度

D1 D2 D3 D4 D5 D6 D7 D8
餐饮服务 0.956 5 0.852 8 0.297 4 0.000 0 0.591 8 1.000 0 0.665 8 0.717 7
购物服务 0.715 7 0.648 2 0.291 8 0.000 0 0.124 4 1.000 0 0.498 6 0.935 2
生活服务 1.000 0 0.897 9 0.307 3 0.037 6 0.000 0 0.803 9 0.679 0 0.528 0
体育休闲 0.819 4 0.798 4 0.017 7 0.000 0 0.209 9 1.000 0 0.735 5 0.798 5
医疗服务 0.987 0 0.877 2 0.266 7 0.000 0 0.135 9 1.000 0 0.698 8 0.623 1
住宿服务 0.725 1 0.663 8 0.132 4 0.000 0 0.012 1 1.000 0 0.459 7 0.511 4
风景名胜 0.178 1 0.122 0 0.000 0 0.204 4 0.293 5 1.000 0 0.009 6 0.715 5
住宅 1.000 0 0.906 4 0.469 7 0.000 0 0.098 3 0.841 3 0.510 6 0.508 2
政府机构 0.701 8 0.642 7 0.105 8 0.000 0 0.065 0 1.000 0 0.321 8 0.638 1
科教文化 0.623 9 0.551 5 0.119 0 0.000 0 0.034 9 1.000 0 0.362 2 0.804 5
交通设施 0.656 9 0.617 3 0.000 0 0.415 6 0.330 2 1.000 0 0.242 5 0.741 8
金融保险 0.493 3 0.448 7 0.047 5 0.000 0 0.086 2 1.000 0 0.227 5 0.976 7
公司企业 0.338 9 0.289 2 0.000 0 0.007 0 0.322 3 1.000 0 0.143 1 0.881 3
4.4.2 功能区识别
通过以上分析,可判断O5、O6、D3为居住区,O1、D4为景区,O3为娱乐区,D5为工作区,D1、D2和D7为居住区/娱乐区的混合区域,O2、O4、O7、O8、D6和D8为商业区。为进一步探索北京市六环整体功能,将每一个格网对应的O区域比例向量 A O ' 和D区域比例向量 A D ' 合为一个向量 A OD ' ∈$\mathbb{R}^{11663\times 16}$,根据 A OD ' ,我们可以判断每个格网属于的O区域模式与D区域模式,一个格网可能为一种O区域模式或者一种D区域模式,也可能为多种O区域模式和多种D区域模式的混合模式。将每个格网的区域模式组成对应的功能组合在一起,得到格网的功能组合,结果如图11,其中“未识别区”对应出租车上车和下车数量为0的区域,这类区域通常是待开发区或者出租车无法到达的区域。图11中商业区包括A1北京CBD、A2王府井、A3西单等商业区域。工作区包括B1中关村科技园、B2亦庄经济开发区等。景区包括C1故宫、C2天坛、C3颐和园等。居住区往往和其它功能区组合在一起,如工作区、景区、商业区、娱乐区,形成混合区域;从图11中可看出,具有居住功能的区域分布空间较广泛,其中居住区和景区混合区域通常是住宅小区和周围公园的组合(D1、D2区域等);居住区和工作区混合区包括E1磁器口附近、E2亦庄科技园附近等;居住区和商业区混合区包括F朝阳门附近等;居住区和娱乐区混合区包括G1北京工人体育场附近、G2簋街等;居住区、娱乐区和商业区混合区则包括H1蓝色港湾、H2南锣鼓巷、H3五道口等区域。综上,结合区域活跃时间段与对应POI分布而获取的空间区域语义特征与现实生活基本常识认知基本一致,验证了本文分析结果的合理性。
Fig. 11 The functional regions

图11 功能区


5 结论


