Time Series Dynamic Graph Embedding: A Method for Precision Identification of Urban Functions

  • GAO Yuan , 1, * ,
  • WANG Jie 2 ,
  • LI Gang 3, 4 ,
  • YAN Jianqiang 2
Expand
  • 1. School of Economics and Management,Northwest University, Xi'an 710127
  • 2. School of Information Technology, Northwest University, Xi'an 710127
  • 3. School of Urban and Environmental Sciences, Northwest University, Xi'an 710127
  • 4. Shaanxi Key Laboratory of Earth Surface System and Environmental Carrying Capacity, Xi'an 710127
*GAO Yuan, E-mail:

Received date: 2022-02-08

  Revised date: 2022-04-07

  Online published: 2022-12-25

Supported by

National Social Science Foundation of China(20BTJ047)

Abstract

Urban functional area recognition based on multi-source big data is a complex nonlinear pattern recognition problem. The traditional machine learning methods are limited to effectively extract the information of multi granularity, time-varying, and multi-scale spatial interaction from large-scale trajectory data. Therefore, this paper designs and implements a Deep Learning model based on time series dynamic graph embedding, integrates Didi travel and Point of Interest (POI), extracts urban areas' spatiotemporal implicit features, and realizes the semantic recognition combined with cluster analysis. The results show that the land use functions in the center of Chengdu tend to be complex and diversified, and the land use attributes change with time. Furthermore, the scope and land use functions show a temporal and spatial law that they change with the activities of urban groups. The comparative experiments with the relevant literature show that the proposed method can identify the functional areas with a finer granularity. Moreover, the agglomeration degree within the same type of functional areas is higher, which can better capture the land use function changes of the composite area in different time modes. This study provides a new technical method for urban land function identification, helping researchers fully understand the structural attributes of urban areas, and has a particular value in improving the use of urban space.

Cite this article

GAO Yuan , WANG Jie , LI Gang , YAN Jianqiang . Time Series Dynamic Graph Embedding: A Method for Precision Identification of Urban Functions[J]. Journal of Geo-information Science, 2022 , 24(10) : 1968 -1981 . DOI: 10.12082/dqxxkx.2022.220057

1 引言

伴随城市的多元化发展,城市用地功能识别研究趋向于面向多元混合用地类型的自动化、精细化识别[1-2]。相较于传统的遥感影像、问卷调查数据,细粒度、高精度的新型大数据蕴含人地关系的多元化、复合性特征,满足用地功能精细化识别的需求。其中,通过挖掘POI(Point of Interest)反映出的用地集聚性特征,实现城市功能区的精细划分和定量识别研究最为广泛[3-6]。还有研究将POI数据与空间数据库中的建筑形态[1]、高分辨率遥感影像[7]等传统数据相结合,提高城市用地功能识别的准确度和精细度。这些基于POI的用地功能识别符合现代城市用地功能在空间维度的多层次和细粒度,但是,POI本质上并不具备时变特征,无法反映人地关系在时空维度的多尺度动态变化。
城市区域功能是人类多样化活动的现实映像,呈现高度的动态化和多变性,并非是一成不变、固定的模式,而是伴随时间不断变化的多功能组合[8-11]。结合手机信令、浮动车轨迹数据的城市用地功能识别,能够反映城市区域功能随人群活动的变化规律[12-20]。上述研究表明,融合多源数据的行为分析,提升了对城市功能的理解,有效支撑短时管理决策和长时政策制定。
本文对城市用地功能识别研究所使用的方法进行文献梳理(表1),主要包括:
表1 城市用地功能识别研究相关文献对比分析

Tab. 1 Comparative analysis of literature

文献编号 数据类型 方法
POI 轨迹 统计分析 传统机器学习 深度学习
[1]、[3]-[8]
[22]-[23]
[2]、[9]
[10]-[13]、[18]*-[19]*、[20]、[24]-[27]
[28]

注:*表示研究目标城市与本文一致,均为成都市。

(1)使用POI实现城市用地功能识别的研究。相关研究包括利用核密度估计计算区域POI类型的频率密度[3-6];量化POI并结合决策树[1]、支持向量机[7]、基于密度的位置共线模式挖掘[8]等机器学习模型,实现用地功能的自动化识别。这些方法在表1中,被标注为传统机器学习方法,也被称为浅层学习(Shallow Learning),其原因是这些方法需要人工设计有效的特征工程,实现原始数据到内部特征的转换,因此针对复杂非线性系统学习问题的泛化能力有限。具体在城市区域功能识别应用中,表现出难以对时空维度上的复杂非线性人地关系进行有效特征提取和建模。近年来,机器学习的发展经历了从传统机器学习的浅层学习到深度学习(Deep Learning)的过度。深度学习从大数据中学习特征,通过深度网络逐层实现特征空间构建,学习并提取大数据集中蕴含的潜在的非线性关系,尤其擅长处理非结构化数据或复杂特征识别问题[21]。例如:在城市用地功能识别研究中,郑至键[22]和Yao[23]基于Word2Vec深度学习框架,分别采用SkipGram和CBOW模型,提取区域POI空间分布关系的潜在特征向量。他们的研究结果表明,深度学习实现了POI中蕴含的高维隐式特征学习,有助于快速有效的识别和理解城市复杂空间结构。
(2)融合POI和轨迹数据的研究。部分研究采用了计算单位POI密度[2]、张量分解[9]等统计分析方法,更多的则使用传统机器学习的浅层学习方法进行数据处理和分析,如最大期望值算法[12,20]、OPTICS聚类[24],基于动态时间规整(Dynamic Time Warping, DTW)的K-MEDOIDS聚类[18,25],基于高斯混合模型的聚类(Gaussian Mixture Mode, GMM)[19]及SOM神经网络[26]等,对轨迹大数据的时序向量进行聚类分析;进而,结合POI的统计结果分析实现用地的混合性辨识及功能识别。部分研究在城市区域中构建轨迹数据的出发-到达(Orientation Destination,OD)起讫对,结合区域之间相互作用的关系及强度实现区域聚类,体现了区域之间相互关联的动态特征,能够用更加广义的人类活动(例如:上班、旅游、购物等)诠释区域用地功能[24-25,27]。上述研究表明,同时利用POI数据在空间上的多粒度和轨迹数据在时间上的多维度信息,避免了单一数据带来的有偏性。但是,多源大数据融合背景下的城市功能区识别是复杂非线性系统的模式识别问题,传统机器学习方法学习能力有限,基于时空大数据的城市功能区域识别研究仍然存在挑战。
(1)在时间维度上,区域功能的时变特征是连续的,体现出随时间变化的空间功能差异和转变。已有的基于统计和传统机器学习的方法,从功能区呈现出的昼夜差异、周内和周末的时间角度实现功能区分析[2,9,13]。但是,如何从轨迹时空数据中捕捉细粒度的、连续的非线性时变特征,提升用地功能的精细化识别还有待进一步探索。
(2)在空间维度上,传统的机器学习难以挖掘区域及区域之间复杂非线性关系。Zhang[28]采用Word2Vec学习轨迹中蕴含的潜在空间语义信息,这种运用深度学习提取轨迹特征的方法,能够充分利用区域与区域之间因人群活动产生的不同形式的空间关联(如通勤所连接的居住区与办公区),进而结合区域聚类实现了混合用地特征的有效辨识。如果能够进一步挖掘轨迹数据中蕴含的时序特征,学习并利用不同区域呈现出的相似性人地关系(如不同位置的居民住宅区),则能够提升用地功能识别的准确性。
基于上述挑战,本文提出一种基于动态图结构的深度学习网络模型,图中的节点代表城市区域,节点之间的有向边代表区域之间的多元关系。该模型不仅对城市用地功能在时间维度上伴随人群移动呈现出的变化特征进行建模,同时对区域之间存在的复杂多元空间关系进行学习,实现相似性区域聚类和功能识别。

2 研究方法

本文提出一种动态图结构深度网络模型实现城市区域建模,具体思路如图1所示,包括模型构建、特征学习和语义理解3个阶段。
图1 区域用地功能识别研究技术路线

Fig. 1 Research framework of functional areas recognition

(1)模型构建。基于区域栅格中分时计算的浮动车起讫点对(Origin-Destination, OD),设计动态时序图结构,实现功能区域的多维度空间和多尺度时间关系建模。
(2)特征学习。设计实现一种结合图注意力网络(Graph Attention Network, GAT)[29-30]和门控循环单元网络(Gated Recurrent Unit, GRU)[31]的深度学习网络模型(简称GAT-GRU),喂入动态时序图训练模型,实现功能区非线性时空关系的潜在特征输出。
(3)语义理解。对不同时段提取出的潜在特征进行K-Means聚类,结合POI类别密度实现区域功能的语义识别。

2.1 区域动态时序图建模

城市中的区域及其联系,呈现一种典型的网状结构,采用图数据结构描述区域的网状关系,是对城市环境中复杂非线性系统建模的直接方式[10,32]。本文设计一种动态时序图模型 G对城市空间区域及其联系进行建模,如图2所示。
图2 GAT-GRU整体框架

Fig. 2 Framework diagram of the GAT-GRU

定义1:设在 T时间段内,动态时序图模型 G表示为一个图序列 G = G 1 , G 2 , , G t , , G T G t t时刻的有向加权图, G t = V t , E t , W t,其中 V t t时刻图的节点集合, E t是图的有向边的集合, W t是有向边的权重。
动态时序图中的一张图 G t的节点代表城市区域在 t时刻的相关特征,对于研究区域中 N个栅格, V t = { v 1 t , , v i t , , v N t }。分时计算栅格网络所覆盖的每个区域的特征,形成时序图中节点的特征 v i t。例如,本文计算栅格网络所覆盖的每个区域的浮动车数量,则节点的特征 v i t代表该区域在 t时刻的用地热度。此外,区域特征可根据研究需求,提取和融合多特征。
图2中的有向边代表区域之间的关系及关系的方向,其权重代表区域之间关系的强度。本文根据浮动车轨迹在区域之间的移动信息,分时计算区域间OD流的方向及强度,建立图的有向边及权重,表征区域间的动态变化和联系。
本文以小时为粒度划分,在不同的时间段下,一个时间戳下对应一张图,构建形成动态时序图模型 G 1 , G 2 , , G t , , G T。在连续的时间戳下,由于研究区域的网格划分是固定的,因此图的节点个数固定不变,但是,节点信息和节点之间的边所代表的多元关系是不断变化的。

2.2 相似功能区域聚类

将研究区域建模为动态时序图后,设计基于动态图嵌入的区域隐式特征提取算法,并将提取后的特征进行K-Means聚类,从而得到相似功能区域的聚类分布情况。
针对城市功能区在不同时间段表现出的差异化属性,传统的机器学习方法难以有效描述城市功能区的非线性动态演变。因此,本文提出GAT-GRU深度学习网络模型,将上一阶段建立的动态时序图数据喂入网络进行学习,通过GAT网络学习图结构中蕴含的区域之间的多层次、细粒度空间特征,然后,GRU基于不同时刻GAT输出的高层语义特征,学习并输出整个时间段内的特征表示。

2.2.1 基于加权GAT-GRU的时空特征学习

GAT网络模型通过一次图卷积操作,对网络中每个节点距离为1的邻居节点特征进行标准化求和。这种通过遍历图上的所有节点的计算方式,使得GAT摆脱了拉普拉斯矩阵的约束,有效地解决了动态时序图中顶点及顶点之间的联系随时间变化的有向图学习问题,适用于城市功能区识别研究中区域与区域之间的联系是非线性时变关系的学习。
基于加权的GAT模型[33]可以在GAT有效捕捉节点空间关系能力的基础上进一步考虑初始的权重矩阵,从而更好的融入城市功能区域与区域之间的交互特征。加权GAT模块输入为动态时序图中每个时间戳下对应图G以及相应的节点特征集合。
具体来说,每一个加权图的注意层通过计算目标节点 i与其一阶邻域节点之间的注意力权值,学习邻域节点对目标节点的贡献度,并迭代调整注意力权值,体现目标节点在网络中的作用。
目标节点i与其一阶邻域节点j的注意力权值 w i j计算如式(1)所示。
w i j = e x p σ A i j a T W V i | W V j k N i e x p σ A i k a T W V i | | W V k
式中:ijk分别代表图G中不同的节点,每个节点即一个栅格区域,其中k为目标节点i的一个邻居节点; N i表示在图G中节点i的所有一阶邻居节点集合; V i V j V k分别为节点 i j k的特征向量表示; A i j A i k分别表示节点i与节点j、节点i与节点k的边连接权重; W R N × F是节点共享的权重变换矩阵;||符号代表向量拼接操作,进一步使用前馈神经网络 a T将拼接得到的向量映射到实数集上; σ为非线性激活函数,最后通过softmax归一化得到最终的注意力系数 w i j。为了提高空间层表示模块的稳定性,使用多头注意力机制进行注意力权重的拼接[33]
加权的GAT模型学习并输出了表征区域空间分布的隐式特征,进而,为了捕获城市区域的时变特征,应用基于门控循环单元GRU的时间层表示模块,学习时间维度上动态图节点集合连续性变化的高层特征表达。其中,GRU模块的输入为上阶段GAT输出的在整个时间序列 T下每个节点i相应的特征向量集合,GRU模块的输出为每个节点i经过门控循环深度学习网络得到的时序向量表示 { e v 1 , e v 2, , e v T },即城市功能区的时间依赖性隐式向量。

2.2.2 模型学习优化

城市功能区的有效表示可以被看作是在拓扑结构 G特征矩阵 f前提下,学习函数映射 φ ,计算能够表征城市功能区的最有效的高层语义特征 f ',如式(2)所示。
f 1 ' , , f t ' , , f T ' = φ G 1 , , G t , , G T : f 1 , , f t , , f T
式中: f 1 , , f t , , f T分别表示在不同时间戳t( 1 t T)下对应图结构 G 1 , , G t , , G T的特征矩阵, f 1 ' , , f t ' , , f T '为对应时间戳t( 1 t T)下通过学习函数映射 φ得到的高层语义特征向量。为了确保学习到的城市功能区的高层语义特征 f '可以同时有效提取节点的空间结构信息以及每个节点自身在时间上的特征变化信息,本文在每个时间步t ( 1 t T)下,使用节点 v的向量表示 e v t来预测 t时刻下节点 v的邻居节点出现的概率,因此使用二分类交叉熵损失函数BCE loss进行模型的训练优化,用来鼓励一个节点的邻居节点在固定长度的随机游走中以较大的概率同时出现,损失函数的定义如式(3)所示。
L v = t = 1 T u N w a l k t ( v ) - l o g ( σ ( < e u t , e v t > ) ) - w n u ' P n t ( v ) l o g ( 1 - σ ( < e u ' t , e v t > ) )
式中: N w a l k t ( v )表示在 t时刻节点 v的固定随机游走步长下经过的节点集合; u表示其中的某个节点; e v t e u t分别表示节点 v以及节点 u t时刻的向量表示; < >表示内积操作,用来计算2个节点间的相似性; P n t ( v )表示在 t时刻节点 v的负采样分布节点集合,即与 v不存在边连接的节点集合; u '表示负采样分布中的某个节点; e u ' t表示节点 u ' t时刻的向量表示; w n为可调节的超参数,表示负采样率,用来平衡正样本与负样本比例; σ为sigmoid激活函数。
学习优化的训练目标是确保每个节点表示为向量的情况下,出现该节点邻近的点的概率最大,即更准确的重构回原始图结构,保证每个节点的嵌入向量表示能够有效的表征图结构中的高级语义信息,这些节点的特征向量表示为本文后面对城市功能区的聚类分析提供支撑。

2.3 区域功能语义识别

通过GAT-GRU模型将时空属性和变化特征相似的区域进行聚合后,需要进一步结合该类区域的POI分布进行功能性语义标注。为了更精确的利用POI的分布特征,采用TF-IDF算法的变体WTF-IDF算法[34]进行语义识别,WTF-IDF计算方式如式(4)—式(7)所示。
W T F - I D F p o i i , r e g j = T F i j × I D F i × w i j
T F i j = s u m ( p o i i ) n j
I D F i = l o g N n - 1 ( N = n ) l o g N n ( N > n )
w i j = l o g s u m ( P O I ) s u m ( p o i i )
T F i j表示第i p o i i在某一类区域 r e g j中的频率占比; s u m ( p o i i )为第i类POI在第j类区域中的数量; n j为第j类区域的面积;N为总功能区个数;n为第i种POI出现过的功能区个数( n 0 )。最后,考虑到一些类型的POI非常具有代表性,对区域主题功能作用明显,例如一个区域内如果含有火车站或景点,那么这个区域很大概率上会呈现交通或者旅游景区的功能属性,因此,通过式(7)初始化权重 w i j进一步增大此类型POI的权重,其中 s u m ( P O I )为第j类区域下POI数量总和。

3 研究区域概况与数据来源

3.1 研究区域概况

本文以成都市为研究案例。成都是我国西南地区的科技、金融中心和交通、通信枢纽,同时也是中国最佳旅游城市之一。研究区域主要包括金牛区、成华区、锦江区、武侯区以及青羊区5个核心功能行政区,同时也是成都市的主要建筑区域,区域内部交通结构密集,混合用地程度高,包括居民住宅、商业办公、娱乐场所等多种功能用地,总面积达427 km2
本文从OpenStreetMap得到成都市的路网数据,应用栅格模型[9,35]将研究区域划分为栅格地块集合,并统一定义每个栅格的面积为1 km2,如图3所示,栅格化区域后每个区域由4个地理位置坐标点(lon, lat)集合进行表示。
图3 研究区域空间分布

Fig. 3 Spatial distribution of the study area

3.2 实验数据

为了获取居民移动行为产生的动态数据,挖掘区域功能所呈现的动态变化特征,本文从滴滴盖亚开放平台中获取研究区域的滴滴出行数据,包括自2016年10月1日至30日一个月的出租车订单数据( https://gaia.didichuxing.com.),共7 065 936条,每条记录字段包括订单ID,订单开始和结束时间,以及对应的起点和终点经纬度。然后,按照小时为粒度,计算区域栅格中车辆的OD信息,作为表征区域流量时变动态特征的数据源。
研究区域POI数据来源于高德开发者平台,包含2019年该区域分布的22种类别共约550 000余个POI记录点。考虑到本研究结合POI对功能区进行语义标注时的标准为群体的主要出行目的,因此将汽车服务、摩托车服务等类别进行合并,最终得到 13种大类。此外,参考文献[36]对每个类别的POI进行开放和关闭时间的定义,得到POI访问时间的动态信息(表2),辅助实现分类结果的语义标注。
表2 研究区域POI类别及开放时间

Tab. 2 POI categories and open hours of study regional

类别 范围 工作日 休息日
商业住宿 宾馆酒店、旅游招待所等 0:00—24:00 0:00—24:00
居民住宅 社区、住宅楼、宿舍、普通房屋等 0:00—24:00 0:00—24:00
金融银行 银行、保险、证券公司等 8:00—18:00 8:00—18:00
商业办公 产业园区、楼宇、公司、工厂等 8:00—24:00 8:00—18:00
旅游景区 风景名胜、公园广场等 8:00—18:00 8:00—18:00
餐饮 中餐厅、快餐厅、甜品店等 8:00—22:00 8:00—24:00
文化娱乐 博物馆、科技馆、图书馆、学校、展览馆等 8:00—18:00 8:00—18:00
医疗服务 专科医院、急救中心、医疗保健销售点等 0:00—24:00 0:00—24:00
休闲娱乐 运动场馆、娱乐场所、电影、休闲场所等 9:00—22:00 8:00—24:00
车辆服务 加油站、洗车场、各类汽车维修点等 9:00—22:00 9:00—22:00
公共设施 地铁站、停车场、公共厕所、报刊亭等 6:00—22:00 6:00—22:00
消费购物 超级市场、综合市场、特色商业街等 9:00—22:00 8:00—22:00
生活服务 旅行社、邮局、物流速递等 9:00—22:00 9:00—22:00

4 结果及分析

4.1 城市群体出行时间特征分析

为了从整体角度理解居民乘车出行规律,分别统计了研究区域内工作日及休息日平均每小时的上车、下车数量,结果如图4所示。图中反映出工作日及休息日居民的出行模式存在较大差异,尤其 体现在7:00—9:00以及17:00—19:00的时间段。工作日7:00—9:00表现出较为明显的早高峰现象,而休息日相对来说增长缓慢;此外,工作日17:00—19:00,上、下客量处于较高值水平,19:00左右出现上客量的峰值,而在休息日同一时段上、下客量下降显著。因此,本研究分别选择工作日7:00—9:00(T1)、17:00—19:00(T2)、休息日7:00—9:00(T3)、17:00—19:00(T4),这4个出行模式差异性显著的时期作为4种不同的时间模式,进一步进行时序图的构建。
图4 滴滴出行的订单量变化

Fig. 4 Changes in Didi order volume

4.2 聚类k值的确定实验

k值的选择是K-Means聚类分析的关键。本文在不同的聚类个数k值下,计算相应的轮廓系数值以及簇内误方差指数,并结合“手肘法”进行最佳k值的选择。
实验结果如图5所示,其中图5(a)表示在T1T4时间模式下轮廓系数值随k值的变化,图5(b)表示在T1T4时间模式下簇内误方差指数随k值相应的变化。结果表明,k值为3和6时轮廓系数值相对高,结合簇内误方差指数的实验结果,在k值为6时簇内误方差指数开始趋于平稳。考虑到更多的聚类个数便于了解更细节的类别特征,因此确定k值为6。
图5 4种时间模式下对应的k值变化

Fig. 5 The corresponding k value changes in the four modes

4.3 聚类区域标识结果分析

区域所呈现的功能与该区域的POI分布相关,因此本研究计算每类区域中各POI的WTF-IDF值并进行归一化,结果如表3所示。其中C1—C6分别表示聚类后功能区。表中加粗的数字为在不同时间模式下,占比排名前三类的POI。特定时间模式下不开放的POI值为空。
表3 不同时间模式下每类区域POI的WTF-IDF值

Tab. 3 The WTF-IDF values of different types of POI in four modes

POI类型 C1 C2 C3
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
商业住宿类 0.310 0.163 0.463 0.321 0.161 0.122 0.415 0.040 0.000 0.000 0.261 0.000
居民住宅类 0.450 0.210 0.404 0.287 0.200 0.227 0.392 0.137 0.079 0.000 0.270 0.004
金融银行类 0.661 0.271 0.307 0.498 0.375 0.409 0.589 0.180 0.000 0.000 0.077 0.000
商业办公类 0.321 0.000 0.165 0.000 0.898 0.306 0.068 0.060 0.837 0.623 0.371 0.818
旅游景区类 0.232 0.131 0.217 0.036 0.110 0.000 0.096 0.749 1.000 1.000 1.000 1.000
餐饮类 0.980 0.897 0.666 1.000 0.986 0.754 1.000 0.845 0.983 0.318 0.084 0.000
文化娱乐类 0.883 0.300 0.183 0.499 0.096 0.299 0.483 0.117 0.486 0.000 0.000 0.000
医疗服务类 0.723 0.735 1.000 1.000 0.701 0.967 0.854 0.877 1.000 1.000 0.734 0.659
休闲娱乐类 - 0.000 0.756 0.403 - 0.067 0.954 0.277 - 0.087 0.874 0.000
消费购物类 - 0.791 0.900 0.552 - 0.737 0.821 0.800 - 1.000 1.000 1.000
生活服务类 - 1.000 - 0.941 - 0.974 - 0.832 - 0.671 - 0.000
车辆服务类 - 0.577 - 0.443 - 0.766 - 0.906 - 1.000 - 1.000
公共设施类 0.735 0.251 0.735 0.406 0.594 0.263 0.793 0.036 0.000 0.000 0.636 0.005
POI类型 C4 C5 C6
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
商业住宿类 0.787 0.784 0.983 0.136 0.049 0.638 0.000 0.133 1.000 1.000 1.000 1.000
居民住宅类 0.942 1.000 0.985 0.586 0.000 0.749 0.000 0.000 1.000 0.975 1.000 1.000
金融银行类 0.994 0.837 0.574 0.325 0.576 0.684 0.000 0.343 1.000 1.000 1.000 1.000
商业办公类 0.000 0.518 0.000 0.548 1.000 0.203 1.000 1.000 0.767 1.000 0.157 0.447
旅游景区类 0.128 0.016 0.754 0.114 0.000 0.488 0.000 0.000 0.143 0.320 0.365 0.102
餐饮类 0.717 0.730 0.000 0.868 1.000 1.000 0.421 0.888 0.000 0.000 0.133 0.763
文化娱乐类 0.435 0.748 1.000 0.202 1.000 0.452 0.772 0.140 0.000 1.000 0.856 1.000
医疗服务类 0.442 0.847 0.789 0.451 0.767 0.780 0.633 0.302 0.000 0.000 0.000 0.000
休闲娱乐类 - 0.375 0.923 0.347 - 0.317 0.000 0.207 - 1.000 1.000 1.000
消费购物类 - 0.237 0.115 0.630 - 0.499 0.940 0.683 - 0.000 0.000 0.000
生活服务类 - 0.374 - 0.973 - 0.725 - 1.000 - 0.000 - 0.103
车辆服务类 - 0.000 - 0.796 - 0.045 - 0.719 - 0.009 - 0.000
公共设施类 0.914 0.686 1.000 0.480 0.703 0.485 0.000 0.000 1.000 1.000 0.967 1.000

注:表中加粗数字表示占比排名前三的POI对应的WTF-IDF值。

研究发现,在空间维度上,多数区域混合用地功能显著,如C1区域中用地功能排名前5的分别为:餐饮类、文化娱乐类、公共设施类、医疗服务类和金融银行类。在时间维度上,呈现出功能的空间分布不断变化的特征,有的功能只在部分时间模式下活跃,有的功能则在所有时间模式下都是活跃的,如C2区域在任意时间模式下医疗服务类设施占比排名都较高,而C4区域在工作日期间金融办公类属性明显,在休息日期间文化娱乐及餐饮类的功能则更明显。

4.4 聚类区域标识与城市用地类型关系分析

为了说明每类区域所呈现的用地功能,本文参考《城市用地分类与规划建设用地标准》[37],将POI数据组合按照居住用地类、商业用地类、公共服务类、工业用地类、生态用地类进行分类,建立POI分类组合与5类城市功能的对应规则(图6)。
图6 城市用地分类定义

Fig. 6 City land-use function classification

根据表3的POI类型分布特点,结合图6中功能主题的分布特征,得到不同时间模式下每类区域的功能性分布变化(表4)。
表4 不同时间模式下区域显著用地功能对比结果

Tab. 4 Comparison of regional significant land-use functions under different time modes

用地性质 T1 T2 T3 T4
居住用地
公共服务用地
商业用地
工业用地
生态用地
以餐饮为主的商业用地
居住/商业混合用地
居住/工业混合用地
居住/公共服务混合用地
生态/商业混合用地

注:“√”表示在某种时间模式下,存在对应用地功能显著的区域,同时包含2种功能主题的区域表现为混合功能区的特点。

结果反映了成都市中心区域呈现用地功能复合化的特点。首先,区域用地性质在不同时间段呈现不同功能的现象,其中,有几类用地性质在各个时间模式下都是显著存在的,如居住用地、商业用地以及生态用地这3类功能区在任何时间模式下均有分布,表明城市区域中这3类的用地区域功能较为固定且占比面积大;此外,公共服务用地主要在工作日功能表现较为显著,重点表现为在此时间段下医疗服务类和公共设施类POI占比权重大,而工业用地性质的区域在工作日及休息日白天表现均较为显著,表明在此阶段一些区域会重点突出商业办公或商业住宅的功能特征;最后,值得注意的是,居住性的用地功能通常会结合商业类、工业类以及公共服务类性质的功能,这些区域呈现出以居住为主的混合用地功能;生态用地同时会带动对应区域的商业发展,表现为生态、商业混合的用地功能。

4.5 功能区时空分布变化特征可视分析

功能区的动态变化主要表现为不同时段每种功能区的分布范围是不同的,为了具体说明这种变化特征,本文根据表4,对4种时间模式下均出现的用地功能,即居住用地、生态用地和商业用地进行空间分布的可视化,如图7所示,从左至右分别表示T1T4时间模式下,3类功能区空间作用范围的时空分布变化特征。
图7 不同用地功能的空间分布变化

Fig. 7 Distribution of different land-use function in study area

图7(a)代表居住用地在不同时间段内的空间分布变化,该类用地分布范围广泛,且周围通常分布有娱乐、公共服务类相关设施。在大多数时间段,该功能用地都占据研究区域大范围空间,且早上大部分居住区功能单一,只表现出住宅属性,晚上部分会转化为休闲娱乐类等性质的用地。同时,周围分布的公共服务类设施最多,其中在休息日晚上从居住用地功能转化为公共服务用地功能的区域最多,表明该时间段居民出行娱乐的频率高,因此对应所需求的配套服务设施功能更突出。
图7(b)代表生态用地在不同时间段内的空间分布变化,该类用地主要分布于研究区域四环附近,部分用地会呈现出生态、商业混合用地的属性。主要表现为景点类POI所占比例最高,且与之对应的娱乐设施,如餐饮购物相对也较高。从时间模式的过渡上来看,工作日早上此类区域表现出生态、商业混合用地的特点,到了工作日晚上及休息日,生态区用地属性则更为突出。
图7(c)代表商业用地在不同时间段内的空间分布变化,该类用地分布范围较为分散,在休闲时段有向市中心集聚的特点。主要表现为工作日白天分布范围较广,在市中心、近郊区域均有分布。工作日晚上时段范围有所减小,主要分布于市中心区域,其中生活服务、休闲购物类POI分布较多;休息日整个时间段主要分布于近郊的一些产业园区,覆盖范围相对工作日减少,此外,在休息日晚上研究区域中心部分区域体现出商业用地的性质,其中餐饮类、休闲购物类等功能更为突出。

4.6 有效性量化分析

引入纯度熵[10]及Kappa系数[5]两种指标对本文提出方法进行量化分析。其中,城市区域功能纯度熵表示每类区域中POI分布的纯度,熵值越小,表明区域聚集度越高,聚类效果越好;一致性指标Kappa系数表示识别结果与真实用地功能之间的吻合度,根据其值对应5组不同级别的一致性,当值位于0.61~0.80区间时,表明高度一致性。
图8为本研究方法与近期研究同一城市的相关工作Liu[18]及Gao[19]所提出的方法在城市区域功能纯度熵上的对比结果。结果表明,本文在纯度熵最高的记录(蓝色柱)中表现出最低的熵值,即区域聚集度最强。这是由于本研究方法充分考虑了不同时间模式下区域功能所呈现的动态性变化,因此识别的功能聚集度更高。在纯度熵最低的记录(红色柱)对比中,本文纯度熵低于DTW_KNN[18]而高于GMM_PCC[19]。经分析发现,GMM_PCC[19]的方法仅以流量特征进行聚类,由于“春熙路”所在区域的流量一直处于较高值,因此将其划分成为独立的类别,但对照实际用地规划图,该类别应该属于商业区的规划范围。而本研究在考虑流量的同时也考虑了跟其空间上相似的其他区域,所以可获得聚集度高且贴近实际用地情况的聚类结果。
图8 3种方法区域聚集度的最大/最小熵值

Fig. 8 The maximum/minimum regional aggregation entropy of the three methods

结合高德电子地图的属性信息及成都市用地功能规划图中真实用地功能,构建各类用地样本误差矩阵,并计算Kappa系数。误差矩阵计算结果如表5所示。据此计算得到Kappa系数为0.612,介于0.6~0.8,表明识别结果与真实用地功能之间的吻合度强。
表5 各类用地样本误差矩阵

Tab. 5 Various types of land sample error matrix

用地类型 居住用地 商业用地 工业用地 生态用地 公共服务用地
居住用地 236 3 9 34 18
商业用地 7 59 3 2 8
工业用地 3 2 20 4 1
生态用地 24 8 7 82 3
公共服务用地 17 6 1 5 54

4.7 案例分析

为了检验本研究方法在城市功能区的动态识别的效果,将研究得到的识别结果与高德地图真实分布的POI数据及区域流量趋势图进行对比分析,通过案例分析本文方法随时间演变的功能区识别的有效性。
绘制成都体育中心所在区域的高德地图真实数据点分布(图9(a)和一个月内此区域在工作日、休息日出租车流量趋势图(图9(b))。从高德地图分布来看,成都体育中心附近分布较多政府办公机构(图9(a)红色圆圈),同时著名的商业中心大楼富力中心也位于此区域。此外,该区域还分布有体育中心、艺术剧场、美术馆等大型的科教文化服务设施(图9(a)绿色圆圈),体现该区域为典型的用地功能混合区。结合出租车流量趋势图,在17:00前此区域的下车量一直大于上车量,即一直为群体流入的状态。在19:00点前工作日和休息日的流量趋势差别较为明显,工作日波动次数较多,产生许多极值,表现出更明显的通勤时间特征,因此更符合工业用地类的属性。而在休息日期间整体波动范围不大,早上流入量较低,到10:00左右开始逐渐增加,且全天比较平稳,更符合居民在此处进行娱乐休闲的出行目的,结合POI的分布,表明在该时间段,区域表现出公共服务类的用地特征,相应的工业区用地功能有所减弱。通过对POI分布与一天内流量趋势的结合分析,得到的结果与本研究考虑了早高峰、晚高峰(图9(b)红色区间)的流量特征及空间交互特征的GAT-GRU方法识别区域功能演变的情况一致。
图9 成都体育中心所在区域的POI分布与流量趋势

Fig. 9 POI distribution and traffic trend in the area where the Chengdu Sports Center is located

5 结论与展望

5.1 结论

本研究融合车辆行驶的轨迹数据和POI数据,提出结合图注意力网络GAT和门控循环网络GRU的深度学习网络模型实现城市用地功能识别。以成都市中心为例,对研究区域进行了多尺度空间和多粒度时间模式下的用地功能识别。主要结论如下:
(1)利用深度学习的方法对城市用地功能的自动化识别过程进行了优化。本文提出的基于图结构的深度学习模型的构建,不仅对城市用地功能在时间维度的变化特征进行建模,同时对区域之间存在的复杂多元空间关系进行学习,反映城市区域中轨迹流量变化及区域之间的空间交互特征。该方法提升了精细化用地识别的准确性,为现代城市功能区呈现出的复杂非线性时空变化特征建模提供了新的视角和方法。
(2)与相关工作对比实验表明,本文提出方法在更细粒度的时间段下进行功能区识别,得到的同一类功能区域集聚度更高。不同于以往的只为某一特定区域分配单一的功能标签或笼统的定义某些区域为功能混合区的研究,本文能够挖掘区域内体现的混合和多重功能的实际发展现象,更好的捕获复合型区域在不同时间模式下呈现出的功能变化,如住宅楼周围通常分布有密集的商业类、公共服务类建筑设施,从而呈现出多功能混合的用地现象,用地属性会随着城市群体活动在时间和空间上发生作用范围的变化,表现出区域功能随着城市群体活动而变化的时空规律。

5.2 展望

深度学习模型的设计和实现,为城市用地功能识别提供了新的技术方法,但是本研究工作仍存在一些改进的方向。首先本研究采用滴滴出行数据代表城市群体的出行行为,在反映群体出行规律和区域之间的交互程度上还不够全面,之后可以结合公交出行、用户手机移动数据,并收集蕴含更丰富的周期性规律的长时时间序列,通过动态图表示深度学习模型提取有效的潜在时空特征,用以探究各功能用地的空间动态演化模式;其次,考虑到城市区域用地功能受到政策、各类型产业状况等因素影响,未来可进一步融合新闻文本数据、经济数据等多源数据,结合相关性分析及因果推断方法,如莫兰指数、元强化学习[38]等,深入探究城市区域功能演化的特征及成因,为城市规划提供更详实的决策支持。
[1]
杨俊宴, 邵典, 王桥, 等. 一种人工智能精细识别城市用地的方法探索——基于建筑形态与业态大数据[J]. 城市规划, 2021, 45(3):46-56.

[ Yang J Y, Shao D, Wang Q, et al. Exploration on a method for precision identification of building forms and business POI data[J]. City Planning Review, 2021, 45(3):46-56. ] DOI: 10.11819/cpr20210308a

DOI

[2]
杨振山, 苏锦华, 杨航, 等. 基于多源数据的城市功能区精细化研究——以北京为例[J]. 地理研究, 2021, 40(2):477-494.

DOI

[ Yang Z S, Su J H, Yang H, et al. Exploring urban functional areas based on multi-source data: A case study of Beijing[J]. Geographical Research, 2021, 40(2):477-494. ] DOI: 10.11821/dlyj020200074

DOI

[3]
丁彦文, 许捍卫, 汪成昊. 融合OSM路网与POI数据的城市功能区识别研究[J]. 地理与地理信息科学, 2020, 36(4):57-63.

[ Ding Y W, Xu H W, Wang C H. Research on urban functional area recognition integrating OSM rad network and POI data[J]. Geography and Geo-information Science, 2020, 36(4):57-63. ] DOI: 10.3969/j.issn.1672-05 04.2020.04.009

DOI

[4]
薛冰, 赵冰玉, 肖骁, 等. 基于POI大数据的资源型城市功能区识别方法与实证——以辽宁省本溪市为例[J]. 人文地理, 2020, 35(0):81-90.

[ Xue B, Zhao B Y, Xiao X, et al. A POI data-based study on urban functional areas of the resources-based city: A case study of Benxi, Liaoning[J]. Human Geography, 2020, 35(4):81-90. ] DOI: 10.13959/j.issn.1003-2398.2020.04.011

DOI

[5]
窦旺胜, 王成新, 薛明月, 等. 基于POI数据的城市用地功能识别与评价研究——以济南市内五区为例[J]. 世界地理研究, 2020, 29(4):804-813.

DOI

[ Dou W W, Wang C X, Xue M Y, et al. Identification and evaluation of urban functional land based on POI data-A case study of five districts in Jinan[J]. World Regional Studies, 2020, 29(4):804-813. ] DOI: 10.3969/j.issn.1004-9479.2020.04.201 9186

DOI

[6]
姜佳怡, 戴菲, 章俊华. 基于POI数据的城市功能结构对比研究——以北京、上海为例[J]. 现代城市研究, 2020(7):42-50.

[ Jiang J Y, Dai F, Zhang J H. Comparative study of urban functional structure based on POI data:Acase study of Beijing and Shanghai[J]. Modern Urban Research, 2020(7):42-50. ] DOI: 10.3969/j.issn.1009-600 0.2020.07.006

DOI

[7]
高子为, 孙伟伟, 程朋根, 等. 融合高分辨率遥感影像和POI数据的多特征潜在语义信息用于识别城市功能区[J]. 遥感技术与应用, 2021, 36(3):618-626.

[ Gao Z W, Sun W W, Cheng P G, et al. Identify urban functional zones using multi-feature latent semantic fused information of high-spatial resolution remote sensing image and POI data[J]. Remote Sensing Technology and Application, 2021, 36(3):618-626. ] DOI: 10.11873/j.issn.1004-03 23.2021.3.0618

DOI

[8]
Chen Y, Chen X, Liu Z, et al. Understanding the spatial organization of urban functions based on co-location patterns mining: A comparative analysis for 25 Chinese cities[J]. Cities, 2020, 97:102563. https://doi.org/10.1016/j.cities.2019.102563

DOI

[9]
刘菊, 许珺, 蔡玲, 等. 基于出租车用户出行的功能区识别[J]. 地球信息科学学报, 2018, 20(11):1550-1561.

DOI

[ Liu J, Xu J, Cai L, et al. Identifying functional regions based on the Spatio-temporal pattern of taxi trajectories[J]. Journal of Geo-information Science, 2018, 20(11):1550-1561. ] DOI: 10.12085/dqxxkx.2018.180164

DOI

[10]
肖飞, 王悦, 梅逸男, 等. 基于出行模式子图的城市功能区域发现方法[J]. 计算机科学, 2018, 45(12):268-278.

DOI

[ Xiao F, Wang Y, Mei Y N, et al. City functional region discovery algorithm based on travel pattern subgraph[J]. Computer Science, 2018, 45(12):268-278. ] DOI: 10.11896/j.is sn.1002-137X.2018.12.04

DOI

[11]
陈占龙, 周路林, 禹文豪, 等. 顾及兴趣点潜在上下文关系的城市功能区识别[J]. 测绘学报, 2020, 49(7):907-920.

[ Chen Z L, Zhou L L, Yu W H, et al. Identification of the urban functional regions considering the potential context of interest points[J]. Acta Geodaetica et Cartographica Sinica, 2020, 49(7):907-920. ] DOI: 10.11947/j.AGCS.202 0.20190315

DOI

[12]
韩昊英, 于翔, 龙瀛. 基于北京公交刷卡数据和兴趣点的功能区识别[J]. 城市规划, 2016, 40(6):52-60.

[ Han H Y, Yu X, Long Y. Identifying urban functional zones using bus smart card data and points of interest in Beijing[J]. City Planning Review, 2016, 40(6):52-60. ] DOI: 10.11819/cpr20160609a

DOI

[13]
张慧杰, 王蓉, 陈斌, 等. 基于轨迹和兴趣点数据的城市功能区动态识别与时变规律可视分析[J]. 计算机辅助设计与图形学学报, 2018, 30(9):1728-1740.

[ Zhang H J, Wang R, Chen B, et al. Dynamic Identification of urban functional areas and visual analysis of time-varying patterns based on trajectory data and POIs[J]. Journal of Computer-Aided Design & Computer Graphics, 2018, 30(9):1728-1740. ] DOI: 10.3724/SP.J.1089.2018.16357

DOI

[14]
顾家焕, 王德. 大数据背景下的通勤模型构建与应用——以上海市为例[J]. 城市规划, 2020, 44(11):69-77.

[ Gu J H, Wang D. Commuting models of Shanghai based on big data: Methods and application[J]. City Planning Review, 2020, 44(11):69-77. ] DOI: 0.11819/cpr20201109a

DOI

[15]
彭正洪, 孙志豪, 程青, 等. 利用时序手机通话数据识别城市用地功能[J]. 武汉大学学报·信息科学版, 2018, 43(9):1399-1407,1437.

[ Peng Z H, Sun Z H, Cheng Q, et al. Urban land use function recognition method using sequential mobile phone data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(9):1399-1407,1437. ] DOI: 10.13203/j.whugis20170329

DOI

[16]
赵莹, 张朝枝, 金钰涵. 基于手机数据可靠性分析的旅游城市功能空间识别研究[J]. 人文地理, 2018, 33(3):137-144.

[ Zhao Y, Zhang C Z, Jin Y H, How reliable are cellular positioning data in tourism environments?An exploration of functional regions[J]. Human Geography, 2018, 33(3):137-144. ] DOI: 10.13959/j.issn.1003-2398.2018.03.017

DOI

[17]
Tu W, Cao J, Yue Y, et al. Coupling mobile phone and social media data: A new approach to understanding urban functions and diurnal patterns[J]. International Journal of Geographical Information Science, 2017, 31(12):2331-2358. DOI: 10.1080/13658816.2017.1356464

DOI

[18]
Liu X, Tian Y, Zhang X, et al. Identification of urban functional regions in Chengdu based on taxi trajectory time series data[J]. ISPRS International Journal of Geo-information, 2020, 9(3):158. DOI: 10.3390/ijgi9030158

DOI

[19]
Gao Q, Fu J, Yu Y, et al. Identification of urban regions' functions in Chengdu, China, based on vehicle trajectory data[J]. PLoS One, 2019, 14(4):e0215656. DOI: 10.1371/journal.pone.0215656

DOI

[20]
Yu B, Wang Z, Mu H, et al. Identification of urban functional regions based on floating car track data and POI data[J]. Sustainability, 2019, 11(23): 6541. DOI:10.3390/su1 1236541

DOI

[21]
Yan L C, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553):436-444. https://doi.org/10.3390/ijgi110 20072

DOI

[22]
郑至键, 郑荣宝, 徐嘉源, 等. 基于POI数据和Place2vec模型的城市功能区识别研究[J]. 地理与地理信息科学, 2020, 36(4):48-56.

[ Zheng Z J, Zheng R B, Xu J Y, et al. Identification of urban functional regions based on POI data and Place2vec model[J]. Geography and Geo-information Science, 2020, 36(4):48-56. ] DOI: 0.3969/j.issn.1 672-0504.2020.04.008

DOI

[23]
Yao Y, Li X, Liu X, et al. Sensing spatial distribution of urban land use by integrating points-of-interest and Google Word2Vec model[J]. International Journal of Geographical Information Science, 2017, 31(4):825-848. DOI: 10.1080/13658816.2016.1244608

DOI

[24]
陈世莉, 陶海燕, 李旭亮, 等. 基于潜在语义信息的城市功能区识别——广州市浮动车GPS时空数据挖掘[J]. 地理学报, 2016, 71(3):471-483.

DOI

[ Chen S L, Tao H Y, Li X L, et al. Discovering urban functional regions using latent semantic information:Spatiotemporal data mining of floating cars GPS data of Guangzhou[J]. Acta Geographica Sinica, 2016, 71(3):471-483. ] DOI:10.11821/dlxb2016 03010

[25]
姚尧, 张亚涛, 关庆锋, 等. 使用时序出租车轨迹识别多层次城市功能结构[J]. 武汉大学学报·信息科学版, 2019, 44(6):875-884.

[ Yao Y, Zhang Y T, Guan Q F, et al. Sensing multi-level urban functional structures by using time series taxi trajectory data[J]. Geomatics and Information Science of Wuhan University, 2019, 44(6):875-884. ] DOI: CNKI:SUN:WHCH.0.2019-06-013

DOI

[26]
Song Z, Wang H, Qin S, et al. Building-Level urban functional area identification based on multi-attribute aggregated data from cell phones: A method combining multidimensional time series with a SOM neural network[J]. ISPRS International Journal of Geo-information, 2022, 11(2):72. https://doi.org/10.3390/ijgi11020072

DOI

[27]
谷岩岩, 焦利民, 董婷, 等. 基于多源数据的城市功能区识别及相互作用分析[J]. 武汉大学学报·信息科学版, 2018, 43(7):1113-1121.

[ Gu Y Y, Jiao L M, Dong T, et al. Spatial distribution and interaction analysis of urban functional areas based on multi-source data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(7):1113-1121. ] DOI: 10.13203/j.whugis20160192

DOI

[28]
Zhang J, Li X, Yao Y, et al. The Traj2Vec model to quantify residents' spatial trajectories and estimate the proportions of urban land-use types[J]. International Journal of Geographical Information Science, 2021, 35(1):193-211. DOI: 10.1080/13658816.2020.1726923

DOI

[29]
Veličković P, Cucurull G, Casanova A, et al. Graph attention networks[J]. arXiv preprint arXiv:1710.10903, 2017.

[30]
Kipf T N, Welling M. Semi-supervised classification with graph convolutional networks[J]. arXiv preprint arXiv:1609.02907, 2016.

[31]
Che Z, Purushotham S, Cho K, et al. Recurrent neural networks for multivariate time series with missing values[J]. Scientific Reports, 2018, 8(1):1-12. DOI: 10.1038/s41598-018-24271-9

DOI

[32]
Liu X, Gong L, Gong Y, et al. Revealing travel patterns and city structure with taxi trip data[J]. Journal of Transport Geography, 2015, 43:78-90. DOI: 10.1016/j.jtrange o.2015.01.016

DOI

[33]
Sankar A, Wu Y, Gou L, et al. Dynamic graph representation learning via self-attention networks[J]. arXiv preprint arXiv:1812.09430, 2018.

[34]
Xu Z, Cui G, Zhong M, et al. Anomalous urban mobility pattern detection based on GPS trajectories and POI data[J]. ISPRS International Journal of Geo-information, 2019, 8(7):308. DOI: 10.3390/ijgi8070308

DOI

[35]
Liu Y, Wang F, Xiao Y, et al. Urban land uses and traffic 'source-sink areas': Evidence from GPS-enabled taxi data in Shanghai[J]. Landscape and Urban Planning, 2012, 106(1):73-87. DOI: 10.1016/j.landurbplan.2012.02.012

DOI

[36]
Zhao P, Kwan M P, Qin K. Uncovering the spatiotemporal patterns of CO2 emissions by taxis based on Individuals' daily travel[J]. Journal of Transport Geography, 2017, 62:122-135. DOI: 10.1016/j.jtrangeo.2017.05.00

DOI

[37]
李翠. 基于POI数据的城市功能区识别研究——以成都市为例[C]// 面向高质量发展的空间治理——2020中国城市规划年会论文集(05城市规划新技术应用)., 2021:236-243.

[ Li C. Research on the identification of urban functional areas based on POI Data—— Taking Chengdu as an example[C]// Spatial Governance for High-quality Development:Proceedings of the 2020 China Urban Planning Annual Conference (05 Application of New Technologies in Urban Planning)., 2021:236-243. DOI: 10.26914/c.cnkihy.2021.033689

DOI

[39]
Dasgupta I, Wang J, Chiappa S, et al. Causal reasoning from meta-reinforcement learning[J]. arXiv preprint arXiv:1901.08162, 2019.

Outlines

/