Hyperparameter Selection for Urban Metro Travel Knowledge Graph Embedding

  • LUO Qiuyu , 1 ,
  • YUE Yang 1, 2 ,
  • GU Yanyan , 1, *
Expand
  • 1. School of Architecture and Urban Planning, Shenzhen University, Shenzhen 518060, China
  • 2. Shenzhen Key Laboratory of Spatial Smart Sensing and Services, Shenzhen 518060, China
*GU Yanyan, E-mail:

Received date: 2023-02-10

  Revised date: 2023-04-19

  Online published: 2023-06-02

Supported by

National Natural Science Foundation of China(42171449)

National Natural Science Foundation of China(42101464)

Open Research Fund Program of LIESMARS(21I03)

Abstract

Knowledge graphs are an important data infrastructure in AI technologies and applications, and have become a hot research topic in geosciences. The size and topological features in geographic knowledge graphs are usually different from universal knowledge graphs, which are not typical small-world networks. However, existing studies often use the default network search depth when learning geographic knowledge graph representations, and its rationality needs further demonstration. For this purpose, this paper constructs a metro travel knowledge graph based on the topological structure features of metro line network, combined with passenger flow data, POI (Point of Interest) data and built environment data, etc.; then GraphSAGE model is used to learn node multidimensional feature embedding and combine POI data for semantic recognition of station classification results to verify the suitable network search depth for metro travel knowledge graph. The results showed that, compared to the default 2 layers search depth, the node embedding features of this metro travel knowledge graph work optimally when the search depth is 3 layers. This study shows that the hyperparameter selection of the geographic knowledge graph representation is supposed to take into account the geographic features, and it is important to avoid the use of results from fields such as computer science that have not been distinguished. When the search depth is 3 layers, the metro station classification results are also more reasonable and explanatory, which can provide a basis for station planning and passenger flow prediction using knowledge graph and AI methods.

Cite this article

LUO Qiuyu , YUE Yang , GU Yanyan . Hyperparameter Selection for Urban Metro Travel Knowledge Graph Embedding[J]. Journal of Geo-information Science, 2023 , 25(6) : 1164 -1175 . DOI: 10.12082/dqxxkx.2023.230054

1 引言

知识图谱被喻为人工智能应用的基础设施[1-2],通过有效组织数据,为人工智能模型和应用提供数据和知识支撑[3-4]。工业界和学术界近年纷纷构建具有自身特征的领域知识图谱[5-6],如搜索引擎、金融、医疗、化学、公安行业等[7];地理知识图谱的构建与应用也成为了一个研究热点[8-10]。地理知识图谱通过融合多源异构时空数据抽取地理实体及其语义关系,提供形式化、结构化的人地关系知识系统,可以更高效地发挥各类人工智能模型和算法的作用,是发挥地理空间智能(GeoAI)巨大潜力的数据基础设施,有助于对地理现象和人地关系等时空规律特征进行更深层次的分析与解释。
知识图谱嵌入表达(Embedding)是指将知识图谱中的符号(包括实体和关系)映射到一个低维的空间,通过利用向量表示法来拟合实体间的交互作用,学习实体和关系的隐含语义特征[11]。常用嵌入表达模型有TransE(加法模型)、DistMult(乘法模型)以及图表示学习等;在学习和优化过程中则包含很多常用超参数,如学习率、初始化、batch size、嵌入维度等。目前,对地理知识图谱的研究多集中在实体、关系、属性的定义、存储和融合等[12-14],对于交通这种典型的人地关系知识图谱的研究则主要集中于短时客流预测[15]、地点推荐[16]以及移动预测[17]等场景。整体而言,目前的相关研究对知识图谱嵌入表达中的超参数选择和优化的讨论较少。
超参数是在机器学习或深度学习模型训练时人为设定的参数,目前关于超参数在知识图谱中的研究主要集中于嵌入维度和聚合方式等方面,合适的超参数可以提高模型的准确性,其中网络搜索深度(Search Depth, SD)的选择影响图谱节点的特征聚合与表达[18]。计算机领域已有研究发现:在图表示学习模型训练和优化过程中,搜索深度从1到6对模型表达能力影响较小[19-20]。计算机领域中常用的数据集,如社交网络和引文网络等,通常具有小世界现象[21]和幂律分布[22]等特征,搜索深度过深易造成过拟合[23];同时增加搜索深度通常会降低模型的运行效率。以GraphSAGE模型为例,当搜索深度为2层的结果精度比一层的高出10%~15%;当搜索深度大于2层时,精度只能提升0%~5%,而运行时间却增加了10~100倍[24]。因此,2层搜索深度是成为多数研究的默认超参数[25-26]。然而,多数地理知识图谱与计算机等领域常见知识图谱的网络拓扑特征和结构不同[27],通常不是典型的小世界网络, 2层网络搜索深度是否适用于地理知识图谱,其合理性还需进一步论证。以城市路网为例,其节点度基本维持在固定的几个数值,节点和边的数量有限且相对固定。因此,在表征地理知识图谱时择优选取才能更好地学习节点的特征,提升知识图谱的表达和推理能力[27]
为探究此问题,本文以地铁线路网络、乘客上下车数据、POI数据和建成环境数据等构建地铁出行知识图谱,选取GraphSAGE作为知识图谱嵌入表达模型,探究超参数中不同搜索深度对地铁站点多维度特征表达的影响。节点分类和链路预测是知识图谱的两大应用,合理地选择超参数有助于提高知识图谱的表达能力。本研究以搜索深度为例,对实现更加准确地理知识图谱的嵌入表达和推理具有一定的启发和借鉴作用。

2 研究方法

2.1 知识图谱构建

知识图谱是一种语义图,其节点代表实体或概念,边代表实体/概念间的各种语义关系。关系抽取是从实体出行信息中辨别出2个实体之间存在的语义关系,如空间关系、时间关系、状态关系、属性关系等。本研究以地铁刷卡数据、POI数据等构建地铁出行知识图谱,以地铁站点作为实体,实体的关系包括:地铁网络拓扑关系(连接)、OD流,并通过语义网络来表示出行知识图谱<头实体,关系,尾实体>三元组,图1为地铁出行知识图谱的模式(schema)。
图1 地铁出行知识图谱模式

Fig. 1 Schema of metro travel knowledge graph

2.2 知识图谱嵌入表达模型的超参数选择

要分析超参数对地铁出行知识图谱特征表达的影响,首先需要选择一个嵌入表达模型。图神经网络(Graph Neural Network, GNN)作为知识图谱嵌入表达的方法之一,可以有效地从图结构和节点属性中学习特征,在生成表示节点与边的低维向量中表现优良[28]。GraphSAGE模型属于归纳学习类GNN算法,每个节点的特征学习过程不仅与节点自身属性相关,同时聚合邻居特征,对于新加入的节点具有较好泛化能力[29],无需遍历全图。因此,本研究采用GraphSAGE对构造的知识谱图进行节点嵌入表达,以捕捉地理环境中的区域特征以及地铁网络中站点的时空依赖关系的功能。
GraphSAGE模型的基本运行步骤如图2所示:① 确定网络搜索深度的层数k,如k=2的时每个节点可以根据其2阶邻接节点的特征学习其自身的嵌入(图2(a));② 在每一层的循环中进行聚合操作,选择适合模型的操作算子对图中每个节点的邻居进行整体输出,在这过程中需要将聚合的邻居特征与选取节点的上一层状态信息进行拼接,之后在将计算后的节点进行归一化处理(图2(b));③ 在迭代k次之后即可得到图中每个节点的嵌入(图2(c))。
图2 GraphSAGE模型的基本的运行过程

Fig. 2 The running process of GraphSAGE

本研究采用的是无监督GraphSAGE模型,损失函数为负采样方法,基于图的无监督损失函数会使得相邻的节点有相似的表示,相距很远的节点差距更大。
J G ( z u ) = - l o g ( σ ( z u z v ) ) - Q E v n P n ( v ) l o g ( σ ( - z u z v n ) )
式中:zu为节点u通过GraphSAGE生成的embedding;节点v是节点u随机游走到达的“邻居”;σ是sigmoid函数;Pn是负采样的概率分布,类似word2vec中的负采样;Q是负样本的数目。
超参数是在机器学习或深度学习模型训练中需要预先设定的参数,选择合适的超参数对于模型性能至关重要,过小或过大的超参数可能导致欠拟合或过拟合,影响模型的泛化能力。GraphSAGE模型中的超参数包含嵌入维度、搜索深度、聚合函数等。本文以搜索深度为例,分析超参数对地铁站点多维度特征表达的影响,以此说明地理尤其是人地关系知识图谱嵌入表达的超参数是否具有特殊性。

3 研究区概况与数据来源

3.1 研究区概况

本文以2018年深圳市167个地铁站点(图3)为例,构建地铁出行知识图谱。深圳市自2004年地铁1号线开始运营到2022年底已建成16条地铁线路,地铁里程超过500 km[30]。目前深圳市地铁公交分担率已超60%,是公交出行的重要组成部分。
图3 2018年深圳市地铁站点与线路分布

Fig. 3 Distribution of metro stations and lines in Shenzhen in 2018

3.2 数据来源

本文以深圳市2018年11月5日的地铁刷卡数据、同年高德POI数据和建筑普查数据以及详细规划数据作为数据源。已有研究[31-33]认为站点周边缓冲区,如400~800 m[34]的就业密度、居住密度、混合土地利用多样性等是影响地铁出行的主要因素。而利用手机数据的研究[35]发现750 m缓冲区能够覆盖70%以上的客流,因此,本研究将地铁站点周边750 m的范围定义为站点缓冲区。

3.2.1 POI数据

POI数据被广泛应用于城市土地利用分析中[36]。如表1所示,本研究将POI依据城市用地类型分为6个大类以及22个中类。其中的“居住”类POI与常见导航地图中的居住类POI的分类不同,这是因为现有导航地图中的居住类POI数据无法表征居住密度和建成环境。以深圳为例,地铁站点缓冲区内的不同的居住类型建筑物对客流有不同程度的影响,通常城中村的影响最大,其次是老旧住区和普通商品房等[35]。因此,本研究将建筑普查和详细规划数据结合区分4类居住用地,代替居住类的POI。
表1 依据城市用地类型的POI数据的重分类

Tab. 1 Reclassification of POI data by urban land use type

大类 中类
居住 第一类居住用地;第二类居住用地;
第三类居住用地;第四类居住用地
公共服务 公共设施;科教文化;体育休闲;医疗保健;政府机构
商业 餐饮服务;购物服务;金融保险;汽车摩托;生活服务;住宿服务
办公 公司企业;商务写字楼
交通 道路附属;地址地名;交通设施
绿地与广场 风景名胜;公园广场
(1)建筑普查数据
建筑普查数据包含居住、商业、公共配套、工业等34个中类。其中属性表中包含的字段有建筑层数、总建筑面积,主要用途等字段。本研究选取字段“主要用途”中的“私宅”和“居住”,但由于数据中的这两类的建筑物并未标明具体属于哪种类型,还需要结合详细规划数据。
(2)详细规划数据
详细规划数据也称法定图则,是根据城市用地分类与规划建设用地标准,将城市的地块划分为 9个中类,其中,居住用地中分为4种类型,即一类居住用地、二类居住用地、三类居住用地和四类居住用地,这4种类型的居住用地的环境和服务人群有所不同,具体如表2所示。
表2 4种不同类型的居住用地

Tab. 2 Four different types of residential land uses

居住用地类型 内容
一类居住用地 独立式住宅(别墅),配套齐全,布局完整
二类居住用地 以多层、中高层为主,配套齐全,布局完整
三类居住用地 单身宿舍
四类居住用地 原农村居民住宅用地
图4表示以白石洲地铁站为中心的750 m缓冲区内,法定图则与建筑普查数据重叠之后得到4种不同类型的居住类建筑物。
图4 法定图则居住用地与居住或私宅类建筑物示例

Fig. 4 Example of residential buildings (including private residences) and residential land uses in statutory chart

3.2.2 地铁刷卡数据

地铁刷卡数据统计的是地铁站点的进出客流信息,即一个用户的一次完整的进出站信息(OD),包括ID、时间、进站站点和出站站点,如表3所示。本研究主要关注通勤出行,因此基于地铁刷卡数据统计2018年11月5日(工作日)早、晚高峰地铁站点间的OD客流量(早、晚高峰的时间分别确定为 7:00—10:00和17:00—20:00)。
表3 地铁刷卡数据示例

Tab. 3 Examples of smart card data

ID 时间 线路 进出站 名称 经度/°E 纬度/°N
68580**** 2018-11-05T20:49:29 地铁一号线 3(进站) 站A 114.**** 22.****
68580**** 2018-11-05T21:30:16 地铁四号线 4(出站) 站B 114.**** 22.****
本研究以地铁站点为知识图谱的组织单元(实体),以站点缓冲区内的22类POI作为实体的属性,以地铁网络、早高峰OD和晚高峰OD作为3种不同类型的边,构建地铁出行知识图谱KG=(G,R),其中G为实体集,R为实体之间的关系集,并存储于Neo4j数据库中。本研究构建出的地铁出行知识图谱不是典型的小世界网络(不具备较小的平均路径长度以及较高的聚集系数),有167个节点和3种不同类型的边(地铁网络191条,早高峰OD 22 142条,晚高峰OD 27 763条),其中节点属性包括换乘站数量和站点区域内的22类POI中类;边的属性分别为地铁网络为无向无属性、早高峰OD有向有属性(流量)和晚高峰OD有向有属性(流量),图5为本文所构建的地铁出行知识图谱子图。
图5 地铁出行知识图谱子图

Fig. 5 Subgraph of metro travel knowledge graph

利用GraphSAGE模型生成地铁站点的节点嵌入表达,参与训练的边为地铁网络,节点特征包括站点区域内22类POI、站点早高峰OD流入、站点早高峰OD流出、站点晚高峰OD流入、站点晚高峰OD流出以及站点换乘站数量;在生成节点嵌入的过程中通过改变超参数中的搜索深度这一变量来判断常规图谱所采用的默认值是否合理。在生成站点嵌入后,将嵌入通过K-means降维,最后利用POI类别对分类结果进行可解释性分析,具体流程如图6所示。
图6 基于GraphSAGE模型的地铁出行知识图谱节点嵌入表达

Fig. 6 Metro travel knowledge graph node Embeddings based on GraphSAGE model

4 结果与分析

4.1 最优搜索深度

如上所述,本研究构建的地铁出行知识图谱与计算机等领域常见知识图谱的网络拓扑特征和结构不同,不是典型的小世界网络,2层网络搜索深度是否适用还需进一步论证。为了保证搜索深度为唯一变量,本研究将节点特征嵌入进行 K-means聚类,并以5类作为一个可供比较的类别数目,用轮廓系数[37]评价聚类结果分离性(表4)。图7显示了SD=3的节点嵌入的TSNE(T-Distribution Stochastic Neighbor Embedding)可视化,类别聚集现象较为明显。
表4 不同搜索深度的聚类轮廓系数

Tab. 4 Clustering silhouette coefficient for different search depths

SD 1 2 3 4 5 6
轮廓系数 0.42 0.46 0.51 0.48 0.51 0.37
图7 搜索深度为3的节点嵌入的TSNE可视化结果

Fig. 7 TSNE visualization of the node embedding when the search depth is 3

为判断样本向量之间的差异,本研究以各个类别之间及子类的平均余弦距离[38]来判断聚类效果最优的搜索深度。平均余弦距离热力图(图8)表明搜索深度为3层时聚类效果略优于2层及其他搜索深度。由于此知识图谱规模较小,增加搜索深度对计算效率影响并不大。但考虑到地铁站点分类在交通研究中具有重要作用,研究进一步结合POI类别对地铁站点的分类结果进行语义识别,判断3层是否为最优搜索深度。
图8 不同搜索深度的平均余弦距离热力图

Fig. 8 Heat maps of the average cosine distance for different search depths

4.2 站点分类语义理解

图9图10所示分别是2层(默认值)和3层搜索深度对应的节点嵌入聚类结果及对应的地铁站点周边土地利用特征。当搜索深度为2层时,站点聚类结果的土地利用可解释性和规律性较弱,类别之间的差别难以辨别。
图9 搜索深度为2层时几类地铁站点周边的土地利用特征

Fig. 9 Land use characteristics around several types of metro stations when the search depth is 2

图10 搜索深度为3层时不同类别地铁站点的土地利用特征

Fig. 10 Land use characteristics of different types of metro stations when the search depth is 3

当搜索深度为3层时(图10),站点周边的土地类型有较为清晰的分类特征,将其映射到地铁线路图上(图11),与现实状态较为相符。
图11 搜索深度为3层时的深圳市地铁站点的分类结果

Fig. 11 Results of Shenzhen metro station classification when the search depth is 3

Cluster1:站点主要类型为工作地。代表站点有深大站、高新园站以及科苑站等。商务写字楼和公司企业远超其他4类的数量,而4个不同级别的居住用地整体偏少。在商业类的POI的子类中,Cluster1的金融保险类较多而购物服务类与汽车摩托类很少。这也比较符合这类地铁站点是以工作地为主的属性。
Cluster2:站点主要表示类型为特定类型的居住地,代表站点有坪洲站、白石洲站和西乡站等。由图可知,大部分的第四类居住用地,即城中村,集中在这一站点类别中。这类站点周边的公共服务类POI较少;在商业类POI中也较少餐饮服务和购物服务,且几乎不存在金融保险类POI。
Cluster3:站点主要表现为地铁换乘站和包含大部分的第二类居住用地,代表站点有宝安中心站和布吉站等。第二类居住用地主要以多层、中高层为主,配套齐全,布局完整。这类站点在缓冲区内不存在城中村建筑物。Cluster2与Cluster3均是以居住类为主的地铁站点且办公类POI占比都较少,但它们重点服务的人群有所不同。
Cluster4:站点的整体POI较为丰富和均衡。代表站点为:福田口岸站、蛇口站、皇岗口岸站以及罗湖站等。其中第一类居住用地(独立式住宅或别墅,配套齐全,布局完整)主要集中在这个类别。通过具体查看相关站点可知,这类站点主要集中在沿海区域,靠近深圳湾附近的别墅群和高档小区是第一类居住用地较多的主要原因。
Cluster5:这类站点整体的POI 数量偏少,混合土地利用较少,主要集中在3号线布吉站以北的龙岗区。这类站点远离城市发展中心,属于正在高速发展的地区。
结合平均余弦距离相似度和站点分类语义理解可知,3层搜索深度的节点嵌入表达效果明显优于2层搜索深度,各类别具有显著的特征。
目前地铁站点没有统一的分类标准,大部分研究采用的是无监督聚类方法,常用的方法有 K-means[39]、层次聚类法[40]、基于模型的潜在聚类方法[32]和主成分分析(PCA)[41]等,分类结果的可解释性较低[42],且现有站点分类研究较少考虑到邻近站点和网络结构对中心站点的影响。使用地铁出行知识图谱,利用拓扑邻近效应推断地铁站点的分类既考虑了观测属性,也顾及其连接对象的特征[43-44]。因此,在地理知识图谱嵌入表达的训练与学习时,对默认超参数进行判断与选择有利于提高地铁站点分类结果的可解释性。

5 结论

利用多源时空数据构建出行知识图谱,对利用人工智能技术深入理解时空和人地关系具有重要价值。由于不同领域专题的知识图谱可能具有不同的网络结构特征,将计算机等领域现有方法直接引入到地理空间应用场景中,某些参数设置的合理性和可行性还需进一步验证。
本研究以深圳市地铁出行知识图谱为例,分析了GraphSAGE模型搜索深度对地铁站点特征嵌入结果的影响。结果表明,针对地铁出行知识图谱最优的搜索深度为3层,而不是其它图谱默认的2层深度;同时3层搜索深度下地铁站点的分类结果也更加具有可解释性,有助于理解交通与土地利用的关系,可进一步用于轨道交通规划和新站点客流预测。此研究虽然仅探讨了搜索深度,但是结果说明,地理知识图谱的嵌入表达需要选择合理的超参数,而不是直接套用其他知识图谱的结论,才能更加准确地对地理及人地关系知识图谱进行表达和推理,发挥知识图谱的潜力。
[1]
张雪英, 张春菊, 吴明光, 等. 顾及时空特征的地理知识图谱构建方法[J]. 中国科学:信息科学, 2020, 50(7):1019-1032.

[ Zhang X Y, Zhang C J, Wu M G, et al. Spatiotemporal features based geographical knowledge graph construction[J]. Scientia Sinica (Informationis), 2020, 50(7):1019-1032. ] DOI:10.1360/SSI-2019-0269

DOI

[2]
诸云强, 孙凯, 胡修棉, 等. 大规模地球科学知识图谱构建与共享应用框架研究与实践[J]. 地球信息科学学报, 2022.

[ Zhu Y Q, Sun K, Hu X M, et al. Research and practice on the framework for the construction, sharing, and application of large-scale geoscience knowledge graphs[J]. Journal of Geo-information Science, 2022. ] DOI:10.12082/dqxxkx.2022.210696

DOI

[3]
刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3):582-600.

[ Liu Q, Li Y, Duan H, et al. Knowledge graph construction techniques[J]. Journal of Computer Research and Development, 2016, 53(3):582-600. ] DOI:10.7544/issn1000-1239.2016.20148228

DOI

[4]
艾瑞咨询产业数字化研究部人工智能研究组. 一图胜万言,一目了然中国知识图谱行业研究报告[C]// 艾瑞咨询系列研究报告, 2022(8):323-400.

[ Artificial Intelligence Research Group, Industry Digitalization Research Department, iResearch Consulting. A picture is worth a thousand words, a glance at Chinese knowledge graph industry research report[C]// iResearch Consulting Research Report Series, 2022(8):323-400. ] DOI:10.26914/c.cnkihy.2022.035148

DOI

[5]
王益鹏, 张雪英, 党玉龙, 等. 顾及时空过程的台风灾害事件知识图谱表示方法[J]. 地球信息科学学报, 2022.

[ Wang Y P, Zhang X Y, Dang Y L, et al. Knowledge graph representation of typhoon disaster events considering spatial and temporal processes[J]. Journal of Geo-information Science, 2022. ] https://kns.cnki.net/kcms/detail/11.5809.p.20221103.1137.006.html. DOI:10.12082/dqxxkx.2022.210800

DOI

[6]
王志华, 杨晓梅, 周成虎. 面向遥感大数据的地学知识图谱构想[J]. 地球信息科学学报, 2021, 23(1):16-28.

DOI

[ Wang Z H, Yang X M, Zhou C H. Geographic knowledge graph for remote sensing big data[J]. Journal of Geo-information Science, 2021, 23(1):16-28. ] DOI:10.12082/dqxxkx.2021.200632

DOI

[7]
杨玉基, 许斌, 胡家威, 等. 一种准确而高效的领域知识图谱构建方法[J]. 软件学报, 2018, 29(10):2931-2947.

[ Yang Y J, Xu B, Hu J W, et al. Accurate and efficient method for constructing domain knowledge graph[J]. Journal of Software, 2018, 29(10):2931-2947. ] DOI:10.13328/j.cnki.jos.005552

DOI

[8]
蒋秉川, 万刚, 许剑, 等. 多源异构数据的大规模地理知识图谱构建[J]. 测绘学报, 2018, 47(8):1051-1061.

[ Jiang B C, Wan G, Xu J, et al. Geographic knowledge graph building extracted from multi-sourced heterogeneous data[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(8):1051-1061. ] DOI:10.11947/j.AGCS.2018.20180113

DOI

[9]
陆锋, 余丽, 仇培元. 论地理知识图谱[J]. 地球信息科学学报, 2017, 19(6):723-734.

DOI

[ Lu F, Yu L, Qiu P Y. On geographic knowledge graph[J]. Journal of Geo-information Science, 2017, 19(6):723-734. ] DOI:10.3724/SP.J.1047.2017.00723

DOI

[10]
高嘉良, 仇培元, 余丽, 等. 基于旅游知识图谱的可解释景点推荐[J]. 中国科学:信息科学, 2020, 50(7):1055-1068.

[ Gao J L, Qiu P Y, Yu L, et al. An interpretable attraction recommendation method based on knowledge graph[J]. Scientia Sinica (Informationis), 2020, 50(7):1055-1068. ] DOI:10.1360/SSI-2019-0268

DOI

[11]
Bordes A, Usunier N, Garcia-Durán A, et al. Translating embeddings for modeling multi-relational data[C]// Proceedings of the 26th International Conference on Neural Information Processing Systems - Volume 2. New York:ACM, 2013:2787-2795. DOI:10.5555/2999792.2999923

DOI

[12]
刘俊楠, 刘海砚, 陈晓慧, 等. 面向多源地理空间数据的知识图谱构建[J]. 地球信息科学学报, 2020, 22(7):1476-1486.

DOI

[ Liu J N, Liu H Y, Chen X H, et al. The construction of knowledge graph towards multi-source geospatial data[J]. Journal of Geo-information Science, 2020, 22(7):1476-1486. ] DOI:10.12082/dqxxkx.2020.190565

DOI

[13]
Zhang X Y, Huang Y, Zhang C J, et al. Geoscience Knowledge Graph (GeoKG): Development, construction and challenges[J]. Transactions in GIS, 2022, 26(6):2480-2494. DOI:10.1111/tgis.12985

DOI

[14]
Liu Y, Ding J, Li Y. Knowledge-driven site selection via urban knowledge graph[EB/OL]. 2021: arXiv: 2111.00787. https://arxiv.org/abs/2111.00787

[15]
Yin D, Jiang R H, Deng J W, et al. MTMGNN: Multi-time multi-graph neural network for metro passenger flow prediction[J]. GeoInformatica, 2023, 27(1):77-105. DOI:10.1007/s10707-022-00466-1

DOI

[16]
Liu C, Gao C, Jin D, et al. Improving location recommendation with urban knowledge graph[EB/OL]. 2021: arXiv: 2111.01013. https://arxiv.org/abs/2111.01013

[17]
Wang H D, Yu Q H, Liu Y, et al. Spatio-temporal urban knowledge graph enabled mobility prediction[J]. Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 2021, 5(4):1-24. DOI:10.1145/3494993

DOI

[18]
Kochsiek A, Niesel F, Gemulla R. Start small, think big: On hyperparameter optimization for large-scale knowledge graph embeddings[EB/OL]. 2022: arXiv: 2207.04979. https://arxiv.org/abs/2207.04979

[19]
Chen Y, Wu L, Zaki M J. Natural question generation with reinforcement learning based graph-to-sequence model[EB/OL]. 2019: arXiv: 1910.08832. https://arxiv.org/abs/1910.08832

[20]
Fei Z C, Zhang Q, Zhou Y Q. Iterative GNN-based decoder for question generation[C]// Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA, USA: Association for Computational Linguistics, 2021:2573-2582. DOI:10.18653/v1/2021.emnlp-main.201

DOI

[21]
方滨兴, 贾焰, 韩毅. 社交网络分析核心科学问题、研究现状及未来展望[J]. 中国科学院院刊, 2015, 30(2):187-199.

[ Fang B X, Jia Y, Han Y. Social networking analysis, core scientific issues, current research and future perspectives[J]. Bulletin of Chinese Academy of Sciences, 2015, 30(2):187-199. ] DOI:10.16418/j.issn.1000-3045.2015.02.007

DOI

[22]
吕鹏辉, 张士靖. 学科知识网络研究(Ⅰ)引文网络的结构、特征与演化[J]. 情报学报, 2014, 33(4):340-348.

[ Lv P H, Zhang S J. Scientific knowledge networks in LIS (I): Case study on the structure, characteristics and evolution of citation networks[J]. Journal of the China Society for Scientific and Technical Information, 2014, 33(4):340-348. ] DOI:10.3772/j.issn.10000135.2014.04.001

DOI

[23]
Abu-El-Haija S, Kapoor A, Perozzi B, et al. N-GCN: Multi-scale graph convolution for semi-supervised node classification[EB/OL]. 2018: arXiv: 1802.08888. https://arxiv.org/abs/1802.08888

[24]
Hamilton W L, Ying R, Leskovec J. Inductive representation learning on large graphs[C]// Proceedings of the 31st International Conference on Neural Information Processing Systems. New York: ACM, 2017:1025-1035. DOI: 10.5555/3294771.3294869

DOI

[25]
Kapoor A, Ben X, Liu L, et al. Examining COVID-19 forecasting using spatio-temporal graph neural networks[EB/OL]. 2020: arXiv: 2007.03113. https://arxiv.org/abs/2007.03113

[26]
Sun Z Q, Wang C M, Hu W, et al. Knowledge graph alignment network with gated multi-hop neighborhood aggregation[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(1):222-229. DOI:10.1609/aaai.v34i01.5354

DOI

[27]
Gu W W, Tandon A, Ahn Y Y, et al. Principled approach to the selection of the embedding dimension of networks[J]. Nature Communications, 2021, 12:3772. DOI:10.1038/s41467-021-23795-5

DOI PMID

[28]
Teru K K, Denis E G, Hamilton W L. Inductive relation prediction by subgraph reasoning[C]// Proceedings of the 37th International Conference on Machine Learning, 2020:9448-9457. DOI:10.5555/3524938.3525814

DOI

[29]
Ying R, He R N, Chen K F, et al. Graph convolutional neural networks for web-scale recommender systems[C]// Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM, 2018:974-983. DOI:10.1145/3219819.3219890

DOI

[30]
侯秀芳, 冯晨, 左超, 等. 2022年中国内地城市轨道交通线路概况[J]. 都市快轨交通, 2023, 36(1):9-13.

[ Hou X F, Feng C, Zuo C, et al. Statistical analysis of urban rail transit in Chinese mainland in 2022[J]. Urban Rapid Rail Transit, 2023, 36(1):9-13. ] DOI:10.3969/j.issn.1672-6073.2023.01.002

DOI

[31]
Kamruzzaman M, Deilami K, Yigitcanlar T. Investigating the urban heat island effect of transit oriented development in Brisbane[J]. Journal of Transport Geography, 2018, 66:116-124. DOI:10.1016/j.jtrangeo.2017.11.016

DOI

[32]
Higgins C D, Kanaroglou P S. A latent class method for classifying and evaluating the performance of station area transit-oriented development in the Toronto region[J]. Journal of Transport Geography, 2016, 52:61-72. DOI: 10.1016/j.jtrangeo.2016.02.012

DOI

[33]
Xiao L Z, Lo S, Zhou J P, et al. Predicting vibrancy of metro station areas considering spatial relationships through graph convolutional neural networks: The case of Shenzhen, China[J]. Environment and Planning B: Urban Analytics and City Science, 2021, 48(8):2363-2384. DOI: 10.1177/2399808320977866

DOI

[34]
Atkinson-Palombo C, Kuby M J. The geography of advance transit-oriented development in metropolitan Phoenix, Arizona, 2000-2007[J]. Journal of Transport Geography, 2011, 19(2):189-199. DOI:10.1016/j.jtrangeo.2010.03.014

DOI

[35]
方勇. 手机信令数据在轨道站点客流与土地利用关联性研究中的应用——以工作日早高峰进站客流为例[D]. 深圳: 深圳大学, 2017.

[ Fang Y. The applications of cell phone signaling data in the research of the correlation between metro station passenger flow and land use: A case of passenger flow during the weekday morning rush[D]. Shenzhen: Shenzhen University, 2017. ]

[36]
谷岩岩, 焦利民, 董婷, 等. 基于多源数据的城市功能区识别及相互作用分析[J]. 武汉大学学报·信息科学版, 2018, 43(7):1113-1121.

[ Gu Y Y, Jiao L M, Dong T, et al. Spatial distribution and interaction analysis of urban functional areas based on multi-source data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(7):1113-1121. ] DOI:10.13203/j.whugis20160192

DOI

[37]
Rousseeuw P J. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis[J]. Journal of Computational and Applied Mathematics, 1987, 20:53-65. DOI:10.1016/0377-0427(87)90125-7

DOI

[38]
Zhuang D Y, Hao S Y, Lee D H, et al. From compound word to metropolitan station: Semantic similarity analysis using smart card data[J]. Transportation Research Part C: Emerging Technologies, 2020, 114:322-337. DOI:10.1016/j.trc.2020.02.017

DOI

[39]
Kumar P P, Sekhar C R, Parida M. Identification of neighborhood typology for potential transit-oriented development[J]. Transportation Research Part D: Transport and Environment, 2020, 78:102186. DOI:10.1016/j.trd.2019.11.015

DOI

[40]
Jeffrey D, Boulangé C, Giles-Corti B, et al. Using walkability measures to identify train stations with the potential to become transit oriented developments located in walkable neighbourhoods[J]. Journal of Transport Geography, 2019, 76:221-231. DOI:10.1016/j.jtrangeo.2019.03.009

DOI

[41]
An D, Tong X, Liu K, et al. Understanding the impact of built environment on metro ridership using open source in Shanghai[J]. Cities, 2019, 93:177-187. DOI:10.1016/j.cities.2019.05.013

DOI

[42]
Kamruzzaman M, Baker D, Washington S, et al. Advance transit oriented development typology: Case study in Brisbane, Australia[J]. Journal of Transport Geography, 2014, 34:54-70. DOI:10.1016/j.jtrangeo.2013.11.002

DOI

[43]
Yin G M, Huang Z, Bao Y, et al. ConvGCN-RF: A hybrid learning model for commuting flow prediction considering geographical semantics and neighborhood effects[J]. Geoinformatica. 2022:1-21. DOI:10.1007/s10707-022-00467-0

DOI

[44]
Zhu D, Zhang F, Wang S Y, et al. Understanding place characteristics in geographic contexts through graph convolutional neural networks[J]. Annals of the American Association of Geographers, 2020, 110(2):408-420. DOI: 10.1080/24694452.2019.1694403

DOI

Outlines

/