地球信息科学理论与方法

基于地理标记照片的个性化景点推荐方法

  • 叶凡 , 1, 2 ,
  • 孙玉 , 1, 2, * ,
  • 陈崇成 1, 2 ,
  • 于大宇 3
展开
  • 1.福州大学空间数据挖掘与信息共享教育部重点实验室,福州 350108
  • 2.福州大学地理空间信息技术国家地方联合工程研究中心,福州 350108
  • 3.武汉大学遥感信息工程学院,武汉 430079
* 孙 玉(1986— ),男,山东德州人,博士,助理研究员,主要从事空间物理大地测量领域研究工作。 E-mail:

叶 凡(1995— ),女,江西上饶人,硕士,主要从事时空数据挖掘、智能推荐。E-mail:

收稿日期: 2020-10-15

  要求修回日期: 2020-12-25

  网络出版日期: 2021-10-25

基金资助

旗山学者奖励支持计划(XRC-19001)

国家重点研发计划项目(2017YFB0504202)

版权

版权所有,未经授权,不得转载、摘编本刊文章,不得使用本刊的版式设计。

A Personalized Attraction Recommendation Method based on Geotagged Photos

  • YE Fan , 1, 2 ,
  • SUN Yu , 1, 2, * ,
  • CHEN Chongcheng 1, 2 ,
  • YU Dayu 3
Expand
  • 1. Key Lab of Spatial Data Mining and Information Sharing of Ministry of Education, Fuzhou University, Fuzhou 350108, China
  • 2. National Engineering Research Center of Geospatial Information Technology, Fuzhou University, Fuzhou 350108, China
  • 3. School of Remote Sensing Information Engineering, Wuhan University, Wuhan 430079, China
* SUN Yu, E-mail:

Received date: 2020-10-15

  Request revised date: 2020-12-25

  Online published: 2021-10-25

Supported by

Qishan Scholar Award Support Scheme(XRC-19001)

National Key Research and Development Project(2017YFB0504202)

Copyright

Copyright reserved © 2021

摘要

研究如何根据已有的海量旅游信息及数据,为游客个性化推荐旅游景点具有重要意义。本文利用从Flickr网站获取的2013—2018年香港特别行政区范围内的地理标记照片来识别旅游景点,并根据游客游览顺序重建旅游轨迹。在此基础上,针对现有方法尚未考虑游客偏好在旅行过程中会发生动态变化的问题,提出一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation, LDA)和用户长短期偏好的个性化景点推荐方法(A Recommendation Method Based on LDA and User's Long and Short-Term Preference, L-ULSP)。该方法利用LDA主题模型获取景点特征信息,挖掘景点间的相关性,再利用注意力机制和长短期记忆网络分别学习用户的长期偏好和短期偏好,最后结合长短期偏好捕捉用户偏好的动态变化。实验结果表明, L-ULSP方法所推荐的景点在命中率和平均倒数排名2个指标上均优于现有其他方法,证明了本文所提方法可以从景点序列中有效学习游客偏好,并为游客推荐下一个景点。此外,本文通过对比实验,进一步验证了同时考虑用户的长短期偏好能够更好地学习用户的偏好变化。

本文引用格式

叶凡 , 孙玉 , 陈崇成 , 于大宇 . 基于地理标记照片的个性化景点推荐方法[J]. 地球信息科学学报, 2021 , 23(8) : 1391 -1400 . DOI: 10.12082/dqxxkx.2021.200608

Abstract

Personalized recommendation of tourist attractions for visitors is useful based on the vast amount of tourism information and data. In this paper, we use Flickr's geotagged photos from 2013 to 2018 in Hong Kong to identify tourist hot spots and reconstruct the tourism trajectory according to the tourist visiting order. On this basis, we propose a personalized recommendation method based on Latent Dirichlet Allocation (LDA) model and User's Long-term and Short-term Preference (L-ULSP) to address the problem that existing methods do not take into account the dynamic changes in visitor preferences during the travel process. In this method, the LDA model is used to obtain the feature information of attractions, and the correlation between attractions is explored. Then, attention mechanism is used to focus on the important information in the long-term sequence to capture the long-term preference of tourists, and LSTM is used to model the short-term sequence information to learn the short-term preference of tourists. Finally, the long-term and short-term preferences are weighted to obtain the final preferences of tourists to capture the dynamic changes of user preferences. The algorithm has the following advantages: (1) By mining the topic feature information of Geotagged photo text, the description information of attractions is added, which can capture users' travel preference more accurately; (2) The algorithm considers both the long-term and short-term preferences of users, and can learn the dynamic changes of users' preferences in the process of travel while modeling the sequence information of attractions. The experimental results show that: (1) The attractions recommended by the L-ULSP method outperform other existing methods in both Hit Rate and Mean Reciprocal Rank, two common evaluation metrics for recommendation algorithms, proving that the proposed method can effectively learn visitor preferences from a sequence of attractions and recommend the next attraction to visitors. It is demonstrated that the method can achieve good recommendation results in travel recommendation scenarios; (2) The comparison experiments between the model using long-term preference as the user's final preference and the model combining user's long-term and short-term preferences as the final preference further validate that considering both the user's long-term and short-term preferences can better learn the user's preference changes and thus improve the accuracy of recommendations; (3) This paper further compares the calculation efficiency of L-ULSP with different deep learning recommendation models based on RNN, and counts the running time of each model. The results show that this method is better than most methods in efficiency.

1 引言

得益于定位技术的发展,地理位置信息已普遍存在于社交网络服务中。例如,Flickr自2004年创立到2018年1月,数据库已累计存储64.7亿张照片,这些照片通常包含地理位置、拍摄时间及标签文本等信息,可用于重建游客的移动轨迹、分析不同游客的旅行模式[1,2,3]以及推荐游客感兴趣的旅游景点[4,5,6,7]等。目前关于旅游推荐的方法包括通用推荐和个性化推荐[8]2种类型。通用旅行推荐遵循“挖掘历史轨迹→发现热门景点→经典旅行序列→推荐”的范式[9],为用户推荐最受欢迎的景点;个性化推荐则在推荐过程中考虑不同游客的兴趣,为游客提供更加符合其偏好的推荐,显然更能够提升用户体验。个性化景点推荐的2个关键问题是如何捕捉游客的偏好和如何为景点信息进行序列化建模[10]。为此,提出了基于协同过滤(Collaborative Filtering,CF)、基于内容(Content-based,CB)及基于马尔科夫链(Markov Chain,MC)的推荐算法等。其中,基于CF的推荐方法[11,12,13]和基于CB的推荐方法[14,15]需获取游客及景点的属性信息以构造信息矩阵进行计算,经常面临因数据稀疏导致的冷启动问题;而且2种方法均未考虑景点的访问顺序,因此严重降低了推荐效果。基于MC的推荐方法[16,17,18,19]虽然解决了冷启动问题,也考虑了景点序列信息,但该方法存在独立性假设的问题,不能有效地表示历史序列中的复杂交互关系。此外,基于MC的推荐方法大多使用一阶马尔可夫链模型,所预测的用户下一次访问位置仅取决于最近的访问记录,可能会影响推荐效果[10]。此外,对游客访问序列挖掘的推荐方法还包括频繁序列挖掘[20]、狄利克雷分配模型方法[21](Latent Dirichlet Allocation,LDA)等,这些方法主要用于挖掘低级语义,无法准确地对用户旅行偏好进行建模。
近年来,循环神经网络(Recurrent Neural Network,RNN)[22]及其变体(长短期记忆(Long Short-Term Memory,LSTM)[23]和门控循环单元(Gate Recurrent Unit,GRU)在序列建模方面取得突破性进展[24,25,26],例如,Hidasi等[27]使用带门控循环单元的RNN为用户行为序列建模,预测用户的下一次行为。然而RNN网络在输出时依赖于最后一个隐藏层激活向量,限制了从隐藏状态理解和学习用户序列行为的主要偏好的能力[28]。用户的历史序列行为对于预测下一个行为并非都重要,需要关注序列中的重要信息以增强神经网络捕获长期依赖关系的能力。Li等[25]在带有门控循环单元的深度循环神经网络的基础上,利用注意力机制考虑每个项目的重要性,并结合用户的序列行为信息生成最终的特征向量来进行推荐。考虑到用户的兴趣会随着时间发生变化,Liu等[26]提出注意力/记忆优先级模型,从长期序列中学习用户的长期偏好,并将用户的最近一次序列行为作为当前偏好,该模型在推荐时增强了当前偏好的影响。
鉴于以上分析,针对当前的景点推荐方法忽略了景点之间的相关性,及未充分考虑用户偏好的动态变化的问题,本文提出一种基于LDA主题模型和用户长短期偏好的个性化景点推荐方法(A Recommendation Method Based on LDA and User's Long-term and Short-term Preference,L-ULSP)。该方法利用LDA主题模型获取游客旅行的主题分布,挖掘景点特征信息;引入注意力机制考虑不同景点的重要程度,关注历史序列中重要的景点信息捕捉用户长期偏好,利用LSTM为用户序列建模学习用户短期偏好,将长期偏好与短期偏好进行加权得到最终偏好,以预测游客下一次可能访问的景点。L-ULSP不存在独立假设性问题并减少了数据的稀疏性带来的影响,为景点序列信息建模的同时,动态捕捉游客长短期偏好,实现高效推荐旅游景点。

2 数据来源与研究方法

本文提出的基于地理标记照片的个性化景点推荐方法包括数据准备和处理、个性化景点推荐2个部分,该方法的框架如图1所示。
图1 基于地理标记照片的个性化景点推荐方法框架

Fig. 1 The framework of personalized scenic spot recommendation method based on geotagged photos

2.1 数据准备和处理

2.1.1 地理标记照片处理
本文将典型的旅游城市——香港特别行政区作为研究区域,通过Flickr API(http://www.flickr.com/services/api/)获取2013年1月至2018年12月香港特别行政区范围内具有地理标记信息的照片及属性信息(用户名、照片ID、拍摄时间、经纬度以及文本标签),共得到9524位用户的315 598条记录(照片及其属性信息)。但这些记录不能直接使用,必须进行清洗:① 删除地理位置位于香港特别行政区之外的记录;② 结合照片的用户名、经纬度以及拍摄时间对重复数据仅保留一条; ③ 利用基于熵的方法[29]区分游客与当地居民,滤除非游客数据;④ 由于存在拍照设备定位错误的情况,删除用户名和拍摄时间相同但经纬度不同的数据。
2.1.2 旅游热点区域识别
重建游客旅游轨迹,首先需要识别城市的旅游热点区域。热点区域的判断通常有2种:① 根据照片密度;② 根据游客密度。在国内外相关的研究中,常用的密度聚类算法(如DBSCAN算法、Meanshift算法)使用照片密度为阈值识别热点区域,而P-DBSCAN算法[30]则以游客数量为阈值,反映游客访问较多的热点区域。假设 D 为地理标记照片集,照片 p 的坐标为( x p , y p )。照片 p q 的距离用 Dist ( p , q ) 表示,照片 p 邻域范围内的照片集用 N θ ( p ) 表示:
N θ p = ( q D , Owner ( q ) Owner ( p ) | Dist ( p , q ) δ )
式中: δ 表示邻域半径; Owner ( p ) 表示照片 p 的所有者(上传照片 p 的游客)。若照片 p q 所属游客不同,且距离不大于 θ ,则称照片 q 是照片 p 的邻域照片。邻域照片集 N θ ( p ) 的所属游客总数量定义为 NumOwner ( p ) ,游客数量的阈值用 λ 表示,如果照片 p 的邻域照片所属游客总数量 NumOwner ( p ) 不小于 λ ,则称照片 p 为核心照片, N θ ( p ) 为热点区域内的照片集。

2.2 个性化景点推荐模型

2.2.1 模型及相关定义
本文个性化景点推荐模型的结构如图2所示,符号定义如表1所示,其基本思想是通过联合学习长期和短期偏好,计算每个景点游客下一次访问景点的概率并生成推荐列表。地理标记照片的文本标签是用户上传照片对景点的描述,可应用主题模型来发现隐含的主题信息,这些主题代表了景点的特征和用户的偏好。本文利用概率主题建模技术LDA挖掘景点的主题特征,挖掘景点之间的相关性。L-ULSP模型将每个游客的景点序列及景点对应的主题特征信息作为初始输入,通过注意力机制关注长期序列中的重要信息,捕捉游客的长期偏好,利用LSTM为短期序列进行序列化信息建模,学习游客的短期偏好。最后,将长短期偏好进行加权得到游客的最终偏好,计算并输出每个景点在下一次访问的概率。
图2 L-ULSP模型结构

Fig. 2 The structure of L-ULSP model

表1 符号定义

Tab. 1 Symbol definition

符号 定义
U = { u 1 , u 2 , , u N }
V = { v 1 , v 2 , , v M }
T = { t 1 , t 2 , , t K }
V u = { v 1 u , v 2 u , , v m u }

L u = { v 1 u , v 2 u , , v l u }
S u = { v l - j + 1 u , v l - j + 2 u , , v l u }
游客集合,其中N为游客数量
景点集合,其中M为景点数量
景点的主题特征集合,其中K是主题数量
游客 u 的景点序列,其中每个 v i u 包含景点和主题特征 ( a i , t i )
游客 u 的长期序列
游客 u 的短期序列, j 是短期序列的长度
2.2.2 长期偏好学习方法
对于每个游客的景点序列,在嵌入层(Embedding Layer)进行编码,将游客 u 和景点序列信息(景点及其主题特征)分别转换为 D u D v D t 维稠密向量。每个景点的向量计算式如下:
h i = ϕ ( W a e i v + W b e i t + c )
式中: W a , W b 是权重矩阵; c 表示偏置向量; e i v 是景点 v i 的向量表示; e i t 是主题 t i 的向量表示; ϕ 是ReLU激活函数。
通过引入注意力机制,增强神经网络捕获长期依赖关系的能力,学习不同景点对不同游客的重要程度,加权得到游客的长期偏好,其计算公式如下:
o i = exp ( u T h i ) exp ( u T h i )
u l = o i [ e i v , e i t ]
式中: o i 表示第 i 个景点的权重; u T 表示用户 u 的潜在向量; u l 表示游客 u 的长期偏好,最后将 u l 输入全连接层计算每个景点下一次访问的概率 P l
2.2.3 短期偏好学习方法
除了游客的长期偏好外,短期偏好对于预测下一个景点同样重要。鉴于LSTM在序列学习中的优良特性,本文利用LSTM模型学习游客的短期偏好。将短期序列经嵌入层转化的低维稠密向量输入到LSTM层中,学习历史景点序列中的依赖性,预测并计算每个景点下一次访问的概率 P s
2.2.4 输出层
注意力层和LSTM层已完成游客长期偏好和短期偏好的学习,在输出层,将长期偏好和短期偏好学习的结果按权重累加,计算每个景点最终的输出概率:
P i = α P l + β P s
y i = e P i j = 1 M e P i
式中: α β 分别是控制长期偏好和短期偏好的权重; M 表示景点的数量; y i 表示每个景点下一次被访问的概率。
2.2.5 评价方法
由于推荐系统通常以列表的形式进行推荐,正确推荐项在推荐列表中且位置越靠前,说明推荐效果越好。因此,评价指标使用推荐系统中常用的命中率(Hitrate,HR)和平均倒数排名(Mean Reciprocal Rank,MRR)来评估推荐结果的表现。本文基于香港特别行政区Flickr数据集评估L-ULSP的推荐性能,选取以下7种推荐方法进行对比。
(1)POP:根据训练集中项目出现频率从高到低进行推荐。
(2)SKNN[31]:通过计算待预测项与用户访问序列之间的相似性,计算每个项目的推荐分数进行推荐。
(3)FPMC[16]:通过将矩阵分解和MC相结合,为每个用户生成单独的转移概率矩阵,生成转移矩阵立方体。并引入贝叶斯个性排名优化模型参数,提高推荐准确度。
(4)FOSSIL[17]:将基于相似度的方法与MC融合,通过对成对的用户-项目和项目-项目交互进行建模,可同时适应长期和短期动态变化。
(5)GRU4Rec[27]:将会话进行拼接,并利用小批量并行计算,提高训练效率。根据项目热门程度进行采样,采用基于排名的损失函数。
(6)NARM[25]:利用注意力机制捕捉用户的主要意图,并结合用户的序列行为信息生成最终的特征向量表示来进行推荐。
(7)STAMP[26]:提出短期注意/记忆优先模型,通过提高短期偏好的重要性来缓解偏好漂移对推荐模型的影响。
L-ULSP的超参数通过网格寻优法来确定,具体参数范围设置为:学习率 LearningRate { 0.001,0.005,0.01,0.05,0.1 ,用户向量表示维度 D u { 30,50,100,200,500 } ,景点向量表示维度 D v { 30,50,100,200,500 } ,主题特征向量表示维度 D t { 30,50,100,200,500 } 。实验采用留一法评估来评估下一个景点推荐效果,将所有用户景点序列的最后一个景点用作测试数据,将其余的景点用作训练数据。取HR@10最优时的参数组合( LearningRate = 0.001 , D u = 200 , D a = 50 , D t = 200 )作为实验参数。训练批量设置为32,采用Adam函数优化损失函数,其他参数使用截断的标准高斯分布生成。

3 结果与分析

3.1 实验数据来源

获取的原始数据集在每一步处理后的游客数和记录数如表2所示,经过数据清洗后最终得到8165位游客的137 671条记录。
表2 各数据处理步骤后的游客数量和记录数量

Tab. 2 Number of tourists and records after each data processing procedure

数据处理步骤 游客数/位 记录数/个
滤除非香港行政区划数据后
滤除重复数据后
滤除非游客数据后
滤除定位错误数据后
8898
8898
8165
8165
280 361275 252142 261137 671
由于香港中心城区(包括油尖旺区、湾仔区及中西区)明显比其他城区照片分布密集(图3),考虑到中心城区和非中心城区热点区域的规模存在明显不同,因此需要分别进行聚类分析,在使用P-DBSCAN算法时分别设置合适的阈值。图4图5分别为中心城区与非中心城区在不同半径与用户数量下的聚类数量。如图4(a)所示,当游客数量上升到 10时,形成簇的速率明显下降,并趋于平稳。图4(b)游客数量为10的曲线中,当半径的值在30 m左右时,聚类形成的簇数达到最大值。因此,确定中心城区的游客数量和半径的最佳阈值分别为10人和30 m。同理,确定非中心城区的游客数量和半径的最佳阈值分别为10人和100 m。由最佳阈值获得的聚类结果如图6所示,识别出的旅游热点区域与地图上实际景点的位置几乎对应。最终,中心城区聚类得到144个热点区域,非中心城区聚类得到124个热点区域,共计268个热点区域。
图3 2013—2018年香港特别行政区地理标记照片空间分布

Fig. 3 Spatial distribution of geotagged photos in HongKong from 2013 to 2018

图4 中心城区不同参数下形成的簇数

Fig. 4 The number of clusters detected with different value of parameters in central area

图5 非中心城区不同参数下形成的簇数

Fig. 5 The number of clusters detected with different value of parameters in non-central area

图6 P-DBSCAN算法聚类得到的香港特别行政区景点

注:图中不同颜色的圆点代表不同类别景点。

Fig. 6 HongKong SAR Attractions in China by P-DBSCAN

热点区域包括地标性景点和受欢迎的兴趣点,在下文中统称为景点。根据游客所游览的景点及其拍摄时间,可生成每位游客所对应的景点序列。将仅游览一个景点的轨迹数据视为无效数据,同一游客的景点序列之间的时间间隔过长看作2次旅行数据,因此滤除景点序列长度为1的数据,分割访问景点的间隔时间超过7 d的数据。最终的景点序列数据集包括2164位游客和11 843条有效旅游记录,平均游览序列长度为5.47。

3.2 景点推荐结果对比与分析

3.2.1 算法对比
本文使用香港特别行政区Flickr数据集在Tensorflow平台上对L-ULSP和对比方法的模型进行训练,POP和SKNN根据其原理建立模型,其他对比方法均使用原论文的公开代码。实验结果如表3所示,通过分析可以得到以下结论:
表3 不同算法的推荐结果对比

Tab. 3 Comparison of recommendation results of different algorithms

方法 HR@10 MRR@10
POP
SKNN
FPMC
FOSSIL
GRU4Rec
NARM
STAMP
L-ULSP
20.6930.7935.4441.5441.3844.8342.6746.63 7.739.5911.8218.2720.6721.2722.6724.64
(1)本文提出的L-ULSP模型在 HR@10和MRR@10指标上均优于对比方法,证明了所提方法的有效性。在所有模型中,POP和SKNN这2种传统方法性能最差,说明只考虑景点受欢迎程度或用户与景点的相似性不适合用作序列推荐。FPMC和FOSSIL利用马尔科夫链为用户景点序列建模,在一定程度上提高了推荐的准确度,其中FOSSIL考虑了用户长短期偏好的变化,推荐效果更好。
(2)基于RNN的深度学习模型的推荐性能整体表现最好,体现了RNN在处理序列问题时的优势。通过进一步对比,NARM和STAMP的性能优于GRU4Rec,说明结合用户长短期偏好可能会提高推荐效果。但NARM仅使用景点序列表示用户向量,忽略了景点的相关性,STAMP模型在考虑短期偏好时只考虑了用户最近一次的序列行为,会影响推荐效果。实验结果显示,L-ULSP与NARM相比,HR@10和MRR@10分别提高了1.8%,3.37%,与STAMP模型相比,HR@10和MRR@10分别提高了3.96%,1.97%。
3.2.2 不同主题数量对实验结果的影响
图7可以看出,主题模型中主题数量K会影响L-ULSP模型的性能。随着K的增大,HR@10和MRR@10逐渐增大,推荐性能逐渐提升。当主题数量达到20时,推荐效果最佳,随后HR@10和MRR@10有微小波动,但波动幅度不大,总体呈平稳趋势。
图7 不同主题数量下的推荐结果

Fig. 7 Recommendation results of different number of topics

3.2.3 不同推荐列表长度对实验的影响
实验结果如图8所示,POP随着推荐列表长度增大无明显变化,结合旅游场景的特点这是合理的,最受欢迎的景点几乎是游客必去的。SKNN的推荐效果优于POP,说明部分景点之间存在相似性。在基于MC的模型中,FOSSIL在推荐过程结合用户长短期偏好,其性能优于FPMC。在基于RNN的模型中,GRU4Rec的表现最差,原因在于该模型为用户序列建模时只考虑了用户的当前兴趣。随着推荐列表长度的增加,NARM、STAMP 及L-ULSP的评价指标值都在逐渐提升,但L-ULSP始终优于其他对比方法。
图8 不同推荐列表长度下的推荐结果

Fig. 8 Recommendation results of different recommendation list

3.2.4 不同偏好表示对实验的影响
通过设计一组对比试验,进一步验证结合长期偏好与短期偏好能否提高推荐的准确度。L-ULP表示将长期偏好作为用户最终偏好的模型,L-ULSP是结合用户长短期偏好作为用户最终偏好的模型。实验结果如表4所示,L-ULSP的各个指标均优于L-ULP,由此可见,与仅考虑长期偏好相比,同时考虑用户的长短期偏好可以提高推荐效果。
表4 用户长短期偏好的影响

Tab. 4 The impact of long and short-term preferences

Model HR@5 MRR@5 HR@10 MRR@10 HR@20 MRR@20
L-ULP
L-ULSP
33.1735.81 19.2723.23 44.7146.63 20.8724.64 53.6156.73 21.4925.33
3.2.5 不同模型的推荐算法效率对比
除了推荐的准确率,模型的计算效率也是衡量性能的重要指标,因此,本文进一步将L-ULSP与不同的基于RNN的深度学习推荐模型在计算效率上进行比较,统计各个模型的运行时间,如表5所示。比较各模型的运行时间可以发现,本文提出的L-ULSP计算成本低于GRU4Rec和NARM,略高于STAMP。综合推荐的准确度与推荐质量,L-ULSP的整体性能最好。
表5 不同模型的运行时间对比

Tab. 5 Running time comparison of different models

Model Runtime/s
GRU4Rec
NARM
STAMP
L-ULSP
91.55
239.05
68.67
76.24

4 结论与讨论

4.1 结论

本文基于2013年1月至2018年12月香港特别行政区范围内的地理标记照片数据集重建游客旅游轨迹,并在此基础上提出了一种新颖的个性化景点推荐方法。该方法使用LDA主题模型提取景点的特征信息,利用文本信息挖掘景点之间的相关性。利用注意力机制捕获长期偏好,LSTM为用户短期序列建模,结合长短期偏好为游客推荐下一个景点。在更好地捕捉用户偏好的同时,减少了数据稀疏性带来的影响。实验结果表明,本文所提方法的推荐准确度和推荐质量优于其他方法。主要结论如下:
(1)近年来,基于位置的社交网络用户量不断增长,为提供旅游景点推荐服务创造了可行性条件。
(2)本文利用地理标记照片识别旅游热点区域,根据位置与时间信息重建游客的旅游轨迹。通过挖掘地理标记照片的文本的主题特征信息,增加了描述景点的信息,更精确的捕捉用户的旅行偏好。
(3)针对游客偏好在旅行过程中会发生变化的问题,本文提出的L-ULSP综合考虑了用户的长期偏好和短期偏好,为景点序列信息建模的同时,学习用户偏好的动态变化。结果表明,L-ULSP的推荐效果优于现有方法,证明了该方法在旅游推荐场景中可以取得较好的推荐效果。
(4)本文进行了将长期偏好作为用户最终偏好的模型和结合用户长短期偏好作为用户最终偏好的模型的对比实验,前者比后者在HR@10和MRR@10分别提高1.92%、2.77%,进一步验证了同时考虑用户的长短期偏好能够更好地学习用户的偏好变化,从而提高推荐的准确性。

4.2 讨论

随着旅游业的快速发展和网络信息的不断丰富,使得个性化景点推荐问题成为近期研究工作的一个热点问题。近年来,基于深度学习的推荐方法在学术界引起广泛关注。与传统的景点推荐方法相比,本文的重点在于下一个景点推荐,通过综合利用景点的主题特征信息和用户的序列信息来挖掘用户的旅游行为偏好。本文所提的方法可应用于不同的旅游城市或区域,为用户提供个性化景点推荐服务。在未来的工作中,可以考虑加入更多的游客信息和上下文信息对旅游轨迹进行更精细的建模,以进一步提高推荐效果。

本文对比方法的代码来源于原论文作者公开的代码,在此表示感谢。

[1]
Vu H Q, Li G, Law R, et al. Exploring the travel behaviors of inbound tourists to Hong Kong using geotagged photos[J]. Tourism Management, 2015, 46:222-232.

DOI

[2]
Becker M, Singer P, Lemmerich F, et al. Photowalking the city: Comparing hypotheses about urban photo trails on Flickr[J]. International Conference on Social Informatics, 2015, 9:227-244.

[3]
Chua A, Servillo, Marcheggiani E, et al. Mapping Cilento: Using geotagged social media data to characterize tourist flows in southern Italy[J]. Tourism Management, 2016, 57:295-310.

DOI

[4]
Majid A, Chen L, Chen G C, et al. A context-aware personalized travel recommendation system based on geotagged social media data mining[J]. International Journal of Geographical Information Science, 2013, 27(4):662-684.

DOI

[5]
Jiang S, Qian X, Mei T, et al. Personalized travel sequence recommendation on multi-source big social media[J]. IEEE Transactions on Big Data, 2016, 2(1):43-56.

DOI

[6]
Xu Z, Chen L, Guo H, et al. User similarity-based gender-aware travel location recommendation by mining geotagged photos[J]. International Journal of Embedded Systems, 2018, 10(5):356-365.

DOI

[7]
Lyu D D, Chen L, Xu Z X, et al. Weighted multi-information constrained matrix factorization for personalized travel location recommendation based on geo-tagged photos[J]. Applied Intelligence, 2020, 50(3):924-938.

DOI

[8]
Zeng Y, Zhou X. Computing with spatial trajectories[M]. New York: Springer Science & Business Media, 2011.

[9]
Zheng Y, Zhang L, Xie X, et al. Mining Interesting Locations and Travel Sequences from GPS Trajectories[C]. Proceeding of the 18th International Conference on World Wide Web, Madrid, Spain , 2009.

[10]
Liu C, Liu J, Xu S, et al. A spatiotemporal dilated convolutional generative network for point-of-interest recommendation[J]. ISPRS International Journal of Geo-Information, 2020, 9(2):113.

DOI

[11]
Jiang K, Yin H, Wang P, et al. Learning from contextual information of geo-tagged web photos to rank personalized tourism attractions[J]. Neurocomputing, 2013, 119:17-25.

DOI

[12]
Xu Z, Chen L, Chen G. Topic based context-aware travel recommendation method exploiting geotagged photos[J]. Neurocomputing, 2015, 155:99-107.

DOI

[13]
Zhang C Y, Wang K. POI recommendation through cross-region collaborative filtering[J]. Knowledge and Information Systems, 2016, 46(2):369-387.

DOI

[14]
Santiago F M, López F A, Montejo-Ráez A, et al. GeOasis: A knowledge-based geo-referenced tourist assistant[J]. Expert Systems with Applications, 2012, 39(14):11737-11745.

DOI

[15]
Binucci C, De Lu F, DI Giacomo E, et al. Designing the content analyzer of a travel recommender system[J]. Expert Systems with Applications, 2017, 87:199-208.

DOI

[16]
Rendle S, Freudenthaler C, Schmidt-thieme L. Factorizing personalized markov chains for next-basket recommendation[C]. Proceedings of the 19th International Conference on World Wide Web, Raleigh, NC, USA , 2010.

[17]
He R N McAuley J. Fusing similarity models with Markov chains for sparse sequential recommendation[EB/OL]. 2016: arXiv: 1609.09152[cs.IR]. https://arxiv.org/abs/1609.09152.

[18]
Liu S, Wang L. A self-adaptive point-of-interest recommendation algorithm based on a multi-order markov model[J]. Future Generation Computer Systems, 2018, 89:506-514.

DOI

[19]
李昇智, 乔建忠, 林树宽. 一种基于用户移动行为相似性的位置预测方法[J]. 计算机科学, 2018, 45(12):288-292,307.

[Li S Z, Qiao J Z, Lin S K. Location prediction method based on sinmmilarity of users moving behavior[J]. Computer Science, 2018, 45(12):28-292,307. ]

[20]
Monreale A, Pinelli F, Trasarti R, et al. Wherenext: A location predictor on trajectory pattern mining[C]. Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Paris, France , 2009.

[21]
Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of machine Learning research, 2003, 3(1):993-1022.

[22]
Williams R J, Zipser D. A learning algorithm for continually running fully recurrent neural networks[J]. Neural Computation, 1989, 1(2):270-280.

DOI

[23]
Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8):1735-1780.

PMID

[24]
Zhu Y, Li H, Liao Y, et al. What to do next: Modeling user behaviors by time-LSTM[C]. Proceeding of the 26 International Joint Conference on Artificial Intelligence, Melbourne, Australia: IJCAI, 2017.

[25]
Li J, Ren P, Chen Z, et al. Neural attentive session-based recommendation[C]. Proceeding of the 2017 ACM on Conference on Information and Knowledge Management, Singapore, 2017.

[26]
Liu Q, Zeng Y, Mokhosi R, et al. STAMP: Short-Term attention/memory priority model for session-based recommendation[C]. Proceeding of the 24th ACM SIGKDD International Conference oSn Knowledge Discovery & Data Mining, London, UK , 2018.

[27]
Hidasi B, Karatzoglou A, Baltrunas L, et al. Session-based recommendations with recurrent neural networks[C]. In Proceedings of the International Conference on Learning Representations, San Juan, Puerto Rico, 2016.

[28]
Quadrana M, Cremonesi P, Jannach D. Sequence-aware recommender systems[J]. ACM Computing Surveys (CSUR), 2018, 51(4):1-36.

[29]
Sun Y R, Fan H C, Bakillah M, et al. Road-based travel recommendation using geo-tagged images[J]. Computers, Environment and Urban Systems, 2015, 53:110-122.

DOI

[30]
Kisilevich S, Mansmann F, Keim D. P-DBSCAN: A density based clustering algorithm for exploration and analysis of attractive areas using collections of geo-tagged photos[C]. Proceeding of the 1st International Conference and Exhibition on Computing for Geospatial Research & Application, Washington, USA, 2010.

[31]
Bonnin G, Jannach D. Automated generation of music playlists: Survey and experiments[J]. ACM Computing Surveys (CSUR), 2014, 47(2):1-35.

文章导航

/