基于主题多样性的旅游景点动态推荐算法及装置

文档序号:1889412 发布日期:2021-11-26 浏览:3次 >En<

阅读说明:本技术 基于主题多样性的旅游景点动态推荐算法及装置 (Scenic spot dynamic recommendation algorithm and device based on theme diversity ) 是由 黄超 曹畅 李漪阳 黄洁 苏宇 于 2020-10-29 设计创作,主要内容包括:本发明属于旅游信息服务技术领域,具体涉及基于主题多样性的旅游景点动态推荐方法及装置。本发明公开了基于主题多样性的旅游景点动态推荐方法,包括以下步骤,S101:收集游客基础信息及扩展信息,S102:收集景点的基础信息,S103:度量游客自身偏好变化,S104:度量考虑社交关系及潮流趋势导致的游客偏好变化,S105:游客预测评分计算,S106:正式推荐景点生成,S107:评估游客预测评分的综合性能;本发明能够面向游客实现考虑多样性的动态个性化旅游景点推荐,进而提升旅游景点的推荐效果;本方法在进行景点推荐时具有最高的精度,因而具有优良的性能。(The invention belongs to the technical field of tourist information services, and particularly relates to a method and a device for dynamically recommending tourist attractions based on theme diversity. The invention discloses a scenic spot dynamic recommendation method based on subject diversity, which comprises the following steps of S101: collecting basic information and extended information of the tourists, S102: collecting basic information of the scenic spots, S103: measuring the change of the preference of the tourist, S104: the measurement considers the social relationship and the change of the guest preference caused by trend, S105: calculating the predicted score of the tourist, S106: generating a formal recommended sight, S107: evaluating the comprehensive performance of the tourist prediction scores; according to the invention, the dynamic personalized tourist attraction recommendation considering diversity can be realized for tourists, so that the recommendation effect of the tourist attraction is improved; the method has the highest precision when the scenic spot recommendation is carried out, so that the method has excellent performance.)

基于主题多样性的旅游景点动态推荐算法及装置

技术领域

本发明属于旅游信息服务技术领域,具体涉及基于主题多样性的旅游景点动态推荐方法及装置。

背景技术

目前针对旅游景点的个性化推荐技术得到了比较广泛的应用,这些方法的基本思路是通过分析游客的兴趣偏好和旅游景点的特征,向游客推荐其可能感兴趣的旅游景点,比如游客曾经去过的景点、与游客曾经去过的景点相似的景点等。在此基础上,有些技术进行了改进,例如进一步考虑游客所处的地理位置、旅游的季节情景等信息,从而提高推荐精度。

现有个性化旅游景点推荐技术在考虑游客偏好变化方面存在明显不足。首先,现有方法主要基于游客基本特征、历史出行信息、所处情境以及社交等方面数据,着重刻画游客的静态偏好。事实上,许多研究表明游客偏好呈现出典型的时变性特征,这种偏好的动态变化性对旅游行程规划和景点推荐具有明显影响。其次,选定候选景点集是开展旅游景点个性化推荐的基础,现有研究在候选景点选择方面主要是最大化满足游客偏好,而对候选景点的多样性和新颖性缺乏考虑。已有研究表明,缺乏多样性和新颖性的推荐结果长期来看将对企业盈利带来负面影响。最后,由于个性化旅游景点推荐领域普遍存在严重的数据稀疏性问题,这使得传统的滑动时间窗、改变实例权重等动态推荐方法难以获得准确的推荐结果的应用,需要探索新的方法进行动态个性化景点推荐。

发明内容

针对上述问题本发明的目的是提出一种新的基于主题多样性的动态个性化旅游景点推荐算法,包括:基于潜在狄利克雷分布(LDA)模型和矩阵分解技术,针对游客评分、评论文本和景点描述文档等数据,建立游客对于不同景点主题的基础偏好模型;基于矩阵分解技术 (MF)从游客主题偏好、景点季节流行度、游客距离、游客偏见、游客社交关系及景点潮流变化等六个方面构建具有高度可解释性的游客偏好漂移预测模型;考虑提出动态游客评分预测算法,提出既考虑游客偏好又保证推荐结果多样性的推荐算法;基于推荐结果的排序向游客推荐满足其偏好的景点列表。

为实现上述技术目的,本发明采用的技术方案如下:

基于主题多样性的旅游景点动态推荐方法,包括以下步骤,

S101:收集游客基础信息及扩展信息,从旅游门户网站和社交网站收集游客的基础信息和扩展信息;

S102:收集景点的基础信息,从旅游门户网站和景点官方网站收集景点的基础信息;

S103:度量游客自身偏好变化,运用LDA模型得到游客在不同时刻对各个主题的偏好,通过两个时刻的偏好差值来量化游客的偏好变化;

S104:度量考虑社交关系及潮流趋势导致的游客偏好变化,游客的社交关系对其偏好具有明显影响,并且随着时间推移,景点的整体潮流趋势也会发生变化,进而影响游客的偏好,通过这个两个方面计算某一时间段游客的偏好变化;

S105:游客预测评分计算,基于所述S103和S104中游客偏好变化分析相对应旅游景点的游客预测评分;

S106:正式推荐景点生成,基于所述S105计算得到的预测评分,按照预测评分的高低生成正式推荐景点集,并以可视化的形式推荐给目标游客;

S107:评估游客预测评分的综合性能,将推荐给游客的景点集的预测评分与游客的真实评分进行对比,若对比数据差异大,说明游客u的偏好发生了变化;基于游客当前偏好和在某一时刻的真实评分,可以使用随机梯度下降算法对游客的偏好进行动态更新,并将更新后的游客动态预测评分生成推荐景点集,并以可视化的形式重新推荐给目标游客。

作为本发明的一种优选方案,所述S103中,

游客u在t1时刻到tn时刻的主题偏好变化量记为其计算如公式①所示,

可以准确度量游客在各个主题上偏好程度的改变;

除了主题偏好之外,游客u在t1时刻到tn时刻的季节流行度偏好、距离偏好和游客偏见会发生变化,并影响游客对景点的偏好程度,对季节流行度偏好变化记为距离偏好变化记为和游客偏见变化记为其各自的计算如公式②③④所示:

来表示游客u在t1时刻的整体偏好,其计算如公式⑤所示:

假设用K个维度来描述游客的主题偏好,游客u在t1时刻的偏好则有K+3个维度,游客u在t1时刻到tn时刻的整体偏好变化量如公式⑥所示:

所述S104中,

从相似邻居v偏好漂移的角度预测的游客u在时刻到tn时刻的偏好漂移,其计算公式如⑦所示:

公式⑦中,sim(u,v)表示相似性度量函数,T表示时刻到tn时刻的时间段,表示时刻到tn时刻之间有评分的游客集合,Neighbour(u)表示时刻到tn时刻之间游客 u的邻居集合;

随着时间推移,景点的整体潮流趋势也会发生变化,进而影响游客的偏好,在预测在时刻到tn时刻的整体潮流漂移的时候,采用所有游客的偏好变化来预测整体潮流漂移,如公式⑧所示:

公式⑧中的表示游客集合中的游客数量;

所述S105中,游客预测评分计算,基于所述S103和S104中游客偏好变化的分析,提出游客预测评分计算公式⑨,

公式⑨中,E为景点-主题矩阵,μ为用户平均评分,bu和bi分别表示游客偏见和景点偏见,分别表示示景点i在时刻的季节流行度和远近程度。

作为本发明的一种优选方案,所述S107中,推荐给目标游客景点集的时间与游客反馈真实评分的时间较短,景点的主题特征分布、景点偏见和平均评分不会在发生明显变化,针对某一景点j的预测评分与实际评分差异大,说明游客u的偏好发生了变化;基于游客当前偏好和在时刻的真实评分,可以使用随机梯度下降算法对游客u的偏好进行动态更新,其计算游客的动态预测评分,其计算公式如下,

公式⑩中,η表示随机梯度下降中的学习率,λ1表示随机梯度下降中的正则化率;

作为本发明的一种优选方案,所述公式⑩中η=0.01和λ1=0.002。

作为本发明的一种优选方案,所述S101中,基础信息包括但不限于年龄、性别、收入、家庭构成、学历、工作性质、好友关系、点赞关系、关注关系;扩展信息包括但不限于游客曾经访问的景点信息、时间信息、入住酒店信息、游客对景点的评论及评分。

作为本发明的一种优选方案,所述S102中,从旅游门户网站和景点官方网站收集景点的基础信息包括但不限于景点基本介绍、门票价格、开放时间、游客接待量。

一种基于主题多样性的旅游景点动态推荐方法的装置,包括数据数据抓取模块、候选景点生成模块、性能评估模块;

所述数据抓取模块,用于旅游景点动态推荐方法在互联网上抓取和收集游客基本信息、历史旅游记录、景点描述信息;

所述候选景点生成模块保护,用于根据游客动态偏好及景点特征生成候选的推荐景点列表;

所述推荐景点生成模块,用于在候选景点列表中进一步考虑景点的流行度、热度等指标,生成考虑多样性的正式推荐景点集;

所述结果推送模块,用于旅游景点动态推荐方法生成的推荐结果以可视化的形式推荐给目标游客;性能评估模块,

所述性能评估模块,用于旅游景点动态推荐方法推荐结果的精度、响应率、召回率等指标进行全面分析,评估算法的综合性能。

一种计算机设备,该计算机设备包括显示设备、输入设备、内/外存储器、中央处理器及可运行的计算机程序,所述内/外存储器上存储有执行上述基于主题多样性的旅游景点动态推荐算法的计算机程序,所述中央处理器执行该计算机程序时实现上述个性化旅游景点推荐算法的方法。

本发明的有益效果:

1、本发明能够面向游客实现考虑多样性的动态个性化旅游景点推荐,进而提升旅游景点的推荐效果;

2、本方法在进行景点推荐时具有最高的精度,因而具有优良的性能。

附图说明

本发明可以通过附图给出的非限定性实施例进一步说明;

图1本方法与基准方法的MAE对比图

具体实施方式

为了使本领域的技术人员可以更好地理解本发明,下面结合附图和实施例对本发明技术方案进一步说明。

基于主题多样性的旅游景点动态推荐方法,包括

S101:收集游客基础信息及扩展信息,从旅游门户网站和社交网站收集游客的基础信息和扩展信息;基础信息包括但不限于年龄、性别、收入、家庭构成、学历、工作性质、好友关系、点赞关系、关注关系;扩展信息包括但不限于游客曾经访问的景点信息、时间信息、入住酒店信息、游客对景点的评论及评分。

S102:收集景点的基础信息,从旅游门户网站和景点官方网站收集景点的基础信息;从旅游门户网站和景点官方网站收集景点的基础信息包括但不限于景点基本介绍、门票价格、开放时间、游客接待量。

S103:度量游客自身偏好变化,借助LDA模型得到游客在不同时刻对各个主题的偏好,通过两个时刻的偏好差值来量化游客的偏好变化;

游客u在t1时刻到tn时刻的主题偏好变化量记为其计算如公式①所示,

可以准确度量游客在各个主题上偏好程度的改变;

除了主题偏好之外,游客u在t1时刻到tn时刻的季节流行度偏好、距离偏好和游客偏见会发生变化,并影响游客对景点的偏好程度,对季节流行度偏好变化记为距离偏好变化记为和游客偏见变化记为其各自的计算如公式②③④所示:

来表示游客u在t1时刻的整体偏好,其计算如公式⑤所示:

假设用K个维度来描述游客的主题偏好,游客u在t1时刻的偏好则有K+3个维度,游客u在t1时刻到tn时刻的整体偏好变化量如公式⑥所示:

S104,度量考虑社交关系及潮流趋势导致的游客偏好变化,

游客的社交关系对其偏好具有明显影响,从相似邻居v偏好漂移的角度预测的游客u在时刻到tn时刻的偏好漂移,其计算公式如⑦所示:

公式⑦中,sim(u,v)表示相似性度量函数,T表示时刻到tn时刻的时间段,表示时刻到tn时刻之间有评分的游客集合,Neighbour(u)表示时刻到tn时刻之间游客 u的邻居集合;

随着时间推移,景点的整体潮流趋势也会发生变化,进而影响游客的偏好,在预测在时刻到tn时刻的整体潮流漂移的时候,采用所有游客的偏好变化来预测整体潮流漂移,如公式⑧所示:

公式⑧中的表示游客集合中的游客数量;

S105,游客预测评分计算,基于S103和S104中游客偏好变化的分析,提出游客动态评分预测公式⑨,

公式⑨中,E为景点-主题矩阵,μ为用户平均评分,bu和bi分别表示游客偏见和景点偏见,分别表示示景点i在时刻的季节流行度和远近程度;

S106:正式推荐景点生成,基于所述S105计算得到的预测评分,按照预测评分的高低生成正式推荐景点集,并以可视化的形式推荐给目标游客;

S107:评估游客预测评分的综合性能,将推荐给游客的景点集的预测评分与游客的真实评分进行对比,若对比数据差异大,说明游客u的偏好发生了变化;基于游客当前偏好和在某一时刻的真实评分,可以使用随机梯度下降算法对游客的偏好进行动态更新,并将更新后的游客动态预测评分生成推荐景点集,并以可视化的形式重新推荐给目标游客;

推荐给目标游客景点集的时间与游客反馈真实评分的时间较短,景点的主题特征分布、景点偏见和平均评分不会在发生明显变化,针对某一景点j的预测评分与实际评分差异大,说明游客u的偏好发生了变化;基于游客当前偏好和在时刻的真实评分,可以使用机梯度下降算法对游客u的偏好进行动态更新,参数更新如公式⑩所示,

公式⑩中,η表示随机梯度下降中的学习率,λ1表示随机梯度下降中的正则化率;

其中η=0.01和λ1=0.002。

为验证基于主题多样性的旅游景点动态推荐方法的技术效果,从携程以及各旅游景点门户网站获取了自2013年至2019年以来23万名游客对542个景点的112万条评分数据,将本方法标记为DARM,与三种典型的个性化景点推荐方法进行性能对比,所使用的三种基准方法如表1 所示。

表1基准对比方法及简介

采用平均绝对误差(MAE)指标,其计算公式如下,

上述公式中的|testset|是测试数据集中的所有游客评分数量,表示游客u对景点i的预测评分,rui是游客u对景点i的真实评分,MAE度量了推荐模型的预评分和真实评分之间的差值,其值越低说明两者越接近,这表明模型的预测越准确。

通过平均绝对误差的计算公式,分别对MF、SVD、SlopeOne和DARM模型的预测评分进行计算验证,其各个年份的数据结果如图1所示,通过图1,可以显然得出本方法的MAE最小,这表明本方法在进行景点推荐时具有最高的精度,因而具有优良的性能。

本实施例提供一种基于主题多样性的旅游景点动态推荐方法的装置,包括数据数据抓取模块、候选景点生成模块、性能评估模块;

所述数据抓取模块,用于旅游景点动态推荐方法在互联网上抓取和收集游客基本信息、历史旅游记录、景点描述信息;

所述候选景点生成模块保护,用于根据游客动态偏好及景点特征生成候选的推荐景点列表;

所述推荐景点生成模块,用于在候选景点列表中进一步考虑景点的流行度、热度等指标,生成考虑多样性的正式推荐景点集;

所述结果推送模块,用于旅游景点动态推荐方法生成的推荐结果以可视化的形式推荐给目标游客;性能评估模块,

所述性能评估模块,用于旅游景点动态推荐方法推荐结果的精度、响应率、召回率等指标进行全面分析,评估算法的综合性能。

本实施例提供一种计算机设备,该计算机设备包括显示设备、输入设备、内/外存储器、中央处理器及可运行的计算机程序,所述内/外存储器上存储有执行上述基于主题多样性的旅游景点动态推荐算法的计算机程序,所述中央处理器执行该计算机程序时实现上述个性化旅游景点推荐算法的方法。

上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:营销转化用户的预测方法、装置及计算机设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!