个性化项目推荐方法、装置、电子设备及存储介质

文档序号:1889420 发布日期:2021-11-26 浏览:3次 >En<

阅读说明:本技术 个性化项目推荐方法、装置、电子设备及存储介质 (Personalized item recommendation method and device, electronic equipment and storage medium ) 是由 陈程 王贺 石奕 于 2021-08-26 设计创作,主要内容包括:本发明涉及人工智能领域,提供一种个性化项目推荐方法、装置、电子设备及存储介质,所述方法包括:获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵;将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵;对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵;对所述项目属性矩阵进行模糊聚类,得到聚类结果;根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息。本申请可以提高项目推荐的准确率。(The invention relates to the field of artificial intelligence, and provides a personalized project recommendation method, a personalized project recommendation device, electronic equipment and a storage medium, wherein the method comprises the following steps: acquiring user data corresponding to a target user and a plurality of associated users, and constructing a project scoring matrix and a project display factor matrix based on the user data; inputting the project scoring matrix and the project explicit factor matrix into a trained implicit semantic model to obtain a project implicit factor matrix; splicing the project explicit factor matrix and the project implicit factor matrix to obtain a project attribute matrix; carrying out fuzzy clustering on the project attribute matrix to obtain a clustering result; and determining the score similarity between the target user and each associated user according to the clustering result, and generating the item recommendation information corresponding to the target user based on the score similarity. The method and the device can improve the accuracy of project recommendation.)

个性化项目推荐方法、装置、电子设备及存储介质

技术领域

本发明涉及人工智能领域,具体涉及一种个性化项目推荐方法、装置、电子设备及存储介质。

背景技术

随着互联网的发展,各类网站和应用等信息平台的便捷性使得用户能够随时随地发布以及和获取项目,如电影项目、游戏项目、音乐项目、短视频项目等,这也导致了网站和应用等信息平台呈现出项目过载的状态。海量的项目对各类信息平台来说确实是一笔宝贵的财富,但同时项目过载也增加了信息平台对用户进行个性化项目推荐的难度,用户在使用信息平台的时候被形形色色的项目淹没,很可能就错过了真正感兴趣的项目。

因此,如何针对信息平台的每个用户去个性化的推荐符合用户兴趣的项目,如何提高项目推荐的准确率是值得研究的问题。

发明内容

鉴于以上内容,有必要提出一种个性化项目推荐方法、装置、电子设备及存储介质,能够提高项目推荐的准确率。

本发明的第一方面提供一种个性化项目推荐方法,所述方法包括:

获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵;

将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵;

对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵;

对所述项目属性矩阵进行模糊聚类,得到聚类结果;

根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息。

上述技术方案,通过获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵;接着将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵,项目隐因子矩阵包括目标用户和多个关联用户对应的隐藏喜好;接着再对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵,使得拼接得到的项目属性矩阵包含更多的用户信息,从而提高推荐的准确率;然后对所述项目属性矩阵进行模糊聚类,得到聚类结果;最后根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息,可以个性化地向目标用户推荐符合用户兴趣的项目,提高了项目推荐的准确率。

根据本发明的一个可选的实施方式,所述对所述项目属性矩阵进行模糊聚类,得到聚类结果包括:

根据所述用户数据,确定初始聚类中心;

基于所述初始聚类中心,对所述项目属性矩阵进行模糊聚类,得到聚类结果。

上述技术方案,通过用户数据确定初始聚类中心,提高了确定初始聚类中心的准确率,避免了初始聚类中心选择不恰当导致进行模糊聚类时陷入局部极值点,无法得到全局的最优解的情况发生。同时,避免了因项目属性矩阵中数据稀疏,随机选择初始化聚类中心后,迭代次数增加,时间复杂度提高,推荐效率降低的情况发生。

根据本发明的一个可选的实施方式,所述根据所述用户数据,确定初始聚类中心包括:

确定所述用户数据对应的数据维度;

根据所述数据维度对所述用户数据进行等距离划分处理,得到多个网格对象;

计算每个网格对象对应的网格密度,并基于所述网格密度,在所述多个网格对象中确定目标网格对象;

基于广度优先遍历算法计算与所述目标网格对象关联的关联网格对象,根据所述目标网格对象和所述关联网格对象,得到聚类簇;

将所述聚类簇的中心确定为初始聚类中心。

上述技术方案,通过网络聚类和广度优先遍历算法可以有效提高确定初始聚类中心的准确率,同时也可以提高确定初始聚类中心的效率。

根据本发明的一个可选的实施方式,所述基于所述评分相似度生成所述目标用户对应的项目推荐信息包括:

根据所述评分相似度的大小,在所述多个关联用户中确定多个目标关联用户;

确定每个目标关联用户对应的项目,并计算每个目标关联用户与其对应的项目的兴趣程度;

基于所述兴趣程度,在所述项目中确定待推荐项目,并根据所述待推荐项目生成与所述目标用户对应的项目推荐信息。

上述技术方案,通过评分相似度的大小,在所述多个关联用户中确定相似度高的关联用户为目标关联用户,并基于目标关联用户兴趣程度高的项目,生成项目推荐信息,可以提高项目推荐的效率。

根据本发明的一个可选的实施方式,每个目标关联用户包括多个项目,所述计算每个目标关联用户与其对应的项目的兴趣程度包括:

计算每个目标关联用户与每个项目之间的欧式距离;

根据所述欧式距离,确定所述目标关联用户与所述项目的兴趣程度。

上述技术方案,通过目标关联用户与项目的欧式距离,确定目标关联用户与项目的兴趣程度,提高了确定兴趣程度的效率。

根据本发明的一个可选的实施方式,所述根据聚类结果,确定所述目标用户与每个关联用户的评分相似度包括:

根据聚类结果,使用余弦相似度算法确定所述目标用户与每个关联用户的评分相似度。

上述技术方案,使用余弦相似度算法提高了计算评分相似度的准确率。

根据本发明的一个可选的实施方式,所述方法还包括:

基于目标用户的用户标识,获取所述目标用户对应的多个维度信息;

对多个所述维度信息进行分析,确定所述维度信息相互之间的关联关系;

基于所述关联关系,构建所述目标用户对应的目标用户画像;

根据所述目标用户画像,确定多个关联用户。

上述技术方案,通过多个维度信息相互之间的关联关系,使得构建的目标用户图像保留更多的用户信息,从而提高确定关联用户的准确率。

本发明的第二方面提供一种个性化项目推荐装置,所述装置包括:

构建模块,用于获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵;

处理模块,用于将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵;

拼接模块,用于对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵;

聚类模块,用于对所述项目属性矩阵进行模糊聚类,得到聚类结果;

推荐模块,用于根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息。

本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述个性化项目推荐方法。

本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述个性化项目推荐方法。

另外,第二方面、第三方面和第四方面所带来的技术效果可参见上述方法部分各设计的方法相关的描述,此处不再赘述。

附图说明

图1是本发明实施例一提供的个性化项目推荐方法的流程图。

图2是本发明实施例二提供的个性化项目推荐装置的结构图。

图3是本发明实施例三提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。

本发明实施例提供一种个性化项目推荐方法、装置、电子设备及计算机可读存储介质。其中,该个性化项目推荐方法可应用于终端设备或服务器中,该终端设备可以手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备,该服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。以下以该个性化项目推荐方法应用于服务器为例进行解释说明。

下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。

请参阅图1,图1是本发明实施例提供的一种个性化项目推荐方法的示意流程图。

如图1所示,所述个性化项目推荐方法具体包括步骤S11至S15,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。

S11,获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵。

目标用户为待进行项目推荐的用户。关联用户为所述目标用户相关联的用户,其中关联可以包括喜好关联、平台关联、身份关联。例如,若有一用户与目标用户的喜好相关联,确定该用户为目标用户;若有一用户与目标用户为同事、亲戚或同学,确定该用户为目标用户;若有一用户与目标用户处于同一社交平台,确定该用户为目标用户。

用户数据可以包括用户观影数据、用户阅读数据、用户娱乐数据。用户数据包括多个项目,以及对所述多个项目的评分。项目评分矩阵包括项目和评分之间的映射关系,项目显因子矩阵包括项目和显因子之间的映射关系。显因子用于表示用户的明显喜好特征,显因子为直接影响用户对信息进行评价的因子。假设一些特征属于某一类型,而用户喜欢这一类型或者物品包含这一类型,由于特征是显式的,所以这些特征可以被称为显因子。例如,电影包括恐怖、喜剧、恋爱、搞笑、动作等特征,这些特征是显式的,所以被称为显因子。

在一个可选的实施方式中,所述方法还包括:

基于目标用户的用户标识,获取所述目标用户对应的多个维度信息;

对多个所述维度信息进行分析,确定所述维度信息相互之间的关联关系;

基于所述关联关系,构建所述目标用户对应的目标用户画像;

根据所述目标用户画像,确定多个关联用户。

用户标识可以包括身份标识、号码标识、平台标识等,例如,可以基于用户的姓名,获取目标用户对应的数据信息,得到多个维度信息;可以基于用户的手机号码,获取目标用户对应的数据信息,得到多个维度信息;也可以基于用户的平台标识,获取该用户在社交平台上的数据信息,得到多个维度信息。维度信息用于提现目标用户的喜好,可以包括观影维度、阅读维度、游戏维度、运动维度等。

计算每个维度信息相互之间的关联关系,并基于关联关系,构建所述目标用户对应的目标用户画像。可以根据关联关系的强弱,构建目标用户图像。例如,可以将关联关系强的几个维度信息构建目标用户对应的目标用户图像。

通过多个维度信息相互之间的关联关系,使得构建的目标用户图像保留更多的用户信息,从而提高确定关联用户的准确率。

S12,将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵。

隐语义模型又可称为隐因子模型(latent factor model,LFM)用于找出输入材料中的潜在的主题或分类,可以确定隐因子。隐因子为潜在影响用户对信息进行评价的因子。示例性的,认为每个用户都有自己偏好信息,同时每个信息也包含所有用户的偏好信息,那么用户对信息的高评分体现的是信息中所包含的偏好信息恰好是用户的偏好信息,但这个偏好信息无法明确的确定出来,因此,可将该偏好信息确定为潜在影响用户对信息进行评价的因子,即隐因子。

所述项目隐因子矩阵包括项目和隐因子之间的映射关系。

S13,对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵。

对所述项目显因子矩阵和所述项目隐因子矩阵进行矩阵拼接,得到项目属性矩阵,项目属性矩阵中包括项目和和显因子之间的映射关系与项目和隐因子之间的映射关系。

S14,对所述项目属性矩阵进行模糊聚类,得到聚类结果。

可以基于模糊c-均值聚类算法(fuzzy c-means,FCM)对所述项目属性矩阵进行模糊聚类处理,优化目标函数得到项目属性矩阵中的每个因子对所有类中心的隶属度,对项目属性矩阵中的因子进行自动分类,得到聚类结果。

在一个可选的实施方式中,所述对所述项目属性矩阵进行模糊聚类,得到聚类结果包括:

根据所述用户数据,确定初始聚类中心;

基于所述初始聚类中心,对所述项目属性矩阵进行模糊聚类,得到聚类结果。

可以确定用户数据对应的数据类型,基于所述数据类型确定初始聚类中心。

通过用户数据确定初始聚类中心,提高了确定初始聚类中心的准确率,避免了初始聚类中心选择不恰当导致进行模糊聚类时陷入局部极值点,无法得到全局的最优解的情况发生。同时,避免了因项目属性矩阵中数据稀疏,随机选择初始化聚类中心后,迭代次数增加,时间复杂度提高,推荐效率降低的情况发生。

在一个可选的实施方式中,所述根据所述用户数据,确定初始聚类中心包括:

确定所述用户数据对应的数据维度;

根据所述数据维度对所述用户数据进行等距离划分处理,得到多个网格对象;

计算每个网格对象对应的网格密度,并基于所述网格密度,在所述多个网格对象中确定目标网格对象;

基于广度优先遍历算法计算与所述目标网格对象关联的关联网格对象,根据所述目标网格对象和所述关联网格对象,得到聚类簇;

将所述聚类簇的中心确定为初始聚类中心。

可以基于用户数据对应的数据类型确定用户对应的数据维度。例如用户数据类型可以包括电影及其对应的评分、游戏及其对应的评分、图像及其对应的评分。同一数据类型为同一维度。数据类型的数量与数据维度相匹配,每个数据类型对应一数据维度。

示例性的,若用户数据中存在多个数据维度,所述根据所述数据维度对所述用户数据进行等距离划分处理,得到多个网格对象包括:根据所述多个数据维度生成多个网格单元,其中,每个数据维度有且仅有一个对应的网格单元;根据每个数据维度对应的数据特征,对所述数据维度对应的网格单元进行等距离划分处理,并将所述数据维度对应的用户数据填充至等距离划分处理后的网格单元中,得到多个网格对象。网格对象可以是包括用户数据的单元格。

不同的数据特征进行等距离划分处理过程中的划分距离也是不同的。例如,用户数据包括三个数据维度,根据三个数据维度对用户数据进行等距离划分处理,可以得到三个网格单元。

网格密度为每个网格对象中用户数据的个数与用户数据的总个数的比重。网格对象边缘的用户数据可以视为网格对象中的用户数据。示例性的,可以将每一个网格单元中网格密度最大的网格对象确定为目标网格对象。

基于广度优先遍历算法遍历目标网格对象周围的网格对象,确定与目标网格对象相关联的关联网格对象。将遍历得到的关联网格对象和目标网格对象作为一个聚类簇,即将遍历得到的所有连通网络确定为一个聚类簇。将所述聚类簇的中心确定为初始聚类中心。

若用户数据中存在多个数据维度,可以得到多个聚类簇,即可得到多个初始聚类中心。

通过网络聚类和广度优先遍历算法可以有效提高确定初始聚类中心的准确率,同时也可以提高确定初始聚类中心的效率。

S15,根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息。

示例性的,根据聚类结果,使用余弦相似度算法确定所述目标用户与每个关联用户的评分相似度。使用余弦相似度算法提高了计算评分相似度的准确率。

在一个可选的实施方式中,所述基于所述评分相似度生成所述目标用户对应的项目推荐信息包括:

根据所述评分相似度的大小,在所述多个关联用户中确定多个目标关联用户;

确定每个目标关联用户对应的项目,并计算每个目标关联用户与其对应的项目的兴趣程度;

基于所述兴趣程度,在所述项目中确定待推荐项目,并根据所述待推荐项目生成与所述目标用户对应的项目推荐信息。

示例性的,根据所述评分相似度的大小对所述多个关联用户进行排序,并按照排序结果在所述多个关联用户中确定多个目标关联用户。例如,按照排序结果确定前Z个关联用户为目标关联用户。

根据用户数据确定每个目标关联用户对应的项目。示例性的,根据兴趣程度的高低在目标关联用户对应的项目中确定待推荐项目。例如,将目标关联用户对应的项目中用户兴趣程度高的项目确定为待推荐项目。

通过评分相似度的大小,在所述多个关联用户中确定相似度高的关联用户为目标关联用户,并基于目标关联用户兴趣程度高的项目,生成项目推荐信息,可以提高项目推荐的效率。

在一个可选的实施方式中,每个目标关联用户包括多个项目,所述计算每个目标关联用户与其对应的项目的兴趣程度包括:

计算每个目标关联用户与每个项目之间的欧式距离;

根据所述欧式距离,确定所述目标关联用户与所述项目的兴趣程度。

欧式距离越小,确定目标关联用户与项目的兴趣程度越高;欧式距离越大,确定目标关联用户与项目的兴趣程度越低。

通过目标关联用户与项目的欧式距离,确定目标关联用户与项目的兴趣程度,提高了确定兴趣程度的效率。

上述实施例提供的个性化项目推荐方法,通过获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵;接着将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵,项目隐因子矩阵包括目标用户和多个关联用户对应的隐藏喜好;接着再对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵,使得拼接得到的项目属性矩阵包含更多的用户信息,从而提高推荐的准确率;然后对所述项目属性矩阵进行模糊聚类,得到聚类结果;最后根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息,可以个性化地向目标用户推荐符合用户兴趣的项目,提高了项目推荐的准确率。

请参阅图2,图2是本发明的实施例提供的一种个性化项目推荐装置的示意性框图。

在一些实施例中,个性化项目推荐装置20可以包括多个由计算机程序段所组成的功能模块个性化项目推荐装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)个性化项目推荐的功能,该个性化项目推荐装置可以配置于服务器或终端中。

其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。

本实施例中,个性化项目推荐装置20根据其所执行的功能,可以被划分为多个功能模块。如图2所示,所述功能模块可以包括:构建模块201、处理模块202、拼接模块203、聚类模块204和推荐模块205。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。

构建模块201,用于获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵。

目标用户为待进行项目推荐的用户。关联用户为所述目标用户相关联的用户,其中关联可以包括喜好关联、平台关联、身份关联。例如,若有一用户与目标用户的喜好相关联,确定该用户为目标用户;若有一用户与目标用户为同事、亲戚或同学,确定该用户为目标用户;若有一用户与目标用户处于同一社交平台,确定该用户为目标用户。

用户数据可以包括用户观影数据、用户阅读数据、用户娱乐数据。用户数据包括多个项目,以及对所述多个项目的评分。项目评分矩阵包括项目和评分之间的映射关系,项目显因子矩阵包括项目和显因子之间的映射关系。显因子用于表示用户的明显喜好特征,显因子为直接影响用户对信息进行评价的因子。假设一些特征属于某一类型,而用户喜欢这一类型或者物品包含这一类型,由于特征是显式的,所以这些特征可以被称为显因子。例如,电影包括恐怖、喜剧、恋爱、搞笑、动作等特征,这些特征是显式的,所以被称为显因子。

在一个可选的实施方式中,构建模块201还用于:

基于目标用户的用户标识,获取所述目标用户对应的多个维度信息;

对多个所述维度信息进行分析,确定所述维度信息相互之间的关联关系;

基于所述关联关系,构建所述目标用户对应的目标用户画像;

根据所述目标用户画像,确定多个关联用户。

用户标识可以包括身份标识、号码标识、平台标识等,例如,可以基于用户的姓名,获取目标用户对应的数据信息,得到多个维度信息;可以基于用户的手机号码,获取目标用户对应的数据信息,得到多个维度信息;也可以基于用户的平台标识,获取该用户在社交平台上的数据信息,得到多个维度信息。维度信息用于提现目标用户的喜好,可以包括观影维度、阅读维度、游戏维度、运动维度等。

计算每个维度信息相互之间的关联关系,并基于关联关系,构建所述目标用户对应的目标用户画像。可以根据关联关系的强弱,构建目标用户图像。例如,可以将关联关系强的几个维度信息构建目标用户对应的目标用户图像。

通过多个维度信息相互之间的关联关系,使得构建的目标用户图像保留更多的用户信息,从而提高确定关联用户的准确率。

处理模块202,用于将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵。

隐语义模型又可称为隐因子模型(latent factor model,LFM)用于找出输入材料中的潜在的主题或分类,可以确定隐因子。隐因子为潜在影响用户对信息进行评价的因子。示例性的,认为每个用户都有自己偏好信息,同时每个信息也包含所有用户的偏好信息,那么用户对信息的高评分体现的是信息中所包含的偏好信息恰好是用户的偏好信息,但这个偏好信息无法明确的确定出来,因此,可将该偏好信息确定为潜在影响用户对信息进行评价的因子,即隐因子。

所述项目隐因子矩阵包括项目和隐因子之间的映射关系。

拼接模块203,用于对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵。

对所述项目显因子矩阵和所述项目隐因子矩阵进行矩阵拼接,得到项目属性矩阵,项目属性矩阵中包括项目和和显因子之间的映射关系与项目和隐因子之间的映射关系。

聚类模块204,用于对所述项目属性矩阵进行模糊聚类,得到聚类结果。

可以基于模糊c-均值聚类算法(fuzzy c-means,FCM)对所述项目属性矩阵进行模糊聚类处理,优化目标函数得到项目属性矩阵中的每个因子对所有类中心的隶属度,对项目属性矩阵中的因子进行自动分类,得到聚类结果。

在一个可选的实施方式中,聚类模块204对所述项目属性矩阵进行模糊聚类,得到聚类结果包括:

根据所述用户数据,确定初始聚类中心;

基于所述初始聚类中心,对所述项目属性矩阵进行模糊聚类,得到聚类结果。

可以确定用户数据对应的数据类型,基于所述数据类型确定初始聚类中心。

通过用户数据确定初始聚类中心,提高了确定初始聚类中心的准确率,避免了初始聚类中心选择不恰当导致进行模糊聚类时陷入局部极值点,无法得到全局的最优解的情况发生。同时,避免了因项目属性矩阵中数据稀疏,随机选择初始化聚类中心后,迭代次数增加,时间复杂度提高,推荐效率降低的情况发生。

在一个可选的实施方式中,聚类模块204根据所述用户数据,确定初始聚类中心包括:

确定所述用户数据对应的数据维度;

根据所述数据维度对所述用户数据进行等距离划分处理,得到多个网格对象;

计算每个网格对象对应的网格密度,并基于所述网格密度,在所述多个网格对象中确定目标网格对象;

基于广度优先遍历算法计算与所述目标网格对象关联的关联网格对象,根据所述目标网格对象和所述关联网格对象,得到聚类簇;

将所述聚类簇的中心确定为初始聚类中心。

可以基于用户数据对应的数据类型确定用户对应的数据维度。例如用户数据类型可以包括电影及其对应的评分、游戏及其对应的评分、图像及其对应的评分。同一数据类型为同一维度。数据类型的数量与数据维度相匹配,每个数据类型对应一数据维度。

示例性的,若用户数据中存在多个数据维度,所述根据所述数据维度对所述用户数据进行等距离划分处理,得到多个网格对象包括:根据所述多个数据维度生成多个网格单元,其中,每个数据维度有且仅有一个对应的网格单元;根据每个数据维度对应的数据特征,对所述数据维度对应的网格单元进行等距离划分处理,并将所述数据维度对应的用户数据填充至等距离划分处理后的网格单元中,得到多个网格对象。网格对象可以是包括用户数据的单元格。

不同的数据特征进行等距离划分处理过程中的划分距离也是不同的。例如,用户数据包括三个数据维度,根据三个数据维度对用户数据进行等距离划分处理,可以得到三个网格单元。

网格密度为每个网格对象中用户数据的个数与用户数据的总个数的比重。网格对象边缘的用户数据可以视为网格对象中的用户数据。示例性的,可以将每一个网格单元中网格密度最大的网格对象确定为目标网格对象。

基于广度优先遍历算法遍历目标网格对象周围的网格对象,确定与目标网格对象相关联的关联网格对象。将遍历得到的关联网格对象和目标网格对象作为一个聚类簇,即将遍历得到的所有连通网络确定为一个聚类簇。将所述聚类簇的中心确定为初始聚类中心。

若用户数据中存在多个数据维度,可以得到多个聚类簇,即可得到多个初始聚类中心。

通过网络聚类和广度优先遍历算法可以有效提高确定初始聚类中心的准确率,同时也可以提高确定初始聚类中心的效率。

推荐模块205,用于根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息。

示例性的,根据聚类结果,使用余弦相似度算法确定所述目标用户与每个关联用户的评分相似度。使用余弦相似度算法提高了计算评分相似度的准确率。

在一个可选的实施方式中,推荐模块205基于所述评分相似度生成所述目标用户对应的项目推荐信息包括:

根据所述评分相似度的大小,在所述多个关联用户中确定多个目标关联用户;

确定每个目标关联用户对应的项目,并计算每个目标关联用户与其对应的项目的兴趣程度;

基于所述兴趣程度,在所述项目中确定待推荐项目,并根据所述待推荐项目生成与所述目标用户对应的项目推荐信息。

示例性的,根据所述评分相似度的大小对所述多个关联用户进行排序,并按照排序结果在所述多个关联用户中确定多个目标关联用户。例如,按照排序结果确定前Z个关联用户为目标关联用户。

根据用户数据确定每个目标关联用户对应的项目。示例性的,根据兴趣程度的高低在目标关联用户对应的项目中确定待推荐项目。例如,将目标关联用户对应的项目中用户兴趣程度高的项目确定为待推荐项目。

通过评分相似度的大小,在所述多个关联用户中确定相似度高的关联用户为目标关联用户,并基于目标关联用户兴趣程度高的项目,生成项目推荐信息,可以提高项目推荐的效率。

在一个可选的实施方式中,每个目标关联用户包括多个项目,推荐模块205计算每个目标关联用户与其对应的项目的兴趣程度包括:

计算每个目标关联用户与每个项目之间的欧式距离;

根据所述欧式距离,确定所述目标关联用户与所述项目的兴趣程度。

欧式距离越小,确定目标关联用户与项目的兴趣程度越高;欧式距离越大,确定目标关联用户与项目的兴趣程度越低。

通过目标关联用户与项目的欧式距离,确定目标关联用户与项目的兴趣程度,提高了确定兴趣程度的效率。

上述实施例提供的个性化项目推荐装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的电子设备上运行。该电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。

本领域技术人员应该了解,图3示出的电子设备的结构并不构成本申请实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。

在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。

需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本申请,也应包含在本申请的保护范围以内,并以引用方式包含于此。

在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时,以实现如下步骤:

获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵;

将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵;

对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵;

对所述项目属性矩阵进行模糊聚类,得到聚类结果;

根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息。

所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

在一些实施例中,所述至少一个处理器32是所述电子设备3的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的个性化项目推荐方法的全部或者部分步骤;或者实现个性化项目推荐装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。

在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。

尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。

本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述个性化项目推荐方法实施例中的步骤,或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能。

上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。

前述实施例提供的个性化项目推荐装置、电子设备及计算机可读存储介质,通过获取目标用户和多个关联用户对应的用户数据,并基于所述用户数据构建项目评分矩阵和项目显因子矩阵;接着将所述项目评分矩阵和所述项目显因子矩阵输入训练完成的隐语义模型中,得到项目隐因子矩阵,项目隐因子矩阵包括目标用户和多个关联用户对应的隐藏喜好;接着再对所述项目显因子矩阵和所述项目隐因子矩阵进行拼接,得到项目属性矩阵,使得拼接得到的项目属性矩阵包含更多的用户信息,从而提高推荐的准确率;然后对所述项目属性矩阵进行模糊聚类,得到聚类结果;最后根据聚类结果,确定所述目标用户与每个关联用户的评分相似度,并基于所述评分相似度生成与所述目标用户对应的项目推荐信息,可以个性化地向目标用户推荐符合用户兴趣的项目,提高了项目推荐的准确率。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

17页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种搜索结果展示方法、装置和用于搜索结果展示的装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!