资源推荐模型的训练方法、资源推荐方法、装置及服务器

文档序号:1889424 发布日期:2021-11-26 浏览:3次 >En<

阅读说明:本技术 资源推荐模型的训练方法、资源推荐方法、装置及服务器 (Resource recommendation model training method, resource recommendation device and server ) 是由 廖一桥 于 2021-08-27 设计创作,主要内容包括:本公开关于一种资源推荐模型的训练方法、资源推荐方法、装置及服务器,属于人工智能技术领域。方法包括:从多个资源类别中,确定新增行为特征对应的第一资源类别,新增行为特征是基于新增行为数据确定的;确定第一资源类别对应的第一类别特征,将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征;基于多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,多个资源类别对应的类别特征包括第一资源类别更新后的第一类别特征,基于第一样本特征训练资源推荐模型,资源推荐模型用于向任一用户账号推荐资源。上述方案在提高了训练资源推荐模型的准确率的同时,还降低了存储压力和处理压力。(The disclosure relates to a resource recommendation model training method, a resource recommendation device and a server, and belongs to the technical field of artificial intelligence. The method comprises the following steps: determining a first resource category corresponding to the newly added behavior characteristics from the plurality of resource categories, wherein the newly added behavior characteristics are determined based on the newly added behavior data; determining a first class feature corresponding to the first resource class, and fusing the newly added behavior feature with the first class feature to obtain the updated first class feature of the first resource class; the resource recommendation method includes the steps of determining first sample characteristics of a resource recommendation model based on category characteristics corresponding to multiple resource categories, wherein the category characteristics corresponding to the multiple resource categories comprise the first category characteristics after the first resource categories are updated, training the resource recommendation model based on the first sample characteristics, and the resource recommendation model is used for recommending resources to any user account. According to the scheme, the accuracy of the resource recommendation model is improved, and meanwhile, the storage pressure and the processing pressure are reduced.)

资源推荐模型的训练方法、资源推荐方法、装置及服务器

技术领域

本公开涉及人工智能技术领域,尤其涉及一种资源推荐模型的训练方法、资源推荐方法、装置及服务器。

背景技术

随着互联网的发展,多种资源展示应用应运而生,每个资源展示应用会为用户推荐其感兴趣的资源以提高用户粘度。并且为了提高推荐准确率,通常基于资源推荐模型进行资源推荐,这就需要先训练出准确的资源推荐模型。

行为特征对资源推荐模型的训练具有重要的指导意义,行为特征是根据用户的行为数据生成的,能够表示用户对资源进行的行为,能够体现用户对资源的兴趣。训练资源推荐模型时所用的行为特征越多,资源推荐模型的准确率越高,但是这就需要存储大量的行为特征,并在进行训练时读取大量的行为特征,会造成较大的存储压力和处理压力。因此如何在根据较多的行为特征训练资源推荐模型的同时降低存储压力和处理压力,成为亟待解决的问题。

发明内容

本公开提供一种资源推荐模型的训练方法、资源推荐方法、装置及服务器,以在提高训练资源推荐模型的准确率的同时,还降低存储压力和处理压力。本公开的技术方案如下:

根据本公开实施例的第一方面,提供一种资源推荐模型的训练方法,包括:

从多个资源类别中,确定新增行为特征对应的第一资源类别,所述新增行为特征是基于新增行为数据确定的,所述新增行为数据是基于用户账号对资源的操作生成的,所述第一资源类别为所述资源所属的类别;其中,每个资源类别与不同的类别特征对应,每个所述类别特征是每个所述资源类别对应的历史行为特征分别融合得到的,所述历史行为特征是根据历史行为数据确定的;

确定所述第一资源类别对应的第一类别特征,将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征;

基于所述多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,所述多个资源类别对应的类别特征包括所述第一资源类别更新后的第一类别特征,基于所述第一样本特征训练所述资源推荐模型,所述资源推荐模型用于向任一用户账号推荐资源。

在一些实施例中,每个资源类别对应的类别特征存储于所述资源类别对应的桶中,所述将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征,包括:

从所述多个资源类别对应的桶中,确定所述第一资源类别对应的第一桶;

从所述第一桶中提取所述第一类别特征;

将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于所述第一桶中。

在一些实施例中,所述新增行为特征包括多个维度的新增子特征;

每个资源类别与不同的桶对应,且每个桶与不同的维度对应,每个所述桶用于存储所述资源类别下,属于所述桶对应的维度的类别子特征;且每个资源类别对应的类别特征包括所述多个维度的类别子特征;

所述将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于所述第一桶中,包括:

对于所述多个维度中的每个维度,从所述第一桶中确定与所述维度对应的第二桶,从所述第二桶中提取类别子特征;

将所述维度的新增子特征与所提取的类别子特征进行融合,将融合后的类别子特征存储于所述第二桶中。

在一些实施例中,所述基于所述多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,包括:

对于每个资源类别,从所述资源类别对应的多个桶中,分别提取所述资源类别对应的类别子特征;

将提取到的所述多个资源类别对应的类别子特征进行拼接,得到所述第一样本特征。

在一些实施例中,所述方法还包括:

获取样本行为数据,所述样本行为数据包括已推荐的样本资源的资源特征、用户特征和行为标签,其中,所述样本资源是在得到所述多个资源类别对应的类别特征之后向样本用户账号推荐的资源,所述资源特征用于描述所述样本资源,所述用户特征为所述样本用户账号对应的用户特征,所述行为标签用于表示所述样本用户账号对所述样本资源进行的行为的类型;

将所述样本资源的资源特征和用户特征确定为第二样本特征;

所述基于所述第一样本特征训练所述资源推荐模型,包括:

基于所述第一样本特征、所述第二样本特征和所述行为标签,训练所述资源推荐模型。

在一些实施例中,所述基于所述第一样本特征、所述第二样本特征和所述行为标签,训练所述资源推荐模型,包括:

将所述第一样本特征与所述第二样本特征进行拼接,得到第三样本特征,基于所述第三样本特征和所述行为标签,训练所述资源推荐模型;或者,

将所述第一样本特征与所述第二样本特征进行融合,得到所述第三样本特征,基于所述第三样本特征和所述行为标签,训练所述资源推荐模型。

在一些实施例中,所述资源属于多个第一资源类别,所述将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征,包括:

分别将每个第一资源类别对应的分配比例与所述新增行为特征的乘积,确定为每个所述第一资源类别分配得到的新增行为特征;

对于每个第一资源类别,将所述第一资源类别分配得到的新增行为特征,与所述第一资源类别对应的所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征。

在一些实施例中,所述方法还包括:

获取配置信息,所述配置信息包括n个层级的资源类别,其中,所述多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

所述基于所述多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,包括:

在第i级中,将属于相同的上级资源类别的多个本级资源类别对应的类别特征进行融合,将融合后的类别特征确定为所述上级资源类别对应的类别特征,直至得到第k级中的至少一个资源类别对应的类别特征,i和k为不大于n的任一正整数,i大于k,其中,第i-1级中的资源类别为所述第i级中的资源类别的上级资源类别;

将所述第k级中的至少一个资源类别对应的类别特征,确定为所述第一样本特征。

在一些实施例中,所述从多个资源类别中,确定新增行为特征对应的第一资源类别,包括:

获取所述新增行为数据,所述新增行为数据至少包括至少一项用户数据和至少一项资源数据,所述至少一项资源数据中包括所述第一资源类别;

对所述新增行为数据中除所述第一资源类别之外的数据进行特征提取,得到所述新增行为特征,将所述第一资源类别确定为所述新增行为特征对应的第一资源类别。

在一些实施例中,所述将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征,包括:

按照所述新增行为特征和所述第一类别特征的权重,对所述新增行为特征和所述第一类别特征进行加权融合,得到所述第一资源类别更新后的第一类别特征。

根据本公开实施例的第二方面,提供一种资源推荐方法,所述方法包括:

确定待推荐的资源的资源特征和目标用户账号的用户特征;

基于所述资源特征、所述用户特征和多个资源类别对应的类别特征,确定模型输入特征,每个所述类别特征是每个所述资源类别对应的历史行为特征分别融合得到的,所述历史行为特征是根据历史行为数据确定的;

将所述模型输入特征输入资源推荐模型,得到所述待推荐的资源对应的预测推荐参数;

基于所述预测推荐参数,向所述目标用户账号推荐所述待推荐的资源。

在一些实施例中,所述方法还包括:

获取配置信息,所述配置信息包括n个层级的资源类别,其中,所述多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

所述基于所述资源特征、所述用户特征和多个资源类别对应的类别特征,确定模型输入特征,包括:

基于所述资源特征、所述用户特征和第k级中的至少一个资源类别对应的类别特征,确定所述模型输入特征,k为不大于n的正整数。

根据本公开实施例的第三方面,提供一种资源推荐模型的训练装置,包括:

第一确定单元,被配置为执行从多个资源类别中,确定新增行为特征对应的第一资源类别,所述新增行为特征是基于新增行为数据确定的,所述新增行为数据是基于用户账号对资源的操作生成的,所述第一资源类别为所述资源所属的类别;其中,每个资源类别与不同的类别特征对应,每个所述类别特征是每个所述资源类别对应的历史行为特征分别融合得到的,所述历史行为特征是根据历史行为数据确定的;

融合单元,被配置为执行确定所述第一资源类别对应的第一类别特征,将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征;

训练单元,被配置为执行基于所述多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,所述多个资源类别对应的类别特征包括所述第一资源类别更新后的第一类别特征,基于所述第一样本特征训练所述资源推荐模型,所述资源推荐模型用于向任一用户账号推荐资源。

在一些实施例中,每个资源类别对应的类别特征存储于所述资源类别对应的桶中,所述融合单元,包括:

确定子单元,被配置为执行从所述多个资源类别对应的桶中,确定所述第一资源类别对应的第一桶;

提取子单元,被配置为执行从所述第一桶中提取所述第一类别特征;

融合子单元,被配置为执行将所述新增行为特征与所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于所述第一桶中。

在一些实施例中,所述新增行为特征包括多个维度的新增子特征;

每个资源类别与不同的桶对应,且每个桶与不同的维度对应,每个所述桶用于存储所述资源类别下,属于所述桶对应的维度的类别子特征;且每个资源类别对应的类别特征包括所述多个维度的类别子特征;

所述融合子单元,被配置为执行对于所述多个维度中的每个维度,从所述第一桶中确定与所述维度对应的第二桶,从所述第二桶中提取类别子特征;将所述维度的新增子特征与所提取的类别子特征进行融合,将融合后的类别子特征存储于所述第二桶中。

在一些实施例中,所述训练单元,被配置为执行对于每个资源类别,从所述资源类别对应的多个桶中,分别提取所述资源类别对应的类别子特征;将提取到的所述多个资源类别对应的类别子特征进行拼接,得到所述第一样本特征。

在一些实施例中,所述装置还包括:

第一获取单元,被配置为执行获取样本行为数据,所述样本行为数据包括已推荐的样本资源的资源特征、用户特征和行为标签,其中,所述样本资源是在得到所述多个资源类别对应的类别特征之后向样本用户账号推荐的资源,所述资源特征用于描述所述样本资源,所述用户特征为所述样本用户账号对应的用户特征,所述行为标签用于表示所述样本用户账号对所述样本资源进行的行为的类型;

第二确定单元,被配置为执行将所述样本资源的资源特征和用户特征确定为第二样本特征;

所述训练单元,被配置为执行基于所述第一样本特征、所述第二样本特征和所述行为标签,训练所述资源推荐模型。

在一些实施例中,所述训练单元,被配置为执行将所述第一样本特征与所述第二样本特征进行拼接,得到第三样本特征,基于所述第三样本特征和所述行为标签,训练所述资源推荐模型;或者,

所述训练单元,被配置为执行将所述第一样本特征与所述第二样本特征进行融合,得到所述第三样本特征,基于所述第三样本特征和所述行为标签,训练所述资源推荐模型。

在一些实施例中,所述资源属于多个第一资源类别,所述融合单元,被配置为执行分别将每个第一资源类别对应的分配比例与所述新增行为特征的乘积,确定为每个所述第一资源类别分配得到的新增行为特征;对于每个第一资源类别,将所述第一资源类别分配得到的新增行为特征,与所述第一资源类别对应的所述第一类别特征进行融合,得到所述第一资源类别更新后的第一类别特征。

在一些实施例中,所述装置还包括:

第二获取单元,被配置为执行获取配置信息,所述配置信息包括n个层级的资源类别,其中,所述多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

所述训练单元,被配置为执行在第i级中,将属于相同的上级资源类别的多个本级资源类别对应的类别特征进行融合,将融合后的类别特征确定为所述上级资源类别对应的类别特征,直至得到第k级中的至少一个资源类别对应的类别特征,i和k为不大于n的任一正整数,i大于k,其中第i-1级中的资源类别为所述第i级中的资源类别的上级资源类别;将所述第k级中的至少一个资源类别对应的类别特征,确定为所述第一样本特征。

在一些实施例中,所述第一确定单元,被配置为执行获取所述新增行为数据,所述新增行为数据至少包括至少一项用户数据和至少一项资源数据,所述至少一项资源数据中包括所述第一资源类别;对所述新增行为数据中除所述第一资源类别之外的数据进行特征提取,得到所述新增行为特征,将所述第一资源类别确定为所述新增行为特征对应的第一资源类别。

在一些实施例中,所述融合单元,被配置为执行按照所述新增行为特征和所述第一类别特征的权重,对所述新增行为特征和所述第一类别特征进行加权融合,得到所述第一资源类别更新后的第一类别特征。

根据本公开实施例的第四方面,提供了一种资源推荐装置,所述装置包括:

第三确定单元,被配置为执行确定待推荐的资源的资源特征和目标用户账号的用户特征;

第四确定单元,被配置为执行基于所述资源特征、所述用户特征和多个资源类别当前对应的类别特征,确定模型输入特征,每个所述类别特征是每个所述资源类别对应的历史行为特征分别融合得到的,所述历史行为特征是根据历史行为数据确定的;

第五确定单元,被配置为执行将所述模型输入特征输入资源推荐模型,得到所述待推荐的资源对应的预测推荐参数;

推荐单元,被配置为执行基于所述预测推荐参数,向所述目标用户账号推荐所述待推荐的资源。

在一些实施例中,所述装置还包括:

第三获取单元,被配置为执行获取配置信息,所述配置信息包括n个层级的资源类别,其中,所述多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

所述第四确定单元,被配置为执行基于所述资源特征、所述用户特征和第k级中的至少一个资源类别对应的类别特征,确定所述模型输入特征,k为不大于n的正整数。

根据本公开实施例的第五方面,提供了一种服务器,所述服务器包括:

处理器;

用于存储所述处理器可执行指令的存储器;

其中,所述处理器被配置为执行所述指令,以实现如上述第一方面所述的资源推荐模型的训练方法或者第二方面所述的资源推荐方法。

根据本公开实施例的第六方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如上述第一方面所述的资源推荐模型的训练方法或者第二方面所述的资源推荐方法。

根据本公开实施例的第七方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的资源推荐模型的训练方法或者第二方面所述的资源推荐方法。

在本公开实施例提供的资源推荐模型的训练方法、资源推荐方法、装置及服务器中,不再分别存储每个新增行为特征,而是将新增行为特征按照资源类别与对应存储的类别特征进行融合,使得更新后的类别特征融合了新增行为特征中包含的信息,资源推荐模型在根据更新后的类别特征训练时能够学习到新增行为特征,并且,由于更新后的类别特征已经融合了新增行为特征,无需再存储该新增行为特征,进而上述方案在提高了训练资源推荐模型的准确率的同时,还降低了存储压力和处理压力。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种实施环境的示意图;

图2是根据一示例性实施例示出的一种资源推荐模型的训练方法的流程图;

图3是根据一示例性实施例示出的一种资源推荐方法的流程图;

图4是根据一示例性实施例示出一种的资源推荐模型的训练方法的流程图;

图5是根据一示例性实施例示出的一种资源推荐模型的训练方法的示意图;

图6是根据一示例性实施例示出的一种资源推荐模型的训练方法的流程图;

图7是根据一示例性实施例示出的一种资源推荐方法的流程图;

图8是根据一示例性实施例示出的一种资源推荐模型的训练装置的结构框图;

图9是根据一示例性实施例示出的一种资源推荐模型的训练装置的结构框图;

图10是根据一示例性实施例示出的一种资源推荐装置的结构框图;

图11是根据一示例性实施例示出的一种资源推荐装置的结构框图;

图12是根据一示例性实施例示出的一种服务器的结构框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所涉及的用户信息可以为经用户授权或者经过各方充分授权的信息。

图1是根据一示例性实施例示出的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。

示例性的,终端101上安装有由服务器102提供服务的应用,终端101能够通过该应用实现例如资源展示或者数据传输等功能。示例性的,该应用为终端101操作系统中的应用,或者为第三方提供的应用。该应用具有资源展示功能,例如,该应用具有展示视频、展示图像、展示音频的功能。当然,该应用还能够具有其他功能,例如,游戏功能、购物功能、聊天功能等。示例性的,该应用为短视频应用、游戏应用、购物应用、音频应用或者其他应用,本公开实施例对此不做限制。

在本公开实施例中,用户在终端101上对资源进行某一种或多种行为,如点赞行为、评论行为等,终端101获取行为数据,向服务器102发送行为数据,由服务器102对行为数据进行处理,得到行为特征。采用上述方式,服务器102可以获取到一条或多条行为特征,从而能够根据获取到的行为特征训练资源推荐模型,通过训练好的资源推荐模型为终端101推荐资源。

本公开实施例提供的资源推荐模型的训练方法,应用于多种场景下。

例如,以资源为视频为例,在用户通过终端中安装的应用浏览视频时,用户对视频进行的行为被记录成新增行为数据。采用本公开实施例提供的方法,根据新增行为数据生成新增行为特征,将获取到的新增行为特征按照资源类别与已存储的类别特征进行融合,使得资源推荐模型能够学习较多的新增行为特征,并且降低了对大量新增行为特征的存储压力和处理压力。后续在对该终端进行资源推荐时,可以根据已训练好的资源推荐模型确定为该终端推荐的资源。

图2是根据一示例性实施例示出的一种资源推荐模型的训练方法的流程图,如图2所示,该方法包括以下步骤。

201、从多个资源类别中,确定新增行为特征对应的第一资源类别,新增行为特征是基于新增行为数据确定的,新增行为数据是基于用户账号对资源的操作生成的,第一资源类别为资源所属的类别;其中,每个资源类别与不同的类别特征对应,每个类别特征是每个资源类别对应的历史新增行为特征分别融合得到的,历史新增行为特征是根据历史行为数据确定的。

202、确定第一资源类别对应的第一类别特征,将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征。

203、基于多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,多个资源类别对应的类别特征包括第一资源类别更新后的第一类别特征,基于第一样本特征训练资源推荐模型,资源推荐模型用于向任一用户账号推荐资源。

在一些实施例中,每个资源类别对应的类别特征存储于资源类别对应的桶中,将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,包括:

从多个资源类别对应的桶中,确定第一资源类别对应的第一桶;

从第一桶中提取第一类别特征;

将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于第一桶中。

在一些实施例中,新增行为特征包括多个维度的新增子特征;

每个资源类别与不同的桶对应,且每个桶与不同的维度对应,每个桶用于存储资源类别下,属于桶对应的维度的类别子特征;且每个资源类别对应的类别特征包括多个维度的类别子特征;

将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于第一桶中,包括:

对于多个维度中的每个维度,从第一桶中确定与维度对应的第二桶,从第二桶中提取类别子特征;

将维度的新增子特征与所提取的类别子特征进行融合,将融合后的类别子特征存储于第二桶中。

在一些实施例中,基于多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,包括:

对于每个资源类别,从资源类别对应的多个桶中,分别提取资源类别对应的类别子特征;

将提取到的多个资源类别对应的类别子特征进行拼接,得到第一样本特征。

在一些实施例中,方法还包括:

获取样本行为数据,样本行为数据包括已推荐的样本资源的资源特征、用户特征和行为标签,其中,样本资源是在得到多个资源类别对应的类别特征之后向样本用户账号推荐的资源,资源特征用于描述样本资源,用户特征为样本用户账号对应的用户特征,行为标签用于表示样本用户账号对样本资源进行的行为的类型;

将样本资源的资源特征和用户特征确定为第二样本特征;

基于第一样本特征训练资源推荐模型,包括:

基于第一样本特征、第二样本特征和行为标签,训练资源推荐模型。

在一些实施例中,基于第一样本特征、第二样本特征和行为标签,训练资源推荐模型,包括:

将第一样本特征与第二样本特征进行拼接,得到第三样本特征,基于第三样本特征和行为标签,训练资源推荐模型;或者,

将第一样本特征与第二样本特征进行融合,得到第三样本特征,基于第三样本特征和行为标签,训练资源推荐模型。

在一些实施例中,资源属于多个第一资源类别,将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,包括:

分别将每个第一资源类别对应的分配比例与新增行为特征的乘积,确定为每个第一资源类别分配得到的新增行为特征;

对于每个第一资源类别,将第一资源类别分配得到的新增行为特征,与第一资源类别对应的第一类别特征进行融合,得到第一资源类别更新后的第一类别特征。

在一些实施例中,方法还包括:

获取配置信息,配置信息包括n个层级的资源类别,其中,多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

基于多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,包括:

在第i级中,将属于相同的上级资源类别的多个本级资源类别对应的类别特征进行融合,将融合后的类别特征确定为上级资源类别对应的类别特征,直至得到第k级中的至少一个资源类别对应的类别特征,i和k为不大于n的任一正整数,i大于k,其中,第i-1级中的资源类别为第i级中的资源类别的上级资源类别;

将第k级中的至少一个资源类别对应的类别特征,确定为第一样本特征。

在一些实施例中,从多个资源类别中,确定新增行为特征对应的第一资源类别,包括:

获取新增行为数据,新增行为数据至少包括至少一项用户数据和至少一项资源数据,至少一项资源数据中包括第一资源类别;

对新增行为数据中除第一资源类别之外的数据进行特征提取,得到新增行为特征,将第一资源类别确定为新增行为特征对应的第一资源类别。

在一些实施例中,将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,包括:

按照新增行为特征和第一类别特征的权重,对新增行为特征和第一类别特征进行加权融合,得到第一资源类别更新后的第一类别特征。。

在本公开实施例中,不再分别存储每个新增行为特征,而是将新增行为特征按照资源类别与对应存储的类别特征进行融合,使得更新后的类别特征融合了新增行为特征中包含的信息,资源推荐模型在根据更新后的类别特征训练时能够学习到新增行为特征,并且,由于更新后的类别特征已经融合了新增行为特征,无需再存储该新增行为特征,进而上述方案在提高了训练资源推荐模型的准确率的同时,还降低了存储压力和处理压力。

图3是根据一示例性实施例示出的一种资源推荐方法的流程图,如图3所示,该方法包括以下步骤。

301、确定待推荐的资源的资源特征和目标用户账号的用户特征。

302、基于资源特征、用户特征和多个资源类别对应的类别特征,确定模型输入特征,每个类别特征是每个资源类别对应的历史新增行为特征分别融合得到的,历史新增行为特征是根据历史行为数据确定的。

303、将模型输入特征输入资源推荐模型,得到待推荐的资源对应的预测推荐参数。

304、基于预测推荐参数,向目标用户账号推荐待推荐的资源。

在一些实施例中,方法还包括:

获取配置信息,配置信息包括n个层级的资源类别,其中,多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

基于资源特征、用户特征和多个资源类别对应的类别特征,确定模型输入特征,包括:

基于资源特征、用户特征和第k级中的至少一个资源类别对应的类别特征,确定模型输入特征,k为不大于n的正整数。

在本公开实施例中,由于资源推荐模型从大量的新增行为特征中学习到了用户账号对不同资源类别的资源的兴趣,从而通过该资源推荐模型来确定是否要对目标用户账号推荐待推荐的资源,能够提高资源推荐的准确性。

图4是根据一示例性实施例示出的另一种资源推荐模型的训练方法的流程图,如图4所示,执行主体为服务器,该方法包括以下步骤:

401、服务器从多个资源类别中,确定新增行为特征对应的第一资源类别,其中,新增行为特征是基于新增行为数据确定的,新增行为数据是基于用户账号对资源的操作生成的,第一资源类别为该资源所属的类别。

其中,新增行为特征能够表示用户对资源进行的行为,能够体现用户对资源的兴趣。该资源为多媒体资源,例如视频、音频或者新闻等资源,或者该资源为商品。该行为为点赞、评论、收藏、购买、点击或者播放等类型的行为。可选地,新增行为特征以嵌入(Embedding)向量的形式表示。不同的资源可能属于不同的类别;资源的分类方式以及资源类别的数量可以根据需要进行设置和更改,本公开对此不作限制。例如,以资源为视频为例,资源类别可以分为游戏类别、音乐类别、影视类别或者美食类别等类别。

在本公开实施例中,对于每个资源,服务器先确定该资源所属的资源类别。在一些实施例中,服务器通过人工标注的方式为每个资源标注资源类别;或者服务器对多个资源进行聚类分析,得到每个资源所属的聚类簇(Cluster)ID,将该聚类簇ID作为资源类别。又或者,服务器采用其它实现方式确定资源所属的资源类别,本公开实施例对此不做限制。

在本公开实施例中,通过灵活设置资源类别的数量,使得资源类别的数量能够根据不同的粒度需求进行弹性伸缩。

在一些实施例中,步骤401的实现方式包括:服务器获取新增行为数据,新增行为数据至少包括至少一项用户数据和至少一项资源数据,至少一项资源数据中包括第一资源类别;对新增行为数据中除第一资源类别之外的数据进行特征提取,得到新增行为特征,将第一资源类别确定为新增行为特征对应的第一资源类别。

其中,用户数据包括用户(User)标识等数据,例如,该用户标识为用户ID(Identity Document,身份标识号)。资源数据包括资源标识、资源作者的作者标识、资源类别等数据。其中,该资源作者为上传该资源的用户账号。例如,以资源为视频为例,该资源数据为视频数据,该资源类别为视频类别,该视频数据包括视频(Video)ID、视频作者的作者(Author)ID、视频类别(Tag)ID等数据。

在一些实施例中,新增行为数据包括多个维度的新增子数据,该多个维度包括用户标识维度、资源标识维度或者资源作者的作者标识维度等,相应地,该新增行为数据包括的新增子数据有:用户标识、资源标识或者资源作者的作者标识等。而在对新增行为数据进行特征提取时,会分别对每个维度的新增子数据进行特征提取,得到每个维度的新增子特征,从而由得到的多个维度的新增子特征构成了上述新增行为特征。

需要说明的是,新增行为数据是以行为序列的形式存在的,因此,该新增行为数据还包括用户对资源进行的行为所发生的时间。例如,该时间为点击的时间、点赞的时间等。在资源为视频或者音频的情况下,则该新增行为数据还可以包括播放时长,该播放时长为终端播放资源的时长。

其中,新增行为数据为用户使用的终端记录的。示例性地,每新生成一条新增行为数据,终端向服务器发送该新增行为数据,服务器接收该新增行为数据。相应地,服务器每接收到一条新增行为数据,就对该新增行为数据进行特征提取,或者服务器先存储该新增行为数据,在接收到多条新增行为数据时,才对该多条新增行为数据分别进行特征提取。

在本公开实施例中,通过对新增行为数据进行特征提取,得到新增行为特征,并确定了该新增行为特征对应的资源类别,从而为后续根据该新增行为特征更新已存储的类别特征提供了数据支持。

在一些实施例中,本公开实施例仅是以执行主体为服务器为例,需要说明的是,该服务器可以包括处理服务器和数据存储服务器,其中处理服务器用于与登录的每个终端进行交互,为终端登录的用户账号推荐资源,或者收集用户在终端上产生的新增行为数据等,数据存储服务器用于存储推荐服务器所需的数据,例如采集到的新增行为数据、新增行为特征或者与资源类别对应存储的类别特征等。那么,处理服务器采集新增行为数据,对该新增行为数据进行特征提取,将特征提取后得到的新增行为特征存储在数据存储服务器中,数据存储服务器将该新增行为特征与已存储的类别特征进行融合,从而得到更新后的类别特征,供处理服务器使用。

示例性地,数据存储服务器可以为PS(Parameter Server,参数服务器)。

在本公开实施例中,由于将新增行为特征的聚合操作从处理服务器和模型层面转移到了数据存储服务器和Embedding向量层面,因此,本公开提供的方法无需将较多的新增行为特征从数据存储服务器输出到处理服务器中,而是仅需输出融合得到的类别特征即可,从而降低了对处理服务器和数据存储服务器之间的I/O(Input/Output,输入/输出)带宽和时延的要求。

402、服务器确定该第一资源类别对应的第一类别特征。

其中,每个资源类别与不同的类别特征对应,每个类别特征是每个资源类别对应的历史行为特征分别融合得到的,历史行为特征是根据历史行为数据确定的。服务器中存在多个资源,而不同的资源可能具有不同的资源类别。该服务器按照资源类别进行划分,分别存储每个资源类别对应的类别特征。

例如,针对多条新增行为特征,若直接存储这些新增行为特征,会导致较大的存储压力,后续读取这些新增行为特征也会导致较大的处理压力。而将这些新增行为特征融合得到类别特征后,存储该类别特征,该类别特征学习到了这些新增行为特征包含的信息,但是数据量会小于这些新增行为特征的数据量,因此降低了存储压力,而且读取该类别特征会更加快速高效,也会降低处理压力。在一些实施例中,该类别特征为由一条或多条新增行为特征融合得到的稀疏(Sparse)特征。

403、服务器将该新增行为特征与该第一类别特征进行融合,得到该第一资源类别更新后的第一类别特征。

其中,服务器通过将新增行为特征与第一类别特征进行融合,使得第一类别特征能够学习到新增行为特征包含的信息,从而更新后的第一类别特征能够表示该第一资源类别下的新增行为特征包含的信息。

在一些实施例中,以服务器包括处理服务器和数据存储服务器为例进行说明,处理服务器向数据存储服务器发送融合指令,该融合指令携带了新增行为特征,数据存储服务器响应于该融合指令,将新增行为特征和第一类别特征进行融合,得到更新后的第一类别特征,以及存储更新后的第一类别特征。

在一些实施例中,每个资源类别对应的类别特征存储于资源类别对应的桶中,相应地,步骤403的实现方式包括:从多个资源类别对应的桶中,确定第一资源类别对应的第一桶;从第一桶中提取第一类别特征;将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于第一桶中。

其中,服务器按照资源类别对类别特征进行分桶,使得每个资源类别具有各自对应的桶,桶中存储了该资源类别对应的类别特征。在本公开实施例中,通过以桶的形式按照资源类别分别存储类别特征,从而便于对类别特征的管理。

在上述实施例的一种可能的实现方式中,新增行为特征包括多个维度的新增子特征,该多个维度的新增子特征是从不同的维度,对新增行为数据进行特征提取得到的,能够从不同的维度,对新增行为数据进行描述。每个资源类别与不同的桶对应,且每个桶与不同的维度对应,每个桶用于存储资源类别下,属于桶对应的维度的类别子特征;且每个资源类别对应的类别特征包括多个维度的类别子特征。相应地,服务器将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于第一桶中的实现方式包括:服务器对于多个维度中的每个维度,从第一桶中确定与维度对应的第二桶,从第二桶中提取类别子特征;将维度的新增子特征与所提取的类别子特征进行融合,将融合后的类别子特征存储于第二桶中。

其中,对于每个资源类别,该资源类别对应的桶的数量与该资源类别对应的维度的数量相同。

在一些实施例中,新增行为数据包括多个维度的新增子数据,新增行为特征所包括的每个维度的新增子特征是基于新增行为数据中该维度对应的新增子数据提取得到的,例如,以资源为视频为例,对于视频ID维度,服务器对新增行为数据中的视频ID进行特征提取,得到视频ID对应的新增子特征。

例如,参见图5,资源类别为类别A,该资源类别与3个桶对应存储,该三个桶为桶1、桶2和桶3,每个桶对应的维度分别为用户标识、资源标识和资源作者的作者标识,服务器将新增行为特征中用户标识维度的新增子特征和桶1中存储的类别子特征进行融合,将更新后的类别子特征存储在桶1中,将资源标识维度的新增子特征和桶2中存储的类别子特征进行融合,将更新后的类别子特征存储在桶2中,将作者标识维度的新增子特征和桶3中存储的类别子特征进行融合,将更新后的类别子特征存储在桶3中。

在本公开实施例中,由于新增行为特征和类别特征均包括多个维度的特征,因此通过将每个维度的新增子特征和类别子特征进行融合,使得同一资源类别且同一维度的特征能够融合在一起,从而没有信息的损失,提高了新增行为特征的利用率。

在一些实施例中,服务器将新增行为特征与第一类别特征进行融合的实现方式包括:服务器按照新增行为特征和第一类别特征的权重,对新增行为特征和第一类别特征进行加权融合,得到第一资源类别更新后的第一类别特征。

其中,加权融合的方式可以为基于滑动加权平均进行融合。例如,滑动加权平均为算数滑动加权平均或者指数滑动加权平均,本公开对此不做限制。可选地,服务器将新增行为特征和第一类别特征的权重确定为固定数值,或者,服务器结合该新增行为特征指示的资源的参考分值来确定新增行为特征和第一类别特征的权重。其中,参考分值为质量分值或者重要性分值。参考分值越高表示资源的质量越高或者重要性越高。相应地,服务器为参考分值较高的新增行为特征设置较高的权重。需要说明的是,任一资源的参考分值可以根据需要事先进行设置,本公开对此不做限制。

或者,加权融合的方式也可以为基于自回归的序列模型进行融合。自回归的序列模型为ARMA(Auto-Regressive and Moving Average,自回归滑动平均)模型、LSTM(LongShort-Term Memory,长短期记忆网络)模型或者Transformer模型(一种自回归模型)等。在该实施例中,通过自回归的序列模型对新增行为特征和第一类别特征进行融合,从而能够得到历史以来获取到的新增行为特征的融合结果。

在本公开实施例中,通过对新增行为特征和第一类别特征进行加权融合,使得融合后的第一类别特征也即是更新后的第一类别特征能够结合历史新增行为特征所指代的信息以及获取到的新增行为特征所指代的信息,与过滤部分新增行为特征以降低存储压力的方式相比,采用存储第一类别特征的方式不会造成信息损失,进而为训练出更加准确的资源推荐模型提供了数据支持。

404、服务器基于该多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,该多个资源类别对应的类别特征包括该第一资源类别更新后的第一类别特征。

其中,在得到更新后的第一类别特征之后,服务器根据当前已存储的多个资源类别对应的类别特征,来训练资源推荐模型。在一些实施例中,服务器直接将多个资源类别对应的类别特征进行拼接,得到资源推荐模型的第一样本特征,相应地,步骤404的实现方式包括:服务器对于每个资源类别,从资源类别对应的多个桶中,分别提取资源类别对应的类别子特征;将提取到的多个资源类别对应的类别子特征进行拼接,得到第一样本特征。

其中,服务器将每个资源类别对应的类别子特征进行拼接,得到拼接后的类别子特征,再将多个资源类别对应的拼接后的类别子特征进行拼接,得到第一样本特征。

在本公开实施例中,通过将多个资源类别对应的桶中存储的类别子特征进行拼接,从而得到一条特征序列,该特征序列能够代表历史新增行为特征所指代的信息以及获取到的新增行为特征所指代的信息,由于得到的第一样本特征的数据量较少,从而减少了资源推荐模型的输入数据量。

在一些实施例中,多个资源类别的数量可能比较多,因此服务器划分多个层级的资源类别,从而结合多个层级的资源类别确定第一样本特征,则本公开实施例提供的资源推荐模型的训练方法还包括以下步骤:服务器获取配置信息,配置信息包括n个层级的资源类别,其中,多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数。相应地,步骤404的实现方式包括:

服务器在第i级中,将属于相同的上级资源类别的多个本级资源类别对应的类别特征进行融合,将融合后的类别特征确定为上级资源类别对应的类别特征,直至得到第k级中的至少一个资源类别对应的类别特征,i和k为不大于n的任一正整数,i大于k,其中第i-1级中的资源类别为第i级中的资源类别的上级资源类别;将第k级中的至少一个资源类别对应的类别特征,确定为第一样本特征。

其中,第k级的级数可以根据需要进行设置,本公开对此不做限制。在步骤401中的多个资源类别为多个层级中第n级的资源类别,也就是说,服务器每次将新增行为特征按照最后一个层级的资源类别与对应的类别特征进行融合。

可选地,在将属于相同的上级资源类别的多个本级资源类别对应的类别特征进行融合时,服务器确定每个本级资源类别的权重为固定数值,或者服务器结合每个本级资源类别的参考分值确定该本级资源类别的权重。例如,参考分值可以为重要性分值,服务器为重要性分值较高的本级资源类别分配较高的权重。需要说明的是,任一资源类别的参考分值可以根据需要事先进行设置,本公开对此不做限制。

例如,该n个层级的资源类别分别为一级类别、二级类别和三级类别,其中,每个一级类别对应至少一个二级类别,每个二级类别对应至少一个三级类别,一级类别的数量为30,二级类别的数量为200,三级类别的数量为1000。

在本公开实施例中,通过灵活划分多个层级的资源类别,从而支持弹性伸缩新增行为特征的融合粒度,进而能够在复杂度和模型效果之间取得折中。

在一些实施例中,在得到多个资源类别对应的类别特征之后,服务器向样本用户账号推荐资源,结合样本用户账号对该资源的反馈,确定样本行为数据,从而结合样本行为数据和第一样本特征一起训练资源推荐模型。其中,样本用户账号为任一用户账号,例如样本用户账号为已获取的新增行为特征对应的用户账号或者其他用户账号。

相应地,本公开实施例提供的资源推荐模型的训练方法还包括以下步骤(1)-(2):

(1)服务器获取样本行为数据,样本行为数据包括已推荐的样本资源的资源特征、用户特征和行为标签。

其中,样本资源是在得到多个资源类别对应的类别特征之后向样本用户账号推荐的资源,资源特征用于描述样本资源,用户特征为样本用户账号对应的用户特征,行为标签用于表示样本用户账号对样本资源进行的行为的类型。

其中,样本资源为在根据获取到的新增行为特征对已存储的多个资源类别的类别特征进行更新之后,推荐给样本用户账号的资源,也即是当前所获取到的新增行为特征中不包括样本资源的资源特征。用户特征可以为对样本用户账号的账号信息进行特征提取得到的用户特征。用户特征可以包括样本用户账号的年龄数据、性别数据或者注册时长数据等账号数据对应的特征。资源特征可以为资源标识、资源作者的作者标识、资源的浏览量或者资源的适用年龄等资源数据对应的特征。

例如,该样本资源为视频,资源特征为视频标识对应的特征、视频作者的作者标识对应的特征、视频的浏览量对应的特征等中的至少一项。其中,行为标签所表示的类型包括点赞、评论、收藏、购买、点击、划走、举报或者播放等行为的类型。该行为标签还可以包括其它类型,本公开对此不做限制。

(2)服务器将样本资源的资源特征和用户特征确定为第二样本特征。

在本公开实施例中,在第一样本特征的基础上,还获取了样本行为数据,从而基于样本行为数据确定了第二样本特征,为后续训练资源推荐模型提供了丰富的数据支持。

405、服务器基于该第一样本特征训练该资源推荐模型,该资源推荐模型用于向任一用户账号推荐资源。

其中,目标用户账号为待推荐资源的任一用户账号。在一些实施例中,由于服务器还根据获取到的样本行为数据确定了第二样本特征,那么服务器在第一样本特征的基础上,结合第二样本特征来训练资源推荐模型。相应地,步骤405的实现方式包括:服务器基于第一样本特征、第二样本特征和行为标签,训练资源推荐模型。其中,行为标签为样本行为数据所包括的行为标签。

在本公开实施例中,资源推荐模型在训练过程中,参考了多个资源类别对应的历史行为数据,还参考了样本行为数据,从而训练出的资源推荐模型的准确性较高。

在一些实施例中,服务器基于第一样本特征、第二样本特征和行为标签,训练资源推荐模型的实现方式包括以下步骤(1)-(2):

(1)服务器将第一样本特征与第二样本特征进行融合,得到第三样本特征。

可选地,服务器基于注意力机制的方式将多个资源类别更新后的目标特以及样本资源的资源特征和用户特征进行融合。其中,服务器基于样本资源的资源特征和用户特征确定索引信息(query),将多个资源类别对应的类别特征作为与该索引信息对应的键值信息,以实现样本资源的资源特征和用户特征与多个资源类别对应的类别特征对应存储,以方便后续检索。该类别特征可以看作是一个信息存储器,而样本资源的资源特征和用户特征作为索引,也即是查询向量,用来查找并选择该类别特征中的部分信息。

其中,键值信息中的键(key)和值(value)是相同的,均为多个资源类别对应的类别特征。通过将键值信息中的键和值均设置为更新后的类别特征,使得后续在检索时,不会因键值不同而混淆。对于已确定的索引信息,服务器获取该索引信息对应存储的键值信息,也即是多个资源类别对应的类别特征,确定该索引信息与每个资源类别对应的类别特征之间的相似度,基于该相似度对多个资源类别对应的类别特征进行加权平均,得到第三样本特征。

例如,该注意力机制可以为多头注意力(Multi-head Attention)机制或者其他注意力机制,本公开对此不做限制。服务器将样本资源的资源特征和用户特征进行拼接,得到索引信息;或者,服务器将样本资源的资源特征作为索引信息;或者,服务器将用户特征作为索引信息,本公开对此不做限制。

需要说明的是,在索引信息为样本资源的资源特征的情况下,服务器将样本资源的资源特征和多个资源类别对应的类别特征进行融合,将融合后的特征和用户特征进行拼接,得到第三样本特征;相应地,在索引信息为样本资源的用户特征的情况下,服务器将样本资源的用户特征和多个资源类别对应的类别特征进行融合,将融合后的特征和资源特征进行拼接,得到第三样本特征。

在本公开实施例中,通过将样本资源的资源特征、用户特征与多个资源类别对应的类别特征进行融合,从而在众多的类别特征中聚焦于对当前的已推荐资源更为关键的类别特征,降低对其他类别特征的关注度,甚至过滤掉无关类别特征,这样就能够解决信息过载问题,并提高后续资源推荐模型的处理效率和准确性。

(2)服务器基于第三样本特征和行为标签,训练资源推荐模型。

其中,服务器根据样本资源的行为标签,确定资源推荐模型在根据第三样本特征进行训练时的损失函数,从而根据损失函数调整以及优化资源推荐模型的模型参数,进而结合优化后的模型参数对资源推荐模型进行更新训练。

在本公开实施例中,通过基于第三样本特征以及样本资源的行为标签来训练资源推荐模型,使得资源推荐模型能够学习样本用户账号对多个资源类别的资源的兴趣,从而提高了资源推荐模型训练的准确性。

在本公开实施例中,一方面,融合得到的第三样本特征的数据量较小,从而使得输入资源推荐模型的训练数据的数据量较小,模型训练速度较快;另一方面,第三样本特征既包含了用户账号的信息、已推荐给用户账号的资源的信息,又包含了新增行为特征的信息,使得模型在训练时能够学习较多的特征,进而提高了资源推荐模型训练的准确性。

在另一些实施例中,服务器基于第一样本特征、第二样本特征和行为标签,训练资源推荐模型的实现方式包括以下步骤:服务器将第一样本特征与第二样本特征进行拼接,得到第三样本特征,基于第三样本特征和行为标签,训练资源推荐模型。

其中,拼接得到的第三样本特征能够完整地保留多个资源类别对应的类别特征、样本资源的用户特征和资源特征所指示的信息。可选地,服务器基于第三样本特征和行为标签,训练资源推荐模型的实现方式与步骤405中的步骤(2)的实现方式同理,在此不再赘述。

在本公开实施例中,通过直接将第一样本特征、第二样本特征和行为标签进行拼接,使得输入资源推荐模型的样本特征更加完整和丰富,从而能够提高资源推荐模型训练的准确性。

例如,以获取到的新增行为特征指代100个资源为例,该新增行为特征中包含维度为资源标识的新增子特征,新增子特征为长度100的向量,也即是该新增子特征包含100个资源标识的向量,资源类别的数量为30,行为标签为点击,将新增子特征按照资源类别进行融合,融合到30个不同资源类别的桶中,这30个桶中更新后的类别子特征可以组成长度为30的类别特征。

在本公开实施例中,存储的类别特征为基于所有的行为特征融合得到的,由于在融合时不存在行为特征的逐出和挑选,因此不存在特征的损失。随着资源推荐模型的训练,这些类别特征中包含的用于表示用户账号对资源进行的行为的信息越多。当资源推荐模型持续训练足够长时间时,可以认为这些类别特征利用了无限长的行为特征。

在本公开实施例中,由于只基于新增行为特征,也即是新产生的行为特征对已存储的类别特征进行融合,从而在训练资源推荐模型时无需存储和读取全量的行为特征;且没有对行为特征进行挑选,而是根据每次更新后的类别特征对资源推荐模型进行更新,从而降低了对服务器的存储容量和吞吐能力的要求,还提高了资源推荐模型训练的准确性。

在本公开实施例中,不再分别存储每个新增行为特征,而是将新增行为特征按照资源类别与对应存储的类别特征进行融合,使得更新后的类别特征融合了新增行为特征中包含的信息,资源推荐模型在根据更新后的类别特征训练时能够学习到新增行为特征,并且,由于更新后的类别特征已经融合了新增行为特征,无需再存储该新增行为特征,进而上述方案在提高了训练资源推荐模型的准确率的同时,还降低了存储压力和处理压力。

图6是根据一示例性实施例示出的另一种资源推荐模型的训练方法的流程图,如图6所示,执行主体为服务器,该方法包括以下步骤:

601、服务器从多个资源类别中,确定新增行为特征对应的多个第一资源类别,其中,新增行为特征是基于新增行为数据确定的,该新增行为数据是基于用户账号对资源的操作生成的,每个第一资源类别均为该资源所属的类别。

在一些实施例中,步骤601的实现方式和步骤401的实现方式同理,在此不再赘述。可选地,同一资源可能属于多个资源类别,在本公开实施例中,以该资源对应多个第一资源类别为例进行说明,相应地,服务器分别确定每个第一资源类别对应的第一类别特征。例如,以资源为视频为例,该视频属于的多个第一资源类别包括游戏类别和音乐类别。

602、服务器确定分别与每个第一资源类别对应存储的第一类别特征。

在一些实施例中,步骤602的实现方式和步骤402的实现方式同理,在此不再赘述。

603、对于每个第一资源类别,服务器将该新增行为特征与该第一资源对应的第一类别特征进行融合,得到该第一资源类别更新后的第一类别特征。

在一些实施例中,服务器将新增行为特征与第一类别特征进行融合的实现方式包括:服务器分别将每个第一资源类别对应的分配比例与新增行为特征的乘积,确定为每个第一资源类别分配得到的新增行为特征;对于每个第一资源类别,将第一资源类别分配得到的新增行为特征,与第一资源类别对应的第一类别特征进行融合,得到第一资源类别更新后的第一类别特征。

其中,该分配比例可以根据需要进行设置,本公开对此不做限制。需要说明的是,由于新增行为特征包括多个维度的新增子特征,因此,在对新增行为特征进行分配时,对于每个维度的新增子特征均按照该分配比例进行分配。

在该实施例中,对于每个第一资源类别,服务器将第一资源类别分配得到的新增行为特征,与第一资源类别对应的第一类别特征进行融合的实现方式与步骤403中服务器将新增行为特征与第一类别特征进行融合的实现方式同理,在此不再赘述。

在本公开实施例中,在新增行为特征指代的资源属于多个第一资源类别时,通过对该新增行为特征进行比例的分配,使得更新后的第一类别特征更加准确,从而能够提高资源推荐模型训练的准确性。

例如,继续参见图5,对于每个第一资源类别,服务器将新增行为特征中不同维度的分配后的新增子特征分别与所提取的该维度的类别子特征进行融合,将融合后的类别子特征存储于与维度对应的桶中。

604、服务器基于该多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,该多个资源类别对应的类别特征包括每个第一资源类别更新后的第一类别特征。

605、服务器基于该第一样本特征训练该资源推荐模型,该资源推荐模型用于向任一用户账号推荐资源。

在一些实施例中,步骤604-605的实现方式和步骤404-405的实现方式同理,在此不再赘述。

在本公开实施例中,不再分别存储每个新增行为特征,而是将新增行为特征按照资源类别与对应存储的类别特征进行融合,使得更新后的类别特征融合了新增行为特征中包含的信息,资源推荐模型在根据更新后的类别特征训练时能够学习到新增行为特征,并且,由于更新后的类别特征已经融合了新增行为特征,无需再存储该新增行为特征,进而上述方案在提高了训练资源推荐模型的准确率的同时,还降低了存储压力和处理压力。

在本公开实施例中,由于训练得到的资源推荐模型已经学习了大量的行为特征,因此使用该资源推荐模型进行资源推荐的准确率较高,从而服务器能够借助于该资源推荐模型进行资源推荐,相应地,以向目标用户账号进行资源推荐为例进行说明,图7是根据一示例性实施例示出的一种资源推荐方法的流程图,如图7所示,执行主体为服务器,该方法包括以下步骤:

701、服务器确定待推荐的资源的资源特征和目标用户账号的用户特征。

其中,对于待推荐的资源,服务器对该资源进行特征提取,得到该资源特征;服务器对目标用户账号的账号进行特征提取,得到用户特征。

702、服务器基于该资源特征、该用户特征和多个资源类别对应的类别特征,确定模型输入特征,每个类别特征是每个资源类别对应的历史行为特征分别融合得到的,该历史行为特征是根据历史行为数据确定的。

在一些实施例中,由于资源类别之间可能存在层级关系,那么服务器在获取多个资源类别当前对应的类别特征时,获取多个层级中的任一层级的资源类别对应的类别特征;相应地,本公开实施例提供的资源推荐方法还包括以下步骤:服务器获取配置信息,配置信息包括n个层级的资源类别,其中多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数。相应地,步骤702的实现方式包括:服务器基于资源特征、用户特征和第k级中的至少一个资源类别对应的类别特征,确定模型输入特征,k为不大于n的正整数。

其中,服务器确定第k级中的至少一个资源类别对应的类别特征的实现方式与步骤404中服务器确定第k级中的至少一个资源类别对应的类别特征的实现方式同理,在此不再赘述。

在本公开实施例中,由于多个资源类别当前对应的类别特征能够在多个层级中确定,使得模型输入特征的数据量能够根据模型的需要灵活设置,从而提高了资源推荐模型的适应性。

703、服务器将该模型输入特征输入资源推荐模型,得到待推荐的资源对应的预测推荐参数。

其中,资源推荐模型的训练过程如上述实施例所示。服务器将模型输入特征作为资源推荐模型的输入数据,通过资源推荐模型确定待推荐的资源的预测推荐参数,该预测推荐参数表示目标用户账号对待推荐的资源的接受程度。

704、服务器基于该预测推荐参数,向该目标用户账号推荐待推荐的资源。

在一些实施例中,预测推荐参数符合推荐条件,表示目标用户账号对待推荐的资源的接受程度较高,则服务器向目标用户账号推荐该待推荐的资源;预测推荐参数不符合推荐条件,表示目标用户账号对该待推荐的资源的接受程度较低,则服务器无需向目标用户账号推荐该待推荐的资源。

可选地,预测推荐参数以分值的形式表示,则推荐条件为高于推荐分值,推荐分值可以根据需要进行设置,本公开对此不做限制。例如,推荐分值为80、90或者95等。

在本公开实施例中,由于资源推荐模型从大量的新增行为特征中学习到了用户账号对不同资源类别的资源的兴趣,从而通过该资源推荐模型来确定是否要对目标用户账号推荐待推荐资源能够提高资源推荐的准确性。

图8是根据一示例性实施例示出的一种资源推荐模型的训练装置的结构框图。参照图8,该装置包括第一确定单元801、融合单元802和训练单元803:

第一确定单元801,被配置为执行从多个资源类别中,确定新增行为特征对应的第一资源类别,新增行为特征是基于新增行为数据确定的,新增行为数据是基于用户账号对资源的操作生成的,第一资源类别为资源所属的类别;其中,每个资源类别与不同的类别特征对应,每个类别特征是每个资源类别对应的历史行为特征分别融合得到的,历史行为特征是根据历史行为数据确定的;

融合单元802,被配置为执行确定第一资源类别对应的第一类别特征,将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征;

训练单元803,被配置为执行基于多个资源类别对应的类别特征,确定资源推荐模型的第一样本特征,多个资源类别对应的类别特征包括第一资源类别更新后的第一类别特征,基于第一样本特征训练资源推荐模型,资源推荐模型用于向任一用户账号推荐资源。

在一些实施例中,参见图9,每个资源类别对应的类别特征存储于资源类别对应的桶中,融合单元802,包括:

确定子单元8021,被配置为执行从多个资源类别对应的桶中,确定第一资源类别对应的第一桶;

提取子单元8022,被配置为执行从第一桶中提取第一类别特征;

融合子单元8023,被配置为执行将新增行为特征与第一类别特征进行融合,得到第一资源类别更新后的第一类别特征,将更新后的第一类别特征存储于第一桶中。

在一些实施例中,新增行为特征包括多个维度的新增子特征;

每个资源类别与不同的桶对应,且每个桶与不同的维度对应,每个桶用于存储资源类别下,属于桶对应的维度的类别子特征;且每个资源类别对应的类别特征包括多个维度的类别子特征;

融合子单元8023,被配置为执行对于多个维度中的每个维度,从第一桶中确定与维度对应的第二桶,从第二桶中提取类别子特征;将维度的新增子特征与所提取的类别子特征进行融合,将融合后的类别子特征存储于第二桶中。

在一些实施例中,训练单元803,被配置为执行对于每个资源类别,从资源类别对应的多个桶中,分别提取资源类别对应的类别子特征;将提取到的多个资源类别对应的类别子特征进行拼接,得到第一样本特征。

在一些实施例中,装置还包括:

第一获取单元804,被配置为执行获取样本行为数据,样本行为数据包括已推荐的样本资源的资源特征、用户特征和行为标签,其中,样本资源是在得到多个资源类别对应的类别特征之后向样本用户账号推荐的资源,资源特征用于描述样本资源,用户特征为样本用户账号对应的用户特征,行为标签用于表示样本用户账号对样本资源进行的行为的类型;

第二确定单元805,被配置为执行将样本资源的资源特征和用户特征确定为第二样本特征;

训练单元803,被配置为执行基于第一样本特征、第二样本特征和行为标签,训练资源推荐模型。

在一些实施例中,训练单元803,被配置为执行将第一样本特征与第二样本特征进行拼接,得到第三样本特征,基于第三样本特征和行为标签,训练资源推荐模型;或者,

训练单元803,被配置为执行将第一样本特征与第二样本特征进行融合,得到第三样本特征,基于第三样本特征和行为标签,训练资源推荐模型。

在一些实施例中,资源属于多个第一资源类别,融合单元802,被配置为执行分别将每个第一资源类别对应的分配比例与新增行为特征的乘积,确定为每个第一资源类别分配得到的新增行为特征;对于每个第一资源类别,将第一资源类别分配得到的新增行为特征,与第一资源类别对应的第一类别特征进行融合,得到第一资源类别更新后的第一类别特征。

在一些实施例中,装置还包括:

第二获取单元806,被配置为执行获取配置信息,配置信息包括n个层级的资源类别,其中,多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

训练单元803,被配置为执行在第i级中,将属于相同的上级资源类别的多个本级资源类别对应的类别特征进行融合,将融合后的类别特征确定为上级资源类别对应的类别特征,直至得到第k级中的至少一个资源类别对应的类别特征,i和k为不大于n的任一正整数,i大于k,其中第i-1级中的资源类别为第i级中的资源类别的上级资源类别;将第k级中的至少一个资源类别对应的类别特征,确定为第一样本特征。

在一些实施例中,第一确定单元801,被配置为执行获取新增行为数据,新增行为数据至少包括至少一项用户数据和至少一项资源数据,至少一项资源数据中包括第一资源类别;对新增行为数据中除第一资源类别之外的数据进行特征提取,得到新增行为特征,将第一资源类别确定为新增行为特征对应的第一资源类别。

在一些实施例中,融合单元802,被配置为执行按照新增行为特征和第一类别特征的权重,对新增行为特征和第一类别特征进行加权融合,得到第一资源类别更新后的第一类别特征。

在本公开实施例中,不再分别存储每个新增行为特征,而是将新增行为特征按照资源类别与对应存储的类别特征进行融合,使得更新后的类别特征融合了新增行为特征中包含的信息,资源推荐模型在根据更新后的类别特征训练时能够学习到新增行为特征,并且,由于更新后的类别特征已经融合了新增行为特征,无需再存储该新增行为特征,进而上述方案在提高了训练资源推荐模型的准确率的同时,还降低了存储压力和处理压力。

图10是根据一示例性实施例示出的一种资源推荐装置的结构框图。参照图10,该装置包括第三确定单元1001、第四确定单元1002、第五确定单元1003和推荐单元1004:

第三确定单元1001,被配置为执行确定待推荐的资源的资源特征和目标用户账号的用户特征;

第四确定单元1002,被配置为执行基于资源特征、用户特征和多个资源类别当前对应的类别特征,确定模型输入特征,每个类别特征是每个资源类别对应的历史行为特征分别融合得到的,历史行为特征是根据历史行为数据确定的;

第五确定单元1003,被配置为执行将模型输入特征输入资源推荐模型,得到待推荐的资源对应的预测推荐参数;

推荐单元1004,被配置为执行基于预测推荐参数,向目标用户账号推荐待推荐的资源。

在一些实施例中,参见图11,装置还包括:

第三获取单元1005,被配置为执行获取配置信息,配置信息包括n个层级的资源类别,其中,多个资源类别为n个层级中第n级的资源类别,n为大于1的正整数;

第四确定单元1002,被配置为执行基于资源特征、用户特征和第k级中的至少一个资源类别对应的类别特征,确定模型输入特征,k为不大于n的正整数。

在本公开实施例中,由于资源推荐模型从大量的行为特征中学习到了用户账号对不同资源类别的资源的兴趣,从而通过该资源推荐模型来确定是否要对目标用户账号推荐待推荐的资源,能够提高资源推荐的准确性。

关于上述实施例中的资源推荐模型的训练装置和资源推荐装置,其中每个单元执行操作的具体方式已经在有关方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图12是根据一示例性实施例示出的一种服务器的结构框图,服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central ProcessingUnits,CPU)1201和一个或一个以上用于存储所述处理器可执行指令的存储器1202,其中,处理器1201被配置为执行该指令,以实现上述实施例中的资源推荐模型的训练方法或者资源推荐方法。当然,该服务器1200还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1200还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,当计算机可读存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述实施例中的资源推荐模型的训练方法或者资源推荐方法。例如,计算机可读存储介质可以是ROM(只读存储器,Read Only Memory)、RAM(随机存取存储器,Random Access Memory)、CD-ROM(只读光盘,Compact Disc Read-Only Memory)、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,当计算机程序被处理器执行时实现上述实施例中的资源推荐模型的训练方法或者资源推荐方法。

在一些实施例中,本公开实施例所涉及的计算机程序可被部署在一个服务器上执行,或者在位于一个地点的多个服务器上执行,又或者,在分布在多个地点且通过通信网络互连的多个服务器上执行,分布在多个地点且通过通信网络互连的多个服务器可以组成区块链系统。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

31页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于多模态的深度兴趣网络推荐方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!