一种数据推荐方法、装置、设备及存储介质

文档序号:1889430 发布日期:2021-11-26 浏览:8次 >En<

阅读说明:本技术 一种数据推荐方法、装置、设备及存储介质 (Data recommendation method, device, equipment and storage medium ) 是由 龚静 张恒 吕有才 詹乐 于 2021-08-31 设计创作,主要内容包括:本发明实施例涉及人工智能领域,公开了一种数据推荐方法、装置、设备及存储介质,该方法包括:获取目标业务场景下用户的画像信息,画像信息包括用户画像和内容画像;从画像信息中提取特征信息,特征信息包括用户特征和内容特征;对用户特征和内容特征进行分类,对分类后的用户特征和内容特征进行扩展得到扩展特征集合;将扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到内容候选集,内容候选集包括多个候选文本内容;利用指定排序算法对多个候选文本内容进行排序,并按照排序后的顺序将多个候选文本内容发送给用户终端,提高了数据推荐的效率和准确率。本发明涉及区块链技术,如可将画像信息写入区块链中,以用于数据取证等场景。(The embodiment of the invention relates to the field of artificial intelligence, and discloses a data recommendation method, a device, equipment and a storage medium, wherein the method comprises the following steps: acquiring portrait information of a user in a target service scene, wherein the portrait information comprises a user portrait and a content portrait; extracting characteristic information from the image information, wherein the characteristic information comprises user characteristics and content characteristics; classifying the user characteristics and the content characteristics, and expanding the classified user characteristics and the content characteristics to obtain an expanded characteristic set; inputting the user characteristics and the content characteristics in the extended characteristic set into a trained recall model to obtain a content candidate set, wherein the content candidate set comprises a plurality of candidate text contents; and the plurality of candidate text contents are sequenced by using a specified sequencing algorithm, and are sent to the user terminal according to the sequenced sequence, so that the efficiency and the accuracy of data recommendation are improved. The present invention relates to blockchain techniques, such as writing image information into blockchains for use in data forensics and other scenarios.)

一种数据推荐方法、装置、设备及存储介质

技术领域

本发明涉及人工智能领域,尤其涉及一种数据推荐方法、装置、设备及存储介质。

背景技术

推荐系统是根据用户的信息需求、兴趣等,将用户感兴趣的信息推荐给用户,目前,主流的推荐系统通常包括索引阶段、召回阶段和排序阶段,其中,召回阶段主要是通过在有限的响应时间内直接从索引阶段得到的内容候选集中选择内容,并将选择的内容发送至排序阶段。然而,这种方式受到巨大候选集和实时性的要求,以及复杂性的限制,推荐处理逻辑难以达到较好的推荐效果。

发明内容

本发明实施例提供了一种数据推荐方法、装置、设备及存储介质,有助于提高得到与用户特征和内容特征对应的内容候选集的效率和准确率,从而提高数据推荐的效率和准确率。

第一方面,本发明实施例提供了一种数据推荐方法,包括:

获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;

从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;

对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;

将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;

利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。

进一步地,所述从所述画像信息中提取特征信息,包括:

对所述画像信息进行分词处理,得到所述画像信息对应的词序列;

通过TF-IDF计算所述词序列中每个词的TF-IDF值,并选取最大的TF-IDF值作为所述画像信息的初始特征信息;

将所述词序列输入LSTM-CRF模型中,并通过所述LSTM-CRF模型的分词映射外部特征层对所述词序列进行特征提取,得到令牌表示信息;

通过LSTM-CRF模型的全连接层对所述初始特征信息和所述令牌表示信息进行合并处理,得到合并特征信息;

将所述合并特征信息输入LSTM-CRF模型的CRF层,得到所述画像信息的特征信息。

进一步地,所述对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合,包括:

将所述用户特征和内容特征输入预训练的BERT模型中,得到所述用户特征和内容特征的类别信息;

根据所述用户特征和内容特征的类别信息,确定与所述用户特征和内容特征的类别信息对应的同义用户特征和同义内容特征;

确定所述用户特征、所述内容特征、所述同义用户特征和所述同义内容特征组成所述扩展特征集合。

进一步地,所述将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型之前,还包括:

将所述扩展特征集合中的各用户特征和内容特征输入预训练的BERT模型,得到所述各用户特征和内容特征的排序分数评估指标;

根据所述各用户特征和内容特征的排序分数评估指标,确定所述排序分数评估指标从大到小的顺序为所述各用户特征和内容特征的排列顺序;

按照所述排列顺序对所述扩展特征集合中的各用户特征和内容特征进行排序。

进一步地,所述将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,包括:

从排序后的所述扩展特征集合中的用户特征和内容特征中提取对应的用户特征向量和内容特征向量;

将所述用户特征向量和内容特征向量输入训练好的召回模型,得到多个候选文本内容,并根据所述多个候选文本内容确定所述内容候选集。

进一步地,所述将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集之前,还包括:

获取样本集,所述样本集包括多个样本画像信息,所述样本画像信息包括样本用户画像和样本内容画像;

提取所述样本集中与样本用户画像对应的样本用户特征以及与样本内容画像对应的样本内容特征;

将所述样本用户特征和所述样本内容特征输入预设的神经网络模型进行训练,得到所述召回模型。

进一步地,所述利用指定排序算法对所述多个候选文本内容进行排序,包括:

利用所述指定排序算法对所述内容候选集中的各个候选文本内容进行打分,得到所述各个候选文本内容的分数;

按照所述各个候选文本内容的分数从高到低的顺序,对所述各个候选文本内容进行排序。

第二方面,本发明实施例提供了一种数据推荐装置,包括:

获取单元,用于获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;

提取单元,用于从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;

扩展单元,用于对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;

召回单元,用于将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;

推送单元,用于利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。

第三方面,本发明实施例提供了一种计算机设备,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述计算机程序,执行上述第一方面的方法。

第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。

本发明实施例可以获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。通过这种方式,有助于提高得到与用户特征和内容特征对应的内容候选集的效率和准确率,从而提高数据推荐的效率和准确率。

附图说明

为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种数据推荐方法的示意流程图;

图2是本发明实施例提供的一种数据推荐装置的示意框图;

图3是本发明实施例提供的一种计算机设备的示意框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供的数据推荐方法可以应用于一种数据推荐装置,在某些实施例中,所述数据推荐装置设置于计算机设备中。在某些实施例中,所述计算机设备包括但不限于智能手机、平板电脑、膝上型电脑等中的一种或者多种。

本发明实施例可以获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。本发明实施例通过这种方式有助于提高得到与用户特征和内容特征对应的内容候选集的效率和准确率,从而提高数据推荐的效率和准确率。

本申请实施例可以基于人工智能技术对相关的数据(如用户的画像信息)进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

下面结合附图1对本发明实施例提供的数据推荐方法进行示意性说明。

请参见图1,图1是本发明实施例提供的一种数据推荐方法的示意流程图,如图1所示,该方法可以由数据推荐装置执行,所述数据推荐装置设置于计算机设备中。具体地,本发明实施例的所述方法包括如下步骤。

S101:获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像。

本发明实施例中,数据推荐装置可以获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像。

在某些实施例中,所述用户画像包括但不限于客户经理画像、客户画像等;在某些实施例中,所述客户经理画像包括客户经理基本信息如个人基本信息、岗位信息、主负责业务;管户及绩效信息如客群信息、产品偏好、绩效排名、展业信息;客户经理行为信息:对案例或产品有意识正向反馈,如点赞、收藏、下载、关注、停留时长、搜索热度、发表正向评论及有意识负向反馈如表达不感兴趣、负向评论、举报等。在某些实施例中,所述客户画像包括客户基本信息如年龄、籍贯、受教育程度、职业、持有产品、风险等级等;客户行为信息如对产品有意识反馈,对客户经理进行正向或者负向评价等。

在某些实施例中,所述画像信息包括但不限于文本、图片、视频等形式的内容。

S102:从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征。

本发明实施例中,数据推荐装置可以从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征。

在一个实施例中,数据推荐装置在从所述画像信息中提取特征信息时,可以根据指定算法从所述画像信息中提取特征信息。在某些实施例中,所述指定算法包括但不限于自然语言处理算法(Natural Language Processing,NLP)、文字识别算法OCR等。

在一个实施例中,如果所述画像信息包括图片或视频,则可以先将所述图片或视频转换为文本,然后从转换的文本中提取特征信息。

在一个实施例中,数据推荐装置在从所述画像信息中提取特征信息时,可以对所述画像信息进行分词处理,得到所述画像信息对应的词序列;通过TF-IDF计算所述词序列中每个词的TF-IDF值,并选取最大的TF-IDF值作为所述画像信息的初始特征信息;将所述词序列输入LSTM-CRF模型中,并通过所述LSTM-CRF模型的分词映射外部特征层对所述词序列进行特征提取,得到令牌表示信息;通过LSTM-CRF模型的全连接层对所述初始特征信息和所述令牌表示信息进行合并处理,得到合并特征信息;将所述合并特征信息输入LSTM-CRF模型的CRF层,得到所述画像信息的特征信息。

S103:对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合。

本发明实施例中,数据推荐装置可以对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合。

在一个实施例中,数据推荐装置在对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合时,可以将所述用户特征和内容特征输入预训练的BERT模型中,得到所述用户特征和内容特征的类别信息;根据所述用户特征和内容特征的类别信息,确定与所述用户特征和内容特征的类别信息对应的同义用户特征和同义内容特征,并确定所述用户特征、所述内容特征、所述同义用户特征和所述同义内容特征组成所述扩展特征集合。通过对用户特征和内容特征进行扩展,有助于提高内容召回的准确率。

在一个实施例中,数据推荐装置在对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合时,还可以采用人工标注的方式对分类后的用户特征和内容特征进行扩展,如人工补充案例所属业务场景、产品对应客群特征等详细的特征信息。通过人工对用户特征和内容特征进行扩展,有助于进一步提高内容召回的准确率。

S104:将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容。

本发明实施例中,数据推荐装置可以将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容。

在一个实施例中,数据推荐装置在将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型之前,可以将所述扩展特征集合中的各用户特征和内容特征输入预训练的BERT模型,得到所述各用户特征和内容特征的排序分数评估指标;根据所述各用户特征和内容特征的排序分数评估指标,确定所述排序分数评估指标从大到小的顺序为所述各用户特征和内容特征的排列顺序;按照所述排列顺序对所述扩展特征集合中的各用户特征和内容特征进行排序。

在一个实施例中,数据推荐装置在将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集时,可以从排序后的所述扩展特征集合中的用户特征和内容特征中提取对应的用户特征向量和内容特征向量;将所述用户特征向量和内容特征向量输入训练好的召回模型,得到多个候选文本内容,并根据所述多个候选文本内容确定所述内容候选集。

在一个实施例中,数据推荐装置在根据所述多个候选文本内容确定所述内容候选集之后,可以计算所述用户特征向量和内容特征向量之间的距离,按照所述距离从小到大的顺序为每个候选文本内容添加索引标识,并将所述索引表示存储于redis缓存中,从而有助于后续在获取到用户终端发送的推荐请求时,根据推荐请求中携带的目标索引标识,快速从redis缓存中查询是否存在于该目标索引标识对应的目标推荐内容,有助于进一步提高推荐效率。在某些实施例中,所述用户特征向量和内容特征向量之间的距离可以通过相似度等计算方式来计算。

在一个实施例中,数据推荐装置在将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集之前,可以获取样本集,所述样本集包括多个样本画像信息,所述样本画像信息包括样本用户画像和样本内容画像;提取所述样本集中与样本用户画像对应的样本用户特征以及与样本内容画像对应的样本内容特征;将所述样本用户特征和所述样本内容特征输入预设的神经网络模型进行训练,得到所述召回模型。

在一个实施例中,在将所述样本用户特征和所述样本内容特征输入预设的神经网络模型进行训练,得到所述召回模型时,可以将样本用户特征与样本内容特征输入指定的神经网络模型,得到损失函数值,并将所述损失函数值与预设阈值进行对比,如果对比结果不满足预设条件,则调整所述指定的神经网络模型的模型参数,将样本用户特征与样本内容特征输入调整模型参数后的神经网络模型中进行重新训练,当得到的损失函数值与预设阈值的对比结果满足预设条件时,确定得到所述召回模型。

S105:利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。

本发明实施例中,数据推荐装置可以利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。

在一个实施例中,数据推荐装置在利用指定排序算法对所述多个候选文本内容进行排序时,可以利用所述指定排序算法对所述内容候选集中的各个候选文本内容进行打分,得到所述各个候选文本内容的分数;按照所述各个候选文本内容的分数从高到低的顺序,对所述各个候选文本内容进行排序。在某些实施例中,所述指定排序算法包括但不限于多目标排序算法。

本发明实施例中,数据推荐装置可以获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。通过这种方式,有助于提高得到与用户特征和内容特征对应的内容候选集的效率和准确率,从而提高数据推荐的效率和准确率。

本发明实施例还提供了一种数据推荐装置,该数据推荐装置用于执行前述任一项所述的方法的单元。具体地,参见图2,图2是本发明实施例提供的一种数据推荐装置的示意框图。本实施例的数据推荐装置包括:获取单元201、提取单元202、扩展单元203、召回单元204以及推送单元205。

获取单元201,用于获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;

提取单元202,用于从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;

扩展单元203,用于对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;

召回单元204,用于将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;

推送单元205,用于利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。

进一步地,所述提取单元202从所述画像信息中提取特征信息时,具体用于:

对所述画像信息进行分词处理,得到所述画像信息对应的词序列;

通过TF-IDF计算所述词序列中每个词的TF-IDF值,并选取最大的TF-IDF值作为所述画像信息的初始特征信息;

将所述词序列输入LSTM-CRF模型中,并通过所述LSTM-CRF模型的分词映射外部特征层对所述词序列进行特征提取,得到令牌表示信息;

通过LSTM-CRF模型的全连接层对所述初始特征信息和所述令牌表示信息进行合并处理,得到合并特征信息;

将所述合并特征信息输入LSTM-CRF模型的CRF层,得到所述画像信息的特征信息。

进一步地,所述扩展单元203对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合时,具体用于:

将所述用户特征和内容特征输入预训练的BERT模型中,得到所述用户特征和内容特征的类别信息;

根据所述用户特征和内容特征的类别信息,确定与所述用户特征和内容特征的类别信息对应的同义用户特征和同义内容特征;

确定所述用户特征、所述内容特征、所述同义用户特征和所述同义内容特征组成所述扩展特征集合。

进一步地,所述召回单元204将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型之前,还用于:

将所述扩展特征集合中的各用户特征和内容特征输入预训练的BERT模型,得到所述各用户特征和内容特征的排序分数评估指标;

根据所述各用户特征和内容特征的排序分数评估指标,确定所述排序分数评估指标从大到小的顺序为所述各用户特征和内容特征的排列顺序;

按照所述排列顺序对所述扩展特征集合中的各用户特征和内容特征进行排序。

进一步地,所述召回单元204将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集时,具体用于:

从排序后的所述扩展特征集合中的用户特征和内容特征中提取对应的用户特征向量和内容特征向量;

将所述用户特征向量和内容特征向量输入训练好的召回模型,得到多个候选文本内容,并根据所述多个候选文本内容确定所述内容候选集。

进一步地,所述召回单元204将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集之前,还用于:

获取样本集,所述样本集包括多个样本画像信息,所述样本画像信息包括样本用户画像和样本内容画像;

提取所述样本集中与样本用户画像对应的样本用户特征以及与样本内容画像对应的样本内容特征;

将所述样本用户特征和所述样本内容特征输入预设的神经网络模型进行训练,得到所述召回模型。

进一步地,所述推送单元205利用指定排序算法对所述多个候选文本内容进行排序时,具体用于:

利用所述指定排序算法对所述内容候选集中的各个候选文本内容进行打分,得到所述各个候选文本内容的分数;

按照所述各个候选文本内容的分数从高到低的顺序,对所述各个候选文本内容进行排序。

本发明实施例中,数据推荐装置可以获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。通过这种方式,有助于提高得到与用户特征和内容特征对应的内容候选集的效率和准确率,从而提高数据推荐的效率和准确率。

参见图3,图3是本发明实施例提供的一种计算机设备的示意框图,在某些实施例中,如图3所示的本实施例中的计算机设备可以包括:一个或多个处理器301;一个或多个输入设备302,一个或多个输出设备303和存储器304。上述处理器301、输入设备302、输出设备303和存储器304通过总线305连接。存储器304用于存储计算机程序,所述计算机程序包括程序,处理器301用于执行存储器304存储的程序。其中,处理器301被配置用于调用所述程序执行:

获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;

从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;

对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;

将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;

利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。

进一步地,所述处理器301从所述画像信息中提取特征信息时,具体用于:

对所述画像信息进行分词处理,得到所述画像信息对应的词序列;

通过TF-IDF计算所述词序列中每个词的TF-IDF值,并选取最大的TF-IDF值作为所述画像信息的初始特征信息;

将所述词序列输入LSTM-CRF模型中,并通过所述LSTM-CRF模型的分词映射外部特征层对所述词序列进行特征提取,得到令牌表示信息;

通过LSTM-CRF模型的全连接层对所述初始特征信息和所述令牌表示信息进行合并处理,得到合并特征信息;

将所述合并特征信息输入LSTM-CRF模型的CRF层,得到所述画像信息的特征信息。

进一步地,所述处理器301对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合时,具体用于:

将所述用户特征和内容特征输入预训练的BERT模型中,得到所述用户特征和内容特征的类别信息;

根据所述用户特征和内容特征的类别信息,确定与所述用户特征和内容特征的类别信息对应的同义用户特征和同义内容特征;

确定所述用户特征、所述内容特征、所述同义用户特征和所述同义内容特征组成所述扩展特征集。

进一步地,所述处理器301将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型之前,还用于:

将所述扩展特征集合中的各用户特征和内容特征输入预训练的BERT模型,得到所述各用户特征和内容特征的排序分数评估指标;

根据所述各用户特征和内容特征的排序分数评估指标,确定所述排序分数评估指标从大到小的顺序为所述各用户特征和内容特征的排列顺序;

按照所述排列顺序对所述扩展特征集合中的各用户特征和内容特征进行排序。

进一步地,所述处理器301将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集时,具体用于:

从排序后的所述扩展特征集合中的用户特征和内容特征中提取对应的用户特征向量和内容特征向量;

将所述用户特征向量和内容特征向量输入训练好的召回模型,得到多个候选文本内容,并根据所述多个候选文本内容确定所述内容候选集。

进一步地,所述处理器301将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集之前,还用于:

获取样本集,所述样本集包括多个样本画像信息,所述样本画像信息包括样本用户画像和样本内容画像;

提取所述样本集中与样本用户画像对应的样本用户特征以及与样本内容画像对应的样本内容特征;

将所述样本用户特征和所述样本内容特征输入预设的神经网络模型进行训练,得到所述召回模型。

进一步地,所述处理器301利用指定排序算法对所述多个候选文本内容进行排序时,具体用于:

利用所述指定排序算法对所述内容候选集中的各个候选文本内容进行打分,得到所述各个候选文本内容的分数;

按照所述各个候选文本内容的分数从高到低的顺序,对所述各个候选文本内容进行排序。

本发明实施例中,计算机设备可以获取目标业务场景下用户的画像信息,所述画像信息包括用户画像和内容画像;从所述画像信息中提取特征信息,所述特征信息包括用户特征和内容特征;对所述用户特征和所述内容特征进行分类,并对分类后的所述用户特征和所述内容特征进行扩展得到扩展特征集合;将所述扩展特征集合中的用户特征和内容特征输入训练好的召回模型,得到与所述用户特征和所述内容特征对应的内容候选集,所述内容候选集包括多个候选文本内容;利用指定排序算法对所述多个候选文本内容进行排序,并按照排序后的顺序将所述多个候选文本内容发送给用户终端。通过这种方式,有助于提高得到与用户特征和内容特征对应的内容候选集的效率和准确率,从而提高数据推荐的效率和准确率。

应当理解,在本发明实施例中,所称处理器301可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备302可以包括触控板、麦克风等,输出设备303可以包括显示器(LCD等)、扬声器等。

该存储器304可以包括只读存储器和随机存取存储器,并向处理器301提供指令和数据。存储器304的一部分还可以包括非易失性随机存取存储器。例如,存储器304还可以存储设备类型的信息。

具体实现中,本发明实施例中所描述的处理器301、输入设备302、输出设备303可执行本发明实施例提供的图1所述的方法实施例中所描述的实现方式,也可执行本发明实施例图2所描述的数据推荐装置的实现方式,在此不再赘述。

本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1所对应实施例中描述的数据推荐方法,也可实现本发明图2所对应实施例的数据推荐装置,在此不再赘述。

所述计算机可读存储介质可以是前述任一实施例所述的数据推荐装置的内部存储单元,例如数据推荐装置的硬盘或内存。所述计算机可读存储介质也可以是所述数据推荐装置的外部存储装置,例如所述数据推荐装置上配备的插接式硬盘,智能存储卡(SmarSMedia Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述数据推荐装置的内部存储单元也包括外部存储装置。所述计算机可读存储介质用于存储所述计算机程序以及所述数据推荐装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

需要强调的是,为进一步保证上述数据的私密和安全性,上述数据还可以存储于一区块链的节点中。其中,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于用户分流的策略推荐方法、装置、设备及介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!