一种视频推荐方法、装置、设备及存储介质

文档序号:1831329 发布日期:2021-11-12 浏览:20次 >En<

阅读说明:本技术 一种视频推荐方法、装置、设备及存储介质 (Video recommendation method, device, equipment and storage medium ) 是由 李雪 于 2021-08-13 设计创作,主要内容包括:本发明实施例提供了一种视频推荐方法、装置、设备及存储介质,当接收到用户输入的视频请求指令时,基于视频请求指令,获取多个待推荐视频;针对每两个待推荐视频,基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度;基于各个第一相似度,从多个待推荐视频中,确定出第一数目个视频,作为目标视频;目标视频中任意两个视频的第一相似度小于预设相似度阈值;向用户推荐目标视频。基于上述处理,目标视频中的任意两个视频的视频内容的相似度较低,目标视频中存在重复的视频的可能性较低,向用户推荐目标视频,可以在一定避免向用户推荐重复的视频的问题,进而,可以减少对客户端中用于显示视频的显示位置的浪费。(The embodiment of the invention provides a video recommendation method, a video recommendation device, video recommendation equipment and a storage medium, wherein when a video request instruction input by a user is received, a plurality of videos to be recommended are obtained based on the video request instruction; for every two videos to be recommended, calculating the similarity of the two videos to be recommended as a first similarity based on the video contents of the two videos to be recommended; determining a first number of videos from a plurality of videos to be recommended as target videos based on the first similarity; the first similarity of any two videos in the target videos is smaller than a preset similarity threshold value; and recommending the target video to the user. Based on the processing, the similarity of the video contents of any two videos in the target video is low, the possibility of repeated videos existing in the target video is low, the target video is recommended to the user, the problem of recommending the repeated videos to the user can be avoided to a certain extent, and further, the waste of display positions for displaying the videos in the client side can be reduced.)

一种视频推荐方法、装置、设备及存储介质

技术领域

本发明涉及互联网技术领域,特别是涉及一种视频推荐方法、装置、设备及存储介质。

背景技术

随着互联网技术的快速发展,客户端为用户提供的功能也越来越多,用户可以通过客户端浏览各种网络资源。例如,当用户需要观看视频时,用户可以向客户端输入搜索关键词。当接收到用户输入的搜索关键词时,客户端可以向服务器发送搜索关键词。然后,服务器可以确定与搜索关键词相关联的视频(可以称为待推荐视频),并向用户推荐待推荐视频。

现有技术中,若待推荐视频中存在标题相同的视频,则在向用户推荐视频时,针对待推荐视频中标题相同的多个视频,可以选择其中一个向用户推荐,以避免推荐重复的视频。

然而,若待推荐视频的标题为网络用户上传该待推荐视频时自定义的标题,可能会导致存在视频的内容相同,而视频的标题不同的多个视频。相应的,基于上述处理,则可能会向用户推荐多个标题不同,而内容相同的视频,即,会向用户推荐重复的视频,造成客户端中用于显示视频的显示位置的浪费。

发明内容

本发明实施例的目的在于提供一种视频推荐方法、装置、设备及存储介质,以实现减少对客户端中用于显示视频的显示位置的浪费。具体技术方案如下:

在本发明实施的第一方面,首先提供了一种视频推荐方法,所述方法包括:

当接收到用户输入的视频请求指令时,基于所述视频请求指令,获取多个待推荐视频;

针对每两个待推荐视频,基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度;

基于各个第一相似度,从所述多个待推荐视频中,确定出第一数目个视频,作为目标视频;其中,所述目标视频中任意两个视频的第一相似度小于预设相似度阈值;

向用户推荐所述目标视频。

可选的,所述视频请求指令中携带有搜索关键词;

所述基于所述视频请求指令,获取多个待推荐视频,包括:

对所述搜索关键词进行分词处理,得到多个关键词,作为待匹配关键词;

从预设的多个视频中,确定视频特征标签与所述多个待匹配关键词存在交集的视频,作为第一备选视频;

基于所述第一备选视频的上传时间,和/或,在第一历史时间段内的点击参数,从所述第一备选视频中选取第二数目个视频,作为第二备选视频;

从所述第二备选视频中选取第三数目个视频,作为待推荐视频。

可选的,所述从所述第二备选视频中选取第三数目个视频,作为待推荐视频,包括:

基于所述第二备选视频的视频特征标签、上传所述第二备选视频的用户的标识、所述第二备选视频在第二历史时间段内的点击参数,以及所述第二备选视频的上传时间,从所述第二备选视频中选取第三数目个视频,作为待推荐视频。

可选的,所述基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度,包括:

基于该两个待推荐视频的视频内容,以及该两个待推荐视频的视频标题,计算该两个待推荐视频的相似度,作为第一相似度。

可选的,所述基于该两个待推荐视频的视频内容,以及该两个待推荐视频的视频标题,计算该两个待推荐视频的相似度,作为第一相似度,包括:

基于预先训练的文本向量化模型,对将该两个待推荐视频的采样视频帧和视频标题进行处理,得到该两个待推荐视频各自的特征向量;

计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

可选的,在所述基于该两个待推荐视频的视频内容,以及该两个待推荐视频的视频标题,计算该两个待推荐视频的相似度,作为第一相似度之前,所述方法还包括:

获取该两个待推荐视频各自的目标关键词;其中,一个待推荐视频的目标关键词包括:第三历史时间段内用户搜索到该待推荐视频时所使用的关键词;

所述基于该两个待推荐视频的视频内容,以及该两个待推荐视频的视频标题,计算该两个待推荐视频的相似度,作为第一相似度,包括:

基于该两个待推荐视频的视频内容、该两个待推荐视频的视频标题、该两个待推荐视频的视频特征标签,以及该两个待推荐视频的目标关键词,计算该两个待推荐视频的相似度,作为第一相似度。

可选的,所述基于该两个待推荐视频的视频内容、该两个待推荐视频的视频标题、该两个待推荐视频的视频特征标签,以及该两个待推荐视频的目标关键词,计算该两个待推荐视频的相似度,作为第一相似度,包括:

基于预先训练的文本向量化模型,对该两个待推荐视频的采样视频帧、视频标题、视频特征标签和目标关键词进行处理,得到该两个待推荐视频各自的特征向量;

计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

可选的,所述基于预先训练的文本向量化模型,对该两个待推荐视频的采样视频帧、视频标题、视频特征标签和目标关键词进行处理,得到该两个待推荐视频各自的特征向量,包括:

针对该两个待推荐视频的每一目标关键词,确定在所述第三历史时间段内用户基于该目标关键词搜索到的视频,作为待处理视频;

生成该目标关键词对应的信息序列;其中,所述信息序列包括:该目标关键词和所述待处理视频各自的视频信息;在所述信息序列中,各个视频信息位于该目标关键词之后,且各个视频信息按照所述第三历史时间段内对应的待处理视频的点击次数从大到小的顺序排列;一个待处理视频的视频信息包括:该待处理视频的视频标识、视频标题、采样视频帧和视频特征标签;

将各目标关键词对应的信息序列,输入至预先训练的文本向量化模型,针对每一待推荐视频的视频信息,得到所述文本向量化模型输出的该待推荐视频的视频信息中的视频标识的特征向量,作为该待推荐视频的特征向量。

在本发明实施的第二方面,还提供了一种视频推荐装置,所述装置包括:

第一获取模块,用于当接收到用户输入的视频请求指令时,基于所述视频请求指令,获取多个待推荐视频;

第一确定模块,用于针对每两个待推荐视频,基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度;

第二确定模块,用于基于各个第一相似度,从所述多个待推荐视频中,确定出第一数目个视频,作为目标视频;其中,所述目标视频中任意两个视频的第一相似度小于预设相似度阈值;

推荐模块,用于向用户推荐所述目标视频。

可选的,所述视频请求指令中携带有搜索关键词;

所述第一获取模块,具体用于对所述搜索关键词进行分词处理,得到多个关键词,作为待匹配关键词;

从预设的多个视频中,确定视频特征标签与所述多个待匹配关键词存在交集的视频,作为第一备选视频;

基于所述第一备选视频的上传时间,和/或,在第一历史时间段内的点击参数,从所述第一备选视频中选取第二数目个视频,作为第二备选视频;

从所述第二备选视频中选取第三数目个视频,作为待推荐视频。

可选的,所述第一获取模块,具体用于基于所述第二备选视频的视频特征标签、上传所述第二备选视频的用户的标识、所述第二备选视频在第二历史时间段内的点击参数,以及所述第二备选视频的上传时间,从所述第二备选视频中选取第三数目个视频,作为待推荐视频。

可选的,所述第一确定模块,具体用于基于该两个待推荐视频的视频内容,以及该两个待推荐视频的视频标题,计算该两个待推荐视频的相似度,作为第一相似度。

可选的,所述第一确定模块,具体用于基于预先训练的文本向量化模型,对将该两个待推荐视频的采样视频帧和视频标题进行处理,得到该两个待推荐视频各自的特征向量;

计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

可选的,所述装置还包括:

第二获取模块,用于获取该两个待推荐视频各自的目标关键词;其中,一个待推荐视频的目标关键词包括:第三历史时间段内用户搜索到该待推荐视频时所使用的关键词;

所述第一确定模块,具体用于基于该两个待推荐视频的视频内容、该两个待推荐视频的视频标题、该两个待推荐视频的视频特征标签,以及该两个待推荐视频的目标关键词,计算该两个待推荐视频的相似度,作为第一相似度。

可选的,所述第一确定模块,具体用于基于预先训练的文本向量化模型,对该两个待推荐视频的采样视频帧、视频标题、视频特征标签和目标关键词进行处理,得到该两个待推荐视频各自的特征向量;

计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

可选的,第一确定模块,具体用于针对该两个待推荐视频的每一目标关键词,确定在所述第三历史时间段内用户基于该目标关键词搜索到的视频,作为待处理视频;

生成该目标关键词对应的信息序列;其中,所述信息序列包括:该目标关键词和所述待处理视频各自的视频信息;在所述信息序列中,各个视频信息位于该目标关键词之后,且各个视频信息按照所述第三历史时间段内对应的待处理视频的点击次数从大到小的顺序排列;一个待处理视频的视频信息包括:该待处理视频的视频标识、视频标题、采样视频帧和视频特征标签;

将各目标关键词对应的信息序列,输入至预先训练的文本向量化模型,针对每一待推荐视频的视频信息,得到所述文本向量化模型输出的该待推荐视频的视频信息中的视频标识的特征向量,作为该待推荐视频的特征向量。

在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述任一所述的视频推荐方法步骤。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的视频推荐方法。

在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的视频推荐方法。

本发明实施例提供的一种视频推荐方法,当接收到用户输入的视频请求指令时,基于视频请求指令,获取多个待推荐视频;针对每两个待推荐视频,基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度;基于各个第一相似度,从多个待推荐视频中,确定出第一数目个视频,作为目标视频;目标视频中任意两个视频的第一相似度小于预设相似度阈值;向用户推荐目标视频。

基于上述处理,目标视频中任意两个视频的第一相似度小于预设相似度阈值,由于第一相似度可以表示待推荐视频的视频内容的相似度,则目标视频中的任意两个视频的视频内容的相似度较低,则目标视频中存在重复的视频的可能性较低,向用户推荐目标视频,可以在一定避免向用户推荐重复的视频的问题,进而,可以减少对客户端中用于显示视频的显示位置的浪费。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例中提供的一种视频推荐方法的流程图;

图2为本发明实施例中提供的另一种视频推荐方法的流程图;

图3为本发明实施例中提供的另一种视频推荐方法的流程图;

图4为本发明实施例中提供的另一种视频推荐方法的流程图;

图5为本发明实施例中提供的另一种视频推荐方法的流程图;

图6为本发明实施例中提供的另一种视频推荐方法的流程图;

图7为本发明实施例中提供的一种视频推荐装置的结构图;

图8为本发明实施例中提供的一种电子设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

参见图1,图1为本发明实施例中提供的一种视频推荐方法的流程图,该视频推荐方法应用于电子设备,电子设备可以为客户端,或者电子设备也可以为服务器,电子设备用于向用户推荐视频。

该方法可以包括以下步骤:

S101:当接收到用户输入的视频请求指令时,基于视频请求指令,获取多个待推荐视频。

S102:针对每两个待推荐视频,基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度。

S103:基于各个第一相似度,从多个待推荐视频中,确定出第一数目个视频,作为目标视频。

其中,目标视频中任意两个视频的第一相似度小于预设相似度阈值。

S104:向用户推荐目标视频。

基于本发明实施例提供视频推荐方法,目标视频中任意两个视频的第一相似度小于预设相似度阈值,由于第一相似度可以表示待推荐视频的视频内容的相似度,则目标视频中的任意两个视频的视频内容的相似度较低,则目标视频中存在重复的视频的可能性较低,向用户推荐目标视频,可以在一定避免向用户推荐重复的视频的问题,进而,可以减少对客户端中用于显示视频的显示位置的浪费。

在步骤S101中,电子设备可以为手机、电脑等智能终端,或者,也可以为上述智能终端中安装的视频应用程序,电子设备可以接收用户输入的视频请求指令。或者,电子设备也可以为服务器,相应的,客户端可以向电子设备发送用户输入的视频请求指令。

一种实现方式中,当用户需要观看视频时,用户可以向电子设备输入视频请求指令。例如,电子设备可以设置有视频推荐页面,当用户刷新该视频推荐页面时,电子设备可以确定接收到用户输入的视频请求指令。然后,电子设备可以基于视频请求指令,获取多个待推荐视频。

另一种实现方式中,电子设备的显示界面中可以设置有搜索框,进而,当用户需要观看视频时,用户可以在搜索框中输入搜索关键词,以搜索视频。相应的,电子设备接收到搜索关键词时,可以确定接收到视频请求指令。

在本发明的一个实施例中,视频请求指令中携带有搜索关键词。相应的,在图1的基础上,参见图2,步骤S101可以包括以下步骤:

S1011:当接收到用户输入的视频请求指令时,对搜索关键词进行分词处理,得到多个关键词,作为待匹配关键词。

S1012:从预设的多个视频中,确定视频特征标签与多个待匹配关键词存在交集的视频,作为第一备选视频。

S1013:基于第一备选视频的上传时间,和/或,在第一历史时间段内的点击参数,从第一备选视频中选取第二数目个视频,作为第二备选视频。

S1014:从第二备选视频中选取第三数目个视频,作为待推荐视频。

预设的多个视频为数据库中所有的视频,数据库中的视频为技术人员根据当前能够提供的视频确定的。例如,预设的视频可以为当前已上线的所有视频,或者,也可以为用户上传的所有视频。

一个视频的视频特征标签可以包括:表示该视频的视频类型的特征标签,表示该视频的视频主题的特征标签,以及上传该视频的用户的标识等。

当用户需要观看视频时,用户可以向电子设备输入搜索关键词。当接收到用户输入的搜索关键词时,电子设备可以基于预设算法,对接收到的搜索关键词进行分词处理,得到多个关键词,作为待匹配关键词。其中,预设算法可以为正向最大匹配法,或者预设算法也可以为反向最大匹配法,或者预设算法也可以为最短路径分词法等,但并不限于此。

进而,电子设备可以基于待匹配关键词,从预设的多个视频中,获取多个待推荐视频。

一种实现方式中,针对预设的每一视频,电子设备可以确定该视频的视频特征标签。然后,电子设备可以判断该视频的视频特征标签是否与待匹配关键词存在交集,如果该视频的视频特征标签与待匹配关键词存在交集,也就是该视频的至少一个视频特征标签与待匹配关键词相同,则可以确定该视频为待推荐视频。

另一种实现方式中,电子设备可以确定视频特征标签与多个待匹配关键词存在交集的视频,作为第一备选视频。

然后,电子设备可以按照各第一备选视频的上传时间,从第一备选视频中选取上传时间距离当前时刻最近的第二数目个视频,作为第二备选视频。

或者,电子设备可以按照各第一备选视频的在第一历史时间段内的点击参数从大到小的顺序,选取前第二数目个视频,作为第二备选视频。一个视频的点击参数可以为该视频的点击率,或者,该视频的点击量,或者该视频的点击率和该视频的点击量的和值。

或者,针对每一第一备选视频,电子设备可以计算该第一备选视频的上传时间与该第一备选视频在第一历史时间段内的点击参数的加权和。然后,电子设备可以按照对应的加权和从大到小的顺序,从各第一备选视频中选取前第二数目个视频,作为第二备选视频。

第二数目可以由技术人员根据经验设置,例如,第二数目可以为1000,或者第二数目也可以为1500,但并不限于此。第一历史时间段可以由技术人员根据经验设置,例如,第一历史时间段可以为当前时刻之前的一天,或者也可以为当前时刻之前的三天,但并不限于此。

然后,电子设备可以按照以下两种方式,从第二备选视频中,确定第三数目个待推荐视频。其中,第三数目可以由技术人员根据经验设置,第三数目可以与第二数目相同,第三数目也可以与第二数目不同。

方式1:电子设备可以直接将第二备选视频,作为待推荐视频。此时第三数目与第二数目相同。

如果直接将第二备选视频作为待推荐视频,待推荐视频的数目较多,后续,电子设备确定每两个待推荐视频的第一相似度的计算量较大。

因此,为了减少电子设备确定每两个待推荐视频的第一相似度的计算量,提高视频推荐效率。在方式2中,上述步骤S1014可以包括以下步骤:基于第二备选视频的视频特征标签、上传第二备选视频的用户的标识、第二备选视频在第二历史时间段内的点击参数,以及第二备选视频的上传时间,从第二备选视频中选取第三数目个视频,作为待推荐视频。

第二历史时间段可以由技术人员根据经验设置,第二历史时间段可以与第一历史时间段相同,或者第二历史时间段也可以与第一历史时间段不同。

一种实现方式中,电子设备可以将第二备选视频的视频特征标签、上传第二备选视频的用户的标识、第二备选视频在第二历史时间段内的点击参数,以及第二备选视频的上传时间输入至预先训练的评分预测模型,得到评分预测模型输出的第二备选视频的评分。评分预测模型可以为DNN(Deep Neural Network,深度神经网络)模型,或者也可以为NCF(Neural Collaborative Filtering,神经协同过滤)模型。

然后,电子设备可以按照对应的评分从大到小的顺序,从第二备选视频中选取前第三数目个视频,作为待推荐视频。此时第三数目与第二数目不同,例如,第三数目可以为第二数目的10%,或者第三数目也可以为第二数目的15%,但并不限于此。

评分预测模型为基于第一预设训练样本进行训练得到的,第一预设训练样本可以包括:第一样本视频的视频特征标签、上传第一样本视频的用户的标识、第一样本视频在第四历史时间段内的点击参数、第一样本视频的上传时间,以及第一样本视频的评分。第一样本视频的评分可以根据用户是否观看第一样本视频确定,例如,如果用户观看了第一样本视频,则第一样本视频的评分为1,如果用户未观看第一样本视频,则第一样本视频的评分为0。

电子设备可以将一样本视频的视频特征标签、上传第一样本视频的用户的标识、第一样本视频在第四历史时间段内的点击参数、第一样本视频的上传时间,作为初始结构的评分预测模型的输入数据。将第一样本视频的评分作为初始结构的评分预测模型的输出数据,对初始结构的评分预测模型的模型参数进行调整,当达到预设收敛条件时,得到训练好的评分预测模型。

基于上述处理,可见减少确定出的待推荐视频的数目,进而可以减少电子设备确定每两个待推荐视频的第一相似度的计算量,提高视频推荐效率。

在步骤S102中,电子设备可以按照以下方式,计算每两个待推荐视频的第一相似度。

方式一:针对每一待推荐视频,电子设备可以从该待推荐视频中提取视频帧,得到该待推荐视频的采样视频帧。例如,电子设备可以提取该待推荐视频的第一帧、中间一帧和最后一帧,作为该待推荐视频的采样视频帧,或者电子设备可以按照预设采样间隔,从该待推荐视频中提取视频帧,作为该待推荐视频的采样视频帧。

然后,针对该待推荐视频的每一采样视频帧,获取该采样视频帧的各像素点的像素值,根据该采样视频帧的各像素点的像素值生成该采样视频帧的特征矩阵。例如,RGB(红绿蓝)图像的像素点的像素值属于0-255,可以按照16个像素值为一个子范围,将0-255分为16个子范围。针对该采样视频帧的每一像素点,如果该像素点的像素值属于子范围0-16,确定该像素点对应的特征元素为0,如果该像素点的像素值属于子范围17-32,确定该像素点对应的特征元素为1,如果该像素点的像素值属于子范围33-48,确定该像素点对应的特征元素为2,以此类推,可以得到各像素点对应的特征元素,作为该采样视频帧的特征矩阵。

进而,针对每两个待推荐视频,电子设备可以计算该两个待推荐的每一采样视频帧的特征矩阵的汉明距离,并计算各采样视频帧的汉明距离的均值,作为该两个待推荐视频的第一相似度。

方式二:在本发明的一个实施例中,在图1的基础上,参见图3,步骤S102可以包括以下步骤:

S1021:基于该两个待推荐视频的视频内容,以及该两个待推荐视频的视频标题,计算该两个待推荐视频的相似度,作为第一相似度。

一种实现方式中,针对该两个待推荐视频中的每一待推荐视频,电子设备可以生成该待推荐视频的视频内容的内容特征向量,以及该待推荐视频的视频标题的标题特征向量。电子设备生成内容特征向量和标题特征向量的方式,可以参见后续实施例的介绍。

然后,电子设备可以分别计算该两个待推荐视频的内容特征向量的相似度(可以称为第二相似度),并分别计算该两个待推荐视频的标题特征向量的相似度(可以称为第三相似度)。进而,计算该两个待推荐视频的第二相似度与第三相似度的加权和,得到该两个待推荐视频的第一相似度。

另一种实现方式中,在图3的基础上,参见图4,步骤S1021可以包括以下步骤:

S10211:基于预先训练的文本向量化模型,对将该两个待推荐视频的采样视频帧和视频标题进行处理,得到该两个待推荐视频各自的特征向量。

S10212:计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

其中,文本向量化模型可以为word 2vec(word to vector,词到向量)模型。

一种实现方式中,针对每一待推荐视频,电子设备可以基于预先训练的文本向量化模型,对将该两个待推荐视频的采样视频帧和视频标题进行处理,得到该两个待推荐视频各自的特征向量。电子设备确定待推荐视频的特征向量的方式,可以参见后续实施例的介绍。

进而,电子设备可以计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。例如,电子设备可以计算该两个待推荐视频各自的特征向量之间的欧氏距离,或者电子设备可以计算该两个待推荐视频各自的特征向量之间的余弦相似度。

方式三:在本发明的一个实施例中,在图3的基础上,参见图5,在步骤S1021之前,该方法还可以包括以下步骤:

S1022:获取该两个待推荐视频各自的目标关键词。

其中,一个待推荐视频的目标关键词包括:第三历史时间段内用户搜索到该待推荐视频时所使用的关键词。

相应的,步骤S1021可以包括以下步骤:

S10213:基于该两个待推荐视频的视频内容、该两个待推荐视频的视频标题、该两个待推荐视频的视频特征标签,以及该两个待推荐视频的目标关键词,计算该两个待推荐视频的相似度,作为第一相似度。

第三历史时间段可以由技术人员根据经验设置,第三历史时间段可以与第一历史时间段、第二历史时间段相同,也可以与第一历史时间段、第二历史时间段不同。

在本发明的一个实施例中,步骤S10213可以包括以下步骤:

步骤1,基于预先训练的文本向量化模型,对该两个待推荐视频的采样视频帧、视频标题、视频特征标签和目标关键词进行处理,得到该两个待推荐视频各自的特征向量;

步骤2,计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

在本发明的一个实施例中,步骤1可以包括以下步骤:

步骤11,针对该两个待推荐视频的每一目标关键词,确定在第三历史时间段内用户基于该目标关键词搜索到的视频,作为待处理视频。

步骤12,生成该目标关键词对应的信息序列。

其中,信息序列包括:该目标关键词和待处理视频各自的视频信息。在信息序列中,各个视频信息位于该目标关键词之后,且各个视频信息按照第三历史时间段内对应的待处理视频的点击次数从大到小的顺序排列。一个待处理视频的视频信息包括:该待处理视频的视频标识、视频标题、采样视频帧和视频特征标签。

步骤13,将各目标关键词对应的信息序列,输入至预先训练的文本向量化模型,针对每一待推荐视频的视频信息,得到文本向量化模型输出的该待推荐视频的视频信息中的视频标识的特征向量,作为该待推荐视频的特征向量。

一个目标关键词对应一个信息序列,且该信息序列包含了该目标关键词,以及第三历史时间段内用户基于该目标关键词搜索到的待处理视频的视频信息。

由于待处理视频为在第三历史时间段内用户基于目标关键词搜索到的视频,并且目标关键词为第三历史时间段内用户搜索到待推荐视频时所使用的关键词。而基于目标关键词,用户可能会搜索到除待推荐视频以外的其他视频,也就是说,待推荐视频属于用户基于目标关键词搜索到的视频,即,属于待处理视频。

因此,输入至文本向量化模型的各个目标关键词对应的信息序列中,均包含该两个待推荐视频的视频信息,相应的,基于文本向量化模型,也就能得到该两个待推荐视频的视频信息(包括视频标识、视频标题、采样视频帧和视频特征标签)的特征向量,也就能得到该两个待推荐视频的视频标识的特征向量,作为该两个待推荐视频各自的特征向量。

一个视频的视频标识可以为技术人员设置的用于表示该视频的唯一性的编号。

文本向量化模型为基于第二预设训练样本进行训练得到的。第二预设训练样本可以包括:样本关键词、用户基于样本关键词搜索到的视频(可以称为第二样本视频)的视频信息,以及基于onehot(独热)编码算法确定出的,第二样本视频的视频信息中的视频标识、视频标题、采样视频帧和视频特征标签各自的特征向量。

电子设备可以确定包含样本关键词和第二样本视频的视频信息的信息序列。然后,电子设备可以将样本关键词对应的信息序列作为初始结构的文本向量化模型的输入数据,将第二样本视频的视频信息中的视频标识、视频标题、采样视频帧和视频特征标签各自的特征向量作为初始结构的文本向量化模型的输出数据,对初始结构的文本向量化模型的模型参数进行调整,当达到预设收敛条件时,得到训练好的文本向量化模型。

一种实现方式中,电子设备可以计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。例如,电子设备可以计算该两个待推荐视频各自的特征向量之间的欧氏距离,或者电子设备可以计算该两个待推荐视频各自的特征向量之间的余弦相似度。

示例性的,电子设备可以基于如下公式,计算该两个待推荐视频各自的特征向量之间的欧氏距离,作为第一相似度。

d表示该两个待推荐视频各自的特征向量之间的欧氏距离,N表示该两个待推荐视频各自的特征向量中元素的数目,x1o表示该两个待推荐视频中的一个待推荐视频的特征向量中的第i个元素,x2o表示该两个待推荐视频中的另一个待推荐视频的特征向量中的第i个元素。

另一种实现方式中,针对每两个待推荐视频,电子设备可以分别计算该两个待推荐视频的视频标识的特征向量的相似度,该两个待推荐视频的视频标题的特征向量的相似度,该两个待推荐视频的采样视频帧的特征向量的相似度,以及该两个待推荐视频的视频特征标签的特征向量的相似度。然后,电子设备可以计算各相似度的加权和,作为该两个待推荐视频的第一相似度。

另外,为了提高视频推荐效率,电子设备可以获取第三历史时间段内用户继续搜索所使用的目标关键词和搜索到的视频,并基于目标关键词和各视频的视频信息计算各视频的特征向量。然后,电子设备可以将计算得到的各视频的特征向量存储在本地。后续,当基于接收到的视频请求指令,确定待推荐视频之后,电子设备可以直接获取本地存储的待推荐视频的特征向量,并计算每两个待推荐视频的特征向量的第一相似度。进而,电子设备可以基于各待推荐视频的第一相似度,向用户推荐视频,相对于确定待推荐视频之后,再计算待推荐视频的特征向量,可以提高视频推荐效率,减少用户等待时间,可以提高用户体验。

在步骤S103中,第一数目可以由技术人员根据经验设置,例如,第一数目可以为客户端的显示界面能够显示的视频数目。预设相似度阈值可以由技术人员根据经验设置,例如,预设相似度阈值可以为0.3,或者预设相似度阈值也可以为0.2,但并不限于此。

电子设备可以获取待推荐视频的评分。然后,电子设备可以按照评分从大到小的顺序,从待推荐视频中选择第一相似度小于预设相似度阈值的前第一数目个待推荐视频,作为目标视频。

对于第一相似度较小的多个待推荐视频,该多个视频的封面图片可能相同,如果将该多个待推荐视频确定为目标视频,向用户推荐该多个待推荐视频。用户在浏览视频时,可能会认为该多个待推荐视频为内容相同的视频,而仅浏览其中一个待推荐视频,导致用户体验较低,且会造成客户端中用于显示视频的显示位置的浪费。

一种实现方式中,电子设备可以按照评分从大到小的顺序,从待推荐视频中选择第一相似度小于预设相似度阈值的前第四数目个待推荐视频,作为第三备选视频。第四数目大于第一数目。针对每一第三备选视频,电子设备可以获取该第三备选视频的封面图片。

然后,电子设备可以按照评分从大到小的顺序,从第三备选视频中选取一个视频,作为待比较视频,并判断第三备选视频中是否存在与待比较视频封面图片相同的视频。如果不存在与待比较视频封面图片相同的视频,则电子设备可以确定待比较视频为目标视频,并按照评分从大到小的顺序,从第三备选视频中选取下一个视频,作为待比较视频,继续判断第三备选视频中是否存在与待比较视频封面图片相同的视频。

如果存在与待比较视频封面图片相同的视频,则电子设备可以确定待比较视频为目标视频,并从第三备选视频中移除与待比较视频封面图片相同的视频。然后,电子设备可以按照评分从大到小的顺序,从第三备选视频中选取下一个视频,作为待比较视频,继续判断第三备选视频中是否存在与待比较视频的封面图片相同的视频,以此类推,直至确定出第一数目个目标视频。

基于上述处理,可以避免向用户推荐封面图片相同的视频,可以减少对客户端中用于显示视频的显示位置的浪费,并提高用户体验。

在步骤S104中,一种实现方式中,如果电子设备为客户端,则电子设备可以直接在显示界面中显示目标视频,以供用户观看。

另一种实现方式中,如果电子设备为服务器,电子设备可以向客户端发送目标视频,以使客户端在显示界面中显示目标视频,以供用户观看。

参见图6,图6为本发明实施例中提供的另一种视频推荐方法的流程图。

在Offline(线下)阶段,电子设备可以基于获取到的第三历史时间段内用户进行搜索所使用的目标关键词和搜索到的视频,进行image embedding(词嵌入)处理,即电子设备可以基于目标关键词和各视频的视频信息,计算各视频的特征向量。电子设备可以对各视频进行图文相似度计算,即电子设备可以获取本地存储的各视频的特征向量,并计算该两个视频的特征向量的相似度,并存储于本地。

在Online(线上)阶段,电子设备在接收到用户输入的搜索关键词时,电子设备可以从corpus(数据库)中召回视频,即电子设备可以从预设的多个视频中,确定出视频特征标签与待匹配关键词存在交集的视频,得到第一备选视频。针对每一第一备选视频,电子设备可以计算该第一备选视频的上传时间与该第一备选视频在第一历史时间段内的点击参数的加权和。

电子设备可以对第一备选视频进行粗排,得到第二备选视频。即电子设备可以按照对应的加权和从大到小的顺序,从各第一备选视频中选取前第二数目个视频,作为第二备选视频。

电子设备可以对第二备选视频进行精排,得到待推荐视频,即电子设备可以基于第二备选视频的视频特征标签、上传第二备选视频的用户的标识、第二备选视频在第二历史时间段内的点击参数,以及第二备选视频的上传时间,从第二备选视频中选取第三数目个视频,作为待推荐视频。

然后,电子设备可以对待推荐视频进行图文多样性控制,即电子设备可以获取本地存储的各待推荐视频之间的第一相似度。电子设备可以从多个待推荐视频中,确定出任意两个视频的第一相似度小于预设相似度阈值(即θ)的第一数目个目标视频。

例如,待推荐视频可以包括11个视频,该11个视频分别为:item1、item2、item3……item10,item11。针对每一待推荐视频,如果该待推荐视频与其他任一待推荐视频的第一相似度均小于预设相似度阈值(即θ),电子设备可以确定该待推荐视频为目标视频。例如,item3与item1的第一相似度小于预设相似度阈值,即sim(1,3)<θ,item3与item2的第一相似度小于预设相似度阈值,即sim(2,3)<θ,以此类推,直至item3与item11的第一相似度小于预设相似度阈值,即sim(11,3)<θ,电子设备可以确定item3为目标视频。

进而,电子设备可以向用户推荐目标视频。例如,电子设备可以按照Twiddler(预设展示规则)显示目标视频。

基于本发明实施例提供的视频推荐方法,目标视频中任意两个视频的第一相似度小于预设相似度阈值,由于第一相似度可以表示待推荐视频的视频内容的相似度,则目标视频中的任意两个视频的视频内容的相似度较低,则目标视频中存在重复的视频的可能性较低,向用户推荐目标视频,可以在一定避免向用户推荐重复的视频的问题,进而,可以减少对客户端中用于显示视频的显示位置的浪费。

与图1的方法实施例相对应,参见图7,图7为本发明实施例中提供的一种视频推荐装置的结构图,所述装置包括:

第一获取模块701,用于当接收到用户输入的视频请求指令时,基于所述视频请求指令,获取多个待推荐视频;

第一确定模块702,用于针对每两个待推荐视频,基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度;

第二确定模块703,用于基于各个第一相似度,从所述多个待推荐视频中,确定出第一数目个视频,作为目标视频;其中,所述目标视频中任意两个视频的第一相似度小于预设相似度阈值;

推荐模块704,用于向用户推荐所述目标视频。

可选的,所述视频请求指令中携带有搜索关键词;

所述第一获取模块701,具体用于对所述搜索关键词进行分词处理,得到多个关键词,作为待匹配关键词;

从预设的多个视频中,确定视频特征标签与所述多个待匹配关键词存在交集的视频,作为第一备选视频;

基于所述第一备选视频的上传时间,和/或,在第一历史时间段内的点击参数,从所述第一备选视频中选取第二数目个视频,作为第二备选视频;

从所述第二备选视频中选取第三数目个视频,作为待推荐视频。

可选的,所述第一获取模块701,具体用于基于所述第二备选视频的视频特征标签、上传所述第二备选视频的用户的标识、所述第二备选视频在第二历史时间段内的点击参数,以及所述第二备选视频的上传时间,从所述第二备选视频中选取第三数目个视频,作为待推荐视频。

可选的,所述第一确定模块702,具体用于基于该两个待推荐视频的视频内容,以及该两个待推荐视频的视频标题,计算该两个待推荐视频的相似度,作为第一相似度。

可选的,所述第一确定模块702,具体用于基于预先训练的文本向量化模型,对将该两个待推荐视频的采样视频帧和视频标题进行处理,得到该两个待推荐视频各自的特征向量;

计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

可选的,所述装置还包括:

第二获取模块,用于获取该两个待推荐视频各自的目标关键词;其中,一个待推荐视频的目标关键词包括:第三历史时间段内用户搜索到该待推荐视频时所使用的关键词;

所述第一确定模块702,具体用于基于该两个待推荐视频的视频内容、该两个待推荐视频的视频标题、该两个待推荐视频的视频特征标签,以及该两个待推荐视频的目标关键词,计算该两个待推荐视频的相似度,作为第一相似度。

可选的,所述第一确定模块可选的,具体用于基于预先训练的文本向量化模型,对该两个待推荐视频的采样视频帧、视频标题、视频特征标签和目标关键词进行处理,得到该两个待推荐视频各自的特征向量;

计算该两个待推荐视频各自的特征向量之间的相似度,作为第一相似度。

可选的,第一确定模块702,具体用于针对该两个待推荐视频的每一目标关键词,确定在所述第三历史时间段内用户基于该目标关键词搜索到的视频,作为待处理视频;

生成该目标关键词对应的信息序列;其中,所述信息序列包括:该目标关键词和所述待处理视频各自的视频信息;在所述信息序列中,各个视频信息位于该目标关键词之后,且各个视频信息按照所述第三历史时间段内对应的待处理视频的点击次数从大到小的顺序排列;一个待处理视频的视频信息包括:该待处理视频的视频标识、视频标题、采样视频帧和视频特征标签;

将各目标关键词对应的信息序列,输入至预先训练的文本向量化模型,针对每一待推荐视频的视频信息,得到所述文本向量化模型输出的该待推荐视频的视频信息中的视频标识的特征向量,作为该待推荐视频的特征向量。

基于本发明实施例提供的视频推荐装置,目标视频中任意两个视频的第一相似度小于预设相似度阈值,由于第一相似度可以表示待推荐视频的视频内容的相似度,则目标视频中的任意两个视频的视频内容的相似度较低,则目标视频中存在重复的视频的可能性较低,向用户推荐目标视频,可以在一定避免向用户推荐重复的视频的问题,进而,可以减少对客户端中用于显示视频的显示位置的浪费。

本发明实施例还提供了一种电子设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信;

存储器803,用于存放计算机程序;

处理器801,用于执行存储器803上所存放的程序时,实现如下步骤:

当接收到用户输入的视频请求指令时,基于所述视频请求指令,获取多个待推荐视频;

针对每两个待推荐视频,基于该两个待推荐视频的视频内容,计算该两个待推荐视频的相似度,作为第一相似度;

基于各个第一相似度,从所述多个待推荐视频中,确定出第一数目个视频,作为目标视频;其中,所述目标视频中任意两个视频的第一相似度小于预设相似度阈值;

向用户推荐所述目标视频。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的视频推荐方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频推荐方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

21页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于输出信息的方法和装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!