一种多媒体信息推荐的方法、装置、设备和介质

文档序号:1737489 发布日期:2019-12-20 浏览:23次 >En<

阅读说明:本技术 一种多媒体信息推荐的方法、装置、设备和介质 (Method, device, equipment and medium for recommending multimedia information ) 是由 伍楚涵 白肇强 白雪峰 程文文 于 2019-09-11 设计创作,主要内容包括:本申请属于计算机技术领域,主要涉及人工智能中的深度学习技术,公开了一种多媒体信息推荐的方法、装置、设备和介质,本申请公开的一种多媒体信息推荐的方法包括,按照预设筛选条件,对获取的各多媒体信息进行筛选,获取筛选的候选多媒体信息的多媒体信息标签,通过对应多媒体信息标签设置的反馈预估模型以及用户画像,预估待推荐用户对候选多媒体信息的反馈结果。只有反馈结果表征非负反馈时,才向待推荐用户推荐候选多媒体信息,否则,过滤候选多媒体信息。这样,对多媒体信息进行初步筛选后,再根据预估的用户对多媒体信息的反馈结果,对推荐的多媒体信息进行再次筛选,实现了对多媒体信息推荐的优化,减少了用户的负反馈。(The method for recommending the multimedia information comprises the steps of screening the acquired multimedia information according to preset screening conditions, acquiring multimedia information labels of screened candidate multimedia information, and predicting a feedback result of a user to be recommended on the candidate multimedia information through a feedback prediction model and a user portrait which are arranged corresponding to the multimedia information labels. And recommending the candidate multimedia information to the user to be recommended only when the feedback result represents non-negative feedback, and otherwise, filtering the candidate multimedia information. Therefore, after the multimedia information is preliminarily screened, the recommended multimedia information is screened again according to the estimated feedback result of the user to the multimedia information, the optimization of the multimedia information recommendation is realized, and the negative feedback of the user is reduced.)

一种多媒体信息推荐的方法、装置、设备和介质

技术领域

本申请涉及计算机技术领域,尤其涉及一种多媒体信息推荐的方法、装置、设备和介质。

背景技术

随着互联网技术的发展,多媒体信息的数量也在不断的增长。为提高用户体验,多媒体信息应用通常会根据用户当前查看的多媒体信息向用户推荐相关的多媒体信息,并在收到用户对推荐多媒体信息的负反馈后,针对该用户屏蔽该多媒体信息来源。

例如,视频应用根据用户当前观看的视频,获取相关视频,并将该相关视频推荐给用户,以及当接收到用户的负面评价时,针对该用户屏蔽该***。

但是,现有技术中,确定推荐多媒体信息时,仅根据用户当前查看的多媒体信息等特定条件,对各多媒体信息进行简单筛选,多媒体信息推荐的精准度较低,这会导致用户的负面评价,以及多媒体信息应用在接收到用户的负反馈后,无法根据收到的负反馈对多媒体信息推荐进行精准的调整,仍然可能会向用户推荐类似的用户不感兴趣的多媒体信息。由此,如何对多媒体信息推荐进行优化,减少用户负反馈,是一个亟待解决的问题。

发明内容

本申请实施例提供一种多媒体信息推荐的方法、装置、设备和介质,用以在向用户推荐多媒体信息时,对多媒体信息推荐进行优化,提高多媒体信息推荐的精准度。

一方面,提供一种多媒体信息推荐的方法,包括:

按照预设筛选条件,对获取的各多媒体信息进行筛选,获得待推荐的候选多媒体信息;

获取待推荐的候选多媒体信息的多媒体信息标签;

获取对应多媒体信息标签设置的反馈预估模型,以及待推荐用户的用户画像,一个多媒体信息标签对应的反馈预估模型用于根据用户的用户画像预测该用户对该多媒体信息标签对应的多媒体信息的反馈;

根据反馈预估模型和用户画像,预估待推荐用户对候选多媒体信息的反馈结果;

当反馈结果表征负反馈时,不向待推荐用户推荐候选多媒体信息;

当反馈结果表征非负反馈时,向待推荐用户推荐候选多媒体信息。

一方面,提供一种多媒体信息推荐的装置,包括:

筛选单元,用于按照预设筛选条件,对获取的各多媒体信息进行筛选,获得待推荐的候选多媒体信息;

第一获取单元,用于获取待推荐的候选多媒体信息的多媒体信息标签;

第二获取单元,用于获取对应多媒体信息标签设置的反馈预估模型,以及待推荐用户的用户画像,一个多媒体信息标签对应的反馈预估模型用于根据用户的用户画像预测该用户对该多媒体信息标签对应的多媒体信息的反馈;

预估单元,用于根据反馈预估模型和用户画像,预估待推荐用户对候选多媒体信息的反馈结果;

推荐单元,用于当反馈结果表征负反馈时,不向待推荐用户推荐候选多媒体信息,以及当反馈结果表征非负反馈时,向待推荐用户推荐候选多媒体信息。

一方面,提供一种控制设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时执行上述任一种多媒体信息推荐的方法的步骤。

一方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一种多媒体信息推荐的方法的步骤。

本申请实施例提供的一种多媒体信息推荐的方法、装置、设备和介质中,按照预设筛选条件,对获取的各多媒体信息进行筛选,获得待推荐的候选多媒体信息;并获取待推荐的候选多媒体信息的多媒体信息标签,通过对应多媒体信息标签设置的反馈预估模型以及用户画像,预估待推荐用户对候选多媒体信息的反馈结果。只有反馈结果表征非负反馈时,才向待推荐用户推荐候选多媒体信息,否则,过滤候选多媒体信息。这样,先通过预设筛选条件对各多媒体信息进行初步筛选,然后,通过预估的用户对筛选后的候选多媒体信息反馈结果对推荐的多媒体信息进行再次筛选,对多媒体信息推荐进行了优化,提高了多媒体信息推荐的精准度,减少用户不感兴趣的多媒体信息推荐,降低了用户的负反馈率,提高了用户体验。

本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1a为本申请实施方式中一种多媒体信息推荐的架构示意图;

图1b为本申请实施方式中一种多媒体信息质检模块的示意图;

图1c为本申请实施方式中一种多媒体信息推荐的应用场景;

图2为本申请实施方式中一种反馈预估模型训练的方法的实施流程图;

图3a为本申请实施方式中一种用户画像示例图;

图3b为本申请实施方式中一种反馈预估模型的示意图;

图4为本申请实施方式中一种多媒体信息推荐的实施流程图;

图5为本申请实施方式中一种多媒体信息推荐的装置的结构示意图;

图6为本申请实施方式中一种控制设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

首先,对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

多媒体信息:组合两种或两种以上媒体的一种人机交互式信息交流和传播媒体。媒体包括文字、图片、声音、影片等。

用户画像:又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。我们在实际操作的过程中通常会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色是根据用户一段时间内的多媒体操作数据以及喜好构造的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。

卷积神经网络(Convolutional Neural Network,CNN):是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。

主成分分析(Principal Component Analysis,PCA):可以将高维数据集映射到低维空间的同时,尽可能的减少信息的丢失,保留数据之间的差异性。PCA旋转数据集与其主成分对齐,将最多的变量保留到第一主成分中。

全连接层(fully connected layers,FC):在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。在实际使用中,全连接层可由卷积操作实现:对前层是全连接的全连接层可以转化为卷积核为1x1的卷积;而前层是卷积层的全连接层可以转化为卷积核为h x w的全局卷积,h和w分别为前层卷积结果的高和宽。

Softmax函数:还可以称为归一化指数函数,是激活函数的一种推广。Softmax函数实际上是有限项离散概率分布的梯度对数归一化。

激活函数(Activation Function):就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端,对于人工神经网络模型去学习、理解非常复杂和非线性的函数来说具有十分重要的作用。它们将非线性特性引入到我们的网络中。

脱敏:将容易泄密的真实敏感数据按一定规则转换成不易泄密的非真实数据的过程。

区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。

区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。

平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。

下面介绍本申请实施例的设计思想。

随着互联网技术的发展,多媒体信息数量的增多,用户每天将面对海量的多媒体信息。为提高用户体验,多媒体信息应用通常根据用户当前查看的多媒体信息向用户推荐相关的多媒体信息。

多媒体信息应用在向用户推荐多媒体信息时,由于仅对多媒体信息进行了简单筛选,无法预估用户是否对推荐的多媒体信息感兴趣,因此,可能会将用户不感兴趣的多媒体信息推送给用户,给用户造成困扰。以及多媒体信息只有在接收到用户的负反馈后,才会调整多媒体信息推荐方式,比较滞后,如,针对该用户屏蔽该***。

例如,多媒体信息应用向用户推荐关于吃槟榔的猎奇视频后,用户对推荐的该视频非常反感。多媒体信息应用收到用户的负反馈后,针对该用户屏蔽该***。但是,用户仍然会收到类似的猎奇视频,如,关于吃八爪鱼的猎奇视频,这使得用户体验较差。

显然,传统技术中,确定推荐多媒体信息时,仅对各多媒体信息进行简单筛选,多媒体信息推荐的精准度较低,通常会向用户推荐不感兴趣的多媒体信息,导致用户的负面评价,并且无法根据收到的负反馈对多媒体信息推荐进行精准的调整,因此,亟待需要一种可以对多媒体信息推荐进行优化,减少用户负反馈的多媒体信息推荐方案。

考虑到可以先对各多媒体信息进行初步筛选,然后通过预估的用户反馈进行再次筛选,本申请实施例中提供了一种多媒体信息推荐的方案,该方案中,通过多媒体信息标签对应的各样本用户的用户画像以及用户反馈,对深度神经网络进行训练,获得反馈预估模型,接着,在多媒体信息推荐时,对各多媒体信息进行初步筛选后,获取筛选后的候选多媒体信息的多媒体信息标签以及对应设置的反馈预估模型,将待推荐用户的用户画像输入至反馈预估模型,预估待推荐用户对该候选多媒体信息的反馈结果,并根据反馈结果仅向待推荐用户推荐感兴趣的多媒体信息,过滤待推荐用户不感兴趣的多媒体信息。

为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。方法在实际的处理过程中或者控制设备执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。

本申请提供的多媒体信息推荐的方法可以应用到各种内容的多媒体信息推荐系统中,如,看点视频推荐、新闻推荐、浏览器首页推荐以及微视一拖三推荐等。参阅图1a所示,为一种多媒体信息推荐系统的架构示意图。该系统包括索引、召回、粗排、精排以及展控五个部分,通过索引、召回、粗排以及精排可以对多媒体信息进行筛选,最后通过展控部分向用户推荐筛选后的多媒体信息。

其中,索引用于获取全部区块链中的区块中存储的各多媒体信息。通过召回、粗排以及精排依次对输入的多媒体信息进行筛选,可以获得筛选后的各候选多媒体信息。展控用于将最终筛选后的指定数量的多媒体信息呈现给用户。

其中,召回、粗排以及精排中每一模块均对应设置有相应的筛选条件,以可以均通过设置的相应筛选条件对上一层输入的多媒体信息进行筛选。

其中,筛选条件可以包括以下几种方式:

第一种方式为:获取用户当前查看的多媒体信息的多媒体信息标签,筛选出该多媒体信息标签对应的多媒体信息。

第二种方式为:根据用户的用户标签,如,地域、语言以及性别等,对多媒体信息进行筛选。

例如,用户的语言为汉语,则筛选出语言为汉语的视频。

第三种方式为:根据用户的操作记录,如,检索记录以及历史记录等,对多媒体信息进行筛选。

例如,根据用户的用户历史记录,确定用户播放的视频主要为美食节目,则筛选出各美食视频。

本申请实施例中,在多媒体信息推荐系统的精排和展控之间,增加一个多媒体信息质检模块。该多媒体信息质检模块用于过滤掉用户不感兴趣的多媒体信息。

参阅图1b所示,为一种多媒体信息质检模块的示意图。具体步骤如下:

通过索引、召回、粗排以及精排模块,按照预设的筛选条件对各多媒体信息进行筛选,获取输出的候选多媒体信息,若候选多媒体信息的多媒体信息标签不被热点标签集合包含,则向待推荐用户推荐候选多媒体信息,否则,根据待推荐用户的用户画像和预先训练的反馈预估模型,预估用户对筛选出的候选多媒体信息的用户反馈,并通过预估的反馈结果,将反馈结果为负反馈的候选多媒体信息进行过滤,仅将反馈结果为非负反馈的候选多媒体信息推荐给待推荐用户。

这样,先对各多媒体信息进行初步筛选,然后将用户可能会发出负反馈的多媒体信息进行再次筛选,降低多媒体信息的负反馈率,提高用户使用体验,并最终提高多媒体信息应用的留存率和日均使用时长等指标。

参阅图1c所示,为一种多媒体信息推荐的应用场景。该应用场景中包括多个终端设备110和服务器130,图1c中是以三个终端设备110为例,实际上不限制终端设备110的数量。终端设备110中安装有用于进行查看多媒体信息的客户端120。客户端120和服务器130之间可以通过通信网络进行通信。终端设备110例如手机、平板电脑和个人计算机等。服务器130可以通过单个服务器实现,也可以通过多个服务器实现。服务器130可以通过实体服务器实现,也可以通过虚拟服务器实现。

在一种可能的应用场景中,为了便于降低多媒体信息推荐的通信时延,可以在各个地区部署服务器130,或者为了负载均衡,可以由不同的服务器130分别去服务各用户。多个服务器130可以通过区块链实现多媒体信息的共享,多个服务器130构成多媒体数据共享系统。例如用户A对应的终端设备110位于地点a,与服务器130之间进行通信连接,用户C、B对应的终端设备110位于地点b,与其他服务器130之间通信连接。

对于多媒体数据共享系统中的每个服务器130,均具有与该服务器130对应的节点标识,多媒体数据共享系统中的每个服务器130均可以存储有数据共享系统中其他服务器的节点标识,以便后续根据其他服务器130的节点标识,将生成的区块广播至多媒体数据共享系统中的其他服务器130。每个服务器130中可维护一个如下表所示的节点标识列表,将服务器130名称和节点标识对应存储至该节点标识列表中。其中,节点标识可为IP(Internet Protocol,网络之间互联的协议)地址以及其他任一种能够用于标识该节点的信息,表1中仅以IP地址为例进行说明。

表1.

服务器名称 节点标识
节点1 119.115.151.174
节点2 118.116.189.145
节点N 119.123.789.258

一种实施例中,管理员将多媒体信息通过某个服务器130写入多媒体数据共享系统中,多媒体数据共享系统中存储有各多媒体信息,任一服务器130均可以通过区块链的区块获取多媒体信息,并将确定的候选多媒体信息下发至客户端120。

可选的,多媒体数据共享系统中还可以存储多媒体推荐以及反馈预估模型训练过程中的数据,如,反馈预估模型的模型参数,用户画像以及候选多媒体信息。

本申请实施例中,在多媒体信息推荐之前,先分别针对每一多媒体信息标签训练相应的反馈预估模型,需要说明的是,本申请实施例中,仅以针对一个多媒体信息标签训练反馈预估模型为例进行说明,基于相同的原理,其它多媒体信息标签可以获得相应的反馈预估模型。

参阅图2所示,为本申请提供的一种反馈预估模型训练的方法的实施流程图。该方法的具体流程如下:

步骤200:服务器获取多媒体信息标签对应的各样本用户的用户画像以及用户反馈。

具体的,一个多媒体信息标签对应的反馈预估模型的各样本用户为:查看该多媒体信息标签对应的多媒体信息的用户。

也就是说,多媒体信息标签不同时,样本用户是不同的。

一种实施方式中,若用户查看的应用页面中包含该多媒体信息标签对应的多媒体信息,则将该用户确定为该多媒体信息标签的样本用户。

也就是说,若多媒体信息应用向用户呈现了多媒体信息,即便用户没有点击播放等操作,也将该用户作为样本用户。

实际应用中,可以实际需求将样本用户划分为不同的类别。样本类别的划分标准可以根据实际需求进行设置,在此不再赘述。本申请实施例中,样本用户至少包括正样本用户和负样本用户,还可以包括中性样本用户。

正样本用户为发出正反馈的用户。负样本用户为发出负反馈的用户。中性样本用户为样本用户中除正样本用户和非负样本用户之外的用户。

用户反馈的类别可以根据多媒体信息查看时间和用户评价确定。一种实施方式中,用户反馈包括正反馈,负反馈以及中性反馈。

例如,负反馈为用户评价为表示不满意的反馈,正反馈为用户评价没有表示不满意,并且满足以下条件中的任意一个或任意组合的反馈:查看时间高于指定时间,查看频率高于指定频率,播放有效时长与总时长的占比高于指定占比,以及用户评价表示满意。

实际应用中,指定时间、指定频率以及指定占比可以根据实际应用场景进行设置,在此不再赘述。

这样,将正反馈倾向性较高的用户作为正样本,将负反馈倾向性较高的用户作为负样本,将反馈倾向性模糊的用户作为中性样本,使得反馈预估模型可以通过正负样本的区分性,与中性样本进行更好的拟合。

本申请实施例中,用户画像为包含用户标签和相应权重的集合。用户标签至少包括根据多媒体信息查看操作确定的标签。其中,权重越高,说明用户标签越重要。

参阅图3a所示,为一种用户画像示例图。用户画像包括用户标识、用户标签以及权重。

可选的,用户画像可以采用以下方式表示:

Ui=[Wnorm(T(i,1)),Wnorm(T(i,2)),……Wnorm(T(i,n))]。

其中,Ui为序号为i的用户画像矩阵,Wnorm为用户标签的归一化后的权重,T为用户标签的类型,n为正整数,为用户标签的数量。

需要说明的是,当T(i,t)不存在时,Wnorm(T(i,t))=0。t为正整数。也就是说,当用户的任意用户标签不存在时,对应的权重则为零。

可选的,归一化后的权重可以采用以下公式获得:

其中,i为用户序号,Wnorm为用户标签的归一化后的权重,W为归一化前的权重,T为用户标签的类型,n为正整数,为用户标签的数量,t、t0均为正整数,表示用户标签的序号。

一种实施方式中,用户标签是根据用户查看多媒体信息的操作数据确定的,如,查看多媒体信息的时间以及查看多媒体信息的频率,以及用户检索内容分类确定。

进一步地,用户标签还可以包括将用户的基础画像特征进行脱敏处理后获得的标签,其中,基础画像特征是根据用户属性确定的。

由于用户属性可能会暴露用户的隐私,是敏感数据,因此,将用户属性进行脱敏(如,线性变换)等方式进行处理,以在保护用户的隐私安全的前提下,提高用户画像的覆盖面,进而可以提高多媒体信息推荐的准确性。

这样,就可以根据用户的用户属性、多媒体信息相关的用户行为以及用户兴趣,生成用户的用户画像。

进一步地,为提高用户画像的准确性,用户画像可以根据最近的指定时间段内的数据生成。这样,获得的用户画像具有一定的热点性并且可以反映用户的长期爱好。

例如,用户画像为根据模型训练前的7天内的数据生成的。

步骤201:服务器根据各样本用户的用户画像,分别统计用户画像中的每一用户标签的样本数量。

具体的,由于不同样本用户的用户画像中包含的用户标签可能是不同的,为提高模型拟合度,减少模型训练数据,服务器分别统计每一用户标签的样本数量,以便在后续的步骤中对用户标签进行筛选。

这样,就可以统计用户标签的有效样本数量。

步骤202:服务器在各样本用户的用户画像中,去除对应的样本数量低于指定样本数量的用户标签。

具体的,服务器分别针对用户画像中的每一用户标签,执行以下步骤:

当确定该用户标签的样本数量低于指定样本数量时,从用户画像中去除该用户标签。

其中,指定样本数量可以根据实际应用场景进行设置,如指定样本数量为10,在此不再赘述。

这是由于用户画像中包含海量的用户标签,例如,用户画像中包括5500万个用户标签,庞大的训练数据会使得模型难以训练。再者,一个用户的有效用户标签数量较少,如平均35个,显然,将各样本用户的用户画像转化为画像矩阵后,画像矩阵可能过于稀疏,这会使得模型训练时的拟合效果下降。

由此,本申请实施例中,将用户画像中的各用户标签进行筛选,舍弃出现次数较少的用户标签,从而可以对模型进行有效训练。

步骤203:服务器采用降维处理算法,将各样本用户的用户画像进行降维处理,获得各降维处理后的用户画像。

可选的,降维处理算法可以采用PCA算法。

所谓降维处理即将用户画像的维度降低,从而减少模型训练的数据量。

由于根据样本数量对用户标签进行筛选后,用户标签的数量仍然是海量,神经网络的训练参数仍为千万级别,网络的数据量非常庞大,同时部署多个用户标签的网络到服务器中会给服务器造成极大的负担,因此,通过降维处理算法可以将用户画像进行进一步降维,减少模型训练的数据量。

步骤204:服务器根据各降维处理后的用户画像和用户反馈对深度神经网络进行训练,获得反馈预估模型。

具体的,反馈预估模型由指定层数的全连接层、插批归一化层(Batch-Normalization Layer)、随机失活层(Drop-out)以及采用激活函数的输出层组成。反馈预估模型是通过各样本用户的用户画像和用户反馈对深度神经网络(Deep NeuralNetworks,DNN)进行训练获得的。反馈预估模型的输入为用户画像组成的矩阵,输出为预估的反馈结果。

实际应用中,指定层数可以根据实际应用场景进行设置,如,指定层数可以为5,在此不作限制。

参阅图3b所示,为一种反馈预估模型的示意图,包括全连接层、Batch-Normalization Layer、(Drop-out)以及采用激活函数的输出层,其中,全连接层包括第一层、第二层……第n层,n为指定层数,可选的,n可以为5。例如,全连接层用D表示,神经元数量用[]表示,第一层全连接层D1=[2048],第二层全连接层D2=[1024],第五层全连接层D5=[16],最后,输出层通过包含3个元素的向量输出3个反馈类别。

可选的,模型训练时,反馈预估模型可以在目前最广为流行的神经网络框架Keras进行,并利用Nvidia Titan-V显卡进行具体的模型训练。

由于用户画像中相邻的用户标签没有相关性,因此,转换后的用户画像矩阵并没有局部的相关性可以挖据出相关特征,因此,反馈预估模型不适用于循环神经网络(Recurrent Neural Network,RNN)和CNN等抓取空间信息的神经网络。由于全连接层能够找到所有输入的用户标签之间的相互交叉关系,因此,本申请实施例中,采用包含全连接层的深度神经网络训练获得反馈预估模型。

其中,反馈预估模型中全连接层之间的参数关系如下:

A[D(m+1)]=g[W[D(m+1)]A[Dm]+B[D(m+1)]];

g(x)=x;

其中,A[D(m+1)]为模型的第m+1层的参数矩阵,W[D(m+1)]为模型的第m+1层的权重矩阵,A[Dm]为模型的第m层的参数矩阵,B[D(m+1)]为模型的第m+1层的常数矩阵,m为全连接层的层数,为正数,可选的,m可以为5。

需要说明的是,各全连接层的激活函数由于在进行前向传播和反向传播的时候,神经元的值可能归0,因此,各全连接层用到的激活函数均为线性层(linear layer)。

本申请实施例中,为了防止反馈预估模型某层间的过拟合,在第二层后添加插批归一化层以及随机失活层。

其中,Batch-Normalization层将该层神经元的权重归一化,在网络神经元值传递的时候避免网络过度关心权重较大的神经元的值,减少了隐藏层的不稳定性,避免过拟合。

再者,Drop-out层会在网络前向传播的时候,随机失活其中的某些神经元,让各神经元都可以得到充分的训练,通过这种方法也可以防止过拟合,让某些依赖程度比较高的神经元不会被过度训练。

本申请实施例中,反馈预估模型的模型网络为多分类任务,因此最终的输出层激活函数用的是Softmax。

可选的,Softmax可以采用以下公式:

Si=ei/∑jej;

其中,Si为序号为i的反馈类别,e表示概率,i,j表示各反馈类别的序号,j=1,2,3。

服务器根据max(Si)来最终判断用户对该多媒体信息的用户反馈。即,将最大概率的反馈类别确定为反馈结果。

例如,负反馈的概率为0.7,则判定预估的反馈结果为负反馈。

参阅图4所示,为本申请提供的一种多媒体信息推荐的方法的实施流程图。该方法的具体流程如下:

步骤400:服务器按照预设筛选条件,对获取的各多媒体信息进行筛选,获得待推荐的候选多媒体信息。

具体的,实际应用中,预设筛选条件可以根据实际应用场景进行设置,在此不再赘述。

一种实施方式中,服务器通过索引、召回、粗排以及精排,按照预设筛选条件对多媒体信息数据库中的各多媒体信息进行筛选后,获得待推荐的候选多媒体信息。

本申请实施例中,仅以预估一个候选多媒体信息的用户反馈为例进行说明,实际应用中,服务器通常会获取指定数量的候选多媒体信息(如10个视频)。

这样,就可以通过预设的筛选条件对海量的多媒体信息进行初步筛选,以便在后续的步骤中,通过反馈预估模型仅对筛选后的少量候选多媒体信息进行再次过滤,可以降低过滤处理的数据量,还可以提高多媒体信息推荐的精准度。

步骤401:服务器获取候选多媒体信息的多媒体信息标签。

具体的,预先针对每一候选多媒体信息设置相应的多媒体信息标签,每一多媒体信息的多媒体信息标签的数量可以根据实际应用场景进行设置,本申请实施例中,仅以针对每一多媒体信息设置一个多媒体信息标签为例进行说明。

例如,多媒体信息标签可以为:游戏、动画、动漫以及美食等。

步骤402:服务器判断多媒体信息标签是否被获取的热点标签集合包含,若是,则执行步骤403,否则,执行步骤406。

具体的,服务器获取热点标签集合,当热点标签集合中不包含多媒体信息标签时,向待推荐用户推荐候选多媒体信息,当热点标签集合中包含多媒体信息标签时,执行步骤403,进而可以根据预估的用户反馈,执行相应的推荐操作。

其中,热点标签集合为指定数量的指定多媒体信息标签的集合。

实际应用中,指定数量可以根据实际应用场景进行相应的设置,如,指定数量可以为10,在此不作限制。

可选的,指定多媒体信息标签可以为通过大数据统计获得的热点内容的标签。例如,指定多媒体信息标签可以根据统计的检索次数,浏览次数以及观看时间等确定的。

由于预估用户对多媒体信息的用户反馈时,需要预先训练获得该多媒体信息的多媒体信息标签对应的反馈预估模型,而多媒体信息标签的数量非常多,若针对所有的多媒体信息标签训练相应的反馈预估模型,会耗费极大的成本,这显然是不符合实际情况的,而热点内容的多媒体信息标签已经涵盖了大多数的多媒体信息,因此,本申请实施例中,获取由热点内容的多媒体信息标签组成的热点标签集合,仅针对热点标签集合中包含的各多媒体信息标签,训练相应的反馈预估模型。

步骤403:服务器获取对应多媒体信息标签设置的反馈预估模型。

具体的,在执行步骤403之前,服务器预先针对每一多媒体信息标签,训练相应的反馈预估模型,并建立各多媒体信息标签和各反馈预估模型之间的对应关系。

步骤404:服务器根据反馈预估模型以及获取的待推荐用户的用户画像,预估待推荐用户对候选多媒体信息的反馈结果。

步骤405:服务器根据反馈结果,执行相应的推荐操作。

具体的,执行步骤405时,可以采用以下两种方式:

第一种方式为:当反馈结果表征正反馈时,服务器向待推荐用户推荐候选多媒体信息。

具体的,服务器判断获得的反馈结果表征正反馈的候选多媒体信息的数量是否达到指定推送数量,若是,则向待推荐用户的多媒体信息应用推送包含各候选多媒体信息的多媒体信息列表,否则,执行步骤400。

这样,多媒体信息应用就可以向待推荐用户呈现服务器推送的多媒体信息列表。

第二种方式为:当反馈结果表征负反馈时,服务器不向待推荐用户推荐候选多媒体信息。

步骤406:服务器向待推荐用户推荐候选多媒体信息。

本申请实施例中,先对获取的各多媒体信息进行初步筛选,然后,对筛选后的候选多媒体信息进行过滤,对多媒体信息推荐进行了优化,提高了多媒体信息推荐的精准度,减少用户不感兴趣的多媒体信息推荐,降低了用户的负反馈率,提高了用户体验。

下面采用一个具体的应用场景对训练后的反馈预估模型的效果进行测试。

假设多媒体信息标签为王者荣耀。服务器获取5.10-5.25号的半个月中针对多媒体信息标签为王者荣耀的视频做出负反馈的用户即负样本用户,以及相应的用户画像。为减少模型的训练数据,在5.10-5.25号的半个月查看多媒体信息标签为王者荣耀的视频的用户中,抽取中性样本用户和正样本用户。正样本用户、负样本用户以及中性样本用户的数量分别为:6.4w、8.12w以及12.5w。通过正样本用户、负样本用户以及中性样本用户的用户画像和用户反馈,进行模型训练,获得反馈预估模型。

在获取训练后的反馈预估模型之后,获取通过反馈预估模型预估的5.26号各用户针对上述视频的反馈结果,并根据各用户的实际反馈结果和预估的反馈结果,计算预测准确率。

表2.

正样本用户 负样本用户 中性样本用户
预测准确率 94.45% 85.42% 77.34%

参阅表2所示,为一种预测准确率示例表。其中,正样本用户的预测准确率为:预测结果为正反馈并且预测正确的用户数量,与实际反馈结果为正反馈的用户总数的比值。

负样本用户的预测准确率为:预测结果为负反馈并且预测正确的用户数量,与实际反馈结果为负反馈的用户总数的比值。

中性样本用户的预测准确率为预测结果为:非正反馈,非负反馈并且预测正确的用户数量,与实际反馈结果为非正反馈并且非负反馈的用户总数的比值。

根据统计结果可知,反馈预估模型可以对85%的负反馈用户进行有效发现并及时干预,从而可以极大地减少负反馈的产生,提高了用户体验,实现了对多媒体信息推荐的优化。

基于同一发明构思,本申请实施例中还提供了一种多媒体信息推荐的装置,由于上述装置及设备解决问题的原理与一种多媒体信息推荐的方法相似,因此,上述装置的实施可以参见方法的实施,重复之处不再赘述。

如图5示,其为本申请实施例提供的一种多媒体信息推荐的装置的结构示意图。一种多媒体信息推荐的装置包括:

筛选单元500,用于按照预设筛选条件,对获取的各多媒体信息进行筛选,获得待推荐的候选多媒体信息;

第一获取单元501,用于获取待推荐的候选多媒体信息的多媒体信息标签;

第二获取单元502,用于获取对应多媒体信息标签设置的反馈预估模型,以及待推荐用户的用户画像,一个多媒体信息标签对应的反馈预估模型用于根据用户的用户画像预测该用户对该多媒体信息标签对应的多媒体信息的反馈;

预估单元503,用于根据反馈预估模型和用户画像,预估待推荐用户对候选多媒体信息的反馈结果;

推荐单元504,用于当反馈结果表征负反馈时,不向待推荐用户推荐候选多媒体信息,以及当反馈结果表征非负反馈时,向待推荐用户推荐候选多媒体信息。

较佳的,第一获取单元501还用于:

获取热点标签集合,热点标签集合为指定数量的指定多媒体信息标签的集合;

当热点标签集合中不包含多媒体信息标签时,向待推荐用户推荐候选多媒体信息;

当热点标签集合中包含多媒体信息标签时,执行获取对应多媒体信息标签设置的反馈预估模型的步骤。

较佳的,反馈预估模型由指定层数的全连接层、插批归一化层、随机失活层以及采用激活函数的输出层组成,是通过各样本用户的用户画像和用户反馈对深度神经网络进行训练获得的;

一个多媒体信息标签对应的反馈预估模型的各样本用户为查看该多媒体信息标签对应的多媒体信息的用户;

用户画像为包含用户标签和相应权重的集合;

用户标签至少包括根据多媒体信息查看操作确定的标签;

用户反馈是根据多媒体信息查看时间和用户评价确定的。

较佳的,用户标签还包括将用户的基础画像特征进行脱敏处理后获得的标签;

基础画像特征是根据用户属性确定的。

较佳的,多媒体信息标签对应的反馈预估模型是通过以下方式训练获得的:

获取多媒体信息标签对应的各样本用户的用户画像和用户反馈;

根据各样本用户的用户画像,分别统计各用户画像中每一用户标签的样本数量;

在各样本用户的用户画像中,去除对应的样本数量低于指定样本数量的用户标签;

采用降维处理算法,将各样本用户的用户画像进行降维处理,获得各降维处理后的用户画像;

根据各降维处理后的用户画像和用户反馈对深度神经网络进行训练,获得反馈预估模型。

较佳的,各多媒体信息是从区块链中的各区块获取的。

本申请实施例提供的一种多媒体信息推荐的方法、装置、设备和介质中,按照预设筛选条件,对获取的各多媒体信息进行筛选,获得待推荐的候选多媒体信息;并获取待推荐的候选多媒体信息的多媒体信息标签,通过对应多媒体信息标签设置的反馈预估模型以及用户画像,预估待推荐用户对候选多媒体信息的反馈结果。只有反馈结果表征非负反馈时,才向待推荐用户推荐候选多媒体信息,否则,过滤候选多媒体信息。这样,一方面,通过预设筛选条件对各多媒体信息进行初步筛选,另一方面,通过反馈预估模型预估用户的多媒体信息反馈,从而根据预估的反馈结果对推荐的多媒体信息进行再次筛选,从而对多媒体信息推荐进行了优化,提高了多媒体信息推荐的精准度,减少用户不感兴趣的多媒体信息推荐,降低了用户的负反馈率,提高了用户体验。

参阅图6所示,为一种控制设备的结构示意图。基于同一技术构思,本申请实施例还提供了一种控制设备,可以包括存储器601和处理器602。

存储器601,用于存储处理器602执行的计算机程序。存储器601可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。处理器602,可以是一个中央处理单元(central processing unit,CPU),或者为数字处理单元等。本申请实施例中不限定上述存储器601和处理器602之间的具体连接介质。本申请实施例在图6中以存储器601和处理器602之间通过总线603连接,总线603在图6中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线603可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器601可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器601也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器601是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器601可以是上述存储器的组合。

处理器602,用于调用存储器601中存储的计算机程序时执行如图4中所示的实施例提供的多媒体信息推荐的方法。

本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意方法实施例中的多媒体信息推荐的方法。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台控制设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

26页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于自学习的商品详情页的生成方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!