一种源多媒体确定方法、装置、设备及存储介质

文档序号：1771878 发布日期：2019-12-03 浏览：24次 >En<

阅读说明：本技术 一种源多媒体确定方法、装置、设备及存储介质 (One provenance multimedia determines method, apparatus, equipment and storage medium ) 是由张晓寒任可欣冯知凡张扬朱勇于 2019-09-03 设计创作，主要内容包括：本申请公开了一种源多媒体确定方法、装置、设备及存储介质,涉及智能搜索技术领域。具体实现方案为：获取多媒体片段对应的至少一个多媒体关联信息；其中多媒体关联信息包括多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种；对各多媒体关联信息进行实体提取,根据所提取的各实体和预设知识图谱,确定与多媒体片段对应的至少一个关联多媒体；从各关联多媒体中确定与多媒体片段对应的源多媒体。本申请的技术方案通过多媒体关联信息对应的实体和预设知识图谱相结合,确定了关联多媒体,缩小了源多媒体的确定范围,从关联多媒体中进行源多媒体的确定,减少了非真实源多媒体的干扰,提高了源多媒体确定效率和准确率。(This application discloses a provenance multimedias to determine method, apparatus, equipment and storage medium, is related to intelligent search technique field.Specific implementation are as follows: obtain at least one corresponding multimedia related information of multi-media segment；Wherein multimedia related information includes at least one of description text, media elements recognition result and user's input label information of multi-media segment；Entity extraction is carried out to each multimedia related information, according to extracted each entity and default knowledge mapping, determines at least one association multimedia corresponding with multi-media segment；Source corresponding with multi-media segment multimedia is determined from each association multimedia.The technical solution of the application is combined by the corresponding entity of multimedia related information and default knowledge mapping, association multimedia has been determined, reduce the multimedia determining range in source, the multimedia determination in source is carried out from association multimedia, reduce the multimedia interference of non-real actual source, the source multimedia of improving determines efficiency and accuracy rate.)

技术领域

本申请涉及数据处理技术领域，尤其涉及智能搜索技术领域。

背景技术

随着互联网上多媒体资源(例如音视频数据)的增多，有越来越多的多媒体相关的应用，例如多媒体数据推荐、多媒体数据搜索等。这类应用在用于精准推荐、搜索推荐以及精准搜索等场景时，需要对多媒体的来源数据进行定位。

现有技术通常使用指纹识别技术，将多媒体片段与多个多媒体数据通过指纹信息的提取和比对，从多个多媒体数据中确定与多媒体片段对应的源多媒体。

然而，指纹提取和指纹比对耗时较长，使得源多媒体确定过程整体耗时较长；另外，仅通过指纹提取和比对的方式容易受添加有多媒体片段的娱乐新闻等非真实源数据的干扰，将娱乐新闻误判为源多媒体，降低了所确定的源多媒体的准确性。

发明内容

本申请实施例提供了一种源多媒体确定方法、装置、设备及存储介质，以提高源多媒体的确定效率和确定结果的准确性。

第一方面，本申请实施例提供了一种源多媒体确定方法，包括：

获取多媒体片段对应的至少一个多媒体关联信息；其中，所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种；

对各所述多媒体关联信息进行实体提取，根据所提取的各实体和预设知识图谱，确定与所述多媒体片段对应的至少一个关联多媒体；

从各所述关联多媒体中，确定与所述多媒体片段对应的源多媒体。

上述申请中的一个实施例通过多媒体片段对应的多媒体关联信息的获取，并提取多媒体关联信息的实体，根据所提取实体和预设知识图谱进行关联多媒体的筛选，进而从关联多媒体中确定与多媒体片段对应的源多媒体，解决了源多媒体确定过程耗时时间长，源多媒体确定准确度较低的问题。本申请的技术方案通过不同维度下的多媒体关联信息对应的实体和预设知识图谱相结合，确定了关联多媒体，缩小了源多媒体的确定范围，从关联多媒体中进行源多媒体的确定，减少了非真实源多媒体的干扰，提高了源多媒体的确定效率和准确率。

可选的，根据所提取的各实体和预设知识图谱，确定与所述多媒体片段对应的至少一个关联多媒体，包括：

根据所提取的各实体和所述知识图谱对应的三元组信息，确定至少一个多媒体实体，并将各多媒体实体对应的多媒体数据作为关联多媒体。

上述申请中的一个实施例通过所提取的各实体和知识图谱对应的三元组信息进行多媒体实体的确定，通过知识图谱对所提取的实体进行扩充，进一步挖掘与多媒体片段对应的实体信息；对扩充后的实体中的非多媒体实体进行剔除，进一步减少了所确定的关联多媒体的数量，提高了关联多媒体与多媒体片段对应的源多媒体之间的相关度。

可选的，在确定至少一个多媒体实体之后，在将各多媒体实体对应的多媒体数据作为关联多媒体之前，所述方法还包括：

根据各多媒体实体的确定频次和/或各多媒体实体对应的所述多媒体关联信息的类别，确定各多媒体实体的置信度；

从各多媒体实体中筛选出置信度满足设定条件的多媒体实体；

相应的，将各多媒体实体对应的多媒体数据作为关联多媒体，包括：

将筛选出的各多媒体实体对应的多媒体数据作为关联多媒体。

上述申请中的一个实施例通过各多媒体实体的确定频次和/或各多媒体实体对应的文件关联信息的类别，进行多媒体实体的置信度的确定，并通过所确定的置信度对多媒体实体进行筛选，减少了多媒体实体的数量，进一步缩小了所确定的关联多媒体的数量，间接提高了关联多媒体与多媒体片段对应的源多媒体之间的相关度。

可选的，根据各多媒体实体的确定频次和各多媒体实体对应的所述多媒体关联信息的类别，确定各多媒体实体的置信度，包括：

针对每个多媒体实体，根据不同类别多媒体关联信息对应的置信权重，对所述多媒体实体的确定频次进行加权；

根据加权后的多媒体实体的频次，确定所述多媒体实体对应的置信度。

上述申请中的一个实施例通过细化根据各多媒体实体的确定频次和各多媒体实体对应的多媒体关联信息的类别，进行置信度的确定，完善了置信度的确定机制，从确定频次和多媒体关联信息的类别两个维度进行置信度的确定，提高了置信度与多媒体片段之间的关联性，使得多媒体实体的置信度越高，该多媒体实体对应的多媒体数据为多媒体片段对应的源多媒体的可能性越大，间接提高了所确定的关联多媒体与多媒体片段之间的相关度。

可选的，从各所述关联多媒体中，确定与所述多媒体片段对应的源多媒体，包括：

分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度；

根据各所述相似度，从所述关联多媒体中确定与所述多媒体片段对应的源多媒体。

上述申请中的一个实施例通过指纹信息相似度的确定，进行关联多媒体与多媒体片段的比对，进而从关联多媒体中进行与多媒体片段对应的源多媒体的确定，完善了源多媒体的确定机制，同时进一步提高了源多媒体的确定结果的准确性。

可选的，在分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度之前，所述方法还包括：

利用所述知识图谱中的多媒体实体对应的播放链接，抓取所述多媒体实体对应的多媒体数据，并提取所述多媒体数据的指纹信息；

将所述多媒体数据的指纹信息与所述多媒体实体关联存储，形成多媒体指纹库。

可选的，分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度，包括：

根据各所述关联多媒体的多媒体实体，在所述多媒体指纹库中查找与各所述关联多媒体对应的指纹信息；

提取所述多媒体片段的指纹信息，并分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度。

上述申请中的一个实施例通过预先进行多媒体指纹库的构建，避免了进行源多媒体确定过程中进行指纹信息的提取操作，从而减少了源多媒体确定时的数据运算量，进一步提高了源多媒体的确定效率。

第二方面，本申请实施例还提供了一种源多媒体确定装置，包括：

关联信息获取模块，用于获取多媒体片段对应的至少一个多媒体关联信息；其中，所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种；

关联多媒体确定模块，用于对各所述多媒体关联信息进行实体提取，根据所提取的各实体和预设知识图谱，确定与所述多媒体片段对应的至少一个关联多媒体；

源多媒体确定模块，用于从各所述关联多媒体中，确定与所述多媒体片段对应的源多媒体。

第三方面，本申请实施例还提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面实施例所提供的一种源多媒体确定方法。

第四方面，本申请实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行第一方面实施例所提供的一种源多媒体确定方法。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是本申请实施例一中的一种源多媒体确定方法的流程图；

图2是本申请实施例二中的一种源多媒体确定方法的流程图；

图3是本申请实施例三中的一种源多媒体确定装置的结构图；

图4是用来实现本申请实施例的源多媒体确定方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

实施例一

图1是本申请实施例一中的一种源多媒体确定方法的流程图，本申请实施例适用于对应用程序或网页等多媒体载体中所包含的多媒体片段的数据来源加以确定的情况，该方法由源多媒体确定装置来执行，该装置通过软件和/或硬件实现，并具体配置于具备一定数据运算能力的电子设备中。

如图1所示的一种源多媒体确定方法，包括：

S101、获取多媒体片段对应的至少一个多媒体关联信息；其中，所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种。

示例性地，多媒体片段可以是视频片段；相应的，多媒体关联信息，可以是视频片段的描述文本、视频中所包含的媒体元素的图像识别结果、以及用户输入的视频片段对应的标签信息等中的至少一种。其中，媒体元素的图像可以是人物图像或道具图像等。

示例性地，多媒体片段还可以是音频片段；相应的，多媒体关联信息可以是音频片段的描述文本、音频中所包含的发生者的音色识别结果、以及用户输入的声音片段对应的标签信息等中的至少一种。

可选的，多媒体片段的多媒体关联信息可以预先存储在电子设备本地、与电子设备关联的其他存储设备或云端中，并在需要时根据多媒体片段的标识信息进行多媒体关联信息的获取。

或者可选地，多媒体片段的多媒体关联信息还可以由用户通过电子设备的输入装置直接输入，并根据所输入信息加以确定。

以多媒体片段包括视频片段为例进行示例性说明。

若多媒体关联信息包括多媒体片段的描述文本，可以从电子设备本地、与电子设备本地所关联的其他存储设备或云端中，通过多媒体片段进行描述文本的查找获取。可选的，还可以获取用户输入的语音信息，并将语音信息转化后的文字信息作为描述文本。可选的，还可以获取用户输入的图片信息，并将从图片信息中提取的文字信息作为描述文本。

若多媒体关联信息包括媒体元素识别结果，可以从电子设备本地、与电子设备本地所关联的其他存储设备或云端中，通过多媒体片段进行媒体元素识别结果的查找获取。可选的，还可以从电子设备本地、与电子设备本地所关联的其他存储设备或云端中，通过多媒体片段进行人脸图像的查找获取，或者直接接收用户输入的人脸图像；通过人脸识别技术确定人脸图像对应的演员名称或角色名称，并将演员名称或角色名称作为媒体元素识别结果。可选的，还可以从电子设备本地、与电子设备本地所关联的其他存储设备或云端中，通过多媒体片段进行道具图像的查找获取，或者直接接收用户输入的道具图像；通过模式识别技术确定道具图像对应的道具名称，并将道具名称作为媒体元素识别结果。

若多媒体关联信息包括用户输入标签信息，则直接获取用户手动输入的文字信息作为标签信息；或者，获取用户输入的语音信息，并将语音信息转化后的文字信息作为标签信息；还可以获取用户输入的图片信息，并将从图片信息中提取出的文字信息作为标签信息。

S102、对各所述多媒体关联信息进行实体提取，根据所提取的各实体和预设知识图谱，确定与所述多媒体片段对应的至少一个关联多媒体。

其中，实体表示具有区别性且独立存在的某种事物，例如能够指代某个人物、某项事物、或某个动作的词语。

其中，源多媒体用于表征多媒体片段对应的来源数据。例如，针对视频片段，关联多媒体可以是该视频片段可能来源的电影或电视剧剧集等对应的源视频；针对音频片段，关联多媒体可以是该音频片段可能来源的歌曲或影视剧配音等对应的源音频。

示例性地，可以预先构建一实体数据库，将各多媒体关联信息分词后将得到的分词结果在实体数据库中进行查找匹配，若查找到与分词结果相对应的词语，则将查找到的词语作为所提取的实体。

其中，知识图谱用于描述各种实体或概念及其关系，其构成一张巨大的语义网络图，节点表示实体或概念，边则由属性或关系构成。其中，三元组是知识图谱的一种通用标识方式，三元组的基本形式主要包括(实体1-关系-实体2)和(实体-属性-属性值)等。每个实体可用一个全局唯一确定的标识来表示，每个属性-属性值对可用来刻画实体的内在特性，而关系可用来连接两个实体，刻画他们之间的关联。

在本申请实施例的一种可选实施方式中，根据所提取的各实体和预设知识图谱，确定与多媒体片段对应的一个关联多媒体，可以是根据预设知识图谱对应的三元组信息，分别确定与所述提取的各实体具备边关系的多媒体实体；将各多媒体实体对应的多媒体数据作为关联多媒体。

示例性地，所提取的实体可以是“实体1”，通过知识图谱中预先存储的“实体1-关系-实体2”的三元组信息，可以确定与“实体1”具备边关系的多媒体实体“实体2”。例如，“胡高峰”和“末代皇帝传奇”为电视剧演出关系，当提取的实体为“胡高峰”时，可以将与“胡高峰”具备电视剧演出关系的实体“末代皇帝传奇”，确定为多媒体实体。

示例性地，所提取的实体还可以是“属性值”，通过知识图谱中预先存储的“实体3-属性-属性值”的三元组信息，可以确定与“属性值”具备变关系的多媒体实体“实体3”。例如“末代皇帝传奇”的演员属性的属性值为“胡高峰”，当提取的实体为“胡高峰”时，可以将“胡高峰”所属演员属性的实体“末代皇帝传奇”，确定为多媒体实体。

可以理解的是，为了减少关联多媒体的数量，同时保证关联多媒体与多媒体片段之间的关联度，还可以对关联多媒体对应的多媒体实体进行筛选，以保留与多媒体片段关联度较高的多媒体实体，将关联度较低的多媒体实体加以剔除。

示例性地，在将各多媒体实体对应的多媒体数据作为关联多媒体之前，还可以根据多媒体实体与所提取实体之间的关系边的数量，确定多媒体实体与所提取实体之间的关系度；剔除关系度大于设定阈值的多媒体实体，以更新多媒体实体。其中，设定阈值由技术人员根据需要或经验值设定，或通过大量试验加以确定。

S103、从各所述关联多媒体中，确定与所述多媒体片段对应的源多媒体。

可选的，可以提取关联多媒体对应的多媒体数据的数据特征信息，并通过各关联多媒体对应的数据特征信息与多媒体片段对应的数据特征信息的相似度；确定相似度大于设定相似度阈值的关联多媒体作为与多媒体片段对应的源多媒体；或者确定相似度阈值最高的关联多媒体作为与多媒体片段对应的源多媒体。其中，设定相似度阈值可以由技术人员根据需要或经验值进行设定。

示例性地，数据特征信息可以是指纹信息，也即：分别确定各所述关联多媒体对应的指纹信息与所述多媒体片段的指纹信息的相似度；根据各所述相似度，从所述关联多媒体中确定与所述多媒体片段对应的源多媒体。

可以理解的是，为了减少确定源多媒体过程中的数据运算量，还可以预先进行多媒体指纹库的构建，并在需要获取多媒体数据对应的指纹信息时，直接根据多媒体数据的多媒体实体从多媒体数据库中进行查找获取。

具体的，在分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度之前，利用所述知识图谱中的多媒体实体对应的播放链接，抓取所述多媒体实体对应的多媒体数据，并提取所述多媒体数据的指纹信息；将所述多媒体数据的指纹信息与所述多媒体实体关联存储，形成多媒体指纹库。

相应的，分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度，可以是：根据各所述关联多媒体的多媒体实体，在所述多媒体指纹库中查找与各所述关联多媒体对应的指纹信息；提取所述多媒体片段的指纹信息，并分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度。其中指纹信息的提取方式可以采用现有技术的多种方式加以实现，在此不再赘述。

举例说明，当多媒体关联信息包括用户输入的标签信息：“胡高峰”、“战争片”、“火风”、“***”、“川岛芳子”和“单薇”，以及人脸图像对应的识别结果：“单薇”、“火风”和“胡高峰”。

根据所提取的各实体和预设知识图谱，确定与多媒体片段对应的关联多媒体为：《末代皇帝传奇》电视剧剧集。

确定电视剧《末代皇帝传奇》每集视频的指纹信息与多媒体片段的指纹信息的相似度，确定目标源视频为《末代皇帝传奇》的第X集。

上述申请中的一个实施例通过多媒体片段对应的多媒体关联信息的获取，并提取多媒体关联信息的实体，根据所提取实体和预设知识图谱进行关联多媒体的筛选，进而从关联多媒体中确定与多媒体片段对应的源多媒体，解决了源多媒体确定过程耗时时间长，源多媒体确定准确度较低的问题。本申请的技术方案通过不同维度下的多媒体关联信息对应的实体和预设知识图谱相结合，确定了关联多媒体，缩小了源多媒体的确定范围，从关联多媒体中进行源多媒体的确定，减少了包含有多媒体片段的娱乐新闻等非真实源多媒体的干扰，提高了源多媒体确定效率和准确率。

实施例二

图2是本申请实施例二中的一种源多媒体确定方法的流程图，本申请实施例在上述各实施例的技术方案的基础上进行了优化改进。

进一步地，将操作“根据所提取的各实体和预设知识图谱，确定与所述多媒体片段对应的至少一个关联多媒体”细化为“根据所提取的各实体和所述知识图谱对应的三元组信息，确定至少一个多媒体实体，并将各多媒体实体对应的多媒体数据作为关联多媒体”，以减少所确定的关联多媒体的数量，提高关联多媒体与多媒体片段对应的源多媒体之间的相关度。

如图2所示的一种源多媒体确定方法，包括：

S201、获取多媒体片段对应的至少一个多媒体关联信息；其中，所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种。

S202、对各所述多媒体关联信息进行实体提取，根据所提取的各实体和所述知识图谱对应的三元组信息，确定至少一个多媒体实体，并将各多媒体实体对应的多媒体数据作为关联多媒体。

根据所提取的各实体和预设知识图谱，确定与多媒体片段对应的一个关联多媒体，可以是根据预设知识图谱对应的三元组信息，分别确定与所述提取的各实体具备边关系的多媒体实体；将各多媒体实体对应的多媒体数据作为关联多媒体。

在本申请实施例的一种可选实施方式中，为了减少关联多媒体中的数量，同时保证关联多媒体与多媒体片段之间的关联度，还可以在确定至少一个多媒体实体之后，在将各多媒体实体对应的多媒体数据作为关联多媒体之前，根据各多媒体实体的确定频次和/或各多媒体实体对应的多媒体关联信息的类别，确定各多媒体实体的置信度；从各多媒体实体中筛选出置信度满足设定条件的多媒体实体。相应的，将各多媒体实体对应的多媒体数据作为关联多媒体，包括：将筛选出的各多媒体实体对应的多媒体数据作为关联多媒体。

需要说明的是，置信度从侧面反映了多媒体实体与多媒体片段之间的关联程度，当多媒体实体的置信度越高，则表明该多媒体实体与多媒体片段的关联度越大。

可选的，根据各多媒体实体的确定频次，确定各多媒体实体的置信度，可以是：统计根据所提取的实体确定的多媒体实体的确定频次；将各多媒体实体对应的确定频次作为多媒体实体的置信度；或者将各多媒体实体对应的确定频次经单调递增函数运算，转化为置信度。

可选的，根据各多媒体实体的确定频次和各多媒体实体对应的所述多媒体关联信息的类别，确定各多媒体实体的置信度，可以是：针对每个多媒体实体，根据不同类别多媒体关联信息对应的置信权重，对所述多媒体实体的确定频次进行加权；根据加权后的多媒体实体的频次，确定所述多媒体实体对应的置信度。其中，不同类别的多媒体关联信息对应的置信权重可以由技术人员根据需要或经验值进行设定。典型的，考虑到不同类别的多媒体关联信息的侧重点不同：描述文本能够较为全面的反映多媒体片段的整体内容，媒体元素识别结果能够从内容细节与多媒体片段产生关联，而标签信息用于从多媒体信息的属性归属层面对多媒体片段进行分类，所以通常设置描述文本对应的置信权重最大，而设置标签信息对应的置信权重最小。

示例性地，从各多媒体实体中筛选出置信度满足设定条件的多媒体实体，可以是筛选出置信度大于设定置信度阈值的多媒体实体；和/或，将各多媒体实体的置信度进行排序，并选取置信度排名最高的设定数量的多媒体实体。其中，设定置信度阈值可以由技术人员根据需要或经验值设定，或者根据大量试验加以确定。

S203、从各所述关联多媒体中，确定与所述多媒体片段对应的源多媒体。

本申请实施例对关联多媒体的确定操作加以细化，通过所提取的各实体和知识图谱对应的三元组信息进行多媒体实体的确定，通过知识图谱对所提取的实体进行扩充，进一步挖掘与多媒体片段对应的实体信息；对扩充后的实体中的非多媒体实体进行剔除，进一步减少了所确定的关联多媒体的数量，提高了关联多媒体与多媒体片段对应的源多媒体之间的相关度。

实施例三

图3是本申请实施例三中的一种源多媒体确定装置的结构图，本申请实施例适用于对应用程序或网页等多媒体载体中所包含的多媒体片段的数据来源加以确定的情况，该装置通过软件和/或硬件实现，并具体配置于具备一定数据运算能力的电子设备中。

如图3所示的一种源多媒体确定装置300，包括：关联信息获取模块301、关联多媒体确定模块302和源多媒体确定模块303。

关联信息获取模块301，用于获取多媒体片段对应的至少一个多媒体关联信息；其中，所述多媒体关联信息包括所述多媒体片段的描述文本、媒体元素识别结果、以及用户输入标签信息中的至少一种；

关联多媒体确定模块302，用于对各所述多媒体关联信息进行实体提取，根据所提取的各实体和预设知识图谱，确定与所述多媒体片段对应的至少一个关联多媒体；

源多媒体确定模块303，用于从各所述关联多媒体中，确定与所述多媒体片段对应的源多媒体。

上述申请中的一个实施例通过关联信息获取模块进行多媒体片段对应的多媒体关联信息的获取，并通过关联多媒体确定模块提取多媒体关联信息的实体，根据所提取实体和预设知识图谱进行关联多媒体的筛选，进而通过源多媒体确定模块从关联多媒体中确定与多媒体片段对应的源多媒体，解决了进行源多媒体确定过程耗时时间长，源多媒体确定准确度较低的问题。本申请的技术方案通过不同维度下的多媒体关联信息对应的实体和预设知识图谱相结合，确定了关联多媒体，缩小了源多媒体的确定范围，从关联多媒体中进行源多媒体的确定，减少了包含有多媒体片段的娱乐新闻等非真实源数据的干扰，提高了源多媒体的确定效率和准确率。

进一步地，关联多媒体确定模块302，在执行根据所提取的各实体和预设知识图谱，确定与所述多媒体片段对应的至少一个关联多媒体时，包括：

关联多媒体确定单元，用于根据所提取的各实体和所述知识图谱对应的三元组信息，确定至少一个多媒体实体，并将各多媒体实体对应的多媒体数据作为关联多媒体。

进一步地，关联多媒体确定模块302，还包括多媒体实体筛选单元，具体用于：

在确定至少一个多媒体实体之后，在将各多媒体实体对应的多媒体数据作为关联多媒体之前，根据各多媒体实体的确定频次和/或各多媒体实体对应的所述多媒体关联信息的类别，确定各多媒体实体的置信度；

从各多媒体实体中筛选出置信度满足设定条件的多媒体实体；

相应的，关联多媒体确定单元，在执行将各多媒体实体对应的多媒体数据作为关联多媒体时，具体用于：

将筛选出的各多媒体实体对应的多媒体数据作为关联多媒体。

进一步地，多媒体实体筛选单元，在执行根据各多媒体实体的确定频次和各多媒体实体对应的所述多媒体关联信息的类别，确定各多媒体实体的置信度时，具体用于：

针对每个多媒体实体，根据不同类别多媒体关联信息对应的置信权重，对所述多媒体实体的确定频次进行加权；

根据加权后的多媒体实体的频次，确定所述多媒体实体对应的置信度。

进一步地，源多媒体确定模块303，包括：

相似度确定单元，用于分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度；

源多媒体确定单元，用于根据各所述相似度，从所述关联多媒体中确定与所述多媒体片段对应的源多媒体。

进一步地，该装置还包括，多媒体指纹库确定模块，用于：

在分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度之前，利用所述知识图谱中的多媒体实体对应的播放链接，抓取所述多媒体实体对应的多媒体数据，并提取所述多媒体数据的指纹信息；

将所述多媒体数据的指纹信息与所述多媒体实体关联存储，形成多媒体指纹库。

进一步地，相似度确定单元，具体用于：

根据各所述关联多媒体的多媒体实体，在所述多媒体指纹库中查找与各所述关联多媒体对应的指纹信息；

提取所述多媒体片段的指纹信息，并分别确定各所述关联多媒体的指纹信息与所述多媒体片段的指纹信息的相似度。

上述源多媒体确定装置可执行本申请任意实施例所提供的源多媒体确定方法，具备执行源多媒体确定方法相应的功能模块和有益效果。

实施例四

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图4所示，是根据本申请实施例的源多媒体确定方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图4所示，该电子设备包括：一个或多个处理器401、存储器402，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图4中以一个处理器401为例。

存储器402即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的源多媒体确定方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的源多媒体确定方法。

存储器402作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的源多媒体确定方法对应的程序指令/模块(例如，附图3所示的包括关联信息获取模块301、关联多媒体确定模块302和源多媒体确定模块303的源多媒体确定装置300)。处理器401通过运行存储在存储器402中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的源多媒体确定方法。

存储器402可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据执行源多媒体确定方法的电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器402可选包括相对于处理器401远程设置的存储器，这些远程存储器可以通过网络连接至执行源多媒体确定方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

执行源多媒体确定方法的电子设备还可以包括：输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接，图4中以通过总线连接为例。

输入装置403可接收输入的数字或字符信息，以及产生与执行源多媒体确定方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置404可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，通过多媒体片段对应的多媒体关联信息的获取，并提取多媒体关联信息的实体，根据所提取实体和预设知识图谱进行关联多媒体的筛选，进而从关联多媒体中确定与多媒体片段对应的源多媒体，解决了源多媒体确定过程耗时时间长，源多媒体确定准确度较低的问题。本申请的技术方案通过多媒体关联信息对应的实体和预设知识图谱相结合，确定了关联多媒体，缩小了源多媒体的确定范围，从关联多媒体中进行源多媒体的确定，减少了包含有多媒体片段的娱乐新闻等非真实源多媒体的干扰，提高了源多媒体确定效率和准确率。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

16页详细技术资料下载

一种源多媒体确定方法、装置、设备及存储介质

相关技术

网友询问留言