一种对象标签确定方法及装置

文档序号:135785 发布日期:2021-10-22 浏览:8次 >En<

阅读说明:本技术 一种对象标签确定方法及装置 (Object label determination method and device ) 是由 毋安安 于 2021-08-17 设计创作,主要内容包括:本发明实施例提供了一种对象标签确定方法及装置,涉及数据处理技术领域,其中,上述方法包括:确定用于描述目标多媒体对象的对象信息。根据对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在知识图谱中确定与目标多媒体对象存在关联关系的目标实体,目标实体包括:与目标多媒体对象直接存在关联关系的实体和/或与目标多媒体对象间接存在关联关系的实体,应用场景中的实体包括:应用场景中的多媒体对象和/或多媒体对象的关联信息。选择目标实体的全部或部分实体信息,作为目标多媒体对象的对象标签。应用本发明实施例提供的方案确定对象标签,可以提高多媒体对象的对象标签的丰富程度。(The embodiment of the invention provides a method and a device for determining an object label, which relate to the technical field of data processing, wherein the method comprises the following steps: object information describing the target multimedia object is determined. Determining a target entity having an association relation with a target multimedia object in a knowledge graph according to the object information and entity information of an entity in the knowledge graph which is constructed in advance and aims at an application scene, wherein the target entity comprises: the entity directly having an association relation with the target multimedia object and/or the entity indirectly having an association relation with the target multimedia object, the entity in the application scene includes: multimedia objects in the application scene and/or associated information of the multimedia objects. And selecting all or part of entity information of the target entity as an object tag of the target multimedia object. The scheme provided by the embodiment of the invention is applied to determine the object tags, so that the richness of the object tags of the multimedia objects can be improved.)

一种对象标签确定方法及装置

技术领域

本发明涉及数据处理技术领域,特别是涉及一种对象标签确定方法及装置。

背景技术

不同的音频、视频等多媒体对象可以具有不同的对象标签,每一多媒体对象的对象标签用于对该多媒体对象进行描述。例如,在上述多媒体对象是视频的情况下,上述对象标签可以包括视频的类别,如电视剧、电影等,也可以包括视频主演的名称,如成龙、周润发等。根据对象标签可以对多媒体对象进行分类、查找、向用户推荐对象标签相似的其他多媒体对象等。

现有技术中,各个多媒体对象的对象标签往往是人工手动添加的。由于人工手动添加对象标签的效率较低,在多媒体对象较多的情况下,对于每一多媒体对象而言,人工手动添加的对象标签往往数量有限,使得对象标签的丰富程度较低。

发明内容

本发明实施例的目的在于提供一种对象标签确定方法及装置,以提高多媒体对象的对象标签的丰富程度。具体技术方案如下:

第一方面,本发明实施例提供了一种对象标签确定方法,所述方法包括:

确定用于描述目标多媒体对象的对象信息;

根据所述对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象存在关联关系的目标实体,其中,所述目标实体包括:与所述目标多媒体对象直接存在关联关系的实体和/或与所述目标多媒体对象间接存在关联关系的实体,所述应用场景中的实体包括:所述应用场景中的多媒体对象和/或多媒体对象的关联信息;

选择所述目标实体的全部或部分实体信息,作为所述目标多媒体对象的对象标签。

本发明的一个实施例中,所述根据所述对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象存在关联关系的目标实体,包括:

根据所述对象信息与知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象直接存在关联关系的第一实体;

根据所述知识图谱中实体间的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体;

得到包含所述第一实体和第二实体的目标实体。

本发明的一个实施例中,所述根据所述对象信息与知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象直接存在关联关系的第一实体,包括:

在所述知识图谱中,确定全部或部分实体信息包含于所述对象信息中的实体,作为与所述目标多媒体对象直接存在关联关系的第一实体;

和/或

在所述知识图谱中,确定全部或部分实体信息与所述对象信息语义相同的实体,作为与所述目标多媒体对象直接存在关联关系的第一实体。

本发明的一个实施例中,所述根据所述知识图谱中实体间的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体,包括:

从所述知识图谱中实体间属于预设关系类型的关联关系中,选择直接指向所述第一实体和/或间接指向所述第一实体的关联关系;

根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

本发明的一个实施例中,所述根据所述知识图谱中实体间的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体,包括:

从所述知识图谱中实体间的关联关系中,选择关系权重大于预设权重的、直接指向所述第一实体和/或间接指向所述第一实体的关联关系;

根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

第二方面,本发明实施例提供了一种对象标签确定装置,所述装置包括:

信息确定模块,用于确定用于描述目标多媒体对象的对象信息;

实体确定模块,用于根据所述对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象存在关联关系的目标实体,其中,所述目标实体包括:与所述目标多媒体对象直接存在关联关系的实体和/或与所述目标多媒体对象间接存在关联关系的实体,所述应用场景中的实体包括:所述应用场景中的多媒体对象和/或多媒体对象的关联信息;

标签选择模块,用于选择所述目标实体的全部或部分实体信息,作为所述目标多媒体对象的对象标签。

本发明的一个实施例中,所述实体确定模块,包括:

第一实体确定子模块,用于根据所述对象信息与知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象直接存在关联关系的第一实体;

第二实体确定子模块,用于根据所述知识图谱中实体间的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体;

实体得到子模块,用于得到包含所述第一实体和第二实体的目标实体。

本发明的一个实施例中,所述第一实体确定子模块,具体用于:

在所述知识图谱中,确定全部或部分实体信息包含于所述对象信息中的实体,作为与所述目标多媒体对象直接存在关联关系的第一实体;

和/或

在所述知识图谱中,确定全部或部分实体信息与所述对象信息语义相同的实体,作为与所述目标多媒体对象直接存在关联关系的第一实体。

本发明的一个实施例中,所述第二实体确定子模块,具体用于:

从所述知识图谱中实体间属于预设关系类型的关联关系中,选择直接指向所述第一实体和/或间接指向所述第一实体的关联关系;

根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

本发明的一个实施例中,所述第二实体确定子模块,具体用于:

从所述知识图谱中实体间的关联关系中,选择关系权重大于预设权重的、直接指向所述第一实体和/或间接指向所述第一实体的关联关系;

根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。

第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的方法步骤。

本发明实施例提供的对象标签确定方法,确定用于描述目标多媒体对象的对象信息,根据对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在知识图谱中确定与上述目标多媒体对象直接和/或间接存在关联关系的目标实体,选择目标实体的全部或部分实体信息,作为目标多媒体对象的对象标签。

由以上可见,由于目标实体是与目标多媒体对象直接或间接存在关联关系的实体,所以可以认为上述目标实体的实体信息与上述目标多媒体对象存在关联关系,可以用于描述上述目标多媒体对象,因此可以将上述目标实体的实体信息作为上述目标多媒体对象的对象标签。将上述目标实体的实体信息确定为上述目标多媒体对象的对象标签,可以增加对象标签的数量,提高对象标签的丰富程度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例中提供的第一种对象标签确定方法的流程示意图;

图2为本发明实施例中提供的一种对象标签的示意图;

图3为本发明实施例中提供的第二种对象标签确定方法的流程示意图;

图4为本发明实施例中提供的第三种对象标签确定方法的流程示意图;

图5为本发明实施例中提供的第一种对象标签确定装置的结构示意图;

图6为本发明实施例中提供的第二种对象标签确定装置的结构示意图;

图7为本发明实施例中提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本发明保护的范围。

由于现有技术中多媒体对象的对象标签的丰富程度较低。为解决这一问题,本发明实施例提供了一种对象标签确定方法及装置。

本发明的一个实施例中,提供了一种对象标签确定方法,所述方法包括:

确定用于描述目标多媒体对象的对象信息。

根据上述对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在上述知识图谱中确定与上述目标多媒体对象存在关联关系的目标实体。其中,上述目标实体包括:与上述目标多媒体对象直接存在关联关系的实体和/或与上述目标多媒体对象间接存在关联关系的实体,上述应用场景中的实体包括:上述应用场景中的多媒体对象和/或多媒体对象的关联信息。

选择上述目标实体的全部或部分实体信息,作为上述目标多媒体对象的对象标签。

由以上可见,由于目标实体是与目标多媒体对象直接或间接存在关联关系的实体,所以可以认为上述目标实体的实体信息与上述目标多媒体对象存在关联关系,可以用于描述上述目标多媒体对象,因此可以将上述目标实体的实体信息作为上述目标多媒体对象的对象标签。将上述目标实体的实体信息确定为上述目标多媒体对象的对象标签,可以增加对象标签的数量,提高对象标签的丰富程度。

下面通过具体的实施例对本发明实施例提供的对象标签确定方法及装置进行说明。

参见图1,为本发明实施例提供的第一种对象标签确定方法的流程示意图,上述方法包括以下步骤S101-S103。

S101:确定用于描述目标多媒体对象的对象信息。

具体的,上述目标多媒体对象可以为视频、音频、图像等。

上述对象信息可以为:上述目标多媒体对象的对象名称、当前的对象标签、属性信息等,上述属性信息可以包括:目标多媒体对象的类型、目标多媒体对象的来源等。

例如,在上述目标多媒体对象为视频的情况下,上述目标多媒体对象的类型可以为:电影、电视剧、短视频等,上述目标多媒体对象的来源可以为:各个视频网站等。在上述目标的多媒体对象为音频的情况下,上述目标多媒体对象的类型可以为:流行歌曲、古典音乐等,上述目标多媒体对象的来源可以为:各个音乐网站等。

S102:根据上述对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在上述知识图谱中确定与上述目标多媒体对象存在关联关系的目标实体。

其中,上述目标实体包括:与上述目标多媒体对象直接存在关联关系的实体和/或与上述目标多媒体对象间接存在关联关系的实体。上述应用场景中的实体包括:上述应用场景中的多媒体对象和/或多媒体对象的关联信息。

具体的,上述知识图谱中包含对应各个实体的节点以及节点之间的边,节点之间存在边表示边两侧的节点对应的实体之间直接存在关联关系。上述知识图谱中还可以包含实体之间的关联关系的权重,权重越高表示实体之间的关联关系越强,不同实体之间的关联关系的权重可以相同也可以不同。

另外,不同实体之间的关联关系表示的关系的关系类型不同,例如,上述关系的关系类型可以为表征存在关联关系的两个实体的实体信息表示的含义相同的同义关系类型,一个实体中包含另一个实体的包含关系类型等。上述实体之间的关联关系可以为有向关系,也可以为无向关系。例如,若实体M与实体N之间存在的关联关系为同义关系类型,则对于实体M而言,实体M的实体信息与实体N的实体信息的含义相同,对于实体N而言,实体N的实体信息与实体M的实体信息的含义同样相同,则上述关联关系可以为无向关系。而若实体M与实体N之间存在的关联关系为包含关系类型,表示实体M中包含实体N,但实体N中不包含实体M,所以上述关联关系可以为有向关系。

上述实体的实体信息可以包括:实体名称、实体类型、实体属性等。上述实体属性可以包含实体的类型、实体的来源等。

此外,为了保证知识图谱中存在与目标多媒体对象之间存在关联关系的实体,上述知识图谱为针对应用场景的知识图谱。例如,在上述目标多媒体对象为视频的情况下,上述知识图谱可以为视频知识图谱。则上述视频知识图谱中包含的实体中包含的多媒体对象为应用场景中的视频,上述多媒体对象的关联信息为:多媒体对象的主演、导演、编剧等。

另外,上述目标实体可以是知识图谱中与上述目标多媒体对象直接和/或间接存在关联关系的实体中表示预设内容的实体。例如,在上述目标多媒体对象为音频的情况下,上述预设内容可以为发行公司、演唱者、作词人、作曲人等。

上述目标实体也可以是知识图谱中与上述目标多媒体对象直接和/或间接存在关联关系的实体中、受欢迎程度大于预设受欢迎程度程度实体。上述受欢迎程度可以以上述实体在历史上被用户搜索的搜索量表示,也可以以在历史上被用户点击的点击量表示等。将受欢迎程度高的实体作为目标实体,可以使得根据目标实体的实体信息确定的对象标签更易于被用户识别。

上述目标实体还可以是知识图谱中与上述目标多媒体对象直接和/或间接存在关联关系的实体中、用户通过输入实体选择指令选择的实体。

本发明的一个实施例中,可以从上述知识图谱中选择实体名称与上述目标多媒体对象的对象名称相同的实体,作为目标实体。

例如,在上述目标多媒体对象的对象名称为芈月传的情况下,上述目标实体为知识图谱中包含的实体名称为“芈月传”的实体。

本发明的另一个实施例中,也可以通过步骤S102A-S102C确定上述目标实体,本发明实施例对此暂不详述。

S103:选择上述目标实体的全部或部分实体信息,作为上述目标多媒体对象的对象标签。

本发明的一个实施例中,可以将目标实体的全部实体信息均作为上述目标多媒体对象的对象标签。

也可以仅选择实体信息中属于预设类型的信息作为上述目标多媒体对象的对象标签,例如,上述预设类型可以为实体名称。

还可以接受用户选择实体信息的指令,将用户选择的实体信息作为上述目标多媒体对象的对象标签。

另外,所得到的对象标签可以存储于标签结果数据表中。

参见图2,为本发明实施例提供的一种对象标签的示意图。

图中包含的芈月传代表目标多媒体对象,其他矩形框代表各个对象标签。在上述目标多媒体对象为芈月传的情况下,上述目标实体为知识图谱中包含的实体名称为“芈月传”的实体。可以将上述芈月传实体的实体信息作为上述目标多媒体对象的对象标签,包括上述实体的属性信息,如上述实体的来源,即图中的M视频网站,还包括上述实体的实体类型,如图中的古装剧、大陆剧。另外,上述对象标签中还包含芈月传的主要演员的名称,包括孙俪、刘涛。

由以上可见,由于目标实体是与目标多媒体对象直接或间接存在关联关系的实体,所以可以认为上述目标实体的实体信息与上述目标多媒体对象存在关联关系,可以用于描述上述目标多媒体对象,因此可以将上述目标实体的实体信息作为上述目标多媒体对象的对象标签。将上述目标实体的实体信息确定为上述目标多媒体对象的对象标签,可以增加对象标签的数量,提高对象标签的丰富程度。

本发明的一个实施例中,在确定得到上述目标多媒体对象的对象标签之后,可以将上述对象标签输出供其他用户或机构使用,也可以根据各个多媒体对象的对象标签,将包含相同对象标签的多媒体对象推荐给用户,吸引用户查看其他多媒体对象。

另外,还可以根据目标实体的受欢迎程度与实体信息计算得到上述目标多媒体对象的受欢迎程度,与目标多媒体对象存在关联关系的目标实体的受欢迎程度越高,上述目标多媒体对象的受欢迎程度越高。

具体的,可以计算各个目标实体的受欢迎程度的平均值、加权平均值等作为上述目标多媒体对象的受欢迎程度。其中,在计算加权平均值作为目标多媒体对象的受欢迎程度的情况下,可以将目标实体与目标多媒体对象之间的关系权重作为上述计算加权平均值时,目标实体对应的受欢迎程度的权重。

参见图3,为本发明实施例提供的第二种对象标签确定方法的流程示意图,与前述图1所示的实施例相比,上述步骤S102可以通过以下步骤S102A-S102C实现。

S102A:根据上述对象信息与知识图谱中实体的实体信息,在上述知识图谱中确定与上述目标多媒体对象直接存在关联关系的第一实体。

具体的,与上述目标多媒体对象直接存在关联关系的第一实体可以是用于表示上述目标多媒体对象的实体。例如,在上述目标多媒体对象为电视剧士兵突击的情况下,上述第一实体可以是用于表示士兵突击电视剧的实体。

本发明的一个实施例中,可以遍历上述知识图谱,从上述知识图谱中包含的各个实体中确定上述第一实体。上述第一实体可以为1个或多个。

本发明的另一个实施例中,可以通过以下步骤A和/或步骤B确定与上述目标多媒体对象直接存在关联关系的第一实体。

步骤A:在上述知识图谱中,确定全部或部分实体信息包含于上述对象信息中的实体,作为与上述目标多媒体对象直接存在关联关系的第一实体。

本发明的一个实施例中,可以遍历上述知识图谱中的各个实体,将部分或全部实体信息与上述对象信息相同的实体确定为第一实体,也可以将部分或全部实体信息为上述对象信息的一部分的实体确定为第一实体。

具体的,可以对上述对象信息进行分词处理,将分词处理结果分别与实体的部分或全部实体信息进行对比,确定实体中的第一实体。

其中,上述分词处理可以通过现有技术中的分词方式实现,本发明实施例对此不进行限定。

通过上述步骤A确定上述第一实体的过程可以被称为结构化匹配过程。

步骤B:在上述知识图谱中,确定全部或部分实体信息与上述对象信息语义相同的实体,作为与上述目标多媒体对象直接存在关联关系的第一实体。

本发明的一个实施例中,可以对对象信息进行语义分析,并对各个实体的全部或部分实体信息进行语义分析,分别将各个实体部分或全部的实体信息的语义与对象信息的语义进行对比,将全部或部分实体信息与对象信息的语义相同的实体确定为第一实体。

具体的,可以通过现有技术中的方式进行上述语义分析,本发明实施例对此不进行限定。

通过上述步骤B确定上述第一实体的过程可以被称为非结构化匹配过程。

S102B:根据上述知识图谱中实体间的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

本发明的一个实施例中,可以将在上述知识图谱中与上述第一实体直接存在关联关系,即与第一实体之间直接存在边的实体作为上述第二实体。

也可以将在上述知识图谱中与上述第一实体间接存在关联关系,即通过其他实体与第一实体之间存在边的实体作为上述第二实体。

具体的,可以将与第一实体直接存在关联关系的其他实体确定为第二实体。

进一步的,在已确定的第二实体的基础上,将与已确定的第二实体之间直接存在关联关系的、除已确定的第二实体和第一实体之外的实体,作为新的第二实体。以此类推,确定与目标多媒体对象间间接存在关联关系的第二实体。

另外,不同的第二实体与目标多媒体对象之间的距离不同,也就是不同的第二实体与目标多媒体对象之间间接存在的关联关系经过的实体的最小数量不同,例如,若目标多媒体对象与实体X之间直接存在关联关系、与实体Y之间不直接存在关联关系,但实体X与实体Y之间直接存在关联关系,则实体Y经过1个实体X与目标多媒体对象之间间接存在关联关系,则实体Y与目标多媒体对象之间的距离为1。

与目标多媒体对象之间的距离越大的第二实体与目标多媒体对象之间的关联程度越小,因此本发明实施例可以在与目标多媒体对象间接存在关联关系的第二实体中,选择与目标多媒体对象之间的距离小于预设距离的实体作为第二实体,从而可以提高确定得到的第二实体与目标多媒体对象之间的关联程度。

S102C:得到包含上述第一实体和第二实体的目标实体。

由以上可见,由于第一实体与目标多媒体对象之间直接存在关联关系,第二实体与第一实体之间直接和/或间接存在关联关系,因此第二实体通过第一实体与目标多媒体对象之间间接存在关联关系,因此上述第一实体与第二实体均可以作为与目标多媒体对象直接和/或间接存在关联关系的目标实体。

本发明的另一个实施例中,可以通过以下步骤C-步骤D实现上述步骤S102B。

步骤C:从上述知识图谱中实体间属于预设关系类型的关联关系中,选择直接指向上述第一实体和/或间接指向上述第一实体的关联关系。

其中,上述预设关系类型可以为:表征存在关联关系的两个实体的实体信息表示的含义相同的同义关系类型,表征存在关联关系的一个实体是另一个实体的上位概念的上位关系类型,表征存在关联关系的一个实体属于另一个实体的属于关系类型等。

具体的,可以仅保留上述知识图谱中属于预设关系类型的关联关系,从所保留的关联关系中选择直接指向上述第一实体和/或间接指向上述第一实体的关联关系。

其中,上述直接指向上述第一实体的关联关系为:关联关系的一侧为第一实体的关联关系。间接指向上述第一实体的关联关系为:通过其他实体指向第一实体的关联关系。

步骤D:根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

具体的,上述第二实体与第一实体之间的关联关系为所选择的关联关系,因此所确定的第二实体与第一实体之间的关联关系为预设类型的关联关系,因此第二实体与目标多媒体对象之间的关联关系为预设类型的关联关系。

由以上可见,由于实体之间的关联关系的关系类型较多,并不是与目标多媒体对象之间存在任意关联关系的实体的实体信息均适用于作为目标多媒体对象的对象标签。通过本发明实施例提供的方案确定的第二实体与目标多媒体对象之间的关联关系为预设关系类型的关联关系,从而提高所得到的对象标签与目标多媒体对象之间的匹配程度。

本发明的再一个实施例中,可以通过以下步骤E-步骤F实现上述步骤S102B。

步骤E:从上述知识图谱中实体间的关联关系中,选择关系权重大于预设权重的、直接指向上述第一实体和/或间接指向上述第一实体的关联关系。

具体的,可以仅保留上述知识图谱中关系权重大于预设权重的关联关系,从所保留的关联关系中选择直接指向上述第一实体和/或间接指向上述第一实体的关联关系。

步骤F:根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

具体的,上述第二实体与第一实体之间的关联关系为所选择的关联关系,因此所确定的第二实体与第一实体之间的关联关系的关系权重大于预设权重,因此第二实体与目标多媒体对象之间的关联关系的关系权重大于预设权重,第二实体与目标多媒体对象之间的关联程度较高。

由以上可见,通过本发明实施例选择的第二实体与目标多媒体对象之间的关联程度较高,因此将关联程度较高的第二实体作为目标实体,将得到的目标实体的实体信息作为对象标签,可以使得所得到的对象标签与目标多媒体对象之间的关联程度较高,得到的对象标签较准确。

参见图4,为本发明实施例提供的第三种对象标签确定方法的流程示意图。

其中,将目标多媒体对象数据与知识图谱中的实体数据作为源数据。在上述目标多媒体对象数据为历史数据的情况下,可以通过离线任务确定目标多媒体对象数据的对象标签,在上述目标多媒体对象数据为新生成的数据的情况下,可以通过实时任务确定目标多媒体对象数据的对象标签。

具体的,上述离线任务与实时任务确定对象标签的方式相同。均是通过解析模块实现上述步骤C-步骤D和/或步骤E-步骤F,从而选择知识图谱中的关联关系。并通过解析模块选择知识图谱中的实体。通过图谱后台从所选择的知识图谱中获得目标实体。从而得到对象标签,得到标签结果数据表。

通过离线任务得到的标签结果数据表可以以离线数据的形式输出,通过实时任务得到的标签结果数据表可以以实时信息的形式输出,还可以通过标签结果数据表为用户提供查询服务。

与前述对象标签确定方法相对应,参见图5,为本发明实施例提供的第一种对象标签确定装置的结构示意图,上述装置包括:

信息确定模块501,用于确定用于描述目标多媒体对象的对象信息;

实体确定模块502,用于根据所述对象信息与预先构建的针对应用场景的知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象存在关联关系的目标实体,其中,所述目标实体包括:与所述目标多媒体对象直接存在关联关系的实体和/或与所述目标多媒体对象间接存在关联关系的实体,所述应用场景中的实体包括:所述应用场景中的多媒体对象和/或多媒体对象的关联信息;

标签选择模块503,用于选择所述目标实体的全部或部分实体信息,作为所述目标多媒体对象的对象标签。

由以上可见,由于目标实体是与目标多媒体对象直接或间接存在关联关系的实体,所以可以认为上述目标实体的实体信息与上述目标多媒体对象存在关联关系,可以用于描述上述目标多媒体对象,因此可以将上述目标实体的实体信息作为上述目标多媒体对象的对象标签。将上述目标实体的实体信息确定为上述目标多媒体对象的对象标签,可以增加对象标签的数量,提高对象标签的丰富程度。

参见图6,为本发明实施例提供的第二种对象标签确定装置的结构示意图,上述实体确定模块502,包括:

第一实体确定子模块502A,用于根据所述对象信息与知识图谱中实体的实体信息,在所述知识图谱中确定与所述目标多媒体对象直接存在关联关系的第一实体;

第二实体确定子模块502B,用于根据所述知识图谱中实体间的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体;

实体得到子模块502C,用于得到包含所述第一实体和第二实体的目标实体。

由以上可见,由于第一实体与目标多媒体对象之间直接存在关联关系,第二实体与第一实体之间直接和/或间接存在关联关系,因此第二实体通过第一实体与目标多媒体对象之间间接存在关联关系,因此上述第一实体与第二实体均可以作为与目标多媒体对象直接和/或间接存在关联关系的目标实体。

本发明的一个实施例中,所述第一实体确定子模块502A,具体用于:

在所述知识图谱中,确定全部或部分实体信息包含于所述对象信息中的实体,作为与所述目标多媒体对象直接存在关联关系的第一实体;

和/或

在所述知识图谱中,确定全部或部分实体信息与所述对象信息语义相同的实体,作为与所述目标多媒体对象直接存在关联关系的第一实体。

本发明的一个实施例中,上述第二实体确定子模块502B,具体用于:

从所述知识图谱中实体间属于预设关系类型的关联关系中,选择直接指向所述第一实体和/或间接指向所述第一实体的关联关系;

根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

由以上可见,由于实体之间的关联关系的关系类型较多,并不是与目标多媒体对象之间存在任意关联关系的实体的实体信息均适用于作为目标多媒体对象的对象标签。通过本发明实施例提供的方案确定的第二实体与目标多媒体对象之间的关联关系为预设关系类型的关联关系,从而提高所得到的对象标签与目标多媒体对象之间的匹配程度。

本发明的一个实施例中,上述第二实体确定子模块502B,具体用于:

从所述知识图谱中实体间的关联关系中,选择关系权重大于预设权重的、直接指向所述第一实体和/或间接指向所述第一实体的关联关系;

根据所选择的关联关系,确定与第一实体直接和/或间接存在关联关系的第二实体。

由以上可见,通过本发明实施例选择的第二实体与目标多媒体对象之间的关联程度较高,因此将关联程度较高的第二实体作为目标实体,将得到的目标实体的实体信息作为对象标签,可以使得所得到的对象标签与目标多媒体对象之间的关联程度较高,得到的对象标签较准确。

本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,

存储器703,用于存放计算机程序;

处理器701,用于执行存储器703上所存放的程序时,实现上述对象标签确定方法任一所述的方法步骤。

应用本发明实施例提供的电子设备确定对象标签时,由于目标实体是与目标多媒体对象直接或间接存在关联关系的实体,所以可以认为上述目标实体的实体信息与上述目标多媒体对象存在关联关系,可以用于描述上述目标多媒体对象,因此可以将上述目标实体的实体信息作为上述目标多媒体对象的对象标签。将上述目标实体的实体信息确定为上述目标多媒体对象的对象标签,可以增加对象标签的数量,提高对象标签的丰富程度。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的对象标签确定方法。

应用本实施例提供的计算机可读存储介质中存储的计算机程序确定对象标签时,由于目标实体是与目标多媒体对象直接或间接存在关联关系的实体,所以可以认为上述目标实体的实体信息与上述目标多媒体对象存在关联关系,可以用于描述上述目标多媒体对象,因此可以将上述目标实体的实体信息作为上述目标多媒体对象的对象标签。将上述目标实体的实体信息确定为上述目标多媒体对象的对象标签,可以增加对象标签的数量,提高对象标签的丰富程度。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的对象标签确定方法。

执行本实施例提供的计算机程序产品确定对象标签时,由于目标实体是与目标多媒体对象直接或间接存在关联关系的实体,所以可以认为上述目标实体的实体信息与上述目标多媒体对象存在关联关系,可以用于描述上述目标多媒体对象,因此可以将上述目标实体的实体信息作为上述目标多媒体对象的对象标签。将上述目标实体的实体信息确定为上述目标多媒体对象的对象标签,可以增加对象标签的数量,提高对象标签的丰富程度。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种应用于医学知识图谱的数据融合方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!