基于视频字幕的知识图谱构建方法、装置及计算设备

文档序号：1904706 发布日期：2021-11-30 浏览：11次 >En<

阅读说明：本技术 基于视频字幕的知识图谱构建方法、装置及计算设备 (Knowledge graph construction method and device based on video subtitles and computing equipment ) 是由李薇曹旭周波王�锋周丽莎于 2020-05-25 设计创作，主要内容包括：本发明实施例涉及视频处理技术领域,公开了一种基于视频字幕的知识图谱构建方法、装置及计算设备,该方法包括：获取用户上传的视频实体,并根据所述视频提取的视频字幕；根据所述视频实体以及所述视频字幕获取所述视频实体的关键词,构成关键词组；将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系,构建新的知识图谱。通过上述方式,本发明实施例能够精确定位视频类别和主题,提供准确的视频分类数据,提供准确的视频关联数据,提供视频推荐能力。(The embodiment of the invention relates to the technical field of video processing, and discloses a knowledge graph construction method, a knowledge graph construction device and a calculation device based on video subtitles, wherein the method comprises the following steps: acquiring a video entity uploaded by a user, and extracting video subtitles according to the video; acquiring keywords of the video entity according to the video entity and the video caption to form a keyword group; and transmitting a data set consisting of the video entity identification, the video entity name and the key phrase to a server end so as to acquire the entity relationship between the video entity and other video entities in the knowledge graph according to the key phrase and construct a new knowledge graph. Through the mode, the video classification and theme can be accurately positioned, accurate video classification data is provided, accurate video associated data is provided, and video recommendation capability is provided.)

技术领域

本发明实施例涉及视频处理技术领域，具体涉及一种基于视频字幕的知识图谱构建方法、装置及计算设备。

背景技术

现有的视频推荐、舆情分析等服务常用的视频关系方法有三种：1)根据视频提交者所提供的关键词，视频标题等信息进行分类，当用户浏览、搜索、观看或者收藏过类似关键词、视频标题的视频后，会对某户的偏好权重进行调整，进而更新用户偏好模型，或者根据实时热点，或者实时上升热点视频等信息更新舆情模型。当对用户进行视频推荐时，采用用户偏好模型和舆情模型，推算出用户当前最感兴趣的分类/关键词，按照热度、播放量、是否曾经观看等因素或者用户自定义排序进行展示。当对舆情进行监控时，则需要对最近播放量/播放视频的分类和标题，偏好用户特征进行统计，输入相应模型进行分析。2)根据视频评论及热度进行分析，根据一定的NLP(自然语言处理)算法提取评论中的关键词进行后续步骤。3)采用视频标题、分类以及视频评论一起进行判断，是前面两种方法的集成。

对于使用视频关键词、视频标题进行分类和视频推荐的方法，由于视频标题、关键词等内容由用户自定义，受人为主观因素影响，会出现脏数据，导致结果不能真实反映视频内容；当出现恶意视频时，上传者只需要通过规避恶意关键词，选择其他分类或者采用无恶意标题等方法，就可以“安全”上传。对于使用视频评论进行分类和推荐的方法，评论由视频的观看人员主动评论，内容由发布者自行决定，其核心观点及内容与视频本身有区别，或者由人为引导有所偏差。由于上述数据问题导致后续结果有偏差或者有错误，在实际使用的情况下将会引起不可预见的结果，例如将不合适内容推送给儿童、关联视频不能引起用户兴趣导致用户流失、对舆论热点把握错误引起社会问题等。

另外现有技术中，所有的运算过程在服务器端进行，当大体量、高并发用户行为产生时，给后台带来大量运行压力，需要考验后台服务器运算能力，将会加大使用者开销，有极大的可能性影响用户感知。

发明内容

鉴于上述问题，本发明实施例提供了一种基于视频字幕的知识图谱构建方法、装置及计算设备，克服了上述问题或者至少部分地解决了上述问题。

根据本发明实施例的一个方面，提供了一种基于视频字幕的知识图谱构建方法，所述方法包括：获取用户上传的视频实体，并根据所述视频提取的视频字幕；根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组；将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系，构建新的知识图谱。

在一种可选的方式中，所述根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组，包括：将所述视频实体标识、所述视频实体名称以及所述视频字幕组成分布式数据集，并对所述分布式数据集进行预处理；对所述分布式数据集进行分词操作，获取分词后的词语数据；将获取的所述词语数据进行二次干扰处理；从二次干扰处理后的所述词语数据中提取所述视频实体的关键词，构成所述关键词组。

在一种可选的方式中，所述从二次干扰处理后的所述词语数据中提取所述视频实体的关键词，构成所述关键词组，包括：采用第一算法从所述词语数据中提取第一关键词数据；采用第二算法从所述词语数据中提取第二关键词数据；合并所述第一关键词数据和所述第二关键词数据，构成所述关键词组。

根据本发明实施例的另一个方面，提供了一种基于视频字幕的知识图谱构建方法，所述方法包括：接收用户端上传的第一视频实体的数据集，其中所述数据集包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组；计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度；根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建新的知识图谱；为所述新的知识图谱提供对外服务接口以方便进行视频推荐服务。

在一种可选的方式中，所述计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度，包括：计算所述第一关键词组中的任一个关键词与所述第二关键词组中的任一个关键词的语义相似度P_i；根据所述语义相似度P_i应用以下关系式计算所述第一关键词组与所述第二关键词组的相似度P：

其中，i为正整数，n为所述第一关键词组中关键词的个数，m为所述第二关键词组中关键词的个数。

在一种可选的方式中，所述根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建新的知识图谱，包括：如果所述第一关键词组与所述第二关键词组的相似度大于等于第一阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为强关联；如果所述第一关键词组与所述第二关键词组的相似度小于所述第一阈值，且大于等于第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为弱关联；如果所述第一关键词组与所述第二关键词组的相似度小于所述第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为无关联；在所述原始知识图谱中增加新的节点，建立所述第一视频实体与所述第二视频实体的双向关系。

根据本发明实施例的另一个方面，提供了一种基于视频字幕的知识图谱构建装置，所述装置包括：字幕提取单元，用于获取用户上传的视频实体，并根据所述视频提取的视频字幕；关键词获取单元，用于根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组；发送单元，用于将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系，构建新的知识图谱。

根据本发明实施例的另一个方面，提供了一种基于视频字幕的知识图谱构建装置，所述装置包括：接收单元，用于接收用户端上传的第一视频实体的数据集，其中所述数据集包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组；计算单元，用于计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度；图谱构建单元，用于根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建知识图谱；接口服务单元，用于为所述知识图谱提供对外服务接口以方便进行视频推荐服务。

根据本发明实施例的另一方面，提供了一种计算设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行上述基于视频字幕的知识图谱构建方法的步骤。

根据本发明实施例的又一方面，提供了一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使所述处理器执行上述基于视频字幕的知识图谱构建方法的步骤。

本发明实施例通过获取用户上传的视频实体，并根据所述视频提取的视频字幕；根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组；将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系，构建新的知识图谱，能够精确定位视频类别和主题，提供准确的视频分类数据，提供准确的视频关联数据，提供视频推荐能力。

上述说明仅是本发明实施例技术方案的概述，为了能够更清楚了解本发明实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的

具体实施方式

。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的基于视频字幕的知识图谱构建系统示意图；

图2示出了本发明实施例提供的基于视频字幕的知识图谱构建方法的流程示意图；

图3示出了本发明实施例提供的基于视频字幕的知识图谱构建方法的关键词组获取示意图；

图4示出了本发明又一实施例提供的基于视频字幕的知识图谱构建方法的流程示意图；

图5示出了本发明又一实施例提供的基于视频字幕的知识图谱构建方法的语义相似度获取示意图；

图6示出了本发明实施例提供的基于视频字幕的知识图谱构建装置的结构示意图；

图7示出了本发明又一实施例提供的基于视频字幕的知识图谱构建装置的结构示意图；

图8示出了本发明实施例提供的计算设备的结构示意图；

图9示出了本发明又一实施例提供的计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

本发明实施例的基于视频字幕的知识图谱构建系统包括用户端和服务器端，具体如图1所示，用户将视频实体上传至用户端，用户端提取该视频实体对应的视频字幕，基于视频字幕进行自然语言处理，获取关键词组，准确把握视频主题及内容，将视频实体标识、视频实体名称以及关键词组构成的数据集传输至服务器端。服务器端获取该视频实体对应的关键词组与原始知识图谱中其他视频实体对应的关键词组的相似度，并基于相似度获取两者之间双向的实体关系，在原始知识图谱中增加新的节点，建立该视频实体与原始知识图谱中其他视频实体的双向关系，构建视频关系模型，形成新的知识图谱。服务器端还为知识图谱提供对外服务接口，支持种类服务，如此可以方便用户根据知识图谱进行视频推荐服务，为用户提供简明，准确的视频关系数据，为后续数据应用提供帮助。

图2示出了本发明实施例提供的基于视频字幕的知识图谱构建方法的流程示意图。该基于视频字幕的知识图谱构建方法主要应用于用户端。如图2所示，该基于视频字幕的知识图谱构建方法包括：

步骤S11：获取用户上传的视频实体，并根据所述视频提取的视频字幕。

具体地，如果所述视频实体有外挂字幕，则读取外挂字幕文件，并进行文本处理得到所述视频字幕；如果所述视频实体有内嵌字幕，则应用字幕提取工具提取所述视频字幕。具体可以采用图像识别提取字幕，或者采用语音识别提取字幕等。字幕提取已有很多现有工具和开源包，在此不做赘述。

步骤S12：根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组。

具体地，如图3所示，将所述视频实体标识(ID)、所述视频实体名称以及所述视频字幕组成分布式数据集(dataframe)，并对所述分布式数据集进行预处理。对分布式数据集进行预处理主要是进行数据清洗，包括：去除无效词语、停用词，如字幕中可能残留的时间标记；去除无效分隔符，如标点符号；统一大小写以避免相同英文单词因大小写问题导致误读；全称和缩写统一，避免误读等。

然后对所述分布式数据集进行分词操作，获取分词后的词语数据。具体将数据导入分词系统采用全模式进行分词操作，分词基础数据分为语义知识库，领域词库，领域语料词库，评价语料库等，分词的同时确定词性。

进一步将获取的所述词语数据进行二次干扰处理，如去掉由上一步骤带来的词语干扰项，如无效语气词、助词等，以及指代消除等。最后从二次干扰处理后的所述词语数据中提取所述视频实体的关键词，构成所述关键词组。具体采用第一算法从所述词语数据中提取第一关键词数据；采用第二算法从所述词语数据中提取第二关键词数据；合并所述第一关键词数据和所述第二关键词数据，构成所述关键词组。在本发明实施例中，采用词频-逆文档频率(Term Frequency-Inverse Document Frequency，TF-IDF)算法进行第一关键词数据提取，字词的重要性随着它在dataframe中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。其中语料库为知识图谱中已存在的关键词集合。采用潜在语义分析(Latent semantic analysis，LSA)算法进行第二关键词数据进行提取，然后将得到的第一关键词数据和第二关键词数据做并集处理，得到关键词组。

步骤S13：将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述视频实体获取所述视频实体与知识图谱中其他视频实体的实体关系，构建新的知识图谱。

获取到关键词组后，将关键词组与视频实体标识、视频实体名称组成数据集。例如，得到的数据集如下：

然后将数据集上传至服务器端，使服务器端能够根据关键词组获取视频实体与知识图谱中其他视频实体的实体关系，进而构建新的知识图谱。

本发明实施例利用视频字幕，采用自然语言处理中的TF/IDF算法与LSA算法的混用，能够精确抓取视频内容的关键词，不受人为原因影响，不受舆论评论引导，真实反应视频内容，提供准确的视频分类数据，根据数据能够精确定位视频类别和主题，为后续处理提供帮助，提供准确的视频分类数据。本发明实施例还采用边缘计算方法，将部分高计算下放至用户端，在用户端上传视频时就进行视频分类处理，能够节约服务器资源。

图4示出了本发明实施例提供的基于视频字幕的知识图谱构建方法的流程示意图。该基于视频字幕的知识图谱构建方法主要应用于服务器端。如图4所示，该基于视频字幕的知识图谱构建方法包括：

步骤S21：接收用户端上传的第一视频实体的数据集，其中所述数据集包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组。

本发明实施例中的知识图谱是反应实体与实体之间关系的数据表现形式，以非结构化数据表现事务关系。知识图谱中需要有三个要素：实体，实体属性，实体关系。其中，实体为视频实体本身、实体属性数据为获取的与视频实体对应的关键词组中的关键词。实体关系为两个视频实体之间的双向关系，本发明实施例需要提取两个视频实体之间实体关系用于构建知识图谱。在步骤S21中，接收用户端上传的第一视频实体的数据集，包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组，以便后续根据第一关键词组获取原始知识图谱中其他视频实体的实体关系。

步骤S22：计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度。

在本发明实施例中，计算所述第一关键词组中的任一个关键词与所述第二关键词组中的任一个关键词的语义相似度P_i。例如，如图5所示，采用word2vec计算视频实体A的关键词组中n个关键词，与视频实体B的关键词组中m个关键词之间的语义相似度，对于视频实体A，获得n*m个语义相似度P_i，其值范围从-1到1。其中，视频实体B为从原始知识图谱中选择的视频实体。在本发明实施例中，可以在原始知识图谱中选择与第一视频实体对应的关键词重复数量较多的视频实体作为视频实体B。

进一步根据所述语义相似度P_i应用以下关系式计算所述第一关键词组与所述第二关键词组的相似度P：

其中，i为正整数，n为所述第一关键词组中关键词的个数，m为所述第二关键词组中关键词的个数。此处认为每个关键词对最终结果的影响是一样的。

步骤S23：根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建新的知识图谱。

在本发明实施例中，如果所述第一关键词组与所述第二关键词组的相似度大于等于第一阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为强关联；如果所述第一关键词组与所述第二关键词组的相似度小于所述第一阈值，且大于等于第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为弱关联；如果所述第一关键词组与所述第二关键词组的相似度小于所述第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为无关联。其中，第一阈值大于第二阈值，第一阈值和第二阈值可以根据需要设置，优选地，第一阈值为0.5，第二阈值为0.2。

完成第一视频实体与第二视频实体的实体关系判断后，在所述原始知识图谱中增加新的节点，建立所述第一视频实体与所述第二视频实体的双向关系。例如，构建语句如下(以neo4j数据库为例)：

CREATE(videoA:keyWord1::keyWord2:keyWord3)

MATCH(videoA:video_A),(videoB:video_B)

CREATE(videoA:video_A)<-(r:relationship)->(videoB:video_B)

RETURN r

在本发明实施例中，可以重复上述步骤，从原始知识图谱中选择多个第二视频实体，优选为选择3，4个第二视频实体，选择方法与前面相同。分别计算第一视频实体与多个第二视频实体的实体关系，并在增加的第一视频实体的节点时，建立第一视频实体与多个第二视频实体和双向关系，构建新的知识图谱。

步骤S24：为所述新的知识图谱提供对外服务接口以方便进行视频推荐服务。

具体地，整合spring、springMVC、MyBatis、shiro、redis(ehcache)+Nginix等框架，提供标准/自定义(需定制开发)的对外服务接口，如此，针对视频关系知识图谱应用，将视频之间的关系进行了简化，为对外提供视频知识图谱能力，为视频推荐，舆情控制等相关应用提供数据及能力，为数据使用者提供简明，准确的视频关系数据，为后续数据应用提供帮助。本发明实施例通过简化视频间关系逻辑，由简明分类代替关联性数据，准确描述视频之间的关系，构建知识图谱中的关系值，提供视频推荐能力，在实际应用中利于用户使用。

本发明实施例通过接收用户端上传的第一视频实体的数据集，其中所述数据集包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组；计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度；根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建新的知识图谱；为所述新的知识图谱提供对外服务接口以方便进行视频推荐服务，能够提供准确的视频关联数据，准确描述视频之间的关系，构建知识图谱中的关系值，提供视频推荐能力，在实际应用中利于用户使用，提高用户感知。

图6示出了本发明实施例的基于视频字幕的知识图谱构建装置的结构示意图。如图6所示，该基于视频字幕的知识图谱构建装置设置于用户端，包括：字幕提取单元601、关键词获取单元602以及发送单元603。其中：

字幕提取单元601用于获取用户上传的视频实体，并根据所述视频提取的视频字幕；关键词获取单元602用于根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组；发送单元603用于将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系，构建新的知识图谱。

在一种可选的方式中，关键词获取单元602用于：将所述视频实体标识、所述视频实体名称以及所述视频字幕组成分布式数据集，并对所述分布式数据集进行预处理；对所述分布式数据集进行分词操作，获取分词后的词语数据；将获取的所述词语数据进行二次干扰处理；从二次干扰处理后的所述词语数据中提取所述视频实体的关键词，构成所述关键词组。

在一种可选的方式中，关键词获取单元602用于：采用第一算法从所述词语数据中提取第一关键词数据；采用第二算法从所述词语数据中提取第二关键词数据；合并所述第一关键词数据和所述第二关键词数据，构成所述关键词组。

图7示出了本发明又一实施例的基于视频字幕的知识图谱构建装置的结构示意图。如图7所示，该基于视频字幕的知识图谱构建装置设置于服务器端，包括：接收单元701、计算单元702、图谱构建单元703以及接口服务单元704。其中：

接收单元701用于接收用户端上传的第一视频实体的数据集，其中所述数据集包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组；计算单元702用于计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度；图谱构建单元703用于根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建知识图谱；接口服务单元704用于为所述知识图谱提供对外服务接口以方便进行视频推荐服务。

在一种可选的方式中，计算单元702用于：计算所述第一关键词组中的任一个关键词与所述第二关键词组中的任一个关键词的语义相似度P_i；根据所述语义相似度P_i应用以下关系式计算所述第一关键词组与所述第二关键词组的相似度P：

其中，i为正整数，n为所述第一关键词组中关键词的个数，m为所述第二关键词组中关键词的个数。

在一种可选的方式中，图谱构建单元703用于：如果所述第一关键词组与所述第二关键词组的相似度大于等于第一阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为强关联；如果所述第一关键词组与所述第二关键词组的相似度小于所述第一阈值，且大于等于第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为弱关联；如果所述第一关键词组与所述第二关键词组的相似度小于所述第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为无关联；在所述原始知识图谱中增加新的节点，建立所述第一视频实体与所述第二视频实体的双向关系。

本发明实施例提供了一种非易失性计算机存储介质，所述计算机存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于视频字幕的知识图谱构建方法。

可执行指令具体可以用于使得处理器执行以下操作：

获取用户上传的视频实体，并根据所述视频提取的视频字幕；

根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组；

将视频实体标识、视频实体名称以及所述关键词组构成的数据集传输至服务器端以根据所述关键词组获取所述视频实体与知识图谱中其他视频实体的实体关系，构建新的知识图谱。

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

将所述视频实体标识、所述视频实体名称以及所述视频字幕组成分布式数据集，并对所述分布式数据集进行预处理；

对所述分布式数据集进行分词操作，获取分词后的词语数据；

将获取的所述词语数据进行二次干扰处理；

从二次干扰处理后的所述词语数据中提取所述视频实体的关键词，构成所述关键词组。

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

采用第一算法从所述词语数据中提取第一关键词数据；

采用第二算法从所述词语数据中提取第二关键词数据；

合并所述第一关键词数据和所述第二关键词数据，构成所述关键词组。

本发明实施例提供了又一种非易失性计算机存储介质，所述计算机存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于视频字幕的知识图谱构建方法。

可执行指令具体可以用于使得处理器执行以下操作：

接收用户端上传的第一视频实体的数据集，其中所述数据集包括第一视频实体标识、第一视频实体名称以及根据所述第一视频实体提取的第一关键词组；

计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度；

根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建新的知识图谱；

为所述新的知识图谱提供对外服务接口以方便进行视频推荐服务。

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

计算所述第一关键词组中的任一个关键词与所述第二关键词组中的任一个关键词的语义相似度P_i；

根据所述语义相似度P_i应用以下关系式计算所述第一关键词组与所述第二关键词组的相似度P：

其中，i为正整数，n为所述第一关键词组中关键词的个数，m为所述第二关键词组中关键词的个数。

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

如果所述第一关键词组与所述第二关键词组的相似度大于等于第一阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为强关联；

如果所述第一关键词组与所述第二关键词组的相似度小于所述第一阈值，且大于等于第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为弱关联；

如果所述第一关键词组与所述第二关键词组的相似度小于所述第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为无关联；

在所述原始知识图谱中增加新的节点，建立所述第一视频实体与所述第二视频实体的双向关系。

本发明实施例提供了一种计算机程序产品，所述计算机程序产品包括存储在计算机存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述任意方法实施例中的基于视频字幕的知识图谱构建方法。

可执行指令具体可以用于使得处理器执行以下操作：

获取用户上传的视频实体，并根据所述视频提取的视频字幕；

根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组；

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

将所述视频实体标识、所述视频实体名称以及所述视频字幕组成分布式数据集，并对所述分布式数据集进行预处理；

对所述分布式数据集进行分词操作，获取分词后的词语数据；

将获取的所述词语数据进行二次干扰处理；

从二次干扰处理后的所述词语数据中提取所述视频实体的关键词，构成所述关键词组。

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

采用第一算法从所述词语数据中提取第一关键词数据；

采用第二算法从所述词语数据中提取第二关键词数据；

合并所述第一关键词数据和所述第二关键词数据，构成所述关键词组。

本发明实施例提供了又一种计算机程序产品，所述计算机程序产品包括存储在计算机存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述任意方法实施例中的基于视频字幕的知识图谱构建方法。

可执行指令具体可以用于使得处理器执行以下操作：

计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度；

根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建新的知识图谱；

为所述新的知识图谱提供对外服务接口以方便进行视频推荐服务。

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

计算所述第一关键词组中的任一个关键词与所述第二关键词组中的任一个关键词的语义相似度P_i；

根据所述语义相似度P_i应用以下关系式计算所述第一关键词组与所述第二关键词组的相似度P：

其中，i为正整数，n为所述第一关键词组中关键词的个数，m为所述第二关键词组中关键词的个数。

在一种可选的方式中，所述可执行指令使所述处理器执行以下操作：

如果所述第一关键词组与所述第二关键词组的相似度大于等于第一阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为强关联；

如果所述第一关键词组与所述第二关键词组的相似度小于所述第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为无关联；

在所述原始知识图谱中增加新的节点，建立所述第一视频实体与所述第二视频实体的双向关系。

图8示出了本发明实施例提供的计算设备的结构示意图，本发明具体实施例并不对设备的具体实现做限定。

如图8所示，该计算设备可以包括：处理器(processor)802、通信接口(Communications Interface)804、存储器(memory)806、以及通信总线808。

其中：处理器802、通信接口804、以及存储器806通过通信总线808完成相互间的通信。通信接口804，用于与其它设备比如客户端或其它服务器等的网元通信。处理器802，用于执行程序810，具体可以执行上述基于视频字幕的知识图谱构建方法实施例中的相关步骤。

具体地，程序810可以包括程序代码，该程序代码包括计算机操作指令。

处理器802可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或各个集成电路。设备包括的一个或各个处理器，可以是同一类型的处理器，如一个或各个CPU；也可以是不同类型的处理器，如一个或各个CPU以及一个或各个ASIC。

存储器806，用于存放程序810。存储器806可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序810具体可以用于使得处理器802执行以下操作：

获取用户上传的视频实体，并根据所述视频提取的视频字幕；

根据所述视频实体以及所述视频字幕获取所述视频实体的关键词，构成关键词组；

在一种可选的方式中，所述程序810使所述处理器执行以下操作：

将所述视频实体标识、所述视频实体名称以及所述视频字幕组成分布式数据集，并对所述分布式数据集进行预处理；

对所述分布式数据集进行分词操作，获取分词后的词语数据；

将获取的所述词语数据进行二次干扰处理；

从二次干扰处理后的所述词语数据中提取所述视频实体的关键词，构成所述关键词组。

在一种可选的方式中，所述程序810使所述处理器执行以下操作：

采用第一算法从所述词语数据中提取第一关键词数据；

采用第二算法从所述词语数据中提取第二关键词数据；

合并所述第一关键词数据和所述第二关键词数据，构成所述关键词组。

图9示出了本发明实施例提供的又一计算设备的结构示意图，本发明具体实施例并不对设备的具体实现做限定。

如图9所示，该计算设备可以包括：处理器902、通信接口904、存储器906、以及通信总线908。

其中：处理器902、通信接口904、以及存储器906通过通信总线908完成相互间的通信。通信接口904，用于与其它设备比如客户端或其它服务器等的网元通信。处理器902，用于执行程序910，具体可以执行上述基于视频字幕的知识图谱构建方法实施例中的相关步骤。

具体地，程序910可以包括程序代码，该程序代码包括计算机操作指令。

处理器902可能是中央处理器CPU，或者是特定集成电路ASIC，或者是被配置成实施本发明实施例的一个或各个集成电路。设备包括的一个或各个处理器，可以是同一类型的处理器，如一个或各个CPU；也可以是不同类型的处理器，如一个或各个CPU以及一个或各个ASIC。

存储器906，用于存放程序910。存储器906可能包含高速RAM存储器，也可能还包括非易失性存储器，例如至少一个磁盘存储器。

程序910具体可以用于使得处理器902执行以下操作：

计算所述第一关键词组与原始知识图谱中的第二视频实体对应的第二关键词组的相似度；

根据所述相似度确定所述第一视频实体与所述第二视频实体的实体关系，构建新的知识图谱；

为所述新的知识图谱提供对外服务接口以方便进行视频推荐服务。

在一种可选的方式中，所述程序910使所述处理器执行以下操作：

计算所述第一关键词组中的任一个关键词与所述第二关键词组中的任一个关键词的语义相似度P_i；

根据所述语义相似度P_i应用以下关系式计算所述第一关键词组与所述第二关键词组的相似度P：

其中，i为正整数，n为所述第一关键词组中关键词的个数，m为所述第二关键词组中关键词的个数。

在一种可选的方式中，所述程序910使所述处理器执行以下操作：

如果所述第一关键词组与所述第二关键词组的相似度大于等于第一阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为强关联；

如果所述第一关键词组与所述第二关键词组的相似度小于所述第二阈值，则确定所述第一视频实体与所述第二视频实体的实体关系为无关联；

在所述原始知识图谱中增加新的节点，建立所述第一视频实体与所述第二视频实体的双向关系。

在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤，除有特殊说明外，不应理解为对执行顺序的限定。

23页详细技术资料下载

基于视频字幕的知识图谱构建方法、装置及计算设备

相关技术

网友询问留言