一种视频字幕匹配程度的确定方法、装置及电子设备

文档序号:1875564 发布日期:2021-11-23 浏览:11次 >En<

阅读说明:本技术 一种视频字幕匹配程度的确定方法、装置及电子设备 (Method and device for determining matching degree of video subtitles and electronic equipment ) 是由 牟晋勇 于 2021-08-27 设计创作,主要内容包括:本发明实施例提供了一种视频字幕匹配程度的确定方法、装置及电子设备,上述方法包括:获取目标外语视频的外语台词和对应的中文字幕;从预设的单词音标库中查询外语台词包括的单词对应的音标,并基于音标确定每个单词对应的发音变化次数;根据发音变化次数和中文字幕的字数,确定目标外语视频的外语台词与中文字幕的匹配程度。采用上述方法可以根据所确定的目标外语视频的外语台词与中文字幕的匹配程度的高低,将用户喜好程度高的外语视频即外语台词与中文字幕的匹配程度高的外语视频推荐给用户,提高了对用户推荐外语视频的推荐效果。(The embodiment of the invention provides a method, a device and electronic equipment for determining the matching degree of video subtitles, wherein the method comprises the following steps: acquiring foreign language lines and corresponding Chinese subtitles of a target foreign language video; inquiring phonetic symbols corresponding to words included in foreign language lines from a preset word phonetic symbol library, and determining pronunciation change times corresponding to each word based on the phonetic symbols; and determining the matching degree of the foreign language lines of the target foreign language video and the Chinese subtitles according to the pronunciation change times and the number of the Chinese subtitles. By adopting the method, the foreign language video with high user preference degree, namely the foreign language speech and the foreign language video with high Chinese subtitle matching degree can be recommended to the user according to the determined matching degree of the foreign language speech and the Chinese subtitle of the target foreign language video, so that the recommendation effect of recommending the foreign language video to the user is improved.)

一种视频字幕匹配程度的确定方法、装置及电子设备

技术领域

本发明涉及计算机技术领域,特别是涉及一种视频字幕匹配程度的确定方法、装置及电子设备。

背景技术

在日常观影生活中,用户会观看大量的外语电影、电视剧、综艺等视频,如好莱坞电影、迪士尼动漫等英语视频。通常,外语视频中的人物用外语表达的同时,视频下方会展示对应翻译的中文字幕,以使观众了解视频表达的意思。

然而,在外语视频的实际播放过程中,由于外语视频中人物的外语发音口型变化与翻译后的中文字幕之间存在差异,会让用户感觉外语视频中的人物表达不自然,影响用户的观看体验,进而导致用户对外语视频的喜好程度降低。

由此可见,外语视频中人物表达外语单词的口型变化与中文字幕的对应程度,会影响用户对该外语视频的喜好程度,口型变化与中文字幕的对应程度越高,用户对该外语视频的喜好程度越高。基于此,如果视频软件将人物表达外语单词的口型变化与中文字幕对应程度很低的外语视频推荐给用户,势必会影响用户的使用体验。因此,如何确定外语视频中人物表达外语单词的口型变化与中文字幕的对应程度,以提高外语视频的推荐效果成为了一个亟待解决的问题。

发明内容

本发明实施例的目的在于提供一种视频字幕匹配程度的确定方法、装置及电子设备,以确定外语视频中人物表达外语单词的口型变化与中文字幕的对应程度。

在本发明实施的第一方面,首先提供了一种视频字幕匹配程度的确定方法,包括:

获取目标外语视频的外语台词和对应的中文字幕;

从预设的单词音标库中查询所述外语台词包括的单词对应的音标,并基于所述音标确定每个所述单词对应的发音变化次数;

根据所述发音变化次数和所述中文字幕的字数,确定所述目标外语视频的外语台词与中文字幕的匹配程度。

可选的,所述基于所述音标确定每个所述单词对应的发音变化次数,包括:

确定每个所述单词对应的音标中元音的数量;

将所述元音的数量确定为该单词对应的发音变化次数。

可选的,所述根据所述发音变化次数和所述中文字幕的字数,确定所述目标外语视频的外语台词与中文字幕的匹配程度,包括:

针对所述目标外语视频的每一句外语台词,将该句外语台词包括的单词对应的发音变化次数之和确定为该句外语台词的发音变化次数;

确定所述目标外语视频的每一句外语台词对应的中文字幕的字数;

遍历所述目标外语视频的每一句外语台词,基于该句外语台词的发音变化次数和该句外语台词对应的中文字幕的字数,确定该句外语台词与对应的中文字幕之间的差异率;

根据所述目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,确定所述目标外语视频的外语台词与中文字幕的匹配程度。

可选的,所述基于该句外语台词的发音变化次数和该句外语台词对应的中文字幕的字数,确定该句外语台词与对应的中文字幕之间的差异率,包括:

如果该句外语台词的发音变化次数大于该句外语台词对应的中文字幕的字数,将该句外语台词对应的中文字幕的字数与该句外语台词的发音变化次数的比值,确定为该句外语台词与对应的中文字幕之间的差异率;

如果该句外语台词的发音变化次数小于等于该句外语台词对应的中文字幕的字数,将该句外语台词的发音变化次数与该句外语台词对应的中文字幕的字数的比值,确定为该句外语台词与对应的中文字幕之间的差异率。

可选的,所述根据所述目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,确定所述目标外语视频的外语台词与中文字幕的匹配程度,包括:

计算所述目标外语视频的外语台词与对应的中文字幕之间的差异率的平均值,作为平均差异率;

基于所述平均差异率和所述目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,计算所述目标外语视频的外语台词与对应的中文字幕之间的差异率的标准方差;

如果所述平均差异率大于等于预设差异率阈值,且所述标准方差小于等于预设波动阈值,确定所述目标外语视频的外语台词与中文字幕的匹配程度为第一匹配度,否则确定所述目标外语视频的外语台词与中文字幕的匹配程度为第二匹配度,其中,所述第一匹配度大于所述第二匹配度。

可选的,在所述确定所述目标外语视频的外语台词与中文字幕的匹配程度之后,所述方法还包括:

如果所述目标外语视频为待推荐视频,基于所述目标外语视频的外语台词与中文字幕的匹配程度,向用户推荐所述目标外语视频。

在本发明实施的第二方面,还提供了一种视频字幕匹配程度的确定装置,包括:

台词获取模块,用于获取目标外语视频的外语台词和对应的中文字幕;

变化次数确定模块,用于从预设的单词音标库中查询所述外语台词包括的单词对应的音标,并基于所述音标确定每个所述单词对应的发音变化次数;

匹配程度确定模块,用于根据所述发音变化次数和所述中文字幕的字数,确定所述目标外语视频的外语台词与中文字幕的匹配程度。

可选的,所述变化次数确定模块,具体用于确定每个所述单词对应的音标中元音的数量;将所述元音的数量确定为该单词对应的发音变化次数。

可选的,所述匹配程度确定模块,包括:

次数确定子模块,用于针对所述目标外语视频的每一句外语台词,将该句外语台词包括的单词对应的发音变化次数之和确定为该句外语台词的发音变化次数;

字数确定子模块,用于确定所述目标外语视频的每一句外语台词对应的中文字幕的字数;

差异率确定子模块,用于遍历所述目标外语视频的每一句外语台词,基于该句外语台词的发音变化次数和该句外语台词对应的中文字幕的字数,确定该句外语台词与对应的中文字幕之间的差异率;

匹配程度确定子模块,用于根据所述目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,确定所述目标外语视频的外语台词与中文字幕的匹配程度。

可选的,所述差异率确定子模块,具体用于如果该句外语台词的发音变化次数大于该句外语台词对应的中文字幕的字数,将该句外语台词对应的中文字幕的字数与该句外语台词的发音变化次数的比值,确定为该句外语台词与对应的中文字幕之间的差异率;如果该句外语台词的发音变化次数小于等于该句外语台词对应的中文字幕的字数,将该句外语台词的发音变化次数与该句外语台词对应的中文字幕的字数的比值,确定为该句外语台词与对应的中文字幕之间的差异率。

可选的,所述匹配程度确定子模块,具体用于计算所述目标外语视频的外语台词与对应的中文字幕之间的差异率的平均值,作为平均差异率;基于所述平均差异率和所述目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,计算所述目标外语视频的外语台词与对应的中文字幕之间的差异率的标准方差;如果所述平均差异率大于等于预设差异率阈值,且所述标准方差小于等于预设波动阈值,确定所述目标外语视频的外语台词与中文字幕的匹配程度为第一匹配度,否则确定所述目标外语视频的外语台词与中文字幕的匹配程度为第二匹配度,其中,所述第一匹配度大于所述第二匹配度。

可选的,所述装置还包括视频推荐模块,用于如果所述目标外语视频为待推荐视频,基于所述目标外语视频的外语台词与中文字幕的匹配程度,向用户推荐所述目标外语视频。

在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述任一所述的视频字幕匹配程度的确定方法步骤。

在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的视频字幕匹配程度的确定方法。

在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的视频字幕匹配程度的确定方法。

采用本发明实施例提供的方法,可以通过获取目标外语视频的外语台词和对应的中文字幕;从预设的单词音标库中查询外语台词包括的单词对应的音标,并基于音标确定每个单词对应的发音变化次数;根据发音变化次数和中文字幕的字数,确定目标外语视频的外语台词与中文字幕的匹配程度。进一步的,可以根据所确定的目标外语视频的外语台词与中文字幕的匹配程度的高低,将用户喜好程度高的外语视频即外语台词与中文字幕的匹配程度高的外语视频推荐给用户,提高了对用户推荐外语视频的推荐效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的视频字幕匹配程度的确定方法的一种流程图;

图2为本发明实施例提供的确定目标外语视频的外语台词与中文字幕的匹配程度的一种流程图;

图3为本发明实施例提供的视频字幕匹配程度的确定装置的一种结构示意图;

图4为本发明实施例提供的视频字幕匹配程度的确定装置的另一种结构示意图;

图5为本发明实施例提供的视频字幕匹配程度的确定装置的又一种结构示意图;

图6为本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

由于外语视频中人物表达外语单词的口型变化与中文字幕的对应程度会影响用户的使用体验,而现有技术中并没有有效的可以确定外语视频中人物表达外语单词的口型变化与中文字幕的对应程度的方法,因此,为了确定外语视频中人物表达外语单词的口型变化与中文字幕的对应程度,进而提高外语视频的推荐效果,本发明实施例提供了一种视频字幕匹配程度的确定方法、装置及电子设备。

图1为本发明实施例提供的视频字幕匹配程度的确定方法的一种流程图,如图1所示,所述方法包括:

步骤101,获取目标外语视频的外语台词和对应的中文字幕。

步骤102,从预设的单词音标库中查询外语台词包括的单词对应的音标,并基于音标确定每个单词对应的发音变化次数。

步骤103,根据发音变化次数和中文字幕的字数,确定目标外语视频的外语台词与中文字幕的匹配程度。

采用本发明实施例提供的方法,可以通过获取目标外语视频的外语台词和对应的中文字幕;从预设的单词音标库中查询外语台词包括的单词对应的音标,并基于音标确定每个单词对应的发音变化次数;根据发音变化次数和中文字幕的字数,确定目标外语视频的外语台词与中文字幕的匹配程度。进一步的,可以根据所确定的目标外语视频的外语台词与中文字幕的匹配程度的高低,将用户喜好程度高的外语视频即外语台词与中文字幕的匹配程度高的外语视频推荐给用户,提高了对用户推荐外语视频的推荐效果。

本发明实施例中,外语视频可以为英语视频、法语视频或德语视频等等。具体的,外语视频具体可以为外语电影视频、外语综艺视频和外语新闻视频等等。目标外语视频可以为一部完整的外语电影视频、一期完整的外语综艺视频或一期完整的外语新闻视频,目标外语视频也可以为一部完整的外语电影视频中的部分片段、一期完整的外语综艺视频的部分片段或一期完整的外语新闻视频的部分片段,此处不做具体限定。

本发明实施例中,可以将外语视频存储于服务端的数据库中。服务端可以直接针对需要确定视频字幕匹配程度的目标外语视频,确定其外语台词与中文字幕的匹配程度。本发明实施例中也可以针对在客户端播放的目标外语视频确定其外语台词与中文字幕的匹配程度:在需要确定视频字幕匹配程度时,客户端可以将目标外语视频的外语台词和对应的中文字幕发送至服务端,然后服务端采用本发明实施例提供的方法确定其外语台词与中文字幕的匹配程度。

本发明实施例中,可以在服务端维护一个外语单词与其音标的对应关系库,即预设的单词音标库。预设的单词音标库中存储有每个外语单词与其音标,且预设的单词音标库中每个外语单词与其音标可以对应存储。例如,可以在服务端维护一个存储有每个英语单词与其音标预设的单词音标库,则可以在该预设的单词音标库查找到每个英语单词的音标,例如可以查找到英文单词banana的英式音标和美式音标

在一种可能的实施方式中,上述基于音标确定每个单词对应的发音变化次数,具体可以包括步骤A1-A2:

步骤A1:确定每个单词对应的音标中元音的数量。

步骤A2:将元音的数量确定为该单词对应的发音变化次数。

若目标外语视频为英语视频,本发明实施例中服务端可以维护的存储英语单词与其音标的预设的英语单词音标库中。该预设的英语单词音标库中存储英语音标中的元音和辅音等,例如其所存储的元音的词表可以包括如下的单元音和双元音:

单元音:[i:]、[i]、[u:]、[u]、[ɑ:]、[Λ]、[e]、

双元音:[ei]、[ai]、[au]、

本实施方式中,可以针对目标外语视频的每一个单词,在该预设的英语单词音标库中查找其音标,并确定其音标中元音的数量,将其音标中元音的数量确定为其对应的发音变化次数。若目标外语视频中包括英文单词banana,则可以在该预设的英语单词音标库中查找banana的音标:英式音标和美式音标可以确定banana的英式音标中的元音包括[ɑ:]和banana的美式音标中的元音包括因此,无论是按照美式音标还是按照英式音标,banana的音标中元音的数量都为3,则可以确定英文单词banana对应的发音变化次数为3。单词对应的发音变化次数可以反映人物在读该单词是口型变化的次数,且人物在读该单词是口型变化的次数与该单词对应的发音变化次数一致,例如,人物在读单词banana时口型变化3次,口型变化次数与banana对应的发音变化次数一致。

在一种可能的实施方式中,图2为本发明实施例提供的确定目标外语视频的外语台词与中文字幕的匹配程度的一种流程图,如图2所示,上述根据发音变化次数和中文字幕的字数,确定目标外语视频的外语台词与中文字幕的匹配程度的步骤,具体可以包括:

步骤201,针对目标外语视频的每一句外语台词,将该句外语台词包括的单词对应的发音变化次数之和确定为该句外语台词的发音变化次数。

本发明实施例中,目标外语视频的每一句外语台词都对应有一句中文字幕,且目标外语视频的每一句外语台词与对应的中文字幕存储时均带有目标外语视频的标识。每一句外语台词和对应的中文字幕均有自身的标识,该标识可以为该句外语台词及其对应的中文字幕在目标视频的所有句台词中的顺序的编号,例如,目标外语视频A的标识为Vid,目标外语视频A中的第三句外语台词的标识为其在目标外语视频A的所有句台词中的顺序的编号E3,且第三句外语台词对应的中文字幕的标识也为其在目标外语视频A的所有句台词中的顺序的编号C3,并且,目标外语视频A中的第三句外语台词和第三句外语台词对应的中文字幕存储时均带有目标外语视频A的标识Vid

每一句外语台词可以包括至少一个单词。本步骤中,可以将每一句外语台词包括的所有单词对应的发音变化次数之和确定为该句外语台词的发音变化次数。

举例说明,例如,目标外语视频为英文视频S,英文视频S中第一句台词为“ayellow banana”,则该句台词中包括单词:a、yellow和banana。可以在该预设的单词音标库中查找单词a的英式音标和美式音标进而可以确定单词a的音标中元音数量为1,即单词a的发音变化次数为1;可以查找单词yellow的英式音标和美式音标进而可以确定单词yellow的音标中元音数量为2,即单词yellow的发音变化次数为2;可以查找单词banana的英式音标和美式音标进而可以确定单词banana的音标中元音数量为3,即单词yellow的发音变化次数为3。所以可以将第一句台词为“ayellow banana”中所有单词“a”、“yellow”和“banana”对应的发音变化次数之和“1+2+3=6”确定为英文视频S中第一句台词为“a yellow banana”发音变化次数。

步骤202,确定目标外语视频的每一句外语台词对应的中文字幕的字数。

举例说明,英文视频S中第一句台词为“a yellow banana”对应的中文字幕为“一根黄色的香蕉”,则可以确定英文视频S中第一句台词为“a yellow banana”对应的中文字幕的字数为7。

步骤203,遍历目标外语视频的每一句外语台词,基于该句外语台词的发音变化次数和该句外语台词对应的中文字幕的字数,确定该句外语台词与对应的中文字幕之间的差异率。

本步骤中,如果该句外语台词的发音变化次数大于该句外语台词对应的中文字幕的字数,将该句外语台词对应的中文字幕的字数与该句外语台词的发音变化次数的比值,确定为该句外语台词与对应的中文字幕之间的差异率;如果该句外语台词的发音变化次数小于等于该句外语台词对应的中文字幕的字数,将该句外语台词的发音变化次数与该句外语台词对应的中文字幕的字数的比值,确定为该句外语台词与对应的中文字幕之间的差异率。

举例说明,若英文视频S中包括N句英文台词,则其所有句的英文台词集合为SEnglish:[E1,E2,…,EN]。可以遍历每一句英文台词Ei,1≤i≤N,并将每一句英文台词Ei中的每个单词Word_X从预设的单词音标库查找出对应的音标SoundMark_X,计算音标SoundMark_X中元音个数Vcount_x,故可得到英文视频S每一句台词Ei中每个单词对应的元音个数集合Vc:[Vcount_1,Vcount_2,…,Vcount_X]。进而,可以得到该英文视频S中所有英文台词集合SEnglish每句英文台词对应的元音总数集合SVc:[Vc_all_1,Vc_all_2,…,Vc_all_N],即该英文视频S中所有英文台词集合SEnglish每句英文台词对应的发音变化次数SVc:[Vc_all_1,Vc_all_2,…,Vc_all_N]。

若目标外语视频为英文视频S,从英文视频S中每句英文台词对应的中文字幕集合为Schinese:[C1,C2,…,CN],遍历每句中文字幕Ci,1≤i≤N,并将每句中文字幕Ci中的汉字的数量Ccount_x,进而,可以得到英文视频S中每句英文台词对应的中文字幕集合SChinese中每句中文字幕的字数的集合Cc:[Ccount_1,Ccount_2,…,Ccount_X]。且每句中文字幕Ci为与每句英文台词Ei对应。

以英文视频S中的第一句英文台词E1和其对应的中文字幕C1为例,如果该句英文台词E1的发音变化次数Vc_all_1大于该句英文台词E1对应的中文字幕的字数Ccount_1,将该句英文台词E1对应的中文字幕的字数Ccount_1与该句英文台词的发音变化次数Vc_all_1的比值,确定为该句外语台词与对应的中文字幕之间的差异率P1=Ccount_1/Vc_all_1。如果该句英文台词E1的发音变化次数Vc_all_1小于等于该句英文台词对应的中文字幕的字数Ccount_1,将该句英文台词的发音变化次数Vc_all_1与该句英文台词对应的中文字幕的字数Ccount_1的比值,确定为该句英文台词与对应的中文字幕之间的差异率P1=Vc_all_1/Ccount_1

遍历英文视频S的每一句台词,可以得到英文视频S中每一句台词与对应的中文字幕之间的差异率,且英文视频S中每一句台词与对应的中文字幕之间的差异率可以构成集合SP:[P1,…,PN]。Pi为英文视频S中第i句台词与对应的中文字幕之间的差异率,1≤i≤N。

步骤204,根据目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,确定目标外语视频的外语台词与中文字幕的匹配程度。

本步骤中,确定外语台词与中文字幕的匹配程度具体可以包括如下步骤B1-B3:

步骤B1:计算目标外语视频的外语台词与对应的中文字幕之间的差异率的平均值,作为平均差异率。

举例说明,若目标外语视频为英文视频S,且英文视频S中每一句台词与对应的中文字幕之间的差异率集合SP:[P1,…,PN],则可以计算英文视频S的所有台词与对应的中文字幕之间的差异率的平均值Pavr=(P1+…+PN)/N,则可以将Pavr作为平均差异率。

步骤B2:基于平均差异率和目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,计算目标外语视频的外语台词与对应的中文字幕之间的差异率的标准方差。

举例说明,若目标外语视频为英文视频S,且英文视频S中每一句台词与对应的中文字幕之间的差异率集合SP:[P1,…,PN],以及英文视频S的平均差异率Pavr=(P1+…+PN)/N,则可以计算英文视频S的所有台词与对应的中文字幕之间的差异率的标准方差σ:

步骤B3:如果平均差异率大于等于预设差异率阈值,且标准方差小于等于预设波动阈值,确定目标外语视频的外语台词与中文字幕的匹配程度为第一匹配度,否则确定目标外语视频的外语台词与中文字幕的匹配程度为第二匹配度。

其中,第一匹配度大于第二匹配度。

本发明实施例中,预设差异率阈值Pvalid小于1,并可以根据实际应用情况在小于1的前提下进行调整,此处不做具体限定。预设波动阈值可以设定为σvalid=Pavr/M,M可以为经验参考值,M可以根据实际应用情况进行适当调整,此处不做具体限定。

本发明实施例中,目标外语视频的外语台词与对应的中文字幕之间的差异率的标准方差反映的实际应用意义可以为:当数据分布比较分散(即数据在平均差异率附近波动较大)时,各个数据与平均差异率的差的平方和较大,算术平方根后的标准方差就较大;当数据分布比较集中时,各个数据与平均差异率的差的平方和较小。因此标准方差σ越大,数据的波动越大;标准方差σ越小,数据的波动就越小。

本发明实施例中,平均差异率大于等于预设差异率阈值,表示目标外语视频中人物的实际外语发音口型变化和中文字幕的字数之间的差异率较小,即目标外语视频的外语台词与中文字幕的匹配程度较高,是用户比较能接受的;标准方差小于等于预设波动阈值,则表示目标外语视频中人物每句外语实际发音口型变化和中文字幕数量差异率波动不大,差异率是比较稳定、平稳连续性的。因此,如果平均差异率大于等于预设差异率阈值且标准方差小于等于预设波动阈值,确定目标外语视频的外语台词与中文字幕的匹配程度为第一匹配度,表示目标外语视频的外语台词与中文字幕的匹配程度较高,否则表示目标外语视频的外语台词与中文字幕的匹配程度较低。

采用本发明实施例提供的方法,可以通过目标外语视频的每一句外语台词的发音变化数和对应的中文字幕的字数,确定每一句外语台词和对应的中文字幕之间的差异率,进而根据目标外语视频的外语台词和对应的中文字幕之间的匹配度的高低,将用户喜好程度高的外语视频即外语台词与中文字幕的匹配程度高的外语视频推荐给用户,提高了对用户推荐外语视频的推荐效果。

在一种可能的实施方式中,上述根据发音变化次数和中文字幕的字数,确定目标外语视频的外语台词与中文字幕的匹配程度的步骤,具体还可以包括如下步骤C1-C3:

步骤C1:确定目标外语视频的所有单词对应的发音变化次数之和,作为总发音变化次数。

步骤C2:确定目标外语视频的所有外语台词对应的中文字幕的总字数。

步骤C3:计算总字数与总发音变化次数的比值的绝对值,作为目标外语视频的外语台词与中文字幕的匹配程度。

如果匹配程度大于预设匹配程度阈值,表示目标外语视频中人物的实际外语发音口型变化和中文字幕的字数之间的差异率较小,即目标外语视频的外语台词与中文字幕的匹配程度较高。如果匹配程度不大于预设匹配程度阈值,表示目标外语视频中人物的实际外语发音口型变化和中文字幕的字数之间的差异率较大,即目标外语视频的外语台词与中文字幕的匹配程度较低。其中,预设匹配程度阈值可以根据实际应用具体进行设定,此处不做具体限定。

在一种可能的实施方式中,在上述确定目标外语视频的外语台词与中文字幕的匹配程度之后,如果目标外语视频为待推荐视频,可以基于目标外语视频的外语台词与中文字幕的匹配程度,向用户推荐目标外语视频。具体的,如果目标外语视频为待推荐视频,且确定出的目标外语视频的外语台词与中文字幕的匹配程度为第一匹配度,表示目标外语视频的外语台词与中文字幕的匹配程度较高,即表示目标外语视频中人物讲外语的口型变化与中文字幕之间差异性较小,目标外语视频看起来更自然,用户感兴趣度会更高,更受用户喜爱,故可以将该目标外语视频的外语台词与中文字幕的匹配程度作为将该视频推荐为用户的一个特征维度,即在确定是否向用户推荐该目标外语视频时也可以考虑该目标外语视频的外语台词与中文字幕的匹配程度。

采用本发明实施例提供的方法,可以通过分析目标外语视频中人物讲外语的口型变化与中文字幕数量之间的差异率,确定目标外语视频的外语台词与中文字幕的匹配程度,并且,可以将该匹配程度提取为目标外语视频的一个特征维度,作为视频推荐系统的一个维度,进而提高视频推荐系统的推荐精准度,提高对用户推荐外语视频的推荐效果。

基于同一发明构思,根据本发明上述实施例提供的视频字幕匹配程度的确定方法,相应地,本发明另一实施例还提供了一种视频字幕匹配程度的确定装置,其结构示意图如图3所示,具体包括:

台词获取模块301,用于获取目标外语视频的外语台词和对应的中文字幕;

变化次数确定模块302,用于从预设的单词音标库中查询所述外语台词包括的单词对应的音标,并基于所述音标确定每个所述单词对应的发音变化次数;

匹配程度确定模块303,用于根据所述发音变化次数和所述中文字幕的字数,确定所述目标外语视频的外语台词与中文字幕的匹配程度。

采用本发明实施例提供的装置,可以通过获取目标外语视频的外语台词和对应的中文字幕;从预设的单词音标库中查询外语台词包括的单词对应的音标,并基于音标确定每个单词对应的发音变化次数;根据发音变化次数和中文字幕的字数,确定目标外语视频的外语台词与中文字幕的匹配程度。进一步的,可以根据所确定的目标外语视频的外语台词与中文字幕的匹配程度的高低,将用户喜好程度高的外语视频即外语台词与中文字幕的匹配程度高的外语视频推荐给用户,提高了对用户推荐外语视频的推荐效果。

可选的,所述变化次数确定模块302,具体用于确定每个所述单词对应的音标中元音的数量;将所述元音的数量确定为该单词对应的发音变化次数。

可选的,参见图4,所述匹配程度确定模块303,包括:

次数确定子模块401,用于针对所述目标外语视频的每一句外语台词,将该句外语台词包括的单词对应的发音变化次数之和确定为该句外语台词的发音变化次数;

字数确定子模块402,用于确定所述目标外语视频的每一句外语台词对应的中文字幕的字数;

差异率确定子模块403,用于遍历所述目标外语视频的每一句外语台词,基于该句外语台词的发音变化次数和该句外语台词对应的中文字幕的字数,确定该句外语台词与对应的中文字幕之间的差异率;

匹配程度确定子模块404,用于根据所述目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,确定所述目标外语视频的外语台词与中文字幕的匹配程度。

可选的,所述差异率确定子模块403,具体用于如果该句外语台词的发音变化次数大于该句外语台词对应的中文字幕的字数,将该句外语台词对应的中文字幕的字数与该句外语台词的发音变化次数的比值,确定为该句外语台词与对应的中文字幕之间的差异率;如果该句外语台词的发音变化次数小于等于该句外语台词对应的中文字幕的字数,将该句外语台词的发音变化次数与该句外语台词对应的中文字幕的字数的比值,确定为该句外语台词与对应的中文字幕之间的差异率。

可选的,所述匹配程度确定子模块404,具体用于计算所述目标外语视频的外语台词与对应的中文字幕之间的差异率的平均值,作为平均差异率;基于所述平均差异率和所述目标外语视频的每一句外语台词与对应的中文字幕之间的差异率,计算所述目标外语视频的外语台词与对应的中文字幕之间的差异率的标准方差;如果所述平均差异率大于等于预设差异率阈值,且所述标准方差小于等于预设波动阈值,确定所述目标外语视频的外语台词与中文字幕的匹配程度为第一匹配度,否则确定所述目标外语视频的外语台词与中文字幕的匹配程度为第二匹配度,其中,所述第一匹配度大于所述第二匹配度。

可选的,参见图5,所述装置还包括视频推荐模块501,用于如果所述目标外语视频为待推荐视频,基于所述目标外语视频的外语台词与中文字幕的匹配程度,向用户推荐所述目标外语视频。

采用本发明实施例提供的装置,可以通过分析目标外语视频中人物讲外语的口型变化与中文字幕数量之间的差异率,确定目标外语视频的外语台词与中文字幕的匹配程度,并且,可以将该匹配程度提取为目标外语视频的一个特征维度,作为视频推荐系统的一个维度,进而提高视频推荐系统的推荐精准度,提高对用户推荐外语视频的推荐效果。

本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,

存储器603,用于存放计算机程序;

处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:

获取目标外语视频的外语台词和对应的中文字幕;

从预设的单词音标库中查询所述外语台词包括的单词对应的音标,并基于所述音标确定每个所述单词对应的发音变化次数;

根据所述发音变化次数和所述中文字幕的字数,确定所述目标外语视频的外语台词与中文字幕的匹配程度。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一所述的视频字幕匹配程度的确定方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频字幕匹配程度的确定方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及存储介质而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

17页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:车联网业务数据的处理方法、装置、电子设备和存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!