一种基于内容相同的视频过滤方法、系统及设备

文档序号:703707 发布日期:2021-04-13 浏览:9次 >En<

阅读说明:本技术 一种基于内容相同的视频过滤方法、系统及设备 (Video filtering method, system and equipment based on same content ) 是由 李美影 于 2020-12-04 设计创作,主要内容包括:本发明提供了一种基于内容相同的视频过滤方法、系统及设备,方法包括以下步骤:基于目标视频在内容相同视频库中检测并获取对应的相似视频;对目标视频和相似视频分别进行定时抽取处理,得到各自的特征时序图;通过动态时间规整算法将目标视频的特征时序图和相似视频的特征时序图匹配出相同的视频片段;基于目标视频的时长分别对匹配出的视频片段进行样本抽取处理,各自得到n帧图像;分别对n帧图像进行图像信息量计算,且分别基于计算得到的图像信息量得到相应的目标视频和相似视频的视频信息量,并将其中视频信息量小的视频剔除。本发明高效筛选出信息量更大、更具有价值的视频,降低了磁盘占用,节约了网络资源,有助于提高检索视频的效率。(The invention provides a video filtering method, a system and equipment based on same content, wherein the method comprises the following steps: detecting and acquiring corresponding similar videos in a video library with the same content based on the target video; respectively carrying out timing extraction processing on the target video and the similar video to obtain respective characteristic sequence diagrams; matching the characteristic time sequence diagram of the target video and the characteristic time sequence diagram of the similar video into the same video segment through a dynamic time warping algorithm; respectively carrying out sample extraction processing on the matched video clips based on the duration of the target video to respectively obtain n frames of images; and respectively carrying out image information amount calculation on the n frames of images, respectively obtaining the video information amounts of the corresponding target video and the similar video based on the image information amounts obtained by calculation, and removing the video with small video information amount. The method and the device efficiently screen out the video with larger information amount and more value, reduce the occupation of a disk, save network resources and contribute to improving the efficiency of video retrieval.)

一种基于内容相同的视频过滤方法、系统及设备

技术领域

本发明涉及视频技术领域,尤其涉及一种基于内容相同的视频过滤方法、系统及设备。

背景技术

随着信息技术的快速发展与广泛应用,网络视频越来越多,但同时也存在着大量的相似视频,它们视频内容一样,只是进行了格式转换、伸缩变形、增加水印、广告、滤镜等。相似视频内容重复且占用了大量的磁盘资源、网络资源,同时也拉低了视频检索速度,由此导致了巨大的经济价值浪费。对于视频平台来说,成本是重中之重,相似视频内容相同、只具有极低的价值甚至可以直接忽略,却占用了大量的资源,与此同时,推送相同内容视频给用户容易影响使用体验。因此迫切需要对内容相同视频进行筛选,如何筛选保留价值更高的视频,就成为了当前迫切需要解决的问题。

现有的内容相同视频过滤技术及存在的技术问题如下:

1.对比视频文件大小,默认大文件信息量更大,过滤掉小文件;在视频格式转换、视频分辨率调高、视频每秒帧数增加等情况下,此方法很可能选出信息量不大或信息量相同却更消耗资源的视频;

2.对比视频分辨率,默认大分辨率信息量更大,过滤掉低分辨率视频;然而一些视频网站为统一分辨率管理,将视频源文件转换为更高分辨率的视频以适配平台,该情况下此方法很可能选出信息量不大或信息量相同却更消耗资源的视频;

3.对比视频长短,默认时长越长信息量更大,过滤掉低时长视频;视频长但模糊不清、视频短但更清晰信息量更大,该情况下此方法很可能选出信息量小的视频。

发明内容

有鉴于此,本发明的目的在于提出一种基于内容相同的视频过滤方法、系统及设备,用以解决现有技术中无法准确过滤掉内容相同的视频的问题。

基于上述目的,本发明提供了一种基于内容相同的视频过滤方法,包括如下步骤:

基于目标视频在内容相同视频库中检测并获取对应的相似视频;

对目标视频和相似视频分别进行定时抽取处理,得到各自的特征时序图;

通过动态时间规整算法将目标视频的特征时序图和相似视频的特征时序图匹配出相同的视频片段;

基于目标视频的时长分别对匹配出的视频片段进行样本抽取处理,各自得到n帧图像;

分别对n帧图像进行图像信息量计算,且分别基于计算得到的图像信息量得到相应的目标视频和相似视频的视频信息量,并将其中视频信息量小的视频剔除。

在一些实施例中,对目标视频和相似视频分别进行定时抽取处理,得到各自的特征时序图包括:对目标视频和相似视频分别定时按帧抽取图像最中间像素点的灰度值,并分别建立其与时间的函数,得到各自的特征时序图。

在一些实施例中,通过动态时间规整算法将目标视频的特征时序图和相似视频的特征时序图匹配出相同的视频片段包括:通过动态时间规整算法选出目标视频的特征时序图和相似视频的特征时序图中有差异的关键帧,并基于关键帧得到匹配的相同的视频片段。

在一些实施例中,基于目标视频的时长分别对匹配出的视频片段进行样本抽取处理,各自得到n帧图像包括:

建立基于目标视频的时长的抽取频率函数;

根据抽取频率函数对匹配出的视频片段按帧抽取,各自得到n帧图像。

在一些实施例中,建立基于目标视频的时长的抽取频率函数包括:将目标视频的时长分为四个时间梯度,分别是:1s~60s、1min~60min、1h~10h及10h以上,对不同的时间梯度建立不同的抽取次数。

在一些实施例中,图像信息量计算包括:计算图像二维熵作为图像信息量。

在一些实施例中,分别基于计算得到的图像信息量得到相应的目标视频和相似视频的视频信息量,并将其中视频信息量小的视频剔除包括:

对目标视频的n帧图像信息量求第一平均值,并以第一平均值与目标视频时长的乘积作为其视频信息量;

对相似视频的n帧图像信息量求第二平均值,并以第二平均值与相似视频时长的乘积作为其视频信息量;

比较目标视频的视频信息量和相似视频的视频信息量,并将其中视频信息量小的视频剔除。

在一些实施例中,方法还包括:响应于视频信息量小的视频被剔除,更新内容相同视频库和常规视频库,其中,常规视频库用于存放具有单独内容的视频。

本发明的另一方面,还提供了一种基于内容相同的视频过滤系统,包括:

视频检测模块,配置用于基于目标视频在内容相同视频库中检测并获取对应的相似视频;

定时抽取模块,配置用于对目标视频和相似视频分别进行定时抽取处理,得到各自的特征时序图;

视频片段匹配模块,配置用于通过动态时间规整算法将目标视频的特征时序图和相似视频的特征时序图匹配出相同的视频片段;

样本抽取模块,配置用于基于目标视频的时长分别对匹配出的视频片段进行样本抽取处理,各自得到n帧图像;以及

视频剔除模块,配置用于分别对n帧图像进行图像信息量计算,且分别基于计算得到的图像信息量得到相应的目标视频和相似视频的视频信息量,并将其中视频信息量小的视频剔除。

本发明的再一方面,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该计算机程序被处理器执行时执行上述任意一项方法。

本发明至少具有以下有益技术效果:

本发明通过对目标视频和相似视频分别进行定时抽取处理和视频片段匹配,高效筛选出了内容一致的视频片段;通过样本抽取处理、图像信息量计算和视频信息量计算,选出了信息量更大、更具有价值的视频;通过将视频信息量小的视频剔除,降低了磁盘占用,节约了网络资源,同时有助于提高检索视频的效率,进一步为视频平台带来了较大的经济价值。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为根据本发明提供的基于内容相同的视频过滤方法的实施例的示意图;

图2为根据本发明实施例的目标视频和对应的相似视频经动态时间规整算法匹配的特征时序图;

图3为根据本发明提供的基于内容相同的视频过滤系统的实施例的示意图;

图4为本发明提供的执行基于内容相同的视频过滤方法的计算机设备的一个实施例的硬件结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。

需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称的非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备固有的其他步骤或单元。

基于上述目的,本发明实施例的第一个方面,提出了一种基于内容相同的视频过滤方法的实施例。图1示出的是本发明提供的基于内容相同的视频过滤方法的实施例的示意图。如图1所示,本发明实施例包括如下步骤:

步骤S10、基于目标视频在内容相同视频库中检测并获取对应的相似视频;

步骤S20、对目标视频和相似视频分别进行定时抽取处理,得到各自的特征时序图;

步骤S30、通过动态时间规整算法将目标视频的特征时序图和相似视频的特征时序图匹配出相同的视频片段;

步骤S40、基于目标视频的时长分别对匹配出的视频片段进行样本抽取处理,各自得到n帧图像;

步骤S50、分别对n帧图像进行图像信息量计算,且分别基于计算得到的图像信息量得到相应的目标视频和相似视频的视频信息量,并将其中视频信息量小的视频剔除。

本发明实施例通过对目标视频和相似视频分别进行定时抽取处理和视频片段匹配,高效筛选出了内容一致的视频片段;通过样本抽取处理、图像信息量计算和视频信息量计算,选出了信息量更大、更具有价值的视频;通过将视频信息量小的视频剔除,降低了磁盘占用,节约了网络资源,同时有助于提高检索视频的效率,进一步为视频平台带来了较大的经济价值。

在一些实施例中,对目标视频和相似视频分别进行定时抽取处理,得到各自的特征时序图包括:对目标视频和相似视频分别定时按帧抽取图像最中间像素点的灰度值,并分别建立其与时间的函数,得到各自的特征时序图。图2示出了目标视频和相似视频的特征时序图,其中,视频A表示目标视频,视频B表示相似视频,横坐标表示出了视频A和视频B是被定时抽取的,纵坐标表示出了相应时间帧的图像的最中间像素点的灰度值,灰度值与时间形成了时间序列函数,时间序列即作为视频的特征值。

在一些实施例中,通过动态时间规整算法将目标视频的特征时序图和相似视频的特征时序图匹配出相同的视频片段包括:通过动态时间规整算法选出目标视频的特征时序图和相似视频的特征时序图中有差异的关键帧,并基于关键帧得到匹配的相同的视频片段。图2为根据本发明实施例的目标视频和对应的相似视频经动态时间规整算法匹配的特征时序图,经动态时间规整算法得到了有差异的关键帧,通过图中的虚线分割示意出了匹配的相同的视频片段。

在一些实施例中,基于目标视频的时长分别对匹配出的视频片段进行样本抽取处理,各自得到n帧图像包括:建立基于目标视频的时长的抽取频率函数;根据抽取频率函数对匹配出的视频片段按帧抽取,各自得到n帧图像。在一些实施例中,建立基于目标视频的时长的抽取频率函数包括:将目标视频的时长分为四个时间梯度,分别是:1s~60s、1min~60min、1h~10h及10h以上,对不同的时间梯度建立不同的抽取次数。本实施例中,视频时间越长,抽取次数越多,因为视频越长,越需要更多的数据来进行比对来完成相似度比较。抽取频率函数f(x)如以下公式,其中x为视频时间长度;当视频时间为1s~60s,则0.05x秒抽取一次;当视频时间为1min~60min,则0.025x分钟抽取一次;当视频时间为1h~10h,则0.01x小时抽取一次,当视频时间为10h以上,则0.01x小时抽取一次。

在一些实施例中,图像信息量计算包括:计算图像二维熵作为图像信息量。本实施例中,使用图像二维熵作为图像信息量,选择图像像素点邻域灰度均值作为灰度分布空间特征,与图像的像素灰度组成特征二元组,记为(i,j),f(i,j)表示特征二元组(i,j)出现的频数,其中i表示像素的灰度值,j表示邻域灰度均值;M、N表示图像尺寸;如以下公式:

图像二维熵如以下公式:

在一些实施例中,分别基于计算得到的图像信息量得到相应的目标视频和相似视频的视频信息量,并将其中视频信息量小的视频剔除包括:对目标视频的n帧图像信息量求第一平均值,并以第一平均值与目标视频时长的乘积作为其视频信息量;对相似视频的n帧图像信息量求第二平均值,并以第二平均值与相似视频时长的乘积作为其视频信息量;比较目标视频的视频信息量和相似视频的视频信息量,并将其中视频信息量小的视频剔除。本实施例中,视频信息量等于图像二维熵乘以时长,以Hsum表示视频信息量,L表示视频时长,单位为帧,则视频信息量为:

Hsum=H*L

得到视频信息量,信息量越小可以被认为价值更小,剔除或删除信息量小的重复视频,即若目标视频信息量小,将目标视频剔除,若对应的相似视频信息量少,将相似视频剔除。

在一些实施例中,方法还包括:响应于视频信息量小的视频被剔除,更新内容相同视频库和常规视频库,其中,常规视频库用于存放具有单独内容的视频。通过对内容相同视频库和常规视频库进行更新,便于提高后续视频检索的效率。

本发明实施例的第二个方面,还提供了一种基于内容相同的视频过滤系统。图3示出的是本发明提供的基于内容相同的视频过滤系统的实施例的示意图。一种基于内容相同的视频过滤系统包括:视频检测模块10,配置用于基于目标视频在内容相同视频库中检测并获取对应的相似视频;定时抽取模块20,配置用于对目标视频和相似视频分别进行定时抽取处理,得到各自的特征时序图;视频片段匹配模块30,配置用于通过动态时间规整算法将目标视频的特征时序图和相似视频的特征时序图匹配出相同的视频片段;样本抽取模块40,配置用于基于目标视频的时长分别对匹配出的视频片段进行样本抽取处理,各自得到n帧图像;以及视频剔除模块50,配置用于分别对n帧图像进行图像信息量计算,且分别基于计算得到的图像信息量得到相应的目标视频和相似视频的视频信息量,并将其中视频信息量小的视频剔除。

本实施例的基于内容相同的视频过滤系统,通过对目标视频和相似视频分别进行定时抽取处理和视频片段匹配,高效筛选出了内容一致的视频片段;通过样本抽取处理、图像信息量计算和视频信息量计算,选出了信息量更大、更具有价值的视频;通过将视频信息量小的视频剔除,降低了磁盘占用,节约了网络资源,同时有助于提高检索视频的效率,进一步为视频平台带来了较大的经济价值。

本发明实施例的第三个方面,还提供了一种计算机设备,包括存储器302和处理器301,该存储器中存储有计算机程序,该计算机程序被该处理器执行时实现上述任意一项实施例方法。

如图4所示,为本发明提供的执行基于内容相同的视频过滤方法的计算机设备的一个实施例的硬件结构示意图。以如图4所示的计算机设备为例,在该计算机设备中包括一个处理器301以及一个存储器302,并还可以包括:输入装置303和输出装置304。处理器301、存储器302、输入装置303和输出装置304可以通过总线或者其他方式连接,图4中以通过总线连接为例。输入装置303可接收输入的数字或字符信息,以及产生与基于内容相同的视频过滤系统的用户设置以及功能控制有关的键信号输入。输出装置304可包括显示屏等显示设备。处理器301通过运行存储在存储器302中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的基于内容相同的视频过滤方法。

最后需要说明的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RAM可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDRSDRAM)、增强SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、以及直接Rambus RAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。

本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。

以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。

应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种传媒宣传用显示图片弹幕信息推送方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类