一种视频压缩方法、装置、设备及介质

文档序号:1144486 发布日期:2020-09-11 浏览:11次 >En<

阅读说明:本技术 一种视频压缩方法、装置、设备及介质 (Video compression method, device, equipment and medium ) 是由 吴振东 李锐 金长新 于 2020-05-06 设计创作,主要内容包括:本申请公开了一种视频压缩方法、装置、设备及介质,包括:提取待压缩视频的关键帧图像与非关键帧图像;将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。(The application discloses a video compression method, a device, equipment and a medium, comprising the following steps: extracting key frame images and non-key frame images of a video to be compressed; respectively inputting the key frame image and the non-key frame image into a pre-established first encoder, and outputting a first encoding result corresponding to the key frame image and a second encoding result corresponding to the non-key frame image; inputting the first coding result and the second coding result to a pre-established first decoder respectively, and outputting a first decoding result corresponding to the first coding result and a second decoding result corresponding to the second coding result, wherein the first decoder comprises a decoding unit and a distinguishing unit which are trained based on a deep learning model; and combining the first decoding result and the second decoding result into a compressed video according to the arrangement sequence of the key frame images and the non-key frame images in the video to be compressed.)

一种视频压缩方法、装置、设备及介质

技术领域

本申请涉及计算机技术领域,尤其涉及一种视频压缩方法、装置、设备及介质。

背景技术

视频编码方式就是指通过压缩技术,将原始视频格式的文件转换成另一种视频格式文件的方式。视频是连续的图像序列,由连续的帧构成,一帧即为一幅图像。由于人眼的视觉暂留效应,当帧序列以一定的速率播放时,我们看到的就是动作连续的视频。由于连续的帧之间相似性极高,为便于储存传输,需要对原始的视频进行编码压缩,以去除空间、时间维度的冗余。

在现有技术中,视频压缩时效果不好,使得用户的体验不佳。

发明内容

有鉴于此,本申请实施例提供了一种视频压缩方法、装置、设备及介质,用于解决现有技术中视频压缩时效果不好,使得用户的体验不佳的问题。

本申请实施例采用下述技术方案:

本申请实施例提供一种视频压缩方法,所述方法包括:

提取待压缩视频的关键帧图像与非关键帧图像;

将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;

将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;

根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

进一步的,所述第一编码器包括子采样管、边缘检测单元以及编码单元。

进一步的,所述将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出第一编码结果与第二编码结果,具体包括:

将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器;

所述第一编码器的子采样管分别对所述关键帧图像与所述非关键帧图像进行子采样,得到所述关键帧图像对应的第一采样结果与所述非关键帧图像对应的第二采样结果;

将所述第一采样结果与所述第二采样结果分别输入至所述第一编码器的边缘检测单元,得到所述第一采样结果对应的第一检测结果与所述第二采样结果对应的第二检测结果;

将所述第一检测结果与所述第二检测结果分别输入至所述第一编码器的编码单元,得到所述第一检测结果对应的第一编码结果与所述第二检测结果对应的第二编码结果。

进一步的,所述将所述第一采样结果与所述第二采样结果分别输入至所述第一编码器的边缘检测单元,得到所述第一采样结果对应的第一检测结果与所述第二采样结果对应的第二检测结果,具体包括:

将所述第一采样结果与所述第二采样结果输入至所述第一编码器的边缘检测单元;

根据所述边缘检测单元内置的边缘检测算法,确定出所述第一采样结果对应的第一像素边缘映射与所述第二采样结果对应的第二像素边缘映射;

采用矢量量化对所述第一像素边缘映射与所述第二像素边缘映射进行边缘映射,得到所述第一采样结果对应的第一检测结果与所述第二采样结果对应的第二检测结果。

进一步的,所述将所述第一检测结果与所述第二检测结果分别输入至所述第一编码器的编码单元,得到所述第一检测结果对应的第一编码结果与所述第二检测结果对应的第二编码结果,具体包括:

将所述第一检测结果与所述第二检测结果分别输入至所述第一编码器的编码单元,

根据行程长度压缩算法将所述第一检测结果与所述第二检测结果从时间和空间两个维度进行压缩,得到所述第一检测结果对应的第一压缩结果与所述第二检测结果对应的第二压缩结果;

根据霍夫曼编码将所述第一压缩结果与所述第二压缩结果进行编码,得出所述第一编码结果与所述第二编码结果。

进一步的,所述深度学习模型为GAN深度网络学习模型。

进一步的,所述提取待压缩视频的关键帧图像与非关键帧图像之后,所述方法还包括:

将所述关键帧图像与所述非关键帧图像分别输入预先建立的第二编码器,输出所述关键帧图像对应的第三编码结果与所述非关键帧图像对应的第四编码结果;

将所述第三编码结果与所述第四编码结果分别输入至预先建立的第二解码器,输出所述第三编码结果对应的第三解码结果与所述第四编码结果对应的第四解码结果;

将所述第三解码结果与所述第四解码结果分别输入至所述第一编码器,输出所述第三解码结果对应的第五编码结果与所述第四解码结果对应的第六编码结果;

将所述第五编码结果与所述第六编码结果分别输入至所述第一解码器,输出所述第五编码结果对应的第五解码结果与所述第六编码结果对应的第六解码结果;

根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第五解码结果与所述第六解码结果组合成压缩视频。

本申请实施例还提供一种视频压缩装置,所述装置包括:

提取单元,用于提取待压缩视频的关键帧图像与非关键帧图像;

编码单元,用于将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;

解码单元,用于将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;

压缩单元,用于根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

本申请实施例提供一种视频压缩设备,所述设备包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

提取待压缩视频的关键帧图像与非关键帧图像;

将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;

将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;

根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

本申请实施例提供一种视频压缩介质,存储有计算机可执行指令,所述计算机可执行指令设置为:

提取待压缩视频的关键帧图像与非关键帧图像;

将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;

将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;

根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本说明书实施例通过提取待压缩视频的关键帧图像与非关键帧图像,以此对待压缩视频进行压缩,使得压缩的效果更好;此外,本说明书实施例通过预先建立的第一编码器对待压缩视频进行编码,之后通过深度学习模型训练的第一解码器进行解码,使得压缩的效果更好。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本说明书实施例一提供的一种视频压缩方法的流程示意图;

图2为本说明书实施例二提供的一种视频压缩方法的流程示意图;

图3为本说明书实施例二提供的视频压缩的流程示意图;

图4为本说明书实施例二提供的视频编码的流程示意图;

图5为本说明书实施例三提供的一种视频压缩装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

以下结合附图,详细说明本申请各实施例提供的技术方案。

图1为本说明书实施例一提供的一种视频压缩方法的流程示意图,本说明书实施例可以由视频压缩系统执行下述步骤,具体包括:

步骤S101,视频压缩系统提取待压缩视频的关键帧图像与非关键帧图像。

步骤S102,视频压缩系统将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果。

在本说明书实施例的步骤S102中,第一编码器可以包括子采样管、边缘检测单元以及编码单元。

进一步的,在本说明书实施例的步骤S102中,该步骤可以具体包括:

将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器;

所述第一编码器的子采样管分别对所述关键帧图像与所述非关键帧图像进行子采样,得到所述关键帧图像对应的第一采样结果与所述非关键帧图像对应的第二采样结果;

将所述第一采样结果与所述第二采样结果分别输入至所述第一编码器的边缘检测单元,得到所述第一采样结果对应的第一检测结果与所述第二采样结果对应的第二检测结果;

将所述第一检测结果与所述第二检测结果分别输入至所述第一编码器的编码单元,得到所述第一检测结果对应的第一编码结果与所述第二检测结果对应的第二编码结果。

通过上述步骤,可以对关键帧图像与非关键帧对象进行编码。

进一步的,所述将所述第一采样结果与所述第二采样结果分别输入至所述第一编码器的边缘检测单元,得到所述第一采样结果对应的第一检测结果与所述第二采样结果对应的第二检测结果,具体包括:

将所述第一采样结果与所述第二采样结果输入至所述第一编码器的边缘检测单元;

根据所述边缘检测单元内置的边缘检测算法,确定出所述第一采样结果对应的第一像素边缘映射与所述第二采样结果对应的第二像素边缘映射;

采用矢量量化对所述第一像素边缘映射与所述第二像素边缘映射进行边缘映射,得到所述第一采样结果对应的第一检测结果与所述第二采样结果对应的第二检测结果。

其中,边缘检测算法是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。

进一步的,将所述第一检测结果与所述第二检测结果分别输入至所述第一编码器的编码单元,得到所述第一检测结果对应的第一编码结果与所述第二检测结果对应的第二编码结果,具体包括:

将所述第一检测结果与所述第二检测结果分别输入至所述第一编码器的编码单元,

根据行程长度压缩算法将所述第一检测结果与所述第二检测结果从时间和空间两个维度进行压缩,得到所述第一检测结果对应的第一压缩结果与所述第二检测结果对应的第二压缩结果;

根据霍夫曼编码将所述第一压缩结果与所述第二压缩结果进行编码,得出所述第一编码结果与所述第二编码结果。

其中,行程长度压缩算法(Run Length Encoding)是根据字符串的连续重复字符进行编码的一种方法。

步骤S103,视频压缩系统将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元。

在本说明书实施例的步骤S103中,深度学习模型可以为GAN深度网络学习模型。

步骤S104,视频压缩系统根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

在本说明书实施例的步骤S104中,待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序即为待压缩视频中关键帧图像与非关键帧图像原本的排列顺序。

本说明书实施例通过提取待压缩视频的关键帧图像与非关键帧图像,以此对待压缩视频进行压缩,使得压缩的效果更好;此外,本说明书实施例通过预先建立的第一编码器对待压缩视频进行编码,之后通过深度学习模型训练的第一解码器进行解码,使得压缩的效果更好。

与本说明书实施例一对应的是,图2为本说明书实施例二提供的一种视频压缩方法的流程示意图,本说明书实施例可以由视频压缩系统执行下述步骤,具体包括:

步骤S201,视频压缩系统提取待压缩视频的关键帧图像与非关键帧图像。

步骤S202,视频压缩系统将所述关键帧图像与所述非关键帧图像分别输入预先建立的第二编码器,输出所述关键帧图像对应的第三编码结果与所述非关键帧图像对应的第四编码结果。

在本说明书实施例的步骤S202中,第二编码器可以为普通的编码器,比如,第二编码器可以为HEVC编码器。

步骤S203,视频压缩系统将所述第三编码结果与所述第四编码结果分别输入至预先建立的第二解码器,输出所述第三编码结果对应的第三解码结果与所述第四编码结果对应的第四解码结果。

在本说明书实施例的步骤S203中,第二解码器可以为普通的解码器,比如,第二解码器可以为HEVC解码器。

步骤S204,视频压缩系统将所述第三解码结果与所述第四解码结果分别输入至所述第一编码器,输出所述第三解码结果对应的第五编码结果与所述第四解码结果对应的第六编码结果。

在本说明书实施例的步骤S204中,第一编码器可以包括子采样管、边缘检测单元以及编码单元。具体实施方式同上述步骤S102。

步骤S205,视频压缩系统将所述第五编码结果与所述第六编码结果分别输入至所述第一解码器,输出所述第五编码结果对应的第五解码结果与所述第六编码结果对应的第六解码结果。

在本说明书实施例的步骤S205中,具体实施方式同上述步骤S103。

步骤S206,视频压缩系统根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第五解码结果与所述第六解码结果组合成压缩视频。

在本说明书实施例的步骤S206中,待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序即为待压缩视频中关键帧图像与非关键帧图像原本的排列顺序。

需要说明的是,本说明书实施例先通过第二编码器与第二解码器完成对视频的第一次压缩,之后通过第一编码器与第一解码器完成对视频的第二次压缩,通过上述操作可以使得视频的压缩效果更好。此外,本说明书实施例也可以先通过第一编码器与第一解码器完成视频的第一次压缩,再通过第二编码器与第二解码器完成视频的第二次压缩。

进一步的,本说明书实施例也可以经过多次第一编码器与第一解码器的压缩,或者经过多次第二编码器与第二解码器的压缩,但为了保证压缩率与视频还原的效果,本申请可以预先设置压缩的次数,以达到最佳的视频压缩效果。

为了进一步说明上述步骤,图3示出了视频压缩的流程示意图,具体为:

步骤1,将准备压缩的视频拆分成帧图像集X;

步骤2,将帧图像集X分为关键帧图像集XI和非关键帧图像集XG

步骤3,将关键帧图像集XI通过HEVC编码器E1(本说明书实施例中的第二编码器)进行编码,生成结果xI

步骤4,将xI通过HEVC解码器D1(本说明书实施例中的第二解码器)进行解码,生成还原结果XI’;

步骤5,将XI’作为输入,经过编码器E2(本说明书实施例中的第一编码器)生成结果xI’;

步骤6,将xI’作为输入,经过解码器(本说明书实施例中的第一解码器)生成

Figure BDA0002478833110000101

其中,解码器是经过GAN深度网络学习模型训练而成的,包括D2解码单元与辨别单元DD,D2解码单元以XI’为真标签,辨别单元DD需要找到解码单元D2所生成的

Figure BDA0002478833110000102

作为标签,经过训练后D2所生成的越来越接近XI’;

需要说明的是,附图中关键帧图像集XI和非关键帧图像集XG分开进行,但过程相同,经过解码单元D2生成

Figure BDA0002478833110000104

本说明书实施例不进行赘述。

步骤7,将

Figure BDA0002478833110000106

两个帧图像组合成压缩视频。

此外,在步骤5中,做出详细的步骤说明,参见图4示出的视频编码的流程示意图,具体如下:

步骤51,将XI’或XG’作为输入,通过子采样管生成对应的采用结果S;

步骤52,将采用结果S通过边缘检测单元生成对应的检测结果QK,其中K为像素点划分簇的个数,可设置为2,4,8,16……等数值;

步骤53,将检测结果QK作为输入,通过编码单元输出xI’或xG’。

具体的,可以设定帧图像集X∈R^(W×H×3×N)来表示一个视频中的一段帧图像,其中W×H分别表示帧图像的宽和高的像素值,N为帧图像的数量,3是指RGB共三通道。其中,RGB是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是运用最广的颜色系统之一。

设定X(t)∈R^(W×H×3)是指上面那段帧图像中的第t帧。该视频的每一个通道都是用8bit进行存储。n(X)=N指的是帧图像集X共有N帧组成。

上述方案中是将X分为两个子集XI和XG。XI是选出的关键帧集合,XG则是非关键帧集合。n(XI)=NI,那么n(XG)=N–NI,其中NI∈{1,2,…N}。

XI={XI(1),XI(2),…,XI(Ni)}

XG={XG(1),XG(2),…,XG(N-Ni)}

本说明书实施例的两个编解码阶段(参见图3):第一阶段是将XI放到编码器E1进行压缩,从而生成xI。然后,解码器D1将xI重建为XI’。如果n(XI)<N,那么XI’进行第二个阶段编码;编码器E2将XI’进行压缩从而生成xI’。接下来,第二阶段解码中的解码器对xI’进行解压,从而生成重建的帧图像集XG的过程同XI,最终生成

对于第一阶段的编解码,在本说明书实施例可以采用HEVC的编码器和HEVC的解码器分别。考虑到传入的每一帧都是关键帧,所以对于HEVC编码器来说不存在任何的动作预测或压缩。

第二阶段的编解码与第一阶段存在很大的不同,其中包括子采样管、边缘检测单元和编码单元(参见图4)。其中,该阶段的解码单元D2与辨别单元DD可以是通过GAN训练产生的。把一系列关键帧和边缘映射作为输入,通过GAN进行训练,最终生成解码器。解码器所学到的是关键帧与边缘映射之间的关系。其中,边缘映射可以为边缘检测单元输出的结果。当解码器训练完成后(主要是解码单元D2的学习),可以通过输入xI’来重建

Figure BDA0002478833110000121

对于第二阶段的编码,输入XI’(或XG’),在完成子采样输出结果设为S,S在完成软边缘检测后输出为QK,QK输入放置到编码单元中输出xI’(或xG’)。

需要说明的是,在完成子采样之后,输出了可压缩结果S。可以使用Canny边缘检测算法来找到图像的边缘映射I=[Ii,Ij],其中:

在边缘检测之后,可以采用矢量量化的方式对有色像素点集群进行边缘映射,公式可以为:

Qi,j=VK(Si,j·Ii,j)

其中,Si,j为子采样帧图像集的第(i,j)个元素,Qi,j是量化后帧图像集QK的第(i,j)个元素,VK是指用K近邻来进行矢量量化,将Ii,j=1映射设置为有色像素点的簇量化为K-1个簇。本说明书实施例并不涉及Ii,j=0的最大像素簇。

当大多数边缘检测的输出结果Q都为0时,对该结果进行编码压缩。可以使用行程长度压缩算法进行从时间和空间两个维度进行压缩,之后对压缩结果采用霍夫曼编码,最终输出xI’或xG’。

对于第二阶段的解码,本说明书实施例可以采用GAN来训练解码单元D2和辨别单元DD,输入关键帧集合xI’或xG’,将辨别器DD辨别成重建的帧图像集

Figure BDA0002478833110000123

(视为假)和解码器D1所解码的帧图像集XI’(视为真)之间的真假。经过不断训练后,图像集越来越真(即与XI’越来越相似),解码后图片的质量就越高,越接近编码前的原图片。

最后将所有解码后的帧图像

Figure BDA0002478833110000126

两个帧图像合计按照原有排列顺序组合成视频,即为最终的输出结果,即本说明书实施例压缩后的视频。

本说明书实施例通过提取待压缩视频的关键帧图像与非关键帧图像,以此对待压缩视频进行压缩,使得压缩的效果更好;此外,本说明书实施例通过预先建立的第一编码器对待压缩视频进行编码,之后通过深度学习模型训练的第一解码器进行解码,使得压缩的效果更好。

与本说明书实施例二相对应的是,图5为本申请实施例三提供的一种视频压缩装置的结构示意图,包括:提取单元1、编码单元2、解码单元3以及压缩单元4。

提取单元1用于提取待压缩视频的关键帧图像与非关键帧图像;

编码单元2用于将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;

解码单元3用于将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;

压缩单元4用于根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

本申请实施例提供一种视频压缩设备,所述设备包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

提取待压缩视频的关键帧图像与非关键帧图像;

将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;

将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;

根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

本申请实施例提供一种视频压缩介质,存储有计算机可执行指令,所述计算机可执行指令设置为:

提取待压缩视频的关键帧图像与非关键帧图像;

将所述关键帧图像与所述非关键帧图像分别输入至预先建立的第一编码器,输出所述关键帧图像对应的第一编码结果与所述非关键帧图像对应的第二编码结果;

将所述第一编码结果与所述第二编码结果分别输入至预先建立的第一解码器,输出所述第一编码结果对应的第一解码结果与所述第二编码结果对应的第二解码结果,其中,所述第一解码器包括基于深度学习模型训练的解码单元与辨别单元;

根据所述待压缩视频中所述关键帧图像与所述非关键帧图像的排列顺序,将所述第一解码结果与所述第二解码结果组合成压缩视频。

在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于俄罗斯方块的信息隐藏方法及终端

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类