硬件解码器流水线优化方法及应用

文档序号：912765 发布日期：2021-02-26 浏览：21次 >En<

阅读说明：本技术 硬件解码器流水线优化方法及应用 (Hardware decoder pipeline optimization method and application ) 是由雷理张云韦虎占坤谢峥江焕承于 2020-10-26 设计创作，主要内容包括：本发明公开了一种硬件解码器流水线优化方法及应用,涉及视频解码技术领域。一种硬件解码器流水线优化方法,将AVC视频序列的解码划分为多级流水线结构,该方法规定了熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程的协同工作方式；使反量化过程与熵解码过程位于同一流水级,反DCT变换过程位于反量化过程所在流水级的下一流水级；通过熵解码反量化单元对宏块进行熵解码和反量化处理,将反量化处理后的多个像素点的数据同步输入到反变换单元进行多点并行的反DCT变换处理。本发明可以节省IQT运算与IDCT运算处于同一流水级时带来的额外乘法器资源开销。(The invention discloses a hardware decoder pipeline optimization method and application, and relates to the technical field of video decoding. A hardware decoder pipeline optimization method divides the decoding of AVC video sequence into multi-stage pipeline structure, the method stipulates the cooperative working mode of entropy decoding, inverse quantization, inverse DCT transformation, intra-frame prediction, inter-frame prediction, image reconstruction and deblocking filtering process; enabling the inverse quantization process and the entropy decoding process to be located at the same pipeline level, and enabling the inverse DCT transformation process to be located at a pipeline level next to the pipeline level where the inverse quantization process is located; the entropy decoding and inverse quantization unit is used for carrying out entropy decoding and inverse quantization processing on the macro block, and the data of a plurality of pixel points after inverse quantization processing are synchronously input to the inverse transformation unit for carrying out multipoint parallel inverse DCT transformation processing. The invention can save the extra multiplier resource overhead brought by the fact that the IQT operation and the IDCT operation are in the same pipeline level.)

硬件解码器流水线优化方法及应用

技术领域

本发明涉及视频解码技术领域，尤其涉及一种硬件解码器流水线优化方法及应用。

背景技术

对于高清视频，如果采用软件全视频解码，会带来很大的CPU、功耗等开销，因此业界通常采用专门的硬件加速器作为视频解码器(简称VDEC(全称Video Decoder)来执行视频解码。以常用的单核硬件解码器为例，单核硬件解码器多采用流水线设计，以宏块(MB，即Macro Block)作为流水单元。以AVC(全称Advanced Video Coding，是现行的主流视频压缩标准之一)视频为例，其主要流水级划分可以参见图1所示，图1中包括4个级别，各级功能描述如下：第一级Entropy Dec：熵解码(CABAC/CAVLC)；第二级IQT(反量化)、IDCT(又称为反DCT变换或逆DCT变换)：反量化，反DCT变换；第三级IPred、ReC：intra、inter预测，图像重建。第四级Dblock：去块滤波。其中，离散余弦逆变换(IDCT)是视频解码运算中最基本也是最常用的变换，是视频解码的核心运算过程之一，其主要过程是对残差数据进行两次矩阵乘法，里面需要大量的乘法器/加法器资源。在残差送入IDCT单元之前，先需要进行反量化处理(IQT)，其过程是根据反量化值(QP)进行相应的乘法运算。现有技术中，由于熵解码解析不同的语法元素(syntax)控制较为复杂，通常会采用DSP加专门的Entropy运算加速器来实现，而IQT、IDCT由于运算前后紧密联系，通常放在熵解码之后的同一流水级。

随着4K/8K高清时代的到来，IDCT单元可能需要在每时钟周期中对多像素点进行并行计算，导致了处于同一流水级的IQT单元也需要同时对多个残差进行反量化计算。作为举例，参见图2所示，IQT单元和IDCT单元置于同一流水级运算，并行计算的多个像素点残差p0，p1，p2，p3，p4，p5，……，pn需要经过各自的IQT单元运算后同步送入IDCT单元，图2中，残差p0通过IQT0单元进行反量化运算，残差p1通过IQT1单元进行反量化运算，以此类推，残差pn通过IQTn单元进行反量化运算。由于每个IQT单元的内部运算至少需要一个16比特(bit)乘法器，另外还需要加法器、移位器等资源，多点并行运算时会带来乘法器资源开销的线性增长。

综上所述，如何提供一种能够节省IDCT并行运算时带来的额外乘法器资源开销的硬件解码器流水线优化方法是当前亟需解决的技术问题。

发明内容

本发明的目的在于：克服现有技术的不足，提供了一种硬件解码器流水线优化方法及应用。本发明通过将IQT(反量化)运算前移，使IQT运算与熵解码处于同一流水级，可以节省IQT运算与IDCT运算处于同一流水级时带来的额外乘法器资源开销。

为实现上述目标，本发明提供了如下技术方案：

一种硬件解码器流水线优化方法，将AVC视频序列的解码划分为多级流水线结构，该方法规定了熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程的协同工作方式；

使反量化过程与熵解码过程位于同一流水级，反DCT变换过程位于反量化过程所在流水级的下一流水级；

通过熵解码反量化单元对宏块进行熵解码和反量化处理，将反量化处理后的多个像素点的数据同步输入到反变换单元进行多点并行的反DCT变换处理。

进一步，将AVC视频序列的解码划分为4级流水线结构，第1级对应熵解码反量化处理，第2级对应反DCT变换处理，第3级对应帧内预测、帧间预测和图像重建处理，第4级对应去块滤波处理。

进一步，所述熵解码反量化单元包括一个残差解析模块和一个反量化计算模块，

所述残差解析模块按zigzag顺序逐个依次解析像素点残差，残差解析模块每解析出一个像素点残差即送入反量化计算模块进行反量化处理，并将处理后的数据存入熵解码输出宏块缓存中。

进一步，通过反量化计算模块对残差进行反量化处理时，残差系数变换过程包括AC系数反量化处理和DC系数反量化处理，在进行所述DC系数反量化处理之前，通过残差解析模块进行DC逆哈达玛变换。

进一步，残差的反量化处理包括如下步骤，

获取残差解析状态；

判定为残差解析空闲态时，通过亮度DC解析子模块Y_DC_DEC解析宏块的亮度分量Y的4x4块的DC系数R_{ij_DC_Y}，再通过亮度DC反量化子模块Y_DC_IQT对4x4块的DC系数R_{ij_DC_Y}进行反哈达玛变换和反量化后得到反量化后的残差值Q_{ij_DC_Y}；同时，通过亮度AC解析子模块Y_AC_DEC解析亮度分量Y的AC系数R_{ij_AC_Y}并进行反量化得到反量化后的残差值Q_{ij_AC_Y}；

然后，通过色度DC解析子模块UV_DC_DEC解析宏块的色度分量UV的2x2块的DC系数R_{ij_DC_UV}，再通过色度DC反量化子模块UV_DC_IQT对2x2块的DC系数R_{ij_DC_UV}进行反哈达玛变换和反量化后得到反量化后的残差值Q_{ij_DC_UV}；同时，通过色度AC解析子模块UV_AC_DEC解析色度分量UV的AC系数R_{ij_AC_UV}并进行反量化得到反量化后的残差值Q_{ij_AC_UV}。

本发明还提供了一种用于视频解码的数据处理装置，将AVC视频序列的解码划分为多级流水线结构；

通过所述数据处理装置设置熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程的协同工作方式时，使反量化过程与熵解码过程位于同一流水级，反DCT变换过程位于反量化过程所在流水级的下一流水级；

所述数据处理装置包括熵解码反量化单元和反变换单元；

所述熵解码反量化单元，能够对宏块进行熵解码和反量化处理，并将反量化处理后的多个像素点的数据同步输入到反变换单元中；

所述反变换单元，能够对同步输入的多个像素点的数据进行多点并行的反DCT变换处理。

进一步，所述熵解码反量化单元包括一个残差解析模块和一个反量化计算模块，

本发明还提供了一种视频解码器系统，采用宏块级流水操作；所述视频解码器系统包括通信连接的解码固件和多核硬件解码加速器(所述解码固件用于解析视频码流上层的非熵编码数据，所述多核硬件解码加速器用于处理视频码流中宏块层的解码任务；

所述多核硬件解码加速器包括前述任一项所述的数据处理装置。

本发明还提供了一种视频解码方法，包括如下步骤：

接收视频码流数据；

通过解码固件解析视频码流上层的非熵编码数据，通过多核硬件解码加速器处理视频码流中宏块层的解码任务；

其中，

所述宏块层的解码任务包括熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程，在设置各过程的协同工作方式时，使反量化过程与熵解码过程位于同一流水级，反DCT变换过程位于反量化过程所在流水级的下一流水级；通过熵解码反量化单元对宏块进行熵解码和反量化处理，将反量化处理后的多个像素点的数据同步输入到反变换单元进行多点并行的反DCT变换处理。

本发明由于采用以上技术方案，与现有技术相比，作为举例，具有以下的优点和积极效果：本发明通过将IQT(反量化)运算前移，使IQT运算与熵解码处于同一流水级，可以节省IQT运算与IDCT运算处于同一流水级时带来的额外乘法器资源开销。

附图说明

图1为现有技术中的单核硬件解码器的流水线设计示意图。

图2为IQT和IDCT置于同一流水级的并行运算示例图。

图3为本发明实施例提供的优化后的流水级划分的部分示意图。

图4为本发明实施例提供的熵解码反量化单元与反变换单元的信息传输示意图。

图5为本发明实施例提供的反量化处理时的残差系数变换过程示意图。

图6为本发明实施例提供的主状态机的控制示意图。

图7为本发明实施例提供的视频解码器系统的模块结构交互示意图。

具体实施方式

以下结合附图和具体实施例对本发明公开的硬件解码器流水线优化方法及应用作进一步详细说明。应当注意的是，下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的，它们可以被相互组合从而达到更好的技术效果。在下述实施例的附图中，各附图所出现的相同标号代表相同的特征或者部件，可应用于不同实施例中。因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

需说明的是，本说明书所附图中所绘示的结构、比例、大小等，均仅用以配合说明书所揭示的内容，以供熟悉此技术的人士了解与阅读，并非用以限定发明可实施的限定条件，任何结构的修饰、比例关系的改变或大小的调整，在不影响发明所能产生的功效及所能达成的目的下，均应落在发明所揭示的技术内容所能涵盖的范围内。本发明的优选实施方式的范围包括另外的实现，其中可以不按所述的或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

实施例

一种硬件解码器流水线优化方法，用于将AVC视频序列的解码划分为多级流水线结构，该方法规定了熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程的协同工作方式。

在设置流水级划分时，使反量化过程与熵解码过程位于同一流水级，并使反DCT变换过程位于反量化过程所在流水级的下一流水级。参见图3所示，通过熵解码反量化单元对宏块进行熵解码和反量化处理，将反量化处理后的多个像素点的数据同步输入到反变换单元进行多点并行的反DCT变换处理。

本实施例中，优选的将AVC视频序列的解码划分为4级流水线结构，分别如下：第1级对应熵解码反量化处理(或称熵解码反量化流水级)，第2级对应反DCT变换处理(或称反DCT变换流水级)，第3级对应帧内预测、帧间预测和图像重建处理(或称帧内预测、帧间预测和图像重建流水级)，第4级对应去块滤波处理(或称去块滤波流水级)。上述流水级划分方式与图1中现有技术的差别在于将反量化(IQT)运算前移到熵解码所在流水级中。

继续参见图3所示，所述熵解码反量化单元(Entropy Dec and IQT)可以包括一个残差解析模块和一个反量化计算模块，所述残差解析模块和反量化计算模块采用流水线结构。考虑到残差(Residue)在熵解码(Entropy Dec)时是按zigzag顺序逐个依次解析的，因此将反量化运算前移至熵解码所在流水级时，残差解析(Res Dec)模块每解出一个残差pn，即送入反量化(IQT)模块做反量化后存入熵解码输出宏块缓存(MB buffer)。

具体的，对于位于同一宏块(MB)中的多个像素点残差p0，p1，p2，……，pn，所述残差解析模块被配置为：按zigzag顺序逐个依次解析像素点残差pi(i至0(1(2(……，n)，以及每解析出一个像素点残差pi即送入反量化计算模块中。

所述反量化计算模块被配置为：接收残差解析模块发送的像素点残差进行反量化处理，并将反量化处理后的数据存入熵解码输出宏块缓存中。

作为举例，比如在图3中，残差解析(Res Dec)模块解析像素点残差p0后即将p0送入反量化(IQT)计算模块中做反量化处理(反量化处理后的数据被存入熵解码输出宏块缓存)，然后残差解析模块继续解析下一个像素点残差p1，解析后将p1送入反量化计算模块中做反量化处理(反量化处理后的数据被存入熵解码输出宏块缓存)；以此类推，直至残差解析模块解析像素点残差pn后即将pn送入反量化计算模块中做反量化处理。

通过采用上述技术方案，实现了反量化计算模块的分时复用，参见图4所示，整个第1流水级(熵解码反量化流水级)只需要用到一个IQT计算模块，相比于现有技术中的IQT/IDCT同级运算，显著减少多像素点并行计算需要的乘法器资源。

由于残差系数变换过程涉及AC系数和DC系数的处理，下面结合图5和图6详细描述残差在熵解码反量化流水级上的完整反量化处理过程。

根据AVC协议，本实施例的残差系数变换过程参见图5所示，对残差pn进行反量化处理时，残差系数变换过程包括AC系数反量化处理和DC系数反量化处理，相比于AC系数反量化而言，所述DC反量化之前还需要进行逆哈达玛变换运算。因此，在进行所述DC系数反量化处理之前，还需要通过残差解析模块进行DC逆哈达玛变换。

用R_ij表示熵解码解语法元素得到的原始残差值，用Q_ij表示最终完成反量化后的残差值，优选的实施方式中，残差的反量化处理包括如下步骤：

步骤1，获取残差解析状态。

步骤2，判定为残差解析空闲态(IDLE)时，通过亮度DC解析子模块Y_DC_DEC解析宏块的亮度分量Y的4x4块的DC系数R_{ij_DC_Y}，再通过亮度DC反量化子模块Y_DC_IQT对4x4块的DC系数R_{ij_DC_Y}进行反哈达玛变换和反量化后得到反量化后的残差值Q_{ij_DC_Y}；同时，通过亮度AC解析子模块Y_AC_DEC解析亮度分量Y的AC系数R_{ij_AC_Y}并进行反量化得到反量化后的残差值Q_{ij_AC_Y}。

步骤3，然后，通过色度DC解析子模块UV_DC_DEC解析宏块的色度分量UV的2x2块的DC系数R_{ij_DC_UV}，再通过色度DC反量化子模块UV_DC_IQT对2x2块的DC系数R_{ij_DC_UV}进行反哈达玛变换和反量化后得到反量化后的残差值Q_{ij_DC_UV}；同时，通过色度AC解析子模块UV_AC_DEC解析色度分量UV的AC系数R_{ij_AC_UV}并进行反量化得到反量化后的残差值Q_{ij_AC_UV}。

如此，就可以获得宏块的亮度分量Y的反量化后的残差值Q_{ij_DC_Y}和Q_{ij_AC_Y}，以及色度分量UV的反量化后的残差值Q_{ij_DC_UV}和Q_{ij_AC_UV}。上述数据输入到反变换单元进行IDCT变换处理(或称逆DCT变换处理，反DCT变换处理)。

作为典型方式的优选，在残差解析模块中插入DC逆哈达玛运算时，主状态机的控制方式参见图6所示。

其中，Y_DC_DEC表示亮度DC解析子模块，用于解析宏块的亮度分量Y的4x4块的DC系数R_{ij_DC_Y}。Y_DC_IQT表示亮度DC反量化子模块，用于对4x4块的DC系数R_{ij_DC_Y}进行反哈达玛变换和反量化后得到反量化后的残差值Q_{ij_DC_Y}。Y_AC_DEC表示亮度AC解析子模块，用于解析亮度分量Y的AC系数R_{ij_AC_Y}并进行反量化得到反量化后的残差值Q_{ij_AC_Y}。

UV_DC_DEC表示色度DC解析子模块，用于解析宏块的色度分量UV的2x2块的DC系数R_{ij_DC_UV}。UV_DC_IQT表示色度DC反量化子模块，用于对2x2块的DC系数R_{ij_DC_UV}进行反哈达玛变换和反量化后得到反量化后的残差值Q_{ij_DC_UV}。UV_AC_DEC表示色度AC解析子模块，用于解析色度分量UV的AC系数R_{ij_AC_UV}并进行反量化得到反量化后的残差值Q_{ij_AC_UV}。

本发明的另一实施例，还提供了一种用于视频解码的数据处理装置。所述数据处理装置用于将AVC视频序列的解码划分为多级流水线结构。

本实施例中，通过所述数据处理装置设置熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程的协同工作方式时，使反量化过程与熵解码过程位于同一流水级，反DCT变换过程位于反量化过程所在流水级的下一流水级。

具体的，所述数据处理装置包括熵解码反量化单元和反变换单元。

所述熵解码反量化单元，能够对宏块进行熵解码和反量化处理，并将反量化处理后的多个像素点的数据同步输入到反变换单元中。

所述反变换单元，能够对同步输入的多个像素点的数据进行多点并行的反DCT变换处理。

本实施例中，所述数据处理装置将AVC视频序列的解码划分为4级流水线结构，第1级对应熵解码反量化处理，第2级对应反DCT变换处理，第3级对应帧内预测、帧间预测和图像重建处理，第4级对应去块滤波处理。

优选的，所述熵解码反量化单元可以包括一个残差解析模块和一个反量化计算模块，所述残差解析模块和反量化计算模块采用流水线结构。考虑到残差(Residue)在熵解码(Entropy Dec)时是按zigzag顺序逐个依次解析的，因此将反量化运算前移至熵解码所在流水级时，残差解析(Res Dec)模块每解出一个残差pn，即送入反量化(IQT)模块做反量化后存入熵解码输出宏块缓存(MB buffer)。

具体的，所述残差解析模块按zigzag顺序逐个依次解析像素点残差，残差解析模块每解析出一个像素点残差即送入反量化计算模块进行反量化处理，并将处理后的数据存入熵解码输出宏块缓存中。

通过采用上述技术方案，实现了反量化计算模块的分时复用，整个第1流水级(熵解码反量化流水级)只需要用到一个IQT计算模块，相比于现有技术中的IQT/IDCT同级运算，显著减少多像素点并行计算需要的乘法器资源。

其它技术特征参考在前实施例，在此不再赘述。

本发明的另一实施例，还提供了一种视频解码器系统，所述系统采用宏块级流水操作。

参见图7所示，所述视频解码器系统可以包括通信连接的解码固件(图7中的VDEC_FW(全称Video FirmWare)和多核硬件解码加速器(图7中的VDEC_MCORE(全称VDEC Multi)Core)。所述解码固件，用于解析视频码流上层的非熵编码数据。所述多核硬件解码加速器，用于处理视频码流中宏块层的解码任务。所述解码固件和多核硬件解码加速器之间以视频码流中的Slice层级数据作为交互单元，通过Slice Queue(即，条队列)进行Slice并行处理。

AVC视频的码流采用分层结构，将属于GOP层、Slice层中共用的大部分语法游离出来，组成了视频参数集VPS(即，Video Parameter Set)，序列参数集SPS(即，SequenceParameter Set)和图像参数集PPS(即，Picture Parameter Set)等，由于这部分数据占比很小且解析简单，非常适合软件解析。根据上述码流数据的特性，本实施例提供的解码器系统将视频解码器VDEC分为解码固件VDEC_FW和多核硬件解码加速器VDEC_MCORE两部分，其中，解码固件作为软件部分用于解析视频码流上层的非熵编码数据(比如视频参数集VPS、序列参数集SPS、图像参数集PPS和Slice头信息等)，多核硬件解码加速器作为硬件部分可以用于集中处理视频码流中宏块层的所有解码工作。

本实施例中，所述多核硬件解码加速器包括前述实施例中的数据处理装置。

通过所述数据处理装置设置熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程的协同工作方式时，使反量化过程与熵解码过程位于同一流水级，反DCT变换过程位于反量化过程所在流水级的下一流水级。

所述数据处理装置，可以包括熵解码反量化单元和反变换单元。

所述熵解码反量化单元，能够对宏块进行熵解码和反量化处理，并将反量化处理后的多个像素点的数据同步输入到反变换单元中。所述反变换单元，能够对同步输入的多个像素点的数据进行多点并行的反DCT变换处理。进一步，所述数据处理装置还可以包括预测重建单元、去块滤波单元，所述预测重建单元用于对宏块数据进行帧内预测处理、帧间预测处理和图像重建处理，所述去块滤波单元用于对宏块数据进行去块滤波处理。

在一个实施方式中，所述熵解码反量化单元可以包括一个残差解析模块和一个反量化计算模块，所述残差解析模块和反量化计算模块采用流水线结构。考虑到残差(Residue)在熵解码(Entropy Dec)时是按zigzag顺序逐个依次解析的，因此将反量化运算前移至熵解码所在流水级时，残差解析(Res Dec)模块每解出一个残差pn，即送入反量化(IQT)模块做反量化后存入熵解码输出宏块缓存(MB buffer)。具体的，所述残差解析模块按zigzag顺序逐个依次解析像素点残差，残差解析模块每解析出一个像素点残差即送入反量化计算模块进行反量化处理，并将处理后的数据存入熵解码输出宏块缓存中。

继续参见图7所示，软/硬件以视频码流中Slice层级作为交互单元，通过视频解码器内部的Slice Queue进行数据交互。解码固件VDEC_FW和多核硬件解码加速器VDEC_MCORE的交互流程可以如下：

1)解码固件VDEC_FW完成码流上层解析任务后，将Slice上层参数信息打包压入Slice Queue队列，即将信息放入(push)到Slice Queue的队列中进行排队。图7中朝下的箭头表示压入Slice Queue的操作。

此时，解码固件被配置为：完成视频码流上层解析后，将Slice上层参数信息打包压入Slice Queue。

2)多核硬件解码加速器VDEC_MCORE查询Slice Queue数据的ready信息(就绪状态信息)，读取队列信息并完成配置后，全硬件解析当前Slice内宏块直至结束，并在结束时发出中断信号，释放Slice Queue，即释放(pop)Slice Queue的队列中的对应信息。图7中朝上的箭头表示释放Slice Queue的操作。

此时，多核硬件解码加速器被配置为：查询Slice Queue数据的ready信息，在读取队列并完成配置后，解析当前Slice内宏块直至该Slice内宏块解析完成，解析结束后发出中断信号，释放Slice Queue。

如此，通过软硬件划分结合Slice queue来实现Slice并行处理，软硬件并行处理能够显著节省软件处理时间，进而提高了并行处理效率。

具体的，作为典型方式的举例，所述多核硬件解码加速器可以配配置为包括一预处理器模块和多个同构的全功能硬件解码器。所述的全功能硬件解码器，是指该硬件解码器至少能够处理宏块行解码所必需的反DCT变换、帧内帧间预测和像素重建几个步骤。

所述预处理器模块，包括数据处理装置的熵解码反量化单元。

所述全功能硬件解码器，包括数据处理装置的反变换单元、预测重建单元和去块滤波单元。

每个所述全功能硬件解码器单核，负责对一行宏块行进行包括反DCT变换、帧内预测、帧间预测、图像重建和去块滤波等过程步骤在内的解码，并使两个相邻的上下行中正在解码的宏块至少间隔两个宏块以实现多核同步解码。

同构的全功能硬件解码器，可以设置为两个以上(包括两个)，设置为两个时称为双核硬件解码加速器，设置为三个时称为三核硬件解码加速器，设置为四个时称为四核硬件解码加速器，以此类推。每个全功能硬件解码器负责一行宏块行的解码，双核硬件解码加速器可以同时进行两行宏块行的并行解码工作，三核硬件解码加速器可以同时进行三行宏块行的并行解码工作，以此类推。

数据处理装置的其它技术特征参考在前实施例，在此不再赘述。

本发明的另一实施例，还提供了利用前述视频解码器系统的视频解码方法。所述视频解码方法包括如下步骤：

步骤100，接收视频码流数据。

步骤200，通过解码固件解析视频码流上层的非熵编码数据，通过多核硬件解码加速器处理视频码流中宏块层的解码任务。

所述步骤200中，所述宏块层的解码任务包括熵解码、反量化、反DCT变换、帧内预测、帧间预测、图像重建和去块滤波过程。在设置各过程的协同工作方式时，使反量化过程与熵解码过程位于同一流水级，反DCT变换过程位于反量化过程所在流水级的下一流水级。通过熵解码反量化单元对宏块进行熵解码和反量化处理，将反量化处理后的多个像素点的数据同步输入到反变换单元进行多点并行的反DCT变换处理。

其它技术特征参考在前实施例，在此不再赘述。

在上面的描述中，本发明的公开内容并不旨在将其自身限于这些方面。而是，在本公开内容的目标保护范围内，各组件可以以任意数目选择性地且操作性地进行合并。另外，像“包括”、“囊括”以及“具有”的术语应当默认被解释为包括性的或开放性的，而不是排他性的或封闭性，除非其被明确限定为相反的含义。所有技术、科技或其他方面的术语都符合本领域技术人员所理解的含义，除非其被限定为相反的含义。在词典里找到的公共术语应当在相关技术文档的背景下不被太理想化或太不实际地解释，除非本公开内容明确将其限定成那样。本发明领域的普通技术人员根据上述揭示内容做的任何变更、修饰，均属于权利要求书的保护范围。

14页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：适用于AVC的熵解码硬件并行计算方法及应用

硬件解码器流水线优化方法及应用

相关技术

网友询问留言