一种用于扩展预定定向帧内预测模式集合的帧内预测装置

文档序号：1956982 发布日期：2021-12-10 浏览：19次 >En<

阅读说明：本技术 一种用于扩展预定定向帧内预测模式集合的帧内预测装置 (Intra-frame prediction device for expanding preset directional intra-frame prediction mode set ) 是由阿列克谢·康斯坦丁诺维奇·菲利波夫瓦西里·亚历斯维奇·拉夫特斯基于 2016-12-23 设计创作，主要内容包括：本发明涉及一种用于扩展矩形视频编码块的预定定向帧内预测模式集合的帧内预测装置(100)。所述帧内预测装置(100)包括：纵横比确定单元(101),用于确定所述矩形视频编码块的纵横比；互补角度范围确定单元(103),用于基于所述纵横比确定互补角度范围；定向帧内预测模式扩展单元(105),用于在所述互补定向范围内选择互补定向,以及将与所述互补定向关联的扩展定向帧内预测模式添加到所述预定定向帧内预测模式集合中；以及帧内预测单元(107),用于基于所述扩展定向帧内预测模式对所述矩形视频编码块的像素的像素值进行帧内预测。(The invention relates to an intra prediction apparatus (100) for extending a set of predetermined directional intra prediction modes of a rectangular video coding block. The intra prediction apparatus (100) includes: an aspect ratio determination unit (101) for determining an aspect ratio of the rectangular video coding block; a complementary angle range determination unit (103) for determining a complementary angle range based on the aspect ratio; a directional intra-prediction mode extension unit (105) for selecting a complementary orientation within the range of complementary orientations, and adding an extended directional intra-prediction mode associated with the complementary orientation to the set of predetermined directional intra-prediction modes; and an intra-prediction unit (107) for intra-predicting pixel values of pixels of the rectangular video coding block based on the extended directional intra-prediction mode.)

技术领域

一般而言，本发明涉及视频编码领域。更具体地，本发明涉及一种用于视频编码块的定向帧内预测装置，以及一种包括此类帧内预测装置的编码装置和解码装置。

背景技术

数字视频通信和存储应用由各种各样的数字设备来实现，例如数码相机、蜂窝无线电话、笔记本电脑、广播系统、视频会议系统等。视频压缩是这些应用中最重要也最具挑战性的任务之一。视频压缩的任务复杂，并且受到压缩效率和计算复杂度这两个相互冲突的参数限制。ITU-T H.264/AVC或ITU-T H.265/HEVC等视频编码标准提供了良好的参数折衷。由于这个原因，支持视频编码标准几乎是对任意视频压缩应用的强制性要求。

现有视频编码标准基于将源图片划分成视频编码块(或短块)。这些块的处理取决于它们的尺寸、空间位置和编码器指定的编码模式。根据预测类型，可将编码模式分为两组：帧内预测模式和帧间预测模式。帧内预测模式使用相同图片(也称为帧或图像)的像素来生成参考样本以计算正在重构的块的像素的预测值。帧内预测也称为空间预测。帧间预测模式旨在用于时间预测，并使用前一个或后一个图片的参考样本来预测当前图片的块的像素。在预测阶段之后，对预测误差(即原始信号与预测信号之间的差值)进行变换编码。然后，使用熵编码器(例如，用于AVC/H.264和HEVC/H.265的CABAC)对变换系数和边信息进行编码。最近通过的ITU-T H.265/HEVC标准(ISO/IEC 23008-2:2013，“信息技术—异构环境中的高效率编码和媒体传送—第2部分：高效率视频编码”，2013年11月)宣布了一套最先进的视频编码工具，提供了编码效率和计算复杂度之间的合理折衷。在《IEEE视频技术电路和系统汇刊》2012年12月第22卷第12期中的Gary J.Sullivan的《高效视频编码(HEVC)标准概述》中给出了ITU-T H.265/HEVC标准概述。其全部内容通过引用并入本文。

与ITU-T H.264/AVC视频编码标准类似，HEVC/H.265视频编码标准将源图片划分成块，例如编码单元(coding unit，简称CU)。可以进一步地将每个CU分成更小的CU或预测单元(predicting unit，简称PU)。PU可以根据应用于PU的像素的处理类型进行帧内或帧间预测。在帧间预测的情况下，PU表示运动补偿通过为PU指定的运动矢量处理的像素面积。对于帧内预测，将相邻块的相邻像素用作参考样本来预测当前块。PU指定从该PU中包含的所有变换单元(transform unit，简称TU)的帧内预测模式集合中选择的预测模式。TU可以具有不同的大小(例如4x4、8x8、16x16和32x32像素)，并且可以采用不同的方式进行处理。TU中进行变换编码，即利用离散余弦变换或离散正弦变换对预测误差进行变换(在HEVC/H.265标准中，将其应用于帧内编码块)并进行量化。因此，重构的像素包含量化噪声(其可能会因为，例如，单元之间的块效应、环状伪影以及尖锐边缘等而变得明显)，环路滤波器如解块滤波器(Deblocking Filter，简称DBF)、样本自适应偏移(Sample Adaptive Offset，简称SAO)和自适应环路滤波器(Adaptive Loop Filter，简称ALF))等试图抑制这种噪声。使用复杂的预测编码(例如，运动补偿和帧内预测)和分割技术(例如，HEVC/H.265标准中用于CU和PU的四叉树及用于TU的残差四叉树以及从版本JEM-3.0开始的用于JEM参考软件的四叉树加二叉树)使标准化委员会能够显著减少PU中的冗余。

根据HEVC/H.265标准，图5所示的帧内预测模式包括平面模式(帧内预测模式索引为0)、DC模式(帧内预测模式索引为1)和33种定向模式(帧内预测模式索引为2至34，用实线表示)。通过将定向帧内预测模式之间的步进角按因子2减小，将定向帧内预测模式集合扩展到65个模式(几乎翻倍)。图5中的虚线表示在JEM软件中引入的角度模式。

对于JEM-3.0软件，提出了一种基于四叉树和二叉树(称为QTBT)的新的分割机制。QT和QTBT分割机制之间的根本区别在于，后者通过基于四叉树和二叉树的划分，不仅可以实现正方形块，而且可以实现矩形块。图6示出了使用QTBT进行块划分和对应树结构的示例，其中实线表示四叉树分割，虚线表示二叉树分割。在二叉树的每个分区节点中，分区类型用0(水平分区)或1(垂直分区)表示。

与HEVC/H.265标准中使用的传统四叉树分割相比，QTBT分割的代价是编码器端会有一些信令开销并且计算复杂度会增加。尽管如此，基于QTBT的分割具有更好的分割性能，并且编码效率显著高于传统四叉树(《EE2.1：四叉树加二叉树结构与JEM工具集成》，2016年5月在瑞士日内瓦举行的第三次JVET会议的文献JVET-C0024，作者Han Huang、Kai Zhang、Yu-Wen Huang、Shawmin Lei)。然而，QTBT分割存在一个关键问题：可用的定向帧内预测模式集合没有相应改变。因此，QTBT框架使用的矩形块的不对称性质尚未被考虑，如图7所示，即沿矩形块的短边和长边使用相同数量的参考样本。因此，定向帧内预测模式的数量既不取决于块的纵横比，也不取决于当前实现QTBT框架时参考样本的实际可用性。

有鉴于此，需要用于视频编码的装置和方法，能够有效地处理矩形视频编码块。

发明内容

本发明的一个目的是提供用于视频编码的装置和方法，其结合定向帧内预测机制高效处理矩形视频编码块。

上述及其它目的通过独立权利要求的主题来实现。根据从属权利要求、说明书以及附图，进一步的实现形式显而易见。

下面的发明内容使用了多个术语，在各实施例中，这些术语具有以下含义：分片——独立编码/解码的图片的空间上不同的区域。分片头——用于发送与特定分片关联的信息的数据结构。视频编码块(或短块)——像素或样本的MxN(M列×N行)阵列(每个像素/样本与至少一个像素/样本值相关联)，或变换系数的MxN阵列。编码树单元(CodingTree Unit，简称CTU)网格——用于将像素块划分为宏块以便进行视频编码的网格结构。编码单元(Coding Unit，简称CU)——亮度样本的编码块，具有三个样本阵列的图片的两个对应的色度样本的编码块，或者黑白图片的样本的编码块或通过三个单独的色彩平面和用于对所述样本进行编码的语法进行编码的图片的样本的编码块。图像参数集(PictureParameter Set，简称PPS)——包含语法元素的语法结构，所述语法元素应用于零个或多个全编码图片，所述编码图片由每个片段头中发现的语法元素确定。序列参数集(SequenceParameter Set，简称SPS)——包含语法元素的语法结构，所述语法元素应用于零个或多个全编码视频序列，所述编码视频序列由所述PPS中发现的语法元素的内容确定，所述PPS中发现的语法元素由每个片段头中发现的语法元素所引用。视频参数集(Video ParameterSet，简称VPS)——包含应用于零个或多个全编码视频序列的语法元素的语法结构。预测单元(Prediction Unit，简称PU)——亮度样本的预测块，具有三个样本阵列的图片的两个对应的色度样本的预测块，或者黑白图片的样本的预测块或通过三个单独的色彩平面和用于预测所述预测块样本的语法进行编码的图片的样本的预测块。变换单元(Transform Unit，简称TU)——亮度样本的变换块，具有三个样本阵列的图片的两个对应的色度样本的变换块，或者黑白图片的样本的变换块或通过三个单独的色彩平面和用于预测所述变换块样本的语法进行编码的图片的样本的变换块。补充增强信息(supplemental enhancementinformation，简称SEI)——可以插入视频比特流以增强所述视频的使用的额外信息。亮度——指示图像样本亮度的信息。色度——指示图像样本颜色的信息，可以用红色差色度分量(Cr)和蓝色差色度分量(Cb)来描述。

一般而言，本发明涉及一种用于改进QTBT框架内的所述定向帧内预测机制的装置和方法。更具体地，本发明根据待预测块的纵横比扩展可用定向帧内预测模式集合，根据参考样本的可用性启用或禁用一些定向帧内预测模式，通过模式映射和1位标志发送包含在扩展子集中的定向帧内预测模式。

本发明实施例还提供了以下优点：在将该技术集成到编解码器中之后获得额外的编码增益、广泛应用于与HM软件和VPX视频编解码器系列兼容的混合视频编码范例以及现有及下一代视频编码框架(分别为所述JEM软件和VPX/AV1视频编解码器系列)、降低编码器端和解码器端的硬件和计算复杂度、在使用传统定向帧内预测机制的编解码器中易于实现。

根据第一方面，本发明涉及一种用于扩展矩形视频编码块的预定定向帧内预测模式集合的帧内预测装置，所述预定定向帧内预测模式集合中的每一个预定定向帧内预测模式与预定定向范围内的预定定向相关联，所述帧内预测装置包括：纵横比确定单元，用于确定所述视频编码块的宽度和高度，以及基于所述宽度和所述高度确定所述矩形视频编码块的纵横比(英文：aspect ratio)；互补角度范围确定单元，用于基于所述矩形视频编码块的所述纵横比确定互补角度范围(α)，所述互补角度范围(α)与不同于所述预定定向范围的互补定向范围相关联；定向帧内预测模式扩展单元，用于在所述互补定向范围内选择互补定向(英文：complementary direction)，以及将与所述互补定向相关联的扩展定向帧内预测模式添加到所述预定定向帧内预测模式集合中；以及帧内预测单元，用于基于所述扩展定向帧内预测模式对所述矩形视频编码块的像素的像素值进行帧内预测。

就此而言，术语“定向”是指所述视频编码块内的方向，用于所述视频编码块内的定向帧内预测。术语“定向范围”是指覆盖多个所述定向的范围。

根据所述第一方面，在所述帧内预测装置的第一种实现方式中，所述互补角度范围确定单元用于根据以下算式确定所述互补角度范围(α)：

其中，α表示所述互补角度范围，L_shorter/L_longer表示所述矩形视频编码块的所述纵横比。

根据所述第一方面的所述第一种实现方式，在所述帧内预测装置的第二种实现方式中，L_shorter表示所述矩形视频编码块的所述宽度，L_longer表示所述矩形视频编码块垂直方向上的所述矩形视频编码块的所述高度，或者L_shorter表示所述矩形视频编码块的所述高度，L_longer表示所述矩形视频编码块水平方向上的所述矩形视频编码块的所述宽度。

根据所述第一方面或所述第一方面的任一前述实现方式，在所述帧内预测装置的第三种实现方式中，所述定向帧内预测模式扩展单元还用于：在所述互补定向范围内选择另一互补定向，并将与所述另一互补定向相关联的另一扩展定向帧内预测模式添加到所述预定定向帧内预测模式集合中。

根据所述第一方面的所述第三种实现方式，在所述帧内预测装置的第四种实现方式中，所述扩展定向帧内预测模式的所述互补定向与所述另一扩展定向帧内预测模式的所述另一互补定向相差预定的角度步长(英文：angle step)。

根据所述第一方面的所述第四种实现方式，在所述帧内预测装置的第五种实现方式中，所述预定角度步长通过以下算式得出：

其中，s表示所述预定角度步长。

根据所述第一方面或所述第一方面的任一前述实现方式，在所述帧内预测装置的第六种实现方式中，所述帧内预测装置还包括定向帧内预测模式移除单元，用于在所述预定定向帧内预测模式集合中选择定向帧内预测模式，所述所选定向帧内预测模式与所述互补定向范围的相反定向相关联，并用于从所述预定定向帧内预测模式集合中移除所述所选定向帧内预测模式。

根据所述第一方面或所述第一方面的任一前述实现方式，在所述帧内预测装置的第七种实现方式中，所述互补定向范围与所述预定定向范围相邻。

根据所述第一方面或所述第一方面的任一前述实现方式，在所述帧内预测装置的第八种实现方式中，所述矩形视频编码块为编码单元(CU)、预测单元(PU)或变换单元(TU)。

根据第二方面，本发明涉及一种用于编码矩形视频编码块的编码装置。所述编码装置包括：根据所述第一方面或所述第一方面的任一实现方式所述的帧内预测装置，用于提供预测的矩形视频编码块；以及编码单元，用于基于所述预测的矩形视频编码块对所述矩形视频编码块进行编码。

根据第三方面，本发明涉及一种用于解码编码矩形视频编码块的解码装置，所述解码装置包括：根据所述第一方面或所述第一方面的任一实现方式所述的帧内预测装置，用于提供预测的矩形视频编码块；以及恢复单元，用于基于所述编码的矩形视频编码块和所述预测的矩形视频编码块恢复矩形视频编码块。

根据第四方面，本发明涉及一种用于扩展矩形视频编码块的预定定向帧内预测模式集合的帧内预测方法，所述预定定向帧内预测模式集合中的每一个预定定向帧内预测模式与预定定向范围内的预定定向相关联，所述帧内预测方法包括：确定所述视频编码块的宽度和高度；基于所述宽度和所述高度确定所述矩形视频编码块的纵横比；基于所述矩形视频编码块的所述纵横比确定互补角度范围(α)，所述互补角度范围(α)与不同于所述预定定向范围的互补定向范围相关联；在所述互补定向范围内选择互补定向；将与所述互补定向相关联的扩展定向帧内预测模式添加到所述预定定向帧内预测模式集合中；以及基于所述扩展定向帧内预测模式对所述矩形视频编码块的像素的像素值进行帧内预测。

根据所述第四方面，在所述帧内预测方法的第一种实现方式中，所述帧内预测方法还包括：在所述预定定向帧内预测模式集合中选择定向帧内预测模式，所述所选定向帧内预测模式与所述互补定向范围的相反定向相关联；以及从所述预定定向帧内预测模式集合中移除所述所选定向帧内预测模式。

所述帧内预测方法可以由所述帧内预测装置执行。所述帧内预测方法的进一步特征直接来自所述帧内预测装置的特征或功能。

根据第五方面，本发明涉及一种包括程序代码的计算机程序，所述程序代码用于在计算机上运行时执行所述第四方面或者所述第四方面的任一实现方式提供的所述方法。

本发明可以硬件和/或软件的方式来实现。

附图说明

本发明进一步的实施方式将结合以下附图进行描述，其中：

图1示出了用于扩展矩形视频编码块的预定定向帧内预测模式集合的帧内预测装置的示意图；

图2示出了用于编码矩形视频编码块的编码装置的示意图；

图3示出了用于解码编码后的矩形视频编码块的解码装置的示意图；

图4示出了用于扩展矩形视频编码块的预定定向帧内预测模式集合的帧内预测方法的示意图；

图5示出了展示不同定向帧内预测模式的视频编码块的示意图；

图6a和6b示出了使用四叉树加二叉树(quad-tree plus binary-tree，简称QTBT)进行块划分和对应树结构的示例；

图7a和7b分别示出了四叉树(quad-tree，简称QT)和四叉树加二叉树(QTBT)框架中定向帧内预测机制的实现方式；

图8a和8b示出了根据给定矩形视频编码块的纵横比扩展预定定向帧内预测模式集合；

图9示出了根据给定矩形视频编码块的纵横比扩展预定定向帧内预测模式集合的示意图；

图10示出了根据给定矩形视频编码块的纵横比保留定向帧内预测模式的基数的示意图；

图11示出了使用四叉树加二叉树(QTBT)进行块划分和对应树结构的示例，其中矩形视频编码块中沿长边的可用参考样本的数量小于其长度的两倍；

图12示出了根据给定矩形视频编码块的参考样本的可用性启用或禁用预定定向帧内预测模式集合；

图13示出了扩展定向帧内预测模式的信令机制的第一步；

图14示出了扩展定向帧内预测模式的信令机制的第二步；

图15示出了通过应用信令机制对定向帧内模式索引进行解码的过程；

图16示出了应用于编码装置的信令机制的实现方式的示意图；

图17示出了应用于解码装置的信令机制的实现方式的示意图；

图18a和18b示出了应用于增强型帧内预测(Enhanced Intra-Prediction，简称EIP)机制的信令机制的实现方式的示意图；

图19示出了用于编码包括帧内预测装置的矩形视频编码块的编码装置的示意图。

在各附图中，相同的或至少功能等同的特征使用相同的标号。

具体实施方式

以下结合附图进行描述，所述附图是描述的一部分，并通过图解说明的方式示出可以实施本发明的具体方面。可以理解的是，在不脱离本发明范围的情况下，可以利用其它方面，并可以做出结构上或逻辑上的改变。因此，以下详细的描述并不当作限定，本发明的范围由所附权利要求书界定。

例如，可以理解的是，与所描述的方法有关的内容对于用于执行方法的对应设备或系统也同样适用，反之亦然。例如，如果描述了一个具体的方法步骤，对应的设备可以包括用于执行所描述的方法步骤的单元，即使此类单元未在图中详细阐述或说明。此外，应理解，除非另外具体指出，否则本文中描述的各种示例性方面的特征可彼此组合。

图1示出了用于扩展矩形视频编码块的预定定向帧内预测模式集合的帧内预测装置100的示意图。所述预定定向帧内预测模式集合中的每一个预定定向帧内预测模式与预定定向范围内的预定定向相关联。所述帧内预测装置100包括：纵横比确定单元101，用于确定所述视频编码块的宽度和高度，以及基于所述宽度和所述高度确定所述矩形视频编码块的纵横比；互补角度范围确定单元103，用于基于所述矩形视频编码块的所述纵横比确定互补角度范围(α)，所述互补角度范围(α)与不同于所述预定定向范围的互补定向范围相关联；定向帧内预测模式扩展单元105，用于在所述互补定向范围内选择互补定向，以及将与所述互补定向相关联的扩展定向帧内预测模式添加到所述预定定向帧内预测模式集合中；以及帧内预测单元107，用于基于所述扩展定向帧内预测模式对所述矩形视频编码块的像素的像素值进行帧内预测。

图2示出了用于编码矩形视频编码块的编码装置200的示意图。所述编码装置200包括：帧内预测装置100，用于提供预测的矩形视频编码块；以及编码单元201，用于基于所述预测的矩形视频编码块对所述矩形视频编码块进行编码。

图3示出了用于解码编码后的矩形视频编码块的解码装置300的示意图。所述解码装置300包括：帧内预测装置100，用于提供预测的矩形视频编码块；以及恢复单元301，用于基于所述编码的矩形视频编码块和所述预测的矩形视频编码块恢复矩形视频编码块。

图4示出了用于扩展矩形视频编码块的预定定向帧内预测模式集合的帧内预测方法400的示意图。所述预定定向帧内预测模式集合中的每一个预定定向帧内预测模式与预定定向范围内的预定定向相关联。所述帧内预测方法400包括：确定401所述视频编码块的宽度和高度；基于所述宽度和所述高度确定403所述矩形视频编码块的纵横比；基于所述矩形视频编码块的所述纵横比确定405互补角度范围(α)，所述互补角度范围(α)与不同于所述预定定向范围的互补定向范围相关联；在所述互补定向范围内选择407互补定向；将与所述互补定向相关联的扩展定向帧内预测模式添加409到所述预定定向帧内预测模式集合中；以及基于所述扩展定向帧内预测模式对所述矩形视频编码块的像素的像素值进行帧内预测411。

图5示出了展示不同定向帧内预测模式的视频编码块的示意图。图5所示的帧内预测模式包括平面模式(帧内预测模式索引为0)、DC模式(帧内预测模式索引为1)和33种定向模式(帧内预测模式索引为2至34，用实线表示)。通过将定向帧内预测模式之间的步进角按因子2减小，将定向帧内预测模式集合扩展到65个模式(几乎翻倍)。图5中的虚线表示在JEM软件中引入的角度模式。

图6a和图6b示出了使用四叉树加二叉树(QTBT)进行块划分和对应树结构的示例，其中实线表示四叉树分割，虚线表示二叉树分割。在二叉树的每个分区节点中，分区类型用0(水平分区)或1(垂直分区)表示。

图7a和7b分别示出了四叉树(quad-tree，简称QT)和四叉树加二叉树(QTBT)框架中定向帧内预测机制的实现方式。这里，沿矩形块的短边和长边使用相同数量的参考样本。因此，定向帧内预测模式的数量既不取决于块的纵横比，也不取决于当前实现QTBT框架时参考样本的实际可用性。

图8a和8b示出了根据给定矩形视频编码块的纵横比扩展预定定向帧内预测模式集合。如图8a所示，正方形视频编码块的纵横比为1:1，采用传统的定向帧内预测模式集合对正在重构的视频编码块的值进行预测。另一方面，矩形视频编码块包括短边和长边，这种不对称可以通过提高预测精度来改进当前的定向帧内预测机制。如图8b所示，可以沿长边增加可用定向帧内预测模式的数量。

图9示出了根据给定矩形视频编码块的纵横比扩展预定定向帧内预测模式集合的示意图。对应的处理步骤可以由所述帧内预测装置100和/或所述帧内预测方法400实现。在图9中，正方形像素表示用于帧内预测的参考样本，其中所述参考样本可用的概率顺序为：具有点的参考像素＞具有条纹的参考像素＞具有对角线的参考像素。

新引入的所述定向帧内预测模式的数量可以取决于所述矩形视频编码块的所述纵横比。包含这些新模式的角度通过以下公式定义：

其中，L_shorter和L_longer分别表示所述矩形视频编码块的所述短边和所述长边的长度。如图9所示，对于所述矩形视频编码块的垂直方向，L_shorter＝宽度，L_longer＝高度。这些模式的实际数量可能取决于相邻定向模式之间的角度和由以上公式定义的角度α。

在所述JEM软件的最新版本(版本JEM-4.0)中，由帧内预测插值滤波器定义的相邻定向模式之间的平均角度步长不依赖于块大小，且等于：

因此，在均匀间隔定向帧内预测模式的情况下，新引入模式的数量N等于：

其中，表示向下取整运算。

在图9所示的实施例中，参考样本的数量沿长边扩展，且对于短边，参考样本的数量不会减少。因此，沿长边可用的帧内预测模式的数量(包含这些模式的角度用实线标记)增加，但沿短边可用的帧内预测模式的数量(包含这些模式的角度用虚线标记)不减少。因而仅帧内预测模式集合的基数增加，而以下纵横比减小：

另一方面，根据另一个实施例，也可以采用另一种方法来保留定向帧内预测模式的原始数量。

图10示出了根据给定矩形视频编码块的纵横比保留定向帧内预测模式的基数的示意图。如图10所示，沿长边增加的定向帧内预测模式的数量(包含这些模式的角度用实线标记)可以等于沿短边移除的定向帧内预测模式的数量(包含这些模式的角度用虚线标记)。因此，所述帧内预测模式集合的基数与正方形块的基数保持相同。根据一个实施例，是否扩展可用的帧内预测模式集合也可以取决于参考样本的可用性，因为它们需要生成帧内预测。

图11示出了使用四叉树加二叉树(QTBT)进行块划分和对应树结构的示例，其中矩形视频编码块中沿长边的可用参考样本的数量小于其长度的两倍。如图11所示，四叉树加二叉树(QTBT)分割框架产生分区，其中，如图9和10中的上述示例中所假设的，沿长边的可用参考样本的实际数量小于其长度的两倍。因此，上述示例中增加所述定向帧内预测模式的数量的方法可能需要根据图11示例中参考样本的可用性进行调整。

图12示出了根据四叉树加二叉树(QTBT)分割框架内给定矩形视频编码块的参考样本的可用性启用或禁用预定定向帧内预测模式集合，其中，灰色矩形区域表示当前处理的视频编码块，具有对角线的正方形像素表示可用参考样本，具有点的正方形像素表示不可用参考样本。

使用内插参考样本生成的矩形视频编码块的分数非预测区域P可以计算如下：

其中，L_longer和L_shorter分别表示矩形视频编码块的长边和短边的长度，γ表示属于所述扩展组的给定定向帧内预测模式的角度，S_block＝L_shorter·L_longer表示要预测的矩形视频编码块的面积，表示非预测区域，即可以不用非内插参考样本预测的视频编码块的面积，如条纹所标记。

因此，帧内预测定向越靠近用虚线标记的对角线，可以不用非内插参考样本进行预测的余下区域部分就越大。在一个示例中，如果沿长边的非内插参考样本的长度L_RSlonger小于长边的长度的两倍，则不扩展所述定向帧内预测模式集合：

L_RSlonger＜2L_longer。

如果扩展了定向帧内预测模式集合，则需要发送新扩展的模式，这通过现有的传统机制可能无法实现。为此，在图13和14中提出并解释了扩展定向帧内预测模式的两步信令机制。

图13示出了扩展定向帧内预测模式的信令机制的第一步，其中扩展的模式集合通过镜像过程映射到传统帧内预测模式集合。

图14示出了扩展定向帧内预测模式的信令机制的第二步，其中用1位标志来区分传统的和扩展的定向模式。对于传统模式，所述标志被赋值为“0”，对于扩展模式，所述标志被赋值为“1”。此外，所述信令机制中的所述标志仅用于那些作为扩展模式的反射的定向模式。

图15示出了通过应用信令机制对定向帧内模式索引进行解码的过程。如图15所示，所述定向帧内预测的所述扩展模式标记为“1”，具有映射模式的所述传统模式标记为“0”，其它模式没有额外的信令值。

图16示出了应用于编码装置的信令机制的实现方式的示意图。在第一处理步骤1601中，从比特流中解析帧内预测模式I_IPM的索引。之后，在处理步骤1603中，根据解码的帧内预测模式是否为定向帧内预测模式进行决策。如果在HEVC视频编码的上下文中采用信令方案，当I_IPM大于1时，所述帧内预测模式是定向的。若所述帧内预测模式是定向的，则在处理步骤1605中，根据解码后的帧内预测模式是否为扩展的进行决策。当I_IPM大于Q[π/2+arctan(Width/Height)]且小于VDIAG_IDX时，扩展所述解码的帧内预测模式，其中，Width和Height表示解码的矩形视频编码块的短边和长边的长度，根据本发明的实施例，VDIAG_IDX等于66。然后，对于可以具有映射的扩展代码的传统模式，将标记“ext_dir_mode_flag”赋值为0(参见处理步骤1607、1609)。在处理步骤1611中，估算传统模式的率失真成本(RD-cost)。对于扩展模式，将标记“ext_dir_mode_flag”赋值为1(参见处理步骤1613、1615)。在处理步骤1617中，估算传统模式的率失真成本(RD-cost)。在处理步骤1619中，通过在传统模式和扩展模式之间找出最低的率失真成本(RD-cost)来确定标记“ext_dir_mode_flag”。

图17示出了应用于解码装置的信令机制的实现方式的示意图。在第一处理步骤1701中，从比特流中解析帧内预测模式I_IPM的索引。之后，在处理步骤1703中，根据解码的帧内预测模式是否为定向帧内预测模式进行决策。如果在HEVC视频编码的上下文中采用信令方案，当I_IPM大于1时，所述帧内预测模式是定向的。若所述帧内预测模式是定向的，则在处理步骤1705中，根据解码后的帧内预测模式是否为扩展的进行决策。当I_IPM大于Q[π/2+arctan(Width/Height)]且小于VDIAG_IDX时，扩展所述解码的帧内预测模式，其中，Width和Height表示解码的矩形块的短边和长边的长度，根据本发明的实施例，VDIAG_IDX等于66。对于扩展的定向帧内预测模式，在处理步骤1707中，从比特流中解析标志“ext_dir_mode_flag”的值。根据本发明的实施例，该标志被引入到比特流中，以编码是否将所提出的机制应用于所述预测单元。在处理步骤1709中，如本发明实施例所提供的，如果ext_dir_mode_flag等于1(处理步骤1711a)，则决定采用扩展预测方案来获得预测信号，如果ext_dir_mode_flag不等于1(处理步骤1711b)，则采用传统预测来获得预测信号。在处理步骤1709中的所述决策是基于在处理步骤1707中确定的所述标记“ext_dir_mode_flag”的值进行的。

所述信令机制适用于本发明实施例提供的更广泛的情况。例如，它可以用于减少由Google为其VPX编解码器系列提出的增强型帧内预测(EIP)技术中使用的扩展的定向帧内预测模式集合引起的信令开销。需要用这种EIP技术来提高帧间预测图片中的帧内预测块的压缩效率。EIP是一种用于增加可用预测定向数量的两步机制，其中，首先编码具有良好帧间预测模式的块，然后填充能够访问更多边界的帧内块。

图18a和18b示出了应用于增强型帧内预测(EIP)机制的信令机制的实现方式的示意图。在图18a和18b所示的情况下，视频编码块的4(2π)和3(3π/2)边分别可用于定向帧内预测。实线表示主角的方向，虚线表示补角的方向。在这两种情况下，可用的帧内预测模式集合大于传统情况。

如上所述，可以采用相同的两步信令机制，通过1位比特标志来指示选择的定向帧内预测模式所属的角度。首先，如果从所述互补角度中选择定向模式，则可以将所述定向模式映射到所述主角上。其次，如果从所述互补角度选择所述方向，则可以将1位标志设置为“ON”，否则可以将所述标志设置为“OFF”。

图19示出了用于编码包括帧内预测装置100的矩形视频编码块的编码装置200的示意图。可以类似地实现解码装置300。

尽管本发明的特定特征或方面可能已经仅结合几种实施方式或实施例中的一种进行公开，但此类特征或方面可以和其它实施方式或实施例中的一个或多个特征或方面相结合，只要对任何给定或特定的应用有需要或有利即可。而且，在一定程度上，术语“包括”、“有”、“具有”或这些词的其它变形在详细的说明书或权利要求书中使用，这类术语和所述术语“包含”是类似的，都是表示包括的含义。同样，术语“示例性地”、“例如”和“如”仅表示为示例，而不是最好或最佳的。可以使用术语“耦合”和“连接”及其派生词。应当理解，这些术语可以用于指示两个元件彼此协作或交互，而不管它们是直接物理接触还是电接触，或者它们彼此不直接接触。

尽管本文中已说明和描述特定方面，但应了解，多种替代和/或等效实现形式可在不脱离本发明的范围的情况下替代所示和描述的特定方面。该申请旨在覆盖本文论述的特定方面的任何修改或变更。

尽管以上权利要求书中的元件是利用对应的标签按照特定顺序列举的，除非对权利要求的阐述另有暗示用于实施部分或所有这些元件的特定顺序，否则这些元件不必限于以所述特定顺序来实施。

通过以上启示，对于本领域技术人员来说，许多替代、修改和变化是显而易见的。当然，本领域的技术人员容易认识到除本文所述的应用之外，还存在本发明的众多其它应用。虽然已参考一个或多个特定实施例描述了本发明，但所属领域的技术人员将认识到在不偏离本发明的范围的前提下，仍可对本发明作出许多改变。因此，应理解，只要是在所附权利要求书及其等效物的范围内，可以用不同于本文具体描述的方式来实践本发明。

27页详细技术资料下载

一种用于扩展预定定向帧内预测模式集合的帧内预测装置

相关技术

网友询问留言