用于帧内子分区编码模式的方法和设备

文档序号：144888 发布日期：2021-10-22 浏览：25次 >En<

阅读说明：本技术 用于帧内子分区编码模式的方法和设备 (Method and apparatus for intra sub-partition coding mode ) 是由修晓宇陈漪纹王祥林马宗全于 2020-02-11 设计创作，主要内容包括：本公开涉及一种对视频信号进行解码的帧内子分区(ISP)方法。所述方法包括：将视频数据的块分割为多个子分区,基于当前块的邻近块的帧内预测模式获得多个最可能帧内预测并且确定用于预测块子分区的样点的帧内预测模式,针对每个子分区从DCT-II变换核、DST-VII变换核和DCT-VIII变换核中选择最优变换组合,获得第一子分区的残差系数并且导出第一子分区的反量化的残差系数,通过在水平方向和垂直方向上对第一子分区的反量化的残差系数执行逆变换来导出第一子分区的残差样点,导出第一子分区的预测样点,导出第一子分区的重建样点,并且导出第二子分区的预测样点。(The present disclosure relates to an intra sub-partition (ISP) method for decoding a video signal. The method comprises the following steps: the method includes partitioning a block of video data into a plurality of sub-partitions, obtaining a plurality of most probable intra predictions based on intra prediction modes of neighboring blocks of a current block and determining an intra prediction mode for predicting samples of the sub-partitions, selecting an optimal transform combination from among a DCT-II transform kernel, a DST-VII transform kernel, and a DCT-VIII transform kernel for each sub-partition, obtaining residual coefficients of a first sub-partition and deriving inverse quantized residual coefficients of the first sub-partition, deriving residual samples of the first sub-partition by performing inverse transform on the inverse quantized residual coefficients of the first sub-partition in a horizontal direction and a vertical direction, deriving predicted samples of the first sub-partition, deriving reconstructed samples of the first sub-partition, and deriving predicted samples of a second sub-partition.)

用于帧内子分区编码模式的方法和设备

相关申请的交叉引用

本申请基于并要求于2019年02月11日提交的62/804,207号临时申请的优先权，其全部内容通过引用并入本文。

技术领域

本申请涉及视频编解码和压缩。更具体地，本公开涉及对用于视频编解码的帧内子分区(ISP)编码模式的改进和简化。

背景技术

可使用各种视频编解码技术来压缩视频数据。根据一个或更多个视频编解码标准来执行视频编解码。例如，视频编解码标准包括通用视频编解码(VVC)、联合探索测试模型(JEM)、高效视频编解码(H.265/HEVC)、高级视频编解码(H.264/AVC)、运动图片专家组(MPEG)编解码等。视频编解码通常使用利用了视频图像或序列中存在的冗余的预测方法(例如，帧间预测、帧内预测等)。视频编解码技术的目标在于将视频数据压缩为使用更低比特率的形式，同时避免或最小化视频质量的下降。

发明内容

本公开的示例提供了用于对用于视频编解码的帧内子分区编码模式的改进和简化的方法。

根据本公开的第一方面，提供了一种对视频信号进行解码的帧内子分区(ISP)方法。所述方法可包括：将视频数据的块分割为多个子分区，其中每个子分区包括N×M个样点，其中N和M是水平方向或垂直方向上的样点的数量；基于当前块的邻近块的帧内预测模式获得多个最可能帧内预测，并且确定用于预测所述块子分区的样点的帧内预测模式；针对每个子分区从DCT-II变换核、DST-VII变换核和DCT-VIII变换核中选择最优变换组合，其中选择最优变换组合包括将多重变换选择MTS模式应用于所述ISP，其中所述最优变换组合由一个MTS标志和一个MTS索引指示；获得第一子分区的残差系数，并且通过对所述第一子分区的所述残差系数执行反量化来导出所述第一子分区的反量化的残差系数。

所述方法还可包括：通过在水平方向和垂直方向上对所述第一子分区的反量化的残差系数执行逆变换来导出所述第一子分区的残差样点，其中所述逆变换基于所述第一子分区的所述最优变换组合；通过基于与所述第一子分区相邻的邻近重建样点对所述第一子分区执行帧内预测来导出所述第一子分区的预测样点；通过将所述第一子分区的所述残差样点与所述第一子分区的所述预测样点相加来导出所述第一子分区的重建样点；并且通过基于所述第一子分区的所述重建样点对第二子分区执行帧内预测来导出所述第二子分区的预测样点。

根据本公开的第二方面，提供了一种计算设备，所述计算设备包括一个或更多个处理器、存储能够由所述一个或更多个处理器执行的指令的非暂态计算机可读存储器。所述一个或更多个处理器可被配置为：将视频数据的块分割为多个子分区，其中每个子分区包括N×M个样点，其中N和M是水平方向或垂直方向上的样点的数量；基于当前块的邻近块的帧内预测模式获得多个最可能帧内预测，并且确定用于预测所述块子分区的样点的帧内预测模式；针对每个子分区从DCT-II变换核、DST-VII变换核和DCT-VIII变换核中选择最优变换组合，其中选择最优变换组合包括将多重变换选择MTS模式应用于所述ISP，其中所述最优变换组合由一个MTS标志和一个MTS索引指示；获得第一子分区的残差系数，并且通过对所述第一子分区的所述残差系数执行反量化来导出所述第一子分区的反量化的残差系数。

所述一个或更多个处理器还可被配置为：通过在水平方向和垂直方向上对所述第一子分区的反量化的残差系数执行逆变换来导出所述第一子分区的残差样点，其中所述逆变换可基于所述第一子分区的所述最优变换组合；通过基于与所述第一子分区相邻的邻近重建样点对所述第一子分区执行帧内预测来导出所述第一子分区的预测样点；通过将所述第一子分区的所述残差样点与所述第一子分区的所述预测样点相加来导出所述第一子分区的重建样点；并且通过基于所述第一子分区的所述重建样点对第二子分区执行帧内预测来导出所述第二子分区的预测样点。

根据本公开的第三方面，提供了一种非暂态计算机可读存储介质，其中存储有用于由具有一个或更多个处理器的计算设备执行的多个程序。当所述多个程序由所述设备的所述一个或更多个处理器执行时，使所述计算设备执行：将视频数据的块分割为多个子分区，其中每个子分区包括N×M个样点，其中N和M是水平方向或垂直方向上的样点的数量；基于当前块的邻近块的帧内预测模式获得多个最可能帧内预测，并且确定用于预测所述块子分区的样点的帧内预测模式；针对每个子分区从DCT-II变换核、DST-VII变换核和DCT-VIII变换核中选择最优变换组合，其中选择最优变换组合包括将多重变换选择MTS模式应用于所述ISP，其中所述最优变换组合可由一个MTS标志和一个MTS索引指示；获得第一子分区的残差系数，并且通过对所述第一子分区的所述残差系数执行反量化来导出所述第一子分区的反量化的残差系数。

所述多个程序还可使所述一个或更多个处理器执行：通过在水平方向和垂直方向上对所述第一子分区的反量化的残差系数执行逆变换来导出所述第一子分区的残差样点，其中所述逆变换可基于所述第一子分区的所述最优变换组合；通过基于与所述第一子分区相邻的邻近重建样点对所述第一子分区执行帧内预测来导出所述第一子分区的预测样点；通过将所述第一子分区的所述残差样点与所述第一子分区的所述预测样点相加来导出所述第一子分区的重建样点；并且通过基于所述第一子分区的所述重建样点对第二子分区执行帧内预测来导出所述第二子分区的预测样点。

应当理解，前述一般描述和以下详细描述都仅是示例性和说明性的，并不限制如所要求保护的本发明。

附图说明

并入本说明书中并构成本说明书的一部分的附图示出了与本公开一致的示例，并且与描述一起用于解释本公开的原理。

图1是根据本公开的示例的编码器的框图。

图2是根据本公开的示例的解码器的框图。

图3是示出根据本公开的示例的用于对视频信号进行解码的帧内子分区(ISP)方法的流程图。

图4是示出根据本公开的示例的用于将多重变换选择(MTS)模式应用于ISP的方法的流程图。

图5A是示出根据本公开的示例的多类型树结构中的块分割的示图。

图5B是示出根据本公开的示例的多类型树结构中的块分割的示图。

图5C是示出根据本公开的示例的多类型树结构中的块分割的示图。

图5D为示出根据本公开的示例的多类型树结构中的块分割的示图。

图5E为示出根据本公开的示例的多类型树结构中的块分割的示图。

图6是示出本公开的示例的通用视频编解码(VVC)中的帧内模式的示图。

图7是示出根据本公开的示例的VVC中用于帧内预测的多参考线的示图。

图8A是示出根据本公开的示例的用于帧内预测的参考样点和角度方向的示图。

图8B是示出根据本公开的示例的用于帧内预测的参考样点和角度方向的示图。

图8C是示出根据本公开的示例的用于帧内预测的参考样点和角度方向的示图。

图9是示出根据本公开的示例的用于一个编码块的PDPC的邻近重建样点的位置的示图。

图10A是示出根据本公开的示例的块的SDIP分割的示图。

图10B是示出根据本公开的示例的块的SDIP分割的示图。

图10C是示出根据本公开的示例的块的SDIP分割的示图。

图11A是示出根据本公开的示例的有效帧内方向的范围与所使用的参考样点的比较的示图。

图11B是示出根据本公开的示例的有效帧内方向的范围与所使用的参考样点的比较的示图。

图12是示出根据本公开的示例的用于一个ISP子块的帧内预测的有效帧内模式和参考样点的示图。

图13是示出根据本公开的示例的水平分割中的非第一子分区的不可用参考样点的示图。

图14是示出根据本公开的示例的导出用于水平分割中的非第一子分区的不可用参考样点的替代参考样点的示图。

图15是示出根据本公开的示例的导出用于垂直分割中的非第一子分区的不可用参考样点的替代参考样点的示图。

图16是示出根据本公开的示例的导出用于水平分割中的非第一子分区的不可用参考样点的替代参考样点的示图。

图17是示出根据本公开的示例的与用户接口耦合的计算环境的示图。

具体实施方式

现在将详细参照示例实施例，其示例在附图中示出。以下描述参照附图，其中不同附图中的相同数字表示相同或相似的元件，除非另有表示。在示例实施例的以下描述中阐述的实施方式不表示与本公开一致的所有实施方式。相反，它们仅是与如所附权利要求中描述的与本公开相关的方面一致的装置和方法的示例。

本公开中使用的术语仅用于描述特定实施例的目的，并不旨在限制本公开。如在本公开和所附权利要求中所使用的，单数形式“一”、“一个”和“该”旨在也包括复数形式，除非上下文另有明确说明。还应当理解，本文使用的术语“和/或”旨在表示并包括一个或更多个相关联的所列项目的任何或所有可能的组合。

应当理解，尽管本文可使用术语“第一”、“第二”、“第三”等来描述各种信息，但是信息不应受这些术语的限制。这些术语仅用于将一类信息与另一类信息区分开。例如，在不脱离本公开的范围的情况下，第一信息可被称为第二信息；并且类似地，第二信息也可被称为第一信息。如本文所使用的，根据上下文，术语“如果”可被理解为意指“当......时”或“在......时”或“响应于判断”。

HEVC标准的第一版本在2013年10月完成，与前一代视频编解码标准H.264/MPEGAVC相比，HEVC标准的第一版本提供大约50％的比特率节省或同等的感知质量。尽管HEVC标准提供与其前身相比显著的编解码改进，但有证据表明可利用额外编解码工具实现优于HEVC的编解码效率。基于此，VCEG和MPEG都开始了用于未来视频编解码标准化的新编解码技术的探索工作。ITU-TVECG和ISO/IECMPEG在2015年10月形成了一个联合视频探索小组(JVET)，以开始对可实现显著提高编解码效率的先进技术的重要研究。被称为联合探索模型(JEM)的一个参考软件由JVET通过在HEVC测试模型(HM)之上集成若干额外编解码工具来维护。

在2017年10月，由ITU-T和ISO/IEC发布了关于具有超出HEVC的能力的视频压缩的联合提议呼吁(CfP)。在2018年4月，在第10次JVET会议上接收并评估了23个CfP回应，其展示了超过HEVC约40％的压缩效率增益。基于这样的评估结果，JVET发起新项目以开发被命名为通用视频编解码(VVC)的新一代视频编解码标准。在同月，建立了一个被称为VVC测试模型(VTM)的参考软件代码库，用于展示VVC标准的参考实现。

类似于HEVC，VVC建立在基于块的混合视频编解码框架上。图1(下面描述)给出了通用的基于块的混合视频编码系统的框图。输入视频信号被逐块(称为编码单元(CU))地处理。在VTM-1.0中，CU可多达128×128个像素。然而，与仅基于四叉树对块进行分割的HEVC不同，在VVC中，一个编码树单元(CTU)被划分为多个CU以适应基于四叉树/二叉树/三叉树的变化的局部特性。另外，HEVC中的多个分区单元类型的概念被移除，即，对CU、预测单元(PU)和变换单元(TU)的区分不再存在于VVC中；相反，每个CU始终被用作用于预测和变换两者的基本单元，而无需进一步的分割。在多类型树结构中，首先通过四叉树结构对一个CTU进行分割。然后，可通过二叉和三叉树结构进一步对每个四叉树叶节点进行分割。如图5A、图5B、图5C、图5D和图5E(如下所述)所示，存在五种划分类型：四元分割、水平二元分割、垂直二元分割、水平三元分割和垂直三元分割。在图1中(如下所述)，可执行空间预测和/或时间预测。空间预测(或“帧内预测”)使用来自同一视频图片/条带中的已经编码的邻近块的样点(其被称为参考样点)的像素来预测当前视频块。空间预测减少了视频信号中固有的空间冗余。时间预测(也被称为“帧间预测”或“运动补偿预测”)使用来自已经编码的视频图片的重建像素来预测当前视频块。时间预测减少了视频信号中固有的时间冗余。对于给定CU的时间预测信号通常由一个或更多个运动矢量(MV)用信号发送，运动矢量指示当前CU与其时间参考之间的运动的量和方向。此外，当支持多个参考图片时，另外发送一个参考图片索引，其用于识别时间预测信号来自所存储的参考图片中的哪个参考图片。在空间和/或时间预测之后，编码器中的模式决策框例如基于率失真优化方法来选择最优预测模式。然后从当前视频块减去预测块；并且使用变换对预测残差进行去相关并进行量化。量化的残差系数被反量化和逆变换以形成重建残差，然后重建残差被加回到预测块以形成CU的重建信号。在将重建CU放入参考图片存储器并用于对未来视频块进行编解码之前，可进一步对重建CU应用环路滤波，诸如去块滤波器、样点自适应偏移(SAO)和自适应环路滤波器(ALF)。为了形成输出视频比特流，编码模式(帧间或帧内)、预测模式信息、运动信息和量化的残差系数都被发送到熵编码单元以进一步压缩和打包以形成比特流。

图2(下面描述)给出了基于块的视频解码器的一般框图。视频比特流首先在熵解码单元被熵解码。编码模式和预测信息被发送到空间预测单元(当帧内编码时)或时间预测单元(当帧间编码时)以形成预测块。残差变换系数被发送到反量化单元和逆变换单元以重建残差块。然后预测块和残差块相加在一起。重建块可在其被存储在参考图片存储器之前进一步被执行环路滤波。然后参考图片存储器中的重建视频被发送出去以驱动显示设备，以及用于预测未来的视频块。

通常，在VVC中应用的基本帧内预测方案与HEVC的基本帧内预测方案保持相同，除了若干模块被进一步扩展和/或改进，例如帧内子分区(ISP)编码模式、具有广角帧内方向的扩展帧内预测、位置相关帧内预测组合(PDPC)和4抽头帧插值。本公开的主要焦点在于改进VVC标准中的现有ISP设计。然而，在下文中，简要回顾包括在VVC中且与本公开中所提出的技术密切相关的其它编解码工具(例如，帧内预测和变换编解码中的工具)。

图1展示了典型的编码器100。编码器100具有视频输入110、运动补偿112、运动估计114、帧内/帧间模式决策116、块预测因子140、加法器128、变换130、量化132、预测相关信息142、帧内预测118、图片缓冲器120、反量化134、逆变换136、加法器126、存储器124、环路滤波器122、熵编码138和比特流144。

图2展示了典型的解码器200的框图。解码器200具有比特流210、熵解码212、反量化214、逆变换216、加法器218、帧内/帧间模式选择220、帧内预测222、存储器230、环路滤波器228、运动补偿224、图片缓冲器226、预测相关信息234和视频输出232。

图3展示了根据本公开的用于对视频信号进行解码的示例ISP方法。

在步骤310，将视频数据的块分割为多个子分区，其中每个子分区可包括N×M个样点，其中N和M是水平方向或垂直方向上的样点的数量。

在步骤312，基于当前块的邻近块的帧内预测模式获得多个最可能帧内预测，并且确定用于预测块子分区的样点的帧内预测模式。

在步骤314，获得第一子分区的残差系数，并通过对第一子分区的残差系数执行反量化来导出第一子分区的反量化的残差系数。

在步骤316，从变换核选择最优变换组合，并且通过在水平方向和垂直方向上对第一子分区的反量化的残差系数执行逆变换来导出第一子分区的残差样点，其中选择最优变换组合包括将多重变换选择(MTS)模式应用于ISP，其中MTS将核变换引入到从块分割出的子分区，并且基于MTS选择可选的变换组合。

在步骤318，通过基于与第一子分区相邻的邻近重建样点对第一子分区执行帧内预测来导出第一子分区的预测样点。

在步骤320，通过将第一子分区的残差样点与第一子分区的预测样点相加来导出第一子分区的重建样点。

在步骤322，通过基于第一子分区的重建样点对第二子分区执行帧内预测来导出第二子分区的预测样点。

图4展示了根据本公开的用于将MTS模式应用于ISP的示例方法。

在步骤410，以当前块级提供MTS标志。

在步骤412，当应用MTS时，针对被分割的块的至少一个子分区来选择变换。

在步骤414，针对块内的子分区同时启用或禁用MTS模式。

图5A展示了示出根据本公开的多类型树结构中的块四元分割的示图。

图5B展示了示出根据本公开的多类型树结构中的块垂直二元分割的示图。

图5C展示了示出根据本公开的多类型树结构中的块水平二元分割的示图。

图5D展示了示出根据本公开的多类型树结构中的块垂直三元分割的示图。

图5E展示了示出根据本公开的多类型树结构中的块水平三元分割的示图。

具有广角帧内方向的帧内预测模式

类似于HEVC，VVC使用与一个当前CU邻近(即，上方或左侧)的先前解码样点集来预测CU的样点。然而，为了捕获自然视频中存在的更精细的边缘方向(特别是对于高分辨率的视频内容，例如4K)，角度帧内模式的量从HEVC中的33扩展到VVC中的93。除了角度方向之外，与HEVC相同的平面模式(其假设具有从边界导出的水平和垂直斜率的逐渐变化的表面)和DC模式(其假设平坦表面)也被应用于VVC标准中。图6(如下所述)示出了如VVC标准中定义的现有帧内模式。类似于HEVC中的帧内预测，VVC中的所有帧内模式(即，平面、DC和角度方向)利用预测块上方和左侧的邻近重建样点集作为用于帧内预测的参考。然而，与仅重建样点的最近行/列(即，下文描述的图7中的线0)作为参考的HEVC不同，在VVC中引入多参考线(MRL)，其中两个额外行/列(即，下文描述的图7中的线1和线3)用于帧内预测。将所选的参考行/列的索引从编码器用信号发送到解码器。当非最近行/列被选择时，从可用于预测当前块的帧内模式集合中排除平面模式和DC模式。假设最近的邻近者，图8A、图8B和图8C(下面描述)示出了在VVC中用于导出一个帧内块的预测样点的参考样点的位置。如图8A、图8B和图8C所示，因为应用了四叉/二叉/三叉树分区结构，所以除了正方形形状的编码块之外，还存在矩形编码块用于VVC的帧内预测。由于一个给定块的宽度和高度不等，所以针对不同的块形状来选择各种角度方向集合，这也被称为广角帧内预测。具体地，对于正方形和矩形编码块，除了平面模式和DC模式之外，对于每个块形状还支持93个角度方向中的65个角度方向，如表1所示。这种设计不仅可有效地捕获通常存在于视频中的方向结构(通过基于块形状自适应地选择角度方向)，而且还可确保针对每个编码块启用总共67个帧内模式(即，平面、DC和65个角度方向)。这可实现用信号发送帧内模式的良好效率，同时提供跨不同块尺寸的一致设计。

表1 VVC中用于不同块形状的帧内预测的选择的角度方向

图6展示了根据本公开的VVC中的帧内模式的示图。

图7展示了根据本公开的VVC中用于帧内预测的多参考线。

图8A展示了根据本公开的用于平矩形块(W/H＝2)的帧内预测的参考样点和角度方向的示图。

图8B展示了根据本公开的用于高矩形块(W/H＝1/2)的帧内预测的参考样点和角度方向的示图。

图8C展示了根据本公开的用于正方形块(W＝H)的帧内预测的参考样点和角度方向的示图。

位置相关帧内预测组合

如前所述，帧内预测样点从未被滤波或被滤波的邻近参考样点集中生成，这可能沿着当前编码块与其邻近者之间的块边界引入不连续性。为了解决这种问题，在HEVC中，通过将DC预测模式、水平预测模式(即，模式18)和垂直预测模式(即，模式50)的预测样点的第一行/列预测样点与未被滤波的参考样点进行组合，利用2抽头滤波器(用于DC模式)或基于梯度的平滑滤波器(用于水平预测模式和垂直预测模式)来应用边界滤波。

VVC中的位置相关帧内预测组合(PDPC)工具通过采用帧内预测样点与未被滤波的参考样点的加权组合来扩展上述构思。在当前的VVC工作草案中，PDPC在无需信令的情况下针对以下帧内模式被启用：平面、DC、水平(即，模式18)、垂直(即，模式50)、接近左下对角线方向的角度方向(即，模式2、3、4、…、10)和接近右上对角线方向的角度方向(即，模式58、59、60、…、66)。假设定位为坐标(x,y)的预测样点是pred(x,y)，其在PDPC之后的相应值被计算为

pred(x,y)＝(wL×R_-1,y+wT×R_x,-1–wTL×R_-1,-1+(64–wL–wT+wTL)×pred(x,y)+32)>>6

其中R_x,-1,R_-1,y分别表示位于当前样点(x，y)的顶部和左侧的参考样点，并且R_-1,-1表示位于当前块的左上角的参考样点。图8A、图8B和图8C示出了用于在PDPC过程期间与当前预测样点组合的参考样点的位置。根据预测模式和样点位置来自适应地选择等式(1)中的权重wL,wT和wTL，如下所述，其中假设当前编码块的尺寸为W×H:

对于DC模式，

wT＝32>>((y<<1)>>shift),wL＝32>>((x<<1)>>shift),wTL＝(wL>>4)+(wT>>4)

对于平面模式，

wT＝32>>((y<<1)>>shift),wL＝32>>((x<<1)>>shift),wTL＝0

对于水平模式：

wT＝32>>((y<<1)>>shift),wL＝32>>((x<<1)>>shift),wTL＝wT

对于垂直模式：

wT＝32>>((y<<1)>>shift),wL＝32>>((x<<1)>>shift),wTL＝wL

对于左下对角线方向：

wT＝16>>((y<<1)>>shift),wL＝16>>((x<<1)>>shift),wTL＝0

对于右上对角线方向：

wT＝16>>((y<<1)>>shift),wL＝16>>((x<<1)>>shift),wTL＝0

其中shift＝(log₂(W)–2+log₂(H)–2+2)>>2。

多重变换选择和形状自适应变换选择

除了在HEVC中使用的离散余弦变换II(DCT-II)变换之外，在VVC中，还通过引入离散余弦变换VIII(DCT-VIII)、离散正弦变换IV(DST-IV)和离散正弦变换VII(DST-VII)的额外核变换来启用多重变换选择(MTS)工具。在VVC中，通过向比特流用信号发送一个MTS标志，在编码块级启用对变换的自适应选择。具体地，当对于一个块来说MTS标志等于0时，在水平方向和垂直方向上应用一对固定变换(例如，DCT-II)。否则(当MTS标志等于1时)，将针对该块进一步用信号发送两个额外标志以指示用于每个方向的变换类型(DCT-VIII或DST-VII)。

另一方面，由于在VVC中引入了基于四叉/二叉/三叉树的块分割结构，所以帧内预测的残差的分布与块形状高度相关。因此，当禁用MTS(即，对于一个编码块来说MTS标志等于0)时，将一种形状自适应变换选择方法应用于所有帧内编码块，在该方法中，基于当前块的宽度和高度隐式地启用DCT-II和DST-VII变换。更具体地，对于每个矩形块，该方法在与一个块的较短边相关联的方向上使用DST-VII变换，并且在与该块的较长边相关联的方向上使用DCT-II变换。对于每个正方形块，在两个方向上应用DST-VII。另外，为避免以不同块尺寸引入新变换，仅在一个帧内编码块的较短边等于或小于16时启用DST-VII变换。否则，始终应用DCT-II变换。表2示出了VVC中的基于形状自适应变换选择方法的用于帧内编码块的所启用的水平变换和垂直变换。

表2 VVC中的用于帧内块的形状自适应变换选择

帧内子分区编码模式

常规帧内模式仅利用与一个编码块邻近的重建样点来生成块的帧内预测样点。基于这种方法，预测样点和参考样点之间的空间相关性与预测样点和参考样点之间的距离大致成比例。因此，内部部分处的样点(尤其是位于块的右下角处的样点)通常具有比靠近块边界的样点更差的预测质量。为了进一步提高帧内预测效率，很久以前提出了短距离帧内预测(SDIP)，并且在HEVC标准的开发期间进行了很好地研究。该方法将一个帧内编码块水平地或垂直地划分为多个子块以进行预测。通常，正方形块被划分为四个子块。例如，8×8块可被划分为四个2×8子块或四个8×2子块。这种基于子块的帧内预测的一种极端情况是所谓的基于线的预测，其中块被划分为1-D行/列以用于预测。例如，一个W×H(宽度×高度)块可被划分为尺寸为W×1的H个子块或尺寸为1×H的W个子块以用于帧内预测。所得到的行/列中的每一个按照与普通2维(2-D)块(如图1所示)相同的方式进行编解码，即，它由可用帧内模式之一被预测，并且预测误差基于变换和量化被去相关并被发送到解码器以进行重建。因此，一个子块(例如，行/列)中的重建样点可被用作用于预测下一子块中的样点的参考。重复上述过程，直到当前块内的所有子块被预测和编解码为止。另外，为减少信令开销，一个编码块内的所有子块共享相同的帧内模式。

在SDIP的情况下，不同的子块分区可提供不同的编解码效率。一般来说，基于线的预测提供最优编解码效率，这是因为它在不同分区之间提供“最短预测距离”。另一方面，对于编解码器硬件实现，它也具有最差的编码/解码吞吐量问题。例如，考虑具有4×4子块的块与具有4×1或1×4子块的相同块，后一种情况仅是前一种情况的吞吐量的四分之一。在HEVC中，亮度的最小帧内预测块尺寸是4×4。

最近，被称为子分区预测(ISP)的视频编解码工具被引入到VVC中。ISP与SDIP在概念上非常相似。具体地，根据块尺寸，ISP在水平方向或垂直方向上将当前编码块划分为2或4个子块，并且每个子块包含至少16个样点。图10A、图10B、图10C(下面描述)示出了针对不同编码块尺寸的所有可能的分割情况。此外，以下主要方面也被包括在当前ISP设计中以处理ISP与VVC中的其它编解码工具的交互：

与广角帧内方向的交互：ISP与广角帧内方向组合。在当前设计中，原始编码块的块尺寸(即，宽度/高度比)用于确定是应该应用普通帧内方向还是应该应用其对应的广角帧内方向。换句话说，这里使用块在子块分割之前的块尺寸。

与多参考线的交互：ISP不能与多参考线共同启用。具体地，在当前的VVC信令设计中，在MRL索引之后用信号发送ISP启用/禁用标志。当一个帧内块具有一个非零MRL索引(即，参考非最近邻近样点)时，ISP启用/禁用标志不用信号发送而被推断为0，即，在这种情况下，针对编码块自动禁用ISP。

与最可能模式的交互：类似于普通帧内模式，通过最可能模式(MPM)机制用信号发送用于一个ISP块的帧内模式。然而，与普通帧内模式相比，对用于ISP的MPM方法进行以下修改：1)每个ISP块仅启用包括在MPM列表中的帧内模式并且禁用不在MPM列表中的所有其它帧内模式；2)对于每个ISP块，其MPM列表排除DC模式并且分别优先化用于ISP水平分割的水平帧内模式和用于ISP垂直分割的垂直模式。

与多重变换选择的交互：ISP与MTS排他地应用，即，当一个编码块使用ISP时，其MTS标志不用信号发送，而是始终被推断为0，即，被禁用。然而，并非始终使用DCT-II变换，而是基于块尺寸将一组固定的核变换(包括DST-VII和DCT-II)隐式地应用于ISP编码块。具体地，假设W和H是一个ISP子分区的宽度和高度，根据如表3中所描述的以下规则来选择该ISP子分区的水平变换和垂直变换。

表3用于ISP块选择的水平变换和垂直变换

图9展示了根据本公开的用于一个编码块的PDPC的邻近重建样点的位置。

图10A展示了根据本公开的8×4块的SDIP分割的示图。

图10B展示了根据本公开的4×8块的SDIP分割的示图。

图10C展示了根据本公开的其他块的SDIP分割的示图。

ISP的改进

尽管VVC中的ISP工具可提高帧内预测效率，但是仍然存在进一步改善其性能的空间。同时，为了有效的编解码器硬件实现，还需要简化现有ISP的一些部分。具体地，在本公开中已经认识到现有ISP设计中的以下问题。

首先，对于实际编解码器设计，为了最小化ISP的实现成本，针对ISP块最大限度地重新使用普通帧内块的现有帧内预测模块(例如，参考样点访问、帧内样点预测等)是更合理的。然而，如在“帧内子分区编码模式”部分中所讨论的，当ISP与广角帧内预测组合时，针对每个子块的关于原始帧内模式(即，在编码块级用信号发送的帧内模式)是否应该被替换为其相应的广角帧内模式的决策基于原始编码块而非正被预测的实际块(例如，子块)的尺寸/形状做出。这与非ISP帧内编码块不一致，非ISP帧内编码块基于其自身的块尺寸在普通帧内方向和广角帧内方向之间进行选择。据称，这种不一致设计可能导致用于硬件实现的以下复杂性问题。首先，由相同尺寸的块支持的有效帧内方向的范围在ISP模式和非ISP模式之间不同。其次，用于对相同尺寸的块进行帧内预测的邻近参考样点在ISP模式和非ISP模式之间不同。此外，为了支持由当前ISP定义的有效帧内方向，与相同尺寸但不是由ISP模式编码的块相比，每个子块可能需要访问更多的上方邻近参考样点或左侧邻近参考样点。

为了说明上述两个问题，令W和H是一个正方形块的宽度和高度(即，W＝H)，图11A和图11B比较了当块通过普通帧内模式被编码时和当该块按照ISP模式的一个子分区(假设垂直ISP分割用于将编码块划分为两个子块)被编码时的两种情况之间该块的有效帧内方向的范围和所使用的参考样点。如图11A中所示，对于普通帧内模式，所支持的角度帧内方向的范围从模式2到模式66(即，覆盖从45度到-135度的角度)。为了支持那些方向，提取2W+1个上方参考样点和2H+1个左侧参考样点以预测块内的样点。但是当通过ISP模式对块进行编解码时，如图11B所示，因为父编码块是平矩形形状，所以广角帧内预测被应用于该块，使得有效角度方向从模式8到模式72(即，覆盖从63.4度到-116.6度的角度)。相应地，需要访问3W+1个上方参考样点和3H/2+1个左侧参考样点。注意，与图11A相比，在图11B中需要从上方邻近块多访问W个参考样点。

其次，如在“介绍”部分中所讨论的，由于帧内预测的残差内存在强相关性的事实，所以当MTS被禁用时，DCT-II和DST-VII都被应用于被帧内预测的编码块。然而，如表2和表3所示，通过普通帧内模式和ISP模式编码的编码块利用不同的方法来在DCT-II和DST-VII之间选择最优水平/垂直变换。在概念上，对最优变换的选择取决于预测残差的实际分布，其应当与块尺寸和所应用的帧内模式高度相关，而不是与关于是否应用ISP的决策高度相关。另一方面，一种用于所有帧内编码块的变换选择的统一设计对于有效的硬件实现更有益。

第三，如在“帧内子分区编码模式”部分中所讨论的，MRL不能与ISP模式联合应用。这是通过在一个帧内块的MRL索引为非零时总是将ISP标志的值推断为零来完成的。然而，MRL工具的益处主要来自以下两个方面：1)因为在变换域中应用量化/反量化，所以不同位置处的重建样点可能具有变化的重建质量，使得最近的邻近者可能并非始终是用于帧内预测的最优参考；2)在最近的邻近者中可能存在编解码噪声和遮挡，这可能导致帧内预测样点的质量下降。基于这种分析，针对ISP模式禁用MRL似乎不合理。换句话说，当启用ISP和MRL的组合时，可预期额外的编解码益处。

图11A展示了根据本公开的一个普通W×H块的有效帧内方向的范围与所使用的参考样点的比较。

图11B展示了根据本公开的一个W×H ISP子块的有效帧内方向的范围与所使用的参考样点的比较。

基于子块尺寸启用/禁用用于ISP的广角帧内方向

根据当前的VVC设计，广角帧内预测可被应用于ISP编码块，并且关于原始帧内模式还是相应的广角帧内模式应被用于一个子块的决策基于整个编码块的尺寸做出。如“问题陈述”部分所指出的，这种设计不仅使ISP块和非ISP块之间支持的帧内方向的范围不一致，而且还可能增加需要来自上方或左侧邻近者的参考样点的数量以便预测一个块内的样点。为了实现更好的设计，在本公开的一个实施例中提出了基于编码块的ISP子分区的尺寸来启用/禁用用于编码块的帧内预测的广角帧内模式，而非使用整个编码块的尺寸。使用图11中的相同示例，图12示出了当应用所提出的方法时每个ISP子分区的有效帧内方向的范围和所使用的参考样点。从图12可看出，在应用所提出的方法之后，每个子块的支持的帧内模式的范围从模式2到模式66(即，从45度到-135度)，并且帧内预测所需的相应参考样点包括来自上方邻近者的2W+1个参考样点和来自左侧邻近者的2H+1个参考样点。所有这些统计量保持与图11A中的相同尺寸(即，W×H)的一个普通帧内块的统计量相同。因此，所提出的方法可提供一种用于帧内块的广角帧内预测的协调设计，而不管帧内块是用ISP模式编码还是不用ISP模式编码。

另外，在当前VTM-3.0中，最大帧内编码块宽度或高度为64，并且最小帧内编码块宽度或高度为4。相应地，一个帧内块的宽高比可以是M:1或1:M，其中M可以是1、2、4、8和16。然而，在启用ISP之后，一个子分区的宽度或高度可低至2个样点，并且1:32和/或32:1的宽高比也变得可能。因此，当基于子块尺寸启用/禁用用于ISP的广角帧内预测时，在定义针对ISP支持的广角帧内方向时，应该引入一对宽高比，即32:1和1:32。为了实现这个，需要将一个新元素引入angTable[]和invAngTable[]中，其定义了各种帧内角度的tan值和atan值，如表4所示，其中灰色元素是由于ISP模式而新引入的广角帧内方向。

表4用于角度帧内预测的修改的angTable[]和invAngTable[]

根据本公开的另一实施例，不是在表4中添加新元素来处理具有1:32和/或32:1的新宽高比的子块的帧内预测，而是可针对这种情况始终禁用SIP。换句话说，在解码器侧，每当所得到的子块具有32:1和/或1:32的宽高比时，SIP模式被推断为0(即，禁用)。

根据本公开的第三实施例，不是在表4中添加新元素来处理具有1:32和/或32:1的新宽高比的子块的帧内预测，而是将用于1:16和16:1的宽高比的相同帧内预测方向集合分别用于具有1:32和32:1的宽高比的子块。

图12展示了根据本公开的当基于子块尺寸启用/禁用广角帧内预测时用于一个ISP子块的帧内预测的有效帧内模式和参考样点。

用于帧内编码块的统一变换选择

在当前的VVC中，当MTS被禁用时，应用不同的方法来针对非ISP编码块(如表2所示)和ISP编码块(如表3所示)从DCT-II和DST-VII中选择最优水平/垂直变换。如在“问题陈述”部分中所分析的，这种设计可能不合理，这是因为针对每个块/子块的帧内预测残差的统计分布应该不依赖于ISP模式是否被应用于当前编码块。为了实现更统一的设计，下面提出了两种方法来协调用于ISP编码块和非ISP编码块的变换选择方法。

在第一种方法中，提出了将非ISP编码块(如表2所示)的变换选择方法的应用扩展到ISP编码块。具体地，通过这种方法，非ISP编码块的变换选择方法保持与表2中的现有设计相同，而ISP编码块的变换选择方法被修改为如下：当一个ISP编码块被划分为矩形子分区时，离散正弦变换VII(DST-VII)DST-VII被应用于每个ISP子分区的较短尺寸，并且离散余弦变换II(DCT-II)被应用于子分区的较长尺寸；否则，当ISP编码块被划分为正方形子分区时，DST-VII被应用于水平方向和垂直方向两者。另外，为避免引入新变换尺寸，DST-VII仅在子分区的相应尺寸等于或小于16(表2中的相同约束设计)时被应用。

在第二种方法中，提出了将ISP编码块(如表3所示)的变换选择方法的应用扩展到非ISP块。在该方法中，ISP子分区的变换选择方法保持与表3中的现有设计相同，并且非ISP编码块的变换选择被修改为基于如表3中所指定的编码块尺寸和所应用的帧内模式。

ISP编码块和非ISP编码块的MPM生成方法的协调

如在“帧内子分区编码模式”部分中所讨论的，与非ISP编码块相比，ISP模式利用一种不同的方法来形成MPM候选列表，MPM候选列表不包括DC模式并且基于所应用的分割方向来优先化一些相邻的水平帧内模式或一些相邻的垂直帧内模式。然而，相应的编码益处可能有限。出于统一的目的，在本公开中提出了使用与用于非ISP编码块的MPM列表生成方法相同的MPM列表生成方法来生成ISP块的MPM候选。

用于ISP编码块的更有效的MPM生成方法

在用于ISP编码块的MPM生成保持与用于非ISP编码块的MPM生成不同的情况下，可改进VVC中用于ISP编码块的MPM生成的当前设计以获得更好的编码效率。根据本公开，当生成用于ISP编码块的MPM时，当对当前块进行水平分割时，从-14到18范围内的帧内预测方向(除了平面的方向0和DC的方向1)被排除在选择之外，如图6所示。这种排除的动机是这些预测方向不太可能为ISP模式下水平分割出的子块提供预测益处。同样地，当生成用于ISP编码块的MPM时并且当对当前块进行垂直分割时，从-50到80范围内的帧内预测方向被排除在选择之外(如图6所示)。

根据本公开，当基于上述规则从用于ISP编码块的MPM选择排除这种帧内预测方向时，可添加一些其他帧内预测方向作为替代。在一个示例中，当存在其相应的广角帧内预测方向时，广角帧内预测方向可被用作替代并放入MPM列表中。在另一示例中，与已在MPM列表中的帧内模式邻近的某个帧内预测方向可被用作替代。

ISP与MRL的组合

在当前的VVC中，当所使用的参考样点不是来自编码块的最近邻域(即，MRL索引非零)时，通过强制ISP标志值为零(即，禁用)，使ISP模式和MRL模式不能被联合应用于一个帧内编码块。如前所述，ISP和MRL从两个不同的方面提高了帧内编码效率。首先，ISP通过缩短预测样点与参考样点之间的距离来以帧内预测效率为目标。其次，MRL以减轻存在于最近邻近样点中的编码噪声和遮挡对整体帧内编码性能的负面影响为目标。因此，在可通过ISP和MRL实现的编码益处之间几乎没有重叠。为了进一步提高帧内预测的效率，在本公开中，提出了针对一个帧内编码块启用ISP模式和MRL模式的组合。

在一个实施例中，提出了在MRL索引之前或之后用信号发送一个ISP标志，并且MRL索引由同一ISP编码块中的所有子分区共享，即，所有子分区可使用它们各自的重建样点的第i行/列(如MRL索引所指示的)作为参考来生成帧内预测样点。

在另一实施例中，提出了允许每个子分区参考重建邻近样点的不同行/列。具体地，在该方法中，在ISP标志之后用信号发送MRL索引。当ISP标志等于零时(即，编码块未被分割)，将用信号发送一个MRL索引，其被应用于确定整个编码块的参考样点；否则(ISP标志等于1)，根据编码块中的子分区的数量，将用信号发送多个MRL索引，每个子分区有一个MRL索引，以单独指示用于导出每个ISP子分区的帧内预测的相应参考样点的位置。

用于ISP的扩展参考样点

如图13所示，用于非第一帧内子分区的参考样点可能不可用。在ISP的当前设计中，最接近的可用参考样点被用作那些不可用参考样点的替代。为了提高ISP的预测效率，本公开使用不同方案来导出那些不可用参考样点的替代参考样点。

在一个实施例中，当前编码块(或CU)的参考样点被用作那些不可用参考样点的替代参考样点。如图14和图15所示，例如，每个不可用参考样点的替代参考样点是从由角度帧内预测模式指示的当前编码块(或CU)的参考样点导出的。当生成替代参考样点时，这里也可应用由常规帧内预测使用的插值滤波器或参考样点平滑滤波器。此外，当预测模式是DC模式或平面模式时，不需要额外过程来导出替代参考样点。

在又一实施例中，部署简单复制以生成替代参考样点，如图16所示。

所提出的ISP扩展样点生成方法(如图14、图15和图16所示)可与本部分中提出的其他ISP改进/简化方法自由组合。在一个特定示例中，提出了将ISP扩展样点生成方法与在“基于子块尺寸启用/禁用用于ISP的广角帧内方向”部分(即基于子分区尺寸确定是否启用/禁用广角帧内方向)中的ISP广角帧内方向进行组合。当启用这种组合时，因为非第一子分区的不可用参考样点是从第一子分区的邻近参考样点生成的，所以可能需要第一子分区的更多邻近参考样点，这是由于以下事实：由非第一子分区使用的替代参考样点的数量取决于根据子块尺寸而非编码块尺寸导出的子分区的相应广角帧内方向。换句话说，这种设计可潜在地增加第一子分区的访问的参考样点的数量。为了避免这种复杂度增加，在本公开的一个实施例中，提出了通过填充子分区的原始参考样点区域中的最近参考样点的值来生成那些额外参考。在另一实施例中，提出了将一个非第一子分区的帧内模式裁剪为不需要使用除第一子分区的参考样点之外的额外参考样点的最接近帧内模式。

图13展示了根据本公开的水平分割中的非第一子分区的不可用参考样点；在垂直分割中的非第一子分区中发生相同的情况。

图14展示了根据本公开的导出水平分割中的非第一子分区的不可用参考样点的替代参考样点的图示；根据帧内预测模式从当前编码块的参考样点导出替代参考样点。

图15展示了根据本公开的导出垂直分割中的非第一子分区的不可用参考样点的替代参考样点的图示；根据帧内预测模式从当前编码块的参考样点导出替代参考样点。

图16展示了根据本公开的导出水平分割中的非第一子分区的不可用参考样点的替代参考样点的图示；替代参考样点直接从当前编码块的参考样点复制；相同的方法适用于垂直分割中的非第一子分区。

图17展示了与用户接口1760耦合的计算环境1710。计算环境1710可以是数据处理服务器的一部分。计算环境1710包括处理器1720、存储器1740和I/O接口1750。

处理器1720通常控制计算环境1710的整体操作，诸如与显示、数据采集、数据通信和图像处理相关联的操作。处理器1720可包括用于执行指令以执行上述方法中的全部或一些步骤的一个或更多个处理器。此外，处理器1720可包括促进处理器1720与其它组件之间的交互的一个或更多个模块。处理器可以是中央处理单元(CPU)、微处理器、单片机、GPU等。

存储器1740被配置为存储各种类型的数据以支持计算环境1710的操作。这种数据的示例包括用于在计算环境1710上操作的任何应用或方法的指令、视频数据集、图像数据等。存储器1740可通过使用任何类型的易失性或非易失性存储器设备或其组合来实现，诸如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、闪存、磁盘或光盘。

I/O接口1750提供处理器1720与外围接口模块(诸如键盘、点击轮、按钮等)之间的接口。按钮可包括但不限于主页按钮、开始扫描按钮和停止扫描按钮。I/O接口1750可与编码器和解码器耦合。

在实施例中，还提供了一种包括多个程序的非暂态计算机可读存储介质，诸如在计算环境1710中被包括在存储器1740中，可由处理器1720执行，用于执行上述方法。例如，非暂态计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等。

非暂态计算机可读存储介质中存储有用于由具有一个或更多个处理器的计算设备执行的多个程序，其中多个程序在由一个或更多个处理器执行时使计算设备执行上述用于运动预测的方法。

在实施例中，计算环境1710可由用于执行上述方法的一个或更多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、图形处理单元(GPU)、控制器、微控制器、微处理器或其他电子组件来实现。

38页详细技术资料下载

用于帧内子分区编码模式的方法和设备

相关技术

网友询问留言