基于mpm列表的帧内预测方法及其设备

文档序号:1943008 发布日期:2021-12-07 浏览:13次 >En<

阅读说明:本技术 基于mpm列表的帧内预测方法及其设备 (MPM list-based intra-frame prediction method and equipment thereof ) 是由 李翎 林宰显 许镇 崔璋元 金昇焕 于 2020-03-23 设计创作,主要内容包括:一种由根据本公开的解码设备执行的图像解码方法包括以下步骤:从比特流获得帧内预测信息,该帧内预测信息包括MPM标志信息、MRL索引信息和平面标志信息中的至少一种;检查MPM标志信息;基于MPM标志信息指示MRL索引信息被检查的情况来检查MRL索引信息;基于MRL索引信息的值为0的情况来检查平面标志信息;基于对平面标志信息的检查来导出用于当前块的帧内预测模式;基于用于当前块的帧内预测模式来导出当前块的预测样本;以及基于预测样本来生成重构图片。(An image decoding method performed by a decoding apparatus according to the present disclosure includes the steps of: obtaining intra prediction information from the bitstream, the intra prediction information including at least one of MPM flag information, MRL index information, and plane flag information; checking MPM mark information; checking the MRL index information based on a case that the MPM flag information indicates that the MRL index information is checked; checking the plane flag information based on a case where the value of the MRL index information is 0; deriving an intra prediction mode for the current block based on the checking of the plane flag information; deriving prediction samples for the current block based on an intra prediction mode for the current block; and generating a reconstructed picture based on the prediction samples.)

基于MPM列表的帧内预测方法及其设备

技术领域

本公开涉及图像编译技术,并且更具体地,涉及图像编译系统中的基于最可能模式(MPM)列表的帧内预测方法及其设备。

背景技术

最近,在各种领域中对诸如4K或8K超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频分辨率或质量变得更高,与传统图像/视频数据相比发送相对更多的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质发送或被存储在传统存储介质中,则传输和存储的成本容易增加。

此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。

因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。

发明内容

技术问题

本公开将提供一种用于改进图像编译效率的方法和设备。

本公开也将提供一种用于改进帧内预测的效率的方法和设备。

本公开还将提供一种基于用于当前块的MPM列表执行帧内预测的方法和设备。

本公开还将提供一种基于用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息执行基于MPM列表的帧内预测的方法和设备。

本公开还将提供一种基于与是否将用于当前块的帧内预测模式确定为平面模式有关的平面(PLANAR)标志信息执行基于MPM列表的帧内预测的方法和设备。

本公开还将提供一种基于MRL索引信息确定是否用信号通知平面标志信息的方法和设备。

本公开还将提供一种构建用于当前块的MPM列表的方法和设备。

本公开还将提供一种基于帧内子分区(ISP)模式是否被应用于当前块,确定用于与平面标志信息关联的bin(二进制位)的上下文索引的值的方法和设备。

技术方案

根据本公开的实施方式,提供了一种由解码设备执行的图像解码方法。该方法包括:从比特流获得帧内预测信息,该帧内预测信息包括与是否基于用于当前块的最可能模式(MPM)候选导出用于当前块的帧内预测模式有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息、以及与是否将用于当前块的帧内预测模式确定为平面模式有关的平面(PLANAR)标志信息中的至少一种;检查MPM标志信息;基于MPM标志信息的值指示对MRL索引信息的检查的情况,检查MRL索引信息;基于MRL索引信息的值为0的情况,检查平面标志信息;基于对平面标志信息的检查,导出用于当前块的帧内预测模式;基于用于当前块的帧内预测模式,导出当前块的预测样本;以及基于预测样本生成重构图片。

在实施方式中,导出用于当前块的帧内预测模式可以包括:基于平面标志信息指示用于当前块的帧内预测模式被导出为平面模式的情况,将用于当前块的帧内预测模式导出为平面模式。

在实施方式中,帧内预测信息可以进一步包括与已从其中排除了平面模式的用于当前块的MPM候选之一关联的MPM索引信息,其中,导出用于当前块的帧内预测模式可以包括:基于平面标志信息指示用于当前块的帧内预测模式不被导出为平面模式的情况,检查MPM索引信息,并且基于检查MPM索引信息的结果,导出用于当前块的帧内预测模式。

在实施方式中,已从其中排除了平面模式的用于当前块的MPM候选的数目可以是五。

在实施方式中,可以基于已从其中排除了平面模式的用于当前块的MPM候选并且基于MRL索引信息的值指示非零的情况,导出用于当前块的帧内预测模式。

在实施方式中,可以基于用于与平面标志信息关联的bin的上下文模型导出平面标志信息的值,可以基于上下文索引增量(ctxInc)导出用于与平面标志信息关联的bin的上下文模型,基于bin的bin索引可以为0的情况,用于与平面标志信息关联的bin的上下文索引增量从两个候选中选择,这两个候选可以包括0和1,用于上下文索引增量为0的情况的上下文模型可以不同于用于上下文索引增量为1的情况的上下文模型,用于与平面标志信息关联的bin的上下文索引增量的值可以是两个不同的整数之一,并且这两个不同的整数可以是0和1。

在实施方式中,用于与平面标志信息关联的bin的上下文索引增量的值可以基于帧内子分区(ISP)模式是否被应用于当前块。

在实施方式中,可以基于ISP模式被应用于当前块的确定将上下文索引增量的值确定为1,以及可以基于ISP模式不被应用于当前块的确定将上下文索引增量的值确定为0。

根据本公开的另一实施方式,提供了一种用于执行图像解码的解码设备。该解码设备包括:熵解码器,该熵解码器从比特流获得帧内预测信息,该帧内预测信息包括与是否基于用于当前块的最可能模式(MPM)候选导出用于当前块的帧内预测模式有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息、以及与是否将用于当前块的帧内预测模式确定为平面模式有关的平面(PLANAR)标志信息中的至少一种,检查MPM标志信息,基于MPM标志信息的值与对MRL索引信息的检查关联的检查结果,检查MRL索引信息,并且基于MRL索引信息的值为0的检查结果检查平面标志信息;预测器,该预测器基于对平面标志信息的检查导出用于当前块的帧内预测模式,并且基于用于当前块的帧内预测模式导出当前块的预测样本;以及加法器,该加法器基于预测样本生成重构图片。

在实施方式中,帧内预测信息可以进一步包括与已从其中排除了平面模式的用于当前块的MPM候选之一关联的MPM索引信息,其中,已从其中排除了平面模式的用于当前块的MPM候选的数目可以是五。熵解码器可以基于平面标志信息的值与不将用于当前块的帧内预测模式导出为平面模式关联的检查结果,检查MPM索引信息。预测器可以基于检查MPM索引信息的结果导出用于当前块的帧内预测模式。

在实施方式中,预测器可以基于已从其中排除了平面模式的用于当前块的MPM候选并且基于MRL索引信息的值不为零的检查结果导出用于当前块的帧内预测模式。

在实施方式中,用于与平面标志信息关联的bin的上下文索引增量的值可以是两个不同的整数之一,这两个不同的整数可以是0和1,并且,用于与平面标志信息关联的bin的上下文索引增量的值可以基于帧内子分区(ISP)模式是否被应用于当前块。

在实施方式中,可以基于ISP模式被应用于当前块的确定将上下文索引增量的值确定为1,以及可以基于ISP模式不被应用于当前块的确定将上下文索引增量的值确定为0。

根据本公开的再一实施方式,提供了一种由编码设备执行的图像编码方法。该图像编码方法包括:导出用于当前块的帧内预测模式;生成与是否基于用于当前块的MPM候选来对帧内预测模式进行编码有关的MPM标志信息;基于MPM标志信息指示与用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息关联的情况,生成MRL索引信息;基于MRL索引信息的值为0的检查结果,生成与所导出的用于当前块的帧内预测模式是否为平面(PLANAR)模式有关的平面标志信息;以及对包括MPM标志信息、MRL索引信息和平面标志信息中的至少一种的图像信息进行编码。

在实施方式中,图像编码方法可以进一步包括:基于平面标志信息的值与用于当前块的帧内预测模式不被导出为平面模式关联的确定,导出与已从其中排除了平面模式的用于当前块的MPM候选之一关联的MPM索引信息。

在实施方式中,已从其中排除了平面模式的用于当前块的MPM候选的数目可以是五。

在实施方式中,图像编码方法可以包括:基于已从其中排除了平面模式的用于当前块的MPM候选并且基MRL索引信息的值不为零的检查结果,导出用于当前块的帧内预测模式。

在实施方式中,用于与平面标志信息关联的bin的上下文索引的值可以是两个不同的整数之一,并且这两个不同的整数可以是0和1。

在实施方式中,用于与平面标志信息关联的bin的上下文索引增量的值可以基于ISP模式是否被应用于当前块。

在实施方式中,可以基于ISP模式被应用于当前块的确定将上下文索引增量的值确定为1,以及可以基于ISP模式不被应用于当前块的确定将上下文索引增量的值确定为0。

根据本公开的再一实施方式,提供了一种用于执行图像编码的编码设备。该编码设备包括:预测器,该预测器导出用于当前块的帧内预测模式;以及熵编码器,该熵编码器生成与是否基于用于当前块的MPM候选对帧内预测模式进行编码有关的MPM标志信息,基于MPM标志信息的值与用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息关联的确定,导出MRL索引信息,基于MRL索引信息的值为0的检查结果,导出与所导出的用于当前块的帧内预测模式是否为平面(PLANAR)模式有关的平面标志信息,并且对包括MPM标志信息、MRL索引信息和平面标志信息中的至少一种的图像信息进行编码。

根据实施方式的图像编码设备可以基于平面标志信息指示用于当前块的帧内预测模式不被导出为平面模式的情况,导出与已从其中排除了平面模式的用于当前块的MPM候选之一关联的MPM索引信息。

在实施方式中,已从其中排除了平面模式的用于当前块的MPM候选的数目可以是五。

根据实施方式的图像编码设备可以基于已从其中排除了平面模式的用于当前块的MPM候选并且基于MRL索引信息的值指示非零的情况导出用于当前块的帧内预测模式。

在实施方式中,可以基于用于与平面标志信息关联的bin的上下文模型导出平面标志信息的值,并且可以基于上下文索引增量(ctxInc)导出用于与平面标志信息关联的bin的上下文模型。可以基于bin的bin索引可以为0的情况从两个候选中选择用于与平面标志信息关联的bin的上下文索引增量。候选可以包括0和1,并且用于上下文索引增量为0的情况的上下文模型可以不同于用于上下文索引增量为1的情况的上下文模型。用于与平面标志信息关联的bin的上下文索引增量的值可以是两个不同的整数之一,并且不同的两个整数可以是0和1。

在实施方式中,用于与平面标志信息关联的bin的上下文索引增量的值可以基于ISP模式是否被应用于当前块。

在实施方式中,可以基于ISP模式被应用于当前块的确定将上下文索引增量的值确定为1,以及可以基于ISP模式不被应用于当前块的确定将上下文索引增量的值确定为0。

根据本公开的再一实施方式,提供了一种解码器可读存储介质,该解码器可读存储介质存储关于使视频解码设备执行根据一些实施方式的解码方法的指令的信息。

根据本公开的再一实施方式,提供了一种解码器可读存储介质,该解码器可读存储介质存储关于使视频解码设备执行根据实施方式的解码方法的指令的信息。根据实施方式的解码方法包括:从比特流获得帧内预测信息,该帧内预测信息包括与是否基于用于当前块的最可能模式(MPM)候选导出用于当前块的帧内预测模式有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息、以及与是否将用于当前块的帧内预测模式确定为平面模式有关的平面标志信息中的至少一种;检查MPM标志信息;基于MPM标志信息的值与对MRL索引信息的检查关联的检查结果,检查MRL索引信息;基于MRL索引信息的值为0的检查结果,检查平面标志信息;基于对平面标志信息的检查,导出用于当前块的帧内预测模式;基于用于当前块的帧内预测模式,导出用于当前块的预测样本;以及基于预测样本生成重构图片。

在实施方式中,帧内预测信息可以进一步包括与已从其中排除了平面模式的用于当前块的MPM候选之一关联的MPM索引信息,其中,已从其中排除了平面模式的用于当前块的MPM候选的数目可以是五。导出用于当前块的帧内预测模式可以包括基于平面标志信息的值与不将用于当前块的帧内预测模式导出为平面模式关联的检查结果,检查MPM索引信息,并且基于检查MPM索引信息的结果,导出用于当前块的帧内预测模式。

根据实施方式的解码方法可以包括:基于已从其中排除了平面模式的用于当前块的MPM候选并且基于MRL索引信息的值指示非零的情况,导出用于当前块的帧内预测模式。

在实施方式中,可以基于用于与平面标志信息关联的bin的上下文模型导出平面标志信息的值,可以基于上下文索引增量(ctxInc)导出用于与平面标志信息关联的bin的上下文模型,可以基于bin的bin索引可以为0的情况从两个候选中选择用于与平面标志信息关联的bin的上下文索引增量。候选可以包括0和1,并且用于上下文索引增量为0的情况的上下文模型可以不同于用于上下文索引增量为1的情况的上下文模型。用于与平面标志信息关联的bin的上下文索引增量的值可以是两个不同的整数之一,并且不同的两个整数可以是0和1。用于与平面标志信息关联的bin的上下文索引增量的值可以基于帧内子分区(ISP)模式是否被应用于当前块。

在实施方式中,可以基于ISP模式被应用于当前块的确定将上下文索引增量的值确定为1。可以基于ISP模式不被应用于当前块的确定将上下文索引增量的值确定为0。

发明效果

根据本公开,可以改进整体图像/视频压缩效率。

根据本公开,可以改进帧内预测效率。

根据本公开,可以基于MPM列表高效地执行帧内预测。

根据本公开,可以基于用于当前块的帧内预测的至少一个参考样本线的MRL索引信息,提高基于MPM列表的帧内预测的效率。

根据本公开,可以基于与是否将用于当前块的帧内预测模式确定为平面模式有关的平面标志信息,提高基于MPM列表的帧内预测的效率。

根据本公开,可以通过基于MRL索引信息确定是否用信号通知平面标志信息,提高图像编译效率。

根据本公开,可以高效地构建用于当前块的MPM列表。

根据本公开,可以基于ISP模式是否被应用于当前块,确定用于与平面标志信息关联的bin的上下文索引的值。

附图说明

图1示意性地图示可以应用本公开的视频/图像编译系统的示例。

图2是示意性地图示可以应用本公开的视频/图像编码设备的配置的图。

图3是用于示意性地说明可以应用本公开的视频/图像解码设备的配置的图。

图4a和图4b是图示由根据实施方式的编码设备执行的图像编码方法的示例以及由根据实施方式的解码设备执行的图像解码方法的示例的图。

图5是图示根据实施方式的帧内预测方法的流程图。

图6是图示定向帧内预测模式的示例的图。

图7是用于说明根据实施方式的MPM列表的构建的图。

图8是用于说明根据另一实施方式的MPM列表的构建的图。

图9是示出根据实施方式的MPM预测方法的流程图。

图10是示出根据另一实施方式的MPM预测方法的流程图。

图11是示出根据实施方式的编码设备的操作的流程图。

图12是示出根据实施方式的编码设备的配置的框图。

图13是示出根据实施方式的解码设备的操作的流程图。

图14是示出根据实施方式的解码设备的配置的框图。

图15表示可以应用本文的公开内容的内容流系统的示例。

具体实施方式

本公开可按各种形式修改,将描述并且在附图中图示其特定实施方式。然而,这些实施方式并非旨在限制本公开。以下描述中使用的术语仅用于描述特定实施方式,而非旨在限制本公开。单数表达包括复数表达,只要不是明确地不同的理解。诸如“包括”和“具有”的术语旨在指示存在以下描述中使用的特征、数量、步骤、操作、元素、组件或其组合,因此应该理解,不排除存在或添加一个或更多个不同的特征、数量、步骤、操作、元素、组件或其组合的可能性。

另外,本公开中描述的附图的各个配置是为了说明作为彼此不同的特征的功能的独立图示,而不意味着各个配置通过彼此不同的硬件或不同的软件被实现。例如,能够组合配置中的两个或更多个配置以形成一个配置,并且也能够将一个配置划分成多个配置。在不脱离本公开的主旨的情况下,配置被组合和/或分离的实施例被包括在本公开的范围内。

在下文中,将参考附图详细地描述本公开的实施方式。另外,贯穿附图使用相似的附图标记来指示相似的元素,并且将省略对相似的元素的相同描述。

图1图示可应用本公开的视频/图像编译系统的示例。

本文涉及视频/图像编译。例如,本文中公开的方法/实施方式可应用于通用视频编译(VVC)、基本视频编译(EVC)标准、AOMedia Video 1(AV1)标准、第2代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267、H.268等)中公开的方法。

本文提出了视频/图像编译的各种实施方式,并且除非另外指定,否则上述实施方式也可彼此组合执行。

在本文中,视频可指随时间的一系列图像。图片通常是指表示特定时间帧处的一个图像的单元,并且切片(slice)/拼块(tile)是指在编译时构成图片的部分的单元。切片/拼块可包括一个或更多个编译树单元(CTU)。一个图片可由一个或更多个切片/拼块组成。一个图片可由一个或更多个拼块组组成。一个拼块组可包括一个或更多个拼块。图块(brick)可表示图片中的拼块内的CTU行的矩形区域(图块可表示图片中的拼块内的CTU行的矩形区域)。拼块可被分区成多个图块,各个图块可用拼块内的一个或更多个CTU行构造(拼块可被分区成多个图块,各个图块由拼块内的一个或更多个CTU行组成)。未被分区成多个图块的拼块也可被称为图块。图块扫描可表示分区图片的CTU的特定顺序排序,其中可以在图块内以CTU栅格扫描对CTU进行排序,并且拼块内的图块可以以拼块的图块的栅格扫描连续地排序,并且在图片中的拼块可以以图片中的拼块的栅格扫描连续地排序(图块扫描是分区图片的CTU的特定顺序排序,其中可以以图块中的CTU栅格扫描对CTU连续地排序,拼块内的图块可以以拼块的图块的栅格扫描连续地排序,并且图片中的拼块可以以图片的拼块的栅格扫描连续地排序)。拼块是特定拼块列和特定拼块列内的CTU的矩形区域(拼块是图片中的特定拼块列和特定拼块行内的CTU的矩形区域)。拼块列是高度等于图片的高度并且宽度可由图片参数集中的语法元素指定的CTU的矩形区域(拼块列是高度等于图片的高度并且宽度由图片参数集中的语法元素指定的CTU的矩形区域)。拼块行是宽度由图片参数集中的语法元素指定并且高度可等于图片的高度的CTU的矩形区域(拼块行是高度由图片参数集中的语法元素指定并且宽度等于图片的宽度的CTU的矩形区域)。拼块扫描可表示分区图片的CTU的特定顺序排序,并且CTU可以以拼块中的CTU栅格扫描连续地排序,而图片中的拼块可以以图片的拼块的栅格扫描连续地排序(拼块扫描是分区图片的CTU的特定顺序排序,其中CTU可以以拼块中的CTU栅格扫描连续地排序,而图片中的拼块可以以图片的拼块的栅格扫描连续地排序)。切片可包括图片的整数数量的图块,并且可在单个NAL单元中包括整数数量的图块(切片包括可排他地包含在单个NAL单元中的图片的整数数量的图块)。切片可用多个完整拼块构造,或者可以是一个拼块的完整图块的连续序列(切片可由多个完整拼块或仅一个拼块的完整图块的连续序列组成)。在本文中,拼块组和切片可代替彼此使用。例如,在本文中,拼块组/拼块组头可被称为切片/切片头。

像素或像元(pel)可意指构成一个图片(或图像)的最小单元。另外,“样本”可被用作与像素对应的术语。样本通常可表示像素或像素的值,并且可表示仅亮度分量的像素/像素值或仅色度分量的像素/像素值。

单元可表示图像处理的基本单元。单元可包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可包括一个亮度块和两个色度(例如cb、cr)块。在一些情况下,单元可与诸如块或面积这样的术语互换地使用。在一般情况下,M×N块可包括M列N行的样本(或样本阵列)或变换系数的集合(或阵列)。

在本公开中,术语“/”和“、”应该被解释为指示“和/或”。例如,表达“A/B”可意指“A和/或B”。此外,“A、B”可意指“A和/或B”。此外,“A/B/C”可意指“A、B和/或C中的至少一个”。另外,“A/B/C”可意指“A、B和/或C中的至少一个”。

此外,在本文中,术语“或”应该被解释为指示“和/或”。例如,表达“A或B”可包括1)仅A、2)仅B和/或3)A和B二者。换句话说,本公开中的术语“或”应该被解释为指示“附加地或另选地。”

参照图1,视频/图像编译系统可包括源装置和接收装置。源装置可通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式传送至接收装置。

源装置可包括视频源、编码设备和发送器。接收装置可包括接收器、解码设备和渲染器。编码设备可被称为视频/图像编码设备,解码设备可被称为视频/图像解码设备。发送器可被包括在编码设备中。接收器可被包括在解码设备中。渲染器可包括显示器,并且显示器可被配置为单独的装置或外部组件。

视频源可通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可包括视频/图像捕获装置,和/或视频/图像生成装置。例如,视频/图像捕获装置可包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可由生成相关数据的处理代替。

编码设备可对输入视频/图像进行编码。为了压缩和编译效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可按比特流的形式输出。

发送器可通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送至接收装置的接收器。数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可包括用于通过预定文件格式生成媒体文件的元件,并且可包括用于通过广播/通信网络传输的元件。接收器可接收/提取比特流并且将所接收的比特流发送至解码设备。

解码设备可通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程对视频/图像进行解码。

渲染器可渲染解码的视频/图像。渲染的视频/图像可通过显示器显示。

图2是示意性地图示可应用本公开的视频/图像编码设备的配置的图。在下文中,被称为视频编码设备的东西可包括图像编码设备。

参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可包括帧间预测器221和帧内预测器222。残差处理器230可包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可包括减法器231。加法器250可被称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可包括解码图片缓冲器(DPB),或者可由数字存储介质配置。硬件组件还可包括存储器270作为内部/外部组件。

图像分割器210可将输入到编码设备200的输入图像(或图片、帧)分割成一个或更多个处理单元。例如,可将处理单元称作编译单元(CU)。在这种情况下,可根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分割编译单元。例如,可基于四叉树结构、二叉树结构和/或三叉树结构将一个编译单元分割成较深深度的多个编译单元。在这种情况下,例如,首先应用四叉树结构,和/或可稍后应用二叉树结构和/或三叉树结构。另选地,也可首先应用二叉树结构。可基于不再分割的最终编译单元来执行根据本公开的编译过程。在这种情况下,基于根据图像特征等的编译效率,可将最大编译单元直接用作最终编译单元,或者必要时,可将编译单元递归地分割成较深深度的编译单元,使得可将具有最佳大小的编译单元用作最终编译单元。这里,编译过程可包括诸如要稍后描述的预测、变换和重构的过程。作为另一示例,处理单元可进一步包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元中的每一个可从前述最终编译单元分割或分区。预测单元可以是样本预测的单元,并且变换单元可以是用于导出变换系数的单元和/或用于从变换系数导出残差信号的单元。

在一些情况下,单元可与诸如块或区域的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一个图片(或图像)对应的术语。

在编码设备200中,从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码器200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可被称为减法器231。预测器可对要处理的块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可确定基于当前块或CU应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可生成与预测有关的各种类型的信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可在熵编码器240中编码并以比特流的形式输出。

帧内预测器222可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。例如,非定向模式可包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可根据设置使用更多或更少的定向预测模式。帧内预测器222可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。

帧间预测器221可基于参考图片上运动向量所指定的参考块(参考样本阵列)来导出当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同或不同。时间邻近块可被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可被称为并置图片(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于导出当前块的运动向量和/或参考图片索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可不发送残差信号。运动向量预测(MVP)模式可以通过将邻近块的运动向量用作运动向量预测子,并且用信号通知运动向量差来指示当前块的运动向量。

预测器220可基于下面描述的各种预测方法来生成预测信号。例如,预测器可不仅应用帧内预测或帧间预测以预测一个块,而且同时应用帧内预测和帧间预测二者。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是可与帧间预测相似地执行,使得在当前图片中导出参考块。即,IBC可使用本文中描述的至少一个帧间预测技术。调色板模式可被视为帧内编译或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知图片内的样本值。

由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可用于生成重构信号或生成残差信号。变换器232可通过对残差信号应用变换技术来生成变换系数。例如,变换技术可包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen–Loève变换(KLT)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,当像素之间的关系信息由图形表示时,GBT意指从图形获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号生成的变换。另外,变换处理可应用于具有相同大小的正方形像素块或者可应用于具有正方形以外的可变大小的块。

量化器233可将变换系数量化并将它们发送到熵编码器240,并且熵编码器240可对量化的信号(关于量化的变换系数的信息)进行编码并输出比特流。关于量化的变换系数的信息可被称为残差信息。量化器233可基于系数扫描顺序将块类型量化的变换系数重排为一维向量形式,并且基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。可生成关于变换系数的信息。熵编码器240可执行例如指数Golomb编译、上下文自适应可变长度编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等的各种编码方法。熵编码器240可对量化的变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或单独地进行编码。编码的信息(例如,编码的视频/图像信息)可按比特流的形式以NAL(网络抽象层)为单位发送或存储。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。在本文中,从编码设备发送/用信号通知给解码设备的信息和/或语法元素可被包括在视频/图片信息中。视频/图像信息可通过上述编码过程编码并被包括在比特流中。比特流可经由网络发送或者可被存储在数字存储介质中。网络可包括广播网络和/或通信网络,并且数字存储介质可包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)可被包括作为编码设备200的内部/外部元件,并且另选地,发送器可被包括在熵编码器240中。

从量化器233输出的量化的变换系数可用于生成预测信号。例如,可通过经由解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差(例如,应用跳过模式的情况),则预测块可用作重构块。加法器250可被称为重构器或重构块生成器。如下所述,所生成的重构信号可用于当前图片中要处理的下一块的帧内预测并且可通过滤波用于下一图片的帧间预测。

此外,可在图片编码和/或重构期间应用亮度映射与色度缩放(LMCS)。

滤波器260可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可通过对重构图片应用各种滤波方法来生成修改的重构图片并将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可生成与滤波有关的各种类型的信息并且将所生成的信息发送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可由熵编码器240编码并以比特流的形式输出。

发送到存储器270的修改的重构图片可用作帧间预测器221中的参考图片。当通过编码设备应用帧间预测时,可避免编码设备200与解码设备之间的预测失配并且编译效率可改进。

存储器270DPB的DPB可存储用作帧间预测器221中的参考图片的修改的重构图片。存储器270可存储导出(或编码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可存储当前图片中的重构块的重构样本并且可将重构样本传送至帧内预测器222。

图3是用于示意性地说明本公开适用于的视频/图像解码设备的配置的图。

参照图3,解码设备300可包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可包括帧间预测器331和帧内预测器332。残差处理器320可包括解量化器321和逆变换器321。根据实施方式,熵解码310、残差处理器320、预测器330、加法器340和滤波器350可由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可包括解码图片缓冲器(DPB)或者可由数字存储介质配置。硬件组件还可包括存储器360作为内部/外部组件。

当输入包括视频/图像信息的比特流时,解码设备300可重构与在图2的编码设备中处理视频/图像信息的处理对应的图像。例如,解码设备300可基于从比特流获得的块分割相关信息来导出单元/块。解码设备300可使用编码设备中应用的处理器来执行解码。因此,例如,解码的处理器可以是编译单元,并且编译单元可根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元分割。可从编译单元导出一个或更多个变换单元。通过解码设备300解码和输出的重构图像信号可通过再现设备再现。

解码设备300可接收从图2的编码设备以比特流的形式输出的信号,并且所接收的信号可通过熵解码器310解码。例如,熵解码器310可解析比特流以导出图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可包括关于各种参数集的信息,例如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可包括一般约束信息。解码设备还可基于关于参数集的信息和/或一般约束信息将图片解码。本文中稍后描述的用信号通知/接收的信息和/或语法元素可通过解码过程解码并从比特流获得。例如,熵解码器310基于诸如指数Golomb编译、CAVLC或CABAC的编译方法对比特流中的信息进行解码,并且输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可接收与比特流中的各个语法元素对应的bin(二进制位),使用解码目标语法元素信息、解码目标块的解码信息或在先前阶段中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测bin出现的概率对bin执行算术解码,并且生成与各个语法元素的值对应的符号。在这种情况下,CABAC熵解码方法可在确定上下文模型之后通过将解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。熵解码器310所解码的信息当中与预测有关的信息可被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中执行了熵解码的残差值(即,量化的变换系数和相关参数信息)可被输入到残差处理器320。残差处理器320可导出残差信号(残差块、残差样本、残差样本阵列)。另外,熵解码器310所解码的信息当中关于滤波的信息可被提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)还可被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本文的解码设备可被称为视频/图像/图片解码设备,并且解码设备可被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可包括熵解码器310,并且样本解码器可包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。

解量化器321可将量化的变换系数解量化并输出变换系数。解量化器321可按二维块形式重排量化的变换系数。在这种情况下,可基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获得变换系数。

逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。

预测器330可对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可确定特定帧内/帧间预测模式。

预测器可基于下述各种预测方法来生成预测信号。例如,预测器不仅可应用帧内预测或帧间预测以预测一个块,而且可同时应用帧内预测和帧间预测。这可被称为组合帧间和帧内预测(CIIP)。另外,预测器可基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上执行当前图片中的预测,但是可与帧间预测相似地执行,使得在当前图片中导出参考块。即,IBC可使用本文中描述的至少一种帧间预测技术。调色板模式可被视为帧内编译或帧内预测的示例。当应用调色板模式时,可基于关于调色板表和调色板索引的信息用信号通知图片内的样本值。帧内预测器331可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。

帧内预测器331可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可包括多个非定向模式和多个定向模式。帧内预测器331可使用应用于邻近块的预测模式来确定应用于当前块的预测模式。

帧间预测器332可基于参考图片上运动向量所指定的参考块(参考样本阵列)来导出当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可包括运动向量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。例如,帧间预测器332可基于邻近块来配置运动信息候选列表并且基于所接收的候选选择信息来导出当前块的运动向量和/或参考图片索引。可基于各种预测模式来执行帧间预测,并且关于预测的信息可包括指示当前块的帧间预测模式的信息。

加法器340可通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块不存在残差,例如当应用跳过模式时,预测块可用作重构块。

加法器340可被称为重构器或重构块生成器。所生成的重构信号可用于当前图片中要处理的下一块的帧内预测,可如下所述通过滤波输出,或者可用于下一图片的帧间预测。

此外,可在图片解码处理中应用亮度映射与色度缩放(LMCS)。

滤波器350可通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可通过对重构图片应用各种滤波方法来生成修改的重构图片并且将修改的重构图片存储在存储器360(具体地,存储器360的DPB)中。例如,各种滤波方法可包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。

存储在存储器360的DPB中的(修改的)重构图片可用作帧间预测器332中的参考图片。存储器360可存储导出(或解码)当前图片中的运动信息的块的运动信息和/或图片中已经重构的块的运动信息。所存储的运动信息可被发送到帧间预测器260以用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可存储当前图片中的重构块的重构样本并将重构样本传送至帧内预测器331。

在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或分别与之对应应用。这也可适用于单元332和帧内预测器331。

如上所述,在执行视频编译时,执行预测以增强压缩效率。可通过预测生成包括当前块(即,目标编译块)的预测样本的预测块。在这种情况下,预测块包括空间域(或像素域)中的预测样本。预测块在编码设备和解码设备中相同地导出。编码设备可通过用信号向解码设备通知关于原始块(而非原始块的原始样本值本身)与预测块之间的残差的信息(残差信息)来增强图像编译效率。解码设备可基于残差信息来导出包括残差样本的残差块,可通过将残差块和预测块相加来生成包括重构样本的重构块,并且可生成包括重构块的重构图片。

残差信息可通过变换过程和量化过程来生成。例如,编码设备可导出原始块与预测块之间的残差块,可通过对包括在残差块中的残差样本(残差样本阵列)执行变换过程来导出变换系数,可通过对变换系数执行量化过程来导出量化的变换系数,并且可将相关残差信息(通过比特流)用信号通知给解码设备。在这种情况下,残差信息可包括诸如量化的变换系数的值信息、位置信息、变换方案、变换核心和量化参数的信息。解码设备可基于残差信息来执行解量化/逆变换过程并且可导出残差样本(或残差块)。解码设备可基于预测块和残差块来生成重构图片。此外,编码设备可通过对供后续图片的帧间预测参考的量化的变换系数进行解量化/逆变换来导出残差块,并且可生成重构图片。

图4a和图4b是图示由根据实施方式的编码设备执行的图像编码方法的示例以及由根据实施方式的解码设备执行的图像解码方法的示例的图。

图4a图示由视频编码设备执行的图像编码方法的示例。参照图4a,图像编码方法可包括块分区、帧内/帧间预测、变换、量化和熵编码过程。例如,可将当前图片分区成多个块,可通过帧内/帧间预测来生成当前块的预测块,并且可通过减去当前块的输入块和预测块来生成当前块的残差块。此后,可通过对残差块进行变换来生成系数块,即,当前块的变换系数。变换系数可被量化和熵编码并存储在比特流中。

图4b图示由解码设备执行的图像解码方法的示例。参照图4b,图像解码方法可包括熵解码、逆量化、逆变换和帧内/帧间预测过程。例如,解码设备可执行编码方法的逆过程。具体地,可通过对比特流的熵解码来获得量化的变换系数,并且可通过量化的变换系数的逆量化过程来获得当前块的系数块,即变换系数。可通过对变换系数的逆变换来导出当前块的残差块,并且可通过将通过帧内/帧间预测导出的当前块的预测块和残差块相加来导出当前块的重构块。

图5是图示根据实施方式的帧内预测方法的流程图。

如图5所示,根据实施方式的帧内预测方法可包括以下三个步骤。也就是说,根据实施方式的帧内预测方法可包括参考样本构建步骤、样本预测步骤和后滤波步骤。在样本预测步骤中,根据该实施方式的帧内预测方法可使用已知的邻近参考样本和帧内预测模式来对未知样本执行预测。

图6是图示定向帧内预测模式的示例的图。

当对当前块应用帧内预测时,根据实施方式的编码设备和/或解码设备可导出用于当前块的帧内预测模式,并且基于该帧内预测模式来导出当前块的预测样本。也就是说,编码设备和/或解码设备可基于当前块的邻近参考样本通过启用定向帧内预测模式或非定向帧内预测模式来导出当前块的预测样本。

在示例中,帧内预测模式可包括两个非定向(或非角度)帧内预测模式和65个定向(或角度)帧内预测模式。非定向帧内预测模式可包括编号0平面帧内预测模式和编号1DC帧内预测模式,而定向帧内预测模式可包括介于编号2帧内预测模式与编号66帧内预测模式之间的65个帧内预测模式。基于65个定向帧内预测模式的帧内预测可被应用于所有大小的块,并且可被应用于亮度分量和色度分量二者。然而,这仅是示例,并且帧内预测模式的配置可以是不同的。

另选地,帧内预测模式可包括两个非定向帧内预测模式和129个定向帧内预测模式。非定向帧内预测模式可包括平面帧内预测模式和DC帧内预测模式,而定向帧内预测模式可包括编号2至编号130帧内预测模式。

同时,除了上述帧内预测模式之外,帧内预测模式还可进一步包括用于色度样本的跨分量线性模型(CCLM)模式。CCLM模式可取决于是考虑左样本、考虑上样本还是考虑二者来导出LM参数而被分类为LT_CCLM、L_CCLM和T_CCLM,并且可被仅应用于色度分量。

可给帧内预测模式编索引,例如,如下表1所示。

[表1]

帧内预测模式 相关名称
0 INTRA_PLANAR
1 INTRA_DC
2..66 INTRA_ANGULAR2..INTRA_ANGULAR66
81..83 INTRA_LT_CCLM、INTRA_L_CCLM、INTRA_T_CCLM

同时,帧内预测类型(或附加帧内预测模式等)可包括上述LIP、PDPC、MRL和ISP中的至少一种。可基于帧内预测类型信息来指示帧内预测类型,并且可以各种形式实现帧内预测类型信息。在一个示例中,帧内预测类型信息可包括指示帧内预测类型中的一种的帧内预测类型索引信息。在另一示例中,帧内预测类型信息可包括以下各项中的至少一种:与是否对当前块应用MRL并且在被应用的情况下哪个参考样本线被使用有关的参考样本线信息(例如,intra_luma_ref_idx)、与是否对当前块应用ISP有关的ISP标志信息(例如,intra_subpartitions_split_flag)、与是否应用PDCP有关的标志信息、或与是否应用LIP有关的标志信息。

参照图6,可以围绕具有左向上对角线预测方向的编号34帧内预测模式区分具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式。图6的H和V分别意指水平方向性和垂直方向性,并且数字-32至32指示样本网格位置上以1/32为单位的位移。编号2至33帧内预测模式具有水平方向性,而编号34至66帧内预测模式具有垂直方向性。编号18帧内预测模式和编号50帧内预测模式分别可以是水平帧内预测模式和垂直帧内预测模式;可将编号2帧内预测模式称作左向下对角线帧内预测模式;可将编号34帧内预测模式称作左向上对角线帧内预测模式;并且可将编号66帧内预测模式称作右向上对角线帧内预测模式。

通常,当图像被划分成块时,要编译的当前块和邻近块具有类似的图像特性。因此,高度可能的是,当前块和邻近块具有相同或类似的帧内预测模式。因此,编码器可使用邻近块的帧内预测模式来对当前块的帧内预测模式进行编码。

更具体地,解码设备可基于当前块的邻近块(例如,左邻近块和/或上邻近块)的帧内预测模式和附加候选模式来导出最可能模式(MPM)列表,并且可基于接收到的MPM索引来选择所导出的MPM列表中的MPM候选中的一个,或者可基于剩余帧内预测模式信息来选择未包括在MPM候选中的剩余帧内预测模式中的一个。MPM列表可被称为帧内预测模式候选列表或者可被表示为candModeList。

当邻近块被帧内编译时,编码设备(或编码器)可检查或导出邻近块的预测模式。例如,可基于左邻近块的预测模式和上邻近块的预测模式来确定当前块的预测模式,并且在这种情况下,可将所对应邻近块的预测模式确定为最可能模式(MPM)。可将确定MPM表达为MPM(最可能模式)候选(或MPM列表)的列举。

编码设备可以检查左邻近块的预测模式是否与上邻近块的预测模式相同。可以通过对两个相邻块的帧内预测模式执行修剪(pruning)过程来形成初始MPM列表。

如果左邻近块的预测模式和上邻近块的预测模式不相同,则可以将第一MPM设置为左邻近块的预测模式,可以将第二MPM设置为上邻近块的预测模式,并且可以将第三MPM设置为帧内平面模式、帧内DC模式和帧内垂直模式(编号50帧内预测模式)中的任何一种。具体地,如果两个邻近块的帧内预测模式彼此不同,则可以将这两种帧内预测模式设置为MPM,并且可以将根据MPM的修剪检查之后的默认帧内模式之一添加到MPM列表。这里,默认帧内模式可以包括帧内平面模式、帧内DC模式和/或帧内垂直模式(编号50帧内预测模式)。

在示例中,MPM列表可以包括3个MPM候选、5个候选或6个MPM候选。作为一个示例,MPM列表可以包括基于邻近块的帧内预测模式、导出的帧内预测模式和/或默认帧内预测模式而导出的候选。编码设备/解码设备可以按特定次序搜索当前块的邻近块,并且可以按导出次序导出邻近块的帧内预测模式作为MPM候选。例如,邻近块可以包括左邻近块、上邻近块、左下邻近块、右上邻近块和左上邻近块。

在一个示例中,可以构建包括三个MPM候选的MPM列表,并且可以基于邻近块F和邻近块G的帧内预测模式来导出三个MPM候选。基于包括邻近块F和邻近块G的用于当前块的邻近块的MPM预测方法可以例如如下图7所示。

图7是用于说明根据实施方式的MPM列表的构建的图。

参照图7,当前块的邻近块可以包括邻近块A、邻近块B、邻近块C、邻近块D、邻近块E、邻近块F和/或邻近块G。

邻近块A可以表示位于当前块的左上样本位置的左上方的邻近块;邻近块B可以表示位于当前块的右上样本位置的上方的邻近块;邻近块C可以表示位于当前块的右上样本位置的右上方的邻近块;邻近块D可以表示位于当前块的左下样本位置的左方的邻近块;邻近块E可以表示位于当前块的左下样本位置的左下方的邻近块;邻近块G可以表示位于当前块的左上样本位置的上方的邻近块;以及邻近块F可以表示位于当前块的左上样本位置的左方的邻近块。

附加地,例如,在当前块的大小为WxH并且当前块的左上样本位置的x分量为0并且其y分量为0时,那么邻近块A是包括坐标(-1,-1)处的样本的块;邻近块B是包括坐标(W-1,-1)处的样本的块;邻近块C是包括坐标(W,-1)处的样本的块;邻近块D是包括坐标(-1,H-1)处的样本的块;邻近块E是包括坐标(-1,H)处的样本的块;邻近块F是包括坐标(-1,0)处的样本的块;以及邻近块G是包括坐标(0,-1)处的样本的块。

在实施方式中,可以基于邻近块F的帧内预测模式和邻近块G的帧内预测模式来导出三个MPM候选。例如,可以导出邻近块F的帧内预测模式和邻近块G的帧内预测模式。同时,在以下三种情况下,可以将邻近块F的帧内预测模式或邻近块G的帧内预测模式导出为DC帧内预测模式。也就是说,如果邻近块F或邻近块G不可用,如果未以帧内预测模式对邻近块F或邻近块G进行编译(如果邻近块F或邻近块G不是帧内编译块),或者如果邻近块F或邻近块G偏离当前编译树单元,则可以将邻近块F的帧内预测模式或邻近块G的帧内预测模式导出为DC帧内预测模式。

如果邻近块F的帧内预测模式或邻近块G的帧内预测模式被确定,则可以例如基于下表2来导出三个MPM候选。

[表2]

表2可以示例性地示出构建MPM列表的伪代码。

参照表2,可以确定邻近块F的帧内预测模式和邻近块G的帧内预测模式是否相同。

如果邻近块F的帧内预测模式和邻近块G的帧内预测模式相同,并且邻近块F的帧内预测模式的模式编号小于2,则可以将当前块的MPM列表导出为MPM列表1(MPM list1)。也就是说,如果邻近块F的帧内预测模式和邻近块G的帧内预测模式相同,并且邻近块F的帧内预测模式是编号0帧内预测模式或编号1帧内预测模式,则可以将当前块的MPM列表导出为MPM列表1。这里,所述MPM列表1可以是用MPM候选{F,F-1,F+1}构建的MPM列表。F可以指示邻近块F的帧内预测模式,并且F-1可以指示模式编号为通过将邻近块F的帧内预测模式的模式编号减去1所获得的值的帧内预测模式,以及F+1可以指示模式编号为通过将1加到邻近块F的帧内预测模式的模式编号所获得的值的帧内预测模式。例如,如果邻近块F的帧内预测模式是编号N帧内预测模式,则MPM列表1可以用包括编号N帧内预测模式、编号N-1帧内预测模式和编号N+1帧内预测模式作为MPM候选的MPM列表构建。

此外,如果邻近块F的帧内预测模式和邻近块G的帧内预测模式相同,并且邻近块F的帧内预测模式的模式编号不小于2,则可以将当前块的MPM列表导出为MPM列表2。

附加地,如果邻近块F的帧内预测模式和邻近块G的帧内预测模式不相同,并且邻近块F的帧内预测模式和邻近块G的帧内预测模式不是平面帧内预测模式,则可以将当前块的MPM列表导出为MPM列表3。

附加地,如果邻近块F的帧内预测模式和邻近块G的帧内预测模式不相同,并且邻近块F的帧内预测模式的模式编号与邻近块G的帧内预测模式的模式编号之和小于2,则可以将当前块的MPM列表导出为MPM列表4。

附加地,如果邻近块F的帧内预测模式和邻近块G的帧内预测模式不相同,并且邻近块F的帧内预测模式和邻近块G的帧内预测模式中的至少一个是平面帧内预测模式,并且邻近块F的帧内预测模式的模式编号与邻近块G的帧内预测模式的模式编号之和不小于2,则可以将当前块的MPM列表导出为MPM列表5。

同时,随着帧内预测模式的数目增加,MPM候选的数目需要增加。因此,MPM候选的数目可以根据帧内预测模式的数目而不同。一般而言,随着帧内预测模式的数目增加,MPM候选的数目可以增加。然而,并不总是随着帧内预测模式的数目增加MPM候选的数目增加这种情况。例如,当存在35种帧内预测模式时或者当存在67种帧内预测模式时,根据设计可以存在诸如3、4、5或6的各种数目的MPM候选。

例如,编码器/解码器可以构建包括6个MPM的MPM列表。为了构建MPM列表,可以考虑默认帧内模式、邻近帧内模式和导出的帧内模式。

在示例中,对于邻近帧内模式,可以考虑两个邻近块,即左邻近块A和上邻近块B。为了生成包括6个MPM的MPM列表,可以考虑基于下表3的初始化默认MPM列表。

[表3]

在另一示例中,构建六个MPM候选的次序可以是按邻近块D、邻近块B、平面帧内预测模式、DC帧内预测模式、邻近块E、邻近块C和邻近块A的次序。也就是说,邻近块D的帧内预测模式、邻近块B的帧内预测模式、平面帧内预测模式、DC帧内预测模式、邻近块E的帧内预测模式、邻近块C的帧内预测模式和块A的帧内预测模式可以按此次序被导出为MPM候选,而如果它与已经导出的帧内预测模式相同,则可以不将它导出为MPM候选。

附加地,当MPM列表不包括最大数目的MPM候选时,也就是说,当导出的MPM候选的数目小于候选的最大数目时,可以考虑与所导出的MPM候选相邻的定向帧内预测模式和预定义默认帧内预测模式作为MPM候选,并且可以一起执行修剪检查过程。这里,与MPM候选相邻的定向帧内预测模式可以指示模式编号与MPM候选的模式编号相邻的帧内预测模式。尽管上述邻近块搜索和连续修剪检查具有节省比特传输率的优点,但是它可能增加用于每个块的MPM列表构建的硬件操作周期的数目。最坏情况场景可能是3840x2160 4K图像被划分成4x4大小块以进行帧内预测,并且用于每个4x4大小块的增加的硬件操作周期可能被认为对吞吐量是重要的。另一方面,当通过当前块的帧间预测编译的邻近块知道邻近块的帧内预测模式时,可以使用邻近块的帧内预测模式来构建MPM列表。

如上所述,一般而言,要编译的当前块和邻近块可以具有类似的图像特性,并且因此,由于当前块和邻近块具有相同或类似的帧内预测模式的概率高,所以可以确定当前块的MPM列表以便导出应用于当前块的帧内预测模式。然而,如果67种帧内预测模式被用于帧内预测,则包括3个MPM候选的MPM列表可能不足以指示多种帧内预测模式的多样性。另外,包括邻近块搜索和修剪检查过程的构建6MPM列表的方法在复杂性和吞吐量方面可能是不利的。在本公开中,将稍后描述用于基于MPM预测来导出用于当前块的帧内预测模式的各种方法。

图8是用于说明根据另一实施方式的MPM列表的构建的图。

参照图8,在实施方式中,作为左邻近块(其可以被表示为LEFT)的A和作为上邻近块(其可以被表示为ABOVE)的B可以如在下表4中一样用于生成MPM列表。算法如下。非MPM编译可以基于截断二进制码。

[表4]

图9是示出根据实施方式的MPM预测方法的流程图。

在本公开中,特定术语或句子被用于定义特定信息或概念。例如,在亮度帧内编译过程中,在没有MPM索引信息的情况下能够被确定为用于当前块的帧内预测模式的特定帧内预测模式被称为“有效模式”,并且指示MPM列表中包括的MPM候选之一的索引被称为“MPM索引”,以及指示是否应用亮度帧内编译的标志被称为“统一MPM标志”,而当不应用MPM预测时,除了MPM候选之外的剩余帧内预测模式被称为“非MPM模式”。然而,“有效模式”可以用诸如significant_mode、默认模式、候选模式等的各种术语替换,并且“MPM索引”可以用probable_mode_index、mpm_idx、intra_luma_mpm_idx等替换,并且“统一MPM标志”可以用unified_probable_mode_flag、MPM标志、intra_luma_mpm_flag等替换,以及“非MPM模式”可以用诸如非MPM模式、non_probable_mode、剩余帧内预测模式和MPM剩余预测模式的各种术语替换。因此,当在整个说明书中解释用于在此定义特定信息或概念的特定术语或句子时,不应该做出限于名称的解释,而需要根据术语打算表达的内容来考虑到各种操作、功能和效果解释术语。

在一个示例中,有效模式可以是帧内平面(PLANAR)模式。

在实施方式中,可以执行统一亮度帧内编译和信令。在亮度帧内编译中,可以首先用信号通知至少一个有效亮度帧内模式,然后可以基于剩余帧内模式来构建MPM列表,使得可以从MPM列表中包括的MPM候选当中选择最佳模式。

首先,可以确定是否使用MRL或者ISP。当使用MRL或ISP时,可以将unified_probable_mode_flag的值确定为1。如果不使用MRL或ISP,则可以解析unified_probable_mode_flag。

如果unified_probable_mode_flag的值是0,则可以解析non_probable_mode_index。如果unified_probable_mode_flag的值是1,则可以解析significant_mode_flag。如果significant_mode_flag的值是1,则可以将用于当前块的帧内预测模式确定为有效模式(例如,帧内平面模式),而如果significant_mode_flag的值是0,则可以解析probable_mode_index。

图10是示出根据另一实施方式的MPM预测方法的流程图。

在图10中,基于一种统一方法(或算法),而不取决于是否基于MRL(多参考线)的帧内预测被应用或者基于ISP(帧内子分区)的预测被应用,执行的帧内预测被称为“统一亮度帧内模式编译”。然而,“统一亮度帧内模式编译”可以用诸如统一亮度帧内模式、统一帧内预测、统一MPM、统一MPM预测、unified_probable_mode、统一帧内编译、统一亮度帧内编译等的各种术语替换。

根据实施方式的用于导出统一亮度帧内模式的详细方法如下。

首先,可以解析unified_probable_mode_flag。如果unified_probable_mode_flag的值是0,则可以解析non_probable_mode_index,而如果它是1,则可以解析significant_mode_flag。如果significant_mode_flag的值是1,则可以将用于当前块的帧内预测模式确定为有效模式(例如,帧内平面模式),而如果significant_mode_flag的值是0,则可以解析probable_mode_index。

另选地,可以在下表5中示出根据实施方式的用于导出统一帧内亮度模式的特定方法。

[表5]

提出了根据实施方式的用于构建MPM列表的方法。可以构建k长度的MPM模式列表。在示例中,k可以是5,并且可以在构建5个不同的MPM列表时使用5个条件。图7的块B可以用A标记,而块D可以用L标记。例如,根据此实施方式的MPM列表构建方法可以如下表6所示。

[表6]

同时,实施方式不限于只有当其值为1的统一MPM标志被用信号通知时才执行统一亮度帧内编译。例如,根据实施方式的解码设备可以在不用信号通知统一MPM标志的情况下执行统一亮度帧内编译。

在实施方式中,统一帧内预测信令和帧内模式信令可以与MPM列表构建组合,并且可以构建非MPM列表。此实施方式可以基于下表7的编译单元语法。

[表7]

表7的编译单元语法可以基于例如下表8的语义。

[表8]

在示例中,以帧内预测模式编译的编译单元的解码过程可以基于下表9的算法(或规范)。

[表9]

在示例中,导出亮度帧内预测模式的过程可以基于下表10的算法(或规范)。

[表10]

在示例中,帧内块的解码过程可以基于下表11的算法(或规范)。

[表11]

在示例中,帧内样本预测可以基于下表12的算法(或规范)。

[表12]

在示例中,帧内平面模式、帧内DC模式等可以基于下表13的算法(或规范)。

[表13]

在示例中,缩放变换系数的变换过程可以基于下表14的算法(或规范)。

[表14]

在示例中,将ctxInc分配给包括上下文编译的bin的语法元素的示例可以基于下表15。

[表15]

实施方式提出了执行统一MPM预测的方法以及对关于相关帧内预测模式的信息进行编译和/或用信号通知的方法。另外,实施方式提出了导出变换核的方法。根据实施方式,表16至24中编写的编译单元语法可以被构建/编码并用信号通知给解码设备,并且解码设备可以基于编译单元语法和MPM列表来导出用于当前块(CU)的帧内预测模式。

例如,根据此实施方式,平面模式可以作为候选模式被包括在MPM列表中,并且如果MPM标志的值是1,则平面标志(intra_planar_flag)可以首先被用信号通知并且指示是否使用平面模式作为当前块的帧内预测模式。如果平面标志的值是0,则用信号通知MPM索引(intra_luma_mpm_idx),并且通过这个,可以指示除了平面模式之外的剩余MPM候选之一。在这种情况下,在示例中,可以将包括除了平面模式之外的剩余候选的MPM列表称为修改后的MPM列表。

如果包括平面模式的MPM候选的总数是6,则已从其中排除了平面模式的修改后的MPM列表中的候选的总数可以是5,并且在这种情况下,MPM索引的值可以介于0与4之间。换句话说,可以将MPM索引的最大值设置为4。在这种情况下,可以将MPM索引的最大值表达为MPM索引的cMAX。可以如将稍后在表16至24中描述的那样基于上下文模型对平面标志的bin进行常规(regular)编译,并且可以根据以下各项如将稍后在表16至24中描述的那样可变地确定用于指示上下文模型的ctxInc的值:i)使用仅一个特定值(例如,0),或者ii)能够基于左邻近块和/或上邻近块的可用性以及平面标志(若可用的话)的值可变地导出,或者iii)MRL或ISP是否被应用。另外,根据此实施方式,可以基于当前块的大小和/或帧内预测类型/模式来导出用于当前块的变换核(垂直变换核/水平变换核)。例如,如果ISP不被应用于当前块或者不可用,如将稍后在下表16至24中描述的那样,则可以通过进一步参照当前块的大小来将变换核(垂直变换核/水平变换核)导出为值1或0。

根据此实施方式,当应用MRL帧内预测时(也就是说,当MRL索引大于0时),可以对当前块应用平面模式或DC模式,并且即使当应用ISP帧内预测时,也可以对当前块应用平面模式或DC模式。因此,可以基于统一MPM预测,而不取决于MRL、ISP等是否被应用,来构建MPM列表。表16至24如下,并且本领域的技术人员将容易地理解表16至24的细节。

下表16示出编译单元语法的示例。

[表16]

表16的编译单元语法可以基于例如下表17的语义。

[表17]

在示例中,以帧内预测模式编译的编译单元的解码过程可以基于下表18的算法(或规范)。

[表18]

在示例中,导出亮度帧内预测模式的过程可以基于下表19的算法(或规范)。

[表19]

在示例中,帧内块的解码过程可以基于下表20的算法(或规范)。

[表20]

在示例中,帧内样本预测可以基于下表21的算法(或规范)。

[表21]

在示例中,帧内平面模式、帧内DC模式等可以基于下表22的算法(或规范)。

[表22]

在示例中,缩放变换系数的变换过程可以基于下表23的算法(或规范)。

[表23]

在示例中,将ctxInc分配给包括上下文编译的bin的语法元素的示例可以基于下表24。

[表24]

实施方式提出了执行统一MPM预测的方法以及对关于相关帧内预测模式的信息进行编译和/或用信号通知的方法。另外,实施方式提出了导出变换核的方法。根据实施方式,表16至24中编写的编译单元语法可以被构建/编码并用信号通知给解码设备,并且解码设备可以基于编译单元语法和MPM列表来导出用于当前块(CU)的帧内预测模式。

例如,根据此实施方式,平面模式可以作为候选模式被包括在MPM列表中,并且如果MPM标志的值是1,则平面标志(intra_planar_flag)可以首先被用信号通知并且指示是否使用平面模式作为当前块的帧内预测模式。如果平面标志的值是0,则用信号通知MPM索引(intra_luma_mpm_idx),并且通过这个,可以指示除了平面模式之外的剩余MPM候选之一。在这种情况下,在示例中,可以将包括除了平面模式之外的剩余候选的MPM列表称为修改后的MPM列表。

如果包括平面模式的MPM候选的总数是6,则已从其中排除了平面模式的修改后的MPM列表中的候选的总数可以是5,并且在这种情况下,MPM索引的值可以介于0与4之间。换句话说,可以将MPM索引的最大值设置为4。在这种情况下,可以将MPM索引的最大值表达为MPM索引的cMAX。可以如将稍后在表25至33中描述的那样基于上下文模型对平面标志的bin进行常规编译,并且可以根据以下各项如将稍后在表25至33中描述的那样可变地确定用于指示上下文模型的ctxInc的值:i)使用仅一个特定值(例如,0),或者ii)能够基于左邻近块和/或上邻近块的可用性以及平面标志(若可用的话)的值可变地导出,或者iii)MRL或ISP是否被应用。另外,根据此实施方式,可以基于当前块的大小和/或帧内预测类型/模式来导出用于当前块的变换核(垂直变换核/水平变换核)。例如,如果ISP不被应用于当前块或者不可用,如将稍后在下表25至33中描述的那样,则可以通过进一步参照当前块的大小来将变换核(垂直变换核/水平变换核)导出为值1或0。

根据此实施方式,可以基于统一MPM预测,而不取决于MRL、ISP等是否被应用,来构建MPM列表。表25至33如下,并且本领域的技术人员将容易地理解表25至33的细节。

下表25示出编译单元语法的示例。

[表25]

表25的编译单元语法可以基于例如下表26的语义。

[表26]

在示例中,在帧内预测模式下编译的编译单元的解码过程可以基于下表27的算法(或规范)。

[表27]

在示例中,导出亮度帧内预测模式的过程可以基于下表28的算法(或规范)。

[表28]

在示例中,帧内块的解码过程可以基于下表29的算法(或规范)。

[表29]

在示例中,帧内样本预测可以基于下表30的算法(或规范)。

[表30]

在示例中,帧内平面模式、帧内DC模式等可以基于下表31的算法(或规范)。

[表31]

在示例中,缩放变换系数的变换过程可以基于下表32的算法(或规范)。

[表32]

在示例中,将ctxInc分配给包括上下文编译的bins的语法元素的示例可以基于下表33。

[表33]

参照表25,能够基于intra_luma_ref_idx的值为0的检查结果来确认intra_planar_flag被检查。intra_luma_ref_idx可以指示多参考线(MRL)索引的示例,并且intra_planar_flag可以指示平面标志的示例。

参照表27,能够确认用于与intra_planar_flag关联的bin的上下文索引(ctxInc或ctxIdx)的值是0或1。也就是说,能够确认用于与intra_planar_flag关联的bin的上下文索引的值可以是两个不同的整数之一。

参照表33,能够确认用于与intra_planar_flag关联的bin的上下文索引基于intra_subpartitions_mode_flag的值。intra_subpartitions_mode_flag可以是与帧内子分区(ISP)模式是否被应用于当前块有关的ISP标志的示例。

图11是示出根据实施方式的编码设备的操作的流程图,并且图12是示出根据实施方式的编码设备的配置的框图。

根据图11和图12的编码设备可以执行与根据图13和图14的解码设备的操作对应的操作。因此,将稍后在图13和图14中描述的解码设备的操作可以被类似地应用于图11和图12的编码设备。

图11中公开的每个步骤可以由图2中公开的编码设备200执行。此外,根据S1100至S1120的操作基于上面在图4至图10中描述的一些内容。因此,将省略或简要地做出针对与上面在图2、图4至图10中描述的内容重复的特定内容的说明。

如图11所示,根据实施方式的编码设备可以包括预测器220和熵编码器240。然而,在一些情况下,图11所示的所有组件可能不是编码设备的必要组件,并且编码设备可以由比图11所示的组件更多或更少的组件来实现。

在根据实施方式的编码设备中,预测器220和熵编码器240可以由单独的芯片实现,或者至少两个或更多个组件可以由单个芯片实现。

根据实施方式的编码设备可以导出用于当前块的帧内预测模式(S1100)。更具体地,编码设备的预测器220可以导出用于当前块的帧内预测模式。

根据实施方式的编码设备可以基于帧内预测模式来生成与是否基于用于当前块的MPM候选来对帧内预测模式进行编码有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息、以及与所导出的用于当前块的帧内预测模式是否为平面模式有关的平面标志信息中的至少一种(S1110)。

例如,编码设备可以生成与是否基于用于当前块的MPM候选来对帧内预测模式进行编码有关的MPM标志信息,并且编码设备可以基于MPM标志信息指示MPM标志信息与用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息关联的情况来生成MRL索引信息,并且编码设备可以基于MRL索引信息的值为0的检查结果来生成与所导出的用于当前块的帧内预测模式是否为PLANAR模式有关的平面标志信息。

根据实施方式的编码设备可以对包括MPM标志信息、MRL索引信息和平面标志信息中的至少一种的图像信息进行编码(S1120)。更具体地,编码设备的熵编码器240可以对包括MPM标志信息、MRL索引信息和平面标志信息中的至少一种的图像信息进行编码。

根据实施方式的编码设备可以基于平面标志信息的值指示用于当前块的帧内预测模式不被导出为平面模式的情况,导出与已从其中排除了平面模式的用于当前块的MPM候选之一关联的MPM索引信息。

在实施方式中,已从其中排除了平面模式的用于当前块的MPM候选的数目可以是五。

在实施方式中,编码设备可以基于已从其中排除了平面模式的用于当前块的MPM候选并且基于MRL索引信息的值指示非零的情况来导出用于当前块的帧内预测模式。

在实施方式中,可以基于用于与平面标志信息关联的bin的上下文模型来导出平面标志信息的值,并且可以基于上下文索引增量(ctxInc)来导出用于与平面标志信息关联的bin的上下文模型,以及可以基于bin的bin索引为0的情况从两个候选中选择用于与平面标志信息关联的bin的上下文索引增量,并且这些候选可以包括0和1,并且用于上下文索引增量为0的情况的上下文模型可以不同于用于上下文索引增量为1的情况的上下文模型,并且用于与平面标志信息关联的bin的上下文索引增量的值可以是两个不同的整数之一,这两个不同的整数可以是0和1。

在实施方式中,用于与平面标志信息关联的bin的上下文索引增量的值可以基于ISP模式是否被应用于当前块。

在实施方式中,可以基于ISP模式被应用于当前块的确定将上下文索引增量的值确定为1,以及可以基于ISP模式不被应用于当前块的确定将上下文索引增量的值确定为0。

根据图11和图12的编码设备和编码设备的操作方法,编码设备可以:

导出用于当前块的帧内预测模式(S1100),基于帧内预测模式来生成与是否基于用于当前块的MPM候选来对帧内预测模式进行编码有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息、以及与所导出的用于当前块的帧内预测模式是否为平面(PLANAR)模式有关的平面标志信息中的至少一种(S1110),并且对包括MPM标志信息、MRL索引信息和平面标志信息中的至少一种的图像信息进行编码(S1120)。

也就是说,根据本公开,可以基于与是否将用于当前块的帧内预测模式确定为平面模式有关的平面标志信息来提高基于MPM列表的帧内预测的效率。另选地,根据本公开,可以通过基于MRL索引信息确定是否用信号通知平面标志信息来提高图像编译效率。另选地,根据本公开,可以高效地构建用于当前块的MPM列表。另选地,根据本公开,可以基于ISP模式是否被应用于当前块来确定用于与平面标志信息关联的bin的上下文索引的值。

图13是示出根据实施方式的解码设备的操作的流程图,并且图14是示出根据实施方式的解码设备的配置的框图。

图13中公开的每个步骤可以由图3中公开的解码设备300执行。因此,将省略或简要地做出对与上述内容重复的特定内容的说明。

如图14所示,根据实施方式的解码设备可以包括熵解码器310、预测器330和加法器340。然而,在一些情况下,图14所示的所有组件可能不是解码设备的必要组件,并且解码设备可以由比图14所示的组件更多或更少的组件来实现。

在根据实施方式的解码设备中,熵解码器310、预测器330和加法器340可以由单独的芯片实现,或者至少两个或更多个组件可以由单个芯片实现。

根据实施方式,解码设备可以从比特流获得帧内预测信息,该帧内预测信息包括与是否基于用于当前块的最可能模式(MPM)候选来导出用于当前块的帧内预测模式有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息、以及与是否将用于当前块的帧内预测模式确定为平面模式有关的平面(PLANAR)标志信息中的至少一种(S1300)。更具体地,解码设备的熵解码器310可以从比特流获得帧内预测信息,该帧内预测信息包括与是否基于用于当前块的MPM候选来导出用于当前块的帧内预测模式有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的多参考线(MRL)索引信息、以及与是否将用于当前块的帧内预测模式确定为平面模式有关的平面标志信息中的至少一种。

在示例中,可以将帧内预测信息包括在编译单元语法中。

在示例中,可以将MPM标志信息表示为intra_luma_mpm_flag;可以将MRL索引信息表示为intra_luma_ref_idx;并且可以将平面标志信息表示为intra_luma_not_planar_flag。当intra_luma_not_planar_flag的值为1时,可以将用于当前块的帧内预测模式确定为不是平面模式,而当intra_luma_not_planar_flag的值为0时,可以将用于当前块的帧内预测模式确定为平面模式。

在另一示例中,可以将平面标志信息表示为intra_luma_planar_flag或intra_planar_flag。当intra_luma_planar_flag的值为1时,可以将用于当前块的帧内预测模式确定为平面模式,而当intra_luma_planar_flag的值为0时,可以将用于当前块的帧内预测模式确定为不为平面模式。

根据实施方式的解码设备可以检查MPM标志信息(S1310)。更具体地,解码设备的熵解码器310可以检查MPM标志信息。换句话说,解码设备可以对MPM标志信息进行解码或解析。

根据实施方式的解码设备可以基于MPM标志信息指示对MRL索引信息的检查的情况来检查MRL索引信息(S1320)。更具体地,解码设备的熵解码器310可以基于MPM标志信息的值与对MRL索引信息的检查关联的检查结果来检查MRL索引信息。

在示例中,解码设备可以基于MPM标志信息的值为1的确定来确定MPM标志信息的值与检查MRL索引信息关联。也就是说,解码设备可以基于MPM标志信息的值为1的确定来检查MRL索引信息。

根据实施方式的解码设备可以基于MRL索引信息的值为0的情况来检查平面标志信息(S1330)。更具体地,解码设备的熵解码器310可以基于MRL索引信息的值为0的检查结果来检查平面标志信息。

在一个示例中,解码设备可以基于MRL索引信息的值为0的检查结果来确定多参考线(MRL)不被用于当前块的帧内预测。

根据实施方式的解码设备可以基于对平面标志信息的检查来导出用于当前块的帧内预测模式(S1340)。更具体地,解码设备的预测器330可以基于对平面标志信息的检查来导出用于当前块的帧内预测模式。

根据实施方式的解码设备可以基于用于当前块的帧内预测模式来导出当前块的预测样本(S1350)。更具体地,解码设备的预测器330可以基于用于当前块的帧内预测模式来导出当前块的预测样本。

根据实施方式的解码设备可以基于预测样本来生成重构图片(S1360)。更具体地,解码设备的加法器340可以基于预测样本来生成重构图片。

根据实施方式的解码设备在导出用于当前块的帧内预测模式时,可以基于平面标志信息指示用于当前块的帧内预测模式被导出为平面模式的情况来将用于当前块的帧内预测模式导出为平面模式。在示例中,解码设备可以基于intra_luma_not_planar_flag的值为0的检查结果来将用于当前块的帧内预测模式导出为平面模式。

在实施方式中,帧内预测信息还包括与已从其中排除了平面模式的用于当前块的MPM候选之一关联的MPM索引信息,并且根据实施方式的解码设备在导出用于当前块的帧内预测模式时,可以基于指示用于当前块的帧内预测模式不被导出为平面模式的情况来检查MPM索引信息,并且基于检查MPM索引信息的结果来导出用于当前块的帧内预测模式。在示例中,解码设备可以基于intra_luma_not_planar_flag的值为1的检查结果来检查MPM索引信息。

在实施方式中,已从其中排除了平面模式的用于当前块的MPM候选的数目可以是五。在示例中,MPM候选可以包括第一MPM候选至第五MPM候选。第一MPM候选可以与MPM索引0关联;第二MPM候选可以与MPM索引1关联;第三MPM候选可以与MPM索引2关联;并且第四MPM候选可以与MPM索引3关联。

根据实施方式的解码设备可以基于已从其中排除了平面模式的用于当前块的MPM候选并且基于MRL索引信息的值指示非零的情况来导出用于当前块的帧内预测模式。

在实施方式中,可以基于用于与平面标志信息关联的bin的上下文模型来导出平面标志信息的值,并且可以基于上下文索引增量(ctxInc)来导出用于与平面标志信息关联的bin的上下文模型,以及可以基于bin的bin索引为0的情况从两个候选中选择用于与平面标志信息关联的bin的上下文索引增量,并且这些候选可以包括0和1,并且用于上下文索引增量为0的情况的上下文模型可以不同于用于上下文索引增量为1的情况的上下文模型,并且用于与平面标志信息关联的bin的上下文索引增量的值可以是两个不同的整数之一。在示例中,用于与intra_luma_not_planar_flag关联的bin的上下文索引增量的值可以是两个不同的整数之一。这里,上下文索引增量可以意指ctxInc。

在实施方式中,两个不同的整数可以是0和1。也就是说,用于与平面标志信息关联的bin的上下文索引增量的值可以是0或1。

在实施方式中,用于与平面标志信息关联的bin的上下文索引增量的值可以基于帧内子分区(ISP)模式是否被应用于当前块。在示例中,用于与平面标志信息关联的bin的上下文索引增量的值可以基于与ISP模式是否被应用于当前块有关的ISP标志的值。可以将ISP标志例如表达为intra_subpartitions_mode_flag。

在实施方式中,可以将基于ISP模式被应用于当前块的确定将上下文索引增量的值确定为1,以及可以基于ISP模式不被应用于当前块的确定将上下文索引增量的值确定为0。在示例中,可以基于intra_subpartitions_mode_flag的值为1的确定将上下文索引增量的值确定为1,以及可以基于intra_subpartitions_mode_flag的值为0的确定将上下文索引增量的值确定为0。

根据图13和图14中公开的解码设备和解码设备的操作方法,解码设备可以从比特流获得帧内预测信息,该帧内预测信息包括与是否基于用于当前块的MPM候选来导出用于当前块的帧内预测模式有关的MPM标志信息、用于当前块的帧内预测的至少一个参考样本线的MRL索引信息、以及与是否将用于当前块的帧内预测模式确定为平面模式有关的平面(PLANAR)标志信息中的至少一种(S1300),检查MPM标志信息(S1310),基于MPM标志信息的值指示对MRL索引信息的检查的情况来检查MRL索引信息信息(S1320),基于MRL索引信息的值为0的情况来检查平面标志信息(S1330),基于对平面标志信息的检查来导出用于当前块的帧内预测模式(S1340),基于用于当前块的帧内预测模式来导出当前块的预测样本(S1350),并且基于预测样本来生成重构图片(S1360)。

也就是说,根据本公开,可以基于与是否将用于当前块的帧内预测模式确定为平面模式有关的平面标志信息来提高基于MPM列表的帧内预测的效率。另选地,根据本公开,可以通过基于MRL索引信息确定是否用信号通知平面标志信息来提高图像编译效率。另选地,根据本公开,可以高效地构建用于当前块的MPM列表。另选地,根据本公开,可以基于ISP模式是否被应用于当前块来确定用于与平面标志信息关联的bin的上下文索引的值。

尽管已经在上述实施方式中基于按顺序列举步骤和框的流程图描述了方法,但是本公开的步骤不限于某个次序,并且可在不同的步骤中或者按与上述步骤不同的次序或同时地执行某个步骤。此外,本领域的普通技术人员应理解,流程图的步骤不是排他性的,并且可在其中包括另一步骤,或者在不影响本公开的范围的情况下,可删除流程图的一个或更多个步骤。

根据本公开的前述方法可具有软件的形式,并且可将根据本公开的编码设备和/或解码设备包括在用于执行图像处理的装置如TV、计算机、智能电话、机顶盒和显示装置等中。

当实施方式在本公开中用软件加以实现时,前述方法可使用执行前述功能的模块(过程、功能等)来实现。模块可被存储在存储器中并由处理器执行。存储器可被设置在处理器内部或外部并且使用各种公知手段连接到处理器。处理器可包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可包括只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器、存储卡、存储介质和/或其它存储装置。也就是说,可在处理器、微处理器、控制器或芯片上实现并执行本文描述的实施方式。例如,可在计算机、处理器、微处理器、控制器或芯片上实现并执行各个附图中示出的功能单元。在这种情况下,可在数字存储介质中存储用于实现方式的信息(例如,关于指令的信息)或算法。

此外,应用本公开的解码设备和编码设备可被包括在以下各项中:多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置以及诸如视频通信的实时通信装置、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供商、过顶(OTT)视频装置、互联网流服务提供商、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车辆终端(例如,车辆(包括自主车辆)终端、飞机终端或船舶终端)和医疗视频装置等,并且可用于处理图像信号或数据。例如,OTT视频装置可包括游戏机、蓝光播放器、连接互联网的TV、家庭影院系统、智能电话、平板PC和数字录像机(DVR)等。

此外,应用本公开的处理方法可被以由计算机执行的程序的形式产生并且可被存储在计算机可读记录介质中。也可将具有根据本公开的数据结构的多媒体数据存储在计算机可读记录介质中。计算机可读记录介质包括在其中存储计算机可读数据的所有种类的存储装置和分布式存储装置。计算机可读记录介质可包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质也包括以载波(例如,通过互联网的传输)的形式体现的介质。此外,通过编码方法生成的比特流可被存储在计算机可读记录介质中或者通过有线或无线通信网络来发送。

另外,可将本公开的实施方式体现为基于程序代码的计算机程序产品,并且可在根据本公开的实施方式的计算机上执行程序代码。可将程序代码存储在计算机可读载体上。

图15表示可以应用本文的公开内容的内容流系统的示例。

参照图15,应用本公开的实施方式的内容流系统可以通常包括编码服务器、流服务器、网络服务器、媒体存储装置、用户装置和多媒体输入装置。

编码服务器用来将从多媒体输入设备如智能电话、照相机、摄像机等输入的内容压缩为数字数据,以生成比特流,并且以将其发送到流服务器。作为另一示例,在诸如智能电话、相机、摄像机等的多媒体输入装置直接生成比特流的情况下,可省略编码服务器。

可通过应用本公开的实施方式的编码方法或比特流生成方法来生成比特流。并且流服务器可在发送或接收比特流的过程中暂时存储比特流。

流服务器基于用户的请求通过网络服务器向用户设备发送多媒体数据,该网络服务器充当向用户通知存在什么服务的工具。当用户请求用户想要的服务时,网络服务器将请求转移至流服务器,并且流服务器将多媒体数据发送到用户。在这方面,内容流系统可包括单独的控制服务器,并且在这种情况下,控制服务器用来控制内容流系统中的各个设备之间的命令/响应。

流服务器可从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收到内容的情况下,可实时地接收内容。在这种情况下,流服务器可将比特流存储预定时间段以流畅地提供流服务。

例如,用户设备可包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超极本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。

可将内容流系统中的每个服务器作为分布式服务器操作,并且在这种情况下,可以分布式方式处理由每个服务器接收的数据。

87页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:视频增强的方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类