图像处理装置和图像处理方法

文档序号:24529 发布日期:2021-09-21 浏览:28次 >En<

阅读说明:本技术 图像处理装置和图像处理方法 (Image processing apparatus, image processing method, and program ) 是由 金钟大 于 2019-12-06 设计创作,主要内容包括:线缓冲器数目计算单元38基于等级信息和输入图像信息来计算线缓冲器数目。例如,线缓冲器数目计算单元38通过使用基于与由等级信息指示的等级对应的最大画面内像素数目计算出的最大画面水平大小以及由输入图像信息指示的输入图像水平大小二者来计算线缓冲器数目。帧内预测单元41通过使用由线缓冲器数目计算单元38计算出的线缓冲器数目的线缓冲器来执行帧内预测处理。当输入图像的水平大小相对于指示吞吐量的等级小时,可以通过使用存储在线缓冲器数目的线缓冲器中的参考图像来执行帧内预测,从而可以通过对线缓冲器的有效使用来提高编码效率。(The line buffer number calculation unit 38 calculates the number of line buffers based on the gradation information and the input image information. For example, the line buffer number calculation unit 38 calculates the line buffer number by using both the maximum in-screen pixel number calculated based on the maximum in-screen pixel number corresponding to the level indicated by the level information and the input image horizontal size indicated by the input image information. The intra prediction unit 41 performs the intra prediction process by using the line buffers of the line buffer number calculated by the line buffer number calculation unit 38. When the horizontal size of the input image is small with respect to the level indicating the throughput, the intra prediction can be performed by using the reference image stored in the line buffer of the number of line buffers, so that the encoding efficiency can be improved by the efficient use of the line buffer.)

图像处理装置和图像处理方法

技术领域

本技术涉及图像处理装置和图像处理方法,并且能够提高编码效率。

背景技术

国际电信联盟电信标准化部门(ITU-T)一直在正在开发下一代视频编码的联合视频探索小组(JVET)中提出各种视频编码。

在视频编码中,在帧内预测中,通过利用同一帧中的相邻块之间的相关性来减少像素信息的代码量。例如,在H.264/AVC中,除了平面预测和DC预测之外,可以选择与九个预测方向对应的方向预测作为帧内预测模式。此外,在H.265/HEVC中,除了平面预测和DC预测之外,可以选择与33个预测方向对应的角度预测作为帧内预测模式。

此外,如非专利文献1所示,在被称为通用视频编码(VVC)的图像编码方法的标准化中,已经提出了使用围绕编码目标块的多条线的帧内预测(多条参考线帧内预测)。此外,非专利文献2提出了在编码树单元(CTU)边界处不使用多条线的限制。

引用列表

非专利文件

非专利文件1:B.Bross,J.Chen、S.Liu,“Versatile Video Coding(Draft 3)”,文献JVET-L1001,第12届JVET会议:中国澳门,2018年10月3日至12日。

非专利文献2:B.Bross,L.Zhao,Y.J.Chang,P.H.Lin,“CE3:Multiple referenceline intra prediction”,文献JVET-L0283,第十二届JVET会议:中国澳门,2018年10月3日至12日。

发明内容

本发明要解决的问题

同时,如非专利文献2所示,通过设置在编码树单元(CTU)边界处不使用多条线的限制,可以抑制在最大图像帧处使用线缓冲器。然而,当不是最大图像帧时,线缓冲器的资源不能用尽,并且线缓冲器不能被有效地使用。

因此,本技术的目的是提供能够提高编码效率的图像处理装置和图像处理方法。

问题的解决方案

本技术的第一方面是图像处理装置,该图像处理装置包括:

线缓冲器数目计算单元,被配置成基于等级信息和输入图像信息来计算线缓冲器数目;以及

帧内预测单元,被配置成通过使用由线缓冲器数目计算单元计算出的线缓冲器数目的线缓冲器来执行帧内预测处理。

在本技术中,线缓冲器数目计算单元基于等级信息和输入图像信息来计算线缓冲器数目。例如,线缓冲器数目计算单元可以通过使用基于与由等级信息指示的等级对应的最大画面内像素数目计算出的最大画面水平大小并且使用由输入图像信息指示的输入图像水平大小来计算线缓冲器数目,并且可以通过使用预先存储的最大画面水平大小代替输入图像信息来计算线缓冲器数目。

帧内预测单元通过使用由线缓冲器数目计算单元计算出的线缓冲器数目的线缓冲器来执行帧内预测处理。通过使用该帧内预测单元的预测结果,生成编码流,并且该编码流包括等级信息和输入图像信息。此外,编码流可以包括识别信息,该识别信息使得能够识别是使用计算出的线缓冲器数目的线缓冲器进行帧内预测处理还是使用一条线的线缓冲器进行帧内预测处理。此外,在帧内预测单元在分量间线性模型预测中对亮度分量执行下采样处理的情况下,可以采用根据由线缓冲器数目计算单元计算出的线缓冲器数目的滤波器抽头数目。

此外,对于图块划分,可以由线缓冲器数目计算单元通过使用图块水平大小来计算线缓冲器数目。此外,被配置成对解码图像数据执行去块滤波处理的去块滤波器可以通过使用由线缓冲器数目计算单元计算出的线缓冲器数目,利用根据计算出的线缓冲器数目的滤波器抽头数目来执行去块滤波处理。

在对输入图像进行编码时,当帧内预测单元对CTU边界处的线执行帧内预测时,帧内预测单元使用保存在计算出的线缓冲器数目的线缓冲器中的解码图像数据来确定最佳帧内预测模式。此外,在对编码流进行解码时,帧内预测单元使用保存在计算出的线缓冲器数目的线缓冲器中的解码图像数据,以由编码流指示的最佳帧内预测模式来生成预测图像。

本技术的第二方面是一种图像处理方法,该图像处理方法包括:

由线缓冲器数目计算单元基于等级信息和输入图像信息来计算线缓冲器数目;以及

由帧内预测单元通过使用由线缓冲器数目计算单元计算出的线缓冲器数目的线缓冲器来执行帧内预测处理。

附图说明

图1是示出亮度分量的亮度参考像素线索引与参考像素线之间的关系的图。

图2是示出图像编码装置的配置的图。

图3是示出帧内预测单元的配置的图。

图4是示出帧内模式搜索单元的配置的图。

图5是示出预测图像生成单元的配置的图。

图6是示出图像编码装置的编码处理操作的流程图。

图7是示出帧内预测处理的流程图。

图8是示出线缓冲器数目计算单元的第一操作的流程图。

图9是示出等级(Level)与最大亮度图片大小(MaxLumaPs)之间的关系的图。

图10是示出等级与最大画面水平大小(max_pic_width)之间的关系的图。

图11是示出输入图像与帧内预测线缓冲器数目之间的关系的图。

图12是示出可以用于帧内预测的线缓冲器的图。

图13是示出帧内预测中的参考像素线的图。

图14是示出编码单元的语法的图。

图15是示出等级与最大水平大小(MaxW)之间的关系的图。

图16是示出可以用于帧内预测的线缓冲器的图。

图17是示出序列参数集的语法的一部分的图。

图18是示出亮度分量(Luma)和对应的色差分量(Chroma)的图。

图19是示出下采样方法的图。

图20是示出在水平方向上对三个抽头执行滤波以计算预测值的情况的图,该预测值是在与色差分量共用的像素位置处的亮度分量。

图21是示出最大线缓冲器数目(MaxLumaRefNum)为2或更大的情况的图。

图22是示出图像解码装置的配置的图。

图23是示出图像解码装置的操作的流程图。

图24是示出图像编码装置的操作的流程图。

图25是示出编码单元的语法的图。

图26是示出图像解码装置的操作的流程图。

具体实施方式

<支持技术内容和技术术语的文献等>

本技术中公开的范围不仅包括在实施方式中描述的内容,而且包括在提交申请时已知的以下非专利文献中描述的内容。

非专利文件3:Jiante chen,Elena Alshina,Gary J.Sullivan,Jens-Rainer,JillBoyce,“Algorithm Description of Joint Exploration Test Model 4”,JVET-G1001_v1,ITU-T SG 16WP 3的联合视频探索小组(JVET)以及ISO/IEC JTC 1/SC 29/WG 11第七次会议:都灵,IT,2017年7月13日至21日。

非专利文件4:ITU(国际电信联盟)的电信标准化部门,“High efficiency videocoding”,H.265,2016年12月。

非专利文件5:ITU(国际电信联盟)的电信标准化部门,“Advanced video codingfor generic audiovisual services”,H.264,2017年4月

即,非专利文献1至5中描述的内容也是用于确定支持要求的基础。此外,类似地,例如,诸如解析、语法和语义之类的技术术语也将在本技术的公开范围内并且满足权利要求书的支持要求,即使在实施方式中没有对其的直接描述的情况下也是如此。

<术语>

在本申请中,以下术语定义如下。

<块>

除非另外说明,否则用于描述为图像(图片)的局部区域或处理单元的“块”(不是指示处理部分的块)指示图片中的任何局部区域,并且大小、形状、特性等不受限制。例如,“块”将包括任何局部区域(处理单元),例如变换块(TB)、变换单元(TU)、预测块(PB)、预测单元(PU)、最小编码单元(SCU)、编码单元(CU)、最大编码单元(LCU)、编码树块(CTB)、编码树单元(CTU)、变换块、子块、宏块、图块或切片。

<块大小的说明>

此外,在指定这种块的大小时,除了直接指定块大小之外,还可以间接地指定块大小。例如,可以使用用于识别大小的识别信息来指定块大小。此外,例如,可以通过与参考块(例如,LCU、SCU等)的大小的比率或者差来指定块大小。例如,在将用于指定块大小的信息作为语法元素等进行发送的情况下,可以使用如上所述的用于间接指定大小的信息作为该信息。如此,可以减少信息的信息量,并且在某些情况下还可以提高编码效率。此外,块大小的指定还包括块大小的范围的指定(例如,可允许块大小的范围的指定等)。

<信息/处理的单元>

可以单独采用设置了各种类型的信息的任何数据单元以及各种处理所针对的任何数据单元。例如,可以分别针对每个变换单元(TU)、变换块(TB)、预测单元(PU)、预测块(PB)、编码单元(CU)、最大编码单元(LCU)、子块、块、图块、切片、图片、序列或分量设置信息和处理,或者可以针对这些数据单元的数据设置信息和处理。当然,可以针对每条信息和处理设置该数据单元,并且不必统一所有信息和处理的数据单元。注意,这些信息可以被存储在任何位置,并且可以被存储在上述数据单元的报头、参数集等中。此外,这些信息可以被存储在多个位置。

<控制信息>

与本技术相关的控制信息可以从编码侧发送到解码侧。例如,可以发送与编码性能相关的等级信息、与输入图像相关的输入图像信息、块大小(上限和下限或者上限下限两者)以及指定帧、分量、层的信息等作为控制信息。

<标志>

注意,在本说明书中,“标志”是用于识别多个状态的信息,并且不仅包括用于识别真(1)或假(0)两个状态的信息,而且还包括能够识别三个或更多个状态的信息。因此,“标志”可以采用的值例如可以是1/0的二进制值,或者可以是三进制值或更多进制的值。即,“标志”中包括的位数可以是任意数,并且可以是1位或多个位。此外,对于识别信息(包括标志),除了在比特流中包括识别信息的形式之外,还假设在比特流中包括相对于特定参考信息的识别信息的差异信息的形式。因此,在本说明书中,“标志”和“识别信息”不仅包括其信息,而且还包括相对于参考信息的差异信息。

<相关联的元数据>

此外,与编码数据(比特流)相关的各种类型的信息(例如元数据)可以以任何形式发送或记录,只要该信息与编码数据相关联即可。这里,术语“相关联”是指,例如当处理一个数据时,允许使用(链接)其他数据。即,彼此相关联的数据可以被组合为一个数据或者可以是单独的数据。例如,可以在与编码数据(图像)不同的传输线上传输与编码数据(图像)相关联的信息。此外,例如,与编码数据(图像)相关联的信息可以被记录在与编码数据(图像)不同的记录介质(或同一记录介质的另一记录区域)上。请注意,该“相关联”可以针对数据的一部分,而不是整个数据。例如,图像与同该图像对应的信息可以以诸如多个帧、一个帧或者帧内的一部分之类的任何单元彼此相关联。

注意,在本说明书中,诸如“包括”的术语是指将多个事物组合为一个,例如,将编码数据和元数据组合为一个数据,并且是指上述“相关联”的一种方法。此外,在本说明书中,编码不仅包括将图像转换为比特流的整个处理,而且还包括该处理的一部分。例如,除了包括预测处理、正交变换、量化、算术编码等的处理之外,还包括:统称为量化和算术编码的处理;包括预测处理、量化和算术编码的处理等。类似地,解码不仅包括将比特流转换为图像的整个处理,而且还包括该处理的一部分。例如,除了包括逆算数解码、逆量化、逆正交变换、预测处理等的处理之外,还包括:包括逆算数解码和逆量化的处理;包括逆算数解码、逆量化和预测处理等的处理。

<关于当前技术>

在下文中,将描述用于实现本技术的实施方式。注意,将按以下顺序给出描述。

1.关于可以使用多条线的帧内预测

2.关于图像编码处理

2-1.图像编码装置的配置

2-2.图像编码装置的操作

2-2-1.线缓冲器数目计算单元的第一操作

2-2-2.线缓冲器数目计算单元的第二操作

2-2-3.帧内预测单元的其他操作

2-2-4.去块滤波处理操作

2-2-5.图块划分时的操作

3.关于图像解码处理

3-1.图像解码装置的配置

3-2.图像解码装置的操作

4.图像处理装置的其他操作

5.应用示例

<1.关于可以使用多条线的帧内预测>

在可以使用多条线的帧内预测中,指示参考像素线的索引(参考线索引)用于确定多条线中的哪条线用于帧内预测。图1示出了亮度分量的亮度参考像素线索引与参考像素线之间的关系。当亮度参考像素线索引(intra_luma_ref_idx[x0][y0])为“1”时,相邻线(IntraLumaRefLineIdx[x0][y0]=1)将成为用于方向预测的参考像素线。当亮度参考像素线索引(intra_luma_ref_idx[x0][y0])为“2”时,从边界起的第三条线(IntraLumaRefLineIdx[x0][y0]=3)将成为用于方向预测的参考像素线。此外,当亮度参考像素线索引(intra_luma_ref_idx[x0][y0])不为“0”时,限制了不使用平面预测和DC预测。在这种可以使用多条线的帧内预测中,本技术有效地利用线缓冲器的资源来提高编码效率。

<2.关于图像编码>

接下来,给出对本技术的图像处理装置执行输入图像的编码处理以生成编码流的情况的描述。

<2-1.图像编码装置的配置>

图2示出了使用多条线进行帧内预测的图像编码装置的配置。图像编码装置10包括画面重排缓冲器21、算术单元22、正交变换单元23、量化单元24、可逆编码单元25、累积缓冲器26和速率控制单元27。此外,编码装置10具有逆量化单元31、逆正交变换单元32、算术单元33、去块滤波器34、样本自适应偏移(SAO)滤波器35、帧存储器36和选择单元37。此外,图像编码装置10包括线缓冲器数目计算单元38、帧内预测单元41、帧间预测单元42和预测选择单元43。

输入图像被输入到画面重排缓冲器21。画面重排缓冲器21根据图片组(GOP)结构存储输入图像并且将以显示顺序存储的帧图像重排为用于编码的顺序(编码顺序)。画面重排缓冲器21以编码顺序将帧图像的图像数据(原始图像数据)输出到算术单元22。此外,画面重排缓冲器21将原始图像数据输出到SAO滤波器35、帧内预测单元41和帧间预测单元42。

算术单元22针对每个像素从画面重排缓冲器21提供的原始图像数据中减去经由预测选择单元43从帧内预测单元41或帧间预测单元42提供的预测图像数据,并且将指示预测残差的残差数据输出到正交变换单元23。

例如,在要对图像进行帧内编码的情况下,算术单元22从原始图像数据中减去由帧内预测单元41生成的预测图像数据。此外,例如,在要对图像进行帧间编码的情况下,算术单元22从原始图像数据中减去由帧间预测单元42生成的预测图像数据。

正交变换单元23对从运算单元22提供的残差数据执行正交变换处理。例如,正交变换单元23针对每个编码树单元(CTU)中设置的一个或更多个TU中的每一个执行正交变换,例如离散余弦变换、离散正弦变换或Karhunen-Loeve变换。正交变换单元23将通过执行正交变换处理获得的频域的变换系数输出到量化单元24。

量化单元24对正交变换单元23输出的变换系数进行量化。量化单元24将变换系数的量化数据输出到可逆编码单元25。此外,量化单元24将生成的量化数据输出到逆量化单元31。

可逆编码单元25针对每个CTU对从量化单元24输入的量化数据执行可逆编码处理。此外,可逆编码单元25获取关于由预测选择单元43选择的预测模式的信息,例如,帧内预测信息和帧间预测信息。此外,可逆编码单元25从稍后描述的SAO滤波器35获取与滤波处理相关的滤波器信息。此外,可逆编码单元25获取指示应该如何在图像中设置CTU、CU、TU和PU的块信息。可逆编码单元25对量化数据进行编码,并且还将所获取的与编码处理相关的参数信息作为H.265/HEVC标准的语法元素作为编码流的报头信息的一部分累积在累积缓冲器26中。此外,可逆编码单元25将输入到图像编码装置10的控制信息(例如,稍后描述的等级信息和输入图像信息)包括在编码流中作为编码流的语法元素。

累积缓冲器26临时保存从可逆编码单元25提供的数据,并且在预定定时处作为编码流输出到后一级的记录装置(未示出)或传输线作为已编码的编码图像。

速率控制单元27基于累积在累积缓冲器26中的压缩图像来控制量化单元24的量化操作的速率,以免导致上溢或下溢。

逆量化单元31以与由量化单元24执行的量化对应的方法对从量化单元24提供的变换系数的量化数据进行逆量化。逆量化单元31将获得的逆量化数据输出到逆正交变换单元32。

逆正交变换单元32通过与由正交变换单元23执行的正交变换处理对应的方法对提供的逆量化数据执行逆正交变换。逆正交变换单元32将逆正交变换结果即所恢复的残差数据送输出到算术单元33。

算术单元33将经由预测选择单元43从帧内预测单元41或帧间预测单元42提供的预测图像数据加到从逆正交变换单元32提供的残差数据中,以获得局部解码图像(解码图像)。例如,在残差数据对应于要进行帧内编码的图像的情况下,算术单元33将从帧内预测单元41提供的预测图像数据加到残差数据。此外,例如,在残差数据对应于要进行帧间编码的图像的情况下,算术单元33将从帧间预测单元42提供的预测图像数据加到残差数据。作为相加结果的解码图像数据被输出到去块滤波器34。此外,解码图像数据被输出到帧存储器36。

去块滤波器34通过适当地执行去块滤波处理来去除解码图像数据的块失真。去块滤波器34将滤波处理结果输出到SAO滤波器35。

SAO滤波器35对由去块滤波器34滤波的解码图像数据执行自适应偏移滤波处理(也称为样本自适应偏移(SAO)处理)。SAO滤波器35将经过SAO处理的图像输出到帧存储器36。

累积在帧存储器36中的解码图像数据在预定定时处经由选择单元37被输出到帧内预测单元41或帧间预测单元42。例如,在要对图像进行帧内编码的情况下,未经过去块滤波器34等的滤波处理的解码图像数据从帧存储器36被读取并且经由选择单元37被输出到帧内预测单元41。此外,例如,在执行帧间编码的情况下,已经由去块滤波器34等进行了滤波处理的解码图像数据被从帧存储器36中读取,并且经由选择单元37输出到帧间预测单元42。

线缓冲器数目计算单元38基于输入的控制信息或者基于控制信息和预先存储的信息计算用于帧内预测的最大线缓冲器数目(MaxLumaRefNum),并且输出到帧内预测单元41。此外,线缓冲器数目计算单元38可以计算所计算的最大线缓冲器数目(MaxLineBufNum),并且输出到去块滤波器34。

帧内预测单元41通过使用最大线缓冲器数目(MaxLumaRefNum)的线缓冲器基于预定的帧内预测模式表来执行帧内预测。图3示出了帧内预测单元的配置。帧内预测单元41具有帧内模式搜索单元411和预测图像生成单元412。

帧内模式搜索单元411搜索最佳帧内模式。图4示出了帧内模式搜索单元的配置。帧内模式搜索单元具有控制单元4111、缓冲器处理单元4112、预测处理单元4113和模式确定单元4114。

控制单元4111基于由线缓冲器数目计算单元38计算的最大线缓冲器数目MaxLumaRefNum来设置帧内预测的搜索范围。例如,在最大线缓冲器数目MaxLumaRefNum为“1”的情况下,搜索范围被设置为相邻线。在最大线缓冲器数目MaxLumaRefNum为“2”的情况下,搜索范围被设置为与相邻线隔开一条线的线。控制单元4111将搜索范围输出到预测处理单元4113。

缓冲器处理单元4112通过使用由线缓冲器数目计算单元38计算出的最大线缓冲器数目的线缓冲器来保存从画面重排缓冲器21提供的原始图像数据,并且将所保存的图像数据输出到预测处理单元4113作为用于帧内预测的参考图像数据。

预测处理单元4113使用从画面重排缓冲器21提供的原始图像数据以及从缓冲器处理单元4112提供的参考图像数据来针对由控制单元4111指示的搜索范围计算每种预测模式的成本函数值。控制单元4111将计算出的每种预测模式的成本函数值输出到模式确定单元4114。

根据每个预测模式的成本函数值,模式确定单元4114将预测块大小与成本函数值最小(即压缩率最高的帧内预测模式)的预测模式的组合设置为最佳预测模式。模式确定单元4114将指示最佳预测模式的模式确定结果输出到预测图像生成单元412。

预测图像生成单元412使用由帧内模式搜索单元411的模式确定单元4114确定的最佳预测模式以及经由选择单元37从帧存储器36读取的解码图像数据来生成预测图像。

图5示出了预测图像生成单元的配置。预测图像生成单元412具有缓冲器处理单元4121和图像生成处理单元4122。

缓冲器处理单元4121通过使用由线缓冲器数目计算单元38计算出的最大线缓冲器数目的线缓冲器来保存从帧存储器36提供的解码图像数据,并且将所保存的解码图像数据输出到图像生成处理单元4122作为用于帧内预测的参考图像数据。

图像生成处理单元4122使用从帧存储器36提供的解码图像数据以及从缓冲器处理单元4121提供的参考图像数据,以由帧内模式搜索单元411确定的最佳预测模式来生成预测图像,并且将生成的预测图像连同最佳预测模式的成本函数值一起输出到预测选择单元43。

返回图2,帧间预测单元42基于原始图像数据和解码图像数据对在每个CTU中设置的一个或更多个PU中的每一个执行帧间预测处理(运动检测和运动补偿)。例如,帧间预测单元42针对包括在搜索范围中的每个预测模式候选,基于预测误差和生成代码量来评估成本函数值。此外,帧间预测单元42选择成本函数值最小的预测模式(即压缩比最高的预测模式)作为最佳帧间预测模式。此外,帧间预测单元42生成帧间预测信息,该帧间预测信息包括具有最小成本函数值的差向量、指示预测运动向量的运动信息等。帧间预测单元42将使用最佳帧间预测模式和最佳预测块、成本函数值和帧间预测信息生成的预测图像数据输出到预测选择单元43。

预测选择单元43基于从帧内预测单元41与帧间预测单元42输入的成本函数值的比较,针对每个CTU、CU等设置预测模式。对于已经设置了帧内预测模式的块,预测选择单元43将由帧内预测单元41生成的预测图像数据输出到算术单元22和33,并且将帧内预测信息输出到可逆编码单元25。此外,对于已经设置了帧间预测模式的块,预测选择单元43将由帧间预测单元42生成的预测图像数据输出到算术单元22和33,并且将帧间预测信息输出到可逆编码单元25。

<2-2.图像编码装置的操作>

接下来,将描述编码处理操作。图6是示出图像编码装置的编码处理操作的流程图。

在步骤ST1中,图像编码装置执行线缓冲器数目计算处理。图像编码装置10的线缓冲器数目计算单元38基于输入的控制信息或者基于控制信息和预先存储的信息计算用于帧内预测的最大线缓冲器数目MaxLumaRefNum。

在步骤ST2中,图像编码装置执行画面重排处理。图像编码装置10的画面重排缓冲器21将显示顺序的输入图像重排为编码顺序,并且输出到帧内预测单元41、帧间预测单元42和SAO滤波器35。

在步骤ST3中,图像编码装置执行帧内预测处理。图7是示出帧内预测处理的流程图。在步骤ST21中,帧内预测单元获取最大线缓冲器数目。图像编码装置10的帧内预测单元41获取由线缓冲器数目计算单元38计算出的最大线缓冲器数目MaxLumaRefNum。

在步骤ST22中,帧内预测单元确定最佳预测模式。帧内预测单元41基于在步骤ST21中获取的最大线缓冲器数目MaxLumaRefNum来设置帧内预测的搜索范围,使用保存在最大线缓冲器数目的线缓冲器中的原始图像数据和参考图像数据来计算每个预测模式的成本函数值,并且确定成本函数值最小的最佳预测模式。

在步骤ST23中,帧内预测单元生成预测图像。帧内预测单元41通过使用在步骤ST22中确定的最佳预测模式和解码图像数据来生成预测图像数据。此外,帧内预测单元41将在最佳帧内预测模式下生成的预测图像数据、成本函数值和帧内预测信息输出到预测选择单元43。

返回图6,在步骤ST4中,图像编码装置执行帧间预测处理。帧间预测单元42获取根据当前图片的参考图片,并且对所有预测模式执行运动搜索以确定当前图片的当前预测块对应于参考图片的哪个区域。此外,帧间预测单元42执行最佳帧间预测模式选择处理,并且将针对每种预测模式计算的成本函数值进行比较,以选择例如成本函数值最小的预测模式作为最佳帧间预测模式。帧间预测单元42在所选择的最佳帧间预测模式下执行运动补偿,并且生成预测图像数据。此外,帧间预测单元42将在最佳帧间预测模式下生成的预测图像数据、成本函数值和帧间预测信息输出到预测选择单元43。

在步骤ST5中,图像编码装置执行预测图像选择处理。图像编码装置10的预测选择单元43基于在步骤ST3和ST4中计算出的成本函数值,将最佳帧内预测模式和最佳帧间预测模式之一确定为最佳预测模式。然后,预测选择单元43选择所确定的最佳预测模式的预测图像数据,并且输出到算术单元22和33。注意,该预测图像数据用于稍后描述的步骤ST6和ST11的算术运算。此外,预测选择单元43将最佳预测模式的帧内预测信息或帧间预测信息输出到可逆编码单元25。

在步骤ST6中,图像编码装置执行差分算术处理。图像编码装置10的运算单元22计算在步骤ST2中重排的原始图像数据与在步骤ST5中选择的预测图像数据之间的差,并且将作为差分结果的残差数据输出到正交变换单元23。

在步骤ST7中,图像编码装置执行正交变换处理。图像编码装置10的正交变换单元23对从算术单元22提供的残差数据进行正交变换。具体地,执行诸如离散余弦变换的正交变换,并且将获得的变换系数输出到量化单元24。

在步骤ST8中,图像编码装置执行量化处理。图像编码装置10的量化单元24对从正交变换单元23提供的变换系数进行量化。在该量化中,如稍后描述的步骤ST17的处理中所描述的那样控制速率。

如上所述生成的量化信息如下所述进行局部解码。即,在步骤ST9中,图像编码装置执行逆量化处理。图像编码装置10的逆量化单元31使用与量化单元24对应的特性对从量化单元24输出的量化数据进行逆量化。

在步骤ST10中,图像编码装置执行逆正交变换处理。图像编码装置10的逆正交变换单元32对由逆量化单元3通过使用与正交变换单元23对应的特性1生成的逆量化数据进行逆正交变换,以生成残差数据,并且输出到运算单元33。

在步骤ST11中,图像编码装置执行图像相加处理。图像编码装置10的算术单元33将从预测选择单元43输出的预测图像数据加到局部解码的残差数据,以生成局部解码(即,经历了局部解码的)的图像。

在步骤ST12中,图像编码装置执行去块滤波处理。图像编码装置10的去块滤波器34对从算术单元33输出的图像数据执行去块滤波处理,去除块失真,并且输出到SAO滤波器35和帧存储器36。

在步骤ST13中,图像编码装置执行SAO处理。图像编码装置10的SAO滤波器35对从去块滤波器34输出的图像数据执行SAO处理。通过该SAO处理,针对每个LCU(即最大编码单元)获得了SAO处理的类型和系数,并且使用这些类型和系数执行滤波处理。SAO滤波器35使在SAO处理之后的图像数据存储在帧存储器36中。此外,SAO滤波器35将与SAO处理相关的参数输出到可逆编码单元25,并且如后所述在步骤ST15中对这些参数进行编码。

在步骤ST14中,图像编码装置执行存储处理。图像编码装置10的帧存储器36存储由去块滤波器34等进行滤波处理之前的图像以及由去块滤波器34等进行滤波处理之后的图像。

然而,在上述步骤ST8中量化的变换系数也被输出到可逆编码单元25。在步骤ST15中,图像编码装置执行可逆编码处理。图像编码装置10的可逆编码单元25通过对从量化单元24输出的量化后的变换系数和所提供的帧内预测信息、帧间预测信息等进行编码来生成编码流。此外,控制信息被包括在编码流中。

在步骤ST16中,图像编码装置执行累积处理。图像编码装置10的累积缓冲器26累积编码数据。累积在累积缓冲器26中的编码数据被适当地读出,并且经由传输线等将传输到解码侧。

在步骤ST17中,图像编码装置执行速率控制。图像编码装置10的速率控制单元27控制量化单元24的量化操作的速率,使得累积在累积缓冲器26中的编码数据不会上溢或下溢。

<2-2-1.线缓冲器数目计算单元的第一操作>

线缓冲器数目计算单元38基于等级信息和输入图像信息来计算线缓冲器数目。等级信息指示从多个预设等级中选择的等级。例如,基于图像编码装置的存储器等的配置、对由图像编码装置生成的编码流进行解码的图像解码装置的存储器配置等来选择等级。在输入图像信息中,示出了输入图像的水平大小(pic_width)和竖直大小(pic_height)。线缓冲器数目计算单元38将基于等级信息和输入图像信息计算出的最大线缓冲器数目(MaxLumaRefNum)输出到帧内预测单元41。

图8是示出线缓冲器数目计算单元的第一操作的流程图。在步骤ST31中,线缓冲器数目计算单元选择最大亮度图片大小。图9示出了等级(Level)与最大亮度图片大小(MaxLumaPs)之间的关系。与每个等级对应的图像处理装置具有对包含画面中的“MaxLumaPs”个像素的图像进行编码的能力。线缓冲器数目计算单元38选择与由等级信息指示的等级对应的最大亮度图片大小(MaxLumaPs)。

在步骤ST32中,线缓冲器数目计算单元计算最大画面水平大小。如等式(1)所示,可以使用最大亮度图片大小(MaxLumaPs)来计算最大画面水平大小(max_pic_width)。

max_pict_width=Sqrt(MaxLumaPs×8)…(1)

线缓冲器数目计算单元38通过使用在步骤ST31中选择的最大亮度图片大小(MaxLumaPs)来执行等式(1)的算术运算,并且计算最大画面水平大小(max_pic_width)。

在步骤ST33中,线缓冲器数目计算单元计算最大线缓冲器数目。如等式(2)所示,可以使用输入图像的最大亮度图片大小(MaxLumaPs)和水平大小(pic_width)来计算最大线缓冲器数目(MaxLumaRefNum)。注意,在等式(2)中,floor()是返回等于或小于括号中的数字的最大整数的函数。

MaxLumaRefNum=floor(max_pic_width/pic_width)…(2)

线缓冲器数目计算单元38使用在步骤ST31中选择的最大亮度图片大小(MaxLumaPs)以及在步骤ST32中计算出的最大画面水平大小(max_pic_width)来执行等式(2)的算术运算,以计算最大线缓冲器数目(MaxLumaRefNum)。

图10示出了等级与最大画面水平大小(max_pic_width)之间的关系。例如,支持等级“6”的图像编码装置10具有存储像素数据“8444”(即最大画面水平大小(max_pic_width))的线缓冲器。

因此,如图11所示,在输入图像是8K图像的情况下可以使用的帧内预测线缓冲器数目将是两条线。在支持等级6的图像处理装置的情况下,在输入图像是4K图像的情况下可以使用的帧内预测线缓冲器数目为四条线,并且在输入图像是2K图像的情况下可以使用的帧内预测线缓冲器数目为八条线。此外,在支持等级5的图像处理装置的情况下,在输入图像是8K图像的情况下可以使用的帧内预测线缓冲器数目为一条线,在输入图像是4K图像的情况下可以使用的帧内预测线缓冲器数目为一条线为两条线,并且在输入图像是2K图像的情况下可以使用的帧内预测线缓冲器数目为一条线为四条线。

图12示出了可以用于帧内预测的线缓冲器。例如,如图12的(a)所示,在输入图像的水平像素数目为Phy个像素并且可以使用一条线的线缓冲器的情况下,在输入图像的水平像素数目为(1/2)Ph个像素的情况下,除非像本技术中那样计算了最大线缓冲器数目并且设置了线缓冲器,否则如图12的(b)所示,不能使用未使用的缓冲器。然而,如果如本技术中那样计算了最大线缓冲器数目并且设置了线缓冲器,则如图12的(c)所示,可以使用两条线的线缓冲器。此外,在输入图像中的水平像素数目为(1/4)Ph个像素的情况下,如图12的(d)所示,除非像本技术中那样计算了最大线缓冲器数目并且设置了线缓冲器,否则未使用的缓冲器数目将大于(1/2)Ph个像素的情况下的缓冲器数目。然而,如果如本技术中那样计算了最大线缓冲器数目并且设置了线缓冲器,则如图12的(e)所示,可以使用四条线的线缓冲器。

图13示出了帧内预测中的参考像素线。图13(a)示出了在不使用本技术的情况下的参考像素线,图13(b)示出了在希望使用本技术的情况下的参考像素线。在不使用本技术的情况下,在要处理的当前块BKcur的上侧是CTU边界的情况下,将与上侧相邻的一条线的像素用作参考像素(外围参考像素)。另一方面,根据本技术,可以将与上侧相邻的四条线的像素用作参考像素(外围参考像素+扩展外围参考像素)。注意,在当前块BKcur的左侧是CTU边界的情况下,将存储与左侧相邻的块的像素的CTU缓冲器的像素用作参考像素。

图14示出了编码单元的语法。注意,尽管未示出,但是在高于编码单元的位置处设置了指示等级的等级标识符语法“general_level_idc”。

在编码单元的语法中,基于由线缓冲器数目计算单元38计算的最大线缓冲器数目(MaxLumaRefNum)来设置由框线AL1指示的参考像素线索引(intra_luma_ref_idx[x0][y0])。

根据这样的本技术,当输入图像具有除最大图像帧以外的大小时,可以有效地使用线缓冲器的资源。因此,与将在CTU边界处使用的线统一限制为一条线的情况相比,可以提高编码效率。

<2-2-2.线缓冲器数目计算单元的第二操作>

在上述线缓冲器数目计算单元的第一操作中,基于以下来计算最大线缓冲器数目(MaxLumaRefNum):基于与等级(Level)对应的最大亮度图片大小(MaxLumaPs)计算出的最大画面水平大小(max_pic_width);以及基于输入图像的水平大小(pic_width),但是存储在图像处理装置中的信息可以用于计算最大线缓冲器数目。

在第二操作中,例如,预先存储了图15所示的等级(Level)与最大水平大小(MaxW)之间的关系,并且将最大水平大小(MaxW)用作最大画面水平大小(max_pic_width)。

线缓冲器数目计算单元8通过使用与由等级信息指示的等级(Level)对应的最大画面水平大小(max_pic_width=MaxW)和输入图像的水平大小(pic_width)来执行等式(2)的算术运算,以计算最大线缓冲器数目(MaxLumaRefNum)。

因此,如图16所示,在输入图像是8K图像的情况下可以使用的帧内预测线缓冲器数目是一条线。在支持等级6的图像处理装置的情况下,在输入图像是4K图像的情况下可以使用的帧内预测线缓冲器数目为两条线,并且在输入图像是2K图像的情况下可以使用的帧内预测线缓冲器数目为四条线。此外,在支持等级5的图像处理装置的情况下,不能处理8K图像,在输入图像是4K图像的情况下可以使用的帧内预测线缓冲器数目将为一条线,并且在输入图像是2K图像的情况下可以使用的帧内预测线缓冲器数目将为两条线。

图17示出了序列参数集的语法的一部分。对于序列参数集,如框线AL2所示,设置了指示预先存储的最大画面水平大小(max_pic_width)的语法“max_pic_width_in_luma_sample”。

以这种方式,通过预先存储最大水平大小(=最大画面水平大小),线缓冲器数目计算单元38能够比第一操作更容易地计算最大线缓冲器数目(MaxLumaRefNum)。

<2-2-3.帧内预测单元的其他操作>

在帧内预测中,已经提出了通过使用亮度信号的解码像素值来生成色差信号的预测值的分量间线性模型(CCML)预测。在帧内预测单元的其他操作中,使线缓冲器有效地用于专利文献“日本专利申请特许公开第2013-110502号”和上述非专利文献1B.Bross,J.Chen,S.Liu,“Versatile Video Coding(Draft 3)”,文献JVET-L1001,第12届JVET会议:中国澳门,2018年10月3日至12日中示出的CCML预测。

在用于色差分量的预测模式的候选中包括的线性模型(LM)模式中,例如,使用等式(3)所示的预测函数来计算预测像素值predc(x,y)。注意,在等式(3)中,recL'(x,y)指示对解码图像的亮度分量进行下采样之后的值,并且“α”和“β”是系数。取决于色度格式,在色差分量的密度与亮度分量的密度不同的情况下,执行对亮度分量的下采样。

predc(x,y)=α×recL’(x,y)+β…(3)

图18用圆形概念性地示出了在色度格式为4:2:0的情况下,大小为16×16像素的一个PU中的亮度分量(Luma)和对应的色差分量(Chroma)。在水平方向和竖直方向上的每一个,亮度分量的密度是色差分量的密度的两倍。图中位于PU周围的实心圆指示在计算预测函数的系数α和β时参考的参考像素。阴影圆形是经过下采样的亮度分量,并且是预测函数的输入像素。通过将以这种方式进行了下采样的亮度分量的值代入等式(3)所示的预测函数的recL'(x,y),计算出公共像素位置处的色差分量的预测值。此外,参考像素也以类似的方式经过下采样。

在色度格式为4:2:0的情况下,如图18所示,通过下采样,每2×2亮度分量生成一个亮度分量的输入值(代入预测函数中的值)。通过使用二维滤波器对滤波器抽头的值进行滤波来进行下采样,该滤波器抽头的值包括在各个色差分量共用的像素位置处的一个或更多个亮度分量以及在不与该色差分量共用的像素位置处的一个或更多个亮度分量。在此,在色度格式为4:2:0的情况下,与某个色差分量“共用”的像素位置处的亮度分量包括相对于色差分量的像素位置(x,y)的亮度分量的像素位置(2x,2y)、(2x+1、2y)、(2x,2y+1)和(2x+1,2y+1)。

图19是示出下采样方法的图。在图19的左上方,示出了像素位置(1,1)处的色差分量Cr1,1。通过将亮度分量的输入值IL1,1代入预测函数来计算色差分量Cr1,1的预测值。可以通过对包括与色差分量Cr1,1共用的像素位置处的亮度分量Lu2,2、Lu3,2、Lu2,3和Lu3,3以及不与色差分量Cr1,1共用的像素位置处的亮度分量Lu1,2和Lu1,3的3×2滤波抽头的值进行滤波。图中的滤波器抽头的圆圈中示出的数字是要与每个滤波器抽头相乘的滤波器系数。以这种方式,通过在下采样期间还将与每个色差分量共用的像素位置周围的亮度分量包括在滤波器抽头中,来减小亮度分量中的噪声的影响,并且提高LM模式下的帧内预测的准确性。

在由帧内预测单元对亮度分量进行这种下采样的情况下,帧内预测单元利用根据由线缓冲器数目计算单元38计算出的线缓冲器数目的滤波器抽头数目在CTU边界处执行下采样处理。

具体地,当线缓冲器最大数目(MaxLumaRefNum)为2或更多时,如图19所示,对六个抽头(水平方向上的三个抽头×竖直方向上的两个抽头)进行滤波以计算预测值,即与色差分量共用的像素位置处的亮度分量。此外,当线缓冲器最大数目(MaxLumaRefNum)等于1或更少时,如图20所示,对水平方向上的三个抽头执行滤波,以计算预测值,即与色差分量共用的像素位置处的亮度分量。

通过执行这样的处理,如图21所示,当最大线缓冲器数目(MaxLumaRefNum)为2或更多时,可以使用通过使用两条线的亮度分量进行滤波而获得的参考像素的亮度分量的预测值来计算色差分量。此外,当最大线缓冲器数目(MaxLumaRefNum)为1或更少时,可以通过使用通过使用一条线的亮度分量进行滤波而获得的亮度分量的预测值来计算色差分量。

<2-2-4.去块滤波处理操作>

已经描述了图像编码装置通过使用由线缓冲器数目计算单元38计算出的线缓冲器数目来执行帧内预测的情况,但是可以基于由线缓冲器数目计算单元38计算出的线缓冲器数目来切换去块滤波器34的滤波处理。

这里,在与最大画面水平大小对应的去块滤波器所需的线数为N条线的情况下,线缓冲器数目计算单元38基于等式(4)来计算去块滤波器34的最大线缓冲器数目MaxLineBufNum。

MaxLineBufNum=floor(N×max_pic_width/pic_width)…(4)

去块滤波器34根据线最大缓冲器数目MaxLineBufNum切换竖直方向上的抽头数目。例如,在线缓冲器数目为“1”或更少的情况下,将竖直方向上的抽头数目设置为“N”。此外,在线缓冲器数目为“2”或更多的情况下,将竖直方向上的抽头数目设置为大于“N”。

通过以这种方式根据线缓冲器数目来调节滤波器抽头数目,变得可以有效地利用在去块滤波器34中设置的线缓冲器来执行去块滤波处理。

<2-2-5.图块划分的操作>

在图像编码处理中,由于图片是并行解码的,并且图块划分是以CTU为单位的,因此可以进行图块划分。因此,在执行图块划分的情况下,线缓冲器数目计算单元38通过使用图块水平大小(tile_column_width)来计算用于每个图块的线缓冲器数目。等式(5)计算用于每个图块的最大线缓冲器数目(MaxLineBufNum)。

MaxLumaRefNum=floor(max_pic_width/tile_column_width)…(5)

以这种方式,由线缓冲器数目计算单元38计算用于每个图块的最大线缓冲器数目(MaxLineBufNum),即使在针对每个图块执行帧内编码的情况下,帧内预测单元41也可以有效地使用线缓冲器来提高预测准确度。

<3.关于图像解码处理>

接下来,将描述对由图像编码装置生成的编码流的解码处理。

<3-1.图像解码装置的配置>

图22示出了被配置成对编码流执行解码处理的图像解码装置的配置,并且图像解码装置50是与图2所示的图像编码装置10对应的图像解码装置。由编码装置10生成的编码流被提供给图像解码装置50并且被解码。

图像解码装置50具有累积缓冲器61、可逆解码单元62、线缓冲器数目计算单元63、逆量化单元64、逆正交变换单元65、运算单元66、去块滤波器67、SAO滤波器68和画面重排缓冲器69。此外,图像解码装置50包括帧存储器71、选择单元72、帧内预测单元73和运动补偿单元74。

累积缓冲器61接收并且累积所发送的编码流。该编码流在预定定时处被读出并且被输出到可逆解码单元62。

此外,可逆解码单元62具有解析功能。可逆解码单元62将包括在编码流的解码结果中的信息(例如,等级信息和输入图像信息)输出到线缓冲器数目计算单元63。此外,可逆解码单元62解析帧内预测信息、帧间预测信息、滤波器控制信息等,并且提供给必要的块。

线缓冲器数目计算单元63执行与图像编码装置10的线缓冲器数目计算单元38的处理类似的处理,基于由等级信息指示的等级(Level)以及由输入图像信息指示的输入图像大小信息(pic_width,pic_height)来计算最大线缓冲器数目(MaxLumaRefNum),并且输出到帧内预测单元73。此外,在基于图像编码装置10中的线缓冲器数目来切换去块滤波器34的滤波处理的情况下,线缓冲器数目计算单元63计算最大线缓冲器数目(MaxLineBufNum),并且输出到去块滤波器67。

逆量化单元64通过与图2中的量化单元24的量化方法对应的方法,对通过利用可逆解码单元62进行解码而获得的量化数据进行逆量化。逆量化单元64将逆量化数据输出到逆正交变换单元65。

逆正交变换单元65通过与图2中的正交变换单元23的正交变换方法对应的方法执行逆正交变换,以获得与图像编码装置10中的正交变换前的残差数据对应的经解码的残差数据,并且输出到算术单元66。

从帧内预测单元73或运动补偿单元74将预测图像数据提供给算术单元66。算术单元66将经解码的残差数据与预测图像数据相加,以获得与图像编码装置10的算术单元22减去预测图像数据前的原始图像数据对应的解码图像数据。算术单元66将经解码的图像数据输出到去块滤波器67。

去块滤波器67通过执行与图像编码装置10的去块滤波器34的处理类似的去块滤波处理来去除解码图像的块失真。去块滤波器67将滤波处理之后的图像数据输出到SAO滤波器68。与图像编码装置10的去块滤波器34类似,去块滤波器67基于计算出的线缓冲器数目来切换滤波处理。

SAO滤波器68对由去块滤波器67滤波的图像数据执行SAO处理。SAO滤波器68通过使用从可逆解码单元62提供的参数,针对每个LCU对由去块滤波器67滤波的图像数据执行滤波处理,并且输出到画面重排缓冲器69。

画面重排缓冲器69重排图像。即,由图2的画面重排缓冲器21针对编码顺序重排的帧的顺序重排为原始显示顺序。

SAO滤波器68的输出还被提供给帧存储器71。选择单元72从帧存储器71中读出要用于帧内预测的图像数据,并且输出到帧内预测单元73。选择单元72从帧存储器71中读出要用于帧间预测的图像数据和要参考的图像数据,并且输出到运动补偿单元74。

帧内预测单元73通过从图像编码装置10的图3所示的帧内预测单元的配置中排除帧内模式搜索单元411配置而成。帧内预测单元73使用用于线(即由线缓冲器数目计算单元63计算出的最大线缓冲器数目(MaxLumaRefNum))的解码图像数据作为参考图像数据,以在由从可逆解码单元62提供的帧内预测信息指示的最佳帧内预测模式下生成预测图像数据,并且将生成的预测图像数据输出到算术单元66。此外,在由帧内预测单元73执行CCML预测的情况下,类似于图像编码装置10的帧内预测单元41,根据最大线缓冲器数目(MaxLumaRefNum)来切换滤波处理。

运动补偿单元74基于通过对由可逆解码单元62的编码位流的解码结果中包含的信息进行解析而输出的帧间预测信息,根据从帧存储器71获取的图像数据来生成预测图像数据,并且输出到运算单元66。

<3-2.图像解码装置的操作>

接下来,将描述图像解码装置的实施方式的操作。图23是示出图像解码装置的操作的流程图。

在步骤ST41中,图像解码装置执行累积处理。图像解码装置50的累积缓冲器61接收并且累积编码流。

在步骤ST42中,图像解码装置执行可逆解码处理。图像解码装置50的可逆解码单元62对从累积缓冲器61提供的编码流进行解码。可逆解码单元62对包含在编码流的解码结果中的信息进行解析,并且提供给必要的块。可逆解码单元62将等级信息和输入图像信息输出到线缓冲器数目计算单元63。此外,可逆解码单元62将帧内预测信息输出到帧内预测单元73,并且将帧间预测信息输出到运动补偿单元74。

在步骤ST43中,图像解码装置执行线缓冲器数目计算处理。图像解码装置50的线缓冲器数目计算单元63基于由等级信息指示的等级(Level)以及由输入图像信息指示的输入图像大小信息(pic_width,pic_height)来计算最大线缓冲器数目(MaxLumaRefNum),并且输出到帧内预测单元73。此外,在基于图像编码装置10中的最大线缓冲器数目(MaxLineBufNum)来切换去块滤波器34的滤波处理的情况下,线缓冲器数目计算单元63计算最大线缓冲器数目(MaxLineBufNum),并且输出到去块滤波器67。

在步骤ST44中,图像解码装置执行预测图像生成处理。图像解码装置50的帧内预测单元73或运动补偿单元74分别对从可逆解码单元62提供的帧内预测信息和帧间预测信息执行预测图像生成处理。即,在从可逆解码单元62提供帧内预测信息的情况下,帧内预测单元73以由帧内预测信息指示的最佳帧内预测模式生成预测图像数据。此外,帧内预测单元73使用由线缓冲器数目计算单元63计算出的最大线缓冲器数目(MaxLumaRefNum)的线缓冲器,以使用存储在线缓冲器中的参考像素来执行帧内预测。

在步骤ST45中,图像解码装置执行逆量化处理。图像解码装置50的逆量化单元64通过与图2的量化单元24的量化方法对应的方法对由可逆解码单元62获得的量化数据进行逆量化,并且将逆量化数据输出到逆正交变换单元65。

在步骤ST46中,图像解码装置执行逆正交变换处理。图像解码装置50的逆正交变换单元65通过与图2中的正交变换单元23的正交变换方法对应的方法来执行逆正交变换,以获得与图像编码装置10中的正交变换前的残差数据对应的解码残差数据,并且输出到算术单元66。

在步骤ST47中,图像解码装置执行图像相加处理。图像解码装置50的算术单元66将在步骤ST44中由帧内预测单元73或运动补偿单元74生成的预测图像数据与从逆正交变换单元65提供的解码残差数据相加,以生成解码图像数据。算术单元66将生成的解码图像数据输出到去块滤波器67和帧存储器71。

在步骤ST48中,图像解码装置执行去块滤波处理。图像解码装置50的去块滤波器67对从算术单元66输出的图像执行去块滤波处理。结果,消除了块失真。此外,在去块滤波处理中,基于在步骤ST43中计算出的最大线缓冲器数目(MaxLineBufNum)来切换滤波处理。经过去块滤波器67的滤波处理的解码图像被输出到SAO滤波器68。

在步骤ST49中,图像解码装置执行SAO处理。图像解码装置50的SAO滤波器68通过使用与从可逆解码单元62提供的与SAO处理相关的参数,对由去块滤波器67滤波的图像执行SAO处理。SAO滤波器68将经过SAO处理之后的解码图像数据输出到画面重排缓冲器69和帧存储器71。

在步骤ST50中,图像解码装置执行存储处理。图像解码装置50的帧存储器71存储从算术单元66提供的滤波处理前的解码图像数据以及由去块滤波器67和SAO滤波器68进行了滤波处理的解码图像数据。

在步骤ST51中,图像解码装置执行画面重排处理。图像解码装置50的画面重排缓冲器69累积从SAO滤波器68提供的解码图像数据,并且以在被图像编码装置10的画面重排缓冲器21重排之前的显示顺序输出所积累的解码图像数据。

通过执行这样的解码处理,可以对由上述图像编码装置10生成的编码流进行解码。

<4.图像处理装置的其他操作>

同时,在编码处理和解码处理中,可以从仅使用一条线的缓冲器的常规图像处理切换到如本技术中那样使用多条线的缓冲器的图像处理。通过提供指示是否可以使用多条线的信息(例如标志enable_mlr_ctu_boundary)并且参考该标志,可以确定该处理是否允许使用多条线。

图24是示出图像编码装置的操作的流程图。在步骤ST61中,图像编码装置10确定是否启用多线缓冲器。在控制信息指示例如在帧内预测中可以在CTU边界处使用用于多条线的参考图像数据的情况下,图像编码装置10进行到步骤ST62,并且在CTU边界处不使用多条线的图像数据的情况下(即,在CTU边界处仅使用一条线的参考图像数据的情况下),处理进行到步骤ST63。

在步骤ST62中,图像编码装置10将标志(enable_mlr_ctu_boundary)设置为“1”。此外,如上所述,计算最大线缓冲器数目(MaxLumaRefNum),并且处理进行到步骤ST64。

在步骤ST63中,图像编码装置10将标志(enable_mlr_ctu_boundary)设置为“0”。此外,将最大线缓冲器数目(MaxLumaRefNum)设置为“1”,并且处理进行到步骤ST64。

在步骤ST64中,图像编码装置10执行编码处理。图像编码装置10使用在步骤ST62或步骤ST63中设置的最大线缓冲器数目(MaxLumaRefNum)作为线缓冲器数目计算单元38的计算结果来执行编码处理,即,执行图6的步骤ST2至ST17的处理,以生成编码流。

图25示出了编码单元的语法。在该语法中,如框线AL3所示,在最大线缓冲器数目(MaxLumaRefNum)在CTU边界处大于“1”的情况下,示出了亮度参考像素线索引(intra_luma_ref_idx[x0][y0],并且可以确定亮度参考像素线(IntraLumaRefLineIdx[x0][y0]),如图1所示。

图26是示出图像解码装置的操作的流程图。在步骤ST71中,图像解码装置50确定标记(enable_mlr_ctu_boundary)是否为“1”。在标志(enable_mlr_ctu_boundary)为“1”的情况下,图像解码装置50进行到步骤ST72,并且在标志(enable_mlr_ctu_boundary)不为“1”的情况下,进行到步骤ST73。

在步骤ST72中,图像解码装置50计算最大线缓冲器数目(MaxLumaRefNum),并且进行到步骤ST74。

在步骤ST73中,图像解码装置50在将最大线缓冲器数目(MaxLumaRefNum)设置为“1”的情况下进行到步骤ST74。

在步骤ST74中,图像解码装置50执行解码处理。图像解码装置50使用在步骤ST72或步骤ST73中设置的最大线缓冲器数目(MaxLumaRefNum)作为线缓冲器数目计算单元63的计算结果来执行如上所述的解码处理,即,图23的步骤ST42至ST51中的处理,并且输出编码处理之前的图像数据。

通过以这种方式提供标志(enable_mlr_ctu_boundary),可以有选择地使用使用多线缓冲器的编解码器处理或者仅使用一个线缓冲器的编解码器处理。

<5.应用示例>

接下来,将描述本技术的图像处理装置的应用示例。本技术的图像处理装置可以应用于捕获运动图像的成像装置。在这种情况下,通过在成像装置中设置图像编码装置10,可以将具有高编码效率的编码流记录在记录介质上或者输出到外部装置。此外,通过在成像装置中提供图像解码装置50,可以对编码流进行解码并且可以记录和再现图像。此外,通过将设置有图像编码装置10的成像装置安装在任何类型的移动体(例如汽车、电动汽车、混合动力电动汽车、摩托车、自行车、个人移动体、飞机、无人机、轮船、机器人、建筑机械或农业机械(拖拉机))上,图像可以被有效地记录或传输到外部装置。此外,通过将本技术的图像处理装置设置在具有捕获运动图像的功能的便携式电子装置中,当在记录介质上记录图像时,与传统方法相比,可以减少数据量。

说明书中描述的一系列处理可以通过硬件、软件或两者的组合配置来执行。在通过软件执行处理的情况下,以处理顺序记录的程序被安装在计算机的专用硬件中所包含的存储器中并且被执行。替选地,可以在可以执行各种处理的通用计算机上安装并且执行该程序。

例如,程序可以被预先记录在作为记录介质的硬盘、固态驱动器(SSD)或只读存储器(ROM)上。替选地,可以将程序临时或永久地存储(记录)在可移动记录介质(例如软盘、光盘只读存储器(CD-ROM)、磁光(MO)盘、数字多功能光盘(DVD)、Blu-Ray(注册商标)盘(BD)、磁盘或半导体存储卡)中。这样的可移动记录介质可以被提供为所谓的封装软件。

此外,程序除了从可移动记录介质安装在计算机上之外,程序还可以经由诸如局域网(LAN)或互联网之类的网络从下载站点以有线或无线方式传输到计算机。在计算机中,可以接收以这种方式传送的程序并且将程序安装在诸如内置硬盘之类的记录介质上。

注意,在本说明书中描述的效果仅是示例并且不受限制,并且可能存在未描述的附加效果。此外,本技术不应被解释为限于上述技术的实施方式。本技术的实施方式以示例的形式公开了本技术,并且明显的是,本领域技术人员可以在本技术的要旨内修改或替换该实施方式。换言之,为了确定本技术的要旨,应该考虑权利要求书。

此外,本技术的图像处理装置还可以具有以下配置。

(1)一种图像处理装置,包括:

线缓冲器数目计算单元,被配置成基于等级信息和输入图像信息来计算线缓冲器数目;以及

帧内预测单元,被配置成通过使用由所述线缓冲器数目计算单元计算出的线缓冲器数目的线缓冲器来执行帧内预测处理。

(2)根据(1)所述的图像处理装置,其中,

通过使用所述帧内预测单元的预测结果生成的编码流包括所述等级信息和所述输入图像信息。

(3)根据(1)或(2)所述的图像处理装置,其中,

所述编码流包括识别信息,所述识别信息使得能够识别帧内预测处理是使用计算出的线缓冲器数目的缓冲器的帧内预测处理还是使用一条线的线缓冲器的帧内预测处理。

(4)根据(1)至(3)中任一项所述的图像处理装置,其中,

所述帧内预测单元利用根据由所述线缓冲器数目计算单元计算出的线缓冲器数目的滤波器抽头数目,对分量间线性模型预测中的亮度分量执行下采样处理。

(5)根据(1)至(4)中任一项所述的图像处理装置,其中,

所述线缓冲器数目计算单元通过使用图块划分时的图块水平大小来计算所述线缓冲器数目。

(6)根据(1)至(5)中任一项的图像处理装置还包括:

去块滤波器,被配置成对解码图像数据执行去块滤波处理,其中,

所述去块滤波器使用由所述线缓冲器数目计算单元计算出的线缓冲器数目的线缓冲器来利用根据计算出的线缓冲器数目的滤波器抽头数目执行所述去块滤波处理。

(7)根据(1)至(6)中任一项所述的图像处理装置,其中,

所述线缓冲器数目计算单元使用基于与由所述等级信息指示的等级对应的最大画面内像素数目计算出的最大画面水平大小并且使用由所述输入图像信息指示的输入图像水平大小来计算所述线缓冲器数目。

(8)根据(1)至(7)中任一项所述的图像处理装置,其中,

当所述帧内预测单元对CTU边界处的线执行帧内预测时,所述帧内预测单元使用保存在计算出的线缓冲器数目的线缓冲器中的解码图像数据来确定最佳帧内预测模式。

(9)根据(1)至(8)中任一项所述的图像处理装置,其中,

所述线缓冲器数目计算单元通过使用预先存储的最大画面水平大小代替所述输入图像信息来计算所述线缓冲器数目。

(10)根据(2)至(7)中任一项所述的图像处理装置,其中,

所述帧内预测单元使用保存在计算出的线缓冲器数目的线缓冲器中的解码图像数据,以由所述编码流指示的最佳帧内预测模式来生成预测图像。

附图标记列表

10 图像编码装置

21、69 画面重排缓冲器

22、33、66 算术单元

23 正交变换单元

24 量化单元

25 可逆编码单元

26、61 累积缓冲器

27 速率控制单元

31、64 逆量化单元

32、65 逆正交变换单元

34、67 去块滤波器

35、68 SAO滤波器

36、71 帧存储器

37、72 选择单元

38、63 线缓冲器数目计算单元

41、73 帧内预测单元

42 帧间预测单元

43 预测选择单元

50 图像解码装置

61 累积缓冲器

62 可逆解码单元

74 运动补偿单元

411 模内搜索单元

412 预测图像生成单元

4111 控制单元

4112、4121 缓冲处理单元

4113 预测处理单元

4114 模式确定单元

4122 图像生成处理单元

41页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:环路整形和块差分脉冲编解码调制之间的相互作用

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类