360度视频帧内预测模式决策方法

文档序号:196227 发布日期:2021-11-02 浏览:27次 >En<

阅读说明:本技术 360度视频帧内预测模式决策方法 (360-degree video intra-frame prediction mode decision method ) 是由 艾达 王易檀 胥策 艾宇 张晓阳 于 2021-06-30 设计创作,主要内容包括:一种360度视频帧内预测模式决策方法,由构建大尺寸预测单元模式决策方法、构建小尺寸预测单元模式决策方法步骤组成。构建大尺寸预测单元模式决策方法包括构建第一阶段的粗略模式决策方法、构建第二阶段的粗略模式决策方法、用于率失真优化的模式确定、确定最优模式步骤,构建小尺寸预测单元模式决策方法包括确定粗略模式决策的模式集合、确定用于率失真优化的模式步骤、确定最优模式步骤。预测单元PU尺寸分为两种大小,并且对不同尺寸PU根据其特点进行模式的预筛选,有效地减少了将粗略模式决策与率失真优化RDO过程所遍历的模式数目,实现了预测单元PU最优预测模式的快速决策。(A360-degree video intra-frame prediction mode decision method comprises the steps of constructing a large-size prediction unit mode decision method and constructing a small-size prediction unit mode decision method. The method for constructing the large-size prediction unit mode decision comprises the steps of constructing a rough mode decision method in a first stage, constructing a rough mode decision method in a second stage, determining a mode for rate distortion optimization and determining an optimal mode, and the method for constructing the small-size prediction unit mode decision comprises the steps of determining a mode set of the rough mode decision, determining a mode for rate distortion optimization and determining an optimal mode. The sizes of the prediction units PU are divided into two sizes, and the mode pre-screening is carried out on the PUs with different sizes according to the characteristics of the PUs, so that the number of modes traversed by a rough mode decision and a Rate Distortion Optimization (RDO) process is effectively reduced, and the quick decision of the optimal prediction mode of the prediction units PU is realized.)

360度视频帧内预测模式决策方法

技术领域

本发明属于视频编码技术领域,具体涉及到360度视频帧内预测模式决策。

背景技术

360度视频作为一种虚拟现实技术,在沉浸式影院、VR游戏、社交媒体、电视广播与远程教育等得到了广泛应用。360度视频的分辨率一般为4K、6K或8K,视频的帧分辨率通常为60帧每秒,有时甚至高达90帧每秒,因此高质量的360度视频每秒就可以消耗数千兆的带宽。如何有效地提高编码速度是促进360度视频技术发展的关键因素。联合图像专家组、运动图像专家组以及联合视频研究组等组织正在对360度视频进行了深入的研究,以确定统一的编码标准。

360度视频的处理流程包括对360度视频的拼接处理、投影转换、编码、传输、解码、视频渲染、逆投影等过程。其中,投影转换方式是决定360度视频编码效率的关键因素,常用的投影方式有等矩形投影,它直观易生成但在极点附近会发生过采样,导致较大的形状失真和编码比特浪费。立方体投影将球面投影至立方体表面,并以灵活的方式排列,排列方式不同可导致压缩效率不同。相较于等矩形投影,立方体投影提高了运动估计和运动补偿的效率,但仍存在过采样问题,与原球面相比,过采样率高达190%。除此之外还有等角立方体投影、八面体投影、球面分割投影、旋转的球面投影、赤道圆柱投影、二十面体投影等11种投影方式。不同的投影方式以不同采样密度对球体的不同区域进行采样,且无论使用哪种投影方式都会带来一定程度的画面失真。目前大多数360度视频编码优化研究都是结合高效视频编码进行的。为了提高360度视频编码的性能,目前有许多工作从投影方式、编码框架以及帧内编码算法等方面提出了许多优化方法,用来提高360度视频编码的质量和效率。

360度视频的高分辨率使帧内编码中的CU划分和模式决策过程比传统视频具有更高的编码复杂度,耗费更多的编码时间,因此对其帧内编码算法优化是一项重要的研究工作。

与传统视频相比,经过投影后的360度视频都会产生一定程度的变形失真,这将导致编码器在帧的不同区域展现出不同的编码性能。而且360度视频的高分辨率会使得帧内编码中模式决策过程耗费大量的编码时间。

发明内容

本发明索要解决的技术问题在于克服上述现有技术的缺点,提供一种编码复杂度低、编码时间短的360度视频帧内预测模式决策方法。

解决上述技术问题所采用的技术方案是由下述步骤组成:

(1)构建大尺寸预测单元模式决策方法

预测单元PU尺寸为64×64、32×32,对当前预测单元PU采用两阶段的粗略模式决策方法:

1)构建第一阶段的粗略模式决策方法

选择8种预测模式0、1、2、10、18、26、30、34用于第一阶段的粗略模式决策,按下式确定8种预测模式的哈达码变换的绝对值和SATD:

其中H为归一化的N×N阶哈达玛矩阵,N为矩阵的大小,N取值为4或8,X为预测模式对应的预测残差矩阵,大小与H相同,p表示HXH的行,q表示HXH的列。

从8种预测模式的绝对值和SATD中选出最小的两种模式,分别称为第一模式FM1、第二模式SM1

2)构建第二阶段的粗略模式决策方法

按下式构建用于第二阶段粗略模式决策RMD的模式集合M:

用模式集合M进行第二阶段的粗略模式决策。

3)将候选模式集合M按照式(1)确定4个哈达码变换的绝对值和SATD,并选择哈达码变换的绝对值和SATD最小的两种模式FM1和SM1用下式构建用于率失真优化RDO的模式集合MR

4)确定最优模式

将最可能模式MPM加入到模式集MR中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。

RDcost=Smode+λ×B'mode (2)

其中,Smode表示预测单元PU原始像素块与重构块之间的残差平方和,λ为编码系数,B’mode表示该预测单元PU帧内编码所耗费的比特数。

(2)构建小尺寸预测单元模式决策方法

预测单元PU的尺寸为16×16、8×8、4×4,用像素绝对偏差方法对预测单元PU纹理方向进行初步分析,得到所匹配的角度模式,将该角度模式以及与其相邻的角度模式、模式0、模式1组成用于粗略模式决策的模式,比较其中各模式的哈达码变换的绝对值和SATD,得到自适应模式筛选结果,并与最可能模式MPM组成用于率失真优化的模式,通过率失真优化方法按式(2)确定率失真代价值RDcost,选择最优模式。

在本发明的(2)步骤中,所述的构建用于粗略模式决策的模式的方法为:

确定粗略模式决策的模式集合如下:

用像素绝对偏差方法确定当前预测单元PU中所有像素点在8个纹理方向上的像素绝对偏差值ADP,8个预测方向的像素绝对偏差值ADP分别用水平绝对偏差值AHor、垂直绝对偏差值AVer、左下对角线绝对偏差值ADDL、左上对角线绝对偏差值ADUL、水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D、垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R表示。

(1)按下式确定水平绝对偏差值AHor

其中N为当前预测单元PU的尺寸,N取值为8,P(n,j)表示预测单元PU内第n行j列的像素值,MHor(n)表示第n行像素值的均值。

(2)按下式确定垂直绝对偏差值AVer

其中P(i,n)表示预测单元PU内第i行n列的像素值,Mver(n)表示预测单元PU块第n列像素平均值。

(3)按下式确定左下对角线绝对偏差值ADDL

其中P(i,j)表示预测单元PU内第i行j列的像素值,i∈[o,1,···,N-1],j∈[o,1,···,N-1],MDDL(n)表示延左下对角线方向第n行像素值的均值。

(4)对左上对角线绝对偏差值ADUL计算只需将预测单元PU向左旋转90°按式(5)确定。

(5)对水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D计算,根据它们所对应的模式与水平方向所对应的模式间的角度偏移值,将预测单元PU向左或向右旋转13°后按式(4)确定。

(6)对垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R计算,根据它们所对应的模式与垂直方向所对应的模式间的角度偏移值,将当前预测单元PU向左或向右旋转13°后按式(3)确定。

将16×16预测单元PU、4×4预测单元PU采用最邻近插值法缩放处理为8×8大小的预测单元PU,按照8×8大小的预测单元PU在各个方向上像素绝对偏差值ADP的方法进行计算。

将最小像素绝对偏差值ADPmin所对应的模式称作可能模式PM,可能模式PM与最小像素绝对偏差值ADPmin的对应关系如下式所示:

根据预测单元PU的可能模式PM构建用于粗略模式决策的候选模式集合MS,选取可能模式PM以及与可能模式PM左右相邻的6种模式和0模式、1模式共同构成用于粗略模式决策的模式集合MS

在本发明的(2)步骤中,所述的用于率失真优化的模式为:

将候选模式集合MS按照式(1)确定8个哈达码变换的绝对值和SATD,16×16的预测单元PU中选取值最小的2种模式,8×8、4×4的预测单元中选取值最小的3种模式。

在本发明的(2)步骤中,所述的确定最优模式为:

将最可能模式集MPMS加入到率失真优化的模式中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。

本发明采用了预测单元PU尺寸与预测模式以及纹理特征间的相关性,提出将预测单元PU尺寸分为两种类别并使用不同的模式决策方法,对大尺寸预测单元PU使用概率统计分析方法,选取模式占比较高的8种模式用于第一阶段粗略模式决策,根据第一阶段粗略模式决策筛选出的哈达码变换的绝对值值最小的两种模式构建用于第二阶段粗略模式决策的模式集;对小尺寸预测单元PU采用纹理方向分析的方法,根据8个主要纹理方向将35种预测模式分为8组,并使用所提的ADP方法实现当前预测单元PU在8个主要纹理方向的模式匹配,选取ADP值最小的纹理方向所对应的模式分组进入粗略模式决策过程,结合MPM和RDO方法完成最优预测模式的选择。所提算法可减少粗略模式决策以及RDO所遍历的模式数目,实现预测单元PU快速模式决策,从而降低时间损耗。

本发明对基于CMP的360度视频的纹理特征进行分析,考虑进帧内编码过程中,对模式决策部分做出改进,降低编码复杂度,节省编码时间。

本发明具有以下有益效果:

本发明充分考虑CMP格式的360度视频的纹理特征,对帧内编码过程进行改进,能够在降低编码复杂度的同时保证编码效率。

预测单元PU尺寸分为两种大小,并且对不同尺寸PU根据其特点进行模式的预筛选,有效地减少了将粗略模式决策与率失真优化RDO过程所遍历的模式数目,实现了预测单元PU最优预测模式的快速决策。

对于联合视频开发组织所提的18个360度视频测试序列的编码结果,所提方法平均编码时间减少了26.4%,BDBR平均增长0.551%,BDWS-PSNR减少了0.07db,WS-PSNR降低0.0153db。优化效果比现有优化技术有明显的提升。

附图说明

图1是本发明实施例1的流程图。

具体实施方式

下面结合附图和实施例对本发明进一步详细说明,但本发明不限于下述的实施方式。

实施例1

本实施例的360度视频帧内预测模式决策方法由下述步骤组成(参见图1):

(1)构建大尺寸预测单元模式决策方法

预测单元PU尺寸为64×64、32×32,对当前预测单元PU采用两阶段的粗略模式决策方法:

1)构建第一阶段的粗略模式决策方法

选择8种预测模式0、1、2、10、18、26、30、34用于第一阶段的粗略模式决策,按下式确定8种预测模式的哈达码变换的绝对值和SATD:

其中H为归一化的N×N阶哈德玛矩阵,N为矩阵的大小,本实施例N取值为4,X为预测模式对应的预测残差矩阵,大小为N,q表示HXH的行,p表示HXH的列。

从8种预测模式的哈达玛变换的绝对值和SATD中选出最小的两种模式,分别称为第一模式和第二模式FM1、SM1

2)构建第二阶段的粗略模式决策方法

按下式构建用于第二阶段粗略模式决策RMD的模式集合M:

用模式集合M进行第二阶段的粗略模式决策。

3)将候选模式集合M按照式(1)确定4个哈达码变换的绝对值和SATD,并选择哈达玛变换的绝对值和SATD最小的两种模式FM1和SM1用下式构建用于率失真优化RDO的模式集合MR

4)确定最优模式

将最可能模式集MPM加入到模式集MR中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。

RDcost=Smode+λ×B'mode (2)

其中,Smode表示预测单元PU原始像素块与重构块之间的残差平方和,λ为编码系数,B’mode表示该预测单元PU帧内编码所耗费的比特数。

(2)构建小尺寸预测单元模式决策方法

预测单元PU的尺寸为16×16、8×8、4×4,用像素绝对偏差方法对预测单元PU纹理方向进行初步分析,得到所匹配的角度模式,将该角度模式以及与其相邻的角度模式、模式0、模式1组成用于粗略模式决策的模式,比较其中各模式的哈达码变换的绝对值,得到自适应模式筛选结果,并与最可能模式MPM组成用于率失真优化的模式,通过率失真优化方法按式(2)确定率失真代价值RDcost,选择最优模式。

所述的构建用于粗略模式决策的模式的方法为:

确定粗略模式决策的模式集合如下:

用像素绝对偏差方法确定当前预测单元PU中所有像素点在8个纹理方向上的像素绝对偏差值ADP,8个预测方向的像素绝对偏差值ADP分别用水平绝对偏差值AHor、垂直绝对偏差值AVer、左下对角线绝对偏差值ADDL、左上对角线绝对偏差值ADUL、水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D、垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R表示。

1)按下式确定水平绝对偏差值AHor

其中N为当前预测单元PU的尺寸,N取值为8,P(n,j)表示预测单元PU内第n行j列的像素值,MHor(n)表示第n行像素值的均值。

2)按下式确定垂直绝对偏差值AVer

其中P(i,n)表示预测单元PU内第i行n列的像素值,Mver(n)表示预测单元PU块第n列像素平均值。

3)按下式确定左下对角线绝对偏差值ADDL

其中P(i,j)表示预测单元PU内第i行j列的像素值,i∈[o,1,···,N-1],j∈[o,1,···,N-1],本实施例的N取值为8,MDDL(n)表示延左下对角线方向第n行像素值的均值。

4)对左上对角线绝对偏差值ADUL计算只需将预测单元PU向左旋转90°按式(5)确定。

5)对水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D计算,根据它们所对应的模式与水平方向所对应的模式间的角度偏移值,将预测单元PU向左或向右旋转13°后按式(4)确定。

6)对垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R计算,根据它们所对应的模式与垂直方向所对应的模式间的角度偏移值,将当前预测单元PU向左或向右旋转13°后按式(3)确定。

将16×16预测单元PU、4×4预测单元PU采用最邻近插值法缩放处理为8×8大小的预测单元PU,按照8×8大小的预测单元PU在各个方向上像素绝对偏差值ADP的计算方法进行计算。

将最小像素绝对偏差值ADPmin所对应的模式称作可能模式PM,可能模式PM与最小像素绝对偏差值ADPmin的对应关系如下式所示:

根据预测单元PU的可能模式PM构建用于粗略模式决策的候选模式集合MS,选取可能模式PM以及与可能模式PM左右相邻的6种模式和0模式、1模式共同构成用于粗略模式决策的模式集合MS

所述的用于率失真优化的模式为:将候选模式集合MS按照式(1)确定8个哈达码变换的绝对值和SATD,16×16的预测单元PU中选取值最小的2种模式,8×8、4×4的预测单元中选取值最小的3种模式。

所述的确定最优模式为:将最可能模式集MPM(已在《新一代高效效视频编码H.265/HEVC原理、标准与实现》中公开)加入到率失真优化的模式中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。

完成360度视频帧内预测模式决策方法。

实施例2

本实施例的360度视频帧内预测模式决策方法由下述步骤组成:

(1)构建大尺寸预测单元模式决策方法

选择8种预测模式0、1、2、10、18、26、30、34用于第一阶段的粗略模式决策,按下式确定8种预测模式的哈达码变换的绝对值和SATD:

其中H为归一化的N×N阶哈达玛矩阵,N为矩阵的大小,本实施例的N取值为8,X为预测模式对应的预测残差矩阵,大小为N,q表示HXH的行,p表示HXH的列。

从8种预测模式的哈达玛变换的绝对值和SATD中选出最小的两种模式,分别称为第一模式和第二模式FM1、第二模式SM1

该步骤的其它步骤与实施例1实施例相同。

其它步骤与实施例1实施例相同,完成360度视频帧内预测模式决策方法。

为了验证本发明本发明额的有益效果,发明人采用本发明实施例1的360度视频帧内预测模式决策方法与现有的标准360度视频编码算法HM16.16-360Lib4.0(简称对比试验方法)进行了对比仿真实验,实验情况如下:

实验在HM16.16-360Lib4.0的基础上进行仿真实验,硬件平台为Intel(R)Core(TM)i7-6820HK [email protected],4核处理器,内存为16GB,显卡为GeForce GTX 980M,操作系统为64位Win10旗舰版。编译调试软件为Visual Studio 2017,配置参数为全I帧编码模式,QP设置为{22,27,32,37}。实验使用JVET提供的包含A(4K)、B(6K)以及C(8K)三种不同分辨率的16个标准360度视频序列,如表所示。

表1实验所用视频序列

本发明与对比试验方法的对比实验结果见表2,在表2中,WS-PSNR表示加权球形均匀峰值信噪比,用于评价球面视频的客观质量,BDBR表示在WS-PSNR相同的条件下,两种不同算法的码率变化情况,BDWS-PSNR表示在码率相同的条件下,本发明方法与对比试验方法的WS-PSNR的差异,ΔT表示本发明方法相对于对比试验方法节省的平均时间百分比,计算公式如下:

其中,TimeHM(i)为对比试验方法在第i个量化参数下的编码时间,Timeprop(i)为本发明方法在第i个量化参数下的编码时间。ΔWS-PSNR为本发明方法相对于对比试验方法在编码比特率相同的情况下,视频质量的变化量,计算公式如下:

其中,WS-PSNRHM(i)为对比试验方法在第i个量化参数下编码重建视频的视频质量,WS-PSNRprop(i)为本发明方法在第i个量化参数下编码重建视频的视频质量。

表2本算法与HM16.16-360Lib4.0的性能对比

表2的实验结果表明,相较于对比试验方法,本发明平均编码时间减少了26.4%,BDBR平均增长0.551%,BDW-SPSNR减少了0.07db,ΔWS-PSNR降低0.0153db,所带来的编码性能损耗可忽略不计。对于不同类型的视频序列,本发明方法都可有效地降低编码时间,提高编码效率,同时保证视频质量。本发明方法适用于不同的测试序列,优化效果明显,具有良好的理论意义及应用价值。

14页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:进行编码和解码的方法、解码端、编码端和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类