编码图像的方法和装置

文档序号:914947 发布日期:2021-02-26 浏览:10次 >En<

阅读说明:本技术 编码图像的方法和装置 (Method and apparatus for encoding image ) 是由 P.安德里冯 M-J.科莱蒂斯 D.图泽 于 2019-07-02 设计创作,主要内容包括:本实施例从表示输入图像的颜色分量中获得表示输出图像的色度分量的色度分量,并且如果至少一个色度分量中的像素的值超过给定值,则修改所述颜色分量中的至少一个中的所述像素的值,使得所述至少一个色度分量中的所述像素的值小于或等于所述给定值。(The present embodiment obtains, from color components representing an input image, chrominance components representing chrominance components of an output image, and if a value of a pixel in at least one of the chrominance components exceeds a given value, modifies the value of the pixel in at least one of the color components such that the value of the pixel in the at least one chrominance component is less than or equal to the given value.)

编码图像的方法和装置

技术领域

本实施例涉及在保持所得视频的高保真度的同时分发HDR视频。

背景技术

本部分旨在向读者介绍本领域的各个方面,这些方面可能与以下描述和/或要求保护的本实施例的各个方面有关。认为该讨论有助于向读者提供背景信息,以有助于更好地理解本实施例的各个方面。因此,应该理解的是,应从这种角度来阅读这些陈述,而不是作为对现有技术的承认。

在下文中,图像数据是指特定图像/视频格式的样本(像素)的一个或若干个阵列,其指定与图像(或视频)的像素值有关的所有信息以及可由显示器和/或任何其他装置用来例如可视化和/或解码图像(或视频)的所有信息。图像包括通常代表图像的亮度(或亮度)的以样本的第一阵列形式的第一分量,以及以样本的其他阵列形式的第二分量和第三分量,通常代表图像的色度(或色度)。或者,等效地,可以通过颜色样本的一组阵列来表示相同的信息,例如传统的三色度RGB表示。

像素值由C个值的向量表示,其中C是分量的数量。向量的每个值用定义像素值的动态范围的多个比特表示。

标准动态范围图像(SDR图像)是其亮度值用有限的位数(通常为8位)表示的图像。这种有限的表示方式不允许正确呈现小信号变化,特别是在暗和亮的亮度范围内。在高动态范围图像(HDR图像)中,信号表示被扩展以在整个范围内保持信号的高精度。在HDR图像中,像素值通常以浮点格式表示(每个分量通常至少10位,即浮点或半浮点数),最受欢迎的格式是openEXR半浮点格式(每个RGB分量16位,即每像素48位)或具有长表示形式的整数,通常至少为16位。

高效视频编码(HEVC)标准的出现(ITU-T H.265ITU电信标准化部门(02/2018),H系列:视听和多媒体系统,视听服务的基础设施-运动视频的编码,高效视频编码,ITU-TH.265建议书)使得能够部署具有增强观看体验的新视频服务,例如超高清服务。除了提高空间分辨率外,与当前部署的高清格式的标准色域(SCG)和标准动态范围(SDR)相比,超高清格式还可以带来更宽的色域(WCG)和更高的动态范围(HDR)。已经提出了用于HDR/WCG视频表示和编码的不同解决方案,例如感知传递函数感知量化器(PQ)(SMPTE ST 2084,“HighDynamic Range Electro-Optical Transfer Function of Mastering ReferenceDisplays,或者Diaz,R.,Blinstein,S.和Qu,S.“Integrating HEVC Video Compressionwith a High Dynamic Range Video Pipeline”,SMPTE Motion Imaging Journal,Vol.125,Issue 1.2016年2月,第14-21页)。通常,SMPTE ST 2084允许仅使用10或12位来表示高达10000cd/m2峰值亮度的HDR视频信号。

SDR与解码和呈现设备的向后兼容性是某些视频分发系统(例如广播或多播系统)中的重要特征。基于单层编码/解码过程的解决方案可以向后兼容,例如,兼容SDR,并可以利用现有的旧式分发网络和服务。

这种基于单层的分发解决方案使得能够在启用HDR的消费电子(CE)设备上实现高质量的HDR呈现,同时在启用SDR的CE设备上提供高质量的SDR呈现。这样的解决方案是基于例如SDR信号的编码信号以及相关联的元数据(每个视频帧或场景只有几个字节),其可用于从解码信号中重构另一个信号,例如SDR或HDR信号。

在ETSI技术规范TS 103 433-1 V1.2.1(2017年8月)中可以找到基于单层的分发解决方案的示例。这种基于单层的分发解决方案在下文中表示为SL-HDR1。

另外,可能已经部署了HDR分发系统(工作流,还有解码和呈现设备)。实际上,有许多全球视频服务提供商都提供HDR内容。但是,分布式HDR材料可能以与消费者终端设备特性不匹配的格式或特性表示。通常,消费者终端设备使解码后的材料适应其自身的特性。但是,由于消费者终端设备的特性与制作环境中用于对原始内容进行分级的母版(mastering)显示设备之间的差异,HDR TV中采用的技术的多样性在呈现方面引起了重要差异。对于内容制作者而言,艺术意图的逼真度及其对消费者的再现至关重要。因此,在解码信号要适配于终端设备特性时,无论是在分级过程中的制作阶段还是在发行前在质量检查操作员的控制下生成的“显示适配”元数据都能够将艺术意图传达给消费者。

在ETSI技术规范TS 103 433-2 V1.1.1(2018年1月)中可以找到结合了显示适应性的基于单层的分发解决方案的示例。这种基于单层的分发解决方案在下文中表示为SL-HDR2。

这种基于单层的分发解决方案SL-HDR1或SL-HDR2生成元数据作为用于信号重构的参数。元数据可以是静态的也可以是动态的。

静态元数据是指代表视频内容的参数或其格式对于视频(图像集)和/或节目保持不变。

静态元数据对整个视频内容(场景,电影,剪辑...)均有效,并且可能取决于图像内容本身或图像内容的表示格式。它们可以定义例如图像格式或颜色空间,色域。例如,SMPTE ST 2086:2014,"Mastering Display Color Volume Metadata Supporting HighLuminance and Wide Color Gamut Images"就这种静态元数据,它描述了用于在制作环境中对材料进行分级的母版显示。母版显示颜色卷(MDCV)SEI(补充增强信息)消息是针对H.264/AVC(“Advanced video coding for generic audiovisual Services”,SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS,Recommendation ITU-T H.264,Telecommunication Standardization Sector of ITU,2017年4月)和HEVC视频编解码器的ST 2086的分发风格。

动态元数据是与内容相关的信息,因此元数据可能会随图像/视频内容而变化,例如对于每个图像或每个图像组而变化。作为示例,SMPTE ST 2094:2016标准系列"DynamicMetadata for Color Volume Transform"通常是在制作环境中生成的动态元数据。由于使用了色彩重映射信息(CRI)SEI消息,SMPTE ST 2094-30可以依照HEVC和AVC编码的视频流进行分发。

基本上,基于单层的分发解决方案包括格式适应步骤,以将输入图像(视频)的格式适应于以下的输入:旨在生成与元数据相关联的输出图像(视频)的预处理步骤,所述输出图像(视频)和元数据的编码步骤,所述输出图像(视频)和元数据的解码步骤以及旨在从所述解码后的输出图像(视频)以及可选地从所述解码后的元数据重构图像(视频)的后处理步骤。

通常使用整数而不是浮点值来实现后处理步骤。这种整数实现涉及将在所述后处理步骤中使用的内部变量的值限制为定义这些内部变量的精度的最大值。然而,可能发生的是,当这些内部变量的值超过所述最大值时,内部变量的值被裁剪,从而导致这些内部变量的精度损失,从而在所述后处理的输出图像中引入视觉伪像。通常,在某些SL-HDR1或SL-HDR2实现中,内部色度分量精度必须限制为9位(+符号位)。发生这种裁剪时,会引入视觉伪像,尤其是对于非常饱和的红色和蓝色而言。

发明内容

以下呈现本实施例的简要内容,以便提供对本实施例的某些方面的基本理解。此内容并不是对本实施例的广泛概论。它并不旨在识别本实施例的关键或重要元素。以下内容仅以简化形式来呈现本实施例的一些方面,作为下文提供的更详细描述的序言。

本实施例旨在通过一种方法补救现有技术的缺点中的至少一个,该方法包括:从代表输入图像的颜色分量中获得代表输出图像的色度分量的色度分量,所述输出图像旨在通过对编码图像本身应用解码和后处理而获得,该编码图像通过对所述输入图像应用预处理和编码获得,所述后处理等效于所述预处理的功能的逆过程;以及如果像素在至少一个所述色度分量中的值超过给定值,修改所述像素在至少一个所述颜色分量中的值,使得所述像素在所述至少一个所述色度分量中的值小于或等于所述给定值。

根据一个实施例,给定值取决于裁剪所述像素在至少一个所述色度分量中的值之前的最大整数值。

根据一个实施例,将所述像素在所述至少一个色度分量中的第一色度分量中的值与第一给定值进行比较,将所述像素在所述至少一个色度分量的第二色度分量中的值与第二给定值进行比较,并且所述第一和第二给定值为不同的值。

根据一个实施例,所述像素在单个颜色分量中的值被修改。

根据一个实施例,通过用当所述像素在所述色度分量中的值小于或等于所述给定值时获得的值来替换所述像素在单个颜色分量中的值,修改所述像素在至少一个所述颜色分量中的值。

根据一个实施例,当所述像素在第一色度分量中的值等于第一给定值时,获得第一值,当所述像素在第二色度分量中的值等于第二给定值时,获得第二值,然后,如果所述第一值大于第二值,将所述像素的最大值确定为所述第一值,否则确定为所述第二值,并且,通过用所述最大值替换所述像素在单个颜色分量中的值来修改所述像素在至少一个所述颜色分量中的值。

根据一个实施例,其中,如果所述最大值严格大于0且严格大于所述像素在所述单个颜色分量中的值,用所述最大值替换所述像素在所述单个颜色分量中的值。

根据一个实施例,所述单个颜色分量被看作是第一颜色分量,所述像素在第二颜色分量中的值也被修改,根据第一和第二值确定所述第二颜色分量,当所述像素在第一色度分量中的值等于第一给定值时,获得所述第一值,并且,当所述像素在第二色度分量中的值等于第二给定值时,获得所述第二值。

根据一个实施例,通过将所述像素在所述第二颜色分量中的值乘以最大值与所述像素在第一颜色分量中的值之比,来修改所述像素在第二颜色分量中的值,如果所述第一值大于第二值,将所述像素的所述最大值确定为所述第一值,否则确定为所述第二值。

根据一个实施例,只有在所述最大值大于给定值时,所述像素在第二颜色分量中的值才被修改。

根据一个实施例,只有在所述像素在输入图像中的值小于所述像素在第一颜色分量中的值时,所述像素在第二颜色分量中的值才被修改。

根据另一个方面,本实施例涉及一种计算机程序产品,包括程序代码指令,其用于在计算机上执行该程序时执行上述方法的步骤。

根据另一个方面,本实施例涉及一种非暂时性处理器可读介质,其程序代码指令用于在计算机上执行该程序时执行上述方法的步骤。

通过以下结合附图对示例的描述,本实施例的特定本性以及本实施例的其他目的、优点、特征和用途将变得明显。

附图说明

在附图中,示出了本实施例的示例。其示出了:

图1示出了根据本实施例的示例的端到端工作流的高层表示,该端到端工作流支持内容传递到具有改进的显示自适应特征的显示器;

图2示出了根据基于单层的分发解决方案的端到端处理工作流的示例,该端到端处理工作流支持内容传递到HDR和SDR CE显示器;

图3示出了图2的工作流的特定实施方式;

图4a示出了感知转移函数的图示;

图4b示出了用于映射的分段曲线的示例;

图4c示出了用于将感知均匀信号转换回线性光域的曲线的示例;

图5展示了装置的架构的示例性实施例,该装置可以被配置为实施结合图1至图4c所描述的方法;以及

图6示出了根据本实施例的示例性实施例的用于对图像进行编码的方法的步骤的图。

相似或相同元素用相同的附图标记表示。

具体实施方式

在下文中将参考附图更全面地描述本实施例,在附图中示出了本实施例的示例。然而,本实施例可以以许多替代形式来体现,并且不应被解释为限于此处阐述的示例。因此,尽管本实施例易有各种修改和替代形式,但是在图中通过示例的方式示出其具体示例,并且将在此详细描述。然而,应当理解,无意将本实施例限制为所公开的特定形式,相反,本公开将涵盖如权利要求限定的本实施例的精神和范围内的所有修改、等同物和替代。

此处使用的术语仅出于描述特定示例的目的,而无意于限制本实施例。如在此处所使用的,单数形式“一个”、“一种”和“该”也意图包含复数形式,除非上下文另外明确指出。还应理解的是,当在该说明书中使用时,术语“包括(comprise)”、“包括(comprising)”、“包含(include)”和/或“包含(including)”指定存在所陈述的特征、整数、步骤、操作、元件和/或组件,但不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其群组的存在或附加。此外,当元件被称为“响应”或“连接”于另一元件时,它可以直接响应或连接于其他元件,或者可以存在中间元件。相反,当元件被称为“直接响应”或“直接连接”于其他元件时,不存在中间元件。如在此处所使用的,术语“和/或”包含相关联的所列项中的一个或多个的任一和所有组合,并且可以缩写为“/”。将理解的是,尽管这里可以使用术语第一、第二等来描述各种元件,但是这些元件不应受到这些术语的限制。这些术语仅用于区分一个元件和另一个元件。例如,在不脱离本实施例的教导的情况下,第一元件可以被称作第二元件,并且类似地,第二元件可以被称作第一元件。尽管一些图包含通信路径上的箭头以示出通信的主要方向,但是应理解的是,通信可以发生在与所描绘的箭头相反的方向上。关于框图和操作流程图描述了一些示例,其中每个框代表电路元件、模块,或包括用于实现(多个)指定的逻辑功能的一个或多个可执行指令的部分代码。还应当注意,在其他实现方式中,框中注释的(多个)功能可以不按注释的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本同时执行,或者这些框有时可以以相反的顺序执行。本文中提及的“根据示例”或“在示例中”是指结合示例描述的特定特征、结构或特性可以包含在本实施例的至少一个实现方式中。在说明书中各处出现的“根据示例”或“在示例中”的表述不一定都指代相同的示例,也不一定是与其他示例相互排斥的单独或替代示例。在权利要求中出现的附图标记仅作为说明,并且应对权利要求的范围没有限制作用。尽管没有明确描述,但是可以以任何组合或子组合中采用本示例和变型。

通常,两个不同的图像具有不同的亮度动态范围。图像的亮度动态范围是所述图像的亮度值的最大值与最小值之比。

通常,当图像的亮度动态范围在1000以下时(例如,500,即100cd/m2与0.2cd/m2之比),所述图像被表示为标准动态范围(SDR)图像,并且当图像的亮度动态范围等于或大于1000时(例如,10000,即1000cd/m2与0.1cd/m2之比),所述图像被表示为HDR图像。亮度用单位坎德拉每平方米(cd/m2)表示。此单位取代了术语“尼特”(尽管其在国际单位制中已弃用),该术语也可以被使用。

本实施例被描述以用于对图像进行预处理、编码、解码和后处理,但是由于序列中的每个图像被依次预处理、编码、解码和后处理,如下文所述,本实施例延伸为对一系列图像(视频)进行预处理、编码、解码和后处理。

下文中,分量表示图像n的分量m。这些分量表示特定图像格式的图像ln。通常,图像格式以色彩容量(例如,色度及动态范围)、色彩编码系统(例如,RGB、YCbCr)等等为特征。

图1示出了根据本实施例的示例的端到端工作流的高层表示,该端到端工作流支持内容传递到具有改进的显示自适应特征的显示器。装置A1被配置为实现用于预处理和编码图像或视频流的方法,装置A2被配置为实现用于对图像或视频流进行解码和后处理的方法,如下所述,并且装置A3被配置为显示经解码和后处理的图像或视频流。两个远程装置A1和A2通过分发网络NET进行通信,分发网络NET被配置为至少从装置A1向装置A2提供已编码的图像或视频流。

装置A1包括被配置为实现如下所述的预处理和/或编码方法的至少一个设备。所述至少一个设备属于包括移动设备、通信设备、游戏设备、平板(或平板电脑)、诸如膝上型计算机之类的计算机设备、静止图像相机、摄像机、编码芯片、静止图像服务器和视频服务器(例如,广播服务器、视频点播服务器或Web服务器)的一组设备。

装置A2包括至少一个被配置为实现如下所述的解码和/或后处理方法的设备。所述至少一个设备属于包括移动设备、通信设备、游戏设备、计算机设备和机顶盒的一组设备。

装置A3包括至少一个被配置为实现显示方法的设备。所述至少一个设备属于包括电视机(或电视)、平板(或平板电脑)、诸如膝上型计算机的计算机设备、显示器、头戴式显示器和呈现/显示芯片的一组设备。

根据一个示例,该网络是广播网络,适应于将静止图像或视频图像从装置A1广播到多个装置A2。基于DVB和ATSC的网络是此类广播网络的示例。

根据另一个示例,该网络是适应于将静止图像或视频图像从装置A1传递到多个装置A2的宽带网络。基于互联网的网络,GSM网络或基于IP网络的电视是此类宽带网络的示例。

在一个示例性实施例中,端到端工作流使用了用于装置A1的广播服务器、用于装置A2的机顶盒、用于装置A3的电视机和DVB地面广播网络。

在替代实施例中,装置A2和A3被组合在单个设备中,例如在集成了机顶盒解码和后处理功能性的电视中。

在替代实施例中,分发网络NET由存储了已编码图像或视频流的物理封装介质代替。

物理封装介质包括光学封装介质,如蓝光光盘和超高清蓝光,还包括基于存储器的封装介质,如用于OTT和VoD服务。

图2示出了根据基于单层的分发解决方案的端到端处理工作流的示例,该端到端处理工作流支持内容传递到HDR和SDR CE显示器。

基本上,所述基于单层的分发解决方案可以解决SDR直接向后兼容性,即,它利用已经存在的SDR分发网络和服务并在启用HDR的CE设备上启用高质量的HDR呈现,包括SDRCE设备上的高质量的SDR呈现。

SL-HDR1是这种基于单层的分发解决方案的一个示例。

但是,所述基于单层的分发解决方案还可以涉及在分发网络上使用的解决方案,分发网络将显示自适应动态元数据与PQ HDR视频信号一起传递。PQ指如Rec.ITU-RBT.2100"Recommendation ITU-R BT.2100-1,Image parameter values for highdynamic range television for use in production and international programmeexchange"中规定的“感知量化”。

图2所示的工作流涉及具有相关元数据的基于单层的分发解决方案并说明了用于重构代表输入图像的三个分量的三个分量的方法的使用示例,输入图像来自代表解码图像的三个解码分量和例如SL-HDR1或SL-HDR2中所指定的所述元数据。

信息数据ID确定必须考虑哪个基于单层的分发解决方案。通常,在实践中,仅实例化一个基于单层的分发解决方案并且信息数据ID为固定值。如果不止一个基于单层的分发解决方案被实例化,则信息数据ID指示这些基于单层的分发解决方案中的哪一个是必须考虑的。

典型地,可以实例化SL-HDR1和SL-HDR2并且信息数据ID指示是否必须考虑SL-HDR1或SL-HDR2。

基本上,图2中所示的基于单层的分发解决方案包括预处理步骤20、编码步骤23、解码步骤25和26以及后处理步骤28。

预处理步骤20的输入和输出分别是分量的三元组,而后处理步骤28的输入和输出分别是分量的三元组。

图2中所示的基于单层的分发解决方案可以包括可选的格式自适应步骤21、22、27、29以将三个分量的格式适应于待应用于这些分量的进一步处理的输入。

例如,在步骤21(可选)中,三个分量的格式可以适应于与预处理步骤20的输入格式或编码步骤23的输入格式适合的格式,并且在步骤22(可选)中,三个分量的格式也可以适应于与编码步骤23的输入格式适合的格式。

在步骤27中(可选),三个分量的格式可以适应于与后处理步骤28的输入适合的格式,并且在步骤29中,三个分量的格式可以适应于可以从目标装置(例如,机顶盒、连接的电视、启用HDR/SDR的CE设备、超高清蓝光光盘播放器)的至少一个特征定义的格式。

所述格式自适应步骤(21、22、27、29)可以包括颜色空间转换和/或色域映射(和/或逆色域映射)。例如,当输出图像的三个解码分量和三个分量或输入图像的三个分量表示在不同的颜色空间和/或色域中时,可以使用逆色域映射。

可以使用通常的格式自适应过程,例如R'G'B'到Y'CbCr或Y'CbCr到R'G'B'转换,BT.709到BT.2020或BT.2020到BT.709,下采样或上采样的色度分量等。

例如,SL-HDR1可以使用如ETSI技术规范TS 103 433-1 V1.2.1(2017年8月)的附件D中指定的格式自适应过程和逆色域映射。

所述输入格式自适应步骤21还可以包括通过对三个分量应用传递函数,比如PQ或者HLG传递函数或其逆函数(建议书ITU-R BT.2100),使三个分量的位深适应于例如10比特的位深。

在预处理步骤20中,三个分量(等于在步骤21中尚未适应于格式时的三个分量或者等于在步骤21中已适应于这些分量的格式时的这三个分量的适应版本)分解为三个分量(在步骤22中可能已经适应于其格式以获得三个分量)和参数集SP,以及切换步骤24确定三个分量是否等于三个分量

在步骤23中,可以用任何视频编解码器对三个分量进行编码并且将包括比特流B的信号携带通过分发网络中。

根据步骤23的变型,参数集SP和/或信息数据ID作为相关联的静态和/或动态元数据在比特流B中传送。

根据一种变型,参数集SP和/或信息数据ID作为相关联的静态和/或动态元数据在特定的信道上传送。

然后,旨在由图1中的装置A2解码的至少一个信号携带比特流B和附带的元数据。

在一种变型中,例如,比特流B被存储在存储介质上,例如机顶盒的存储器,蓝光光盘或硬盘上。

在一种变型中,至少一些附带的相关元数据被存储在存储介质上,例如机顶盒的存储器,超高清蓝光光盘或硬盘上。

优选地,在步骤23中,用视频编解码器,比如H.265/HEVC编解码器或H.264/AVC,对分量的至少一个三元组的序列,以及可能的相关元数据进行编码,其中每个分量代表一个图像,。

在步骤25中,至少部分地从比特流B或从另一特定信道获得参数集SP。参数集SP中的至少一个参数也可以从单独的存储介质中获得。

在步骤26中,从比特流B获得三个解码的分量

在后处理步骤28中,其是预处理步骤20的附近逆函数,从三个解码的分量和所获得的参数集SP重构三个分量

更详细地,预处理步骤20包括步骤200-203。

在步骤200中,通过在三个分量的分量上应用映射函数,得到分量所述分量代表输入图像的亮度。

从数学角度讲,

其中MF是可以减少或增加图像亮度的动态范围的映射函数。请注意,它的逆函数(表示为IMF)可以逆向增加或减少图像的亮度的动态范围。

在步骤202中,通过在分量上应用逆映射函数得到重构分量

其中,IMF是映射函数MF的逆函数。因此,重构分量的值属于分量的值的动态范围。

在步骤201中,通过根据分量和重构分量校正表示输入图像的色度的分量而导出分量

步骤201允许控制从三个分量获得的颜色并保证它们的感知与输入图像的颜色匹配。分量(通常表示为色度分量)的校正可以通过调整色度校正和逆映射步骤的参数来保持受控。因此,从三个分量获得的颜色饱和度和色调处于受控。通常,当使用非参数映射函数(步骤200)时,这种控制是不可能的。

可选地,在步骤203中,分量可以进行调整以进一步控制感知的饱和度,如下所示:

其中a和b是两个参数。

步骤203允许控制亮度(由分量表示)以保证从三个分量获得的颜色(饱和度和色调)与输入图像的颜色之间的感知颜色匹配。

参数集SP可以包括与映射函数或其逆函数(步骤200、202和282)相关的信息数据,与色度校正(步骤201和281)相关的信息数据,与饱和度调整函数相关的信息,具体地是它们的参数a和b(步骤203),以及相对于格式自适应阶段21、22、27、29(例如,色域映射和/或逆色域映射参数)中使用的选择性转换的信息。

参数集SP还可以包括信息数据ID和输出图像的信息特征,例如代表所述输出图像(图2和3的步骤29,和图3的步骤284)的三个分量的格式。

更详细地,后处理步骤28包括步骤280-282,其将参数集SP中的至少一个参数作为输入。

在可选的步骤280中,三个分量中的分量步骤27的输出,可以做如下调整:

其中a和b是参数集SP中的两个参数。

例如,当信息数据ID指示必须考虑SL-HDR1时执行步骤280,而当它指示必须考虑SL-HDR2时不执行步骤280。

在步骤282中,通过在分量或,可选地,上应用映射函数,获得三个分量中的分量

其中MF1是从参数集SP中的至少一个参数导出的映射函数。

在步骤281中,通过根据分量或,可选地,对三个分量中的分量进行逆校正而导出三个分量的分量

根据一个实施例,将分量乘以色度校正函数β(.),色度校正函数由参数集SP的参数定义并且其值取决于分量或,可选地,

从数学角度讲,分量由下式给出:

https://patentlicensing.technicolor.com/ IPTech/home/

或可选地,

图3表示图2的基于单层的解决方案的硬件友好的优化。所述优化包括两个附加步骤283和284并允许通过减少总线位宽的使用来降低硬件实现的复杂性。

在步骤283中,通过考虑参数集SP中的参数,从分量步骤281的输出,获得表示为(R1,G1,B1)的三个分量:

其中m0,m1,m2,m3是参数集SP的参数,而S0是从分量以及参数集SP的其他参数导出来的。

在步骤284中,然后根据分量步骤282的输出,对三个分量(R1,G1,B1)进行缩放来获得三个分量

其中(步骤282).

根据图2或图3的端到端工作流的第一示例性实施例,信息数据ID指示必须考虑SL-HDR1。

等式(1)中的映射函数MF(.)然后减小输入图像亮度的动态范围,等式(2)中它的逆函数IMF(.)增加了分量的动态范围以及等式(5)中的映射函数MF1(.)增加了分量的动态范围。

根据所述第一示例性实施例的第一变型,分量是非线性信号,在文献中表示为亮度,其通过下式从输入图像的经伽玛压缩的RGB分量获得(步骤21):

其中γ可以是伽马因子,优选等于2.4。

接下来,根据所述第一变型,然后通过对输入图像的RGB分量应用伽玛压缩来获得(步骤21)分量

其中A=[A1A2A3]T是标准的3x3 R'G'B'-Y'CbCr转换矩阵(例如取决于颜色空间的建议书ITU-R BT.2020-2或ITU-R BT.709-6),A1,A2,A3是1x3矩阵:

A1=[A11 A12 A13]

A2=[A21 A22 A23]

A3=[A31 A32 A33]

其中Amn(m=1,..,3,n=1,..3)是矩阵系数。

接下来,在步骤201中,根据所述第一变型,从分量与伽玛压缩的重构的分量的乘积之间的比率来校正分量

其中是取决于分量的值也可以是取决于三个分量的颜色原色的恒定值。例如,可以等于建议书BT.2020中的1.2。可能的是,还可以取决于如ETSI TS 103 433-1 V.1.2.1条款C.2.3.中指定的参数。也可以是参数集SP中的一个参数。

最后,根据所述第一变型,三个分量然后可以表示Y'CbCr 4:2:0伽马传递特性视频信号。

例如,与映射函数MF和/或其逆函数IMF和/或映射函数MF1(.)相关的控制参数可以按照条款C.3.2(ETSI技术规范TS 103 433-1 V1.2.1)中的规定确定。色度校正函数β(.)及其参数可以按照条款C.2.3和C.3.4(ETSI技术规范TS 103 433-1 V1.2.1)中的规定确定。与映射函数或其逆函数相关的控制参数相关的信息数据以及与色度校正函数β(.)及其参数相关的信息数据是参数集SP中的参数。例如,可以在附件F(表F.1)(ETSI技术规范TS103 433-1 V1.2.1.)中找到参数集SP的参数的数值的示例。

参数m0,m1,m2,m3和S0可以按照ETSI技术规范TS 103 433-1 V1.2.1的条款6.3.2.6(matrixCoefficient[i]定义m0,m1,m2,m3)和条款6.3.2.8(kCoefficient[i]用来构建S0)的规定来确定以及其重构的用途可以按照条款7.2.4(ETSI技术规范TS 103 433-1 V1.2.1)中的规定确定。

根据所述第一示例性实施例的第二变型,分量是通过下式从输入图像I1的RGB分量获得的线性光亮度分量L:

接下来,根据所述第二变型,通过对输入图像I1的RGB分量应用伽玛压缩来导出(步骤21)分量

接下来,根据所述第二变型,然后通过从第一分量与伽玛压缩的重构的分量的乘积之间的比率校正分量来导出(步骤201)分量

其中是取决于分量的值,并且可能从ETSI TS 103 433-1V.1.2.1条款C.3.4.2中规定的参数获得,其中等式(22)中

也可以是参数集SP中的一个参数。

最后,根据所述第二变型,三个分量然后可以表示Y'CbCr 4:2:0伽马传递特性视频信号。

例如,可以按照条款C.3.2(ETSI技术规范TS 103 433-1 V1.2.1)中的规定确定与映射函数MF和/或其逆函数IMF和/或映射函数MF1(.)相关的控制参数。色度校正函数β(.)及其参数可以按照条款7.2.3.2(ETSI技术规范TS 103 433-2 V1.1.1)中的规定确定,其中等式(25)fsgf(Yn)=1。与映射函数或其逆映射函数相关的控制参数相关的信息数据和与色度校正函数β(.)和其参数相关的信息数据是参数集SP的参数。

参数m0,m1,m2,m3和S0可以按照ETSI技术规范TS 103 433-1 V1.2.1的条款6.3.2.6(matrixCoefficient[i]定义m0,m1,m2,m3)和条款6.3.2.8(kCoefficient[i]用于构建S0)中的规定确定以及其在重构中的用途可以按照条款7.2.4(ETSI技术规范TS 103 433-1V1.2.1)中的规定确定。

根据图2或图3的端到端工作流的第二示例性实施例,信息数据ID指示必须考虑SL-HDR2。

然后可以将三个分量表示为Y'CbCr 4:4:4全范围PQ10(PQ 10位)视频信号(在建议书ITU-R BT.2100中指定)。提供三个分量其为从三个分量(典型为10,12或16位)计算出的PQ 10-位图像数据和关联参数,然后使用,例如HEVC Main 10配置文件编码方案,进行编码(步骤23)。那些参数被设置到参数集SP。

根据变型,等式(5)中的映射函数MF1(.)可以增加或减小分量的动态范围。

例如,当所连接的HDR CE显示器的峰值亮度高于内容的峰值亮度时,映射函数MF1(.)增加动态范围。当所连接的HDR或SDR CE显示器的峰值亮度低于内容的峰值亮度时,映射函数MF1(.)减小动态范围。例如,所述峰值亮度可以是参数集SP中的参数。

例如,可以按照条款C.3.2(ETSI技术规范TS 103 433-1 V1.2.1)中的规定确定与映射函数MF1相关的控制参数。可以按照条款7.2.3.2(ETSI技术规范TS 103 433-2V1.1.1)中的规定确定色度校正函数β(.)及其参数,其中等式(25)fsgf(Yn)=1。与映射函数相关的控制参数相关的信息数据和与色度校正函数β(.)及其参数相关的信息数据为参数集SP的参数。例如,可以在附件F(表F.1)(ETSI技术规范TS 103 433-2 V1.1.1)中找到参数集SP的参数的数值的示例。

参数m0,m1,m2,m3(由ETSI技术规范TS 103 433-2 V1.1.1中的matrixCoefficient[i]定义)和S0(用ETSI技术规范TS 103 433-2 V1.1.1中的kCoefficient[i]构建)可以按照条款7.2.4(ETSI技术规范TS 103 433-2 V1.1.1)中的规定确定。

根据所述第二示例性实施例的第一变型,代表所述输出图像的三个分量是三个分量

根据所述第二示例性实施例的第二变型,在后处理步骤28中,在解码(步骤25)之后,从三个分量和参数集SP中的参数重构三个分量

然后,三个分量可用于启用SDR或HDR的CE显示器。如上所述,三个分量的格式可能被适配(步骤29)。

映射函数MF(.)或MF1(.)基于感知传递函数,其目标是将输入图像的分量转换为输出图像的分量,从而减小(或增大)的他们的亮度值的动态范围。因此,输出图像的分量的值属于比输入图像的分量的值小(或更大)的动态范围。所述感知传递函数使用有限的控制参数集。

图4a示出了可以用于映射亮度分量的感知传递函数的图示,但是可以使用用于映射亮度分量的类似的感知传递函数。映射由母版显示器峰值亮度参数(在图4a中等于5000cd/m2)控制。为了更好地控制黑白水平,在与内容相关的黑白水平之间应用了信号展宽。然后,使用由三部分构建的分段曲线来映射经转换的信号,如图4b所示。下部和上部是线性的,陡度分别由shadowGain和highlightGain控制参数确定。中间部分是在两个线性部分之间提供了连续且平滑的桥梁的抛物线。交叉部的宽度由midToneWidthAdjFactor参数确定。例如通过使用ETSI TS 103 433-1附件A.2元数据中指定的SEI消息,可以将控制映射的所有参数作为元数据进行传送。

图4c示出了感知传递函数TM(图4a)的逆函数的示例以示出如何基于目标传统显示最大亮度(例如100cd/m2)将感知优化的亮度信号转换回线性光域。

在步骤25(图2或3)中,获得参数集SP以从三个分量重构三个分量这些参数可以根据从比特流(例如比特流B)获得的元数据获得。

ETSI TS 103 433-1 V1.2.1条款6和附件A.2提供了所述元数据的语法示例。描述了建议书ETSI的语法,用于从SDR视频中重构HDR视频,但是该语法可以根据任何解码的分量扩展到重构任何图像;例如,TS 103 433-2 V1.1.1使用相同的语法从HDR视频信号(具有不同的动态范围)重构适配HDR视频的显示。

根据ETSI TS 103 433-1 V1.2.1,可以根据所谓的基于参数的模式或基于表的模式来传送所述动态元数据。对于分发工作流,基于参数的模式可能是令人感兴趣的,分发工作流的主要目标是提供直接SDR向后兼容服务,并具有用于携带动态元数据的非常低的额外有效载荷或带宽使用量。对于配备有低端终端的工作流或需要更高级别的自适应来正确表示HDR和SDR流两者时,基于表的模式可能是令人感兴趣的。在基于参数的模式下,要传送的动态元数据是代表要在后处理步骤中应用的逆映射函数的亮度映射参数,即tmInputSignalBlackLevelOffset;tmInputSignalWhiteLevelOffset;shadowGain;HighlightGain;midToneWidthAdjFactor;tmOutputFineTuning参数。

此外,要传送的其他动态元数据是用于微调ETSI TS 103 433-1 V1.2.1条款6.3.5和6.3.6中指定的默认色度校正函数β(.)的颜色校正参数(saturationGainNumVal,saturationGainX(i)和saturationGainY(i))。如上所述,可以在saturationGain函数参数中分别携带参数a和b。可以使用HEVC SL-HDR信息(SL-HDRI)用户数据注册的SEI消息(参见ETSI TS 103 433-1 V1.2.1附件A.2)或诸如AVS2/IEEE1857.4规范中指定的另外一种扩展数据机制来传达这些动态元数据。典型的动态元数据有效载荷大小为每画面或场景小于100字节。

返回图3,在步骤25中,将SL-HDRI SEI消息进行解析以获得参数集SP中的至少一个参数。

在步骤282和202中,从获得的映射参数中重构(导出)逆映射函数(所谓的lutMapY)(更多详细信息参见ETSI TS 103 433-1 V1.2.1条款7.2.3.1,TS 103 433-2V1.1.1的相同条款)。

在步骤282和202中,还从获得的颜色校正参数中重构(导出)色度校正函数β(.)(所谓的lutCC)(更多详细信息参见ETSI TS 103 433-1 V1.2.1条款7.2.3.2,TS 103 433-2 V1.1.1的相同条款)。

在基于表的模式下,要传送的动态数据是代表映射函数的分段线性曲线的枢轴点。例如,动态元数据是指示枢轴点数量的luminanceMappingNumVal,指示枢轴点的横坐标(x)值的luminanceMappingX和指示枢轴点的纵坐标(y)值的luminanceMappingY(更多详细信息参见ETSI TS 103 433-1 V1.2.1条款6.2.7和6.3.7)。此外,其他要传送的动态元数据可以是代表色度校正函数β(.)的分段线性曲线的枢轴点。例如,动态元数据为colorCorrectionNumVal,指示枢轴点的数量;colorCorrectionX,指示枢轴点的x值;colorCorrectionY,指示枢轴点的y值(更多详细信息参见ETSI TS 103 433-1 V1.2.1条款6.2.8和6.3.8)。可以使用HEVC SL-HDRI SEI消息来传送这些动态元数据(在ETSI TS 103433-1 V1.2.1的附件A.2.3中提供了条款6参数与附件A分发元数据之间的映射)。

在步骤25中,将SL-HDRI SEI消息进行解析以获得代表逆映射函数的分段线性曲线的枢轴点和代表色度校正函数β(.)的分段线性曲线的枢轴点以及色度至亮度注入参数a和b。

在步骤282和202中,从与代表逆映射函数ITM的分段线性曲线相关的那些枢轴点导出逆映射函数(更多详细信息参见ETSI TS 103 433-1 V1.2.1条款7.2.3.3,-ETSI TS103 433-2 V1.1.1的相同条款)。

在步骤281和201中,还从与代表色度校正函数β(.)的分段线性曲线相关的那些所述枢轴点导出色度校正函数β(.),(更多详细信息参见ETSI TS 103 433-1 V1.2.1条款7.2.3.4,-ETSI TS 103 433-2 V1.1.1的相同条款)。

请注意,也可以通过SEI消息来传送由后处理步骤使用的静态元数据。例如,基于参数的模式或基于表的模式的选择可以由如ETSI TS 103 433-1 V1.2.1(条款A.2.2)指定的有效载荷模式信息携带。静态元数据,例如颜色原色或最大显示母版显示器亮度由AVC,HEVC中指定的母版显示器色量(MDCV)SEI消息传送,或者如ETSI TS 103 433-1 V1.2.1附件A.2中指定的那样嵌入SL-HDRI SEI消息中。

根据步骤25的实施例,信息数据ID由比特流中的语法元素显式地用信号发送,并因此通过解析比特流而获得。例如,所述语法元素是SEI消息的一部分,例如包含在SL-HDRISEI消息中的sl_hdr_mode_value_minus1语法元素。

根据一个实施例,所述信息数据ID识别什么是应用于输入图像以处理参数集SP的处理。

根据该实施例,然后可以使用信息数据ID来推断如何使用参数以重构三个分量(步骤25)。

例如,当等于1时,信息数据ID指示已经通过将SL-HDR1预处理步骤(步骤20)应用于输入的HDR图像而获得参数集SP并且三个分量代表SDR图像。当等于2时,信息数据ID指示已通过将SL-HDR2预处理步骤(步骤20)应用于HDR 10位图像(步骤20的输入)而获得参数并且三个分量代表HDR10图像。

本实施例从代表输入图像的颜色分量获得通常表示为色度分量的分量其代表输出图像的色度分量,并且如果像素在至少一个所述色度分量中的值超过给定值,则修改所述像素在至少一个所述颜色分量中的值,使得所述像素在所述至少一个所述色度分量中的值小于或等于所述给定值。

确定像素在至少一个所述色度分量中的值是否超过给定值允许检测输出图像的非常饱和的颜色,并修改所述像素在至少一个所述颜色分量中的值,使得所述像素在所述至少一个所述色度分量中的值小于或等于所述给定值,在感知上不影响显示器上呈现的颜色的范围内减小所述非常饱和的颜色的饱和度。

例如,假设输入图像在RGB颜色空间中表示并且色度分量是通常的U和V色度分量,则当像素的U色度分量的值大于给定值时,与所述像素的R和G分量值相比,输入图像中的所述像素的B分量值往往非常高。然后,根据本实施例,修改所述像素的G(还可能是R)分量值,使得从修改后的颜色分量获得的所述像素在所述U色度分量中的值低于或等于所述给定值。

同样,当像素的V色度分量的值高于给定值时,与所述像素的B和G分量值相比,输入图像中所述像素的R分量值往往非常高。然后,根据本实施例,修改所述像素的G(还可能是B)分量值,使得从修改后的颜色分量获得的所述像素在所述V色度分量中的值低于或等于所述给定值。

图6示出了根据本实施例的示例性实施例的用于对图像进行编码的方法的步骤图。

该方法包括步骤60至步骤62。

步骤60的输入是代表输入图像的色度分量值的三元组。在下文中,颜色分量的三元组是指众所周知的RGB颜色空间的三元组,但是,在不限制本实施例的范围的情况下,可以使用代表图像的值的任何其他三元组。

如上文中图2和图3中所述,对代表输入图像的三个分量进行预处理(步骤20),在比特流B中编码输出的三个分量(步骤23),随后通过解码(步骤26)比特流B获得三个分量然后,代表输出图像的三个分量要么从三个分量中直接获得,要么由三个分量以及从关联元数据获得的参数集SP的参数(步骤25)进行重构(步骤28)。

步骤28通常通过使用整数值来实现,即,该步骤中的一些内部值是属于由下限值LBV和上限值UBV所界定的特定范围的整数值。通常,此范围是以9位和符号位定义的,即,下限值LBV等于-512,上限值UBV等于511。

在所述后处理步骤28的过程中,根据分量(等式6)或可选地(等式6bis),通过逆校正三个分量分量,推导出三个分量分量。所述分量代表输出图像的色度,即,它们通常被表示为三个分量的色度分量。

在步骤60中,模块M1从代表输入图像的色度分量中获得代表输出图像色度分量的色度分量

根据图2或图3的端到端工作流程的第一示例性实施例的第一变型,即,当考虑SL-HDR1时,色度分量通过从等式(9)-等式(10)获得的等式(14)获得:

假设编码/解码未考虑(当考虑等式6bis时,考虑等式(6)时的类似结果)。

根据图2或图3的端到端工作流程的第二示例性实施例,即,当考虑SL-HDR2时,如果不考虑显示自适应功能,即,在ETSI TS 103 433-2 V1.1.1第7.2.3.2节中考虑modFactor等于0时,色度分量通过等式(15)获得:

其中,R”=EOTFPQ(R),G”=EOTFPQ(G),B”=EOTFPQ(B)及EOTFPQ(.),其中,在SMPTE ST 2084中指定了EOTFPQ(.),并假定编码/解码未考虑(当考虑等式6bis时,考虑等式(6)时的类似结果)。

在步骤61中,模块M2检查像素p在至少一个所述色度分量中的值是否超过给定值。

根据一个实施例,给定值取决于像素p在至少一个所述色度分量中的值裁剪之前的最大整数值。

所述给定值可以低于或等于上限值UBV。

根据步骤61的变型,模块M2检查像素p在色度分量中的值是否超过第一给定值,模块M2检查所述像素p在色度分量中的值是否超过第二给定值,并且所述第一和第二给定值是不同的值。

为色度分量定义不同的给定值会对从三个分量获得的颜色产生特殊影响,因为三个分量的色度分量不会根据相同的方式进行处理。

如果像素p在所述色度分量中的值分别超过给定值,那么,在步骤62中,模块M3修改所述像素p在至少一个所述色度分量中的值,使得所述像素p在所述至少一个所述色度分量中的值低于或等于所述给定值。

根据步骤62的实施例,修改所述像素p在单个颜色分量中的值。

例如,假设输入图像在RGB颜色空间中进行表示,而G分量是要修改的单个颜色分量。

根据步骤62的实施例的变型,用值Val(p)替代像素p在单个颜色分量中的值,其中值Val(p)是当所述像素p在所述色度分量(或)中的值(或)等于所述给定值时获得的,即,例如,当给定值等于UBV时,(或)=UBV。

例如,当G分量是要修改的单个颜色分量时,当低于或等于UBV时,通过以下方式计算值Val(p):

其中,当考虑等式(14)时,EOTF(X)=X1/γ且invEOFT(Y)=Yγ,其中,考虑等式(15)时,EOTF(X)=EOTFPQ(X)且invEOTF(Y)=InvEOTFPQ(Y),invEOTF(Y)是EOTFPQ(.)函数的逆函数。

当(代表通常的V色度分量的)色度分量低于或等于UBV时,可以获得类似的等式:

其中,当考虑等式(14)时,EOTF(X)=X1/γ且invEOFT(Y)=Yγ,当考虑等式(15)时,时,EOTF(X)=EOTFPQ(X)且invEOTF(Y)=InvEOTFPQ(Y),其中,invEOTF(Y)是EOTFPQ(.)函数的逆函数。

根据步骤62的另一实施例,当所述像素p在第一色度分量中的值等于第一给定值时,根据等式(16)获得第一值Val1(p);当所述像素p在第二色度分量中的值等于第二给定值时,根据等式(17)获得第二值Val2(p)。

然后,如果所述第一值Val1(p)大于第二值Val2(p),则将所述像素p的最大值MaxVal(p)确定为所述第一值Val1(p),否则确定为所述第二值Val2(p)。

第一和第二给定值可以等于不同的值UBV1和UBV2,或等于相同的值,当使用9个比特(+1个符号位)表示该值时,通常为511,即,给定值等于上限值UBV。

最后,在步骤62中,以所述最大值MaxVal(p)代替所述像素p在所述单个颜色分量中的值,来修改所述像素p在单个颜色分量中的值。

根据步骤62中的变型,如果所述像素p的所述最大值MaxVal(p)严格大于0且严格大于所述像素p在所述单个颜色分量中的值,则以所述最大值MaxVal(p)代替所述像素p在单个颜色分量中的值。

根据步骤62的实施例,如上所述,修改了所述像素p在第一颜色分量中的值,并且还修改了所述像素p在第二颜色分量中的值,所述第二颜色分量根据所述第一和第二值Val1(p)和Val2(p)确定。

例如,假设输入图像在RGB颜色空间中进行表示并且色度分量是通常的U和V色度分量,则第一值Val1(p)指的是U色度分量,第二值Val2(p)指的是V色度分量。当Val1(p)>Val2(p)时,第二颜色分量为R色度分量,否则为B色度分量。

根据步骤62的实施例的变型,将所述像素p在所述第二颜色分量中的所述值乘以最大值MaxVal(p)与所述像素p在第一颜色分量中的值的比值,来修改所述像素p在所述第二颜色分量中的值。

例如,假设输入图像在RGB颜色空间中进行表示并且色度分量是通常的U和V色度分量,则第一值Val1(p)指的是U色度分量,第二值Val2(p)指的是V色度分量。那么,如果Val1(p)大于Val2(p),即MaxVal(p)=Val1()且颜色非常饱和是由于U色度分量引起的,则R分量是要如下修改的第二颜色分量:

R(p)=R(p).Val1(p)/Value(p),其中,Value(p)是在修改所述像素在所述第一颜色分量中的值之前的像素p在所述第一颜色分量(例如,G)中的值。

以此方式,通过增加R分量值来补偿B分量的高值,从而导致输出图像中像素p的颜色的整体去饱和。

如果Val1(p)低于Val2(p),即,MaxVal(p)=Val2()且颜色的非常饱和是由于V色度分量引起的,则B分量是要如下修改的第二颜色分量:

B(p)=B(p).Val2(p)/Value(p),其中,Value(p)是在修改像素的在所述第一颜色分量中值之前的所述第一颜色分量(例如,G)中的像素p的值。

以此方式,通过增加B分量值来补偿R分量的高值,从而导致输出图像中像素p的颜色的整体去饱和。

根据步骤62的变型,仅当MaxVal(p)大于给定值LOW(例如,当范围以9位定义时为25)时,才修改所述像素p在第二颜色分量中的值。

该变型避免了在重构图像I3上引入不期望的色彩偏移,因为即使val(p)很低,MaxVal(p)/Val(p)之间的比率也不会取非常高的值。

根据步骤62的另一变型,仅当输入图像中的所述像素p的值val(p)低于所述像素p在单个颜色分量(或第一颜色分量)例如G分量中的值时,才修改所述像素p在第二颜色分量中的值。

该变型避免了当R(或B)颜色分量相对较高时,在输出图像上引入不期望的色彩偏移,因为将比值MaxVal(p)/val(p)应用于R(或B)颜色分量时,不会产生可能会在输出图像中引入不期望的颜色的过高的R(或B)颜色值。

根据另一变型,当MaxVal(p)低于给定值LOW2时,修改伽马编码的单个颜色分量的伽马因子。

通常,LOW2=1.0且当MaxVal(p)<LOW2时,伽马因子等于2.0,否则等于2.4。

这样的效果是极暗值的亮度不会被过度放大,从而避免了某些不期望的颜色在输出图像中弹出。

在图1至图4c和图6中,模块是功能单元,其与可区分的物理单元可以相关,也可以不相关。例如,这些模块或其中的一些模块可以集成在一个独特的组件或电路中,或帮助软件实现功能。相反,某些模块可能由单独的物理实体组成。与本实施例兼容的装置使用纯硬件,例如使用专用硬件,如ASIC或FPGA或VLSI,分别为“专用集成电路”、“现场可编程门阵列”、“超大规模集成”来实现,或者由嵌入在装置中的若干个集成电子组件来实现,或者由硬件和软件组件的混合来实现。

图5表示装置50的架构的示例性实施例,该装置可以被配置为实施结合图1至图4c所描述的方法。

装置50包括通过数据和地址总线51连接在一起的以下元件:微处理器52(或CPU),例如,DSP(或数字信号处理器);ROM(或只读存储器)53;RAM(或随机存取存储器)54;I/O接口55,用于从应用程序接收要发送的数据;以及可选地电池56。根据一个示例,电池56在装置外部。在所提及的每个存储器中,说明书中使用的词语“寄存器”可以对应于小容量(一些比特)的区域,或非常大的区域(例如整个程序或大量接收或解码的数据)。ROM 53至少包括程序和参数。ROM 53可以存储算法和指令以执行根据本实施例的技术。当上电时,CPU 52将程序上载到RAM 54中并执行相应的指令。RAM54在寄存器中包括由CPU 52执行并在装置50接通电源之后上载的程序,寄存器中的输入数据,寄存器中的方法的不同状态的中间数据,以及用于执行寄存器中的方法的其它变量。

可以以例如方法或过程、装置、软件程序、数据流或信号来实现本文中所描述的实施方式。即使仅在单一形式的实施方式的上下文中进行讨论(例如,仅作为方法或装置进行讨论),所讨论的特征的实施方式还可以以其他形式(例如,程序)来实现。装置可以以例如适当的硬件,软件和固件来实现。所述方法可以被实现于诸如处理器的装置中,所述处理器一般地是指处理装置,包括例如计算机,微处理器,集成电路或可编程逻辑装置。处理器还包括通信装置,例如,计算机,移动电话,便携/个人数字助理(“PDAs”),以及促进终端用户之间的信息通信的其他装置。

根据示例,从源获得输入视频或输入视频的图像。例如,源属于集合,该集合包括本地存储器(53或54),例如视频存储器或RAM(或随机存取存储器)、闪存、ROM(或只读存储器)、硬盘;存储接口(55),例如带有大容量存储器、RAM、闪存、ROM、光盘或磁性载体的接口;通信接口(55),例如有线接口(例如总线接口、广域网接口、局域网接口)或无线接口(例如IEEE 802.11接口或接口);以及图像捕获电路(例如,诸如CCD(或电荷耦合器件)或CMOS(或互补金属氧化物半导体)之类的传感器)。

根据一个示例,携带元数据的比特流被发送到目的地。作为示例,比特流存储在本地或远程存储器中,例如视频存储器或RAM(54),硬盘。在变型中,至少一个比特流被发送到存储接口(55),例如具有大容量存储装置、闪存、ROM、光盘或磁性载体的接口,和/或通过通信接口(55)被发送,例如用于点对点链接、通信总线、点对多点链接或广播网络的接口。

根据其他示例,从源获得携带元数据的比特流。示例性地,从本地存储器例如,视频存储器(54)、RAM(54)、ROM(53)、闪存(53)或硬盘(53),读取比特流。在变型中,从存储接口(55),例如,具有大容量存储装置、RAM、ROM、闪存、光盘或磁性载体的接口,接收比特流,和/或从通信接口(55),例如点对点链接、总线、点对多点链接或广播网络的接口,接收比特流。

根据一个示例,被配置为实现如上所述方法的装置50属于集合,该集合包括移动设备、通信设备、游戏设备、平板(或平板电脑),笔记本电脑、静止图像相机、摄像机、编码/解码芯片、电视机、机顶盒、显示器、静止图像服务器和视频服务器(例如广播服务器、视频点播服务器或web服务器)。

本文描述的各种过程和特征的实施方式可以体现在各种不同的设备或应用中。这种设备的示例包括编码器、解码器、处理解码器输出的后处理器、将输入提供给编码器的预处理器、视频编码器、视频解码器、视频编解码器、web服务器、机顶盒、膝上型计算机、个人计算机、手机、PDA以及用于处理图像或视频的任何其他装置或其他通信装置。应当清楚,设备可以是移动的甚至可以安装在移动车辆中。

此外,可以通过由处理器执行的指令来实现所述方法,并且可以将这样的指令(和/或由实施方式产生的数据值)存储在计算机可读存储介质上。计算机可读存储介质可以采用计算机可读程序产品的形式,所述计算机可读程序产品体现在一个或多个计算机可读介质中,并且其中体现有可由计算机执行的计算机可读程序代码。如本文使用的计算机可读存储介质被认为是非暂时性存储介质,其被赋予用于在其中存储信息的固有能力以及用于从中检索信息的固有能力。计算机可读存储介质可以是例如但不限于:电,磁,光,电磁,红外或半导体系统,装置或设备或前述的任意合适组合。应当理解,以下内容尽管提供了可以应用实施例的更具体的计算机可读存储介质的示例,但如本领域普通技术人员更容易认识到的,仅是说明性而非穷尽地列出:便携式计算机;软盘;硬盘;只读存储器(ROM);可擦除可编程只读存储器(EPROM或闪存);便携式紧凑盘只读存储器(CD-ROM);光存储设备;磁存储设备;或前述的任意合适组合。

指令可以形成有形地体现在处理器可读介质上的应用程序。指令可以是在例如硬件、固件、软件或其组合。指令可以在例如操作系统,单独的应用或两者的组合中找到。因此,处理器的特征可以在于,例如,被配置为执行过程的装置和包括具有用于执行过程的指令的处理器可读介质(例如存储设备)的装置。此外,处理器可读介质可以存储,除了或代替指令,由实施方式产生的数据值。

如对本领域技术人员将是明显的,实施方式可以产生各种信号,这些信号被格式化以携带例如可以被存储或发送的信息。该信息可以包括例如用于执行方法的指令或由所述实施方式之一产生的数据。例如,信号可以被格式化以将用于写入或读取所述实施例的所述示例的语法的规则作为数据携带,或者将由所述实施例的所述示例所写入的实际语法值作为数据携带。这样的信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。格式化可以包括例如对数据流进行编码并且用编码的数据流来调制载波。信号携带的信息可以是例如模拟或数字信息。众所周知,信号可以通过各种不同的有线或无线链路发送。信号可以存储在处理器可读介质上。

已经描述了多个实施方式。然而,应当理解,可以进行各种修改。例如,可以组合、增补、修改或去除不同实施方式的要素,以便产生其他实施方式。附加地,本领域普通技术人员将理解的是,其他结构或过程可以替代那些公开的结构或过程,并且所得到的实施方式将用至少基本相同的(多个)方式来执行至少基本相同的(多个)功能,以实现与所公开的实施方式基本相同的(多个)结果。因此,本申请考虑了这些和其他实施方式。

31页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:用于视频译码中帧内预测和帧间预测的插值滤波方法和装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类