深度图处理

文档序号:144834 发布日期:2021-10-22 浏览:63次 >En<

阅读说明:本技术 深度图处理 (Depth map processing ) 是由 D.多伊恩 B.范达姆 G.博伊森 于 2020-02-13 设计创作,主要内容包括:对于以MVD(多视图+深度)格式表示的多视图视频内容,可以处理深度图以改进它们之间的连贯性。在一种实施方式中,为了基于输入视图处理目标视图,首先将输入视图的像素投影到世界坐标系中,然后投影到目标视图中以形成投影视图。比较投影视图的纹理和目标视图的纹理。如果一像素处的差值很小,则调整该像素处的目标视图的深度,例如,替换为投影视图的对应深度。当在系统中对多视图视频内容进行编码和解码时,可以在预处理和后处理模块中应用深度图处理,以改进视频压缩效率和渲染质量。(For multiview video content represented in MVD (multiview &#43; depth) format, the depth map may be processed to improve the coherence between them. In one embodiment, to process the target view based on the input view, the pixels of the input view are first projected into the world coordinate system and then into the target view to form a projected view. The texture of the projection view and the texture of the target view are compared. If the difference at a pixel is small, the depth of the target view at that pixel is adjusted, e.g., replaced with the corresponding depth of the projection view. When multi-view video content is encoded and decoded in a system, depth map processing may be applied in pre-processing and post-processing modules to improve video compression efficiency and rendering quality.)

深度图处理

技术领域

本实施例总体上涉及一种用于深度图处理的方法和设备,更具体地,涉及一种用于处理与以MVD(多视图+深度)格式表示的多视图视频内容相关联的深度图的方法和设备。

背景技术

MVD是一种用于传输多视图内容(来自多个相机的多个视图)的格式,每个视图具有关联深度图。当以MVD格式表示多视图视频时,对于每个视图画面,纹理图像与深度图相关联,例如,以相同的像素分辨率。深度图可以通过不同的方法生成,例如通过计算或测量。MVD是用于扩展HEVC(高效视频编码)以压缩多个视图和关联深度信息的输入格式。这种格式也可能是H.266/VVC(通用视频编码)的未来扩展的输入格式,以解决未来的6DoF(六自由度)内容,例如MPEG当今称为“窗口化6DoF”的内容。

发明内容

根据实施例,提供了一种视频处理方法,包括:访问多视图视频内容的第一视图和第二视图;将所述第一视图中第一位置处的第一像素投影到所述第二视图中的第二位置上;确定(1)所述第一视图的所述第一像素的纹理信息与(2)所述第二视图中所述第二位置处的第二像素的纹理信息之间的差值;和响应于所述差值,基于所述第一视图的所述第一像素的深度值,调整所述第二视图的所述第二像素的深度值。

根据另一实施例,提供了一种用于视频处理的设备,包括一个或多个处理器,其中所述一个或多个处理器被配置为:访问多视图视频内容的第一视图和第二视图;将所述第一视图中第一位置处的第一像素投影到所述第二视图中的第二位置上;确定(1)所述第一视图的所述第一像素的纹理信息与(2)所述第二视图中所述第二位置处的第二像素的纹理信息之间的差值;和响应于所述差值,基于所述第一视图的所述第一像素的深度值,调整所述第二视图的所述第二像素的深度值。该设备还可包括耦合到所述一个或多个处理器的一个或多个存储器。

根据另一个实施例,提供了一种用于视频处理的设备,包括:用于访问多视图视频内容的第一视图和第二视图的部件;用于将所述第一视图中第一位置处的第一像素投影到所述第二视图中的第二位置上的部件;确定(1)所述第一视图的所述第一像素的纹理信息与(2)所述第二视图中所述第二位置处的第二像素的纹理信息之间的差值;和响应于所述差值,用于基于所述第一视图的所述第一像素的深度值、调整所述第二视图的所述第二像素的深度值的部件。

附图说明

图1图示了用于编码和解码多视图视频内容的系统。

图2图示了16相机阵列。

图3图示了来自视图的纹理图像及其关联深度。

图4图示了根据实施例的处理深度图的处理。

图5图示了世界坐标系和相机坐标系以及对应的转换矩阵。

图6图示了输入视图到目标视图上的前向投影。

图7图示了可以在其中实现本实施例的方面的系统的框图。

具体实施方式

为了提供运动视差,多视图内容应该足够密集以在视图之间提供足够的重叠,但具有不同的视角以允许这种视差。这意味着不同相机捕获的大量信息对应于场景的同一部分。这是压缩算法用来减少要传输的数据量的一个要素。在HEVC的3D-HEVC和MV-HEVC扩展中,已经引入了视图间预测。当时,多视图系统大多被认为是仅水平系统,并且预测机制仅利用水平方向。现在相机阵列不再仅仅是水平的,而是更多地处于2D(平面)甚至3D(非平面)排列中。

深度估计是提供多视图内容中的一种有用要素。由于内容的使用可能需要合成中间视点,因此通常传输深度信息。在一个示例中,计算深度信息的方式依赖于当前视图和相邻视图之间的匹配标准。为了限制计算量,仅使用最近的视图(通常使相关性最大化的视图)用于此类计算。通常,与视图相关联的深度信息是独立于其他视图计算的,因此来自不同视图的深度图可能缺乏连贯性。本实施例涉及修改深度图以在它们之间提供更多连贯性的方法。当使用来自视图的深度图信息将视图的像素解投影(de-projected)到世界坐标系时,可以通过位于空间(世界坐标系)中相同位置的对应视图的像素的数目,来测量两个深度图的连贯性。

MPEG-I节目的目标是6DoF内容的传递,它允许最终用户感知视差。客户端渲染的内容应实时适应观察者的头部运动。为了创建这种视差,人们不仅应该提供通常的2D内容,而且还应该提供与从初始视点未观看到但可以从其他视点观看的内容相对应的内容。此内容通常可以由相机阵列捕获,每个相机从略有不同的角度观看场景。相机之间的距离大致给出了系统将能够提供的视差量。

传输多视图内容的数据量是巨大的。它包括与每个视图关联的深度图,以使得能够在渲染端合成其他视点。MVD格式过去已用于传递此类内容。例如,它已经被用作HEVC的3D-HEVC扩展的输入格式。

如果视图合成用于生成用户可能请求的视点,则深度信息通常与纹理一起传输。此外,来自不同视图的深度图应该是连贯的,以实现正确的视图合成。在多视图采集系统中,世界坐标系(WCS)中的同一点可被几个相机捕获并属于几个视图。深度图估计应用于每个视图,并且其将深度信息与每个像素相关联。对于对应于WCS中同一点的两个视图的两个像素,关联深度应允许在应用解投影时在WCS中重新创建同一点。当给定数量的像素验证此属性时,我们在两个视图的深度图之间具有连贯性。否则,它们在WCS中的投影将不会在同一位置,并然后投影到合成视点将创建双像素效果。最后,这种差值可能会大大降低视图合成的质量。

在MPEG中开发的称为DERS(深度估计参考软件)的参考软件可供整个MPEG社区使用。自第一个版本以来,该软件已经进行了大量更新,现在DERS7.0是最新的参考版本。尽管如此,即使是最新的发展仍然没有解决不同深度图之间的连贯性需求。每个视图使用一组输入视图来估计其自己的深度图。由于对应于两个不同视图的两个估计之间没有相关性,因此估计的深度图通常是不连贯的。当使用来自不同视图的深度图来生成点云时,没有特殊的处理来确保对应于空间中同一点的两个深度估计将是连贯的。两个深度图可能碰巧会在空间中给出两个分离的点。使用这些深度的进一步处理可能会失败,因为空间中的同一点与多于一个深度相关联。

本方法试图为一组视图提供一组更连贯的深度图,以便具有与多视图加深度内容相关联的更连贯的点云。虽然点云中可能会保留孤立的像素,但结果是更加连贯的点云,其中对于场景中的给定点存在空间中的唯一3D点。因此可以改进诸如基于若干视图和关联深度的视图合成之类的进一步处理。

图1图示了用于编码和解码多视图视频内容的系统。以MVD格式表示的多视图视频内容用作输入。可以在预处理模块中处理深度图以改进连贯性。然后可以使用(多个)视频编码器/解码器,例如(多个)HEVC/VVC编码器/解码器,对多视图内容进行编码和解码。也可以传输元数据,例如用于捕获多视图视频内容的相机的姿势和内在参数。由于深度图中增强的连贯性,可以改进编码效率。在解码器侧,可以处理深度图以改进后处理模块中的连贯性。然后可以在动态视点处渲染多视图视频内容并向观看者显示。通过增强视图之间的连贯性,可以改进视图合成,并因此改进用户的观看体验。

图2图示了16相机阵列的示例(基于4个相机乘以4个相机),并且图3图示了一个视图及其相关联的深度图的示例。对于这种相机阵列,捕获的视图之间的重叠很重要。

图4图示了根据实施例的用于处理深度图的示例方法400。方法400可用于预处理和后处理模块,如图1所示。对于具有多个视图的多视图视频,该处理应用于至少一个视图,并且可以应用于一组输入视图或所有输入视图。在下文中,为了便于标注,我们将要处理其深度图的视图称为“目标视图”,将当前输入视图投影到目标视图上产生的视图称为“投影视图”。

在方法400中,在步骤410,选择要处理的目标视图。在一个示例中,将处理每个输入视图,即每个输入视图在某一时刻将是目标视图。在步骤420,选择目标视图之外的另一输入视图。该选择是在所有可能的输入视图之中或在相对于目标视图定义的一组输入视图之中完成的。例如,我们只能从最近的视图中进行选择。在步骤430,输入视图(m)的像素被前向投影(440)到目标视图上。在步骤450,例如基于纹理差值,评估投影视图的像素和目标视图的像素之间的光连贯性。在步骤455,如果光连贯性高于(455)给定阈值(即,差值低于给定阈值),则可以在步骤460启动深度替换的处理。

当没有更多像素要处理时(465,470),新的深度图可用作输出(475)。为了去除潜在的孤立错误深度信息,可以应用过滤,例如中值滤波器。该处理可以是递归的(490),即在处理目标视图结束时,将修改后的深度视为用于处理另一目标视图的新深度。或者,该处理不是递归的,即不考虑用于处理另一目标视图的目标视图的新深度,而是考虑旧深度。在处理所有目标视图之后(480),方法400在步骤499结束。

下面,更详细地描述可用于前向投影(440)、测量光连贯性(450)和深度值替换(460)的方法。

前向投影

让我们考虑校准为普通针孔的相机。设为其内在矩阵,其中f表示从出瞳到传感器的距离,以像素表示,通常称为“焦距”;表示所谓的“主点”的像素坐标,即针孔在传感器上的正交投影;并且α和γ分别表示像素的纵横比和传感器的偏斜系数。

如果是相机的坐标系(CS)中给定点的坐标,则其图像投影的坐标(以像素为单位)由下式给出:

其中符号“≡”表示齐次向量之间的等价关系:

现在假设表示相机的姿势矩阵,其中 分别表示相机在参考坐标系(CS)中的方位和位置。相机的外在矩阵定义为:

如果分别表示相机CS和参考CS中相同点的坐标,则并且如图5所示,图5示出了世界和相机坐标系以及对应的过渡矩阵。

现在让我们将给定的相机视为对应于输入视图,并假设m为它的索引。假设是当前像素在输入视图的纹理图像中的位置,z是它的假定深度。对于输入视图m(来自相机m)的像素P(u,v),可以执行一个输入视图m到目标视图n的前向投影,如图6所示。

首先,输入视图m的像素被解投影到世界坐标系(XYZ)中作为Pw。该解投影使用姿势矩阵、相机m的逆内在矩阵以及与该像素关联的深度Z(u,v)。随后,将像素Pw投影到目标视图n上,得到P'(u',v')。使用相机n的内在矩阵和外在矩阵,将空间Pw中的点投影到目标视图n上。

在数学上,从P(u,v)得到P'(u',v')的全局计算可以表示为:

当投影没有落入视图n区域时,可以拒绝投影。拒绝可能会导致投影视图中的某些像素出现空洞,并且不会对这些像素进行纹理比较。当投影落入相机n区域时,投影很可能不会落入真实像素上,而是在4个像素之间。如果像素未被拒绝,则可以选择相机n上最近的像素作为Pproj(up,vp)。最近的像素是使投影结果P'(u',v')与4个相邻像素之一之间的距离最小的像素,其中距离可以计算为坐标之间的平方差之和的平方根:

οP1(int(u’),int(v’))

οP2(int(u’)+1,int(v’))

οP3(int(u’),int(v’)+1)

οP4(int(u’)+1,int(v’)+1)

光连贯性

为了决定是否考虑来自目标视图的另一视图的深度信息,例如通过目标和投影纹理之间的加权差值,来评估投影像素的光连贯性。当差值低时,光连贯性高。在一个实施例中,该差值可以基于使用目标视图(Rt,Gt,Bt)和投影视图(Rp,Gp,Bp)两者的当前像素的纹理之间的绝对差值的比较。比较应用于纹理的三个分量(R,G,B),并且可以对每个分量使用不同的权重或使用相同的权重应用该比较。

Difference=wr*abs(Rt–Rp)+wg*abs(Gt–Gp)+wb*abs(Bt–Bp)

权重wr、wg和wb可以都等于1/3或可以具有不同的值,以便例如更好地表示它们对亮度的贡献。

在另一实施例中,比较是基于目标视图和投影视图两者的当前像素的纹理之间的平方差。该比较应用于纹理的三个分量(R,G,B),并且可以对每个分量使用不同的权重或使用相同的权重应用该比较。

Difference=wr*(Rt–Rp)2+wg*(Gt–Gp)2+wb*(Bt–Bp)2

权重wr、wg和wb可以都等于1/3或可以具有不同的值,以便例如更好地表示它们对亮度的贡献。

在另一实施例中,该比较基于目标视图和投影视图两者的当前像素周围的一组像素的纹理之间的平方差或绝对差。该比较应用于纹理的三个分量(R、G、B),并且可以对每个分量使用不同的权重或使用相同的权重应用该比较。窗口的尺寸可以是3*3或5*5像素或任何其他值。

Difference=ΣΣ(wr*(Rt–Rp)2+wg*(Gt–Gp)2+wb*(Bt–Bp)2)

深度值替换

如果纹理比较示出来自投影视图的像素与目标视图的像素相似(例如,纹理差值低于给定阈值且光连贯性高),则可能用与投影视图相关的深度值替换目标视图的深度值。例如,可以使用以下方案之一来完成。

第一种解决方案是简单地用投影视图的深度值替换目标视图的深度值。使用图6为例,目标视图n中Pproj(up,vp)处的深度值被输入视图m中P(u,v)处的深度值代替。第一种解决方案假设相机与平行光轴共面。与等式(1)相关,它意味着输入视图m的姿势矩阵与目标视图n的外在矩阵之间的关系如下:

其中θ表示绕z轴的旋转角度。结果,我们具有z'=z。

第二种解决方案是用重新计算的投影视图的深度值替换目标视图的深度值。这种重新计算整合了目标视图的姿势和内在相机参数。使用等式(1)计算新的z'值。

第三种解决方案是检查目标视图的深度值对于投影视图是否满足针对投影视图测试的标准。特别地,目标视图的深度用于实现逆处理,通过将目标视图投影到输入视图上并测试光连贯性是否高于阈值(该阈值可以相同或不同)。如果逆处理成功,则不进行替换,否则按前面所述进行替换。

在已经处理了目标视图之后(即新的深度图可用),由于在处理期间可能已经引入了孤立的深度数据,因此可以对结果进行过滤。为了消除这种孤立的深度数据,可以应用中值滤波器。应定义中值滤波器的尺寸、以及应用的中值滤波的次数。该尺寸可以是3*3像素或5*5或更大。中值滤波器出现的次数可以是一次或不止一次。典型值为5*5窗口和2次出现。取决于窗口的尺寸和出现的次数,中值滤波器的不同变体是可能的。也可以使用其他滤波器,例如平均滤波器。

在此描述了各种方法,并且每个方法包括用于实现所描述的方法的一个或多个步骤或动作。除非该方法的正确操作需要步骤或动作的特定顺序,否则可以修改或组合特定步骤和/或动作的顺序和/或使用。

在上文中,在描述视频编码器/解码器时使用HEVC或VVC。应当注意的是,本方面不限于VVC或HEVC,并且例如可以在使用其他标准和建议以及任何此类标准和建议的扩展时应用。纹理视频的色彩空间不限于RGB空间,例如可以用YUV表示。除非另有说明或技术上排除,本申请中描述的方面可以个别使用或组合使用。

本申请中使用各种数值,例如中值滤波器的尺寸。特定值用于示例的目的,并且所描述的方面不限于这些特定值。

图7图示了其中实现各个方面和实施例的系统的示例的框图。系统700可以实施为包括以下描述的各种组件的装置,并且被配置为执行本申请中描述的一个或多个方面。此类装置的示例包括但不限于各种电子装置,例如个人电脑、笔记本电脑、智能手机、平板电脑、数字多媒体机顶盒、数字电视接收器、个人视频记录系统、连接的家用电器和服务器。系统700的元件可以单独地或组合地实施在单个集成电路、多个IC和/或分立组件中。例如,在至少一个实施例中,系统700的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施例中,系统700经由例如通信总线或通过专用输入和/或输出端口,通信地耦合到其他系统或其他电子装置。在各种实施例中,系统700被配置为实现本申请中描述的一个或多个方面。

系统700包括至少一个处理器710,其被配置为执行加载在其中的指令以实现例如本申请中描述的各个方面。处理器710可以包括嵌入式存储器、输入输出接口、和本领域已知的各种其他电路。系统700包括至少一个存储器720(例如,易失性存储装置和/或非易失性存储装置)。系统700包括储存装置740,其可以包括非易失性存储器和/或易失性存储器,包括但不限于EEPROM、ROM、PROM、RAM、DRAM、SRAM、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,储存装置740可以包括内部储存装置、附加储存装置和/或网络可访问储存装置。

系统700包括编码器/解码器模块730,其被配置为例如处理数据以提供编码视频或解码视频,并且编码器/解码器模块730可以包括其自己的处理器和存储器。编码器/解码器模块730表示可以被包括在装置中以执行编码和/或解码功能的(多个)模块。如已知的,装置可以包括编码和解码模块之一或两者。此外,编码器/解码器模块730可以作为系统700的单独元件来实现,或者可以作为本领域技术人员已知的硬件和软件的组合并入处理器710内。

要在处理器710或编码器/解码器730上加载以执行本申请中描述的各个方面的程序代码可以存储在储存装置740中,随后加载到存储器720上以供处理器710执行。根据各种实施例,处理器710、存储器720、储存装置740和编码器/解码器模块730中的一个或多个可以在本申请中描述的处理的执行期间存储各种项目中的一个或多个。此类存储的项目可包括但不限于输入视频、解码视频或解码视频的一部分、比特流、矩阵、变量、以及来自方程、公式、运算和运算逻辑的处理的中间或最终结果。

在若干实施例中,处理器710和/或编码器/解码器模块730内部的存储器用于存储指令,并提供用于在编码或解码期间需要的处理的工作存储器。然而,在其他实施例中,处理装置外部的存储器(例如,处理装置可以是处理器710或编码器/解码器模块730)用于这些功能中的一个或多个。外部存储器可以是存储器720和/或存储装置740,例如动态易失性存储器和/或非易失性闪存。在若干实施例中,外部非易失性闪存用于存储电视的操作系统。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器用作视频编码和解码操作的工作存储器,例如用于MPEG-2、HEVC或VVC。

到系统700的元件的输入可以通过各种输入装置提供,如框705所示。这样的输入装置包括但不限于,(i)接收例如由广播器在空中传输的RF信号的RF部分,(ii)复合输入端子,(iii)USB输入端子,和/或(iv)HDMI输入端子。

在各种实施例中,框705的输入装置具有相关联的本领域已知的相应输入处理元件。例如,RF部分可以与适合于(i)选择期望频率(也称为选择信号,或将信号频带限制为频带),(ii)下变频所选信号,(iii)再次将频带限制到更窄的频带以选择(例如)在某些实施例中可以称为信道的信号频带,(iv)解调下变频和频带限制的信号,(v)执行纠错,以及(vi)解复用以选择期望的数据分组流的元件相关联。各种实施例的RF部分包括一个或多个元件来执行这些功能,例如频率选择器、信号选择器、带限器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可以包括执行这些功能中的各种功能的调谐器,包括例如将接收到的信号下变频到较低频率(例如,中间频率或近基带频率)或到基带。在一个机顶盒实施例中,RF部分及其相关联的输入处理元件接收通过有线(例如,线缆)介质传输的RF信号,并通过滤波、下变频和再次滤波到期望频带来执行频率选择。各种实施例重新排列上述(和其他)元素的顺序,移除这些元素中的一些,和/或添加执行类似或不同功能的其他元素。添加元件可以包括在现有元件之间插入元件,例如,插入放大器和模数转换器。在各种实施例中,RF部分包括天线。

此外,USB和/或HDMI端子可以包括相应的接口处理器,用于通过USB和/或HDMI连接将系统700连接到其他电子装置。应当理解,可以在必要时在例如单独的输入处理IC内或在处理器710内实现输入处理的各个方面,例如里德-所罗门纠错。类似地,USB或HDMI接口处理的方面可以根据需要在单独的接口IC内或在处理器710内实现。解调、纠错和解复用的流被提供给各种处理元件,包括例如处理器710、和编码器/解码器730,其与存储器和储存元件组合操作以根据需要处理数据流以在输出装置上呈现。

系统700的各种元件可提供在集成外壳内。在集成外壳内,各种元件可使用合适的连接设备715互连并在其间传输数据,例如本领域已知的内部总线,包括I2C总线、布线和印刷电路板。

系统700包括能够经由通信信道790与其他装置进行通信的通信接口750。通信接口750可以包括但不限于被配置为通过通信信道790传输和接收数据的收发器。通信接口750可以包括但不限于调制解调器或网卡,并且通信信道790可以例如在有线和/或无线介质内实现。

在各种实施例中,使用诸如IEEE 802.11的Wi-Fi网络将数据流式传输到系统700。通过适用于Wi-Fi通信的通信信道790和通信接口750,接收这些实施例的Wi-Fi信号。这些实施例的通信信道790通常连接到接入点或路由器,该接入点或路由器提供对包括因特网在内的外部网络的访问,以允许流应用和其他顶点之上(over-the-top)通信。其他实施例使用通过输入块705的HDMI连接传递数据的机顶盒向系统700提供流数据。还有其他实施例使用输入块705的RF连接向系统700提供流数据。

系统700可以向各种输出装置提供输出信号,包括显示器765、扬声器775和其他外围装置785。在实施例的各种示例中,其他外围装置785包括独立DVR、盘播放器、立体声系统、照明系统和基于系统700的输出提供功能的其他装置中的一个或多个。在各种实施例中,使用例如AV.Link、CEC或使能在有或没有用户干预的情况下进行装置到装置的控制的其他通信协议的信令,在系统700和显示器765、扬声器775或其他外围装置785之间传送控制信号。输出装置可以通过各自的接口760、770和780经由专用连接通信地耦合到系统700。或者,输出装置可以经由通信接口750使用通信信道790连接到系统700。显示器765和扬声器775可以与系统700的其他组件一起集成在电子装置(例如,电视机)中的单个单元中。在各种实施例中,显示接口760包括显示驱动器,例如时序控制器(T Con)芯片。

例如,如果输入705的RF部分是单独机顶盒的一部分,则显示器765和扬声器775可以替代地与一个或多个其他组件分开。在显示器765和扬声器775是外部组件的各种实施例中,可以经由专用输出连接提供输出信号,包括例如HDMI端口、USB端口或COMP输出。

根据实施例,提供了一种视频处理方法,包括:访问多视图视频内容的第一视图和第二视图;将所述第一视图中第一位置处的第一像素投影到所述第二视图中的第二位置上;确定(1)所述第一视图的所述第一像素的纹理信息与(2)所述第二视图中所述第二位置处的第二像素的纹理信息之间的差值;和响应于所述差值,基于所述第一视图的所述第一像素的深度值,调整所述第二视图的所述第二像素的深度值。

根据另一实施例,提供了一种用于视频处理的设备,包括一个或多个处理器,其中所述一个或多个处理器被配置为:访问多视图视频内容的第一视图和第二视图;将所述第一视图中第一位置处的第一像素投影到所述第二视图中的第二位置上;确定(1)所述第一视图的所述第一像素的纹理信息与(2)所述第二视图中所述第二位置处的第二像素的纹理信息之间的差值;和响应于所述差值,基于所述第一视图的所述第一像素的深度值,调整所述第二视图的所述第二像素的深度值。

根据另一实施例,提供了一种用于视频处理的设备,包括:用于访问多视图视频内容的第一视图和第二视图的部件;用于将所述第一视图中第一位置处的第一像素投影到所述第二视图中的第二位置上的部件;确定(1)所述第一视图的所述第一像素的纹理信息与(2)所述第二视图中所述第二位置处的第二像素的纹理信息之间的差值;和响应于所述差值,用于基于所述第一视图的所述第一像素的深度值调整所述第二视图的所述第二像素的深度值的部件。

在一个实施例中,所述投影包括:基于与用于捕获所述第一视图的相机相关联的姿势和逆内在参数,将所述第一像素投影到世界坐标系中的第四位置;基于与用于捕获所述第二视图的相机相关联的内在和外在参数,将所述世界坐标系中的所述第四位置投影到所述第二视图中的第五位置;并且从所述第五位置获得所述第二位置。在一个实施例中,所述获得包括选择与所述第五位置最近的像素位置作为所述第二位置。

在一个实施例中,所述多视图视频内容以多视图加深度(MVD)格式表示。

在一个实施例中,所述第一视图是所述第二视图的相邻视图。

在一个实施例中,所述差值基于(1)所述第一视图的所述第一像素的所述纹理信息和(2)所述第二视图的所述第二像素的所述纹理信息的三个分量的各自差值来确定。在另一实施例中,所述差值是基于(1)所述第一视图的所述第一像素周围的一组像素的纹理信息和(2)所述第二视图的所述第二像素周围的对应像素组的纹理信息的三个分量的相应差值来确定的。

在一个实施例中,如果所述差值小于一值,则执行所述调整。

在一个实施例中,所述调整还包括应用与所述第二视图相关联的姿势和内在参数。

在一个实施例中,所述一个或多个处理器还被配置为执行:将所述第二视图的所述第二像素投影到所述第一视图中的第三位置;以及确定(1)所述第二视图的所述第二像素的所述纹理信息与(2)所述第一视图中所述第三位置处的第三像素的纹理信息之间的第二差值,其中仅当所述第二差值小于第二值时,才执行所述调整。

在一个实施例中,对所述第一视图中的所有像素执行所述投影。例如,可以通过中值滤波器对所述投影结果进行滤波。所述投影结果可以形成投影视图。

在一个实施例中,所述第一视图由第一纹理图像和第一深度图表示,并且所述第二视图由第二纹理图像和第二深度图表示。

实施例提供了一种包括指令的计算机程序,该指令在由一个或多个处理器执行时,促使该一个或多个处理器执行根据上述任一实施例的视频处理方法。本实施例中的一个或多个还提供一种计算机可读储存介质,其上存储有用于根据上述方法处理深度数据的指令。

在此描述的实施方式和方面可以在例如方法或处理、设备、软件程序、数据流或信号中实施。即使仅在单一实现形式的上下文中讨论(例如,仅作为方法讨论),所讨论的特征的实现也可以以其他形式(例如,设备或程序)来实现。设备可以在例如适当的硬件、软件和固件中实现。所述方法例如可以在设备例如处理器中实现,处理器一般指代处理装置,包括例如计算机、微处理器、集成电路或可编程逻辑器件。处理器还包括通信装置,例如计算机、手机、便携式/个人数字助理(“PDA”)、和促进终端用户之间信息通信的其他装置。

对“一个实施例”或“实施例”或“一种实施方式”或“实施方式”及其其他变体的引用意味着结合实施例描述的特定特征、结构、特性等被包括在至少一个实施例中。因此,在本申请的各个地方出现的短语“在一个实施例中”或“在实施例中”或“在一种实施方式中”或“在实施方式中”、以及任何其他变体的出现不一定都是指相同的实施例。

此外,本申请可能涉及“确定”各条信息。确定信息可以包括例如估计信息、计算信息、预测信息、或从存储器中检索信息中的一种或多种。

此外,本申请可以指“访问”各条信息。访问信息可以包括例如接收信息、(例如从存储器)检索信息、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息、或估计信息中的一种或多种。

此外,该应用可以指“接收”各条信息。接收与“访问”一样,旨在是广义的术语。接收信息可包括例如访问信息或(例如,从存储器)检索信息中的一种或多种。此外,“接收”通常以一种或另一种方式涉及在操作期间,例如,存储信息、处理信息、传输信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息。

应当理解,使用以下“/”、“和/或”和“其中至少一个”,例如,在“A/B”、“A和/或B”的情况下”和“A和B中的至少一个”,旨在包括仅选择第一个列出的选项(A),或仅选择第二个列出的选项(B),或选择两个选项(A和B)。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一个”的情况下,这样的措辞旨在仅包含对第一个列出的选项(A)的选择,或仅选择第二个列出的选项(B),或仅选择第三个列出的选项(C),或仅选择第一个和第二个列出的选项(A和B),或仅选择第一个和第三个列出的选项(A和C),或仅选择第二个和第三个列出的选项(B和C),或选择所有三个选项(A和B和C)。正如本领域和相关领域的普通技术人员清楚的那样,这可以扩展用于与列出的一样多的项目。

对于本领域的普通技术人员来说显而易见的是,实现方式可以产生被格式化以携带例如可以被存储或传输的信息的各种信号。该信息可以包括例如用于执行方法的指令或由所描述的实现方式之一产生的数据。例如,信号可以被格式化以携带所描述的实施例的比特流。这种信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。格式化可以包括例如对数据流进行编码并用编码的数据流调制载波。信号携带的信息可以是例如模拟或数字信息。众所周知,信号可以通过各种不同的有线或无线链路传输。该信号可以存储在处理器可读介质上。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:残留DC测定装置、残留DC测定方法及残留DC测定程序

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类