多声道音频内容的编码

文档序号:1674056 发布日期:2019-12-31 浏览:20次 >En<

阅读说明:本技术 多声道音频内容的编码 (Encoding of multi-channel audio content ) 是由 H·普恩哈根 H·默德 K·克约尔林 于 2014-09-08 设计创作,主要内容包括:本发明公开了多声道音频内容的编码。提供了用于对多声道音频内容进行编码和解码以供在具有N个声道的扬声器配置上回放的解码和编码方法。该解码方法包括:在第一解码模块中将M个输入音频信号解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号;并且对于所述N个声道中的超过M个声道的每一个,接收与所述M个中间信号中的一个对应的另外的输入音频信号,以及对输入音频信号及其对应的中间信号进行解码以便产生立体声信号,该立体声信号包括适合于在扬声器配置的N个声道中的两个上回放的第一音频信号和第二音频信号。(The invention discloses encoding of multi-channel audio content. Decoding and encoding methods are provided for encoding and decoding multi-channel audio content for playback on a speaker configuration having N channels. The decoding method comprises the following steps: decoding the M input audio signals in a first decoding module into M intermediate signals suitable for playback on a loudspeaker configuration having M channels; and for each of more than M of said N channels, receiving a further input audio signal corresponding to one of said M intermediate signals, and decoding the input audio signal and its corresponding intermediate signal to produce a stereo signal comprising a first audio signal and a second audio signal suitable for playback on two of the N channels of the loudspeaker configuration.)

多声道音频内容的编码

本申请是基于申请号为201480050044.3、申请日为2014年9月8日、发明名称为“多声道音频内容的编码”的专利申请的分案申请。

技术领域

本文中的公开一般涉及多声道音频信号的编码。特别地,它涉及一种用于多个输入音频信号的编码和解码以供在具有某一数量的声道的扬声器配置上回放的编码器和解码器。

背景技术

多声道音频内容对应于具有某一数量的声道的扬声器配置。例如,多声道音频内容可以对应于具有五个前声道、四个环绕声道、四个天花板声道、以及低频效果(LFE)声道的扬声器配置。这样的声道配置可以被称为5/4/4.1、9.1+4或13.1配置。有时,期望在具有声道(即,扬声器)少于编码的多声道音频内容的扬声器配置的回放系统上回放编码的多声道音频内容。在下面,这样的回放系统被称为旧有回放系统。例如,可能期望在具有三个前声道、两个环绕声道、两个天花板声道、以及LFE声道的扬声器配置上回放编码的13.1音频内容。这样的声道配置也被称为3/2/2.1、5.1+2或7.1配置。

根据现有技术,原始多声道音频内容的所有声道的完整解码(接着下混到旧有回放系统的声道配置)将被需要。显然,这样的方法在计算上是低效的,因为原始多声道音频内容的所有声道都需要被解码。因此需要一种允许直接对适合于旧有回放系统的下混进行解码的编码方案。

具体实施方式

鉴于以上,因此目的在于提供用于多声道音频内容的编码/解码的编码/解码方法,其允许适合于旧有回放系统的下混的高效解码。

I.概述—解码器

根据第一方面,提供了用于对多声道音频内容进行解码的解码方法、解码器、以及计算机程序产品。

根据示例性实施例,提供了一种用于对多个输入音频信号进行解码以供在具有N个声道的扬声器配置上回放的解码器中的方法,所述多个输入音频信号表示与至少N个声道对应的编码的多声道音频内容,所述方法包括:

接收M个输入音频信号,其中,1<M≤N≤2M;

在第一解码模块中将所述M个输入音频信号解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号(mid signal);

对于所述N个声道中的超过M个声道的每一个:

接收与所述M个中间信号中的一个对应的另外的(additional)输入音频信号,所述另外的输入音频信号是侧边信号(side signal)或者连同中间信号和加权参数a一起允许重构侧边信号的补充信号(complementary signal);

在立体声解码模块中对所述另外的输入音频信号及其对应的中间信号进行解码以便产生立体声信号,所述立体声信号包括适合于在扬声器配置的N个声道中的两个上回放的第一音频信号和第二音频信号;

由此,产生适合于在扬声器配置的N个声道上回放的N个音频信号。

以上方法是有利的,因为在音频内容将在旧有回放系统上回放的情况下,解码器不必对多声道音频内容的所有声道进行解码并且形成完整多声道音频内容的下混。

更详细地,被设计为对与M声道扬声器配置对应的音频内容进行解码的旧有解码器可以简单地使用M个输入音频信号并将这些解码为适合于在M声道扬声器配置上回放的M个中间信号。在解码器侧不需要音频内容的进一步下混。事实上,适合于旧有回放扬声器配置的下混在编码器侧已经被准备好并被编码,并且由所述M个输入音频信号表示。

被设计为对与多于M个的声道对应的音频内容进行解码的解码器可以接收另外的输入音频信号并借助于立体声解码技术将这些与M个中间信号中的对应几个组合,以便达到与期望的扬声器配置对应的输出声道。因此,提议的方法是有利的,因为关于将被用于回放的扬声器配置它是灵活的。

根据示例实施例,所述立体声解码模块可在依赖于所述解码器按其接收数据的比特率的至少两个配置中操作。所述方法可以还包括接收关于所述至少两个配置中的哪个用在对所述另外的输入音频信号及其对应的中间信号进行解码的步骤中的指示。

这是有利的,因为关于编码/解码系统使用的比特率该解码方法是灵活的。

根据示例性实施例,接收另外的输入音频信号的步骤包括:

接收一对音频信号,所述一对音频信号对应于与所述M个中间信号中的第一个对应的另外的输入音频信号和与所述M个中间信号中的第二个对应的另外的输入音频信号的联合编码;和

对所述一对音频信号进行解码以便产生分别与所述M个中间信号中的第一个和第二个对应的另外的输入音频信号。

这是有利的,因为另外的输入音频信号可以被成对地高效编码。

根据示例性实施例,所述另外的输入音频信号是包括与直到第一频率的频率对应的谱数据的波形编码信号,并且所述对应的中间信号是包括与直到比所述第一频率大的频率的频率对应的谱数据的波形编码信号,并且其中,根据所述立体声解码模块的第一配置对所述另外的输入音频信号及其对应的中间信号进行解码的步骤包括以下步骤:

如果所述另外的音频输入信号是补充信号的形式,则通过将中间信号与加权参数a相乘并将乘法的结果与补充信号相加来计算对于直到所述第一频率的频率的侧边信号;和

对所述中间信号和侧边信号进行上混以便产生包括第一音频信号和第二音频信号的立体声信号,其中,对于低于所述第一频率的频率,所述上混包括执行所述中间信号和侧边信号的逆向的和与差(sum-and-difference)变换,而对于高于所述第一频率的频率,所述上混包括执行所述中间信号的参数化上混。

这是有利的,因为由立体声解码模块所执行的解码使得能够进行中间信号和对应的另外的输入音频信号的解码,其中,所述另外的输入音频信号被波形编码直到比对于中间信号的对应频率低的频率。以这种方式,该解码方法允许编码/解码系统以降低的比特率操作。

通过执行中间信号的参数化上混一般意指对于高于所述第一频率的频率,所述第一音频信号和第二音频信号基于中间信号被参数化重构。

根据示例性实施例,所述波形编码的中间信号包括与直到第二频率的频率对应的谱数据,所述方法还包括:

在执行参数化上混之前通过执行高频重构来将所述中间信号扩展到高于所述第二频率的频率范围。

以这种方式,该解码方法允许编码/解码系统以甚至进一步降低的比特率操作。

根据示例性实施例,所述另外的输入音频信号和对应的中间信号是包括与直到第二频率的频率对应的谱数据的波形编码信号,并且根据所述立体声解码模块的第二配置对所述另外的输入音频信号及其对应的中间信号进行解码的步骤包括以下步骤:

如果所述另外的音频输入信号是补充信号的形式,则通过将中间信号与加权参数a相乘并将乘法的结果与补充信号相加来计算侧边信号;和

执行所述中间信号和侧边信号的逆向的和与差变换以便产生包括第一音频信号和第二音频信号的立体声信号。

这是有利的,因为由立体声解码模块所执行的解码进一步使得能够进行中间信号和对应的另外的输入音频信号的解码,其中,所述另外的输入音频信号被波形编码直到相同的频率。以这种方式,该解码方法允许编码/解码系统也以高比特率操作。

根据示例性实施例,所述方法还包括:通过执行高频重构来将所述立体声信号的第一音频信号和第二音频信号扩展到高于所述第二频率的频率范围。这是有利的,因为关于编码/解码系统的比特率的灵活性进一步增加。

根据示例性实施例,在所述M个中间信号将在具有M个声道的扬声器配置上回放的情况下,所述方法还可以包括:

通过基于高频重构参数执行高频重构来扩展所述M个中间信号中的至少一个的频率范围,所述高频重构参数与可以从所述M个中间信号中的所述至少一个及其对应的另外的音频输入信号产生的立体声信号的第一音频信号和第二音频信号相关联。

这是有利的,因为高频重构的中间信号的质量可以被改进。

根据示例性实施例,在所述另外的输入音频信号为侧边信号的形式的情况下,使用具有不同变换大小的修正离散余弦变换来对所述另外的输入音频信号和对应的中间信号进行波形编码。这是有利的,因为关于选择变换大小的灵活性被增加。

示例性实施例还涉及一种包括计算机可读介质的计算机程序产品,所述计算机可读介质具有用于执行以上公开的编码方法中的任何一个的指令。所述计算机可读介质可以是非暂时性计算机可读介质。

示例性实施例还涉及一种用于对多个输入音频信号进行解码以供在具有N个声道的扬声器配置上回放的解码器,所述多个输入音频信号表示与至少N个声道对应的编码的多声道音频内容,所述解码器包括:

接收组件,所述接收组件被配置为接收M个输入音频信号,其中,1<M≤N≤2M;

第一解码模块,所述第一解码模块被配置为将所述M个输入音频信号解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号;

用于所述N个声道中的超过M个声道的每一个的立体声编码模块,,所述立体声编码模块被配置为:

接收与所述M个中间信号中的一个对应的另外的输入音频信号,所述另外的输入音频信号是侧边信号或者连同中间信号和加权参数a一起允许重构侧边信号的补充信号;

对所述另外的输入音频信号及其对应的中间信号进行解码以便产生立体声信号,所述立体声信号包括适合于在扬声器配置的N个声道中的两个上回放的第一音频信号和第二音频信号;

由此,所述解码器被配置为产生适合于在扬声器配置的N个声道上回放的N个音频信号。

II.概述—编码器

根据第二方面,提供了用于对多声道音频内容进行解码的编码方法、编码器、以及计算机程序产品。

该第二方面总体上可以具有与第一方面相同的特征和优点。

根据示例性实施例,提供了一种用于对多个输入音频信号进行编码的编码器中的方法,所述多个输入音频信号表示与K个声道对应的多声道音频内容,所述方法包括:

接收与具有K个声道的扬声器配置的声道对应的K个输入音频信号;

从所述K个输入音频信号产生M个中间信号和K-M个输出音频信号,所述M个中间信号适合于在具有M个声道的扬声器配置上回放,其中,1<M<K≤2M,

其中,所述中间信号中的2M-K个对应于所述输入音频信号中的2M-K个;并且

其中,剩余的K-M个中间信号和所述K-M个输出音频信号通过对于K的超过M的每个值执行以下步骤产生:

在立体声编码模块中,对所述K个输入音频信号中的两个进行编码以便产生中间信号和输出音频信号,所述输出音频信号是侧边信号或者连同中间信号和加权参数a一起允许重构侧边信号的补充信号;

在第二编码模块中将所述M个中间信号编码为M个另外的输出音频声道;以及

将所述K-M个输出音频信号和M个另外的输出音频声道包括在数据流中以用于传输到解码器。

根据示例性实施例,所述立体声编码模块可在依赖于所述编码器的期望比特率的至少两个配置中操作。所述方法还可以包括将关于在对所述K个输入音频信号中的两个进行编码的步骤中被所述立体声编码模块使用的所述至少两个配置中的哪个的指示包括在所述数据流中。

根据示例性实施例,所述方法还可以包括在包括在所述数据流中之前成对地执行所述K-M个输出音频信号的立体声编码。

根据示例性实施例,在所述立体声编码模块根据第一配置操作的情况下,对所述K个输入音频信号中的两个进行编码以便产生中间信号和输出音频信号的步骤包括:

将所述两个输入音频信号变换为第一信号和第二信号,所述第一信号是中间信号,所述第二信号是侧边信号;

将所述第一信号和第二信号分别波形编码为第一波形编码信号和第二波形编码信号,其中,所述第二信号被波形编码直到第一频率,而所述第一信号被波形编码直到比所述第一频率大的第二频率;

使所述两个输入音频信号经受参数化立体声编码以便提取参数化立体声参数,所述参数化立体声参数使得能够重构所述K个输入音频信号中的所述两个的高于第一频率的频率的谱数据;以及

将所述第一波形编码信号和第二波形编码信号以及参数化立体声参数包括在所述数据流中。

根据示例性实施例,所述方法还包括:

对于低于所述第一频率的频率,通过将作为中间信号的波形编码的第一信号乘以加权参数a并从第二波形编码信号减去乘法的结果来将作为侧边信号的波形编码的第二信号变换为补充信号;和

将所述加权参数a包括在所述数据流中。

根据示例性实施例,所述方法还包括:

使作为中间信号的第一信号经受高频重构编码以便产生高频重构参数,所述高频重构参数使得能够进行所述第一信号的高于所述第二频率的高频重构;和

将所述高频重构参数包括在所述数据流中。

根据示例性实施例,在所述立体声编码模块根据第二配置操作的情况下,对所述K个输入音频信号中的两个进行编码以便产生中间信号和输出音频信号的步骤包括:

将所述两个输入音频信号变换为第一信号和第二信号,所述第一信号是中间信号,所述第二信号是侧边信号;

将所述第一信号和第二信号分别波形编码为第一波形编码信号和第二波形编码信号,其中,所述第一信号和第二信号被波形编码直到第二频率;和

包括所述第一波形编码信号和第二波形编码信号。

根据示例性实施例,所述方法还包括:

通过将作为中间信号的波形编码的第一信号乘以加权参数a并从第二波形编码信号减去乘法的结果来将作为侧边信号的波形编码的第二信号变换为补充信号;和

将所述加权参数a包括在所述数据流中。

根据示例性实施例,所述方法还包括:

使所述K个输入音频信号中的所述两个中的每一个经受高频重构编码以便产生高频重构参数,所述高频重构参数使得能够进行所述K个输入音频信号中的所述两个的高于所述第二频率的高频重构;和

将所述高频重构参数包括在所述数据流中。

示例性实施例还涉及一种包括计算机可读介质的计算机程序产品,所述计算机可读介质具有用于执行示例性实施例的编码方法的指令。所述计算机可读介质可以是非暂时性计算机可读介质。

示例性实施例还涉及一种用于对多个输入音频信号进行编码的编码器,所述多个输入音频信号表示与K个声道对应的多声道音频内容,所述编码器包括:

接收组件,所述接收组件被配置为接收与具有K个声道的扬声器配置的声道对应的K个输入音频信号;

第一编码模块,所述第一编码模块被配置为从所述K个输入音频信号产生M个中间信号和K-M个输出音频信号,所述M个中间信号适合于在具有M个声道的扬声器配置上回放,其中,1<M<K≤2M,

其中,所述中间信号中的2M-K个对应于所述输入音频信号中的2M-K个,并且

其中,所述第一编码模块包括被配置为产生剩余的K-M个中间信号和所述K-M个输出音频信号的K-M个立体声编码模块,每个立体声编码模块被配置为:

对所述K个输入音频信号中的两个进行编码以便产生中间信号和输出音频信号,所述输出音频信号是侧边信号或者连同中间信号和加权参数a一起允许重构侧边信号的补充信号;

第二编码模块,所述第二编码模块被配置为将所述M个中间信号编码为M个另外的输出音频声道,以及

复用组件,所述复用组件被配置为将所述K-M个输出音频信号和M个另外的输出音频声道包括在数据流中以用于传输到解码器。

III.示例实施例

具有左声道(L)和右声道(R)的立体声信号可以以与不同立体声编码方案对应的不同形式表示。根据在本文中被称为左-右编码“LR编码”的第一编码方案,立体声转换组件的输入声道L、R和输出声道A、B根据以下表达式关联:

L=A;R=B。

换句话说,LR编码仅仅意味着输入声道的传递(pass-through)。由其L声道和R声道表示的立体声信号被说成具有L/R表示或者为L/R形式。

根据在本文中被称为和与差编码(或中间-侧边编码“MS编码”)的第二编码方案,立体声转换组件的输入声道和输出声道根据以下表达式关联:

A=0.5(L+R);B=0.5(L-R)。

换句话说,MS编码涉及计算输入声道的和与差。这在本文中被称为执行和与差变换。由于这个原因,声道A可以被看作第一声道L和第二声道R的中间信号(和信号M),而声道B可以被看作第一声道L和第二声道R的侧边信号(差信号S)。在立体声信号已经受和与差编码的情况下,它被说成具有中间/侧边(M/S)表示或者是中间/侧边(M/S)形式。

从解码器角度来讲,对应的表达式是:

L=(A+B);R=(A-B)。

将中间/侧边形式的立体声信号转换为L/R形式在本文中被称为执行逆向的和与差变换。

中间-侧边编码方案可以一般化为在本文中被称为“增强的MS编码”(或增强的和差编码)的第三编码方案。在增强的MS编码中,立体声转换组件的输入声道和输出声道根据以下表达式关联:

A=0.5(L+R);B=0.5(L(1–a)–R(1+a)),

L=(1+a)A+B;R=(1-a)A–B,

其中,a是加权参数。该加权参数a可以是时间和频率变量。同样,在该情况下,信号A可以被认为是中间信号,而信号B可以被认为是修正的侧边信号或补充的侧边信号。特别是,对于a=0,增强的MS编码方案退化为中间-侧边编码。在立体声信号已经受增强的中间/侧边编码的情况下,它被说成具有中间/补充/a表示(M/c/a)或者是间/补充/a形式。

根据以上,补充信号可以通过将对应的中间信号与参数a相乘并将乘法的结果与补充信号相加而变换为侧边信号。

图1示出根据示例性实施例的解码系统中的解码方案100。数据流120被接收组件102接收。该数据流120表示与K个声道对应的编码的多声道音频内容。接收组件102可以对数据流120进行解复用和解量化,以便形成M个输入音频信号122和K-M个输入音频信号124。这里,假定M<K。

M个输入音频信号122被第一解码模块104解码为M个中间信号126。该M个中间信号适合于在具有M个声道的扬声器配置上回放。第一解码模块104一般可以根据任何已知的用于对与M个声道对应的音频内容进行解码的解码方案进行操作。因此,在解码系统是旧有或低复杂度的、仅支持在具有M个声道的扬声器配置上回放的解码系统的情况下,该M个中间信号可以在该扬声器配置的M个声道上回放,而无需原始音频内容的所有K个声道的解码。

在支持在具有N个声道的扬声器配置上回放的解码系统(其中,M<N≤K)的情况下,解码系统可以将M个中间信号126和K-M个输入音频信号124中的至少一些提交给第二解码模块106,该第二解码模块106产生适合于在具有N个声道的扬声器配置上回放的N个输出音频信号128。

根据两个替代方案中的一个,K-M个输入音频信号124中的每一个对应于M个中间信号126中的一个。根据第一替代方案,输入音频信号124是与M个中间信号126中的一个对应的侧边信号,使得中间信号和对应的输入音频信号形成以中间/侧边形式表示的立体声信号。根据第二替代方案,输入音频信号124是与M个中间信号126中的一个对应的补充信号,使得中间信号和对应的输入音频信号形成以中间/补充/a形式表示的立体声信号。因此,根据第二替代方案,侧边信号可以从补充信号连同中间信号和加权参数a一起重构。当使用第二替代方案时,加权参数a被包括在数据流120中。

如下面将更详细地解释的,第二解码模块106的N个输出音频信号128中的一些可以与M个中间信号126中的一些直接对应。此外,第二解码模块可以包括一个或多个立体声解码模块,每个立体声解码模块对M个中间信号126中的一个及其对应的输入音频信号124进行操作以产生一对输出音频信号,其中,每对产生的输出音频信号适合于在扬声器配置的N个声道中的两个上回放。

图2示出编码系统中的与图1的解码方案100对应的编码方案200。与具有K个声道的扬声器配置的声道对应的K个输入音频信号228(其中,K>2)被接收组件(未示出)接收。该K个输入音频信号被输入到第一编码模块206。基于K个输入音频信号228,第一编码模块206产生K-M个输出音频信号224和适合于在具有M个声道的扬声器配置上回放的M个中间信号226,其中,M<K≤2M。

一般地,如下面将更详细地解释的,M个中间信号226中的一些(通常是中间信号226中的2M-K个)对应于K个输入音频信号228中的相应的一个。换句话说,第一编码模块206靠使K个输入音频信号228中的一些通过来产生M个中间信号226中的一些。

M个中间信号226中的剩余的K-M个一般通过对没有通过第一编码模块206的输入音频信号228进行下混(即,线性组合)而产生。特别地,第一编码模块可以成对地对这些输入音频信号228进行下混。出于这个目的,第一编码模块可以包括一个或多个(通常是K-M个)立体声编码模块,每个立体声编码模块对一对输入音频信号228进行操作以产生中间信号(即,下混或和信号)和对应的输出音频信号224。根据以上讨论的两个替代方案中的任何一个,该输出音频信号224对应于中间信号,即,输出音频信号224是侧边信号或者连同中间信号和加权参数a一起允许侧边信号的重构的补充信号。在后一种情况下,加权参数a被包括在数据流220中。

M个中间信号226然后被输入到第二编码模块204,在该第二编码模块204中,它们被编码为M个另外的输出音频信号222。第二编码模块204一般可以根据任何已知的用于对与M个声道对应的音频内容进行编码的编码方案进行操作。

M个另外的输出音频信号222和来自第一编码模块的N-M个输出音频信号224然后通过复用组件202量化并包括在数据流220中以供传输到解码器。

在参照图1-2描述的编码/解码方案的情况下,K声道音频内容到M声道音频内容的适当下混在编码器侧(由第一编码模块206)执行。以这种方式,实现了K声道音频内容的高效解码以供在具有M个声道(或者更一般地,N个声道)的声道配置上回放,其中,M≤N≤K。

下面将参照图3-8来描述解码器的示例实施例。

图3示出被配置用于多个输入音频信号的解码以供在具有N个声道的扬声器配置上回放的解码器300。该解码器300包括接收组件302、第一解码模块104、第二解码模块106,该第二解码模块106包括立体声解码模块306。第二解码模块106还可以包括高频扩展组件308。解码器300还可以包括立体声转换组件310。

下面将描述解码器300的操作。接收组件302从编码器接收数据流320(即,比特流)。该接收组件302可以例如包括用于将数据流320解复用为其组成部分的解复用组件和用于接收的数据的解量化的解量化器。

接收的数据流320包括多个输入音频信号。一般地,该多个输入音频信号可以对应于与具有K个声道的扬声器配置对应的编码的多声道音频内容,其中,K≥N。

特别地,数据流320包括M个输入音频信号322,其中,1<M<N。在示出的示例中,M等于七,使得存在七个输入音频信号322。然而,根据其它示例,可以取其它数字,诸如五个。而且,数据流320包括N-M个音频信号323,N-M个输入音频信号324可以从该N-M个音频信号323解码。在示出的示例中,N等于十三,使得存在六个另外的输入音频信号324。

数据流320还可以包括另外的音频信号321,该另外的音频信号321通常对应于编码的LFE声道。

根据示例,N-M个音频信号323的一对可以对应于N-M个输入音频信号324的一对的联合编码。立体声转换组件310可以对N-M个音频信号323的这样的对进行解码以产生N-M个输入音频信号324的对应对。例如,立体声转换组件310可以通过将MS或增强的MS解码应用于N-M个音频信号323的所述对来执行解码。

M个输入音频信号322和另外的音频信号321(如果可用的话)被输入到第一解码模块104。如参照图1所讨论的,该第一解码模块104将M个输入音频信号322解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号326。如该示例中所示出的,该M个声道可以对应于中心前置扬声器(C)、左前扬声器(L)、右前扬声器(R)、左环绕扬声器(LS)、右环绕扬声器(RS)、左天花板扬声器(LT)、以及右天花板扬声器(RT)。第一解码模块104还将另外的音频信号321解码为输出音频信号325,该输出音频信号325通常对应于低频效果LFE扬声器。

如以上参照图1进一步讨论的,另外的输入音频信号324中的每一个对应于中间信号326中的一个,因为它是与该中间信号对应的侧边信号或者与该中间信号对应的补充信号。举例来说,输入音频信号324中的第一个可以对应于与左前扬声器相关联的中间信号326,输入音频信号324中的第二个可以对应于与右前扬声器等相关联的中间信号326。

M个中间信号326和N-M个音频输入音频信号324被输入到第二解码模块106,该第二解码模块106产生适合于在N声道扬声器配置上回放的N个音频信号328。

第二解码模块106将中间信号326中的不具有对应的残余信号的那些中间信号映射到N声道扬声器配置的对应声道,可选地经由高频重构组件308。例如,与M声道扬声器配置的中心前置扬声器(C)对应的中间信号可以被映射到N声道扬声器配置的中心前置扬声器(C)。高频重构组件308类似于稍后将参照图4和5描述的那些。

第二解码模块106包括N-M个立体声解码模块306,由中间信号326和对应的输入音频信号324构成的每一对一个立体声解码模块306。一般地,每个立体声解码模块306执行联合立体声解码以产生立体声音频信号,该立体声音频信号映射到N声道扬声器配置的声道中的两个。举例来说,将与7声道扬声器配置的左前扬声器(L)对应的中间信号及其对应的输入音频信号324当作输入的立体声解码模块306产生立体声音频信号,该立体声音频信号映射到13声道扬声器配置的两个左前扬声器(“Lwide”和“Lscreen”)。

立体声解码模块306可在依赖于编码器/解码器系统按其操作的数据传输率(比特率)(即,解码器300按其接收数据的比特率)的至少两个配置中操作。第一配置可以例如对应于中等比特率,诸如每立体声解码模块306大约32-48kbps。第二配置可以例如对应于高比特率,诸如每立体声解码模块306超过48kbps的比特率。解码器300接收关于使用哪个配置的指示。例如,这样的指示可以通过编码器经由数据流320中的一个或多个比特用信号通知给解码器300。

图4示出当立体声解码模块306根据与中等比特率对应的第一配置工作时的立体声解码模块306。该立体声解码模块306包括立体声转换组件440、各种时间/频率变换组件442、446、454,高频重构(HFR)组件448、以及立体声上混组件452。立体声解码模块306被约束为将中间信号326和对应的输入音频信号324当作输入。假定中间信号326和输入音频信号324在频域(通常为修正离散余弦变换(MDCT)域)中被表示。

为了实现中等比特率,至少输入音频信号324的带宽被限制。更确切地说,输入音频信号324是包括与直到第一频率k1的频率对应的谱数据的波形编码信号。中间信号326是包括与直到比第一频率k1大的频率的频率对应的谱数据的波形编码信号。在一些情况下,为了节省必须在数据流320中被发送的更多比特,中间信号326的带宽也被限制,使得中间信号326包括直到比第一频率k1大的第二频率k2的谱数据。

立体声转换组件440将输入信号326、324变换为中间/侧边表示。如以上进一步讨论的,中间信号326和对应的输入音频信号324可以以中间/侧边形式或者中间/补充/a形式表示。在前一种情况下,由于输入信号已经为中间/侧边形式,所以立体声转换组件440从而使输入信号326、324通过而没有任何修改。在后一种情况下,立体声转换组件440使中间信号326通过,而作为补充信号的输入音频信号324被变换为对于直到第一频率k1的频率的侧边信号。更确切地说,立体声转换组件440通过将中间信号326与加权参数a(其从数据流320接收)相乘并将乘法的结果与输入音频信号324相加来确定对于直到第一频率k1的频率的侧边信号。作为结果,立体声转换组件从而输出中间信号326和对应的侧边信号424。

关于这一点,值得注意的是,在中间信号326和输入音频信号324被以中间/侧边形式接收的情况下,在立体声转换组件440中没有信号324、326的混合发生。结果,中间信号326和输入音频信号324可以借助于具有不同变换大小的MDCT变换而被编码。然而,在中间信号326和输入音频信号324被以中间/补充/a形式接收的情况下,中间信号326和输入音频信号324的MDCT编码限于相同的变换大小。

在中间信号326具有有限带宽的情况下(即,如果中间信号326的谱内容(spectralcontent)限于直到第二频率k2的频率),该中间信号326通过高频重构组件448经受高频重构(HFR)。通过HFR一般意指参数化技术,该参数化技术基于信号的低频(在该情况下为低于第二频率k2的频率)的谱内容和在数据流320中从编码器接收的参数,重构该信号的高频(在该情况下为高于第二频率k2的频率)的谱内容。这样的高频重构技术在本领域中是已知的,并且包括例如谱带复制(SBR)技术。HFR组件448从而将输出具有直到系统中所表示的最大频率的谱内容的中间信号426,其中,高于第二频率k2的谱内容被参数化重构。

高频重构组件448通常在正交镜像滤波器(QMF)域中操作。因此,在执行高频重构之前,中间信号326和对应的侧边信号424可以首先通过通常执行逆向MDCT变换的时间/频率变换组件442被变换到时域,并然后通过时间/频率变换组件446被变换到QMF域。

中间信号426和侧边信号424然后被输入到立体声上混组件452,该立体声上混组件452产生以L/R形式表示的立体声信号428。由于侧边信号424仅具有对于直到第一频率k1的频率的谱内容,所以立体声上混组件452不同地对待低于和高于第一频率k1的频率。

更详细地,对于直到第一频率k1的频率,立体声上混组件452将中间信号426和侧边信号424从中间/侧边形式变换为L/R形式。换句话说,立体声上混组件对于直到第一频率k1的频率执行逆向的和差变换。

对于高于第一频率k1的频率(在这些频率处,没有谱数据提供给侧边信号424),立体声上混组件452从中间信号426参数化重构立体声信号428的第一分量和第二分量。一般地,立体声上混组件452经由数据流320接收在编码器侧出于这个目的而已被提取的参数,并使用这些参数以进行重构。一般地,可以使用任何已知的用于参数化立体声重构的技术。

鉴于以上,由立体声上混组件452输出的立体声信号428从而具有直到系统中所表示的最大频率的谱内容,其中,高于第一频率k1的谱内容被参数化重构。类似于HFR组件448,立体声上混组件452通常在QMF域中操作。因此,立体声信号428通过时间/频率变换组件454被变换到时域,以便产生在时域中表示的立体声信号328。

图5示出当立体声解码模块306根据与高比特率对应的第二配置操作时的立体声解码模块306。该立体声解码模块306包括第一立体声转换组件540、各种时间/频率变换组件542、546、554,第二立体声转换组件452、以及高频重构(HFR)组件548a、548b。立体声解码模块306被约束为将中间信号326和对应的输入音频信号324当作输入。假定中间信号326和输入音频信号324在频域(通常为修正离散余弦变换(MDCT)域)中被表示。

在高比特率情况下,关于输入信号326、324的带宽的限制不同于中等比特率情况。更确切地说,中间信号326和输入音频信号324是包括与直到第二频率k2的频率对应的谱数据的波形编码信号。在一些情况下,第二频率k2可以对应于系统所表示的最大频率。在其它情况下,第二频率k2可以低于系统所表示的最大频率。

中间信号326和输入音频信号324被输入到第一立体声转换组件540以供变换为中间/侧边表示。该第一立体声转换组件540类似于图4的立体声转换组件440。不同之处在于,在输入音频信号324为补充信号的形式的情况下,第一立体声转换组件540将补充信号变换为对于直到第二频率k2的频率的侧边信号。因此,立体声转换组件540输出中间信号326和对应的侧边信号524,这两个信号都具有直到第二频率的谱内容。

中间信号326和对应的侧边信号524然后被输入到第二立体声转换组件552。该第二立体声转换组件552形成中间信号326和侧边信号524的和与差,以便将中间信号326和侧边信号524从中间/侧边形式变换为L/R形式。换句话说,第二立体声转换组件执行逆向的和与差变换,以便产生具有第一分量528a和第二分量528b的立体声信号。

优选地,第二立体声转换组件552在时域中操作。因此,在被输入到第二立体声转换组件552之前,中间信号326和侧边信号524可以通过时间/频率变换组件542被从频域(MDCT域)变换到时域。作为替代方案,第二立体声转换组件552可以在QMF域中操作。在这样的情况下,图5的组件546和552的次序将被反过来。这是有利的,因为在第二立体声转换组件552中发生的混合将不对关于中间信号326和输入音频信号324的MDCT变换大小施加任何进一步的限制。因此,如以上进一步讨论的,在中间信号326和输入音频信号324被以中间/侧边形式接收的情况下,它们可以借助于使用不同变换大小的MDCT变换而被编码。

在第二频率k2低于所表示的最高频率的情况下,立体声信号的第一和第二分量528a、528b可以通过高频重构组件548a、548b经受高频重构(HFR)。该高频重构组件548a、548b类似于图4的高频重构组件448。然而,在该情况下,值得注意的是,第一组高频重构参数经由数据流230被接收,并且在立体声信号的第一分量528a的高频重构中被使用,以及第二组高频重构参数经由数据流230被接收,并且在立体声信号的第二分量528b的高频重构中被使用。因此,高频重构组件548a、548b输出包括直到系统中所表示的最大频率的谱数据的立体声信号的第一和第二分量530a、530b,其中,高于第二频率k2的谱内容被参数化重构。

优选地,高频重构在QMF域中执行。因此,在经受高频重构之前,立体声信号的第一和第二分量528a、528b可以通过时间/频率变换组件546被变换到QMF域。

从高频重构组件548输出的立体声信号的第一和第二分量530a、530b然后可以通过时间/频率变换组件554被变换到时域,以便产生在时域中表示的立体声信号328。

图6示出被配置用于包括在数据流620中的多个输入音频信号的解码以供在具有11.1声道的扬声器配置上回放的解码器600。该解码器600的结构总体上类似于图3中所示出的结构。不同之处在于,示出的扬声器配置的声道数量与图3相比较少,在图3中,示出了具有13.1声道的扬声器配置,其具有LFE扬声器、三个前置扬声器(中心C、左L和右R)、四个环绕扬声器(左侧Lside、左后Lback、右侧Rside、右后Rback)、以及四个天花板扬声器(左上前置LTF、左上后置LTB、右上前置RTF、和右上后置RTB)。

在图6中,第一解码组件104输出七个中间信号626,这些信号可以对应于扬声器配置的声道C、L、R、LS、RS、LT和RT。而且,存在四个另外的输入音频信号624a-d。该另外的输入音频信号624a-d每一个对应于中间信号626中的一个。举例来说,输入音频信号624a可以是与LS中间信号对应的侧边信号或补充信号,输入音频信号624b可以是与RS中间信号对应的侧边信号或补充信号,输入音频信号624c可以是与LT中间信号对应的侧边信号或补充信号,并且输入音频信号624d可以是与RT中间信号对应的侧边信号或补充信号。

在示出的实施例中,第二解码模块106包括图4和图5中所示出的类型的四个立体声解码模块306。每个立体声解码模块306将中间信号626中的一个和对应的另外的输入音频信号624a-d当作输入,并且输出立体声音频信号328。例如,基于LS中间信号和输入音频信号624a,第二解码模块106可以输出与Lside和Lback扬声器对应的立体声信号。更多的示例从该图是显然的。

此外,第二解码模块106充当中间信号626中的三个(这里,与C、L和R声道对应的中间信号)的传递通道(pass through)。依赖于这些信号的谱带宽,第二解码模块106可以通过使用高频重构组件308来执行高频重构。

图7示出旧有或低复杂度的解码器700如何对与具有K个声道的扬声器配置对应的数据流720的多声道音频内容进行解码以供在具有M个声道的扬声器配置上回放。举例来说,K可以等于十一或十三,而M可以等于七。该解码器700包括接收组件702、第一解码模块704、以及高频重构模块712。

如参照图1中的数据流120进一步描述的,数据流720一般可以包括M个输入音频信号722(参见图1和图3中的信号122和322)和K-M个另外的输入音频信号(参见图1和图3中的信号124和324)。可选地,数据流720可以包括另外的音频信号721,该另外的音频信号721通常对应于LFE声道。由于解码器700对应于具有M个声道的扬声器配置,所以接收组件702从数据流720仅提取M个输入音频信号722(和另外的音频信号721,如果存在的话),并且丢弃剩余的K-M个另外的输入音频信号。

这里通过七个音频信号示出的M个输入音频信号722和另外的音频信号721然后被输入到第一解码模块104,该第一解码模块104将M个输入音频信号722解码为与M声道扬声器配置的声道对应的M个中间信号726。

在M个中间信号726仅包括直到低于系统所表示的最大频率的某一频率的谱内容的情况下,借助于高频重构模块712可以使M个中间信号726经受高频重构。

图8示出这样的高频重构模块712的示例。高频重构模块712包括高频重构组件848和各种时间/频率变换组件842、846、854。

借助于HFR组件848使输入到HFR模块712的中间信号726经受高频重构。该高频重构优选地在QMF域中执行。因此,通常为MDCT谱的形式的中间信号726在被输入到HFR组件848之前,可以通过时间/频率变换组件842被变换到时域,并然后通过时间/频率变换组件846被变换到QMF域。

HFR组件848一般以与例如图4和图5的HFR组件448、548相同的方式操作,因为它使用输入信号的较低频的谱内容连同从数据流720接收的参数,以便参数化重构较高频的谱内容。然而,依赖于编码器/解码器系统的比特率,HFR组件848可以使用不同的参数。

如参照图5所解释的,对于高比特率情况以及对于具有对应的另外的输入音频信号的每个中间信号,数据流720包括第一组HFR参数和第二组HFR参数(参见图5的项548a、548b的描述)。即使解码器700不使用与中间信号对应的另外的输入音频信号,HFR组件848在执行中间信号的高频重构时也可以使用第一组HFR参数和第二组HFR参数的组合。例如,高频重构组件848可以使用第一组和第二组的HFR参数的下混(诸如平均或线性组合)。

HFR组件854从而输出具有扩展的谱内容的中间信号828。该中间信号828然后借助于时间/频率变换组件854被变换到时域,以便给出具有时域表示的输出信号728。

下面将参照图9-11来描述编码器的示例实施例。

图9示出被归入图2的一般结构的编码器900。该编码器900包括接收组件(未示出)、第一编码模块206、第二编码模块204、以及量化和复用组件902。第一编码模块206还可以包括高频重构(HFR)编码组件908和立体声编码模块906。编码器900可以还包括立体声转换组件910。

现在将解释编码器900的操作。接收组件接收与具有K个声道的扬声器配置的声道对应的K个输入音频信号928。例如,K个声道可以对应于如上所述的13声道配置的声道。此外,通常与LFE声道对应的另外的声道925可以被接收。K个声道被输入到第一编码模块206,该第一编码模块206产生M个中间信号926和K-M个输出音频信号924。

第一编码模块206包括K-M个立体声编码模块906。该K-M个立体声编码模块906中的每一个将K个输入音频信号中的两个当作输入,并且产生中间信号926中的一个和输出音频信号924中的一个,如下面将更详细地解释的。

第一编码模块206还将没有被输入到立体声编码模块906中的一个的剩余的输入音频信号映射到M个中间信号926中的一个,可选地经由HFR编码组件908。该HFR编码组件908类似于将参照图10和图11描述的那些。

M个中间信号926,可选地连同通常表示LFE声道的另外的输入音频信号925一起,被输入到如以上参照图2描述的第二编码模块204以编码为M个输出音频声道922。

在被包括在数据流920中之前,K-M个输出音频信号924可选地可以借助于立体声转换组件910被成对地编码。例如,立体声转换组件910可以通过执行MS或增强的MS编码来对K-M个输出音频信号924中的一对进行编码。

M个输出音频信号922(以及从另外的输入音频信号925得到的另外的信号)和K-M个输出音频信号924(或者从立体声编码组件910输出的音频信号)通过量化和复用组件902被量化并包括在数据流920中。而且,由不同的编码组件和模块提取的参数可以被量化并包括在数据流中。

立体声编码模块906可在依赖于编码器/解码器系统按其操作的数据传输率(比特率)(即,编码器900按其传输数据的比特率)的至少两个配置中操作。第一配置可以例如对应于中等比特率。第二配置可以例如对应于高比特率。编码器900将关于使用哪个配置的指示包括在数据流920中。例如,这样的指示可以经由数据流920中的一个或多个比特而被用信号通知。

图10示出当立体声编码模块906根据与中等比特率对应的第一配置操作时的立体声编码模块906。该立体声编码模块906包括第一立体声转换组件1040、各种时间/频率变换组件1042、1046,HFR编码组件1048、参数化立体声编码组件1052、以及波形编码组件1056。立体声编码模块906还可以包括第二立体声转换组件1043。该立体声编码模块906将输入音频信号928中的两个当作输入。假定输入音频信号928在时域中被表示。

第一立体声转换组件1040通过根据以上形成和与差来将输入音频信号928变换为中间/侧边表示。因此,第一立体声转换组件940输出中间信号1026和侧边信号1024。

在一些实施例中,中间信号1026和侧边信号1024然后通过第二立体声转换组件1043被变换为中间/补充/a表示。第二立体声转换组件1043提取加权参数a以用于包括在数据流920中。加权参数a可以是时间和频率相关的,即,它可以在数据的不同时间帧和频带之间变化。

波形编码组件1056使中间信号1026和侧边或补充信号经受波形编码,以便产生波形编码的中间信号926和波形编码的侧边或补充信号924。

第二立体声转换组件1043和波形编码组件1056通常在MDCT域中操作。因此,中间信号1026和侧边信号1024可以在第二立体声转换和波形编码之前借助于时间/频率变换组件1042被变换到MDCT域。在信号1026和1024不经受第二立体声转换1043的情况下,不同的MDCT变换大小可以被用于中间信号1026和侧边信号1024。在信号1026和1024经受第二立体声转换1043的情况下,相同的MDCT变换大小应当被用于中间信号1026和补充信号1024。

为了实现中等比特率,至少侧边或补充信号924的带宽被限制。更确切地说,侧边或补充信号被针对直到第一频率k1的频率进行波形编码。因此,波形编码的侧边或补充信号924包括与直到第一频率k1的频率对应的谱数据。中间信号1026被针对直到比第一频率k1大的频率的频率进行波形编码。因此,中间信号926包括与直到比第一频率k1大的频率的频率对应的谱数据。在一些情况下,为了节省必须在数据流920中被发送的更多比特,中间信号926的带宽也被限制,使得波形编码的中间信号926包括直到比第一频率k1大的第二频率k2的谱数据。

在中间信号926的带宽被限制的情况下(即,如果中间信号926的谱内容限于直到第二频率k2的频率),中间信号1026通过HFR编码组件1048经受HFR编码。一般地,HFR编码组件1048对中间信号1026的谱内容进行分析并提取一组参数1060,该组参数1060使得能够基于信号的低频(在该情况下为高于第二频率k2的频率)的谱内容来重构信号的高频(在该情况下为高于第二频率k2的频率)的谱内容。这样的HFR编码技术在本领域中是已知的,并且包括例如谱带复制(SBR)技术。该组参数1060被包括在数据流920中。

HFR编码组件1048通常在正交镜像滤波器(QMF)域中操作。因此,在执行HFR编码之前,中间信号326可以通过时间/频率变换组件1046被变换到QMF域。

输入音频信号928(或者可替代地,中间信号1046和侧边信号1024)在参数化立体声(PS)编码组件1052中经受参数化立体声编码。一般地,参数化立体声编码组件1052对输入音频信号928进行分析并提取参数1062,该参数1062使得能够基于对于高于第一频率k1的频率的中间信号1026来重构输入音频信号928。参数化立体声编码组件1052可以应用任何已知的用于参数化立体声编码的技术。参数1062被包括在数据流920中。

参数化立体声编码组件1052通常在QMF域中操作。因此,输入音频信号928(或者可替代地,中间信号1046和侧边信号1024)可以通过时间/频率变换组件1046被变换到QMF域。

图11示出当立体声编码模块906根据与高比特率对应的第二配置操作时的立体声编码模块906。该立体声编码模块906包括第一立体声转换组件1140、各种时间/频率变换组件1142、1146,HFR编码组件1048a、1048b、以及波形编码组件1156。可选地,立体声编码模块906可以包括第二立体声转换组件1143。该立体声编码模块906将输入音频信号928中的两个当作输入。假定输入音频信号928在时域中被表示。

第一立体声转换组件1140类似于第一立体声转换组件1040,并且将输入音频信号928变换为中间信号1126和侧边信号1124。

在一些实施例中,中间信号1126和侧边信号1124然后通过第二立体声转换组件1143被变换为中间/补充/a表示。第二立体声转换组件1043提取加权参数a以用于包括在数据流920中。加权参数a可以是时间和频率相关的,即,它可以在数据的不同时间帧和频带之间变化。波形编码组件1156然后使中间信号1126和侧边或补充信号经受波形编码,以便产生波形编码的中间信号926和波形编码的侧边或补充信号924。

波形编码组件1156类似于图10的波形编码组件1056。然而,关于输出信号926、924的带宽出现重要的不同。更确切地说,波形编码组件1156执行中间信号1126和侧边或补充信号的直到第二频率k2(其通常大于关于中间比特率情况描述的第一频率k1)的波形编码。作为结果,波形编码的中间信号926和波形编码的侧边或补充信号924包括与直到第二频率k2的频率对应的谱数据。在一些情况下,第二频率k2可以对应于系统所表示的最大频率。在其它情况下,第二频率k2可以低于系统所表示的最大频率。

在第二频率k2低于系统所表示的最大频率的情况下,输入音频信号928通过HFR组件1148a、1148b经受HFR编码。HFR编码组件1148a、1148b中的每一个与图10的HFR编码组件1048类似地操作。因此,HFR编码组件1148a、1148b分别产生第一组参数1160a和第二组参数1160b,这些参数使得能够基于输入音频信号928的低频(在该情况下为高于第二频率k2的频率)的谱内容来重构各个输入音频信号928的高频(在该情况下为高于第二频率k2的频率)的谱内容。第一组和第二组参数1160a、1160b被包括在数据流920中。

等同、扩展、替代和其它

在研究以上描述之后,本公开的进一步的实施例对于本领域技术人员将变得清楚。即使目前的描述和附图公开了实施例和示例,但本公开也不限于这些具体示例。在不脱离由随附权利要求限定的本公开的范围的情况下,可以进行许多修改和变型。在权利要求中出现的任何附图标记都不应被理解为限制它们的范围。

另外,对公开的实施例的变型可以由技术人员在实施本公开时从附图、公开和所附权利要求的研究来理解和实现。在权利要求中,词语“包括”不排除其它元件或步骤,并且不定冠词“一个”不排除多个。仅有的某些措施在相互不同的独立权利要求中被记载的事实并不表明这些措施的组合不能被用于获利。

在上文中公开的系统和方法可以被实现为软件、固件、硬件或其组合。在硬件实现中,在以上描述中提及的功能单元之间的任务的划分不一定对应于划分成物理单元;相反,一个物理组件可以具有多个功能,并且一个任务可以由若干物理组件合作执行。某些组件或全部组件可以被实现为由数字信号处理器或微处理器执行的软件,或者被实现为硬件或专用集成电路。这样的软件可以分发在计算机可读介质上,该计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域技术人员公知的,术语计算机存储介质包括以存储信息(诸如计算机可读指令、数据结构、程序模块或其它数据)的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质两者。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪速存储器或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储设备、或者可以被用于存储期望信息并且可以被计算机访问的任何其它介质。此外,技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块、或调制数据信号(诸如载波或其它输送机制)中的其它数据,并且包括任何信息递送介质。

所有的附图都是示意性的,并且一般仅示出了为了阐明本公开而必要的部分,而其它部分则可以被省略或者仅仅被建议。除非另外指出,否则同样的附图标记在不同的附图中指代同样的部分。

26页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:信号编码方法和装置以及信号解码方法和装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类