音频信号动态范围压缩

文档序号:1568605 发布日期:2020-01-24 浏览:35次 >En<

阅读说明:本技术 音频信号动态范围压缩 (Audio signal dynamic range compression ) 是由 游余立 于 2018-11-29 设计创作,主要内容包括:本申请公开了音频信号动态范围压缩。提供了用于压缩音频信号的动态范围的系统、方法和技术。在一个实现方式中:获得输入音频信号,并基于该信号和期望的输出范围提供时变增益信号。随后将时变的初步增益信号施加到输入音频信号以提供输出音频信号。时变增益信号的提供包括使用攻击增益响应时间和释放增益响应时间作为滤波参数对基于输入音频信号的信号进行低通滤波,其中响应于确定输入音频信号中出现瞬变,攻击增益响应时间减少,而释放增益响应时间增加。(Audio signal dynamic range compression is disclosed. Systems, methods, and techniques for compressing the dynamic range of an audio signal are provided. In one implementation: an input audio signal is obtained and a time varying gain signal is provided based on the signal and a desired output range. The time-varying preliminary gain signal is then applied to the input audio signal to provide an output audio signal. The providing of the time-varying gain signal comprises low-pass filtering the input audio signal based signal using an attack gain response time and a release gain response time as filtering parameters, wherein the attack gain response time decreases and the release gain response time increases in response to determining that a transient occurs in the input audio signal.)

音频信号动态范围压缩

发明领域

本发明除其他方面之外涉及与音频信号范围的动态压缩(例如,从信号的最小电平到其最大电平)相关的并且可以用于例如在更好地防止或限制音频失真和/或对输出设备(诸如扬声器或耳机)的损坏的同时提高音频信号的音量,以及总体上改善收听体验的系统、方法和技术。

背景

某些音频通道的动态范围有时比可用的输出设备(诸如扩音器)能够精确或清晰地产生的范围宽得多。例如,当音频信号低时,重现的声音可能听不见,而当音频信号高时,重现的声音可能削波或过载。看电影的人可能需要在喧闹场景过程中调低音量,而在安静场景的过程中调高音量。

动态范围压缩试图解决这些问题。它指的是一类用于减小音频信号的动态范围以适应回放设备和/或情景要求的技术。在D.Giannoulis、M.Massberg和J.Reiss于2012年在Journal of Audio Engineering Society 60:第399-408页发表的“Digital DynamicRange Compressor Design-A Tutorial and Analysis”(其在本文中被称为“Giannoulis2012”)中给出了这种技术的回顾。

一种传统的实现方式是图1中所示的动态范围压缩器(DRC)5。在那里,Abs模块10执行绝对值运算,而Log模块12执行对数函数。在更具体的实现方式中,Log模块12将输入值转换成分贝,如下所示:

XG(n)=20log10(|x(n)|),

其中,x(n)表示输入信号,并且XG(n)表示在第n个采样周期处的转换信号。

增益计算机14然后实现静态范围压缩,例如,如下(来自Giannoulis 2012):

Figure BDA0001885317160000021

其中,T、R和w分别是指定阈值、压缩比和拐点宽度(knee width)。如本文所用,术语“静态”指的是不参考其他输入值(即,其他时间点处的输入值)对单独输入值的修改。增益计算机14的其他实现方式也是可能的,诸如在Rane Corporation于2005年的“DynamicProcessors-Technology&Application Tips”(在本文中称为“Rane 2005”)中给出的任何实现方式,例如包括前述压缩与扩展器和限制器的组合。

如图1所示,然后在减法器15中从增益计算机14的输入中减去增益计算机14的输出,以获得以下负增益信号:

XL=XG-YG 方程2

其被输入到电平检测器16中,用于基本上对XL,应用平滑化操作以获得信号电平的平滑化表示。电平检测器16有许多可能的实现方式,包括Giannoulis 2012中描述的那些中的任一个。在一个特定示例中,电平检测器16执行以下运算:

Y1(n)=max(XL(n),αRY1(n-1)+(1-αR)XL(n))

YL(n)=αAYL(n-1)+(1-αA)Y1(n) 方程3

其中,Y1(n)是内部状态,αA和αR是各自的一阶无限脉冲响应(IIR)滤波器的攻击极点和释放极点(attack and release poles)。这些极点控制YL(n)的平滑度,或者YL(n)对XL(n)变化进行响应的速度。每个都与τ相关,τ是相应的时间常数(TC),如下所示:

Figure BDA0001885317160000022

其中,fs是采样频率。换句话说,

Figure BDA0001885317160000023

Figure BDA0001885317160000024

其中,τA和τR分别是攻击TC和释放TC。

在电平检测器16中进行平滑化后,在加法器18中,补偿增益19(M)与平滑化后的负增益的相反数相加,然后由指数函数模块20将结果转换成线性标度,例如,如下所示:

Figure BDA0001885317160000031

然后,在乘法器21中,该线性增益被施加到(可选地延迟的)输入信号,以产生输出信号,如下所示:

y(n)=K(n)x(n-τ)

其中,τ是由可选的延迟单元22提供的可选延迟,其可用于匹配增益计算侧链30内的延迟和/或向侧链30提供“向前看得更远”的能力(例如,为了“准备”DRC 5以更好地应对强大的攻击)。然而,在一些实施例中,完全省略了延迟单元22。

正如将从上面的讨论中容易认识到的,DRC通常将输入信号乘以随时间变化的增益,因此它执行将失真引入信号的运算。为了将这种失真保持为低且理想情况下是听不见的,应该使用大的TC,使得增益变化缓慢。这种大的TC对于音频信号的似稳态分段有效,但是通常会遇到短暂的攻击或者突然的强有力的声音爆发的问题,诸如可能是由敲击乐器或者***产生的。当这种强大的攻击到来时,大的TC产生的缓慢增益变化不能足够快地降低增益,以防止攻击超出期望范围的上限。因此,音频信号可能在数字域中削波(导致失真),功率放大器可能过载(潜在地损坏它),和/或扩音器的音圈可能撞击其背板(潜在地损坏扬声器)。所有这些情况都会产生令人讨厌的声音,且在某些情况下可能会造成损害。因此,期望使TC适应输入信号的动态变化性质,例如,使得:(1)允许在强大攻击期间的快速增益降低,以及(2)在似稳态分段期间提供更慢变化的增益。

在这方面已经做了一些尝试。例如,D.Giannoulis、M.Massberg和J.Reiss于2013年在Journal of the Audio Engineering Society的716-726页发表的“ParameterAutomation in a Dynamic Range Compressor”(其在本文中被称为“Giannoulis 2013”)采用瞬变或攻击检测器来区分输入信号的瞬变和似稳态分段,然后对瞬变分段使用较短的TC,而对似稳态分段使用较长的TC。通常,这种传统方法在似稳态分段期间使用“标准”攻击和释放TC。例如,在似稳态分段期间,攻击TC可能是50-100毫秒(ms),而释放TC(通常是10倍大)可能是500-1000ms。然后,当检测到瞬变时,这些值通常会以10的因子减少,或这样,即攻击TC减少到5-10ms,而释放TC减少到50-100ms。

发明概述

不幸的是,虽然在短暂的攻击期间使用短攻击TC和释放TC以及在似稳态分段期间使用长攻击和释放TC的传统直接方法似乎符合直觉逻辑,但是本发明人已经发现这种方法实际上往往不能提供良好的结果。本发明解决了这个问题,例如,通过调整TC或者允许增益以多快速度变化的其他度量(本文有时称为“增益响应时间”),其不同于过去已经使用的方法。

因此,本发明的一个实施例针对压缩音频信号的动态范围,例如,其中:获得输入音频信号;基于输入音频信号和期望的输出范围提供时变增益信号;并且时变增益信号被施加到输入音频信号以提供输出音频信号。本实施例中的时变增益信号的提供包括:(i)确定并提供输入音频信号中是否出现瞬变的指示,(ii)基于输入音频信号中是否出现瞬变的指示,提供攻击增益响应时间(例如,攻击指数时间常数)和释放增益响应时间(例如,释放指数时间常数),以及(iii)使用攻击增益响应时间和释放增益响应时间作为滤波参数,对基于输入音频信号的信号进行低通滤波。响应于输入音频信号中出现瞬变的确定,攻击增益响应时间减少,而释放增益响应时间增加。优选地,攻击增益响应时间主要控制允许输出音频信号强度响应于输入音频信号强度的突然增加而增加的速度有多快,而释放增益响应时间主要控制允许输出音频信号强度响应于输入音频信号强度的突然降低而降低的速度有多快。

如下文更详细讨论的,输入音频信号中是否出现瞬变的指示优选地被提供作为攻击函数值,其还指示任何检测到的瞬变的强度的度量。优选地,由于检测到的瞬变的强度的更大度量,攻击增益响应时间减少得更多,而释放增益响应时间增加得更多。

根据本发明的攻击函数能够以各种不同的方式实现,包括以下任意一种或任意组合:(1)基于使用峰值的波峰因子检测器;(2)基于与指定阈值相比的输入音频信号的强度;和/或(3)作为增量值,通过首先确定初步攻击值,然后计算作为先前一个初步攻击值和当前一个初步攻击值之间的变化量的增量值。输入音频信号可以是基于帧的,例如,其中针对输入音频信号的各个帧确定输入音频信号中是否出现瞬变的指示,或者不是基于帧的,其中基于逐个样本确定是否出现瞬变的指示。

在优选实施例中,时变增益信号的生成还包括识别将实现期望静态范围压缩的增益(例如,使用输入音频信号值的分段线性映射)。

前面的概述仅旨在提供本发明的某些方面的简要描述。通过结合附图参考权利要求和优选实施例的以下详细描述,可以获得对本发明的更完整的理解。

根据本发明的实施例,还包括以下内容:

1)一种压缩音频信号的动态范围的方法,包括:

(a)获得输入音频信号;

(b)基于所述输入音频信号和期望的输出范围提供时变增益信号;和

(c)将所述时变增益信号施加到所述输入音频信号以提供输出音频信号,

其中,步骤(b)包括:(i)确定并提供所述输入音频信号中是否出现瞬变的指示,(ii)基于所述输入音频信号中是否出现瞬变的所述指示,提供攻击增益响应时间和释放增益响应时间,以及(iii)使用所述攻击增益响应时间和所述释放增益响应时间作为滤波参数,对基于所述输入音频信号的信号进行低通滤波,以及

其中,响应于所述输入音频信号中出现瞬变的确定,所述攻击增益响应时间减少,而所述释放增益响应时间增加。

2)根据1)所述的方法,其中,所述输入音频信号中是否出现瞬变的所述指示表明检测到的瞬变的强度的度量。

3)根据2)所述的方法,其中,作为检测到的瞬变的强度的更大度量的结果,所述攻击增益响应时间减少得更多,而所述释放增益响应时间增加得更多。

4)根据1)所述的方法,其中,所述输入音频信号中是否出现瞬变的所述指示基于使用峰值的波峰因子检测器。

5)根据4)所述的方法,其中,所述输入音频信号中是否出现瞬变的所述指示也基于与指定阈值比较的所述输入音频信号的强度。

6)根据1)所述的方法,其中,所述输入音频信号中是否出现瞬变的所述指示基于与指定阈值比较的所述输入音频信号的强度。

7)根据1)-6)中任一项所述的方法,其中,通过首先确定多个初步攻击值且然后计算作为所述多个初步攻击值中的先前一个初步攻击值和所述多个初步攻击值中的当前一个初步攻击值之间的变化量的增量值,来将所述输入音频信号中是否出现瞬变的所述指示计算为所述增量值。

8)根据1)-6)中任一项所述的方法,其中,所述输入音频信号是基于帧的,并且针对所述输入音频信号的各个帧来确定在所述输入音频信号中是否出现瞬变的所述指示。

9)根据1)-6)中任一项所述的方法,其中,步骤(b)还包括识别增益以实现期望的静态范围压缩。

10)根据1)-6)中任一项所述的方法,其中,所述攻击增益响应时间和所述释放增益响应时间中的每一个是指数时间常数。

11)根据1)-6)中任一项所述的方法,其中,所述攻击增益响应时间主要控制允许所述输出音频信号的强度响应于所述输入音频信号的强度的突然增加而增加的速度有多快,而所述释放增益响应时间主要控制允许所述输出音频信号的强度响应于所述输入音频信号的强度的突然降低而降低的速度有多快。

12)一种用于压缩音频信号的动态范围的系统,包括:

(a)系统输入端,其接受输入音频信号;

(b)自适应增益生成模块,其具有耦合到所述系统输入端的输入端和基于所述输入音频信号和期望的输出范围提供时变增益信号的输出端;

(c)乘法器,其具有输出端、耦合到所述系统输入端的第一输入端和耦合到所述自适应增益生成模块的输出端的第二输入端,

其中,所述自适应增益生成模块包括具有输入端和输出端的电平检测器和增益计算机,

其中,所述电平检测器包括:(i)攻击检测模块,其确定并提供所述输入音频信号中是否出现瞬变的指示,(ii)增益响应时间发生器,其基于已经由所述攻击检测模块提供的所述输入音频信号中是否出现瞬变的所述指示,提供攻击增益响应时间和释放增益响应时间,以及(iii)滤波器,其使用所述攻击增益响应时间和所述释放增益响应时间作为滤波参数,对已经输入到所述电平检测器中的信号进行低通滤波,以及

其中,响应于所述攻击检测模块的瞬变检测,所述增益响应时间发生器缩短了所述攻击增益响应时间并增加了所述释放增益响应时间。

13)根据12)所述的系统,其中,由所述攻击检测模块提供的所述输入音频信号中是否出现瞬变的所述指示表明检测到的瞬变的强度的度量。

14)根据13)所述的系统,其中,作为检测到的瞬变的强度的更大度量的结果,所述攻击增益响应时间减少得更多,而所述释放增益响应时间增加得更多。

15)根据12)所述的系统,其中,所述输入音频信号中是否出现瞬变的所述指示基于使用峰值的波峰因子检测器。

16)根据15)所述的系统,其中,所述输入音频信号中是否出现瞬变的所述指示也基于与指定阈值比较的所述输入音频信号的强度。

17)根据12)所述的系统,其中,所述输入音频信号中是否出现瞬变的所述指示基于与指定阈值比较的所述输入音频信号的强度。

18)根据12)-17)中任一项所述的系统,其中,通过首先确定多个初步攻击值且然后计算作为所述多个初步攻击值中的先前一个初步攻击值和所述多个初步攻击值中的当前一个初步攻击值之间的变化量的增量值,将所述输入音频信号中是否出现瞬变的所述指示计算为所述增量值。

19)根据12)-17)中任一项所述的系统,其中,所述增益计算机识别产生静态范围压缩以适应所述期望的输出范围的增益。

20)根据12)-17)中任一项所述的系统,其中,所述攻击增益响应时间主要控制允许输出音频信号的强度响应于所述输入音频信号的强度的突然增加而增加的速度有多快,而所述释放增益响应时间主要控制允许所述输出音频信号的强度响应于所述输入音频信号的强度的突然降低而降低的速度有多快。

21)一种存储计算机程序的计算机可读介质,所述计算机程序能够被执行以执行1)-11)中任一项所述的方法。

22)一种自适应增益生成模块,包括:

(a)输入端;

(b)输出端;

(c)增益计算机;以及

(d)具有输入端和输出端的电平检测器,

其中,所述电平检测器包括:(i)攻击检测模块,其确定并提供输入音频信号中是否出现瞬变的指示,(ii)增益响应时间发生器,其基于已经由所述攻击检测模块提供的所述输入音频信号中是否出现瞬变的所述指示,提供攻击增益响应时间和释放增益响应时间,以及(iii)滤波器,其使用所述攻击增益响应时间和所述释放增益响应时间作为滤波参数,对已经输入到所述电平检测器中的信号进行低通滤波,以及

其中,响应于所述攻击检测模块的瞬变检测,所述增益响应时间发生器缩短了所述攻击增益响应时间并增加了所述释放增益响应时间。

23)根据22)所述的自适应增益生成模块,其中,由所述攻击检测模块提供的所述输入音频信号中是否出现瞬变的所述指示表明检测到的瞬变的强度的度量。

24)根据23)所述的自适应增益生成模块,其中,作为检测到的瞬变的强度的更大度量的结果,所述攻击增益响应时间减少得更多,而所述释放增益响应时间增加得更多。

25)根据22)所述的自适应增益生成模块,其中,所述输入音频信号中是否出现瞬变的所述指示基于使用峰值的波峰因子检测器。

26)根据25)所述的自适应增益生成模块,其中,所述输入音频信号中是否出现瞬变的所述指示也基于与指定阈值比较的所述输入音频信号的强度。

27)根据22)所述的自适应增益生成模块,其中,所述输入音频信号中是否出现瞬变的所述指示基于与指定阈值比较的所述输入音频信号的强度。

28)根据22)-27)中任一项所述的自适应增益生成模块,其中,通过首先确定多个初步攻击值且然后计算作为所述多个初步攻击值中的先前一个初步攻击值和所述多个初步攻击值中的当前一个初步攻击值之间的变化量的增量值,将所述输入音频信号中是否出现瞬变的所述指示计算为所述增量值。

29)根据22)-27)中任一项所述的自适应增益生成模块,其中,所述增益计算机识别产生静态范围压缩以适应期望的输出范围的增益。

30)根据22)-27)中任一项所述的自适应增益生成模块,其中,所述攻击增益响应时间主要控制允许输出音频信号的强度响应于所述输入音频信号的强度的突然增加而增加的速度有多快,而所述释放增益响应时间主要控制允许所述输出音频信号的强度响应于所述输入音频信号的强度的突然降低而降低的速度有多快。

具体实施方式

,功能的精确分布优选地根据已知的工程折衷来进行。

在上述讨论中,词语“包括(include)”、“包括(includes)”、“包括(including)”及该词语的所有其它形式不应该被理解为限制,而应该将这些单词之后的任何具体项理解为仅仅是示范性的。

本发明的几个不同实施例在上面和/或在通过引入并入本文的任何文件中进行描述,其中每个这样的实施例被描述为包括某些特征。然而,意图是结合任何单个实施例的讨论描述的特征不限于该实施例,而是可以被包括和/或布置在任何其它实施例中的各种组合中,如将由本领域技术人员理解的。

因此,虽然本发明已经关于其示例性实施例和附图被详细描述,但是对于本领域技术人员明显的是,在不脱离本发明的目的和范围的情况下,可以实现本发明的各种适应和修改。因此,本发明不限于附图所示和上述的精确实施例。相反,意图是不偏离本发明的目的的所有这样的变化被认为是落入其仅由所附权利要求书限定的范围内。

22页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:立体声信号的编码方法、解码方法、编码装置和解码装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类