一种音频信号缩放处理方法及装置

文档序号:1398267 发布日期:2020-03-03 浏览:16次 >En<

阅读说明:本技术 一种音频信号缩放处理方法及装置 (Audio signal scaling processing method and device ) 是由 高威特 张楠赓 于 2018-08-23 设计创作,主要内容包括:本发明的实施方式提供了一种音频信号的缩放处理方法和装置,其特征在于,方法包括:获取当前帧音频信号;检测当前帧音频信号的能量幅值在预设频率范围内的过门限率;根据过门限率更新音频缩放处理系数;根据更新后的音频缩放处理系数对当前帧音频信号的下一帧进行缩放处理。本发明通过根据有效频段内的数据情况针对性地选择音频信号动态范围,进一步提高了音频信号的缩放处理效果。(The embodiment of the invention provides a method and a device for scaling an audio signal, which are characterized in that the method comprises the following steps: acquiring a current frame audio signal; detecting the threshold crossing rate of the energy amplitude of the current frame audio signal in a preset frequency range; updating an audio zooming processing coefficient according to the threshold crossing rate; and carrying out scaling processing on the next frame of the current frame audio signal according to the updated audio scaling processing coefficient. The invention further improves the zooming processing effect of the audio signal by pertinently selecting the dynamic range of the audio signal according to the data condition in the effective frequency band.)

一种音频信号缩放处理方法及装置

技术领域

本发明涉及数据处理领域,具体涉及一种音频信号缩放处理方法及装置。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

在计算机中用现有的资源(例如:内存、带宽等)描述一个现实量的时候都涉及到采样的问题,对于采样得到的数据需要以二进制的形式使用固定位宽进行描述。然而,上述固定长度的bit值存在范围限制,尤其当使用嵌入式音频处理装置时,这样,很容易造成数据溢出,进而造成音频信号失真。

现有技术中,在对音频信号进行缩放以防止音频信号溢出时并不会对音频信号的有效频段与无关频段进行区分处理。例如,在语音识别领域,大部分数据下溢都集中在100Hz以下的频段,然而在实际情况中,这是人耳根本不关心的频段,现有技术下,通常会将这类下溢同样作为后续音频缩放处理的影响因素,进一步造成了对音频信号进行缩放处理的效果变差。

发明内容

针对现有技术中的对音频信号进行缩放处理以防止音频数据溢出时并不对不同频段的音频信号进行有效区分,进一步导致音频信号进行缩放处理的效果较差的问题,本发明提供了一种音频信号的缩放处理方法和装置,其可以根据实际应用场景对音频信号进行自适应地缩放处理,显著改善了防数据溢出处理的效果。

在本发明实施方式的第一方面,提出一种音频信号的缩放处理方法,其特征在于,所述方法包括:

获取当前帧音频信号;检测所述当前帧音频信号的能量幅值在预设频率范围内的过门限率;

根据所述过门限率更新音频缩放处理系数;

根据所述更新后的音频缩放处理系数对所述当前帧音频信号的下一帧音频信号进行缩放处理。

在一种实施方式中,其中,所述方法还包括:

根据数据溢出临界值设置门限值;

通过统计所述当前帧音频信号的能量幅值在预设频率范围内超出所述门限值的频率范围获取所述过门限率。

在一种实施方式中,其中,在所述检测所述当前帧音频信号的能量幅值在预设频率范围内的过门限率之前,所述方法还包括:

根据更新前的所述音频缩放处理系数对所述当前帧音频信号进行缩放处理。

在一种实施方式中,其中,所述音频缩放处理系数包括声音增益系数和/或定点FFT(快速傅里叶变换)右移系数。

在一种实施方式中,其中,所述缩放处理具体包括:

根据所述更新后的声音增益系数对所述当前帧音频信号的下一帧音频信号进行缩放处理;和/或

在所述傅里叶变换变换时,根据所述更新后的定点FFT(快速傅里叶变换)右移系数对所述当前帧音频信号的下一帧音频信号进行缩放处理。

在一种实施方式中,其中,所述定点FFT(快速傅里叶变换)右移系数为快速傅里叶变换过程中,所述当前帧音频信号的下一帧音频信号进入蝶形运算时的右移位数。

在一种实施方式中,其中,所述方法进一步包括:

根据数据上溢临界值设置上门限值;和/或

根据数据下溢临界值设置下门限值。

在一种实施方式中,其中,所述过门限率进一步包括第一比率和/或第二比率;其中,

所述第一比率为预设频率范围内数据超过上门限值的频率范围占预设频率范围的比值;以及

所述数据下溢率为预设频率范围内数据低于下门限值的频率范围占预设频率范围的比值。

在一种实施方式中,其中,所述根据所述过门限率更新音频缩放系数具体包括:

若所述第一比率超过第一阈值,则根据所述第一比率对所述音频缩放系数进行缩小处理;以及

若所述第一比率小于第二阈值,则根据所述第一比率对所述音频缩放系数进行扩大处理;

其中,所述第一阈值大于或等于所述第二阈值。

在一种实施方式中,其中,所述根据所述过门限率更新所述预设缩放系数具体包括:

若所述第一比率未超过所述第一阈值,且所述第二比率超过第三阈值,则根据所述第一比率和所述第二比率对所述音频缩放系数进行扩大处理。

在本发明实施方式的第二方面,提出一种音频信号的缩放处理装置,其特征在于,所述装置包括:

获取模块,用于获取当前帧音频信号;

检测模块,用于检测所述当前帧音频信号的能量幅值在预设频率范围内的过门限率;

更新模块,用于根据所述过门限率更新音频缩放处理系数;

缩放处理模块,用于根据所述更新后的音频缩放处理系数对所述当前帧音频信号的下一帧音频信号进行缩放处理。

在一种实施方式中,其中,所述装置还包括门限模块,用于:

根据数据溢出临界值设置门限值;

通过统计所述当前帧音频信号的能量幅值在预设频率范围内超出所述门限值的频率范围获取所述过门限率。

在一种实施方式中,其中,所述缩放处理模块还用于:在所述检测所述当前帧音频信号的能量幅值在预设频率范围内的过门限率之前,根据更新前的所述音频缩放处理系数对所述当前帧音频信号进行缩放处理。

在一种实施方式中,其中,所述更新模块用于:

更新声音增益系数和/或用于更新定点FFT(快速傅里叶变换)右移系数。

在一种实施方式中,其中,所述缩放处理模块具体用于:

根据所述更新后的声音增益系数对所述当前帧音频信号的下一帧音频信号进行缩放处理;和/或

在所述快速傅里叶变换变换时,根据所述更新后的定点FFT(快速傅里叶变换)右移系数对所述当前帧音频信号的下一帧音频信号进行缩放处理。

在一种实施方式中,其中,所述定点FFT(快速傅里叶变换)右移系数为快速傅里叶变换变换过程中,所述当前帧音频信号的下一帧音频信号进入蝶形运算时的右移位数。

在一种实施方式中,其中,所述门限模块进一步用于:

根据数据上溢临界值设置上门限值;和/或

根据数据下溢临界值设置下门限值。

在一种实施方式中,其中,所述过门限率进一步包括第一比率和/或第二比率;其中,

所述第一比率为预设频率范围内数据超过上门限值的频率范围占预设频率范围的比值;以及

所述数据下溢率为预设频率范围内数据低于下门限值的频率范围占预设频率范围的比值。

在一种实施方式中,其中,所述更新模块具体用于:

若所述第一比率超过第一阈值,则根据所述第一比率对所述音频缩放系数进行缩小处理;以及

若所述第一比率小于第二阈值,则根据所述第一比率对所述音频缩放系数进行扩大处理;

其中,所述第一阈值大于或等于所述第二阈值。

在一种实施方式中,其中,所述更新模块具体用于:

若所述第一比率未超过所述第一阈值,且所述第二比率超过第三阈值,则根据所述第一比率和所述第二比率对所述音频缩放系数进行扩大处理。

本发明实施方式提供的技术方案通过获取预设频率范围内的过门限率,进而可以针对不同的应用场景对音频信号的有效频段与无关频段进行区分处理,以及根据有效频段内的数据超出预设门限值的情况针对性地选择音频信号缩放处理方案,进一步提高了音频信号缩放处理的技术效果。

附图说明

通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:

图1示出了根据本发明实施例的一种音频信号缩放处理方法流程图;

图2示出了根据本发明实施例的另一种音频信号的缩放处理方法流程图;

图3示出了根据本发明实施例的一种对音频信号进行缩放处理的装置示意图;

图4示出了根据本发明实施例的另一种对音频信号进行缩放处理的装置示意图;

图5A示出了根据本发明实施例的当前帧音频信号的理论频谱示意图;

图5B示出了根据本发明实施例的当前帧音频信号的实际频谱示意图;

图5C示出了根据本发明实施例的经过缩放处理的下一帧音频信号的频谱示意图;

图6示出了根据本发明实施方式的一种音频信号缩放处理的装置示意图。

在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

示例性方法

本发明实施例提出一种音频信号的缩放处理方法。

图1是根据本发明实施例的一种音频信号的缩放处理方法的示意性流程图。如图1所示,该方法包括但不限于S110~S140,具体地,该步骤包括:

S110:获取当前帧音频信号。

S120:检测所述当前帧音频信号的能量幅值在预设频率范围内的过门限率。

本领域技术人员可以理解的是,在步骤S120之前,还可以根据现有技术对当前帧音频信号进行快速傅里叶变换(FFT),从而将当前帧音频信号从时域信号转化为频域信号,进而在后续的技术方案中得以在频域范围内进行区分处理。

S130:根据所述过门限率更新音频缩放处理系数。

S140:根据所述更新后的音频缩放处理系数对所述当前帧音频信号的下一帧进行缩放处理。

在传统的音频信号数字化处理的过程中,选择动态范围与后续音频信号的应用是两个互不关联的过程,而本发明实施方式将上述两个过程关联,针对不同的应用场景采取不同的选择动态范围的方案,这能够更加具有针对性选择动态范围。

本申请实施例中,只需要考虑预设频率范围内能量幅值超过门限值的情况。

在一个示例性实施例中,在语音识别应用场景下,由于实际情况中,可能导致数据下溢的几个频率范围段一般都在100Hz以下,属于人耳不关心的频段,因此只需要关注人声频率范围内的音频能量幅值超过门限值情况,本发明实施例可以将上述预设频率范围设为人声频率范围。

在另一个示例性实施例中,在助听器应用场景下,由于患者只能接收到某些频率范围内的信号,此时只需关注上述能够接收到的频率范围内的音频能量幅值超过门限值情况,本发明实施例可以将上述预设频率范围设为设备工作频率范围。

在又一个示例性实施例中,在某些特殊应用场景中,例如海洋生物检测应用场景中,由于不同的海洋生物具有不同的啸叫声频率,因此可以针对不同的检测对象具体设置预设频率范围。

在这里,对预设频率范围不作具体限定,其可以根据实际应用场景选取任一段或几段频率范围作为预设频率范围。本申请中以上述人声频率范围、海洋生物啸叫声频率范围以及助听器工作频率范围为例,但是不限于此。

本领域技术人员可以理解的是,关于步骤S140,对于一段连续的音频帧而言,由于当前帧音频与下一帧音频之间能量值具有连贯性,因此可以采用上述步骤S140中根据更新后的音频缩放处理系数对所述当前帧音频信号的下一帧进行缩放处理的技术方案。这相当于根据当前帧音频信号的检测结果对当前帧音频信号的下一帧的缩放处理系数进行调整。

下面结合图2进一步描述本发明实施例。

在一个实施例中,在所述对所述当前帧音频信号进行快速傅里叶变换之前,所述方法还可以包括:

根据更新前的所述音频缩放处理系数对所述当前帧音频信号进行缩放处理。

通过采用上述根据更新前的所述音频缩放处理系数对当前帧音频信号进行缩放处理的技术方案,可以避免未经处理的音频信号由于过门限率过高(例如:全频段超过门限值)从而导致无法区分各频段的过门限率情况,因而采用上述技术方案可以计算出更为准确的过门限率值。

在一个实施例中,上述更新前的所述音频缩放处理系数可以是根据当前帧音频信号的上一帧的过门限率获得的音频缩放处理系数,也可以是预设的音频缩放处理系数。

下面结合图3和图4进一步描述本发明实施例的步骤S130。

在一个具体的实施例中,音频缩放处理系数以及根据音频缩放处理系数对音频进行缩放处理可以包括:

(1)音频缩放处理系数为声音增益系数

本领域技术人员可以理解的是,声音增益系数实际上是增益乘法器的一个参数,通过控制声音增益系数进行音频缩放处理的技术方案可以包括:增益乘法器接收麦克风输入的原始音频信号,增益乘法器将音频信号的强度值乘以设定的声音增益系数,增益乘法器输出增益后的音频信号。

在一个实施例中,上述控制声音增益系数进行音频缩放处理的具体实现可以表现为调大或调小音频音量。

在一个实施例中,可以预先设定过门限率与增益系数的对照表并预存,直接根据检测到的过门限率通过查找表的方式获取增益系数。

如图3所示,在一个实施例中,基于上述声音增益系数进行缩放处理具体包括:在傅里叶变换之前,根据所述声音增益系数对当前帧音频信号的下一帧进行缩放处理。

(2)音频缩放处理系数为定点FFT右移系数。

在一个具体的实施例中,上述定点FFT右移系数为定点FFT变换过程中,所述当前帧音频信号数据进入蝶形运算的乘积运算中的右移位数。

本领域技术人员可以理解的是,右移运算是将一个二进制位的操作数按指定移动的位数向右移动,移出位被丢弃,左边移出的空位或者一律补0,或者补符号位,这由不同的机器而定。通过上述右移运算可以将音频信号的进行缩放处理,显著节省了运算量。

如图4所示,在一个实施例中,基于上述定点FFT右移系数进行缩放处理具体包括:在对音频信号进行傅里叶变换时,根据定点FFT右移系数对所述当前帧音频信号的下一帧进行缩放处理。

在一个实施例中,根据上述声音增益系数与定点FFT右移系数对音频进行缩放处理的技术方案可以单独使用或组合使用。其中组合使用多个系数时可以进一步处理,例如,为声音增益系数和定点FFT右移系数分配不同权值。

在这里,对音频缩放处理系数的类型不作具体限定,其也可以是对音频信号进行FFT运算,或者是接入到音频处理流程中的处理信号的系数。本申请中以声音增益系数和/或定点FFT右移系数为例,但是不限于此。

通过采用上述声音增益系数和/或定点FFT右移系数作为音频缩放处理系数的参数,利用音频处理系统中原有的参数进行检测,一方面不会产生额外的运算量,另一方面避免了音频二次检测过程中可能会产生的误差。

下面结合图5A、图5B、图5C进一步具体描述本发明实施例。

在一个具体的实施例中,如图5A所示,本发明实施例中该过门限率进一步可以分为第一比率与第二比率;其中,第一比率为预设频率范围内数据超过上门限的频率范围占预设频率范围的比值;第二比率为预设频率范围内数据超过下门限的频率范围占预设频率范围的比值。

进一步地,上述上门限值具体是根据数据上溢临界值设置的;上述下门限值具体是根据数据下溢临界值设置的。

例如,若系统的上溢临界值为A,则可以设置上述上门限值为90%A。

在上述根据数据溢出临界值设置门限值的技术方案中,本发明实施例可以在溢出临界值之内根据实际情况具体对溢出临界值进行设置,例如,上述门限值可以与溢出临界值保持同一值,本发明实施例仅以上述 90%为例,但不限于此。

本领域技术人员可以理解的是,上溢指的是能量值数据转化为二进制的位宽大于设备的位宽所能表达的最高范围。而下溢是指能量值小于设备的位宽所能表达的最低范围,例如能量值为0.4时,由于计算机只能以整数形式表达,此时就会将其表述为0,同样会导致失真。

综上可见,第一比率与第二比率为两种不同的参数类型,二者之间甚至存在相对关系。本发明实施例通过采用将过门限率进一步区分为数据第一比率与数据第二比率的技术方案,可以对其进行综合考虑,从而达到区分处理音频信号的目的。

本发明实施例通过采用根据数据临界值设置门限值,并根据该门限值控制音频缩放处理系数这一技术方案,相较于直接统计位于数据溢出临界值的频率范围而言,更有利于收集与观测数据,进一步地,相当于在溢出临界值中间设置一个更小的双门限值,也即在门限值与对应的溢出临界值之间留有一定余量,并尽力将音频能量幅值控制在门限值内,这样,即使经过缩放系数控制的下一帧音频信号超出了所述门限值,也仍然在数据溢出临界值内,进一步有利于减少在数据溢出率。

在一个示例性实施方式中,如图5A所示,为当前帧音频的理论频谱图,图中,上侧虚线Y2意指数据上溢临界值、下侧虚线Y1意指数据下溢临界值,预设频率范围为m~n,由图中可以看出,在预设频率范围内出现了数据大于上溢临界值的情况。

本领域技术人员可以理解的是,上述图5A仅是理论频谱图,然而实际情况下,溢出的数据无法真实表现出来,如图5B所示,真实情况下,当前帧音频信号在超过溢出临界值的部分均会输出为Y2,相应地,所有能量小于Y1的频段能量都会输出为0,造成失真。

所以,在此情况下,本发明实施例可以设置上门限值Y3以及下门限值Y4,通过统计预设频段(m~n)内所有超过上门限值Y3的频段以计算出第一比率;通过检测所有低于下门限值Y4的频段以计算出第二比率。

在本发明示例性实施例中采用以下公式计算过门限率:

s=[(b-a)]/(n-m),

由图5可知,由于本发明实施例中低于下门限的频段处于预设频段范围之外,因此不予考虑。

在一个实施例中,所述预设频率范围可以是一段范围,也可以是几段频率范围的集合。

进一步地,如图5C所示,采用上文中描述的技术方案,根据上述计算出的过门限率s对当前帧音频信号的下一帧进行缩放处理,使得多数频段能量落入Y2以下数值内。

本领域技术人员可以理解的是,实际上本发明采用的是根据当前帧音频信号在预设频率范围内的过门限率更新音频缩放系数,以及根据更新后的音频缩放系数对当前帧音频信号的下一帧进行缩放处理这一技术方案,由于音频信号具有连贯性,频率范围能量一般不易发生瞬变,因此本发明实施例中采用与当前帧音频信号相似的频谱图作为示例频谱图。

具体地,如图5B所示,由于上述计算过门限率时,当前帧音频信号在预设频率范围内仅存在超过上门限值的(a~b)段,对于预设频率范围外的低于下门限的信号不予考虑,因此相较于全频段过门限率率,本发明实施例采用的缩放处理方法更具有针对性。在一个具体地实施例中,所述根据所述过门限率更新音频缩放系数具体包括:

若所述数据第一比率超过第一阈值,则根据所述第一比率对所述音频缩放系数进行缩小处理;以及

若所述数据第一比率小于第二阈值,则根据所述第一比率对所述音频缩放系数进行扩大处理;

其中,所述第一阈值大于或等于所述第二阈值。

在一个示例性实施例中,可以仅基于音频信号的第一比率更新音频缩放处理系数。具体地,若第一比率超过10%(第一阈值),则根据第一比率对所述音频缩放系数进行缩小处理;若当前帧音频信号的第一比率不超过5%(第二阈值),则根据第一比率对所述音频缩放系数进行缩小处理;若第一比率处于5%(第二阈值)和10%(第一阈值)之间,则不更新音频缩放处理系数,继续以当前的音频缩放处理系数处理下一帧音频信号,通过上述技术方案可以尽量将上述音频数据的第一比率控制在 5%~10%之间。

在一个示例性实施方式中,上述第一阈值可以等于第二阈值。

在本发明实施例中,由于低于下门限值的数据实际上为较为细微的音频型号,一般情况下属于人耳不关心的能量范围,因此,当本发明实施例的应用场景并非需要对细微声进行精细检测时,通过采用上述仅根据音频数据第一比率进行缩放处理的技术方案可以达到运算量更少、运算逻辑更为简洁的技术效果。

在一个实施例中,所述根据所述过门限率更新所述预设缩放系数可以包括:若所述第一比率未超过所述第一阈值,且所述第二比率超过第三阈值,则根据所述第一比率和第二比率对所述音频缩放系数进行扩大处理。

在一个实施例中,本发明实施例综合基于第一比率与第二比率更新音频缩放处理系数,其中,第一比率因素的优先级要高于第二比率因素。具体地,若第一比率未超过10%(第一阈值),进一步对第二比率进行判断,若第二比率超过10%(第三阈值),则根据第一比率与第二比率扩大音频缩放处理系数。

在这里,对根据所述过门限率更新所述音频缩放处理系数的方式不作具体限定,其可以通过对各类过门限率进行优先级排序,进而通过决策树模型控制上述数据缩放系数,或者是对第一比率与第二比率进行加权组合后,也可以基于各比率因素建立数学模型后计算出所述音频缩放处理系数。本申请中仅以上述技术方案为例,但是不限于此。

在本发明实施例中,通过采用上述对第一比率与第二比率进行综合考虑并计算出一弄缩放处理系数的技术方案,可以达到更为精准缩放处理的技术效果。

综上,本发明实施方式提供的技术方案通过获取预设频率范围内的过门限率,进而可以针对不同的应用场景对音频信号的有效频段与无关频段进行区分处理,以及根据有效频段内的数据超出预设门限值的情况针对性地选择音频信号缩放处理方案,进一步提高了音频信号缩放处理的技术效果。

示例性设备

本发明实施例提出一种音频信号的缩放处理装置。

图6是根据本发明实施例的一种音频信号的缩放处理装置600的示意性流程图。如图6所示,该装置600包括但不限于:

获取模块610,用于获取当前帧音频信号;

检测模块620,用于检测所述当前帧音频信号的能量幅值在预设频率范围内的过门限率;

本领域技术人员可以理解的是,在检测模块进行检测之前,还可以根据现有技术对当前帧音频信号进行快速傅里叶变换(FFT),从而将当前帧音频信号从时域信号转化为频域信号,进而在后续的技术方案中得以在频域范围内进行区分处理。

更新模块630,用于根据所述过门限率更新音频缩放处理系数;

缩放处理模块640,用于根据所述更新后的音频缩放处理系数对所述当前帧音频信号的下一帧进行缩放处理。

在传统的音频信号数字化处理的过程中,选择动态范围与后续音频信号的应用是两个互不关联的过程,而本发明实施方式将上述两个过程关联,针对不同的应用场景采取不同的选择动态范围的方案,这能够更加具有针对性选择动态范围。

本申请实施例中,只需要考虑预设频率范围内信号音频能量幅值超过门限值的情况。

在一个示例性实施例中,在语音识别应用场景下,由于实际情况中,可能导致数据下溢的几个频率范围段一般都在100Hz以下,属于人耳不关心的频段,因此只需要关注人声频率范围内的音频能量幅值超过门限值情况,本发明实施例可以将上述预设频率范围设为人声频率范围。

在另一个示例性实施例中,在助听器应用场景下,由于患者只能接收到某些频率范围内的信号,此时只需关注上述能够接收到的频率范围内的音频能量幅值超过门限值情况,本发明实施例可以将上述预设频率范围设为设备工作频率范围。

在又一个示例性实施例中,在某些特殊应用场景中,例如海洋生物检测应用场景中,由于不同的海洋生物具有不同的啸叫声频率,因此可以针对不同的检测对象具体设置预设频率范围。

在这里,对预设频率范围不作具体限定,其可以根据实际应用场景选取任一段或几段频率范围作为预设频率范围。本申请中以上述人声频率范围、海洋生物啸叫声频率范围以及助听器工作频率范围为例,但是不限于此。

本领域技术人员可以理解的是,关于缩放处理模块640,对于一段连续的音频帧而言,由于当前帧音频与下一帧音频之间能量值具有连贯性,因此缩放处理模块640可以采用根据更新后的音频缩放处理系数对所述当前帧音频信号的下一帧进行缩放处理的技术方案,这相当于根据当前帧音频信号的检测结果对当前帧音频信号的下一帧的缩放处理系数进行调整。

在一个实施例中,所述缩放处理模块640还可以用于:在所述对所述当前帧音频信号进行快速傅里叶变换之前,根据更新前的所述音频缩放处理系数对所述当前帧音频信号进行缩放处理。

通过采用上述根据更新前的所述音频缩放处理系数对当前帧音频信号进行缩放处理的技术方案,可以避免未经处理的音频信号由于过门限率过高(例如:全频段超过门限值)从而导致无法区分各频段的过门限率情况,因而采用上述技术方案可以计算出更为准确的过门限率值。

在一个实施例中,上述更新前的所述音频缩放处理系数可以是根据当前帧音频信号的上一帧的过门限率获得的音频缩放处理系数,也可以是预设的音频缩放处理系数。

下面结合图3和图4进一步描述本发明实施例的更新模块630。

在一个具体的实施例中,音频缩放处理系数以及根据音频缩放处理系数对音频进行缩放处理可以包括:

(1)音频缩放处理系数为声音增益系数

本领域技术人员可以理解的是,声音增益系数实际上是增益乘法器的一个参数,通过控制声音增益系数进行音频缩放处理的技术方案可以包括:根据当前帧音频信号的过门限率修改增益乘法器中的声音增益系数;增益乘法器接收麦克风输入的下一帧音频信号,增益乘法器将下一帧音频信号的强度值乘以设定的声音增益系数,增益乘法器输出增益后的下一帧音频信号。

在一个实施例中,上述控制声音增益系数进行音频缩放处理的具体实现可以表现为调大或调小音频音量。

在一个实施例中,可以预先设定过门限率与增益系数的对照表并预存,直接根据检测到的过门限率通过查找表的方式获取增益系数。

(2)音频缩放处理系数为定点FFT右移系数。

在一个具体的实施例中,上述定点FFT右移系数为定点FFT过程中,所述当前帧音频信号的下一帧进入蝶形运算的乘积运算中的右移位数。

本领域技术人员可以理解的是,右移运算是将一个二进制位的操作数按指定移动的位数向右移动,移出位被丢弃,左边移出的空位或者一律补0,或者补符号位,这由不同的机器而定。通过上述右移运算可以将音频信号的进行缩放处理,显著节省了运算量。

如图4所示,在一个实施例中,基于上述定点FFT右移系数进行缩放处理具体包括:根据当前帧音频信号的过门限率修改FFT模块中的定点FFT右移系数;FFT模块接收麦克风输入的下一帧音频信号,FFT模块根据更新的定点FFT右移系数处理下一帧音频信号,FFT模块输出处理后的下一帧音频信号。。

在一个实施例中,根据上述声音增益系数与定点FFT右移系数对音频进行缩放处理的技术方案可以单独使用或组合使用。其中组合使用多个系数时可以进一步处理,例如,为声音增益系数和定点FFT右移系数分配不同权值。

在这里,对音频缩放处理系数的类型不作具体限定,其也可以是对音频信号进行FFT运算,或者是接入到音频处理流程中的处理信号的系数。本申请中以声音增益系数和/或定点FFT右移系数为例,但是不限于此。

通过采用上述声音增益系数和/或定点FFT右移系数作为音频缩放处理系数的参数,利用音频处理系统中原有的参数进行检测,一方面不会产生额外的运算量,另一方面避免了音频二次检测过程中可能会产生的误差。

下面结合图5A、图5B、图5C进一步具体描述本发明实施例。

在一个具体的实施例中,如图5A所示,本发明实施例中该过门限率进一步可以分为第一比率与数据第二比率;其中,第一比率为预设频率范围内数据上溢的频率范围占预设频率范围的比值;第二比率为预设频率范围内数据下溢的频率范围占预设频率范围的比值。

进一步地,上述上门限值具体是根据数据上溢临界值设置的;上述下门限值具体是根据数据下溢临界值设置的。

例如,若系统的上溢临界值为A,则可以设置上述上门限值为90%A。

在上述根据数据溢出临界值设置门限值的技术方案中,本发明实施例可以在溢出临界值之内根据实际情况具体对溢出临界值进行设置,例如,上述门限值可以与溢出临界值保持同一值,本发明实施例仅以上述 90%为例,但不限于此。

本领域技术人员可以理解的是,上溢指的是能量值数据转化为二进制的位宽大于设备的位宽所能表达的最高范围。而下溢是指能量值小于设备的位宽所能表达的最低范围,例如能量值为0.4时,由于计算机只能以整数形式表达,此时就会将其表述为0,同样会导致失真。

综上可见,数据第一比率与数据第二比率为两种不同的参数类型,二者之间甚至存在相对关系。本发明实施例通过采用将过门限率进一步区分为数据第一比率与数据第二比率的技术方案,可以对其进行综合考虑,从而达到区分处理音频信号的目的。

本发明实施例通过采用根据数据临界值设置门限值,并根据该门限值控制音频缩放处理系数这一技术方案,相较于直接统计位于数据溢出临界值的频率范围而言,更有利于收集与观测数据,进一步地,相当于在溢出临界值中间设置一个更小的双门限值,也即在门限值与对应的溢出临界值之间留有一定余量,并尽力将音频能量幅值控制在门限值内,这样,即使经过缩放系数控制的下一帧音频信号超出了所述门限值,也仍然在数据溢出临界值内,进一步有利于减少在数据溢出率。

在一个示例性实施方式中,如图5A所示,为当前帧音频的理论频谱图,图中,上侧虚线Y2意指数据上溢临界值、下侧虚线Y1意指数据下溢临界值,预设频率范围为m~n,由图中可以看出,在预设频率范围内出现了数据大于上溢临界值的情况。

本领域技术人员可以理解的是,上述图5A仅是理论频谱图,然而实际情况下,溢出的数据无法真实表现出来,如图5B所示,真实情况下,当前帧音频信号在超过溢出临界值的部分均会输出为Y2,相应地,所有能量小于Y1的频段能量都会输出为0,造成失真。

所以,在此情况下,可以通过检测预设频段(m~n)内所有具有Y2 临界值的频段,并计算出上溢频段宽度;通过检测所有值为0的频段,并计算出下溢频段宽度。

本发明实施例可以设置上门限值Y3以及下门限值Y4,通过统计预设频段(m~n)内所有超过上门限值Y3的频段以计算出第一比率;通过检测所有低于下门限值Y4的频段以计算出第二比率。

在本发明示例性实施例中采用以下公式计算过门限率:

s=[(b-a)]/(n-m),

由图5可知,由于本发明实施例中低于下门限的频段处于预设频段范围之外,因此不予考虑。

在一个实施例中,所述预设频率范围可以是一段范围,也可以是几段频率范围的集合。进一步地,如图5C所示,采用上文中描述的技术方案,根据上述计算出的过门限率s(本实施例中具体为第一比率)对当前帧音频信号的下一帧进行缩放处理,使得多数频段能量落入Y2以下数值内。

本领域技术人员可以理解的是,实际上本发明采用的是根据当前帧音频信号在预设频率范围内的过门限率更新音频缩放系数,以及根据更新后的音频缩放系数对当前帧音频信号的下一帧进行缩放处理这一技术方案,由于音频信号具有连贯性,频率范围能量一般不易发生瞬变,因此本发明实施例中采用与当前帧音频信号相似的频谱图作为示例频谱图。

具体地,如图5B所示,由于上述计算过门限率时,当前帧音频信号在预设频率范围内仅存在超过上门限值的(a~b)段,对于预设频率范围外的数据低于下门限的信号不予考虑,因此相较于全频段过门限率,本发明实施例采用的缩放处理装置更具有针对性。

在一个具体地实施例中,所述处理模块650还用于:

若所述数据第一比率超过第一阈值,则根据所述第一比率对所述音频缩放系数进行缩小处理;以及

若所述数据第一比率小于第二阈值,则根据所述第一比率对所述音频缩放系数进行扩大处理;

其中,所述第一阈值大于或等于所述第二阈值。

在一个示例性实施例中,可以仅基于音频信号的第一比率更新音频缩放处理系数。具体地,若数据第一比率超过10%(第一阈值),则根据第一比率对所述音频缩放系数进行缩小处理;若当前帧音频信号的数据第一比率不超过5%(第二阈值),则根据第一比率对所述音频缩放系数进行缩小处理;若第一比率处于5%(第二阈值)和10%(第一阈值)之间,则不更新音频缩放处理系数,继续以当前的音频缩放处理系数处理下一帧音频信号,通过上述技术方案可以尽量将上述音频数据的第一比率控制在5%~10%之间。

在一个示例性实施方式中,上述第一阈值可以等于第二阈值。

在本发明实施例中,由于下溢的数据实际上为较为细微的音频型号,一般情况下属于人耳不关心的能量范围,因此,当本发明实施例的应用场景并非需要对细微声进行精细检测时,通过采用上述仅根据音频数据第一比率进行缩放处理的技术方案可以达到运算量更少、运算逻辑更为简洁的技术效果。

在一个实施例中,所述处理模块650还可以用于:若所述数据第一比率未超过所述第一阈值,且所述数据第二比率超过第三阈值,则根据所述第一比率和第二比率对所述音频缩放系数进行扩大处理。

在一个实施例中,本发明实施例综合基于第一比率与第二比率更新音频缩放处理系数,其中,第一比率因素的优先级要高于第二比率因素。具体地,若第一比率未超过10%(第一阈值),进一步对第二比率进行判断,若第二比率超过10%(第三阈值),则根据第一比率与第二比率扩大音频缩放处理系数。

在这里,对根据所述过门限率更新所述音频缩放处理系数的方式不作具体限定,其可以通过对各类过门限率进行优先级排序,进而通过决策树模型更新音频缩放处理系数,或者是通过对各类过门限率进行加权组合后更新音频缩放处理系数,也可以基于各类过门限率因素建立数学模型后计算出所述音频缩放处理系数。本申请中仅以上述技术方案为例,但是不限于此。

在本发明实施例中,通过采用上述对第一比率与第二比率进行综合考虑并计算出一弄缩放处理系数的技术方案,可以达到更为精准缩放处理的技术效果。

综上,本发明实施方式提供的技术方案通过获取预设频率范围内的数据溢出率过门限率,进而可以针对不同的应用场景对音频信号的有效频段与无关频段进行区分处理,以及根据有效频段内的数据溢出情况超出预设门限值的情况针对性地选择音频信号缩放处理方案,进一步提高了音频信号缩放处理的技术效果。

此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

20页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:语音活动检测方法、装置、设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!