啸叫抑制装置、其方法以及程序

文档序号：991730 发布日期：2020-10-20 浏览：1次 >En<

阅读说明：本技术 啸叫抑制装置、其方法以及程序 (Howling suppression device, method thereof, and program ) 是由齐藤翔一郎小林和则中川朗原田登于 2019-02-14 设计创作，主要内容包括：啸叫抑制装置包含：整合处理部,将L设为2以上的整数的任一个,设i＝1,2,…,L,从L个第i信号的第n帧所对应的L个值中求最大值,其中所述L个第i信号是从由多个麦克风拾音的音响信号得到的频域的信号；以及啸叫抑制处理部,使用最大值,对L个第i信号的至少其中一个进行啸叫抑制处理。(The howling suppression device includes: an integration processing unit which sets L to any one of integers of 2 or more, sets i to 1,2, …, and finds a maximum value from L values corresponding to an n-th frame of L i-th signals in a frequency domain obtained from acoustic signals collected by a plurality of microphones; and a howling suppression processing unit that performs howling suppression processing on at least one of the L i-th signals using the maximum value.)

啸叫抑制装置、其方法以及程序

技术领域

本发明涉及一种用于抑制通过扬声器对声音进行扩音而使得容易进行会话时发生的啸叫(howling)的技术。

背景技术

在广阔的空间中，人们彼此的会话语音难以到达对方，发生难以进行会话的状况。在这样的情况下，经常会使用扩音装置。对于诸如多人会议这样的用途而言，如图1所示还进行如下处理：将同一空间内位于远离听众的位置的讲话者的语音通过在讲话者的附近配置的麦克风扬声器1进行拾音，通过在听众的附近配置的麦克风扬声器2进行再生，而进行扩音。麦克风和扬声器(例如麦克风和扬声器被组装于1个筐体内的麦克风扬声器)分别有2组，被2组麦克风之中的靠近讲话者的麦克风拾音的声音由2组扬声器之中的远离讲话者的扬声器进行再生。

这里，在图1那样的系统中，与演讲厅等中的演讲者的扩音等不同，讲话者彼此的距离没那么远。因此，成为不仅可以听见扩音后的语音还可以略微听见讲话者语音本身(直接音)的状况。在该情况下，若扩音后的语音延迟后再生，则听起来与讲话者语音的直接音错开。在这样的情况下，产生听觉上的不协调感。例如，在听起来扩音后的语音相对于直接音延迟20ms～30ms左右的情况下，人耳识别为鸣响，感到不协调感。因此，在图1那样的系统中要求是低延迟的处理。

在这样的麦克风扬声器的系统中，一般会因扩音的音量或房间的环境而发生啸叫。为了防止啸叫，除了增大麦克风和扬声器的距离、缩小扬声器音量等方法外，还有搭载啸叫防止功能的方法。例如有像专利文献1那样使用每个频率的功率，通过阈值处理来检测啸叫的方法。

现有技术文献

专利文献

专利文献1：特开平6-164278号公报

发明内容

发明要解决的课题

这里，在图1这样的系统中，有引发图2那样的啸叫的情况。有时相邻的2个频率引发啸叫，啸叫的时间波形会引起拍音(beats)。在图2中没有到啸叫发散的地步，但是尤其是在0.4秒附近，虽然没有语音，但是也在很大程度上残留了啸叫分量，与通常的啸叫同样成为非常刺耳的声音。但是，在这样的情形下，在想要通过现有技术予以应对的情况下会发生问题。具体而言，为了通过现有技术予以应对，为了检测啸叫的发生，需要“为了排除发生拍音的现象的影响而在充分长的帧中对频率进行分析”或者“为了降低短时间帧中的分析结果的拍音分量的影响而在时间方向上进行平滑化”。但是，不论哪一种方式都需要长时间的观测，所以违反在以上描述的“低延迟”的要求条件。或者，由于检测慢，所以只有在发生了一定程度的啸叫之后才能够予以应对。

本发明目的在于提供能够预防啸叫的检测的延迟且提高扩音系统的啸叫防止效果的啸叫抑制装置、其方法以及程序。

用于解决课题的方案

为了解决上述课题，根据本发明的一方式，啸叫抑制装置包含：整合处理部，将L设为2以上的整数的任一个，设i＝1,2,…,L，从L个第i信号的第n帧所对应的L个值中求最大值，其中该L个第i信号是从由多个麦克风拾音的音响信号得到的频域的信号；以及啸叫抑制处理部，使用最大值对L个第i信号的至少其中一个进行啸叫抑制处理。

为了解决上述课题，根据本发明的其他方式，啸叫抑制装置包含：整合处理部，将L设为2以上的整数的任一个，设i＝1,2,…,L，从L个第i信号的第n帧所对应的L个值中求最小值，其中所述L个第i信号是从由多个麦克风拾音的音响信号得到的频域的信号；啸叫判定部，在由L个麦克风之中的2个麦克风拾音的音响信号被进行频率变换后的信号即2个第i信号的第n帧所对应的2个值的差分的符号在规定的时间内改变了规定的次数以上的情况下，判定为有发生啸叫的顾虑、或者正在发生啸叫；以及啸叫抑制处理部，在被判定为有发生啸叫的顾虑、或者正在发生啸叫的情况下，使用最小值对L个第i信号的至少其中一个进行啸叫抑制处理。

为了解决上述课题，根据本发明的其他方式，啸叫抑制方法包含：整合处理步骤，将L设为2以上的整数的任一个，设i＝1,2,…,L，从L个第i信号的第n帧所对应的L个值中求最大值，其中所述L个第i信号是从由多个麦克风拾音的音响信号得到的频域的信号；以及啸叫抑制处理步骤，使用最大值对L个第i信号的至少其中一个进行啸叫抑制处理。

为了解决上述课题，根据本发明的其他方式，啸叫抑制方法包含：整合处理步骤，将L设为2以上的整数的任一个，设i＝1,2,…,L，从L个第i信号的第n帧所对应的L个值中求最小值，其中所述L个第i信号是从由多个麦克风拾音的音响信号得到的频域的信号；啸叫判定步骤，在由L个麦克风之中的2个麦克风拾音的音响信号被进行频率变换后的信号即2个第i信号的第n帧所对应的2个值的差分的符号在规定的时间内改变了规定的次数以上的情况下，判定为有发生啸叫的顾虑、或者正在发生啸叫；以及啸叫抑制处理步骤，在被判定为有发生啸叫的顾虑、或者正在发生啸叫的情况下，使用最小值对L个第i信号的至少其中一个进行啸叫抑制处理。

发明效果

根据本发明，能够防止啸叫的检测的延迟，能够提高扩音系统的啸叫防止效果。

附图说明

图1是用于对扩音装置的使用状况进行说明的图。

图2是用于对啸叫的状态进行说明的图。

图3是表示2个啸叫抑制装置的配置例的图。

图4是第一实施方式涉及的啸叫抑制装置的功能框图。

图5是表示第一实施方式涉及的啸叫抑制装置的处理流程的例子的图。

图6是啸叫抑制处理部的功能框图。

图7是表示啸叫抑制处理部的处理流程的例子的图。

图8是将图2的0.35～0.45这0.1秒放大而将x₁和x₂并排描绘的图。

图9是表示第一实施方式的变形例2的L个啸叫抑制装置的配置例的图。

图10是表示第一实施方式的变形例3的啸叫抑制装置的配置例的图。

图11是第一实施方式的变形例3涉及的啸叫抑制装置的功能框图。

图12是第二实施方式涉及的啸叫抑制装置的功能框图。

图13是表示第二实施方式涉及的啸叫抑制装置的处理流程的例子的图。

具体实施方式

以下，对本发明的实施方式进行说明。另外，在以下的说明中使用的附图中，对具有相同功能的结构部件或进行相同处理的步骤标注相同的标号，省略重复说明。在以下的说明中，文本中使用的标号“^-”等原本应该记载在紧后的字符的正上方，但是由于文本记法的限制而记载在该字符的紧前。在式子中这些标号记述在原本的位置。此外，除非特别予以否认，否则设以向量或矩阵的各要素单位进行的处理应用于该向量或该矩阵的全部要素。

＜第一实施方式的要点＞

使2个啸叫系统的信号解析数值协作，更准确地求可能成为啸叫频率的分量的信息。由此，防止检测延迟造成的啸叫的发散。

＜第一实施方式＞

啸叫抑制系统包含2个啸叫抑制装置100-i。其中i＝1,2。图3表示2个啸叫抑制装置100-i的配置例。

图4表示第一实施方式涉及的啸叫抑制装置的功能框图，图5表示其处理流程。

啸叫抑制装置100-i包含频率变换部110、平滑化处理部120、延迟部121、整合处理部130、啸叫抑制处理部140以及频率逆变换部150。

啸叫抑制处理部140包含功率判定部141、时间常数判定部142、延迟部143、增益计算部144以及增益叠加部145。图6表示啸叫抑制处理部140的功能框图，图7表示其处理流程。

如图3所示，啸叫抑制装置100-i将由同一系统的麦克风80-i拾音的音响信号、以及其他系统的啸叫抑制装置100-j的平滑化处理部120的输出值作为输入。其中j＝1,2且i≠j。啸叫抑制装置100-i抑制由同一系统的麦克风80-i拾音的音响信号中包含的啸叫分量，将抑制后的信号输出给同一系统的扬声器90-i。在扬声器90-i中对抑制后的信号进行再生。例如，麦克风80-i和扬声器90-j构成1个麦克风扬声器。

啸叫抑制装置例如是在具有中央运算处理装置(中央处理单元(CPU：CentralProcessing Unit))、主存储装置(随机存取存储器(RAM：Random Access Memory))等的公知或者专用的计算机中读入特别的程序而被构成的特别的装置。啸叫抑制装置例如基于中央运算处理装置的控制执行各处理。输入给啸叫抑制装置的数据或通过各处理得到的数据例如存储于主存储装置，存储于主存储装置的数据根据需要被向中央运算处理装置读出而用于其他处理。啸叫抑制装置的各处理部也可以至少一部分由集成电路等硬件构成。啸叫抑制装置所具有的各存储部例如能够由RAM(随机存取存储器(Random Access Memory))等主存储装置、或者关系数据库或键值存储(key-value store)等中间件构成。其中，各存储部不必一定包括在啸叫抑制装置的内部，也可以设为如下结构：由通过硬盘或光盘或者闪存存储器(Flash Memory)这样的半导体存储器元件构成的辅助存储装置构成，包含于啸叫抑制装置的外部。

以下，对各部件进行说明。

＜频率变换部110＞

频率变换部110将由同一系统的麦克风80-i拾音的音响信号x_i(t)作为输入，变换为频域的信号(S110)，输出变换后的信号X_i(k,n)。例如，通过下式所表示的傅立叶变换(快速傅立叶变换等)将时域的音响信号x_i(t)变换为频域的信号。

X_i(k,n)＝FT(x_i(n))

其中，x_i(n)＝[x_i(nT-T+1),x_i(nT-T+2),…,x_i(nT)]，n表示当前时刻的帧号，FT表示傅立叶变换，T表示傅立叶变换的帧尺寸(T是2以上的整数的任一个)，k表示频率索引。另外，t表示离散时刻的索引，按每个帧周期T/D(D是2以上的能够被T整除的整数的任一个)使用从时刻t起的过去T个音响信号x_i(t),x_i(t-1),…,x_i(t-T+1)进行傅立叶变换。另外，此时满足t＝nT/D的关系。

另外，输入给啸叫抑制装置100-i以及频率变换部110的信号也可以不是由麦克风拾音的音响信号本身，而是对音响信号进行信号处理后的信号。例如，对由m个麦克风(例如麦克风阵列)拾音的音响信号进行波束成形处理，得到在规定的方向上具有指向性的L(在本实施方式中L＝2)个输出信号，将该输出信号取代音响信号x_i(t)输入给啸叫抑制装置100-i以及频率变换部110。此外，不限于波束成形处理，也可以输入进行了噪声抑制处理等信号处理后的信号。概而言之，啸叫抑制装置100-i以及频率变换部110被输入从由麦克风拾音的音响信号得到的L个信号。

＜平滑化处理部120＞

平滑化处理部120将信号X_i(k,n)作为输入，从延迟部121取出一时刻(帧)前的值X_i'(k,n-1)，将信号X_i(k,n)在时间方向上进行平滑化(S120)，求值X'_i(k,n)，输出给整合处理部130和啸叫抑制装置100-j。进一步，将值X'_i(k,n)存储于延迟部121，在下一帧n+1的平滑化处理时利用。例如，通过下式，通过与一时刻(帧)前的值X_i'(k,n-1)的加权和而将各频率分量在时间方向上进行平滑化。

X'_i(k,n)＝||X_i(k,n)||+αX_i'(k,n-1)

其中α是时间常数，为0以上且小于1的实数，是其值越大则将过去的信息反映得越大的值。

＜整合处理部130＞

整合处理部130将啸叫抑制装置100-i的平滑化处理部120的输出值即值X'_i(k,n)、以及其他啸叫抑制装置100-j的平滑化处理部120的输出值即值X'_j(k,n)作为输入，从2个值X'_i(k,n)、X'_j(k,n)中求最大值^-X(k,n)(S130)，并输出。另外，该求最大值的处理也称为将2个值X'_i(k,n)、X'_j(k,n)整合的处理，将最大值^-X(k,n)也称为整合后的值。例如，通过下式求最大值。

^-X(k,n)＝max{X_i'(k,n),X_j'(k,n)}

设max{}是输出{}内的最大的值的处理。

通过这样的结构，在2组麦克风扬声器的循环中发生啸叫的情况下，利用在各个麦克风输入信号中拍音的相位错开的情况。例如，在有最大π的相位错位的情况下，在通过一侧的麦克风输入而啸叫局部地成为最小的定时，在另一个麦克风输入中，啸叫局部地成为最大，反之亦然。图8是将图2的0.35～0.45这0.1秒放大而将x₁和x₂并排描绘后的图。从图8可知，成为拍音的峰值的定时不同。因此，在拍音的相位错开、且振幅相近的情况下，通过采用2个值的最大值，能够降低拍音的振幅的影响。

＜啸叫抑制处理部140＞

啸叫抑制处理部140将最大值^-X(k,n)和频域的信号X_i(k,n)作为输入，使用最大值^-X(k,n)对信号X_i(k,n)进行啸叫抑制处理(S140)，输出抑制后的信号Y_i(k,n)。利用最大值^-X(k,n)的结构相当于利用由L(在本实施方式中L＝2)个麦克风拾音的音响信号间的啸叫的相位错开的情况。即，也可以说，啸叫抑制处理部140利用由L个麦克风拾音的音响信号间的啸叫的相位错开的情况进行啸叫抑制处理。

在本实施方式中，啸叫抑制处理部140(i)在最大值^-X(k,n)大于表示规定的功率的值的情况、以及(ii)表示最大值^-X(k,n)的改变量的值大于表示规定的改变量的值的情况的至少其中一种情况下，通过将基于最大值^-X(k,n)得到的第一增益、以及基于表示最大值^-X(k,n)的改变量的值得到的第二增益之中的较小的值与信号X_i(k,n)相乘而进行啸叫抑制处理。以下，使用图6、图7对啸叫抑制处理部140的各部件的处理内容进行说明。

＜功率判定部141＞

功率判定部141将最大值^-X(k,n)作为输入来判定最大值^-X(k,n)是否满足功率的条件。例如，判定最大值^-X(k,n)是否大于表示规定的功率的值(阈值Thr1，Thr1是通过实验等预先算出的正实数)(S141)，输出功率判定结果P(k,n)。例如，通过下式得到功率判定结果P(k,n)。

[算式1]

即，在本例中表示功率判定结果P(k,n)为1时满足功率的条件。

＜延迟部143＞

延迟部143将最大值^-X(k,n)作为输入并进行存储，与时间常数判定部142的请求相应地输出。

＜时间常数判定部142＞

时间常数判定部142将最大值^-X(k,n)作为输入，从延迟部143取出一时刻(帧)前的最大值^-X(k,n-1)。时间常数判定部142判定最大值^-X(k,n)相对于一时刻(帧)前的差分值是否满足条件(S142)，输出时间常数判定结果S(k,n)。

在本实施方式中，根据表示最大值^-X(k,n)的改变量的值和表示规定的改变量的值的大小关系来判定最大值^-X(k,n)相对于一时刻(帧)前的差分值是否满足条件。表示最大值^-X(k,n)的改变量的值是当前的帧的最大值^-X(k,n)和过去的帧的最大值^-X(k,n-1)之比^-X(k,n)/^-X(k,n-1)，表示规定的改变量的值是规定的时间常数β。时间常数判定部142判定当前的帧的最大值^-X(k,n)是否大于将过去的帧的最大值^-X(k,n-1)与规定的时间常数β相乘后的值β^-X(k,n-1)，输出改变量判定结果S(k,n)。例如，通过下式得到改变量判定结果S(k,n)。

[算式2]

时间常数β是比通常室内的混响(reverberations)充分大且小于1(＝无衰减)的值。即，在本例中表示改变量判定结果S(k,n)为1时满足改变量的条件。

＜增益计算部144＞

增益计算部144将功率判定结果P(k,n)和改变量判定结果S(k,n)作为输入，计算用于抑制啸叫的增益(gain)(S144)，并输出。例如，在从当前帧的功率判定结果P(k,n)得到的功率指标^-P(k,n)小于规定的值^-P_min的情况下增益计算部144设为^-P(k,n)＝^-P_min，在该功率指标^-P(k,n)大于规定的值^-P_max的情况下增益计算部144设为^-P(k,n)＝^-P_max，基于功率指标^-P(k,n)和规定的阈值P_thr的大小关系求第一增益G_p。其中^-P_min<^-P_max。例如，如以下那样求第一增益G_p。

[算式3]

其中，G_p1是0以上且1以下的固定值。设^-P(k,n)的n＝0的初始值为0。

进一步，在从当前帧的改变量判定结果S(k,n)得到的时间常数指标^-S(k,n)小于规定的值^-S_min的情况下增益计算部144设为^-S(k,n)＝^-S_min，在该时间常数指标^-S(k,n)大于规定的值^-S_max的情况下增益计算部144设为^-S(k,n)＝^-S_max，基于时间常数指标^-S(k,n)和规定的阈值S_thr的大小关系求第二增益G_S。其中^-S_min<^-S_max。例如，如以下那样求第二增益G_S。

[算式4]

其中G_s1是0以上且1以下的固定值。设^-S(k,n)的n＝0的初始值为0。

增益计算部144将第一增益G_P和第二增益G_S之中较小的值设为第三增益G，作为用于抑制啸叫的增益而输出第三增益G。例如，如以下那样求第三增益G。

G(k,n)＝min{G_P,G_S}

其中，设min{}是输出{}内的最小的值的处理。

＜增益叠加部145＞

增益叠加部145将第三增益G和信号X_i(k,n)作为输入，将第三增益G与信号X_i(k,n)相乘(S145)，将积作为抑制后的信号Y_i(k,n)输出。

Y_i(k,n)＝X_i(k,n)G(k,n)

＜频率逆变换部150＞

频率逆变换部150将信号Y_i(k,n)作为输入，变换为时域的信号(S150)，将变换后的信号y_i(t)作为啸叫抑制装置100-i的输出值来输出。另外，就向时域的变换方法而言，使用与频率变换部110所使用的向频域的变换方法对应的方法即可。例如，通过傅立叶逆变换(高速傅立叶逆变换等)将频域的信号Y_i(k,n)变换为时域的信号。

y_i(n)＝IFT(Y_i(k,n))

另外，y_i(n)＝[y_i(nT-T+1),y_i(nT-T+2),…,y_i(nT)]。通过傅立叶逆变换按每个帧得到的时域的信号y_i(n)被适当移位而取得线性和，成为连续的时域的信号y_i(t)。

＜效果＞

通过以上的结构，能够防止啸叫的检测的延迟，能够提高扩音系统的啸叫防止效果。

通过如图3那样配置2个啸叫抑制装置100-i，对于i＝1,2分别执行啸叫抑制处理，从而能够从两个系统中抑制啸叫的发生。

＜变形例1＞

在本实施方式中，第一增益G_p1、第二增益G_s1设为了固定值，但是也可以使它们与输入音响信号联动。例如进行设定以使

G_p1＝α×Thr2/^-X(k,n)。

α是0以上且1以下的实数，在X_i(k,n)＝^-X(k,n)且α＝1时，G_p1成为将X_i(k,n)降至Thr2为止的抑制增益。在α小于1的情况下，抑制量被设定以使进一步小于Thr2。例如，Thr2被设定为若为比它更大的声音则被认为是啸叫的值、或者更小的值。此外，Thr2也可以设定为在功率判定部141中使用的Thr1以下的值。

关于第二增益G_s1同样也可以进行设定以使

G_S1＝α₂×Thr3/^-X(k,n)。

α₂是0以上且1以下的实数。Thr3基于与Thr2同样的考量而被设定。

＜变形例2＞

啸叫抑制系统也可以设为包含L个啸叫抑制装置100-i的结构(参照图9)。L是2以上的整数的任一个，i＝1,2,…,L。

在该变形例2中，整合处理部130将啸叫抑制装置100-i的平滑化处理部120的输出值即值X'_i(k,n)、以及其他L-1个啸叫抑制装置100-j的平滑化处理部120的输出值即值X'_j(k,n)作为输入。其中j＝1,2,…,L且i≠j。整合处理部130从L个值X'_i(k,n)中求最大值^-X(k,n)(S130)，并输出。另外，该求最大值的处理也称为将L个值X'_i(k,n)整合的处理，将最大值^-X(k,n)也称为整合后的值。例如，通过下式求最大值。

^-X(k,n)＝max{X₁'(k,n),X₂'(k,n),…,X_L'(k,n)}

设max{}是输出{}内的最大的值的处理。

通过这样的结构，能够将第一实施方式的啸叫抑制系统扩展为包含L个啸叫抑制装置100-i的结构。此外，第一实施方式可以说是变形例2的一例。

另外，例如，也可以设为如下结构：将L个啸叫抑制装置100-i的输出值y_i之中的L-1个输出值y_i合成(混音(mixing))，输出给扬声器90-i。例如将从L个输出值y_i去除了由构成麦克风扬声器的麦克风拾音的音响信号所对应的输出值y_i后的输出值y_i(L-1个输出值y_i)合成，通过构成同一麦克风扬声器的扬声器进行再生即可。

＜变形例3＞

也可以通过一个装置来实现本实施方式的两个啸叫处理装置100-i。图10表示变形例3的啸叫抑制装置100的配置例。图11表示本变形例涉及的啸叫抑制装置的功能框图。啸叫抑制装置100包含频率变换部110、平滑化处理部120、延迟部121、整合处理部130、啸叫抑制处理部140以及频率逆变换部150，在各部件中进行与第一实施方式同样的处理。不过，在第一实施方式中，除整合处理部以外，在各部件中对1个系统的信号进行处理，但是在本变形例中，对2个系统的信号进行处理。另外，在整合处理部中进行与第一实施方式同样的处理。

通过这样的结构，如图10所示，啸叫抑制装置100将由2个系统的麦克风80-i拾音的音响信号作为输入，分别抑制由2个麦克风80-i拾音的音响信号中包含的啸叫分量，将抑制后的信号分别输出给2个扬声器90-i。

另外，变形例1～3也可以分别进行组合。

＜其他变形例＞

在本实施方式及其变形例中，在全部L个系统中抑制啸叫分量，但是也可以设为在L个系统之中的至少1个系统中抑制啸叫分量的结构。例如，在第一实施方式中，也可以设为只配置啸叫抑制处理装置100-1、100-2的其中一个的结构。在该情况下，在所配置的啸叫抑制处理装置中，对由另一个系统的麦克风拾音的音响信号进行频率变换部110以及平滑化处理部120中的处理(S110，S120)，生成整合处理部130的输入值。

即使是这样的结构，与第一实施方式等相比，虽然啸叫防止效果下降，但是能够防止啸叫的检测的延迟，能够提高扩音系统的啸叫防止效果。

此外，在本实施方式中，将由麦克风拾音的时域的音响信号作为输入，但是也可以将由其他装置变换为频域的信号后的音响信号作为输入。在该情况下，啸叫抑制装置100-i也可以不包含频域变换部110。

此外，通过进行平滑化处理部120中的平滑化处理，从而帧是稳定的，但是即使不进行平滑化处理就进行处理，也能够防止啸叫的检测的延迟，能够提高扩音系统的啸叫防止效果。因此，啸叫抑制装置100-i也可以不包含平滑化处理部120。

在整合处理部130中，将作为从由多个麦克风拾音的音响信号得到的频域的信号的L个第i信号作为输入即可。例如，除本实施方式的2个值X'_i(k,n)、X'_j(k,n)以外，将平滑化处理前的频域的信号X_i(k,n)、或对由多个麦克风拾音的音响信号进行波束成形处理、噪声抑制处理等信号处理后的频域的信号设为输入即可。

此外，啸叫抑制装置100-i例如也可以直接输出频域的信号Y_i(k,n)，在后级的装置中对频域的信号Y_i(k,n)进行某些信号处理，在信号处理后变换为时域的信号。由此，啸叫抑制装置100-i也可以不包含频率逆变换部150。

＜第二实施方式的要点＞

在第一实施方式的整合处理部130中，通过

^-X(k,n)＝max{X_i'(k,n),X_j'(k,n)}

能够减轻拍音的影响，但是在一侧发出语音等其他声音响起的情况下也容易受到影响。即，若在其中一方频率分量较大则^-X(k,n)取较大的值。

与此相对，提出利用“在一侧发出的声音”只在一侧声压大的情况而设为^-X(k,n)＝min{X_i'(k,n),X_j'(k,n)}的方法。此时，设min是输出{}内的最小的值的处理。

由此，在通常发出语音的情况(换言之，在没有发生啸叫的状况下讲话者发出声音的情况)下，选择2系统的较低的那个。另一方面，在正发生啸叫的情况下，2系统以大致相同的音量增加，因此与通常产生语音的情况相比，2系统的较低的那个的值成为相对较大的值。通过使用这样的值，与第一实施方式相比，变得更容易区分啸叫和不是啸叫的信号。

另外，这种方法反过来难以捕捉到拍音的现象，但是若如以下所示定义

[算式5]

这个变量，在该变量在短期间的期间频繁地在正负之间往复的情况下判定为拍音，则问题被减轻。

在第二实施方式中，对用于实现上述结构的结构进行说明。

＜第二实施方式＞

以与第一实施方式不同的部分为中心进行说明。

图12表示第二实施方式涉及的啸叫抑制装置的功能框图，图13表示其处理流程。

啸叫抑制装置100-i包含频率变换部110、平滑化处理部120、延迟部121、整合处理部230、啸叫判定部260、啸叫抑制处理部240以及频率逆变换部150。频率变换部110、平滑化处理部120、频率逆变换部150中的处理与第一实施方式相同。

另外，由于利用“在一侧发出的语音”只在一侧声压大的情况，所以设2个麦克风80-i相对于声源配置于不同的距离。

＜整合处理部230＞

整合处理部230将啸叫抑制装置100-i的平滑化处理部120的输出值即值X'_i(k,n)、以及啸叫抑制装置100-j的平滑化处理部120的输出值即值X'_j(k,n)作为输入，从2个值X'_i(k,n)、X'_j(k,n)中求最小值^-X(k,n)(S230)，并输出。另外，该求最小值的处理也称为将2个值X'_i(k,n),X'_j(k,n)整合的处理，将最小值^-X(k,n)也称为整合后的值。例如，通过下式求最小值。

^-X(k,n)＝min{X_i'(k,n),X_j'(k,n)}

＜啸叫判定部260＞

啸叫判定部260将啸叫抑制装置100-i的平滑化处理部120的输出值即值X'_i(k,n)、以及其他啸叫抑制装置100-j的平滑化处理部120的输出值即值X'_j(k,n)作为输入，在2个值X'_i(k,n)、X'_j(k,n)的差分的符号在规定的时间内改变了规定的次数以上的情况下，判定为有发生啸叫的担忧、或者正在发生啸叫(S260)，输出给判定结果。例如，在判定为有发生啸叫的担忧、或者正在发生啸叫的情况下，输出1作为判定结果，在除此以外的情况下输出0。

关于2个值X'_i(k,n)、X'_j(k,n)的差分的符号是否改变，可以使用(X'_i(k,n)-X'_j(k,n))的符号进行判断，也可以如上述那样定义

[算式6]

这个变量，使用该变量的符号进行判断。例如，在图8的例子中在0.1秒内符号改变6次，所以对规定的时间以及规定的次数进行设定以使能够检测这样的状态即可。

＜啸叫抑制处理部240＞

啸叫抑制处理部240将最小值^-X(k,n)、频域的信号X_i(k,n)以及啸叫判定部260的判定结果作为输入，在判定结果表示有发生啸叫的担忧、或者正在发生啸叫的情况下，使用最小值^-X(k,n)对信号X_i(k,n)进行啸叫抑制处理(S240)，输出抑制后的信号Y_i(k,n)。另外，在不满足上述的条件的情况下(判定结果不表示有发生啸叫的担忧、或者正在发生啸叫的情况下)，不对信号X_i(k,n)进行啸叫抑制处理，输出信号Y_i(k,n)＝X_i(k,n)。在进行啸叫抑制处理的情况下，使用最小值^-X(k,n)取代最大值^-X(k,n)进行与啸叫抑制处理部140同样的处理即可。其中，阈值Thr1或时间常数β等与最小值^-X(k,n)相匹配地适当进行设定。另外，在本实施方式中，设在进行啸叫抑制处理1次后继续进行啸叫抑制处理。在该情况下，啸叫判定部260也可以设为在一旦判定为有发生啸叫的担忧、或者正在发生啸叫后不进行判定处理的结构。此外，也可以设为在判定结果不表示有发生啸叫的担忧、或者正在发生啸叫的情况下不再次进行啸叫抑制处理的结构，重新开始啸叫判定部260中的判定处理。

＜效果＞

通过设为这样的结构，能够得到与第一实施方式同样的效果。进一步，在啸叫以外的其他声音响起的情况下也能够适当地抑制啸叫。另外，也可以将本实施方式与第一实施方式的变形例进行组合。此外，也可以设为如下结构：将啸叫判定部260的判定结果作为整合部230的输入，在判定结果不表示有发生啸叫的担忧、或者正在发生啸叫的情况下省略整合处理部230中的整合处理(S230)。

＜其他变形例＞

本发明不限定于上述的实施方式以及变形例。例如，也可以是，上述的各种处理不仅基于记载按时间序列执行，还根据用于执行处理的装置的处理能力或者根据需要并行地或者单独执行。此外，在不脱离本发明的宗旨的范围能够适当变更。

＜程序以及记录介质＞

此外，也可以通过计算机实现在上述的实施方式以及变形例中说明的各装置中的各种处理功能。在该情况下，通过程序记述各装置应该具有的功能的处理内容。并且，通过由计算机执行该程序，上述各装置中的各种处理功能在计算机上被实现。

记述了该处理内容的程序能够预先记录于计算机可读取记录介质。作为计算机可读取记录介质，例如也可以是磁记录装置、光盘、光磁记录介质、半导体存储器等任意介质。

此外，该程序的流通例如通过对记录了该程序的DVD、CD-ROM等便携式记录介质进行销售、转让、出借等来进行。进一步，也可以预先将该程序存储于服务器计算机的存储装置，经由网络将该程序从服务器计算机转发给其他计算机，从而使该程序流通。

执行这样的程序的计算机例如首先将记录于便携式记录介质的程序或者从服务器计算机转发的程序暂时存储于自身的存储部。并且，在执行处理时，该计算机读取存储于自身的存储部的程序，执行基于所读取的程序的处理。此外，作为该程序的其他实施方式，也可以设为由计算机从便携式记录介质直接读取程序，执行基于该程序的处理。进一步，也可以设为每当程序被从服务器计算机转发给该计算机时，依次执行基于接收到的程序的处理。此外，也可以设为如下结构：从服务器计算机不向该计算机进行程序的转发，通过只根据其执行指示和结果获取而实现处理功能的、所谓ASP(应用服务提供商(ApplicationService Provider))型的业务，执行上述处理。另外，设在程序中包含用于电子计算机进行的处理的信息并且是基于程序的信息(不是对计算机的直接指令，但是具有对计算机的处理进行规定的性质的数据等)。

此外，设为了通过在计算机上执行规定的程序而构成各装置，但是也可以设为通过硬件方式实现这些处理内容的至少一部分。

26页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：信息处理装置、信息处理方法、信息处理系统和程序

啸叫抑制装置、其方法以及程序

相关技术

网友询问留言