一种用于助行辅具的语音增强分析方法及系统

文档序号:1965040 发布日期:2021-12-14 浏览:29次 >En<

阅读说明:本技术 一种用于助行辅具的语音增强分析方法及系统 (Voice enhancement analysis method and system for walking aid assistive device ) 是由 韩宇菲 史金飞 黄家才 盛云龙 陈国军 陈伟 李毅搏 张铎 于 2021-08-30 设计创作,主要内容包括:本发明实施例公开了一种用于助行辅具的语音增强分析方法及系统,涉及语音识别技术领域,能够缓减目前的助行辅具的语音增强分析中的降噪效果及鲁棒性不足的问题。本发明包括:语音增强系统、参考传声器、环境噪声传声器、语音识别系统和助行辅具驱动,所述参考传声器、所述环境噪声传声器和所述语音识别系统,都与所述语音增强系统连接。所述语音增强系统通过变步长与变阶数相结合的混合参数模型,对所述语音信号中所述外界环境噪声进行处理,将降噪后的语音信号输出至语音识别系统。本发明适用于助行辅具的语音操控。(The embodiment of the invention discloses a voice enhancement analysis method and system for a walking aid, relates to the technical field of voice recognition, and can alleviate the problems of insufficient noise reduction effect and robustness in the voice enhancement analysis of the existing walking aid. The invention comprises the following steps: the system comprises a voice enhancement system, a reference microphone, an environment noise microphone, a voice recognition system and a walking aid driving aid, wherein the reference microphone, the environment noise microphone and the voice recognition system are all connected with the voice enhancement system. And the voice enhancement system processes the external environment noise in the voice signal through a mixed parameter model combining variable step length and variable order, and outputs the voice signal after noise reduction to a voice recognition system. The invention is suitable for voice control of the auxiliary walking aid.)

一种用于助行辅具的语音增强分析方法及系统

技术领域

本发明涉及语音识别技术领域,尤其涉及一种用于助行辅具的语音增强分析方法及系统。

背景技术

随着人口老龄化加剧,今后50年内,60岁以上的人口比例预计将会翻一番,并且由于各种灾难和疾病造成的残障人士也逐年增加,他们存在不同程度的能力丧失,如行走、视力、动手及语言等。因此,为老年人和残障人士提供性能优越的代步工具已成为整个社会重点关注的问题之一。助行辅具作为一种服务器械,可以大大提高老年人和残障人士的日常生活和工作质量。助行辅具的关键技术之一就是实现与使用者的人机交互的技术,这种交互包括两方面的要素:一方面使人能更自然地控制助行辅具,另一方面使助行辅具可以较好的理解人的思维和命令。

但现有的电动助行辅具产品普遍存在人机交互不友好、操作不方便、安全性低等缺点。此外在日常生活、工作等环境中均存在声音噪声,带有外界环境噪声的语音信号将对语音信号的识别带来极大的困难,使得识别率降低。

自适应波束形成语音增强技术,是改善识别率的核心技术,但是目前的方案存在收敛速度慢、稳态性能差等缺点,严重影响降噪效果。并且,其中的自适应滤波方案,并不适合一些非线性,非平稳时间噪声序列的处理,鲁棒性较差,且计算量大,对硬件要求较高。由于日常生活中的噪声变化较大,现有方案依旧难以满足系统的实时性,而常规降噪系统结构相对简单,不具备足够的性能去应对一些噪声突变的场景,且降噪系统本身又极易产生额外噪声,会对降噪效果产生极大影响。这些因素,都导致了目前的降噪效果及鲁棒性不足。

发明内容

本发明的实施例提供一种用于助行辅具的语音增强分析方法及系统,能够缓减目前的助行辅具的语音增强分析中的降噪效果及鲁棒性不足的问题。

为达到上述目的,本发明的实施例采用如下技术方案:

一方面,提供一种用于助行辅具的语音增强分析系统,包括:

语音增强系统、参考传声器、环境噪声传声器、语音识别系统和助行辅具驱动,所述参考传声器、所述环境噪声传声器和所述语音识别系统,都与所述语音增强系统连接;

所述参考传声器,用于采集语音信号,并将所采集的语音信号向所述语音增强系统和所述环境噪声传声器发送;

所述环境噪声传声器,用于从所述语音信号中提取外界环境噪声,并向所述语音增强系统发送;

所述语音增强系统,用于通过变步长与变阶数相结合的混合参数模型,对所述语音信号中所述外界环境噪声进行处理,将降噪后的语音信号输出至语音识别系统;

所述语音识别系统,用于根据所述降噪后的语音信号,触发所述助行辅具驱动执行相应的动作;

所述助行辅具驱动,用于驱动助行辅具响应所述相应的动作。

另一方面,提供一种用于助行辅具的语音增强分析方法,包括:

S1、采集包括外界环境噪声的语音信号;

S2、从所述语音信号中提取所述外界环境噪声;

S3、通过变步长与变阶数相结合的混合参数模型,对所述语音信号中所述外界环境噪声进行处理,得到降噪后的语音信号;

S4、根据所述降噪后的语音信号,控制助行辅具执行动作。

在步骤S1之后,还包括:根据所述语音信号和所述外界环境噪声,调节所述变步长与变阶数相结合的混合参数模型的权值系数。

所述通过变步长与变阶数相结合的混合参数模型,对所述语音信号中所述外界环境噪声进行处理,包括:其中,表示上一时刻平滑误差值的均方根,表示上一时刻的平滑误差值,λ表示迭代系数一般小于且接近于1,n表示迭代次数。

其中,表示系统噪声的方差,表示近10似计算出的先验误差,k表示计数,max表示取最大值,并且 表示计算平滑后的先验误差的平方。

其中,μ(n)表示步长,D表示设定的常量,β表示正则因子;并且 lf(n)表示中间分数阶数,α表示迭代系数,γ表示变阶数步长,L(n)表示阶数,表示阶数为L(n)的完整误差,Δ表示误差宽度,表示部分误差。

其中,FE表示完整误差与部分误差之差,M(n)表示示意阶数,表示阶数为M(n)的完整误差,表示整体阶数为 M(n),取部分M(n)-Δ后的部分误差,并且,q1(n)=λq1(n-1)+(1-λ)|FE(n)|,q1(n) 表示迭代计算的中间量,q2(n)=λq2(n-1)+(1-λ)FE(n),q2(n)表示迭代计算的另一中间量。

γ(n)=ρ1q1(n),γ(n)表示变阶数步长,ρ1表示常量系数,Δ(n)=min(Δmax,ρ2|q2(n)|),Δ(n)表示误差宽度,Δmax表示最大误差宽度,ρ2表示常量系数。

相比现有技术,本实施例充分利用一种新的自适应波束形成语音增强技术方法,能够实现良好的噪声控制效果,同时还能够有效地应对不同的噪声场景,实现噪声强度识别和分类,运用储存的各个场景特征量进行智能判断,选择出最适合的系统系数,最后通过语音识别系统与助行辅具驱动,实现助行辅具良好的语音模态操控效果。本发明在助行辅具的语音操控中应用了新型的高性能模型,通过模型调节模型的关键参数,能够极大地减小计算量,提升收敛速度、稳态等性能,易于实现,从而增强降噪效果及鲁棒性。本发明所应用的新型模型,采用鲁棒性设计,通过调节模型中的关键参数,能够更加快速准确地追踪噪声信号的变化,从而大幅度提升降噪效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的各个系统单元之间的联系结构示意图;

图2为本发明实施例提供的语音操控模态流程结构示意图;

图3为本发明实施例提供的自适应模型部分的结构示意图;

图4为本发明实施例提供的执行流程的示意图。

具体实施方式

为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/ 或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

本实施例的设计目的在于:针对助行辅具语音操控模态,提高语音操控的便捷性,增强降噪效果及鲁棒性。

为实现上述目的,本实施例的设计思路是:设计一种助行辅具中混合参数自适应波束形成语音增强模型的语音操控模态,包括:参考传声器、环境噪声传声器、语音增强系统、语音识别系统以及助行辅具驱动,参考传声器以及环境噪声传声器均与语音增强系统连接。其中:参考传声器,用来采集带有外界环境噪声的语音信号,并将采集的信号发送至语音增强系统。环境噪声传声器,用于对外界环境噪声进行采集,传输给语音增强系统。语音增强系统,用于对各传声器采集的带噪语音信号及噪声信号,通过变步长与变阶数相结合的混合参数模型进行处理,输出降噪后更为清晰的语音信号至助行辅具的语音识别系统。具体的,其通过语音增强系统的混合变参数自适应波束形成的语音增强模型,实现对各类实际环境中的带噪语音的降噪处理,提高语音信号的清晰度和可懂度,最终保证语音信号识别的成功率,使得语音操控模态在街道,商场,车站等复杂噪声场景中具备实用性与安全性。语音识别系统,用于将接收到的降噪后的语音信号,对助行辅具的相应动作进行识别处理。助行辅具驱动,用于驱动助行辅具响应语音信号相应的动作。

语音操控模态的整体流程为:使用者说出语音唤醒词唤醒助行辅具,助行辅具通过唤醒词进入语音操控模态,从而避免误唤醒与误指令,提高其安全性。目前唤醒词为“小杰”。而具体的操控动作指令具有“前进”,“后退”,“左转”,“右转”,“上升”,“下降”,“逍遥”,“停止”等十几种动作指令词。具体操控方法为,说出前进或是左转等指令词后,助行辅具开始调动机械驱动部分进行相应动作,当达到使用者意图后,如前进到了目的地或左转到了目标角度,使用者说出“停止”即可,此外还可将此功能进行拓展,可以配合在线语音识别及语音助手系统,实现语音交互功能。

此外,语音增强系统,还用于根据参考传声器采集的带有外界环境噪声的语音信号,及环境噪声传声器采集的外界环境噪声,共同调节语音增强系统的权值系数,语音增强系统利用混合参数模型提高收敛速度并降低稳态误差及计算量。具体地,可以自动调节语音增强系统的权值系数,利用上述模型进行处理,产生一组噪声控制的权值系数w。之后基于噪声控制的权值系数w,选取对噪声影响较大的系数进行重组,得到最优权值向量,以此计算最终的输出信号。

其中,变步长与变阶数相结合的混合参数自适应模型原理如下:

阶数和步长这两个变量对自适应模型的性能影响巨大。阶数太小会使模型产生陷入局部最优解的情况,并且阶数小于实际系统所要求的阶数时,还会引起发散。为了避免这种情况,通常在一般模型中分配阶数为较大的值。然而,这也会也导致计算量增加,收敛及稳态性能变差,因此阶数应有合理的调整策略。同样地,大的步长通常会令模型收敛性能增加,但稳态性能和鲁棒性下降。而小的步长会保证稳态及鲁棒性能,但会影响收敛性能。步长也应当具有相应的变化策略。相对于只对步长或只对阶数进行调整,若同时对阶数和步长进行调整,使其各自均具有合理的取值,可能会对模型性能带来进一步的提升。在模型收敛过程中,适当大的步长能够提升收敛性能,同时,阶数也进行调整,向最优阶数快速收敛,阶数越接近最优值,MSD变化量越大,模型收敛性能越好。在步长和阶数的共同作用下,模型的收敛速度能够得到进一步提升。而在稳态时,小的步长能够提升稳态性能,此时阶数也已经收敛到最优阶数的合理范围内,而稳态时阶数越接近最优值,未估计阶数部分带来的误差也就越小,从而稳态时MSE也就越小,稳态性能会得到提升。因此,在步长和阶数的共同作用下,模型的稳态性能也能得到进一步提升。

然而,学者们以往对于变步长或是变阶数模型的研究,并没有将他们联系在一起,往往只注重步长与阶数中的一个,而忽略了另一个,不能令这二者协调配合,这也使得模型的性能提升仍具有很大的潜力。此外,以往改进模型的变化策略中,有的不能准确地根据模型状态去调整阶数和步长,有的不能去除系统误差的干扰,这使其步长或阶数的值并不是最适合每一时刻的,容易产生模型失调,阶数的严重过估计和建模不足等问题,许多模型还缺少相应的性能和参数选择分析,且实验环境受限,因此不具备实用性。

本发明公开了一种助行辅具语音中混合参数自适应波束形成语音增强模型的语音操控模态,通过各类传声器采集外界噪声及带噪语音信号,并将采集的信号发送至语音增强系统。语音增强系统通过变迭代参数的变步长与变阶数混合模型进行处理,输出降噪后的语音信号。语音识别系统接收降噪后更为清晰的语音信号,从而操控助行辅具进行相应动作响应。本发明所应用的新型基于混合参数自适应波束形成语音增强模型的助行辅具语音操控方法,采用鲁棒性设计,将噪声信号通过该系统进行循环迭代处理,能够选择出最适合的权值系数,更加快速准确地追踪噪声信号的变化,从而大幅度提升降噪效果,提高语音信号的纯净度,最终提高助行辅具语音操控方法中相应语音信号的识别率。

本发明实施例具体提供一种用于助行辅具的语音增强分析系统,具体如图1 所示的提供架构中的各个系统单元之间的连接和交互方式。包括其中:

语音增强系统、参考传声器、环境噪声传声器、语音识别系统和助行辅具驱动,参考传声器、环境噪声传声器和语音识别系统,都与语音增强系统连接,其中,具体可以采用总线形式的连接。

参考传声器,用于采集语音信号,并将所采集的语音信号向语音增强系统和环境噪声传声器发送。

环境噪声传声器,用于从语音信号中提取外界环境噪声,并向语音增强系统发送。

语音增强系统,用于通过变步长与变阶数相结合的混合参数模型,对语音信号中外界环境噪声进行处理,将降噪后的语音信号输出至语音识别系统。

其中,对各传声器采集的带噪语音信号及噪声信号,通过变步长与变阶数相结合的混合参数模型进行处理,输出降噪后更为清晰的语音信号至助行辅具的语音识别系统。具体的,其通过语音增强系统的混合变参数自适应波束形成的语音增强模型,实现对各类实际环境中的带噪语音的降噪处理,提高语音信号的清晰度和可懂度,最终保证语音信号识别的成功率,使得语音操控模态在街道,商场,车站等复杂噪声场景中具备实用性与安全性。

语音识别系统,用于根据降噪后的语音信号,触发助行辅具驱动执行相应的动作。

助行辅具驱动,用于驱动助行辅具响应相应的动作。其中,语音识别系统可以在接收到的降噪后的语音信号后,对助行辅具的相应动作进行识别处理。助行辅具驱动再驱动助行辅具响应语音信号相应的动作。

图1所示的各个系统单元之间的联系结构。其中参考传声器用来采集带有外界环境噪声的语音信号,并将采集的信号发送至语音增强系统,通过语音增强系统处理,产生输入带噪语音信号x(n)。环境噪声传声器用于对外界环境噪声进行采集,传输给语音增强系统,产生另一信号d(n)。主要的关键点为语音增强控制系统以及噪声前端识别检测系统,通过这两者协调配合,能够产生更好的降噪效果。

以图2所示的语音操控模态流程为例,使用者说出语音唤醒词唤醒助行辅具,助行辅具通过唤醒词进入语音操控模态,从而避免误唤醒与误指令,提高其安全性,目前唤醒词为“小杰”。而具体的操控动作指令具有“前进”,“后退”,“左转”,“右转”,“上升”,“下降”,“逍遥”,“停止”等十几种动作指令词。具体操控方法为,说出前进或是左转等指令词后,助行辅具开始调动机械驱动部分进行相应动作,当达到使用者意图后,如前进到了目的地或左转到了目标角度,使用者说出“停止”即可,此外还可将此功能进行拓展,可以配合在线语音识别及语音助手系统,实现语音交互功能。

具体的,语音增强系统,还用于调节语音增强系统中运行的变步长与变阶数相结合的混合参数模型的权值系数。例如:语音增强系统根据参考传声器采集的带有外界环境噪声的语音信号,及环境噪声传声器采集的外界环境噪声,共同调节语音增强系统的权值系数,语音增强系统利用混合参数模型提高收敛速度并降低稳态误差及计算量。具体地,可以自动调节语音增强系统的权值系数,利用上述模型进行处理,产生一组噪声控制的权值系数w。之后基于第一组噪声控制的权值系数,选取对噪声影响较大的系数进行重组,得到最优权值向量,以此计算最终的输出信号。

基于上述系统,本实施例还提供一种用于助行辅具的语音增强分析方法,如图4所示的,其中大致包括:

S1、采集包括外界环境噪声的语音信号。

S2、从语音信号中提取外界环境噪声。

S3、通过变步长与变阶数相结合的混合参数模型,对语音信号中外界环境噪声进行处理,得到降噪后的语音信号。

S4、根据降噪后的语音信号,控制助行辅具执行动作。

语音增强系统根据所述参考传声器采集的带有外界环境噪声的语音信号,及环境噪声传声器采集的外界环境噪声,共同调节所述语音增强系统的权值系数,所述语音增强系统利用混合参数模型提高收敛速度并降低稳态误差及计算量。具体地,可以自动调节所述语音增强系统的权值系数,利用上述模型进行处理,产生一组噪声控制的权值系数w;之后基于所述噪声控制的权值系数,选取对噪声影响较大的系数进行重组,得到最优权值向量,以此计算最终的输出信号。

可以重复上述步骤,进行循环迭代处理。

进一步的,在步骤S1之后,还包括:

根据语音信号和外界环境噪声,调节变步长与变阶数相结合的混合参数模型的权值系数。

其中,调节变步长与变阶数相结合的混合参数模型的权值系数,包括:将参考传声器采集的带噪语音信号x(n)和环境噪声传声器采集的外界环境噪声信号d(n),获取噪声控制的权值系数w。

在步骤S3中,选取对外界环境噪声影响大的权值系数w进行重组,得到最优权值向量,利用最优权值向量对语音信号中外界环境噪声进行处理。

如图3所示,为应用的新型混合参数自适应波束形成语音增强模型的结构框图,带噪语音信号x(n)通过参考传声器进行采取获得,外界环境噪声信号d(n) 通过环境噪声传声器采取获得,再将它们传输给图2前端的语音增强系统进行处理,利用模型能够产生一组噪声控制的权值系数w。最后系统对前馈语音增强系统权值系数w进行选取,选取对噪声影响较大的系数进行重组,得到最优权值向量,用来计算最终的输出信号。

进一步的,获取噪声控制的权值系数w的方式包括:

具体应用了一种同时调整阶数与步长的改进模型,其中,语音增强模型部分的主要计算流程,详情如下。

自适应模型中权值更新公式可以表示为:

W(n+1)=W(n)+μe(n)x(n) (1)

其中,n表示迭代次数,w(n)表示权值向量,μ表示步长,e(n)表示误差, x(n)表示带噪语音信号。

具体的,通过变步长与变阶数相结合的混合参数模型,对语音信号中外界环境噪声进行处理,包括公式(2)~(11)的计算过程,其中:

同时调整步长和阶数的混合自适应最小均方误差模型,是在上述公式的基础上同时对步长及阶数进行调整,该模型不受系统误差的干扰,并且能够准确地根据迭代状态调整阶数和步长,同时获得阶数及步长的最优取值,提升了模型的一些关键性能。该模型对步长与阶数的调整策略如下:

其中,表示上一时刻平滑误差值的均方根,表示上一时刻的平滑误差值,λ表示迭代系数一般小于且接近于1,n表示迭代次数,

其中,表示系统噪声的方差,表示近似计算出的先验误差,k表示计数,max表示取最大值,

其中,表示计算平滑后的先验误差的平方,

其中,μ(n)表示步长,D表示常量,β表示正则因子,

其中,lf(n)表示中间分数阶数,α表示迭代系数,γ表示变阶数步长,L(n)表示阶数,表示阶数为L(n)的完整误差,Δ表示误差宽度,表示部分误差,

其中,FE表示完整误差与部分误差之差,,M(n)表示示意阶数,表示阶数为M(n)的完整误差,表示整体阶数为M(n),取部分M(n)-Δ后的部分误差,

q1(n)=λq1(n-1)+(1-λ)|FE(n)| (8)

其中,q1(n)表示迭代计算的中间量,

q2(n)=λq2(n-1)+(1-λ)FE(n) (9)

其中,q2(n)表示迭代计算的另一中间量,表示,

γ(n)=ρ1q1(n) (10)

其中,γ(n)表示变阶数步长,ρ1表示常量系数,

Δ(n)=min(Δmax,ρ2|q2(n)|) (11)

其中,Δ(n)表示误差宽度,Δmax表示最大误差宽度,ρ2表示常量系数。

在实际应用中,阶数和步长这两个变量对性能影响巨大。阶数太小会陷入局部最优解的情况,并且阶数小于实际系统所要求的阶数时,还会引起发散。为了避免这种情况,通常在一般分配阶数为较大的值。然而,这也会也导致计算量增加,收敛及稳态性能变差,因此阶数应有合理的调整策略。同样地,大的步长通常会令收敛性能增加,但稳态性能和鲁棒性下降;而小的步长会保证稳态及鲁棒性能,但会影响收敛性能。

本实施例所设计的方案,同时对阶数和步长进行调整,使其各自均具有合理的取值,会对性能带来进一步的提升。在收敛过程中,适当大的步长能够提升收敛性能,同时,阶数也进行调整,向最优阶数快速收敛,阶数越接近最优值,MSD变化量越大,收敛性能越好。在步长和阶数的共同作用下,收敛速度能够得到进一步提升。而在稳态时,小的步长能够提升稳态性能,此时阶数也已经收敛到最优阶数的合理范围内,而稳态时阶数越接近最优值,未估计阶数部分带来的误差也就越小,从而稳态时MSE也就越小,稳态性能会得到提升。因此,在步长和阶数的共同作用下,稳态性能也能得到进一步提升。

本实施例与其他一些经典模型进行比较,包括MPFT-LMS、NFT-LMS、 VSTFT-LMS、IAPFT-LMS及不同参数取值的FT-LMS等模型,从而评估性能。为了公平地比较,每个模型的参数设置均根据各自文章中所给出的依据去选择。其中输入信号是由典型高斯白噪声通过一个整形滤波器即H(z)=0.35+z-1+z-2而得到的。通过系统噪声产生SNR=OdB的高噪实验环境,并附加四段不同的未知系统测试:

式中ak,bk,ck,dk都表示零均值的高斯白噪声序列。

W1和W2用作阶数较小情况下的第一个实验系统,当n<10000时,Wopt=W1,而当10000≤n<20000时,Wopt=W2。W3和W4用作阶数较大情况下的第二个实验系统,当n<10000时,Wopt=W3,当10000≤n<20000时,Wopt=W4。通过这样的设置,有利于验证应对突发情况的能力。期望序列通过下面的公式计算得到:

d(n)=xT(n)wopt+v(n) (14)

从实验的结果可以看出,本实施例中所设计的模型的曲线的MSD与EMSE曲线下降速度最快,且其曲线值也是全程最小,这说明其权系数最接近于最优值。由于其除了保证阶数的正常调整外,还具有步长的合理调整策略,使得这两个变量协调配合,因此性能获得了进一步的全面提升。

综上可以清晰地发现上述模型的优点在于较为简洁,易于在语音增强中的应用,可以随着噪声能量变化调节一些关键参数,从而大幅度减少计算量,并提升稳态、收敛、跟踪、鲁棒性能,对于时变的噪声,提升降噪效果。

由于现有基于自适应波束形成的语音增强模型,不适合一些非线性、非平稳时间噪声序列的处理,鲁棒性较差,由于日常生活中的噪声变化较大,需要系统的实时性较强,而常规降噪系统结构相对简单,不具备足够的能力去应对一些噪声突变的场景,不能准确地识别场景,选择出最适宜的降噪模式,且极易产生额外噪声,比如易出现瞬噪等一些突发噪声,会对降噪效果产生极大影响。相比现有技术,本发明应用的一种助行辅具中混合参数自适应波束形成语音增强模型的语音操控模态,通过环境噪声传声器采集外界环境噪声,通过参考传声器采集带有环境噪声的语音信号,并将采集的各类信号发送至语音增强系统;语音增强系统对所述各类传声器采集的信号进行处理,输出降噪后的更为清晰的语音信号给助行辅具的语音识别系统;语音识别系统将接收到的清晰语音信号进行识别,控制助行辅具做出相应的动作信号。此外,还可以通过将语音识别成功率反馈至语音增强系统,语音增强系统根据最终降噪后的语音信号识别成功率,调节噪声控制系统的权值系数。

本发明从核心自适应模型入手,通过将高性能模型应用到语音增强中,通过模型调节模型的关键参数,能够极大地减小计算量,提升收敛速度、稳态等性能,易于实现,从而增强降噪效果及鲁棒性。本发明充分利用一种高性能的自适应波束形成的语音增强模型,实现带噪语音良好的降噪效果。本发明所应用的新型模型,采用鲁棒性设计,通过调节控制模型中的关键参数,能够更加快速准确地追踪噪声信号的变化,从而大幅度提升降噪效果。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:通信设备的控制方法、通信设备、电子设备以及可读存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!