回声信号的处理方法、设备及计算机存储介质

文档序号:1172963 发布日期:2020-09-18 浏览:39次 >En<

阅读说明:本技术 回声信号的处理方法、设备及计算机存储介质 (Echo signal processing method, echo signal processing device and computer storage medium ) 是由 黄景标 俞骏燊 林聚财 于 2020-05-21 设计创作,主要内容包括:本申请提供一种回声信号的处理方法、设备及计算机存储设备。包括:在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,使得输出缓存区的数据量保持在阈值之上;将输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据进行回声处理。本申请有效地消除了第一语音数据和第二语音数据间的回声,避免回声对通话质量的影响。(The application provides a processing method and equipment of echo signals and computer storage equipment. The method comprises the following steps: before receiving the service voice data, inputting the fixed voice data into an output buffer area, so that the data volume of the output buffer area is kept above a threshold value; and performing echo processing on the first voice data output by the output buffer and the second voice data acquired by the microphone. The method and the device effectively eliminate the echo between the first voice data and the second voice data and avoid the influence of the echo on the call quality.)

回声信号的处理方法、设备及计算机存储介质

技术领域

本申请涉及语音通信技术领域,特别是涉及一种回声信号的处理方法、设备及计算机存储介质。

背景技术

不论是语音对讲还是语音识别场景,回声性能都作为影响语音通话质量及识别质量的重要指标。回声分为硬件电路回声和声学回声。电路回声可通过硬件设备的合理设计消除,而声学回声的通路复杂多变。图1是声学回声产生的示意图,如图1所示,远端语音信号从听筒出来后,经过空气或其他的传播媒介传到近端用户的话筒,再通过话筒录音后重新传到远端用户的听筒中形成回声。

现有技术中,为了消除回声对通话质量的影响,通常会输入采集的语音数据到缓存区,输出缓存区输出的语音数据作为输出语音数据,利用回声消除算法消除输出语音数据和采集的语音数据间的时间延迟。但由于输出缓存区内数据量的不确定,输入缓存区的采集语音数据需等待缓存区语音数据达到一定阈值后才能输出,使输出语音数据时间延长不确定,导致采集语音数据和输出语音数据间的时间延迟抖动。

发明内容

本申请提供了一种回声信号的处理方法、设备及计算机存储介质,主要解决的技术问题是如何有效地消除缓存区输出的第一语言数据和由麦克风采集的第二语音数据间的回声,避免回声对语音通话质量的影响。

为解决上述技术问题,本申请提供了一种回声信号的处理方法,所述方法包括:

在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,使得所述输出缓存区的数据量保持在阈值之上;

将所述输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据进行回声处理。

根据本申请提供的一实施方式,所述在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,包括:

持续将固定语音数据传输至所述输出缓存区,并在接收到业务语音数据时,将业务语音数据与固定语音数据混音后传输至输出缓存区。

根据本申请提供的一实施方式,所述第一语音数据为播放数据;所述将所述缓存区输出的第一语音数据和由麦克风采集的第二语音数据进行回声处理,包括:

将所述第一语音数据加上固定延迟数据作为回声参考数据;

利用回声消除算法对所述回声参考数据和所述第二语音数据进行计算。

根据本申请提供的一实施方式,所述固定延迟数据为预设数据,或由所述第一语音数据和所述第二语音数据的个数确定。

根据本申请提供的一实施方式,所述利用回声消除算法对所述回声参考数据和所述第二语音数据进行计算,包括:

利用所述回声消除算法对数字信号格式的回声参考数据和所述第二语音数据进行计算。

根据本申请提供的一实施方式,所述固定语音数据是值为0的数据。

根据本申请提供的一实施方式,将所述输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据进行回声处理,包括:

由麦克风采集的第二语音数据保存在输入缓存区;

将所述输出缓存区输出的第一语音数据和所述输入缓存区输出的第二语音数据进行回声处理。

为解决上述技术问题,本申请提供了一种回声信号的处理设备,所述设备包括存储器以及与所述存储器耦接的处理器;

所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如上述的回声信号的处理方法。

为解决上述技术问题,本申请还提供了一种计算机存储介质,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现如上述的回声信号的处理方法。

本申请在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,使得输出缓存区的数据量保持在阈值之上,利于业务语音数据输入到输出缓存区时,能够及时输出第一语音数据,避免输出缓存区对输出的第一语言数据的影响,导致输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据存在时间延迟抖动,影响通话质量。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:

图1是现有技术中的声学回声产生的示意图;

图2是本申请提供的回声信号的处理方法一实施例的流程示意图;

图3是本申请提供的回声信号的处理方法另一实施例的流程示意图;

图4是本申请提供的设备一实施例的结构示意图;

图5是本申请提供的计算机存储介质一实施例的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请提出了一种回声信号的处理方法,具体请参阅图2,图2是本申请提供的回声信号的处理方法一实施例的流程示意图。本实施例中回声信号的处理方法可以应用于回声信号的处理设备,也可应用于具有数据处理能力的服务器。本实施例的回声信号的处理方法具体包括以下步骤:

S101:在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,使得输出缓存区的数据量保持在阈值之上。

为了避免因输出缓存区的数据量不够阈值,使得输入到输出缓存区的业务语音数据的输出时间延迟,本实施例采用在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,使得输出缓存区的数据量保持在阈值之上,利于输出缓存区及时输出输入的业务语音数据,避免输出缓存区对业务语音数据输出的影响。

其中,业务语音数据为正常语音通话时的语音数据。输出缓存区的数据量阈值可为根据实际情况进行设定,使得输入到输出缓存区的语音数据能够及时输出,避免时间延迟。

S102:将输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据进行回声处理。

第一语音数据为输出缓存区输出的语音数据,第二语音数据为麦克风采集的语音数据。为了实现快速存取语音数据,本实施例将麦克风采集的第二语音数据保存在输入缓存区,以及时对输出缓存区输出的第一语音数据和输入缓存区输出的第二语音数据进行回声处理,避免回声对通话质量的影响。

本实施例中,在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,使得输出缓存区的数据量保持在阈值之上,利于业务语音数据输入到输出缓存区时,能够及时输出第一语音数据,避免输出缓存区对输出的第一语言数据的影响,导致输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据存在时间延迟抖动,影响通话质量。

为了解决现有技术中输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据间时间延迟抖动的问题,基于上述实施例,本申请还提出了一种回声信号的处理方法,具体请参阅图3,图3是本申请提供的回声信号的处理方法另一实施例的流程示意图。

如图3所示,本实施例的回声信号的处理方法具体包括以下步骤:

S201:持续将固定语音数据传输至输出缓存区,并在接收到业务语音数据时,将业务语音数据与固定语音数据混音后传输至输出缓存区。

为了避免输入的固定语音数据对业务语音数据的影响,本实施例中的固定语音数据是值为0的数据,持续的将固定语音数据值为0的数据输入输出缓存区,便于输出缓存区的数据量保持在阈值之上,在接收到业务语音数据时,将业务语音数据与固定语音数据混音后传输至输出缓存区。

在具体实施例中,可采用音频混音器对业务语音数据和固定语音数据进行混音,由于固定语音数据的值为0数据,业务语音数据和固定语音数据进行混音时,输出的混音后数据与输入的业务语音数据相同。

进一步地,接收到业务语音数据前持续将固定语音数据传输至输出缓存区,使得语音通话在终端唤醒业务频繁启动/暂停播放数据时,能够有效防止缓存区输出的第一语音数据和由麦克风采集的第二语音数据间的数据时延抖动。

S202:将第一语音数据加上固定延迟数据作为回声参考数据。

为了避免通过Android框架中获取音频流类和播放音频流类采集或播放的音频存在时间偏差,导致采集的音频和播放的音频间有回声现象,本实施例将输出缓存区输出的第一语音数据加上固定延迟数据作为回声参考数据。其中,第一语音数据为播放数据,固定延迟数据为预设数据或由第一语音数据和第二语音数据的个数确定。

在具体实施例中,由于语音数据是按照固定采样频率输出,可通过对比第一语音数据和第二语音数据的0数据个数,获取时间抽上的延迟,从而确定固定延迟数据。

S203:利用回声消除算法对回声参考数据和第二语音数据进行计算。

基于S202中获取的回声参考数据,利用回声消除算法对回声参考数据和第二语音进行计算,从而消除第一语音数据和第二语音数据间的回声,避免回声对语音通话质量的影响。

在具体实施例中,为了避免引入模/数转换对回声消除结果带来非线性失真和噪音,本实施例中采用回声消除算法对数字格式的回声参考数据和第二语音数据进行计算,避免了语音数据间的模/数转换。

本实施例中,在接收到业务语音数据之前,将固定语音数据输入到输出缓存区,使得输出缓存区的数据量保持在阈值之上,利于业务语音数据输入到输出缓存区时,能够及时输出第一语音数据,避免输出缓存区对输出的第一语言数据造成影响,导致输出缓存区输出的第一语音数据和由麦克风采集的第二语音数据存在时间延迟抖动,影响通话质量;将固定语音数据值为0的数据输入输出缓存区,便于输出缓存区的数据量保持在阈值之上;在接收到业务语音数据时,将业务语音数据与固定语音数据混音后传输至输出缓存区,使得混音后数据与输入的业务数据相同;将输出缓存区输出的第一语音数据加上固定延迟数据作为回声参考数据,避免通过Android框架中获取音频流类和播放音频流类采集或播放的音频间存在时间偏差,导致采集的音频和播放的音频间有回声现象,并采用回声消除算法对数字格式的回声参考数据和第二语音数据进行计算,避免了引入模/数转换对回声消除结果带来非线性失真和噪音。

为实现上述实施例的回声信号的处理方法,本申请提出了另一种设备,具体请参阅图4,图4是本申请提供的设备一实施例的结构示意图。

设备400包括存储器41和处理器42,其中,存储器41和处理器42耦接。

存储器41用于存储程序数据,处理器42用于执行程序数据以实现上述实施例的回声信号的处理方法。

在本实施例中,处理器42还可以称为CPU(Central Processing Unit,中央处理单元)。处理器42可能是一种集成电路芯片,具有信号的处理能力。处理器42还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器42也可以是任何常规的处理器等。

本申请还提供一种计算机存储介质500,如图5所示,计算机存储介质500用于存储程序数据51,程序数据51在被处理器执行时,用以实现如本申请方法实施例中所述的回声信号的处理方法。

本申请回声信号的处理方法实施例中所涉及到的方法,在实现时以软件功能单元的形式存在并作为独立的产品销售或使用时,可以存储在装置中,例如一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种便于拆装的调制解调器

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!