噪声过滤
一种基于无线移动通信的声纹采集测试装置及测试方法
本发明公开了一种基于无线移动通信的声纹采集测试装置及测试方法,包括:主控制器模块;与所述主控制器模块相关联的麦克风模块,用于收集待检测声场的声源信息;与所述主控制器模块相关联的无线移动通信模块,所述主控器模块通过所述无线移动通信模块与服务器关联;其中,所述主控制器模块能够将所述麦克风模块收集的声源信息进行预处理,并经由无线移动通信模块发送至所述服务器;所述预处理至少包括对声源信息进行预滤波、语音端点检测、FFT分析处理。本发明能够实时的收集交通行业、电力行业、石油化工、天然气管网等工业领域中关键部位的音频信号,进而可以通过服务器对上述的关键部分进行实时监控。

2021-11-02

访问量:42

录音方法、装置、电子设备及计算机可读介质
本申请公开了一种录音方法、装置、电子设备及计算机可读介质,涉及音频处理技术领域,方法包括:在电子设备执行视频录制操作的情况下,基于目标对象在图像采集装置所拍摄的视频画面内的图像位置,确定目标对象与音频采集装置之间的第一方位信息;基于第一方位信息,对第一方位信息对应的目标声源执行追焦录音操作;若未检测到目标对象在图像采集装置所拍摄的视频画面内,确定第二方位信息;对第二方位信息对应的目标声源执行追焦录音操作。因此,在目标对象在图像采集装置所拍摄的视频画面内消失时,确定新的方位信息,即第二方位信息,对第二方位信息对应的目标声源执行追焦录音操作,能够提高追焦录音操作的持续性。

2021-11-02

访问量:41

用于录制音频的方法、装置、设备和介质
本公开提供了一种录制音频的方法及装置、计算设备和介质,涉及人工智能技术领域,尤其涉及语音测试集的录制。实现方案为:控制录音设备录制音频片段集合;对音频片段集合中的至少一个音频片段中的每个音频片段执行操作,操作包括:基于与该音频片段相对应的第一时间和第二时间以及声音在预定距离上的传播时延,标注该音频片段的音频在该音频片段内的开始时间;以及基于与该音频片段相对应的第一时间和第四时间、预定超时时间以及传播时延,标注该音频片段的音频在该音频片段内的结束时间。

2021-11-02

访问量:38

语音信号处理方法、设备、介质及计算机程序产品
本申请公开了一种语音信号处理方法、设备、介质及计算机程序产品,所述语音信号处理方法包括:获取待处理语音信号,基于所述待处理语音信号中的骨导信号对所述待处理语音信号进行语音激活检测,以确定所述待处理语音信号的信号类型;基于所述待处理语音信号的信号类型对所述待处理语音信号进行噪声调节处理,得到目标语音信号。本申请通过对获取的待处理语音信号进行语音激活检测,可以准确地确定出待处理语音信号的信号类型,并可以根据信号类型以相应的处理方式对作为纯噪声或含噪语音的待处理语音信号进行噪声调节处理,实现根据信号类型滤除含噪语音中的噪声以避免噪声的干扰,或降低纯噪音的音量,避免外界噪声造成人们的听觉疲劳。

2021-11-02

访问量:35

语音增强模型的训练方法和设备及语音增强方法和设备
本公开提供了一种语音增强模型的训练方法和设备及语音增强方法和设备。所述语音增强模型包括共享特征网络和多任务降噪网络,所述多任务降噪网络包括多个降噪网络,所述训练方法包括:获取包括干净语音信号和带噪语音信号的训练样本;将所述带噪语音信号的信息输入所述共享特征网络,得到所述带噪语音信号对应的特征;将所述特征分别输入所述多个降噪网络中的每个降噪网络,得到所述多个降噪网络分别预测的增强语音信号的信息;根据所述多个降噪网络分别预测的增强语音信号的信息和所述干净语音信号,计算所述语音增强模型的损失函数;通过根据所述损失函数调整所述共享特征网络和所述多个降噪网络的参数,对所述语音增强模型进行训练。

2021-11-02

访问量:21

一种具有音频识别功能的虚拟隔音通信方法
本发明公开一种具有音频识别功能的虚拟隔音通信方法。所述方法包括音频信号采集步骤、接近信号检测步骤、采集指令调节步骤、虚拟音频隔音步骤、输出信号质量评价步骤以及音频识别模型更新步骤。所述音频信号采集步骤用于采集输入音频、所述接近信号检测步骤用于检测接近信号、所述采集指令调节步骤用于基于所述检测到的接近信号调节所述音频信号采集指令、所述虚拟音频隔音步骤用于基于音频识别模型进行隔音处理后输出信号、若所述输出信号质量评价步骤的结论为否,则执行所述音频识别模型更新步骤。本发明的技术方案能够自适应的进行不同场景下的隔音消噪。

2021-11-02

访问量:26

基于多域扩张的音频增强方法及装置
本发明属于音频处理技术领域,具体涉及基于多域扩张的音频增强方法及装置。所述方法执行以下步骤:步骤1:将待处理音频进进行多域变换,得到待处理音频在频域、时域和映射域的波形;步骤2:对待处理音频在频域的波形进行叠加扩张,具体包括:将频域的波形代入预设的频域叠加扩张函数,生成一个中间叠加波形,将生成的中间叠加波形与频域的波形进行叠加,得到叠加波形。本发明通过对将待处理的音频进行多域变换,再分别对不同域的波形进行处理,以找回音频丢失帧,再对音频进行处理,可以显著提升音频的质量;同时在进行处理过程中,还通过多种手段去除了处理过程中产生的噪声,进一步提升了音频质量。

2021-11-02

访问量:42

语料降噪方法及装置、电子设备和存储介质
本公开是关于一种语料降噪方法及装置、电子设备和存储介质。该方法包括:获取初始语料集合的估计标签分布;根据所述估计标签分布获取置信矩阵,所述置信矩阵用于描述类别条件下的标签噪声分布;基于所述置信矩阵获取所述初始语料集合中的噪声语料;处理所述初始语料集合中的噪声语料,获得目标语料集合。本实施例中可以通过标签的预测概率和标注标签来建立置信矩阵,并通过置信矩阵来识别出初始语料集合中的噪声语料,在对噪声语料处理后,可以减少目标语料中噪声语料所占的比例和歧义信息,使目标语料的边界更清晰,减少垂域模型的训练次数,进而减少训练所需要的计算资源和消耗时长,有利于提升训练效率。

2021-11-02

访问量:29

一种语音中瞬态噪声的抑制方法
一种深度复值U-Net网络的瞬态噪声抑制方法,解决了传统方法在低信噪比下语音可懂度低、语音信号失真大的问题,属于语音增强领域。本发明包括:根据时频域语音信号,通过语音存在概率、阈值确定瞬态噪声所在时间段;建立改进的深度复值U-Net网络的瞬态噪声抑制模型,改进的深度复值U-Net网络模型总共有十一个卷积块,五个编码块,五个解码块,一个专注力块;最后将得到的瞬态噪声时域段送入到深度复值U-Net网络模型中进行增强,然后把得到的增强结果插回到原序列中得到增强语音;本方法把深度学习应用于瞬态噪声的抑制,极大地提高了语音的可懂度。

2021-11-02

访问量:26

回声时延检测方法、装置及电子设备
本申请公开了一种回声时延检测方法、装置及电子设备,涉及计算机技术领域中的音频处理技术。具体实现方案为:在第一电子设备播放音频且计数器开启的情况下,获取自计数器开启接收到的第N块录音数据块,其中,第N块数据块为当前接收到的录音数据块,N为大于1的整数;将第N块录音数据块与缓存区中的参考数据块进行匹配,其中,录音数据块和参考数据块均为目标时长的数据块,缓存区用于:自开启计数器开始,缓存第一电子设备播放的音频数据块;在第N块录音数据块与缓存区中的参考数据块匹配的情况下,获取计数器的第一计数值,其中,计数器在录音数据块与缓存区中的参考数据块不匹配时计数;基于目标时长和第一计数值,确定回声时延。

2021-11-02

访问量:33

注册成为会员可查看更多数据。