通过改变振幅
录音方法、装置、电子设备及计算机可读介质
本申请公开了一种录音方法、装置、电子设备及计算机可读介质,涉及音频处理技术领域,方法包括:在电子设备执行视频录制操作的情况下,基于目标对象在图像采集装置所拍摄的视频画面内的图像位置,确定目标对象与音频采集装置之间的第一方位信息;基于第一方位信息,对第一方位信息对应的目标声源执行追焦录音操作;若未检测到目标对象在图像采集装置所拍摄的视频画面内,确定第二方位信息;对第二方位信息对应的目标声源执行追焦录音操作。因此,在目标对象在图像采集装置所拍摄的视频画面内消失时,确定新的方位信息,即第二方位信息,对第二方位信息对应的目标声源执行追焦录音操作,能够提高追焦录音操作的持续性。

2021-11-02

访问量:41

一种充分利用视觉与语音联系的视听语音增强方法及系统
一种充分利用视觉与语音联系的视听语音增强方法及系统,属于语音信号处理技术领域,解决如何利用视觉与语音之间的内在联系,在现实中嘈杂的语音环境中实现对目标语音信息进行增强的问题;在语音特征和视觉特征融合之前,通过BLSTM对视觉特征进行初次利用,由此得到的目标的二进制掩码和原始的噪声幅度谱图获取的语音特征相融合从而得到干净幅度二进制掩码,将此幅度掩码代替基本框架中的视觉特征和语音特征一起馈入BLSTM和全连接层组成的训练网络;同时在基础的增强网络之上,基于频域,加入后置相位子网络,利用语音的幅度和相位在结构上相关性,获取增强相位谱图和幅度谱图相融合使得语音增强效果更佳,提高了增强后语音清晰度,降低语音失真率。

2021-10-01

访问量:38

一种数字音频处理方法及系统
本发明提供一种数字音频处理方法及系统,其中,方法包括:获取音频输入信号,对所述音频输入信号进行预处理,得到音频第一信号;其中,所述预处理包括:调节音量增益、控制相位变换、设置相关参数;通过反馈抑制算法对所述音频第一信号进行啸叫处理,得到音频第二信号;通过DSP混响算法对所述音频第二信号进行混响处理,得到音频第三信号。本发明可以同时处理反馈抑制和混响调节,适用场合大大增加;通过网络能进行远程便捷升级,使得用户,开发者都能高效的使用和开发产品。

2021-10-01

访问量:44

一种音频降噪方法、装置、系统及计算机可读存储介质
本发明公开了一种音频降噪方法、装置、系统及计算机可读存储介质,该方法包括拾取语音信号;采用预先训练的通话降噪模型对语音信号进行降噪处理,得到降噪后的语音数据;其中,通话降噪模型的训练过程为:依据带噪样本语音数据及对应的干净样本语音数据对通话降噪网络进行训练,并在训练过程中采用频域幅值分析网络对带噪样本语音数据的复数幅度值及对应的干净样本语音数据的复数幅度值进行分析,根据分析结果对通话降噪网络的网络参数进行优化,以得到损失小于预设损失值的通话降噪模型;本发明中的通话降噪模型具有更优的网络参数,因此在采用该通话降噪模型对拾取到的语音信号进行降噪处理后,能够使降噪后的语音数据更加精确,降噪效果更好。

2021-09-24

访问量:34

一种音频流量的压缩算法
本发明公开了一种音频流量的压缩算法,包括以下步骤;步骤一、进行去噪处理;步骤二、对去噪处理后的音频数据计算功率谱密度,如果功率谱密度小于所设定的阈值,则把音频数据包标识为音频静态帧格式,并把向服务器发送的音频数据包数据字段填为空;步骤三、服务端收到带有音频静态帧的数据包之后,对音频数据进行转发;步骤四、客户端PC软件或APP软件收到服务端转发的音频数据包之后,在播放的时候客户端对带有音频静态帧的数据包标识为静音。本发明能够对前端摄像机芯片编码输出的音频数据的噪声进行去除,可以改善客户端播放音频声音的用户体验,减轻了服务端的流量压力,降低了服务器的使用费用。

2021-09-24

访问量:34

注册成为会员可查看更多数据。