提取参数的每个子带的频谱信息

本申请提供一种音频信号编码方法、解码方法、编码设备以及解码设备,用于实现更高质量的音频编解码,提高用户体验。该方法包括：获取音频信号的当前帧,当前帧包括高频带信号和低频带信号；根据高频带信号、低频带信号和频带扩展的配置信息得到当前帧的频带扩展的参数；获取频率区域信息,频率区域信息用于指示高频带信号中需要进行音调成分检测的第一频率范围；在第一频率范围进行音调成分检测以获取高频带信号的音调成分的信息；对频带扩展的参数和音调成分的信息进行码流复用,以得到载荷码流。

2021-11-02

访问量：29

一种检测语音识别准确率的装置和系统

本公开涉及一种检测语音识别准确率的装置和系统。包括：语音播放设备、音频采集设备、网络监测设备、音频分析设备,其中,所述网络监测设备用于监测所述音频分析设备的网络连接状态,在所述网络连接状态低于预设值的情况下,向所述音频分析设备发送停止播放的信息；所述音频分析设备与所述语音播放设备、所述音频采集设备和所述网络监测设备电性连接,用于根据所述响应音频和预设响应音频,确定所述待测设备语音识别的准确率,并且在接收到所述停止播放的信息后,删除或停止接收所述响应音频。本公开实施例利用音频分析设备可以自动化的测试待测设备的语音识别准确率,无需人工参与,测试周期短。

2021-11-02

访问量：34

一种炸街车快速筛选方法及系统

本发明公开了一种炸街车快速筛选方法及系统,该方法包括：接收来自麦克风阵列采集的声音数据；对接收的麦克风阵列采集的声音数据进行处理,判断声音数据中的声音是否为炸街车声音；若判断出声音数据中的声音为炸街车声音时,则采用图像采集装置对发出该声音的车辆进行抓拍,生成相关图像。本发明提供的炸街车快速筛选方法及系统,炸街车声音判断精度高、炸街车识别精度高；炸街车筛选速度快、提高执法人员效率。

2021-11-02

访问量：25

音频控制场景的方法、设备和计算机可读存储介质

一种音频控制场景的方法、设备和计算机可读存储介质,以精确控制场景的变化,给用户带来更多的体验。所述方法包括：获取现场中属于音乐的音频信号；从音乐的音频信号提取音频特征；根据音乐的音频信号的音频特征与灯光特征的映射关系,获取灯光特征；按照灯光特征,控制相应的灯具进行灯光的变化,和/或按照音乐的音频信号的音频特征,控制相应视频显示设备进行视频播放方式的变化。本申请的技术方案可以对灯光和视频播放方式的控制变得更加精准、精细,使得场景的变化更加丰富多彩,给用户带来更好的视觉体验。

2021-10-29

访问量：21

音频处理方法、装置、设备及存储介质

本发明公开了一种音频处理方法、装置、设备及存储介质,涉及音频处理技术领域,方法包括：获取包括至少两种不同音色音频信号的第一音频数据；对第一音频数据进行特征提取,获得音频特征向量；根据音频特征向量、目标音频信号的声音样本特征以及生成对抗网络,获得第二音频数据,第二音频数据不包括目标音频信号,生成对抗网络用于生成目标音频信号的伪信号,并根据伪信号获得第二音频数据,伪信号与目标音频信号之间的差异值小于阈值。本发明解决了现有技术在消除乐曲音频中指定乐器的声音时,容易导致原音损失的问题,实现了获得更自然且更完整的输出音频的效果。

2021-10-29

访问量：53

一种语音编码方法、装置、设备、存储介质及产品

本申请提供了一种语音编码方法、装置、设备、存储介质及产品；该语音编码方法包括：获取前N帧噪声语音和每帧噪声语音对应的感知能量,其中,感知能量与听觉感知上的强弱程度相关,N为正整数；基于感知能量,确定前N帧噪声语音对应的标准感知能量；确定与标准感知能量负相关的噪声编码间隔；基于噪声编码间隔,对M帧噪声语音进行噪声编码,其中,M帧噪声语音为前N帧噪声语音之后的语音,编码后的M帧噪声语音用于生成舒适噪声,M为正整数。通过本申请,能够提升舒适噪声的生成质量。

2021-10-29

访问量：39

语音转换方法、系统、电子设备及可读存储介质

本公开公开了语音转换方法、系统、电子设备及可读存储介质,涉及语音、深度学习等人工智能技术领域,尤其涉及语音转换领域。具体实现方案为：语音转换方法,包括：获取目标说话人第一语音；获取原说话人语音；提取目标说话人第一语音的第一特征参数；提取原说话人语音的第二特征参数；将所述第一特征参数和所述第二特征参数进行处理得到梅尔谱信息；将所述梅尔谱信息进行转换,输出同目标说话人第一语音的音色相同,并且同原说话人语音的内容相同的目标说话人第二语音。本公开的语音转换方法及系统保留了目标说话人的语音情感、腔调等音色特征,并且见减小了运算成本。

2021-10-29

访问量：35

一种声电信号融合的煤岩识别方法

本发明公开了一种声电信号融合的煤岩识别方法,在采煤机进行煤矿井下工作过程中,采集滚筒电机的电流信号,绘制电流波形图,构建纵向稠密电流谱图；通过采集采煤机滚筒电机工作过程中产生的声音信号,将声音信号转换为具有时间序列的语谱图,并生成宽带语谱图和窄带语谱图；构建煤岩识别网络模型,将纵向稠密电流谱图、宽带语谱图和窄带语谱图输入训练好的煤岩识别网络模型中,输出结果作为采煤机截割过程中的煤岩识别结果。通过本发明,能够增加煤岩界面识别的鲁棒性,有效提升采煤机截割过程中煤、岩区分的可靠性。

2021-10-29

访问量：32

机器人化煤机故障音频识别及诊断方法

本发明公开了一种机器人化煤机故障音频识别及诊断方法,包括：对采集的煤矿设备声音信息进行预处理,得到具有若干短时声音帧的预处理声音信息；获取预处理声音信息对应的包含有若干语谱帧的语谱图；将语谱图输入训练好的混合神经网络模型,输出故障诊断结果。其中,混合神经网络模型包括：ALEXTet网络模型、LSTM网络模型、Softmax分类层。本发明通过混合神经网络模型对煤矿设备异常声音进行识别,其中,ALEXTet网络模型简化了传统的CNN卷积层,减小了算法复杂度；采用LSTM网络模型进行图像序列的循环采集,学习和记忆序列关联信息,结合单图像信息和序列关联信息进行判别,提高煤矿井下设备异常声音识别准确性和鲁棒性。

2021-10-29

访问量：22

一种非法广告确定方法、装置、电子设备及存储介质

本发明实施例提供了一种非法广告确定方法、装置、电子设备及存储介质,应用于投屏技术领域,包括：获得待处理的目标音频,其中,目标音频是投屏设备在开始播放投屏内容的预设时间段内采集到的音频；提取目标音频的指定音频特征；其中,指定音频特征为用于唯一标识目标音频的特征信息；判断指定音频特征是否与预设音频特征相匹配,预设音频特征为与目标音频预先相关联的广告中的音频特征,或者预设音频特征为目标音频中的音频特征；如果指定音频特征与预设音频特征相匹配,确定投屏设备在播放目标音频时未插入非法广告。可见,本方案可以识别投屏设备在播放投屏内容前是否被插入非法广告。

2021-10-26

访问量：39

注册成为会员可查看更多数据。

热门专题

技术分类