提取参数的倒谱
一种去除语音信号中噪声信号的方法
本发明实施例涉及一种去除语音信号中噪声信号的方法,包括:对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;根据频谱,对各帧含噪语音信号进行端点检测,将各帧含噪语音信号区分为语音帧和噪声数据帧;分别对语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;根据噪声功率谱估计融合值,确定先验信噪比;根据先验信噪比,确定维纳滤波增益函数;根据维纳滤波增益函数对含噪语音信号进行增益处理,得到去噪语音信号。

2021-11-02

访问量:36

一种声纹识别方法及装置
本申请公开了一种声纹识别方法及装置,响应于用户的来电呼叫,接通后,获取用户提供的初始语音信息。当确定需要对用户进行身份认证且确定用户已开通声纹识别功能后,将用户的初始语音信息进行信息处理和特征提取,获取用户的声学特征参数。将声学特征参数输入隐马尔可夫模型,获取模型输出的目标对数似然度概率得分。确定目标对数似然度概率得分对应的声纹识别数据集中的目标声学特征参数,进而确定目标声学特征参数对应的身份信息,将身份信息对应的用户确定为目标用户。获取目标声学特征参数和用户对应的声学特征参数的相关性。当相关性满足预设条件时,确定用户的身份识别通过。在用户无感的情况下,对用户进行了身份识别。

2021-11-02

访问量:36

一种基于深度学习的语音情感识别方法
一种基于深度学习的语音情感识别方法,属于语音识别领域。现有语音情感识别率低。本发明方法的一种基于深度学习的语音情感识别方法包括,待测语音信息的预处理;情感特征提取;对提取的情感特征参数进行归一化处理的过程;设计DNN瓶颈层结合决策树和特征融合的语音情感识别系统;利用归一化处理的情感特征参数对识别系统进行训练;利用训练后的DNN瓶颈层结合决策树和特征融合的语音情感识别系统对获取待测语音信息进行语音识别。本发明方法提高了语音情感识别率。

2021-11-02

访问量:42

基于人工智能的语音检测方法、装置及电子设备
本申请提供了一种基于人工智能的语音检测方法、装置、电子设备及计算机可读存储介质;方法包括:将音频信号划分为多个发音片段,获取每个所述发音片段的音频特征;基于每个所述发音片段的音频特征,对每个所述发音片段进行人声分类处理,得到每个所述发音片段的人声分类结果;基于每个所述发音片段的音频特征,对每个所述发音片段进行语种分类处理,得到每个所述发音片段的语种分类结果;基于每个所述发音片段的人声分类结果确定所述音频信号的人声分类结果,并基于每个所述发音片段的语种分类结果确定所述音频信号的语种分类结果。通过本申请,能够提高语音识别的实时性和准确度。

2021-11-02

访问量:49

一种深度融合面部表情和语音的驾驶员路怒症识别方法
本发明一种深度融合面部表情和语音的驾驶员路怒症识别方法,包括:从驾驶员面部视频影像信息中提取出驾驶员的面部影像信息和语音信息;对面部影像帧信息进行预处理并输入到多层卷积神经网络中获得面部表情特征;对语音信息首先提取其梅尔倒谱系数及其一阶和二阶系数值进行初始特征提取,并拼接2段语音片段初始特征输入到全连接层网络中获得与面部表情帧对应的判别性语音帧特征;将得到的面部帧表情特征和语音帧特征进行低秩双线性池化融合获得融合特征;对面部表情特征、语音特征和融合特征进行决策融合后获取到最终的路怒症识别结果。本发明在复杂驾驶环境下,依然能实现高精度地输出驾驶员愤怒症识别结果,进而有效地进行安全驾驶预警。

2021-11-02

访问量:46

音频播放方法和电子设备
本申请公开了一种音频播放方法和电子设备,属于人工智能领域。该方法包括:首先基于针对目标视频聊天场景所获取的人脸图像信息,确定与目标视频聊天场景对应的背景音乐音频信息;以及,基于针对目标视频聊天场景所获取的用户语音信息,确定目标视频聊天场景中目标用户的语音特征参数信息;然后基于语音特征参数信息,调整背景音乐音频信息的音频特征参数信息,并基于音频特征参数信息播放背景音乐音频信息。

2021-10-29

访问量:33

基于嵌套深度神经网络的语音情感识别方法和系统
本发明公开了一种基于嵌套深度神经网络的语音情感识别方法和系统,方法包括:构建MFCC数据集;基于深度神经网络构建语音情感识别模型,采用MFCC数据集对语音情感识别模型进行初步训练,遍历得到不同参数组对应的语音情感的识别率;结合不同参数组及其对应的识别率,生成识别率数据集;基于深度神经网络构建参数拟合模型,用于对导入的识别率数据集进行拟合,得到最大识别率对应的参数组;将得到的最大识别率对应的参数组导入语音情感识别模型,利用MFCC数据集对语音情感识别模型进行训练,得到最终的语音情感识别模型。本发明通过利用嵌套式的深度神经网络不断优化输入神经网络的参数,大幅提高了语音情感的识别率。

2021-10-29

访问量:39

基于梅尔倒谱系数-支持向量机架构的声音识别方法
本发明提供了一种基于梅尔倒谱系数-支持向量机架构的声音识别方法及系统,方法包括:获取待识别声音信号;提取待识别声音信号的声音特征数据;声音特征数据包括待识别声音信号的静态特征数据和动态特征数据;将待识别声音信号的声音特征数据输入声音识别模型中,得到声音识别结果;声音识别模型是根据历史声音信号对支持向量机模型进行训练得到的。本发明通过对声音信号的静态特征数据和动态特征数据对支持向量机模型进行训练,得到的声音识别模型,能够提高声音识别的准确性。

2021-10-29

访问量:37

音频处理方法、装置、设备及存储介质
本发明公开了一种音频处理方法、装置、设备及存储介质,涉及音频处理技术领域,方法包括:获取包括至少两种不同音色音频信号的第一音频数据;对第一音频数据进行特征提取,获得音频特征向量;根据音频特征向量、目标音频信号的声音样本特征以及生成对抗网络,获得第二音频数据,第二音频数据不包括目标音频信号,生成对抗网络用于生成目标音频信号的伪信号,并根据伪信号获得第二音频数据,伪信号与目标音频信号之间的差异值小于阈值。本发明解决了现有技术在消除乐曲音频中指定乐器的声音时,容易导致原音损失的问题,实现了获得更自然且更完整的输出音频的效果。

2021-10-29

访问量:52

一种冰箱多麦克混合音异常识别方法、装置和电子设备
本说明书实施例提供一种冰箱多麦克混合音异常识别方法,通过冰箱多麦克同时播放声音,采集多麦克混合音,对多麦克混合音进行分离,得到各麦克音,计算各麦克音之间的一致度数据,根据一致度数据识别异常的冰箱及麦克混合音。通过程序自动同时对多个麦克的声音进行异常识别,无需对麦克逐个进行人为检测,提高了识别效率。

2021-10-29

访问量:44

注册成为会员可查看更多数据。