首页
最新技术
特色专题
技术名词
热点聚焦
行业风向
登录
注册
提取参数的倒谱
一种去除语音信号中噪声信号的方法
本发明实施例涉及一种去除语音信号中噪声信号的方法,包括:对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;根据频谱,对各帧含噪语音信号进行端点检测,将各帧含噪语音信号区分为语音帧和噪声数据帧;分别对语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;根据噪声功率谱估计融合值,确定先验信噪比;根据先验信噪比,确定维纳滤波增益函数;根据维纳滤波增益函数对含噪语音信号进行增益处理,得到去噪语音信号。
2021-11-02
访问量:36
一种声纹识别方法及装置
本申请公开了一种声纹识别方法及装置,响应于用户的来电呼叫,接通后,获取用户提供的初始语音信息。当确定需要对用户进行身份认证且确定用户已开通声纹识别功能后,将用户的初始语音信息进行信息处理和特征提取,获取用户的声学特征参数。将声学特征参数输入隐马尔可夫模型,获取模型输出的目标对数似然度概率得分。确定目标对数似然度概率得分对应的声纹识别数据集中的目标声学特征参数,进而确定目标声学特征参数对应的身份信息,将身份信息对应的用户确定为目标用户。获取目标声学特征参数和用户对应的声学特征参数的相关性。当相关性满足预设条件时,确定用户的身份识别通过。在用户无感的情况下,对用户进行了身份识别。
2021-11-02
访问量:36
一种基于深度学习的语音情感识别方法
一种基于深度学习的语音情感识别方法,属于语音识别领域。现有语音情感识别率低。本发明方法的一种基于深度学习的语音情感识别方法包括,待测语音信息的预处理;情感特征提取;对提取的情感特征参数进行归一化处理的过程;设计DNN瓶颈层结合决策树和特征融合的语音情感识别系统;利用归一化处理的情感特征参数对识别系统进行训练;利用训练后的DNN瓶颈层结合决策树和特征融合的语音情感识别系统对获取待测语音信息进行语音识别。本发明方法提高了语音情感识别率。
2021-11-02
访问量:42
基于人工智能的语音检测方法、装置及电子设备
本申请提供了一种基于人工智能的语音检测方法、装置、电子设备及计算机可读存储介质;方法包括:将音频信号划分为多个发音片段,获取每个所述发音片段的音频特征;基于每个所述发音片段的音频特征,对每个所述发音片段进行人声分类处理,得到每个所述发音片段的人声分类结果;基于每个所述发音片段的音频特征,对每个所述发音片段进行语种分类处理,得到每个所述发音片段的语种分类结果;基于每个所述发音片段的人声分类结果确定所述音频信号的人声分类结果,并基于每个所述发音片段的语种分类结果确定所述音频信号的语种分类结果。通过本申请,能够提高语音识别的实时性和准确度。
2021-11-02
访问量:50
一种深度融合面部表情和语音的驾驶员路怒症识别方法
本发明一种深度融合面部表情和语音的驾驶员路怒症识别方法,包括:从驾驶员面部视频影像信息中提取出驾驶员的面部影像信息和语音信息;对面部影像帧信息进行预处理并输入到多层卷积神经网络中获得面部表情特征;对语音信息首先提取其梅尔倒谱系数及其一阶和二阶系数值进行初始特征提取,并拼接2段语音片段初始特征输入到全连接层网络中获得与面部表情帧对应的判别性语音帧特征;将得到的面部帧表情特征和语音帧特征进行低秩双线性池化融合获得融合特征;对面部表情特征、语音特征和融合特征进行决策融合后获取到最终的路怒症识别结果。本发明在复杂驾驶环境下,依然能实现高精度地输出驾驶员愤怒症识别结果,进而有效地进行安全驾驶预警。
2021-11-02
访问量:46
音频播放方法和电子设备
本申请公开了一种音频播放方法和电子设备,属于人工智能领域。该方法包括:首先基于针对目标视频聊天场景所获取的人脸图像信息,确定与目标视频聊天场景对应的背景音乐音频信息;以及,基于针对目标视频聊天场景所获取的用户语音信息,确定目标视频聊天场景中目标用户的语音特征参数信息;然后基于语音特征参数信息,调整背景音乐音频信息的音频特征参数信息,并基于音频特征参数信息播放背景音乐音频信息。
2021-10-29
访问量:34
基于嵌套深度神经网络的语音情感识别方法和系统
本发明公开了一种基于嵌套深度神经网络的语音情感识别方法和系统,方法包括:构建MFCC数据集;基于深度神经网络构建语音情感识别模型,采用MFCC数据集对语音情感识别模型进行初步训练,遍历得到不同参数组对应的语音情感的识别率;结合不同参数组及其对应的识别率,生成识别率数据集;基于深度神经网络构建参数拟合模型,用于对导入的识别率数据集进行拟合,得到最大识别率对应的参数组;将得到的最大识别率对应的参数组导入语音情感识别模型,利用MFCC数据集对语音情感识别模型进行训练,得到最终的语音情感识别模型。本发明通过利用嵌套式的深度神经网络不断优化输入神经网络的参数,大幅提高了语音情感的识别率。
2021-10-29
访问量:39
基于梅尔倒谱系数-支持向量机架构的声音识别方法
本发明提供了一种基于梅尔倒谱系数-支持向量机架构的声音识别方法及系统,方法包括:获取待识别声音信号;提取待识别声音信号的声音特征数据;声音特征数据包括待识别声音信号的静态特征数据和动态特征数据;将待识别声音信号的声音特征数据输入声音识别模型中,得到声音识别结果;声音识别模型是根据历史声音信号对支持向量机模型进行训练得到的。本发明通过对声音信号的静态特征数据和动态特征数据对支持向量机模型进行训练,得到的声音识别模型,能够提高声音识别的准确性。
2021-10-29
访问量:37
音频处理方法、装置、设备及存储介质
本发明公开了一种音频处理方法、装置、设备及存储介质,涉及音频处理技术领域,方法包括:获取包括至少两种不同音色音频信号的第一音频数据;对第一音频数据进行特征提取,获得音频特征向量;根据音频特征向量、目标音频信号的声音样本特征以及生成对抗网络,获得第二音频数据,第二音频数据不包括目标音频信号,生成对抗网络用于生成目标音频信号的伪信号,并根据伪信号获得第二音频数据,伪信号与目标音频信号之间的差异值小于阈值。本发明解决了现有技术在消除乐曲音频中指定乐器的声音时,容易导致原音损失的问题,实现了获得更自然且更完整的输出音频的效果。
2021-10-29
访问量:53
一种冰箱多麦克混合音异常识别方法、装置和电子设备
本说明书实施例提供一种冰箱多麦克混合音异常识别方法,通过冰箱多麦克同时播放声音,采集多麦克混合音,对多麦克混合音进行分离,得到各麦克音,计算各麦克音之间的一致度数据,根据一致度数据识别异常的冰箱及麦克混合音。通过程序自动同时对多个麦克的声音进行异常识别,无需对麦克逐个进行人为检测,提高了识别效率。
2021-10-29
访问量:45
注册成为会员可查看更多数据。
热门专题
左旋肉碱的制备方法 左旋肉碱生产工艺 左旋肉碱相关技术资料
免烧砖的制造方法及应用 免烧砖相关专利技术
水溶肥制备方法和应用 水溶肥相关技术资料
保温砂浆及其制备方法 保温砂浆相关技术资料
聚羧酸减水剂的配方 聚羧酸减水剂制备方法 聚羧酸减水剂相关技术资料
除湿机的结构设计 新型工业除湿机的制造 除湿机相关技术资料
脱硫剂的制备方法及系统 脱硫剂数字化评价装置及其评价方法
硅基材料的生产工艺 新型硅基负极材料 硅基材料相关生产制备工艺
柔性电池的制备方法 柔性电池的工艺原理 柔性电池相关生产制备技术资料
汽车充电桩的设计原理 新型汽车充电桩 汽车充电桩的生产制造设计工艺
技术分类
本小类其他组不包括的技术主题
判别语音信号之间的浊音和清音部分
语音信号的音调确定
语音信号内离散点的检测
从噪声判别声音
从音乐中判别声音
语音信号存在或不存在的检测
模拟声道参数
用于发送分析结果
用于评估合成或解码语音信号
提取与健康状况相关的参数
情感状态估计
语音信号的质量检测
用于处理视频信号
为检索
比较或判别
专门适用于特定用途
以分析窗类型为特征的
利用遗传算法
利用混沌理论
利用模糊逻辑
利用神经网络
以分析方法为特征的
提取参数的倒谱
提取参数的功率信息
提取参数的每个子带的频谱信息
提取参数的共振信息
提取参数的预测系数
提取参数的零交叉率
提取参数的相关性系数
以提取参数类型为特征的
不限于组G10L15/00-G10L21/00的语言或者声音分析技术
转换处理的零部件
转换成非可视形式
通过显示频域信息
通过显示时域信息
转换成可视信息
将语音转换成非可听表达形式,例如语音可视化、触觉辅助的语音处理
用于提高可识度
用于与其他信号的同步,例如,视频信号
拨打电话
下载资料
栏目导航
会员登录