语音信号内离散点的检测
体感互动数据处理方法、装置及体感互动设备
本申请涉及一种体感互动数据处理方法、装置及体感互动设备,所述方法包括获取待播放的音频数据及其对应匹配的第一体感图像数据,将所述音频数据输出至音响系统进行音效处理并播放;接收图像处理系统实时反馈的第二体感图像数据;其中,所述第二体感图像数据为图像处理系统基于播放所述音频数据时获取的与用户相关联的图像数据;根据所述第一体感图像数据对所述第二体感图像数据进行比对分析,并基于所述比对分析生成该用户的互动数据处理结果进行展示。该技术方案,可以在肢体运动的娱乐场景中,及时为用户提供智能化的体感互动反馈辅助功能。

2021-11-02

访问量:50

一种去除语音信号中噪声信号的方法
本发明实施例涉及一种去除语音信号中噪声信号的方法,包括:对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;根据频谱,对各帧含噪语音信号进行端点检测,将各帧含噪语音信号区分为语音帧和噪声数据帧;分别对语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;根据噪声功率谱估计融合值,确定先验信噪比;根据先验信噪比,确定维纳滤波增益函数;根据维纳滤波增益函数对含噪语音信号进行增益处理,得到去噪语音信号。

2021-11-02

访问量:36

机器人化煤机故障音频识别及诊断方法
本发明公开了一种机器人化煤机故障音频识别及诊断方法,包括:对采集的煤矿设备声音信息进行预处理,得到具有若干短时声音帧的预处理声音信息;获取预处理声音信息对应的包含有若干语谱帧的语谱图;将语谱图输入训练好的混合神经网络模型,输出故障诊断结果。其中,混合神经网络模型包括:ALEXTet网络模型、LSTM网络模型、Softmax分类层。本发明通过混合神经网络模型对煤矿设备异常声音进行识别,其中,ALEXTet网络模型简化了传统的CNN卷积层,减小了算法复杂度;采用LSTM网络模型进行图像序列的循环采集,学习和记忆序列关联信息,结合单图像信息和序列关联信息进行判别,提高煤矿井下设备异常声音识别准确性和鲁棒性。

2021-10-29

访问量:22

基于噪声抑制的语音检测方法、装置、存储介质以及终端
本申请公开了一种基于噪声抑制的语音检测方法、装置、存储介质以及终端,涉及语音检测领域。获取语音信号,提取语音信号中的短时能频值序列;判断语音信号中的背景噪声是否发生改变,若背景噪声发生改变,则重新计算背景噪声;其中,重新计算背景噪声包括:对语音信号进行建模,并获取语音信号的语音噪声概率;根据语音噪声概率得到语音信号的噪声估计值;对噪声估计值基于最小均方误差准则进行最优估计,并输出噪声抑制信号;根据噪声抑制信号更新短时能频值序列,以及输出语音端点检测结果。当检测到语音信号中的背景噪声发生改变后,可以通过语音信号进行相关处理,输出噪声抑制信号,有效提高了检测语音端点的精确率。

2021-10-22

访问量:36

一种生猪异常状态声音采集及识别方法
本发明公开了一种生猪异常状态声音采集及识别方法,属于生猪异常状态识别领域,本发明搭建了生猪异常状态声音采集平台并采集声音,可长时间采集,避免了养殖人员直接与猪只接触,保障了猪只福利;通过对采集的声音进行分析,决断出生猪存在三种异常状态以及相对应发出的声音,然后对该声音信号进行预加重、分帧、加窗并使用引入了过减因子的谱减法去除背景噪声,使用基于短时能量的单参数双门限法进一步检测出有效声音,使声音数据更加准确,减少程序的计算量,进而提高算法的识别率;最后提取生猪声音信号的Log-梅尔谱图作为特征参数,搭建神经网络模型对声音数据进行训练和识别,识别精度高,收敛速度快。

2021-10-22

访问量:27

音频信息处理方法、系统和计算机可读存储介质
本申请涉及音频信息处理方法、系统和计算机可读存储介质,其中,该方法包括:通过若干个录音设备采集多人对话场景下的对话音频数据,并获取与录音设备对应的人员信息;对对话音频数据进行预处理,并输出若干个非静默音频段;根据语音识别技术将非静默音频段转换成对应的有声文本段;对同一时间的多个有声文本段进行相似度比较得到重复文本段,对重复文本段对应的重复音频段进行判断,确定重复音频段对应的实际人员信息,并得到每个录音设备对应的实际对话音频数据。通过文本相似度及时间点匹配,对同一场景下录入的声音进行溯源,一定程度上解决了角色分离准确性的问题,实现了角色分离准确性的提高。

2021-10-22

访问量:27

一种单音信号检测方法
本发明公开了一种单音信号检测方法,包括以下步骤:S1:对当前语音信号进行采集,采用音频编解码芯片wm8960对语音信号进行采集,并对采集的语音信号通过MATLAB转换为数字信号输出;S2:对预处理后的数字信号进行端点检测,采用Verilog HDL(硬件描述语言)对数字信号端点进行检测;S3:对输出的数字信号进行预处理,数字信号特征提取,采用MFCC声学特征提取;S4:对提取的特征进行陷阱滤波检测和ADC信噪比的计算;S5:对检测结果进行处理并输出。本发明通过对语音进行采集和特征进行提取,并将语音的特征输入至陷阱滤波模块中,通过陷阱滤波模块处理后与原始音频数据进行比较,能够快速的识别是否含有单音信号,确保了单音检测的准确性,提高了单音信号检测效率。

2021-10-19

访问量:34

实时语音识别方法、装置、设备及介质
本申请涉及人工智能技术领域,揭露了一种实时语音识别方法,所述方法包括:获取用户输入的第一语音流,通过预设的第一声纹特征实时对所述第一语音流进行噪声去除,得到第二语音流,所述第一声纹特征为用户的历史语音集中所提取到的声纹特征;通过预设的断句特征对所述第二语音流实时进行端点检测,以判断是否出现语音开始点,所述断句特征为用户的历史语音集中所提取到的断句特征;在检测到语音开始点时,实时对所述第二语音流进行语音识别,得到语音文本。此外,本申请还涉及一种实时语音识别方法、装置、设备及存储介质。本申请可解决语音识别的效率较低以及识别结果的可读性较差的问题。

2021-10-19

访问量:36

音频处理方法、装置、电子设备及存储介质
本公开实施例提供一种音频处理方法、装置、电子设备及存储介质;音频处理方法包括:确定第一音频信号对应的调幅系数,根据所述调幅系数对所述第一音频信号进行更新,得到第二音频信号;对所述第二音频信号进行频域变换,得到第一频域信号;确定所述第一频域信号的谐波分量和冲击分量;对所述谐波分量进行减弱处理,对所述冲击分量进行加强处理,得到第二频域信号;对所述第二频域信号进行时域变换,得到第三音频信号。本公开实施例能够增强音频信号中的起始点信息,提升进行起始点检测的精度和准确性。

2021-10-12

访问量:52

一种基于语音识别的言语功能自动评估系统和方法
本发明公开了一种基于语音识别的言语功能自动评估系统和方法。该系统包括语音端点检测模块、语音识别模块和评估模块,所述语音识别模块分别与所述语音端点检测模块和所述评估模块具有通信连接,其中所述语音端点检测模块被配置为从连续语音流中检测出语音信号的起点和终点,以提取待评估的语音段;所述语音识别模块被配置为基于经训练的声学模型,对待评估语音段进行特征提取,并输入至深度神经网络模型,以识别出对应的词序列;所述评估模块被配置针对所识别出的词序列,结合呼吸功能的评价指标、发声功能的评价指标和构音功能的评价指标来评估言语功能。本发明能够更全面和准确地评估言语功能,尤其适用于儿童的言语功能分析。

2021-10-12

访问量:33

注册成为会员可查看更多数据。