语音信号存在或不存在的检测
检测音频质量方法、装置及存储介质
本申请公开了一种检测音频质量方法、装置及存储介质,属于计算机技术领域。所述方法包括:根据目标干声音频的每个待检测音频帧对应的功率谱,确定每个待检测音频帧对应的人声基频估计值;对于每个待检测音频帧,对待检测音频帧的功率谱中每个频点的功率值进行乘权处理;根据每个待检测音频帧对应的功率谱和乘权处理后的功率谱,确定每个待检测音频帧的人声存在概率;根据每个待检测音频帧对应的人声存在概率,在目标干声音频的待检测音频帧中,检测人声音频帧和非人声音频帧;根据人声音频帧对应的功率谱和非人声音频帧对应的功率谱,确定目标干声音频的音频质量信息。采用本申请,可以更加准确的判定干声音频的音频质量。

2021-11-02

访问量:36

语音异常诊断方法、装置、设备及存储介质
本发明属于多媒体领域,公开了一种语音异常诊断方法、装置、设备及存储介质。该方法包括:将语音服务切换至录音模式,并播放预先录制的原始语音;在录音模式下对原始语音进行录制,获得录制语音;通过预设通话算法和原始语音对录制语音进行分析,并根据分析结果进行语音异常诊断。由于本发明是根据对预先录制的原始语言进行播放,然后获得录制语音,根据预设通话算法和原始语音对录制语音进行分析,并根据分析结果进行语音异常诊断,相对于现有的语音出现故障后就联系运维解决的方式,本发明上述方式能够对语音异常进行初步分析,提高了语音异常诊断的效率。

2021-11-02

访问量:20

一种唇部语音活动检测和结果纠错的语音识别系统和方法
本发明涉及一种唇部语音活动检测和结果纠错的语音识别系统及识别方法,其特征在于,包括音视频处理模块、语音活动检测器、语音识别器、专有名词数据库、识别结果纠错器。其中,所述音视频处理模块,用于将采集好的包含人脸的视频进行处理,划分成视频片段,提取出含有音频的视频片段;所述语音活动检测器,用于对含有音频的视频片段进行语音活动检测,判断出所述的含有音频的视频片段是否为含有语音的视频片段;所述语音识别器,用于对被检测为含有语音的视频片段中提取出的音频进行语音识别,得到语音识别的原始结果。所述识别结果纠错器,用于对语音识别器的识别结果进行纠错。

2021-10-29

访问量:31

用于头戴式音频设备的音频信号增强
提供了一种头戴式音频设备,其具有用于语音信号增强的电路。电路包括被布置在预定义位置处的至少多个麦克风,其中每个麦克风提供麦克风信号。电路进一步包括方向性预处理器和盲源分离处理器。方向性预处理器与多个麦克风连接以接收麦克风信号,方向性预处理器被配置为提供至少语音信号和噪声信号。方向性预处理增加提供给盲源分离处理器的信号的相互独立性,并且因此改善了盲源分离的处理。盲源分离处理器接收至少语音信号和噪声信号,并且被配置为至少对语音信号和噪声信号执行盲源分离以至少提供具有降低的噪声分量的增强语音信号。

2021-10-22

访问量:35

一种基于车辆的语音交流方法和装置
本发明实施例提供了一种基于车辆的语音交流方法和装置,所述方法包括:在所述车辆不打开车窗的情况下,响应车内人员的操作,控制车辆分别采集车内人员的车内语音信息和车外人员的车外语音信息;根据所述车内语音信息和所述车外语音信息实现车内外的语音交流。通过建立车内与车外的双向沟通渠道,实现车内人员与车外人员的双向语音交流,增强接收和发送的语音,达到在不开车窗的前提下车内人员与车外人员进行有效沟通的目的。

2021-10-22

访问量:23

一种基于无线分布式麦克风阵列的语音唤醒决策系统
本发明公开了一种基于无线分布式麦克风阵列的语音唤醒决策系统,具体涉及语音识别技术领域,包括微处理器、多个麦克风阵列和用于将麦克风阵列与控制中心连接的NB-iot模块,多个麦克风阵列采集语音信息通过NB-iot模块传输至控制中心进行处理,所述控制中心还连接有语音端点检测模块和信号处理模块,所述信号处理模块连接有声学特征提取模块,所述声学特征提取模块连接有识别解码模块。本发明能够获取更加全面的声音样本,并根据声音样本进行语音处理和分析,从而获取语音信息中的唤醒词,根据唤醒词匹配程度,完成唤醒决策内容,在常见的远场、噪音等复杂场景下,大大改善了智能语音设备的实际使用体验。

2021-10-19

访问量:36

一种基于语音识别的言语功能自动评估系统和方法
本发明公开了一种基于语音识别的言语功能自动评估系统和方法。该系统包括语音端点检测模块、语音识别模块和评估模块,所述语音识别模块分别与所述语音端点检测模块和所述评估模块具有通信连接,其中所述语音端点检测模块被配置为从连续语音流中检测出语音信号的起点和终点,以提取待评估的语音段;所述语音识别模块被配置为基于经训练的声学模型,对待评估语音段进行特征提取,并输入至深度神经网络模型,以识别出对应的词序列;所述评估模块被配置针对所识别出的词序列,结合呼吸功能的评价指标、发声功能的评价指标和构音功能的评价指标来评估言语功能。本发明能够更全面和准确地评估言语功能,尤其适用于儿童的言语功能分析。

2021-10-12

访问量:32

一种基于工业互联网的语音识别及处理方法
本发明公开了一种基于工业互联网的语音识别及处理方法,涉及语音识别技术领域。本发明包括如下步骤:构建工业互联网相应的文本数据库;获取待识别语音数据;对待识别语音数据进行预处理;对处理后的语音数据进行特征提取;将待识别的语音特征同声学模型进行匹配比较得到识别结果;将识别结果输入语言模型进行语言处理,获取语法和语义分析结果。本发明通过构建工业互联网文本数据库,将待识别的语音数据进行预处理和特征提取,将提取的特征与声学模型进行匹配,获取识别结果并输入语音模型分析得到语法和语义分析结,能够提高语音识别的精准度,并排除杂音造成的干扰。

2021-10-01

访问量:26

用于从视频自动生成课程的系统和方法
本发明提供用于从视频自动生成课程的系统和方法,具体地,提出了用于自动创建外语学习课程的系统和方法。收到输入视频后,对音轨进行去噪,然后根据音轨中的句子对音轨进行分割。抄录句子,并对抄录文本中的单词评分。基于合计评分,将视频视为外语学习的正面示例或反面示例。将视频和句子的抄录文本制作为教学材料。可以对抄录文本中的单词进行标记以指示母语为另一语言的学习者可能容易说错的单词。

2021-09-28

访问量:36

一种基于无线声学传感器的降噪方法
本发明公开了一种基于无线声学传感器的降噪方法,涉及声学传感器降噪技术领域。本发明包括以下步骤:步骤1:对声源进行采集,对输入的声信号进行分帧加窗处理并求取每帧的短时能量,进行归一化;步骤2:对每帧的能量进行统计,得到所有帧的能量概率,并绘制出能量的概率直方图,从概率直方图中找到最大值所对应的能量T,取出概率最大值的能量;步骤3:根据概率最大值的能量T来设置高门限T-2和低门限T-1;步骤4:利用单参数双门限VAD进行检测,将能量高于双门限的部分作为带噪声信号,将能量低于双门限的部分作为背景噪声部分。更加精确地分离目标信号以及背景噪声,大大提高提取的音频信号准确性较低从而使得降噪的效果进一步提高。

2021-09-28

访问量:25

注册成为会员可查看更多数据。