分段;字极限检测
语音噪声过滤方法、装置、电子设备和介质
本公开提供了一种语音噪声过滤方法、装置、电子设备和介质,涉及语音识别技术领域。其中,语音噪声过滤方法包括:对输入的语音信息进行分段操作,得到分段语音;基于所述分段语音中的人声特征执行层次聚类操作,得到初始聚类簇;基于K均值聚类对所述初始聚类簇进行修正,并确定修正后的聚类中心;根据所述分段语音与所述聚类中心之间的距离和距离分布,识别所述分段语音中的噪声;对识别出的所述噪声执行噪声过滤操作,得到过滤后的所述语音信息。通过本公开的技术方案,能够提升对彩铃、笑声、咳嗽声、背景人声、信道噪声等无效音频的过滤效果,进而有利于提升设置有本公开的噪声过滤模块的语音识别系统的识别性能,从而提升用户的使用体验。

2021-11-02

访问量:29

一种基于NLP技术的安全帽系统及操作方法
本发明提供一种基于NLP技术的安全帽系统及操作方法,包括语音识别模块用以识别使用人的语音内容,并将识别出的语音内容传送至语义解析模块;语义解析模块用以接收语音识别模块发送的语音内容,通过NLP技术实现对所接收语音内容的分词,并提取关键词;知识图谱模块用以存储标准词,并将语义解析模块提取的关键词与标准词进行比对;语音播报模块用以播报知识图谱模块比对的结果;智能模组用以同服务器建立连接,接收服务器发送的指令,同时向服务器发送语音查询信息;服务器用以接收智能模组发送的语音查询信息,并向智能模组发送指令,使得技术人员可快速调阅各种规程规范,大大提高现场施工规范性和监理的准确性,且大大提高现场工作效率。

2021-11-02

访问量:51

说话人分离算法的评估方法、装置、电子设备和存储介质
本公开提供一种说话人分离算法的评估方法、装置、电子设备和存储介质。该方法的一具体实施方式包括:将样本音频的说话人分离结果与样本音频的预设语音分段结果对齐,得到第一对齐结果,其中,说话人分离结果通过待评估的说话人分离算法得到,第一对齐结果中语音段落的划分方式与预设语音分段结果一致,第一对齐结果中的说话人标签根据说话人分离结果中的预测说话人标签确定;根据第一对齐结果,评估待评估的说话人分离算法的覆盖效果。上述实施方式能够获得合理的说话人分离算法的评估结果。

2021-11-02

访问量:21

语音切分模型的训练方法、装置、电子设备及存储介质
本申请公开了语音切分模型的训练方法、装置、电子设备及存储介质,涉及计算机技术领域,具体涉及语音技术、深度学习和自然语言处理等人工智能技术领域。具体实施方案为,获取样本语音,并获取待训练的语音切分模型;将样本语音划分为多个样本语音片段;根据语音翻译模型对多个样本语音片段进行翻译,以生成多个样本文本片段;根据多个样本文本片段和预设条件,生成多个样本语音片段的标签值;以及根据多个样本语音片段的标签值和多个样本语音片段对语音切分模型进行训练,以生成训练之后的语音切分模型。由此,能够提高语音切分模型的准确度,且可通过训练的语音切分模型为后续的同声传译提供有意义的语音片段,从而能够提高同声传译的准确率。

2021-11-02

访问量:44

一种基于深度学习的语音情感识别方法
一种基于深度学习的语音情感识别方法,属于语音识别领域。现有语音情感识别率低。本发明方法的一种基于深度学习的语音情感识别方法包括,待测语音信息的预处理;情感特征提取;对提取的情感特征参数进行归一化处理的过程;设计DNN瓶颈层结合决策树和特征融合的语音情感识别系统;利用归一化处理的情感特征参数对识别系统进行训练;利用训练后的DNN瓶颈层结合决策树和特征融合的语音情感识别系统对获取待测语音信息进行语音识别。本发明方法提高了语音情感识别率。

2021-11-02

访问量:40

基于人工智能的语音检测方法、装置及电子设备
本申请提供了一种基于人工智能的语音检测方法、装置、电子设备及计算机可读存储介质;方法包括:将音频信号划分为多个发音片段,获取每个所述发音片段的音频特征;基于每个所述发音片段的音频特征,对每个所述发音片段进行人声分类处理,得到每个所述发音片段的人声分类结果;基于每个所述发音片段的音频特征,对每个所述发音片段进行语种分类处理,得到每个所述发音片段的语种分类结果;基于每个所述发音片段的人声分类结果确定所述音频信号的人声分类结果,并基于每个所述发音片段的语种分类结果确定所述音频信号的语种分类结果。通过本申请,能够提高语音识别的实时性和准确度。

2021-11-02

访问量:48

语音分离方法、系统、装置和存储介质
本发明公开了一种语音分离方法、系统、装置和存储介质,语音分离方法包括对语音信号进行分割,得到多个语音片段,将语音片段映射到时域特征空间,得到时域向量;对时域向量迭代进行多轮识别处理,直至执行识别处理所得的置信度小于阈值后停止执行识别处理,获取目标说话人的语音特征向量,根据时域向量、目标说话人的语音特征向量以及各轮识别处理中所识别到的说话人的语音特征向量,确定目标说话人对应的语音活跃值等步骤。本发明语音分离方法所获得的语音活跃值可以表示目标说话人在语音信号中的某个时刻是否说了话,从而容易清晰地区分说话人的说话顺序,改善了顺序模糊的问题。本发明可广泛应用于语音处理技术领域。

2021-10-29

访问量:44

基于语音数据的客户标签识别方法、装置及计算设备
本发明实施例涉及人工智能技术领域,公开了一种基于语音数据的客户标签识别方法、装置及计算设备,该方法包括:实时获取客户的语音数据并根据所述语音数据识别对应的业务类型;根据所述业务类型将所述语音数据加载至训练后的语音标签识别模型;调用训练后的所述语音标签识别模型对所述语音数据进行客户标签解析,获取对应的客户标签,包括:将所述语音数据切分成长度固定的小片段,所述小片段之前有固定长度的重合部分,并将所述小片段转写成文本数据;对所述文本数据进行客户标签解析,获取对应的客户标签。通过上述方式,本发明实施例能够实现语音的实时转译解析、标签自动提取沉淀,突破了传统标签数据更新周期的瓶颈,创建了实时标签。

2021-10-29

访问量:52

一种人工智能语音识别分析方法、系统、装置及存储介质
本发明涉及语音识别技术领域,具体提供了一种人工智能语音识别分析方法、系统、装置及存储介质,其中,所述方法包括:获取语音数据,生成第一结果;获取口型数据,生成第二结果,其中所述口型数据与所述语音数据的起始时间和结束时间相同;对比第一结果和第二结果,生成最终结果并输出。本发明通过分别翻译语音数据和口型数据,并对比翻译结果,取正确率较高的翻译单词组成最终结果,提高了语音识别的正确率。

2021-10-29

访问量:36

一种医疗问诊数据处理方法和装置
本公开涉及一种医疗问诊数据处理方法和装置,其中,方法包括:在医疗问诊过程中,采集目标时长的问诊语音数据;根据语音方向信息对问诊语音数据进行切割,获取第一语音片段集合和第二类语音片段集合;对第一语音片段集合和第二语音片段集合进行语音识别,生成第一文本集合和第二文本集合;对第一文本集合和第二文本集合进行语义理解,确定第一语音方向对应的第一用户身份标识,以及第二语音方向对应的第二用户身份标识;根据第一用户身份标识和第二用户身份标识对第一文本集合和第二文本集合进行语义分析,获取结构化数据和问诊语音数据存储在预设数据库。由此,在临床问诊过程中,实现更高效的记录信息和保存原始数据。

2021-10-26

访问量:33

注册成为会员可查看更多数据。