语音识别
语音处理方法、装置及系统
本申请涉及智能车辆技术领域,提供一种语音处理方法、装置及系统,其中获取用户的输入语音信息;根据输入语音信息,确定输入语音信息对应的多个第一置信度,多个第一置信度分别对应于多个语种;根据用户的用户特征修正多个第一置信度为多个第二置信度;根据多个第二置信度,确定输入语音信息的语种。采用如上所述的语音处理方法,在考虑了用户特征的基础上确定用户的输入语音信息的语种,因此,能够提高语种识别精度,提高语音识别能力。

2021-11-02

访问量:35

一种外呼时的智能选号方法及系统
本发明提供了一种外呼时的智能选号方法及系统,其中方法包括:对后台服务器发送请求获取选号规则;坐席外呼或自动外呼时,指定任一选号规则,根据选号规则与数据库内外显号码池中外显号码的参数从数据库内外显号码池的外显号码中确定初始外显号码发起外呼;获取外呼通话信息并将外呼通话信息发送至消息队列;对外呼通话信息进行处理,得到最新统计数据;基于最新统计数据对数据库内外显号码池中外显号码的参数进行更新;基于外呼时的智能选号方法的系统可以更灵活、智能的选择外显号,摆脱了之前针对坐席配置固定外显号,或由管理人员根据报表人工配置外显号的方法,提高了管理人员工作效率,降低了企业的外呼、获客成本,提高了企业运营效率。

2021-11-02

访问量:42

一种基于大数据的车载人工智能语音交互系统
本发明公开了一种基于大数据的车载人工智能语音交互系统,通过设置消噪模块、主控模块、实时网络共享模块、主转换模块和深度学习模块,在使用时,其语音唤醒模块保持麦克风阵列始终处于拾音状态,对音频进行静音识别和降噪处理,语音唤醒模块会判断是否出现唤醒词,如果是,后续语音识别服务器随之启动,随即通过深度学习模块与数据库中采用大数据的方式进行比对,使其获取最终的翻译文字后通过雨衣理解服务器进行处理即可,这种方式能够针对于语音收录的过程中保持稳定的语音降噪,保障交互信息收录过程的准确性,同时能够在采用实时共享模块将多个车机采用大数据互联的方式,使其进行共同学习,使其极大的提升识别的准确性。

2021-11-02

访问量:32

口音分类模型训练和口音分类方法、装置和存储介质
本申请涉及一种口音分类模型训练方法、装置、计算机设备和存储介质。该方法包括:获取训练音频和对应的口音类别标签;将训练音频输入初始口音分类模型中,初始口音分类模型通过初始特征提取网络对训练音频特征提取,得到训练音频特征,将训练音频特征输入初始上下文网络进行语义特征提取,得到训练音频上下文语义特征,基于训练音频上下文语义特征得到训练音频对应的训练音频口音类别,初始特征提取网络和初始上下文网络的网络参数是基于自监督预训练得到的;基于训练音频口音类别和对应的口音类别标签计算损失信息,基于损失信息更新初始口音分类模型,当训练完成时,得到目标口音分类模型。采用本方法能够提高目标口音分类模型的分类准确性。

2021-11-02

访问量:34

口音识别声学模型训练、口音识别方法、装置和存储介质
本申请涉及一种口音识别声学模型训练方法、装置、计算机设备和存储介质。所述方法包括:获取训练数据;提取训练语音对应的声学特征;将声学特征和口音区域特征输入初始口音识别声学模型中,初始口音识别声学模型将口音区域特征进行变换,得到初始变换特征,对声学特征进行语音特征提取,得到初始语音特征,将初始变换特征和初始语音特征进行合并,得到初始合并特征,并对初始合并特征进行语音音素识别,得到初始语音音素信息;基于初始语音音素信息和对应的音素标签计算损失信息,基于损失信息更新初始口音识别声学模型,并循环迭代执行,直到训练完成时,得到目标口音识别声学模型。采用本方法能够口音识别的准确性。

2021-11-02

访问量:55

基于人工智能的语音检测方法、装置及电子设备
本申请提供了一种基于人工智能的语音检测方法、装置、电子设备及计算机可读存储介质;方法包括:将音频信号划分为多个发音片段,获取每个所述发音片段的音频特征;基于每个所述发音片段的音频特征,对每个所述发音片段进行人声分类处理,得到每个所述发音片段的人声分类结果;基于每个所述发音片段的音频特征,对每个所述发音片段进行语种分类处理,得到每个所述发音片段的语种分类结果;基于每个所述发音片段的人声分类结果确定所述音频信号的人声分类结果,并基于每个所述发音片段的语种分类结果确定所述音频信号的语种分类结果。通过本申请,能够提高语音识别的实时性和准确度。

2021-11-02

访问量:48

一种基于词素媒介的蒙汉机器翻译方法
本发明公开了一种基于词素媒介的蒙汉机器翻译方法,涉及蒙汉互译技术领域,包括信息输入:将需要进行翻译的信息输入至系统内,输入信息可以为文字形式或者语言形式;S2、词素提取:将输入到系统中的信息进行分解,并提取出信息中的词素信息;S3、词素组合:对分解的词素分为多种词素组合进行拼接,并将其转换为需要被翻译的语音进行组合,本发明的有益效果为:该基于词素媒介的蒙汉机器翻译方法,通过采用语言以及文字双重输入的方式,可以根据使用者的使用要求切换不同的使用方式,并且在进行翻译的时候是利用词素作为媒介进行翻译,可以在保证语句原意的情况下对语句进行分解,并且再将翻译为中文后进行组合,避免翻译出现语义不同的情况。

2021-11-02

访问量:26

音频处理方法、装置及电子设备
本申请提供一种音频处理方法、装置及电子设备,该方法包括:接收电子设备的麦克风识别到的第一语音信息,第一语音信息为第一语种对应的语音信息;将第一语音信息转换成与第二语种对应的第二语音信息;控制电子设备的定向音频器件向目标方位输出第二语音信息对应的语音,以使位于目标方位的目标用户听取第二语音信息对应的语音。这样通过利用电子设备的定向音频器件的定向传播功能,使用不同语言的用户可以通过具有定向音频器件的电子设备完成语音信息的传递,实现面对面的交流,且由于定向音频器件的所具有的定向传播功能,还不用担心定向音频器件输出的语音会被除目标用户之外的其他用户听到,保证了聊天内容的私密性。

2021-10-29

访问量:31

一种闽南语语音识别方法、系统、设备及介质
本发明公开了一种闽南语语音识别方法、系统、设备及介质,使用普通话音素作为建模单元对闽南语进行识别,相较于传统的使用闽南语音素作为建模单元,大幅减少了音素序列的数量,降低了基于音素的n-gram语言模型的复杂度,降低了工作量,从而提高了建模效率;同时,在目标函数中引入条件随机场CRF,CTC的状态后验可以看作是条件随机场的点势能,状态与状态之间的联系可以通过边势能引入,改善了词错误率水平,提高了声学模型的性能,从而提高了识别准确率。

2021-10-29

访问量:41

语音信息处理方法、装置和电子设备
本公开实施例公开了语音信息处理方法、装置和电子设备。该方法的一具体实施方式包括:获取至少一帧待翻译语音信息的第一声学特征信息;在流式语音识别下,确定第一声学特征信息是否对应完整语义;响应于确定结果为是,对所述第一声学特征信息执行翻译操作,得到对应的翻译结果,提高了翻译结果的准确度,降低了翻译结果的输出延迟。

2021-10-29

访问量:23

注册成为会员可查看更多数据。