语音分类或检索
一种内容显示方法、显示设备及服务器
本实施例提供一种内容显示方法、显示设备及服务器。显示设备的控制器在接收用户输入的用于唤醒语音交互功能的指令,根据该指令驱动声音采集器启动。如果进一步未从声音采集器获取到可用于搜索媒资内容的搜索关键词,则向服务器发送备选媒资请求。从服务器接收根据备选媒资请求查找的备选媒资信息,以及在显示器上显示该备选媒资信息。本申请实施例在未能获取到用户的明确意图时,也可以从服务器获取相应的备选媒资信息,并在显示器上显示该备选媒资信息。避免简单文本回复,或者无回复的情况发生,从而提升用户使用体验。

2021-11-02

访问量:26

一种语音识别离线命令词唤醒应用方法与系统
本申请公开了一种语音识别离线命令词唤醒应用方法与系统,其包括预设离线命令词集,所述离线命令词集包括至少一个离线命令词;采集语音数据并进行缓存;对缓存的所述语音数据与所述离线命令词集中的离线命令词进行匹配,匹配成功则对语音系统进行唤醒。本申请可根据需求灵活设置离线命令词集中的离线命令词的数量,从而便于对不同的语音系统进行唤醒,增加唤醒效果,尽量避免对多个语音系统同时进行唤醒,使对语音系统的唤醒更加具有指定性。

2021-11-02

访问量:23

查询方法、装置、终端设备及存储介质
本申请公开了一种查询方法、装置、终端设备及存储介质,涉及智能搜索领域。具体实现方案为:获取语音查询指令;根据所述语音查询指令获取预设区域的图像;根据所述预设区域的图像确定待查询内容;根据所述待查询内容确定查询结果,并展示所述查询结果。本申请实施例提供的方案,无需对书本进行拍照、框选等操作,直接通过用户发出语音查询指令即可启动查询操作,并最终得到查询结果进行展示,操作简便。

2021-11-02

访问量:38

语音数据的处理方法及装置、存储介质、电子装置
本发明提供了一种语音数据的处理方法及装置、存储介质、电子装置,上述方法包括:获取待处理的语音数据;根据多个预设语音模型中各预设语音模型对应的权重,从多个预设语音模型中确定至少一个目标语音模型,各预设语音模型的权重表征该预设语音模型识别结果的置信度;通过至少一个目标语音模型对待处理的语音数据进行处理,解决了现有技术中在使用多种语音识别引擎(即语音模型)进行语音识别时,识别时间长,无法确定识别结果的准确率等问题,确保了语音数据进行识别的灵活性,提升对于识别准确率的确定时间。

2021-11-02

访问量:30

基于意图识别的流程节点跳转方法、装置、设备及介质
本发明涉及人工智能技术,提供一种基于意图识别的流程节点跳转方法、装置、设备及介质,该方法包括:从预设有至少两个流程节点的业务流程中确定待处理节点,流程节点关联有条件标签集和可选意图,可选意图关联有识别信息和唯一的意图标签,条件标签集包括至少一个条件标签;获取待处理语音信息并输入至预设的NLP模型中得到识别结果;将根据识别结果确定的目标意图的意图标签输入至标签计数器,并获取业务流程开始后获取到的全部意图标签组成的标签累计结果;根据标签累计结果匹配出目标流程节点并进行跳转。根据本发明实施例提供的方案,无需人手操作,通过累计的意图标签确定目标流程节点,能够在复杂逻辑的情况下提高目标流程节点的匹配准确性。

2021-11-02

访问量:50

基于人工智能的语音检测方法、装置及电子设备
本申请提供了一种基于人工智能的语音检测方法、装置、电子设备及计算机可读存储介质;方法包括:将音频信号划分为多个发音片段,获取每个所述发音片段的音频特征;基于每个所述发音片段的音频特征,对每个所述发音片段进行人声分类处理,得到每个所述发音片段的人声分类结果;基于每个所述发音片段的音频特征,对每个所述发音片段进行语种分类处理,得到每个所述发音片段的语种分类结果;基于每个所述发音片段的人声分类结果确定所述音频信号的人声分类结果,并基于每个所述发音片段的语种分类结果确定所述音频信号的语种分类结果。通过本申请,能够提高语音识别的实时性和准确度。

2021-11-02

访问量:48

虚拟机器人形象优化方法、系统、存储介质及计算机设备
本发明适用于虚拟机器人技术领域,提供了一种虚拟机器人形象优化方法,包括:解析识别语音信息中的播放歌曲的指令,生成所述歌曲的槽位参数信息;分析判断所述槽位参数信息中所述歌曲对应的类型,生成匹配所述类型的形象标签;根据所述形象标签对应的人物形象以变换虚拟机器人。还提供了一种虚拟机器人形象优化系统、用于存储执行所述方法的计算机程序的存储介质以及实现所述方法的计算机设备。借此,本发明能够有效的减少在播放歌曲时,降低歌曲本身与虚拟机器人的落差感,使虚拟人物形象和歌曲类型趋同,使用户在听虚拟机器人唱歌时更自然。

2021-10-29

访问量:57

语音唤醒方法和设备
本申请涉及语音唤醒技术领域,尤其涉及一种语音唤醒方法和设备。其中,所述语音唤醒方法,应用于具有麦克风的电子设备,包括:检测到满足第一条件的至少两路麦克风输入的语音信号;根据所述至少两路麦克风输入的语音信号的语音能量是否满足第二条件,确定是否唤醒电子设备;其中,如果满足所述第二条件,则唤醒电子设备;如果不满足所述第二条件,则继续检测麦克风输入的语音信号。基于本申请实施例的方法和设备,可以实现以免唤醒词方式语音唤醒电子设备。

2021-10-29

访问量:33

一种基于AI技术的实时对讲干预与告警平台
本发明提供了一种基于AI技术的实时对讲干预与告警平台包括通讯服务器、媒体资源控制服务器和AI语音训练与识别平台,通讯服务器用于提供通信服务,并将通信内容实时转化成音频媒体流,发送到媒体资源控制服务器;媒体资源控制服务器用于将音频媒体流转换成文本内容发送到AI语音训练与识别平台;AI语音训练与识别平台用于识别文本内容中涉及的敏感信息,以及识别文本内容中涉及的音频进行分类,发送告警信息至通讯服务器,启动通讯服务器中的干预模块。本发明用于识别多个业务场景中出现的敏感词、暴力恐吓、求救声、异常声音等风险信息,启动对应的干预动作,以达到净化会话环境,及时处理意外事件发生的目的。

2021-10-26

访问量:26

基于特征选择与迁移学习的语音抑郁状态识别方法
本发明提供一种基于特征选择与迁移学习的语音抑郁状态识别方法,针对基于语音进行建模时特征维度较高、特征分布受被试除抑郁水平外的个体差异影响两个问题,提出融合Lasso和迁移学习方法CORAL的语音抑郁状态识别方法。其优势在于1.Lasso过滤特征中的冗余信息,保留有效特征,在提升模型效率的基础上进一步提升识别精度;2.迁移学习方法CORAL在不泄漏抑郁标签信息的前提下,拉近训练集与测试集的特征分布,减小特征分布受抑郁水平外其他因素的影响。两种方法相结合能进一步提高抑郁筛查的准确性和稳定性。

2021-10-26

访问量:30

注册成为会员可查看更多数据。