语音合成设备的体系结构

本申请提出一种文本的语音合成方法、系统、装置、设备及存储介质,该方法包括：从客户端包括的数据转换接口获得待转换的文本数据；通过预设声学服务模块和预设编解码脚本将文本数据转换为对应的语音数据。本申请在用户终端本地设置预设声学服务模块及预设编解码脚本,或用户终端设置预设编解码脚本,且服务器配置预设声学服务模块。客户端中设置数据转换接口,通过该接口访问语音合成服务。任意客户端中都可设置该接口,任意能安装客户端的设备都可使用语音合成服务,不用购买任何特定设备,也无需下载并安装额外的应用程序,不会增加用户终端上安装的应用程序的数量,节省了用户终端的存储资源和计算资源,降低了用户使用语音合成服务的成本。

2021-11-02

访问量：32

文本分析与语音合成方法、装置、系统及存储介质

本发明提供一种文本分析与语音合成方法、装置、系统及存储介质。方法包括：获取待处理文本；对待处理文本进行人名识别,以确定待处理文本中出现的所有人名；将所有人名中属于同一角色的人名聚类在一起,以获得与至少一个角色一一对应的至少一个人名集合；至少基于至少一个人名集合确定全局角色信息,全局角色信息包括与至少一个角色一一对应的至少一组角色信息,每组角色信息包括对应角色的代表性角色名称和别名集合；结合全局角色信息对待处理文本中的任一目标语句进行文本分析,文本分析包括对至少一个预设项目的分析,至少一个预设项目包括以下一项或多项：文本类型、角色名称和角色属性。利用全局角色信息辅助识别局部的角色信息。

2021-10-22

访问量：30

语音合成方法、装置、系统及存储介质

本发明提供一种语音合成方法、装置、系统及存储介质。方法包括：获取待处理文本；对任一目标语句进行文本分析,以获得初始文本分析结果,文本分析包括对至少一个预设项目的分析,至少一个预设项目包括以下一项或多项：文本类型、角色名称、角色属性和情绪类别；输出文本结果信息,文本结果信息包括初始文本分析结果；接收用户输入的文本反馈信息；在文本反馈信息包括与初始文本分析结果相关的第一修改信息的情况下,基于第一修改信息对初始文本分析结果进行修改,以获得新文本分析结果；至少基于最终文本分析结果对目标语句进行语音合成。保证较高效率的同时获得高质量的合成语音。

2021-10-22

访问量：40

一种基于慕课语音数据集的语音合成方法

本发明公开了一种基于慕课语音数据集的语音合成方法,该方法的主要特征在于通过真实场景下的语音构建的数据集进行语音合成,并进行说话人转换和多语种语音合成；该方法运用端到端的语音合成模型生成梅尔频谱,并用基于生成对抗网络的声码器将梅尔频谱转换成最终音频。本发明在真实场景下的语音数据集上有良好的效果,降低了语音合成所需数据的要求,提高了合成音频的质量,使合成音频更贴近真实说话场景。

2021-10-22

访问量：46

中控及智能设备控制方法

本申请公开了一种中控及智能设备控制方法。实施应用中,可通过中控对多个智能设备进行协调,以使多个智能设备能够自动的为用户提供服务来提高智能设备的资源利用率。如本申请中,中控控制第一智能设备为目标对象播放音频流,并监测目标对象的当前位置信息；若目标对象的当前位置信息处于第一智能设备负责的播放范围之外时,查找播放范围包含目标对象的当前位置信息的第二智能设备；若音频流未播放完毕,则控制第二智能设备继续播放音频流。由此,实现用户在移动后由第二智能设备接力为用户播报音频。

2021-10-15

访问量：36

一种语音转发方法及服务器、智能语音设备

本发明公开了一种语音转发方法及服务器、智能语音设备,所述方法包括接收第一智能语音设备采集的语音通知消息,确定第一智能语音设备的地址,根据语音通知消息确定出通知人的身份信息、第一通知信息和被通知人的身份信息,确定出第一转发内容,根据被通知人身份信息进行人员定位,定位到被通知人的位置后,确定出第二智能语音设备的地址,确定出第一语音消息,上传至消息总线进行第一语音消息转发。通过对被通知人进行人员定位,确定出被通知人的位置,依据被通知人的位置得到第二智能语音设备的地址,从而通过消息总线将语音消息进行转发,以使第二智能语音设备监听到语音消息后向被通知人播放,使得被通知人快速听取消息,提高消息转发效率。

2021-10-08

访问量：25

基于问答库的语音识别处理化学品事故的接警系统及方法

本发明公开了一种基于问答库的语音识别处理化学品事故的接警系统及方法,属于接警领域,本发明提供一种基于化学品问答库的智能电话语音识别处理化学品事故的接警系统及方法,通过语音识别技术,理解用户查询意图,查询化学品问答库,语音合成输出答案等技术手段,使用户直接自助获取解决问题的接警方法。提高了查询的方便性、快捷性和准确性,提升服务质量,节约人工成本。本发明中可应用于危险化学品领域的接警,也可广泛应用于公共安全服务中的其他各个领域的接警服务,应用前景良好。

2021-10-08

访问量：41

跨讲话者风格转移语音合成

本公开提供了用于训练声学模型的方法和装置。所述声学模型可以用于实现跨讲话者风格转移并且至少包括风格编码器。可以获得训练数据,所述训练数据包括与参考音频对应的文本、讲话者标识(ID)、风格ID、以及声学特征。可以通过所述风格编码器,基于所述声学特征来生成参考嵌入向量。可以至少利用所述风格ID和所述讲话者ID对所述参考嵌入向量执行对抗训练,以去除讲话者信息并保留风格信息。可以通过所述风格编码器,至少基于所述经过对抗训练的参考嵌入向量来生成风格嵌入向量。可以至少基于与所述文本对应的状态序列、与所述讲话者ID对应的讲话者嵌入向量、以及所述风格嵌入向量来生成预测的声学特征。

2021-10-01

访问量：30

产品防伪处理方法、装置、计算机设备及存储介质

本发明公开一种产品防伪处理方法、装置、计算机设备及存储介质。该方法包括：扫描目标产品的目标防伪声纹码,获取目标防伪声纹码对应的目标防伪数字编码；对目标防伪数字编码进行编码校验,获取编码校验结果；若编码校验结果为校验通过,则基于目标防伪数字编码查询系统数据库,获取目标产品介绍文本和正品产品介绍频谱；将目标产品介绍文本输入文本频谱合成模型进行识别,获取目标产品介绍频谱；基于目标产品介绍频谱和正品产品介绍频谱,获取真伪识别结果,显示和/或播放真伪识别结果。该方法无需采用专用工具进行防伪识别,有助降低防伪识别的操作不便性和成本,且通过编码校验和频谱校验,有助于保障获取到的真伪识别结果的效率和准确性。

2021-10-01

访问量：25

信息处理设备和信息处理方法

本技术涉及能够使用更佳的输出模态输出信息的信息处理设备和信息处理方法。提供了一种信息处理设备,该信息处理设备包括处理单元,该处理单元被配置为执行以下处理：获取关于每个电子装置的输出模态的装置信息；基于获取的装置信息从多个电子装置中选择具有输出信息的输出模态的电子装置；以及从选择的电子装置的输出模态输出该信息。本技术可以应用于例如电子装置,诸如信息装置、视频装置、音频装置或家用电器。

2021-09-28

访问量：33

注册成为会员可查看更多数据。

热门专题

技术分类