声音编辑，例如操控合成设备的声音

本公开公开了语音转换方法、系统、电子设备及可读存储介质,涉及语音、深度学习等人工智能技术领域,尤其涉及语音转换领域。具体实现方案为：语音转换方法,包括：获取目标说话人第一语音；获取原说话人语音；提取目标说话人第一语音的第一特征参数；提取原说话人语音的第二特征参数；将所述第一特征参数和所述第二特征参数进行处理得到梅尔谱信息；将所述梅尔谱信息进行转换,输出同目标说话人第一语音的音色相同,并且同原说话人语音的内容相同的目标说话人第二语音。本公开的语音转换方法及系统保留了目标说话人的语音情感、腔调等音色特征,并且见减小了运算成本。

2021-10-29

访问量：34

数据处理方法、移动终端及存储介质

本申请公开一种数据处理方法,包括基于移动终端触发音频数据生成指令时,获取所述音频数据生成指令对应的目标文本数据以及与所述目标文本数据关联的初始音频数据；根据所述目标文本数据与所述初始音频数据的关联关系生成所述目标文本数据对应的目标音频数据。本申请还提供一种移动终端和存储介质。本申请实现文本数据和音频数据之间的转换,使得修改后的文本,对应音频数据也随之修改,保持文本数据和音频数据的一致性。

2021-10-26

访问量：29

歌声合成方法、装置、计算机设备及存储介质

本发明公开了一种歌声合成方法、装置、计算机设备及存储介质,应用于计算机技术领域。本发明提供的方法包括：获取目标歌曲的音乐数据,通过预设的编码器对所述音乐数据进行编码,生成音乐编码数据；将音乐数据编码输入到注意力机制网络进行编码,生成特征信息；将特征信息输入到歌声合成模型中,并生成第一声谱数据；对所述第一声谱数据进行解码,得到第一线性谱数据,并通过傅里叶变换方式,将所述第一线性谱数据转换成目标歌曲音频。本发明通过少量的训练数据训练得到歌声合成模型,提高了目标歌曲音频的合成效率,同时保证目标歌曲音频的合成效果。

2021-10-26

访问量：28

语音合成方法、电子设备及存储介质

本发明公开一种语音合成方法,应用于服务器,该方法包括：获取待合成文本；获取目标说话人特征参数；将所述待合成文本和所述目标说话人特征参数输入至通用语音合成模型得到具有目标说话人音色的合成音频。本发明的语音合成方法在服务器执行,在合成具有目标说话人音色的合成音频时,无需配置目标说话人专属的语音合成模型,只需要将待合成文本和目标说话人特征参数输入至通用语音合成模型即可。由此本发明的语音合成方法只需要预先准备目标说话人特征参数即可基于通用语音合成模型合成对应于待合成文本的合成音频。

2021-10-22

访问量：20

文本分析与语音合成方法、装置、系统及存储介质

本发明提供一种文本分析与语音合成方法、装置、系统及存储介质。方法包括：获取待处理文本；对待处理文本进行人名识别,以确定待处理文本中出现的所有人名；将所有人名中属于同一角色的人名聚类在一起,以获得与至少一个角色一一对应的至少一个人名集合；至少基于至少一个人名集合确定全局角色信息,全局角色信息包括与至少一个角色一一对应的至少一组角色信息,每组角色信息包括对应角色的代表性角色名称和别名集合；结合全局角色信息对待处理文本中的任一目标语句进行文本分析,文本分析包括对至少一个预设项目的分析,至少一个预设项目包括以下一项或多项：文本类型、角色名称和角色属性。利用全局角色信息辅助识别局部的角色信息。

2021-10-22

访问量：30

语音合成方法、装置、系统及存储介质

本发明提供一种语音合成方法、装置、系统及存储介质。方法包括：获取待处理文本；对任一目标语句进行文本分析,以获得初始文本分析结果,文本分析包括对至少一个预设项目的分析,至少一个预设项目包括以下一项或多项：文本类型、角色名称、角色属性和情绪类别；输出文本结果信息,文本结果信息包括初始文本分析结果；接收用户输入的文本反馈信息；在文本反馈信息包括与初始文本分析结果相关的第一修改信息的情况下,基于第一修改信息对初始文本分析结果进行修改,以获得新文本分析结果；至少基于最终文本分析结果对目标语句进行语音合成。保证较高效率的同时获得高质量的合成语音。

2021-10-22

访问量：40

一种基于慕课语音数据集的语音合成方法

本发明公开了一种基于慕课语音数据集的语音合成方法,该方法的主要特征在于通过真实场景下的语音构建的数据集进行语音合成,并进行说话人转换和多语种语音合成；该方法运用端到端的语音合成模型生成梅尔频谱,并用基于生成对抗网络的声码器将梅尔频谱转换成最终音频。本发明在真实场景下的语音数据集上有良好的效果,降低了语音合成所需数据的要求,提高了合成音频的质量,使合成音频更贴近真实说话场景。

2021-10-22

访问量：46

一种收款播报的方法、装置、设备及存储介质

本发明实施例涉及一种收款播报的方法、装置、设备及存储介质,包括：从收款信息中获取与收款金额相关的金额信息；确定所述金额信息中每个字符对应的单位信息以及文本信息,得到所述金额信息对应的单位信息集合和文本信息集合；针对所述金额信息中所述字符的顺序、所述单位信息集合和所述文本信息集合对所述收款信息进行语音播报。本方案可自主录制播报语音,只需录入几个指定的音频信息就可进行收款播报,成本更低,技术实现起来更方便。

2021-10-15

访问量：22

一种智能语音伴读方法、装置以及伴读盒

本发明涉及计算机技术领域,尤其涉及一种智能语音伴读方法、装置以及伴读盒。所述方法包括：接收伴读开始指令,所述伴读开始指令用于指示伴读者；在检测到倾听者的文字指示对象时,获取所述文字指示对象所指示的文字对象；获取匹配所述文字对象的所述伴读者的声音信息；根据所述文字指示对象输出所述声音信息。本方案的伴读盒可以实现根据倾听者的时间灵活伴读,且可以自由录入伴读者的声音以供所述倾听者选择,还可以实现根据伴读者指向文字的速度实时伴读。

2021-10-08

访问量：26

一种音频处理方法、装置、电子设备及可读存储介质

本申请提供了一种音频处理方法、装置、电子设备及可读存储介质,属于数据处理技术领域。本申请通过获取目标音频的第一音频帧集合和参考音频的第二音频帧集合；按照所述第二音频帧集合中的语义特征对所述第一音频帧集合中的语义特征执行时域维度上的对齐处理,得到所述第一音频帧集合对应的目标音频帧集合；确定所述目标音频帧集合对应的第一音高集合,以及,确定所述第二音频帧集合对应的第二音高集合；基于所述第一音高集合和所述第二音高集合确定调整策略；利用所述调整策略对所述目标音频的音高进行调整。以避免由于没有考虑用户自身的音高造成失真的情况。

2021-10-01

访问量：46

注册成为会员可查看更多数据。

热门专题

技术分类