文本分析或文本以外的语音合成参数的产生,例如语义图翻译为音素、韵律产生、重音或声调测定
一种语音数据标注方法和装置
本发明提供了一种语音数据标注方法和装置,涉及自然语言技术领域。本发明提供的语音数据标注方法和装置,通过获取待标注语音信息的待标注文本数据和待标注音频数据;将所述待标注文本数据转换为拼音序列数据;将所述待标注文本数据输入韵律标注模型中,获得输出的所述待标注文本数据的韵律标识;将所述拼音序列数据和所述待标注音频数据输入强制对齐模型,获得输出的所述拼音序列数据的起止时间标识;将所述拼音序列数据、所述韵律标识以及所述拼音序列数据的起止时间标识进行合并,生成语音标识拼音序列。本发明实施例从韵律标注及音素切分两方面,基于序列韵律标注及强制对齐模型的进行音素起止时间标注,实现自动标注语音数据的目的。

2021-11-02

访问量:32

语音合成方法、装置、设备及可读存储介质
本申请公开了一种语音合成方法、装置、设备及可读存储介质,属于人工智能技术领域。方法包括:获取第一对象的会话数据;根据第一对象的会话数据确定第二对象的情绪信息;从文本数据库中查找与第一对象的会话数据相匹配的文本数据;根据文本数据和第二对象的情绪信息合成第二对象的语音数据,基于第二对象的语音数据对第一对象的会话数据进行回复。由于第二对象的语音数据中包含第二对象的情绪信息,增强了语音数据的表现力,提高了智能机器人的服务质量。

2021-11-02

访问量:36

语音交互方法、装置及相关设备
本申请涉及数据处理技术,提供一种语音交互方法、装置、计算机设备及存储介质,包括:基于目标人物判定模型对初始讲解文本与评价文本分析,判定人物是否为目标人物;获取目标人物的初始讲解文本集,得到若干聚类簇;对聚类簇中的初始讲解文本提取目标特征,得到第一讲解文本集,对第一讲解文本进行组合,得到目标讲解文本;解析目标讲解文本,得到业务流程文本;生成业务流程语音,构建虚拟人物,获取虚拟人物的面部特征以及音频特征;解析语音指令,得到业务流程节点信息;根据业务流程节点信息得到与业务流程节点信息匹配的目标业务流程语音。本申请能够提高业务讲解效率,可用于智慧城市的各个功能模块中,促进智慧城市的快速发展。

2021-11-02

访问量:30

用户分类的方法、计算机设备和可读存储介质
本申请涉及一种用户分类的方法、计算机设备和可读存储介质,其中,该用户分类的方法包括:获取对话内容,并将对话特征对话内容转换成语音文本;对对话特征语音文本进行纠错,输入纠错后的对话特征语音文本至预训练模型中,得到文本特征;输入对话特征至梯度迭代决策树中,得到用户分类标签,其中,对话特征对话特征包括对话特征文本特征,通过本申请,解决了相关技术中智能对话系统的用户分类结果不准确的问题,提高了智能对话系统的用户分类结果的准确性。

2021-10-29

访问量:17

语音合成方法、装置、电子设备及存储介质
本发明涉及语音语义领域,揭露了一种语音合成方法,包括:利用语音合成模型对待合成文本进行语音合成,得到待合成文本的文本语音;获取用户语音,对用户语音进行特征提取,得到特征用户语音;利用语音转换模型中的编码器提取文本语音的语义特征,及特征用户语音的声纹特征,并利用语音转换模型中的解码器对语义特征和声纹特征进行特征融合,得到融合特征;利用声码器对融合特征进行音频合成,得到音频合成结果。另外,本发明还提出一种语音合成装置、电子设备以及计算机可读存储介质。此外,本发明还涉及区块链技术,所述音频合成结果可存储于区块链中。本发明可以实现任意用户语音与文本语音的合成,满足用户个性化的文本语音音色定制需求。

2021-10-26

访问量:33

数据处理方法、移动终端及存储介质
本申请公开一种数据处理方法,包括基于移动终端触发音频数据生成指令时,获取所述音频数据生成指令对应的目标文本数据以及与所述目标文本数据关联的初始音频数据;根据所述目标文本数据与所述初始音频数据的关联关系生成所述目标文本数据对应的目标音频数据。本申请还提供一种移动终端和存储介质。本申请实现文本数据和音频数据之间的转换,使得修改后的文本,对应音频数据也随之修改,保持文本数据和音频数据的一致性。

2021-10-26

访问量:29

声学特征转换及模型训练方法、装置、设备、介质
本申请提供了一种声学特征转换及模型训练方法、装置、设备、介质,应用于人工智能领域;其中,所述声学特征转换方法包括:将待转换文本序列输入至转换模型的编码器网络,得到文本表示序列;待转换文本序列包括音韵特征信息;将文本表示序列输入至转换模型的基础注意力网络,得到当前时间步的第一注意力状态、第一上下文向量和基础注意力得分矩阵;将当前时间步的第一注意力状态和第一上下文向量输入至转换模型的解码器网络,得到第一声学特征;第一声学特征用于合成待转换文本序列对应的音频数据。通过本申请提供的声学特征转换方法,能够生成质量较高的声学特征。

2021-10-26

访问量:15

一种端到端语音转文本罕见词优化方法
本发明公开了一种端到端语音转文本罕见词优化方法,训练集语料库对应标注文本中罕见词列表的构造,首先,整理分析训练集语料的标注文本;然后,使用分词工具对标注文本进行分词并使用SRILM语言模型工具统计单词词频;最后,将词频小于所设置的词频阈值的单词定义为罕见词,将其加入到罕见词列表中,本发明提出的一种端到端语音转文本罕见词优化技术,通过对训练集语料对应的文本标注进行统计分析,并构造包含罕见词的文本语料列表,能够有效搜索出端到端语音识别模型中未充分训练的文本语料。

2021-10-22

访问量:31

语音合成方法、电子设备及存储介质
本发明公开一种语音合成方法,应用于服务器,该方法包括:获取待合成文本;获取目标说话人特征参数;将所述待合成文本和所述目标说话人特征参数输入至通用语音合成模型得到具有目标说话人音色的合成音频。本发明的语音合成方法在服务器执行,在合成具有目标说话人音色的合成音频时,无需配置目标说话人专属的语音合成模型,只需要将待合成文本和目标说话人特征参数输入至通用语音合成模型即可。由此本发明的语音合成方法只需要预先准备目标说话人特征参数即可基于通用语音合成模型合成对应于待合成文本的合成音频。

2021-10-22

访问量:20

一种语音合成方法和装置
本发明实施例提供了一种语音合成方法和装置,所述方法包括:获取输入文本和风格生成模块,根据所述输入文本和所述风格生成模块得到风格特征表示;获取音色标记以及目标语音合成模型;其中,所述目标语音合成模型为基于预先训练的用于提取相关时长表示的时长提取模型和用于提取风格特征表示的风格特征模块训练得到;根据所述输入文本与所述风格特征表示,以及所述音色标记与语音合成模型,得到具有相应风格及相应音色的情感语音。通过自定义情感特征表示的提取及预处理方式实现自定义风格的情感语音合成,在支持合成语音风格自定的基础上实现合成语音的风格适用于语料库中的所有音色,达到半监督的可自定义风格的情感语音合成的目的。

2021-10-22

访问量:25

注册成为会员可查看更多数据。