产生合成语音的方法;语音合成设备
蓝牙耳机
一种蓝牙耳机包括信标信息接收模块、文字转语音模块、蓝牙音频接收模块、及混音处理模块。信标信息接收模块配置用以接收至少一信标装置广播的一信标信息,并通过对应的通信协议解析出该信标信息包含的信息内容后以文本格式输出。文字转语音模块配置用以将文本格式的该信息内容转换成语音格式后以音频信号输出。蓝牙音频接收模块配置用以接收一移动装置发送的一蓝牙音频,并将该蓝牙音频解析成一蓝牙音源信号后输出。混音处理模块配置用以将该音频信号与该蓝牙音源信号进行混音处理成为一混音信号后输出。因此,让使用者更能够专注在目前的活动上,从而提供给使用者更为沉浸式的体验。

2021-11-02

访问量:30

一种语音数据标注方法和装置
本发明提供了一种语音数据标注方法和装置,涉及自然语言技术领域。本发明提供的语音数据标注方法和装置,通过获取待标注语音信息的待标注文本数据和待标注音频数据;将所述待标注文本数据转换为拼音序列数据;将所述待标注文本数据输入韵律标注模型中,获得输出的所述待标注文本数据的韵律标识;将所述拼音序列数据和所述待标注音频数据输入强制对齐模型,获得输出的所述拼音序列数据的起止时间标识;将所述拼音序列数据、所述韵律标识以及所述拼音序列数据的起止时间标识进行合并,生成语音标识拼音序列。本发明实施例从韵律标注及音素切分两方面,基于序列韵律标注及强制对齐模型的进行音素起止时间标注,实现自动标注语音数据的目的。

2021-11-02

访问量:33

语音合成方法、装置、设备及可读存储介质
本申请公开了一种语音合成方法、装置、设备及可读存储介质,属于人工智能技术领域。方法包括:获取第一对象的会话数据;根据第一对象的会话数据确定第二对象的情绪信息;从文本数据库中查找与第一对象的会话数据相匹配的文本数据;根据文本数据和第二对象的情绪信息合成第二对象的语音数据,基于第二对象的语音数据对第一对象的会话数据进行回复。由于第二对象的语音数据中包含第二对象的情绪信息,增强了语音数据的表现力,提高了智能机器人的服务质量。

2021-11-02

访问量:36

歌声合成方法及装置、电子设备及存储介质
本申请实施例涉及语音合成领域,提供一种歌声合成方法及装置、电子设备及存储介质,通过获得待合成歌曲的音素序列输入歌声合成模型,由于音素序列包括音素、音高及音素时长,使得合成的歌唱音频能够反映各个音素的发音时长,提高了歌声合成的自然度;同时,在歌声合成模型的解码阶段输入梅尔谱特征,该梅尔谱特征是预先对参考音频进行处理得到的,使得合成的歌唱音频能够更加接近真人演唱效果,提高了用户的听觉体验。

2021-11-02

访问量:22

文本的语音合成方法、系统、装置、设备及存储介质
本申请提出一种文本的语音合成方法、系统、装置、设备及存储介质,该方法包括:从客户端包括的数据转换接口获得待转换的文本数据;通过预设声学服务模块和预设编解码脚本将文本数据转换为对应的语音数据。本申请在用户终端本地设置预设声学服务模块及预设编解码脚本,或用户终端设置预设编解码脚本,且服务器配置预设声学服务模块。客户端中设置数据转换接口,通过该接口访问语音合成服务。任意客户端中都可设置该接口,任意能安装客户端的设备都可使用语音合成服务,不用购买任何特定设备,也无需下载并安装额外的应用程序,不会增加用户终端上安装的应用程序的数量,节省了用户终端的存储资源和计算资源,降低了用户使用语音合成服务的成本。

2021-11-02

访问量:32

语音交互方法、装置及相关设备
本申请涉及数据处理技术,提供一种语音交互方法、装置、计算机设备及存储介质,包括:基于目标人物判定模型对初始讲解文本与评价文本分析,判定人物是否为目标人物;获取目标人物的初始讲解文本集,得到若干聚类簇;对聚类簇中的初始讲解文本提取目标特征,得到第一讲解文本集,对第一讲解文本进行组合,得到目标讲解文本;解析目标讲解文本,得到业务流程文本;生成业务流程语音,构建虚拟人物,获取虚拟人物的面部特征以及音频特征;解析语音指令,得到业务流程节点信息;根据业务流程节点信息得到与业务流程节点信息匹配的目标业务流程语音。本申请能够提高业务讲解效率,可用于智慧城市的各个功能模块中,促进智慧城市的快速发展。

2021-11-02

访问量:31

结合RPA和AI的语音控制方法及装置
本申请实施例公开了一种结合RPA和AI的语音控制方法及装置,其中,结合RPA和AI的语音控制方法包括:获取控制语音;根据控制语音生成对应的控制指令;将控制指令发送至RPA机器人,以控制RPA机器人根据控制指令对待控制设备进行对应的操作。通过采用上述技术方案,可以方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

2021-10-29

访问量:32

语音对话方法、装置、电子设备及存储介质
本公开提出一种语音对话方法、装置、电子设备及存储介质,属于电子设备技术领域。其中,该语音对话方法应用于电子设备包括:响应于检测到语音对话激活事件,通过目标通道获取用户语音信息;向服务器发送用户语音信息;接收服务器反馈的用户语音信息对应的应答结果;若应答结果中包括通道切换指令,则根据通道切换指令将目标通道切换为自适应波束形成对应的语音通道;以及将应答结果中的应答文本转换为应答语音,并通过扬声器播放。由此,能够在连续对话场景中实现单通道语音输入,从而提高连续对话的成功率和稳定性,进而提高用户体验。

2021-10-29

访问量:34

一种汉语盲文语音合成方法及系统
本发明提出一种汉语盲文语音合成方法和系统,包括:通过将待语音合成的通用盲文文本中标点符号和音节分别转换为中文标点和拼音,得到拼音序列;通过汉字预测模型将该拼音序列转换为汉字,得到带有分词信息的汉字序列,并将该汉字序列输入至韵律预测模型,得到该汉字序列的韵律标签;结合该韵律标签和拼音序列,得到含有韵律标签的拼音序列,并将其输入至语音合成模块,得到该通用盲文文本的语音合成结果。本发明可应用于盲用终端上的电子书阅读器文本编辑器等软件,可以实现通用盲文的实时语音转换,帮助盲人在阅读盲文时可以实时听到其触摸的文字,更好地理解他们所阅读的内容。

2021-10-29

访问量:33

一种低质数据的自动化合成方法、装置及电子设备
本发明提供了一种低质数据的自动化合成方法、装置及电子设备,涉及语音技术领域,包括获取低质音频数据;对所述低质音频数据进行噪音分离,得到发音数据和噪音数据;基于所述噪音数据去除所述发音数据的背景噪音,得到去除背景噪音的发音数据;对所述发音数据进行语音识别,得到所述发音数据的文本信息;输入所述文本信息至预先训练的声学模型,得到合成的音频数据。本申请具有在保证全自动化的情形下对收集到的低质量音频数据进行语音合成任务的功能。

2021-10-29

访问量:29

注册成为会员可查看更多数据。