首页
最新技术
特色专题
技术名词
热点聚焦
行业风向
登录
注册
产生合成语音的方法;语音合成设备
蓝牙耳机
一种蓝牙耳机包括信标信息接收模块、文字转语音模块、蓝牙音频接收模块、及混音处理模块。信标信息接收模块配置用以接收至少一信标装置广播的一信标信息,并通过对应的通信协议解析出该信标信息包含的信息内容后以文本格式输出。文字转语音模块配置用以将文本格式的该信息内容转换成语音格式后以音频信号输出。蓝牙音频接收模块配置用以接收一移动装置发送的一蓝牙音频,并将该蓝牙音频解析成一蓝牙音源信号后输出。混音处理模块配置用以将该音频信号与该蓝牙音源信号进行混音处理成为一混音信号后输出。因此,让使用者更能够专注在目前的活动上,从而提供给使用者更为沉浸式的体验。
2021-11-02
访问量:30
一种语音数据标注方法和装置
本发明提供了一种语音数据标注方法和装置,涉及自然语言技术领域。本发明提供的语音数据标注方法和装置,通过获取待标注语音信息的待标注文本数据和待标注音频数据;将所述待标注文本数据转换为拼音序列数据;将所述待标注文本数据输入韵律标注模型中,获得输出的所述待标注文本数据的韵律标识;将所述拼音序列数据和所述待标注音频数据输入强制对齐模型,获得输出的所述拼音序列数据的起止时间标识;将所述拼音序列数据、所述韵律标识以及所述拼音序列数据的起止时间标识进行合并,生成语音标识拼音序列。本发明实施例从韵律标注及音素切分两方面,基于序列韵律标注及强制对齐模型的进行音素起止时间标注,实现自动标注语音数据的目的。
2021-11-02
访问量:33
语音合成方法、装置、设备及可读存储介质
本申请公开了一种语音合成方法、装置、设备及可读存储介质,属于人工智能技术领域。方法包括:获取第一对象的会话数据;根据第一对象的会话数据确定第二对象的情绪信息;从文本数据库中查找与第一对象的会话数据相匹配的文本数据;根据文本数据和第二对象的情绪信息合成第二对象的语音数据,基于第二对象的语音数据对第一对象的会话数据进行回复。由于第二对象的语音数据中包含第二对象的情绪信息,增强了语音数据的表现力,提高了智能机器人的服务质量。
2021-11-02
访问量:36
歌声合成方法及装置、电子设备及存储介质
本申请实施例涉及语音合成领域,提供一种歌声合成方法及装置、电子设备及存储介质,通过获得待合成歌曲的音素序列输入歌声合成模型,由于音素序列包括音素、音高及音素时长,使得合成的歌唱音频能够反映各个音素的发音时长,提高了歌声合成的自然度;同时,在歌声合成模型的解码阶段输入梅尔谱特征,该梅尔谱特征是预先对参考音频进行处理得到的,使得合成的歌唱音频能够更加接近真人演唱效果,提高了用户的听觉体验。
2021-11-02
访问量:22
文本的语音合成方法、系统、装置、设备及存储介质
本申请提出一种文本的语音合成方法、系统、装置、设备及存储介质,该方法包括:从客户端包括的数据转换接口获得待转换的文本数据;通过预设声学服务模块和预设编解码脚本将文本数据转换为对应的语音数据。本申请在用户终端本地设置预设声学服务模块及预设编解码脚本,或用户终端设置预设编解码脚本,且服务器配置预设声学服务模块。客户端中设置数据转换接口,通过该接口访问语音合成服务。任意客户端中都可设置该接口,任意能安装客户端的设备都可使用语音合成服务,不用购买任何特定设备,也无需下载并安装额外的应用程序,不会增加用户终端上安装的应用程序的数量,节省了用户终端的存储资源和计算资源,降低了用户使用语音合成服务的成本。
2021-11-02
访问量:32
语音交互方法、装置及相关设备
本申请涉及数据处理技术,提供一种语音交互方法、装置、计算机设备及存储介质,包括:基于目标人物判定模型对初始讲解文本与评价文本分析,判定人物是否为目标人物;获取目标人物的初始讲解文本集,得到若干聚类簇;对聚类簇中的初始讲解文本提取目标特征,得到第一讲解文本集,对第一讲解文本进行组合,得到目标讲解文本;解析目标讲解文本,得到业务流程文本;生成业务流程语音,构建虚拟人物,获取虚拟人物的面部特征以及音频特征;解析语音指令,得到业务流程节点信息;根据业务流程节点信息得到与业务流程节点信息匹配的目标业务流程语音。本申请能够提高业务讲解效率,可用于智慧城市的各个功能模块中,促进智慧城市的快速发展。
2021-11-02
访问量:31
结合RPA和AI的语音控制方法及装置
本申请实施例公开了一种结合RPA和AI的语音控制方法及装置,其中,结合RPA和AI的语音控制方法包括:获取控制语音;根据控制语音生成对应的控制指令;将控制指令发送至RPA机器人,以控制RPA机器人根据控制指令对待控制设备进行对应的操作。通过采用上述技术方案,可以方便快捷地实现对可视化数字大屏等待控制设备的演示控制。
2021-10-29
访问量:32
语音对话方法、装置、电子设备及存储介质
本公开提出一种语音对话方法、装置、电子设备及存储介质,属于电子设备技术领域。其中,该语音对话方法应用于电子设备包括:响应于检测到语音对话激活事件,通过目标通道获取用户语音信息;向服务器发送用户语音信息;接收服务器反馈的用户语音信息对应的应答结果;若应答结果中包括通道切换指令,则根据通道切换指令将目标通道切换为自适应波束形成对应的语音通道;以及将应答结果中的应答文本转换为应答语音,并通过扬声器播放。由此,能够在连续对话场景中实现单通道语音输入,从而提高连续对话的成功率和稳定性,进而提高用户体验。
2021-10-29
访问量:34
一种汉语盲文语音合成方法及系统
本发明提出一种汉语盲文语音合成方法和系统,包括:通过将待语音合成的通用盲文文本中标点符号和音节分别转换为中文标点和拼音,得到拼音序列;通过汉字预测模型将该拼音序列转换为汉字,得到带有分词信息的汉字序列,并将该汉字序列输入至韵律预测模型,得到该汉字序列的韵律标签;结合该韵律标签和拼音序列,得到含有韵律标签的拼音序列,并将其输入至语音合成模块,得到该通用盲文文本的语音合成结果。本发明可应用于盲用终端上的电子书阅读器文本编辑器等软件,可以实现通用盲文的实时语音转换,帮助盲人在阅读盲文时可以实时听到其触摸的文字,更好地理解他们所阅读的内容。
2021-10-29
访问量:33
一种低质数据的自动化合成方法、装置及电子设备
本发明提供了一种低质数据的自动化合成方法、装置及电子设备,涉及语音技术领域,包括获取低质音频数据;对所述低质音频数据进行噪音分离,得到发音数据和噪音数据;基于所述噪音数据去除所述发音数据的背景噪音,得到去除背景噪音的发音数据;对所述发音数据进行语音识别,得到所述发音数据的文本信息;输入所述文本信息至预先训练的声学模型,得到合成的音频数据。本申请具有在保证全自动化的情形下对收集到的低质量音频数据进行语音合成任务的功能。
2021-10-29
访问量:29
注册成为会员可查看更多数据。
热门专题
左旋肉碱的制备方法 左旋肉碱生产工艺 左旋肉碱相关技术资料
免烧砖的制造方法及应用 免烧砖相关专利技术
水溶肥制备方法和应用 水溶肥相关技术资料
保温砂浆及其制备方法 保温砂浆相关技术资料
聚羧酸减水剂的配方 聚羧酸减水剂制备方法 聚羧酸减水剂相关技术资料
除湿机的结构设计 新型工业除湿机的制造 除湿机相关技术资料
脱硫剂的制备方法及系统 脱硫剂数字化评价装置及其评价方法
硅基材料的生产工艺 新型硅基负极材料 硅基材料相关生产制备工艺
柔性电池的制备方法 柔性电池的工艺原理 柔性电池相关生产制备技术资料
汽车充电桩的设计原理 新型汽车充电桩 汽车充电桩的生产制造设计工艺
技术分类
本小类其他组不包括的技术主题
判别语音信号之间的浊音和清音部分
语音信号的音调确定
语音信号内离散点的检测
从噪声判别声音
从音乐中判别声音
语音信号存在或不存在的检测
模拟声道参数
用于发送分析结果
用于评估合成或解码语音信号
提取与健康状况相关的参数
情感状态估计
语音信号的质量检测
用于处理视频信号
为检索
比较或判别
专门适用于特定用途
以分析窗类型为特征的
利用遗传算法
利用混沌理论
利用模糊逻辑
利用神经网络
以分析方法为特征的
提取参数的倒谱
提取参数的功率信息
提取参数的每个子带的频谱信息
提取参数的共振信息
提取参数的预测系数
提取参数的零交叉率
提取参数的相关性系数
以提取参数类型为特征的
不限于组G10L15/00-G10L21/00的语言或者声音分析技术
转换处理的零部件
转换成非可视形式
通过显示频域信息
通过显示时域信息
转换成可视信息
将语音转换成非可听表达形式,例如语音可视化、触觉辅助的语音处理
用于提高可识度
用于与其他信号的同步,例如,视频信号
拨打电话
下载资料
栏目导航
会员登录