首页
最新技术
特色专题
技术名词
热点聚焦
行业风向
登录
注册
语音识别系统的评估或评价
语音识别校正方法及其相应的装置、设备、介质
本申请公开一种语音识别校正方法及其相应的装置、设备、介质,该方法包括:获取选定的声学模型从原始音频数据中识别出的初步音频文本及置信度数据;将初步音频文本中置信度低于预设阈值的字词替换为空洞标记,获得标记音频文本;根据与原始音频数据的原始音频文本对所述标记音频文本实施文本对齐,使标记音频文本中的空洞标记根据原始音频文本获得对应补全,以获得订正音频文本;将所述原始音频数据标记为训练样本,将所述订正音频文本标记为该原始音频数据的监督标签,存储于声学模型训练所需的样本库中。本申请能够对关联于相同语音内容的音频文本和音频数据所构成的脏数据进行高效地清洗,从而制备出声学模型训练所需的训练数据。
2021-10-22
访问量:44
一种语音识别方法及装置
本申请公开了一种语音识别方法及装置,用以提高语音识别效率,从而提高语音指令的响应速度。本申请提供的一种语音识别方法,包括:逐帧确定用户语音解码的最优路径;在用户语音截止之前,根据当前最优路径的置信度确定是否输出用户语音对应的识别结果。
2021-10-19
访问量:31
一种语音识别缺陷检测方法和装置
本发明实施例提供了一种语音识别缺陷检测方法和装置,所述方法包括:接收车载系统转发的语音请求;对所述语音请求的文本进行意图分类;根据意图分类结果,对所述文本进行置信度分类;根据置信度分类结果,从所述文本确定候选词进行筛选,筛选出关键词作为语音识别缺陷。本发明实施例可以更准确地识别出语音请求的文本中的语音识别缺陷。
2021-10-19
访问量:30
一种语音测试方法、计算机设备及可读存储介质
本申请提供了一种语音测试方法、计算机设备及可读存储介质,该方法包括接收音频测试文件,音频测试文件包括主叫终端发出的唤醒语音及被叫终端响应唤醒语音发出的回复语音;解析音频测试文件以生成测试音频波形曲线;根据测试音频波形曲线计算唤醒语音的结束时间及回复语音的开始时间的差值,以得到被叫终端的响应时间。通过上述方法,本申请能够减少测试误差,降低人工成本,提高测试结果的一致性及测试效率。
2021-10-19
访问量:35
唤醒测试的方法、装置、电子设备和可读存储介质
本公开提供了一种唤醒测试的方法、装置、电子设备和可读存储介质,涉及自动驾驶、智能交通技术领域。其中,唤醒测试的方法包括:获取多个唤醒音频;将所述多个唤醒音频在车辆中进行播放,并在每个唤醒音频的播放过程中设置噪音环境;根据所述车辆中的至少一个待测试车载客户端针对不同唤醒音频的唤醒结果,得到所述至少一个待测试车载客户端的唤醒率。本公开能够降低唤醒测试的成本,提升唤醒测试的准确性。
2021-10-01
访问量:32
语音合成系统评测方法、装置、可读存储介质及终端设备
本发明属于自然语言处理技术领域,尤其涉及一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备。所述方法包括:将预设的文本序列分别输入至待评测的若干个语音合成系统中,并分别获取各个语音合成系统的输出语音序列;获取与所述文本序列对应的基准语音序列;根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离;选取与所述基准语音序列之间的整体偏差距离最小的语音合成系统作为优选语音合成系统,并使用所述优选语音合成系统执行语音合成任务。通过本发明,可以在提高评测效率的同时也提高评测准确度。
2021-09-28
访问量:27
语音识别测试方法、装置、测试设备及存储介质
本申请涉及人工智能领域,提供了一种语音识别测试方法、装置、测试设备及存储介质,该方法包括:获取测试文件,该测试文件包括多个基于不同收音角度生成的语音文件、以及各语音文件对应的收音角度和标准文本;将多个语音文件发送给多个待测设备,并指示多个待测设备各自对多个语音文件进行语音识别,以使多个待测设备各自生成与多个语音文件一一对应的多个识别文本;获取多个待测设备各自生成的多个识别文本;将对应同一语音文件的识别文本与标准文本进行文本比对,确定多个待测设备各自对各语音文件的识别结果;根据多个待测设备各自对多个语音文件的识别结果,确定多个待测设备各自的语音识别准确率。因此,本申请能够提高批量测试时的准确性。
2021-09-28
访问量:35
测试方法、装置及系统
本申请实施例公开了测试方法、装置及系统,所述系统包括:控制子系统,用于在测试过程中播放测试语料,所述测试语料中包括测试语音指令,所述测试语音指令的尾部关联有超声波信号;待测子系统,用于对收听到的测试语料进行处理以便生成应答语音流,并在处理过程中的至少一个处理节点处播放超声波信号;音频采集子系统,用于在测试过程中进行音频信号进行采集,并将音频采集结果提供给所述控制子系统;所述控制子系统还用于,从所述音频采集结果中检测出超声波信号在音频时间轴上的位置信息,根据所述位置信息确定所述待测子系统的响应时间信息。通过本申请实施例,可以获得更准确的测试结果。
2021-09-24
访问量:31
注册成为会员可查看更多数据。
热门专题
左旋肉碱的制备方法 左旋肉碱生产工艺 左旋肉碱相关技术资料
免烧砖的制造方法及应用 免烧砖相关专利技术
水溶肥制备方法和应用 水溶肥相关技术资料
保温砂浆及其制备方法 保温砂浆相关技术资料
聚羧酸减水剂的配方 聚羧酸减水剂制备方法 聚羧酸减水剂相关技术资料
除湿机的结构设计 新型工业除湿机的制造 除湿机相关技术资料
脱硫剂的制备方法及系统 脱硫剂数字化评价装置及其评价方法
硅基材料的生产工艺 新型硅基负极材料 硅基材料相关生产制备工艺
柔性电池的制备方法 柔性电池的工艺原理 柔性电池相关生产制备技术资料
汽车充电桩的设计原理 新型汽车充电桩 汽车充电桩的生产制造设计工艺
技术分类
本小类其他组不包括的技术主题
判别语音信号之间的浊音和清音部分
语音信号的音调确定
语音信号内离散点的检测
从噪声判别声音
从音乐中判别声音
语音信号存在或不存在的检测
模拟声道参数
用于发送分析结果
用于评估合成或解码语音信号
提取与健康状况相关的参数
情感状态估计
语音信号的质量检测
用于处理视频信号
为检索
比较或判别
专门适用于特定用途
以分析窗类型为特征的
利用遗传算法
利用混沌理论
利用模糊逻辑
利用神经网络
以分析方法为特征的
提取参数的倒谱
提取参数的功率信息
提取参数的每个子带的频谱信息
提取参数的共振信息
提取参数的预测系数
提取参数的零交叉率
提取参数的相关性系数
以提取参数类型为特征的
不限于组G10L15/00-G10L21/00的语言或者声音分析技术
转换处理的零部件
转换成非可视形式
通过显示频域信息
通过显示时域信息
转换成可视信息
将语音转换成非可听表达形式,例如语音可视化、触觉辅助的语音处理
用于提高可识度
用于与其他信号的同步,例如,视频信号
拨打电话
下载资料
栏目导航
会员登录