以顺序或并行使用的多个识别器；相应的记分组合系统，例如投票系统

一种语音识别系统包括用于将输入声学信号转换为编码器状态序列的编码器、用于识别编码器状态序列中的对转录输出进行编码的编码器状态的位置的对齐解码器、用于基于所识别的编码器状态的位置将编码器状态序列划分成分区集合的划分模块、以及确定针对作为输入提交至基于注意力的解码器的编码器状态的每个分区的转录输出的基于注意力的解码器。当接收到声学信号时,系统使用编码器生成编码器状态序列,基于由对齐解码器识别出的编码器状态的位置,将编码器状态序列划分为分区集合,并且将分区集合顺序地提交到基于注意力的解码器中,以产生针对每个所提交的分区的转录输出。

2021-10-29

访问量：23

一种语音识别方法及装置

本申请公开了一种语音识别方法及装置,用以提高语音识别效率,从而提高语音指令的响应速度。本申请提供的一种语音识别方法,包括：逐帧确定用户语音解码的最优路径；在用户语音截止之前,根据当前最优路径的置信度确定是否输出用户语音对应的识别结果。

2021-10-19

访问量：31

零延迟数字助理

本发明题为“零延迟数字助理”。一种电子设备可通过从麦克风捕获音频输入并使用第一处理器将表示所捕获的音频输入的音频数据写到存储缓冲器来实现零延迟数字助理。响应于在捕获音频输入时检测到用户输入,设备可确定用户输入是否满足预先确定的标准。如果用户输入满足标准,则设备可使用第二处理器基于存储缓冲器的内容的至少一部分来识别并执行任务。

2021-10-01

访问量：30

基于神经网络的自动语音识别方法、设备及可读存储介质

本发明涉及一种人工智能,提供一种基于神经网络的自动语音识别方法、装置、电子设备及计算机可读存储介质,其中方法包括：通过ASR识别进程中的声学模型和ngram语言模型共同对待识别的音频进行识别处理,获取至少两个以上的初次识别结果；将所述初次识别结果传输至rescore进程,并通过rescore进程中的gpt语言模型进行评分处理,获取gpt语言模型得分；将所述gpt语言模型得分传输至所述ASR识别进程,并替换所述ASR识别进程中的ngram语言模型得分；对所述ASR识别进程中的所述gpt语言模型得分与所述声学模型得分之和进行排序,并将排序结果中排序最前的识别结果作为最终识别结果。本发明主要目的在于通过采用gpt语言模型,解决数据稀疏性的问题。

2021-09-28

访问量：38

注册成为会员可查看更多数据。

热门专题

技术分类