一种语音识别系统及识别方法

文档序号:1157600 发布日期:2020-09-15 浏览:29次 >En<

阅读说明:本技术 一种语音识别系统及识别方法 (Voice recognition system and recognition method ) 是由 李新生 贾彦亭 李汶 于 2020-05-27 设计创作,主要内容包括:本发明公开的属于信息科技技术领域,具体为一种语音识别系统及识别方法,信号采集提取模块、模型库模块、发音词典、语言模型和解码器,所述信号采集提取模块与解码器连接,所述解码器与语言模型连接,所述语言模型与模型库和发音词典连接,根据信号采集提取模块对语音信息进行提取,通过降噪单元即可提高提取和识别效率,然后根据发音词典和模型库模块可以实现根据国语发音采用声韵母模式作为分析方法,提高音节的识别效率,同时可以根据语境提高语音识别的信息输出准确性,从而减少人工调整等情况发生,提高输出效率。(The invention belongs to the technical field of information technology, and particularly relates to a voice recognition system and a voice recognition method.)

一种语音识别系统及识别方法

技术领域

本发明涉及信息科技技术领域,具体为一种语音识别系统及识别方法。

背景技术

语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

现有的语音识别系统在使用时,进行语音识别难免会造成输出信息有误的情况发生,造成在进行语音输出完成后,仍然需要人工对信息进行调整,降低了语音输出的效率。

发明内容

本部分的目的在于概述本发明的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于上述和/或现有语音识别系统中存在的问题,提出了本发明。

因此,本发明的目的是提供一种语音识别系统及识别方法,能够提高语音输出的识别效率,减少信息的更改。

为解决上述技术问题,根据本发明的一个方面,本发明提供了如下技术方案:

一种语音识别系统,包括信号采集提取模块、模型库模块、发音词典、语言模型和解码器,所述信号采集提取模块与解码器连接,所述解码器与语言模型连接,所述语言模型与模型库和发音词典连接。

作为本发明所述的一种语音识别方法的一种优选方案,其中:该语音识别方法如下:

步骤一:信号采集提取模块采集和提取外部语音信息;

步骤二:解码器对采集的信息的信号进行处理;

步骤三:通过语言模型获取语境;

步骤四:通过模型库和发音词典确定输出词汇;

步骤五:根据输入信号通过解码器生成一组信号获得结果,最终输出最优解。

作为本发明所述的一种语音识别方法的一种优选方案,其中:所述步骤一中的信号采集提取模块基于信号采集算法和数据提取算法运行,所述信号采集提取模块还包括降噪单元,所述降噪单元基于语音降噪算法运行。

作为本发明所述的一种语音识别方法的一种优选方案,其中:所述步骤二中解码器对采集信号进行处理具体为将采集的信号获取最大概率输出该信号的词串。

作为本发明所述的一种语音识别方法的一种优选方案,其中:所述步骤三中语言模型获取语境具体为根据上下文的语境区别发音相似的词语或者短语,从而找到适合该语境的最佳词语。

作为本发明所述的一种语音识别方法的一种优选方案,其中:所述步骤四中发音词典具体为词汇与模型库的声学特征的映射关系,所述模型库由多个不同的发音频率作为声学特性构成。

与现有技术相比:现有的语音识别系统在使用时,进行语音识别难免会造成输出信息有误的情况发生,造成在进行语音输出完成后,仍然需要人工对信息进行调整,降低了语音输出的效率,本申请文件中,根据信号采集提取模块对语音信息进行提取,通过降噪单元即可提高提取和识别效率,然后根据发音词典和模型库模块可以实现根据国语发音采用声韵母模式作为分析方法,提高音节的识别效率,同时可以根据语境提高语音识别的信息输出准确性,从而减少人工调整等情况发生,提高输出效率。

附图说明

为了更清楚地说明本发明实施方式的技术方案,下面将结合附图和详细实施方式对本发明进行详细说明,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:

图1为本发明一种语音识别系统及识别方法的系统结构示意图;

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施方式的限制。

其次,本发明结合示意图进行详细描述,在详述本发明实施方式时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施方式作进一步地详细描述。

本发明提供一种语音识别系统,包括信号采集提取模块、模型库模块、发音词典、语言模型和解码器,所述信号采集提取模块与解码器连接,所述解码器与语言模型连接,所述语言模型与模型库和发音词典连接,具体的,该语音识别系统的原理通过对声道的短管级联模型处理,使系统的传递函数符合全极点数字滤波器的形式,从而n时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。对LPC的计算方法使用了德宾Durbin法、协方差法和格型法。计算上的快速有效保证了声学特征。针对国语发音采用了声韵母模式作为分析方法,可以更精准的识别出正确的音节。最后通过线性回归算法将声音处理为文本输出到应用场景中。

一种语音识别方法,该语音识别方法如下:

步骤一:信号采集提取模块采集和提取外部语音信息;

步骤二:解码器对采集的信息的信号进行处理;

步骤三:通过语言模型获取语境;

步骤四:通过模型库和发音词典确定输出词汇;

步骤五:根据输入信号通过解码器生成一组信号获得结果,最终输出最优解。

其中,所述步骤一中的信号采集提取模块基于信号采集算法和数据提取算法运行,所述信号采集提取模块还包括降噪单元,所述降噪单元基于语音降噪算法运行。

其中,所述步骤二中解码器对采集信号进行处理具体为将采集的信号获取最大概率输出该信号的词串。

其中,所述步骤三中语言模型获取语境具体为根据上下文的语境区别发音相似的词语或者短语,从而找到适合该语境的最佳词语。

其中,所述步骤四中发音词典具体为词汇与模型库的声学特征的映射关系,所述模型库由多个不同的发音频率作为声学特性构成。

虽然在上文中已经参考实施方式对本发明进行了描述,然而在不脱离本发明的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本发明所披露的实施方式中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本发明并不局限于文中公开的特定实施方式,而是包括落入权利要求的范围内的所有技术方案。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:语音处理装置、会议系统以及语音处理方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!