一种基于大数据的车载人工智能语音交互系统

文档序号:193360 发布日期:2021-11-02 浏览:33次 >En<

阅读说明:本技术 一种基于大数据的车载人工智能语音交互系统 (Vehicle-mounted artificial intelligence voice interaction system based on big data ) 是由 王永锋 朱方其 徐波 于 2021-09-06 设计创作,主要内容包括:本发明公开了一种基于大数据的车载人工智能语音交互系统,通过设置消噪模块、主控模块、实时网络共享模块、主转换模块和深度学习模块,在使用时,其语音唤醒模块保持麦克风阵列始终处于拾音状态,对音频进行静音识别和降噪处理,语音唤醒模块会判断是否出现唤醒词,如果是,后续语音识别服务器随之启动,随即通过深度学习模块与数据库中采用大数据的方式进行比对,使其获取最终的翻译文字后通过雨衣理解服务器进行处理即可,这种方式能够针对于语音收录的过程中保持稳定的语音降噪,保障交互信息收录过程的准确性,同时能够在采用实时共享模块将多个车机采用大数据互联的方式,使其进行共同学习,使其极大的提升识别的准确性。(The invention discloses a vehicle-mounted artificial intelligence voice interaction system based on big data, which is characterized in that a noise elimination module, a main control module, a real-time network sharing module, a main conversion module and a deep learning module are arranged, when in use, a voice awakening module keeps a microphone array in a pickup state all the time, the audio is subjected to mute recognition and noise reduction, the voice awakening module can judge whether awakening words appear or not, if yes, a subsequent voice recognition server is started, and then the voice awakening module is compared with a database in a big data mode through the deep learning module, so that the final translated words are obtained and then processed through a raincoat understanding server, the method can keep stable voice noise reduction in the voice receiving and recording process, ensure the accuracy of the interactive information receiving and recording process, and simultaneously adopt the real-time sharing module to interconnect a plurality of vehicle machines in a big data mode, the method and the device can carry out common learning, and the accuracy of identification is greatly improved.)

一种基于大数据的车载人工智能语音交互系统

技术领域

本发明涉及智能语音交互领域,特别是涉及一种基于大数据的车载人工智能语音交互系统。

背景技术

随着目前车辆的车机系统的发展,智能化语音系统对于行驶过程具备良好的辅助效果,能够免于操作直接进行交流与功能选择的作用,其发展如今,车机的智能语音交互系统逐渐趋于完善。

然而目前的该类车用的语音交互系统在使用时其功能及其单一,采用实时联网的方式进行接入后台数据库进行问答处理,这就对于数据库中的知识储备有着较为全面的要求,作为运营车辆而言,针对不同客户的五花八门问题自己口音,对于智能化的语音交互有着极高的挑战,对于声音的稳定采集以及准确的识别信息是最为基础的一个层面,故而对其进行音频的采集保障就显得不可或缺。

发明内容

为了克服现有技术的不足,本发明提供一种基于大数据的车载人工智能语音交互系统,作为运营车辆而言,针对不同客户的五花八门问题自己口音,对于智能化的语音交互有着极高的挑战,对于声音的稳定采集以及准确的识别信息是最为基础的一个层面,故而对其进行音频的采集保障就显得不可或缺。

为解决上述技术问题,本发明提供如下技术方案:一种基于大数据的车载人工智能语音交互系统,包括主控模块,所述主控模块的输入端与消噪模块的输出端电连接,所述消噪模块的输入端与语音识别服务器的输出端电连接,所述语音识别服务器的输入端与语音唤醒模块的输出端电连接,所述语音唤醒模块的输入端与消噪模块的输出端电连接,所述主控模块的与实时网络共享模块双向电连接,所述实时网络共享模块的输出端与云端服务器的输入端电连接,所述云端服务器的输出端与主转换模块的输入端电连接,所述主转换模块的输出端与分类模块的输入端电连接,所述分类模块的输出端分别与数据库和深度学习模块的输入端电连接,所述深度学习模块与分类模块均与数据库的输入端电连接,所述主转换模块的输出端与语义理解服务器的输入端电连接,所述语义理解服务器的输出端与实施网络共享模块的输入端电连接。

作为本发明的一种优选技术方案,所述主转换模块的输出端与模型库的输入端电连接,所述模型库的输出端与深度学习模块的输入端电连接。

作为本发明的一种优选技术方案,所述消噪模块采用降噪专用dsp芯片与八个麦克风阵列的硬件配合方式,所述降噪模块采用谱减法降噪,所述谱减法计算式如下:

其中:ps(ω)为纯净语音信号功率谱,px(ω)为原声信号功率谱,pn(ω)为噪声信号功率谱。

作为本发明的一种优选技术方案,所述语音唤醒模块采用对麦克风阵列持续处于拾音状态,对采集音频进行采样量化。

作为本发明的一种优选技术方案,所述语音识别服务器采用多个麦克风进行多个音频数据的同步高质量收录,并直接对多个音频信号频谱进行对比,将重复度最高的收录信号发送到消噪模块。

作为本发明的一种优选技术方案,所述实时网络共享模块采用4G网络方式数据传输,所述主控模块采用安装9.0系统平台框架搭建。

作为本发明的一种优选技术方案,所述主转换模块具体为语音转文字功能,且能够顺畅识别则直接将文字发送到语义理解服务器,若无法识别语音则发送到模型库。

作为本发明的一种优选技术方案,所述模型库对语音进行收录和比对,通过深度学习模块进行搜索近似项,并通过将检索的近似项进行语言数据通过大数据进行匹配即可。

与现有技术相比,本发明能达到的有益效果是:

通过设置消噪模块、语音识别服务器、语音唤醒模块、主控模块、实时网络共享模块、主转换模块和深度学习模块,在使用时,其语音唤醒模块保持麦克风阵列始终处于拾音状态,并经过内置的基本的信号处理,对音频进行静音识别和降噪处理,语音唤醒模块会判断是否出现唤醒词,如果是,后续语音识别服务器随之启动,识别交互语音信息后通过消噪模块处理,车辆与风的噪音噪声的特点为加性的、局部平稳的且与语音信号统计独立,频谱法进行处理后根据噪声的加性特点,通过噪声能量估计和增益计算得到噪声的功率谱,然后从带噪语音的功率谱中减去估计出的噪声得到较为纯净的语音,随之对于一些口音带方言的交互语音中,其主转换模块难以检测出完整的文字,使其通过模型库建立独立的模型文件对比,随即通过深度学习模块与数据库中采用大数据的方式进行比对,使其获取最终的翻译文字后通过雨衣理解服务器进行处理即可,这种方式能够针对于语音收录的过程中保持稳定的语音降噪,保障交互信息收录过程的准确性,同时能够在采用实时共享模块将多个车机采用大数据互联的方式,使其进行共同学习,使其极大的提升识别的准确性。

附图说明

图1为本发明系统的结构示意图;

图2为本发明消噪模块的流程框图。

其中:1主控模块、2消噪模块、3语音识别服务器、4语音唤醒模块、5实时网络共享模块、6云端服务器、7主转换模块、8分类模块、9数据库、10深度学习模块、11模型库、12语义理解服务器。

具体实施方式

为了使本发明实现的技术手段;创作特征;达成目的与功效易于明白了解,下面结合具体实施例,进一步阐述本发明,但下述实施例仅仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其它实施例,都属于本发明的保护范围。下述实施例中的实验方法,如无特殊说明,均为常规方法,下述实施例中所用的材料;试剂等,如无特殊说明,均可从商业途径得到。

实施例

如图1-2所示,本发明提供一种基于大数据的车载人工智能语音交互系统,包括主控模块1,主控模块1的输入端与消噪模块2的输出端电连接,消噪模块2的输入端与语音识别服务器3的输出端电连接,语音识别服务器3的输入端与语音唤醒模块4的输出端电连接,语音唤醒模块4的输入端与消噪模块2的输出端电连接,主控模块1的与实时网络共享模块5双向电连接,实时网络共享模块5的输出端与云端服务器6的输入端电连接,云端服务器6的输出端与主转换模块7的输入端电连接,主转换模块7的输出端与分类模块8的输入端电连接,分类模块8的输出端分别与数据库9和深度学习模块10的输入端电连接,深度学习模块10与分类模块8均与数据库9的输入端电连接,主转换模块7的输出端与语义理解服务器12的输入端电连接,语义理解服务器12的输出端与实施网络共享模块的输入端电连接。

主转换模块7的输出端与模型库11的输入端电连接,模型库11的输出端与深度学习模块10的输入端电连接,语音唤醒模块4采用对麦克风阵列持续处于拾音状态,对采集音频进行采样量化,语音识别服务器3采用多个麦克风进行多个音频数据的同步高质量收录,并直接对多个音频信号频谱进行对比,将重复度最高的收录信号发送到消噪模块2,实时网络共享模块5采用4G网络方式数据传输,主控模块1采用安装9.0系统平台框架搭建,主转换模块7具体为语音转文字功能,且能够顺畅识别则直接将文字发送到语义理解服务器12,若无法识别语音则发送到模型库11,模型库11对语音进行收录和比对,通过深度学习模块10进行搜索近似项,并通过将检索的近似项进行语言数据通过大数据进行匹配即可。

消噪模块2采用降噪专用dsp芯片与八个麦克风阵列的硬件配合方式,降噪模块采用谱减法降噪,谱减法计算式如下:

其中:ps(ω)为纯净语音信号功率谱,px(ω)为原声信号功率谱,pn(ω)为噪声信号功率谱。

在使用时,其语音唤醒模块4保持麦克风阵列始终处于拾音状态,并经过内置的基本的信号处理,对音频进行静音识别和降噪处理,语音唤醒模块4会判断是否出现唤醒词,如果是,后续语音识别服务器3随之启动,识别交互语音信息后通过消噪模块2处理,车辆与风的噪音噪声的特点为加性的、局部平稳的且与语音信号统计独立,频谱法进行处理后根据噪声的加性特点,通过噪声能量估计和增益计算得到噪声的功率谱,然后从带噪语音的功率谱中减去估计出的噪声得到较为纯净的语音,随之对于一些口音带方言的交互语音中,其主转换模块7难以检测出完整的文字,使其通过模型库11建立独立的模型文件对比,随即通过深度学习模块10与数据库9中采用大数据的方式进行比对,使其获取最终的翻译文字后通过雨衣理解服务器进行处理即可,这种方式能够针对于语音收录的过程中保持稳定的语音降噪,保障交互信息收录过程的准确性,同时能够在采用实时共享模块将多个车机采用大数据互联的方式,使其进行共同学习,使其极大的提升识别的准确性。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接触,也可以包括第一和第二特征不是直接接触而是通过它们之间的另外的特征接触。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正下方和斜下方,或仅仅表示第一特征水平高度小于第二特征。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

7页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种会议语音数据采集方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!