一种车载语音操作系统人机互动方法及装置

文档序号：193339 发布日期：2021-11-02 浏览：45次 >En<

阅读说明：本技术 一种车载语音操作系统人机互动方法及装置 (Human-computer interaction method and device for vehicle-mounted voice operating system ) 是由胡凯文胡世民于 2021-07-26 设计创作，主要内容包括：本发明公开了一种车载语音操作系统人机互动方法及装置,通过语音唤醒,启动车载语音操作系统,在车内安装的多个语音收发器,用于收集多音源的声音,并将收集到的音频发送至音频处理器进行处理,得到用户语音数据；并对无法识别的语音进行重新匹配加入到新增语音指令中,便于以后人员再次使用该指令时,语音系统能够进行识别并作出相应动作,避免因用户使用方言而导致同一语句多次使用时系统无法解析而降低用户体验感,使得语音系统更加完善；在语音解析识别过程中,用户新增的语音指令数据保存在本地数据库中,具有较好的私密性；系统优先与本地数据进行比对,便于实现快速查询比对,提升运行效率。(The invention discloses a man-machine interaction method and a man-machine interaction device for a vehicle-mounted voice operating system, wherein the vehicle-mounted voice operating system is started through voice awakening, and a plurality of voice transceivers are arranged in a vehicle and used for collecting the sound of a plurality of sound sources and sending the collected audio to an audio processor for processing to obtain user voice data; the voice which cannot be recognized is re-matched and added into the newly added voice command, so that when the command is used again by later personnel, the voice system can recognize and make corresponding actions, the phenomenon that the system cannot be analyzed when the same statement is used for multiple times due to dialect use of a user is avoided, and the user experience is reduced, and the voice system is more perfect; in the voice analysis and recognition process, the newly added voice instruction data of the user is stored in the local database, so that the privacy is better; the system is preferentially compared with local data, so that quick query and comparison are conveniently realized, and the operation efficiency is improved.)

一种车载语音操作系统人机互动方法及装置

技术领域

本发明涉及人机语音交互系统技术领域，尤其涉及一种车载语音操作系统人机互动方法及装置。

背景技术

汽车操作系统作为汽车的大脑，相关技术也在不断进步，但市场上的车辆操作系统却一直没有足够颠覆的用户体验，最大的原因是用户需要进行诸多手动操作，而在用户驾车时手动操作需要用户转移注意力和时间，这对用户来说不仅不够便捷，对于驾车这种特别需要用户专注的行为来说有时候将是致命的。

语音识别、控制技术的不断成熟，其被更广泛的应用到各个领域，也有更多的汽车的智能操作系统开始使用语音识别与控制技术。然而现行的语音识别、控制技术应用到操作系统中仍有一些问题需要解决。

为了解决上述问题，人们开始研究车载人机语音交互系统，人员发出语音指令通过车载语音交互系统处理后，系统指导车载器件进行相关动作，以此简化人员的操作步骤，减少人员手上的动作，使得司机能够更加专心的从事驾驶工作，提高专注力，可以有效降低因为司机分神导致的交通事故发生的几率。但是，现有的车载系统任然存在一些不足，因为车载语音操作系统在接收到人员的语音指令后，将语音信息进行编码并与语音数据库进行比对、查询出相关机械指令，进而指导机器动作，若司机或车内其他人员使用方言进行人机交互时，系统往往因为无法识别该语音内容进而无法作出对应的动作，影响人员的使用体验。

发明内容

本发明的目的是为了解决现有技术中存在的缺点，而提出了一种车载语音操作系统人机互动方法及装置。

本发明提出的一种车载语音操作系统人机互动方法，包括以下步骤：

S1：语音唤醒，车内人员使用指定的唤醒语句启动车载语音操作系统；

S2：在车内安装多个语音收发器，用于收集声音，并将收集到的音频发送至音频处理器进行处理，得到用户语音数据；

S3：对用户语音进行识别判断语义，若语义识别成功则执行S4，并将无法识别信号标识int_flag_a置0；若语义无法识别则提醒用户重新说，将本次无法识别的语音数据保存到本地语音数据库，同时将无法识别信号标识int_flag_a置1，并回到步骤S2；

S4：将车载语音操作系统识别的指令显示在显示器上，并检测无法识别信号的标识值，若无法识别信号标识int_flag_a为0，表示系统记载没有记录到无法识别的语义，执行S6；若无法识别信号标识int_flag_a为1，表示有系统记录到有无法识别的语义，并询问是否进入语音指令新增模块；

S5：若S4中用户选择进入语音指令新增模块，则语音操作系统将当前本地语音数据库中存储的无法识别的指令与本次识别成功的指令进行匹配关联并保存至在线语音数据库，以此扩充语句指令，便于下次用户再次使用该无法识别的语句指令时系统能够完成识别；若S4中用户选择不进入语音指令新增模块，则语音操作系统将当前本地语音数据中存储的无法识别的指令删除后执行S6；

S6：人员确定是否执行识别的指令，若是，则执行S7；若否，这执行S9；

S7：语音系统自动将本次语音指令与系统中的动作指令进行匹配，并将匹配后的动作指令发送到汽车的中央处理器；

S8：中央处理器接收到动作指令后，控制相关设备进行动作；

S9：结束本次语音操作，车载语音操作系统进入待唤醒状态。

优选地，音频处理器用于除杂滤波，分离出不同音源的声音，并将语音文件转化为文本文件显示在显示器上。

优选地，S3步骤中语义为音频处理器解析分段整合的数据，若整合后的数据能格式化为标准语句，则表明语义可识别；若整合后的数据不能格式化为标准语句，则表明语义不可识别。

优选地，语音指令与动作指令为多对一的关系，便于在添加新的语音指令后，使用新的语音指令控制设备动作。

优选地，步骤S8中设备动作为硬件设备作出响应或软件停止/开始运行。

一种车载语音操作系统人机互动装置，包括语音收发器、数据存储器、显示器、按键、音频处理器、基于SIM卡的网络通讯器、车载中控器和后台服务器。

优选地，语音收发器为麦克风，且麦克风个数至少为四，分布安装于车辆的内部四周。

优选地，数据存储器包含有以下数据分类：指令数据库和语音数据库，语音数据库中包含有本地数据库和在线数据库，本地语音数据库为两个区域，其一为临时区域，该区域用于存储系统运行过程中无法识别的语音数据，该区域数据掉电丢失；另一区域为存储区域，该区域用于存储匹配成功后的新增语音数据，参与语音比对遍历。

优选地，按键的个数至少为五，按键均位于车辆的方向盘上，显示器为触摸屏。

本发明的有益效果为：

本发明通过人员语音唤醒功能启动车载语音操作系统，在车内安装的多个语音收发器，用于收集多音源的声音，并将收集到的音频发送至音频处理器进行处理，得到用户语音数据；并对无法识别的语音进行重新匹配加入到新增语音指令中，便于以后人员再次使用该指令时，语音系统能够进行识别并作出相应动作，避免因用户使用方言而导致同一语句多次使用时系统无法解析而降低用户体验感，使得语音系统更加完善；在语音解析识别过程中，用户可以放弃语义匹配，以实现系统的可选择性，用户新增的语音指令数据保存在本地数据库中，具有较好的私密性，在数据比对时，系统优先与本地数据进行比对，以此便于实现快速查询比对，提升运行效率。

附图说明

图1为本发明提出的一种车载语音操作系统人机互动方法的执行流程图；

图2为本发明提出的一种车载语音操作系统人机互动装置的结构框图；

图3为本发明提出的一种车载语音操作系统人机互动装置的数据库框图。

具体实施方式

下面详细描述本专利的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本专利，而不能理解为对本专利的限制。

在本专利的描述中，需要理解的是，术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本专利和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本专利的限制。

在本专利的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“设置”应做广义理解，例如，可以是固定相连、设置，也可以是可拆卸连接、设置，或一体地连接、设置。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本专利中的具体含义。

参照图1-3，一种车载语音操作系统人机互动方法，包括以下步骤：

S1：语音唤醒，车内人员使用指定的唤醒语句启动车载语音操作系统；

S2：在车内安装多个语音收发器，用于收集声音，并将收集到的音频发送至音频处理器进行处理，得到用户语音数据；

S6：人员确定是否执行识别的指令，若是，则执行S7；若否，这执行S9；

S7：语音系统自动将本次语音指令与系统中的动作指令进行匹配，并将匹配后的动作指令发送到汽车的中央处理器；

S8：中央处理器接收到动作指令后，控制相关设备进行动作；

S9：结束本次语音操作，车载语音操作系统进入待唤醒状态。

本发明中，音频处理器用于除杂滤波，分离出不同音源的声音，并将语音文件转化为文本文件显示在显示器上。

本发明中，S3步骤中语义为音频处理器解析分段整合的数据，若整合后的数据能格式化为标准语句，则表明语义可识别；若整合后的数据不能格式化为标准语句，则表明语义不可识别，如本车系统中不包含有语音中提到的需要动作的设备。

本发明中，语音指令与动作指令为多对一的关系，便于在添加新的语音指令后，使用新的语音指令控制设备动作。

本发明中，步骤S8中设备动作为硬件设备作出响应或软件停止/开始运行。

本发明中，语音收发器为麦克风，且麦克风个数至少为四，分布安装于车辆的内部四周，用于接收多位置的声音信号。

本发明中，数据存储器包含有以下数据分类：指令数据库和语音数据库，语音数据库中包含有本地数据库和在线数据库，本地语音数据库为两个区域，其一为临时区域，该区域用于存储系统运行过程中无法识别的语音数据，该区域数据掉电丢失；另一区域为存储区域，该区域用于存储匹配成功后的新增语音数据，参与语音比对遍历。

本发明中，按键的个数至少为五，按键均位于车辆的方向盘上，具有翻阅和确认功能，显示器为触摸屏。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

9页详细技术资料下载

一种车载语音操作系统人机互动方法及装置

相关技术

网友询问留言