一种插件式语音识别方法、智能电子秤及交易平台

文档序号:88054 发布日期:2021-10-08 浏览:35次 >En<

阅读说明:本技术 一种插件式语音识别方法、智能电子秤及交易平台 (Plug-in type voice recognition method, intelligent electronic scale and transaction platform ) 是由 郑吉贵 熊会超 郑吉富 于 2021-07-07 设计创作,主要内容包括:本发明公开了一种插件式语音识别方法、智能电子秤及交易平台,方法包括:S1,语音监听,设定起始标记,当监听到起始标记时,获取其后的关键语音;S2,语音编码,将关键语音转换成文本数据;S3,关键词识别,根据文本数据,设定孤立词词长,对文本数据进行关键词识别,当未能识别关键词时,返回S1;S4,匹配检索,将关键词与数据库中的数据进行匹配,当无匹配项时,返回S1,匹配成功时,输出匹配项,并返回S1;智能电子秤包括:语音识别系统与交易系统,语音识别系统包括:语音监听模块、语音编码模块、关键词识别模块、匹配检索模块及交易系统,交易系统包括:展示装置、称重装置、结算装置;交易平台包括:智能电子秤和服务器。(The invention discloses a plug-in voice recognition method, an intelligent electronic scale and a transaction platform, wherein the method comprises the following steps: s1, monitoring voice, setting a start mark, and acquiring subsequent key voice when the start mark is monitored; s2, voice coding, converting the key voice into text data; s3, identifying keywords, setting the word length of isolated words according to the text data, identifying the keywords of the text data, and returning to S1 when the keywords cannot be identified; s4, matching and searching, matching the keywords with the data in the database, returning to S1 when no matching item exists, outputting the matching item when the matching is successful, and returning to S1; the intelligent electronic scale includes: speech recognition system and transaction system, the speech recognition system includes: pronunciation monitoring module, speech coding module, keyword recognition module, match retrieval module and transaction system, transaction system includes: the device comprises a display device, a weighing device and a settlement device; the trading platform comprises: intelligent electronic scale and server.)

一种插件式语音识别方法、智能电子秤及交易平台

技术领域

本发明涉及语音识别

技术领域

,尤其是涉及一种插件式语音识别方法、智能电子秤及交易平台。

背景技术

传统的电子秤、智能电子秤系统,只有手动输入、手动查找功能,当品类/菜品很多时,卖家需要在系统屏幕上,翻好几页才能找到对应的品类/菜品,而长时间翻页搜索,为农贸市场的经营户原本就繁忙的工作带来不便,且当手湿滑或者沾污时,更不方便触摸和点击。

发明内容

为解决现有技术的不足,实现插件式语音识别、搜索菜品的目的,本发明采用如下的技术方案:

一种插件式语音识别方法,包括如下步骤:

S1,语音监听,设定起始标记,当监听到起始标记时,获取其后的关键语音,从而避免对关键语音的实时监听或关键词的实时识别所带来的能耗,同时也为了避免农贸市场中隔壁摊位或客户的语音信号的影响,导致的误识别;

S2,语音编码,将关键语音转换成文本数据,同时通过编码对数据起到加密的效果;

S3,关键词识别,根据文本数据,设定孤立词词长,对文本数据进行关键词识别,从而也起到了过滤不相关长句或短语(长于关键词阈值)的效果,当未能识别关键词时,返回S1;

S4,匹配检索,将关键词与数据库中的数据进行匹配,当无匹配项时,返回S1,当匹配成功时,输出匹配项,并返回S1。

进一步地,当未能识别关键词,和/或识别的关键词无匹配项时,返回S1后,直接监听关键语音,直至预设的第N次返回后,恢复对起始标记的监听,所述N为自然数,因为农贸市场环境相对嘈杂,通过一两次输入语音,无法识别的几率较高,通过省略对起始标记的监听,商户无需再次喊出起始标记,直接喊出关键语音即可,以提高再次识别的便捷性;同时,商户无需等待识别系统反馈是否识别到匹配项(通过等待屏幕中是否自动跳出需要的菜品),直接连续输入两次以上的关键语音即可。

进一步地,所述S1中,未在预设时间内获取到关键语音的,则返回对起始标记的监听,避免商户或买家喊出起始标记后,因其他事宜不再输入菜品/菜品分类时,系统进行空等,无法进行后续的语音监听,当商户或买家喊出起始标记后,不再需要输入菜品/菜品分类时,无需其他操作即可使系统回复到语音监听的状态,增加了便捷性;同时,还能过滤超出预设之间的长语音,提高降噪、语音识别的效率。

进一步地,所述S1中,为关键语音设定分隔标记,用于区分连续的关键语音,一方面,将分隔标记前后的关键语音作为一组关键语音输入,如:依次可以输入2个以上的菜品/菜品分类,作为一组,并行的进行后续语音降噪、语音编码、关键词识别等操作,提高关键语音的识别效率;另一方面,通过分隔标记前后的关键语音依次进行后续的操作,从而提高识别连续关键语音的精准率。

进一步地,对所述S1获取到的关键语音进行语音降噪,由于农贸市场环境嘈杂,需要对接收到的语音信号进行降噪处理。

进一步地,设置接口与外部系统对接,通过返回函数,将所述匹配项输出至外部系统。

进一步地,所述关键语音包括菜品名和菜品分类,当先获取到菜品分类,并匹配上的菜品分类的匹配项后,将该菜品分类的子类进行展示,并返回S1,监听所述菜品分类的子类,并进行语音识别,循环展示子类和监听子类语音信号,直至监听并识别到菜品名。

一种插件式语音识别智能电子秤,包括:语音识别系统与交易系统,所述语音识别系统包括:依次连接的语音监听模块、语音编码模块、关键词识别模块、匹配检索模块及交易系统,语音监听模块还分别与关键词识别模块、匹配检索模块连接;所述交易系统包括:展示装置、称重装置、结算装置,交易系统获取到匹配项后,通过展示装置展示匹配项内容,展示当前菜品,并激活称重装置,直接称重,结算装置获取付款信息并反馈付款凭证,现有系统中,为了精准,需要点选上菜品,等待客户支付完成后,再次点确定,才算完成交易,本方法的交易系统无需点选菜品操作,也无需点击确定,客户的支付系统与电子秤系统连接,在二维码付款后,直接默认交易完成。

进一步地,所述的智能电子秤还包括交互式菜品选取系统,用于选取菜品和/或菜品分类,并输出至交易系统,所述语音识别系统,用于获取菜品和/或菜品分类,交易系统获取并展示菜品分类后,通过语音识别系统或交互式菜品选取系统,获取具体菜品,农贸市场中的嘈杂声可能是间歇性的,客户的购物习惯、商户的操作习惯也各不相同,有些客户可能希望通过电子屏幕先通过菜品类别,看下有哪些菜,有些商户可能更习惯于接触式手动点选,当期间任何环节出现干扰时,商户或客户都可选的通过手动点选或语音识别选定菜品。

一种插件式语音识别交易平台,包括智能电子秤和服务器,所述智能电子秤将访问数据上传服务器,访问数据包括结算数据和称重数据,结算数据用于反映菜品和/或菜品类别销量,访问数据用于反映菜品和/或菜品类别的热度。

本发明的优势和有益效果在于:

本发明通过设置语音识别的起始标记,避免了对关键语音的实时监听或关键词的实时识别所带来的能耗,同时也避免了农贸市场中隔壁摊位或客户的语音信号的影响,导致的误识别;语音编码,将关键语音转换成文本数据的同时,通过编码对数据起到加密的效果;关键词识别,根据文本数据,设定孤立词词长,对文本数据进行关键词识别,从而也起到了过滤不相关长句或短语(长于关键词阈值)的效果。

附图说明

图1是本发明的方法流程图。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。

传统的智能电子秤系统,通常是根据客户的要求手动输入或翻页选择菜品,点击选中菜品,进行称重并输出价格,客户根据称重后的价格付款。

本申请的智能电子称系统,通过插件式智能语音助手,为手动输入或翻页、点击选中的菜品两个步骤提供了可选的并行方案,卖家只需根据客户需求,通过语音选择菜品,然后称重,客户付款即可。

如图1所示,基于插件式语音识别系统的智能电子秤,其语音识别方法包括如下步骤:

步骤一、语音监听,获取卖家输入的菜品语音信号。为了节约能耗,同时也为了避免农贸市场中隔壁摊位或客户的语音信号导致系统的误识别,采用语音标识符的方式,在语音搜索关键词之前,添加语音标识符,语音监听模块当监听到语音标识符时,才对其后的关键词进行识别及后续步骤,例如:小农,土豆,小农即为语音标识符,土豆为关键语音。

步骤二、语音降噪,由于农贸市场环境嘈杂,需要对接收到的语音信号进行降噪处理。

步骤三、语音编码,将音频数据转换成文本数据,同时,通过编码对数据起到加密的作用。

步骤四、关键词识别,根据文本数据,通过改编自隐马尔科夫模型(HMM)作为声学模型,识别其中的关键词,同时,由于菜品名都是较短的单词,因此采用孤立词识别,从而也起到了过滤不相关长句或短语的效果,例如,输入语音关键词时,正好客户正在说带有菜品名的短句或发出感叹词,由于距离近、声音清晰,导致语音降噪模块未能将其去除,此时,通过孤立的关键词,能通过文本数据的长短,去除短句或感叹词,从而识别出菜品名关键词。当没有识别出关键词时,返回步骤一,继续进行语音监听。

另一方面,在语音监听时,以时间为单位,获取关键语音,例如:小农,后面1-2秒的时间用于输入菜品的关键语音,依次过滤其他长句,提高降噪、语音识别的效率。

当第一次识别未果,返回语音监听模块继续监听时,不再要求先识别到语音标识符,再进行关键词识别,这是为了第一次未能识别出,而给予的第二次输入,以提高便捷性,商户无需再次喊出语音标识符(小农),直接喊出土豆即可。此外,在环境特别嘈杂等情况下,通常输入一次语音,无法识别的几率较大,对此,商户无需等待识别系统反馈是否识别到语音(通过等待屏幕中是否自动跳出需要的菜品),直接连续输入两次以上的关键词即可,例如:小农,土豆、土豆,由于语音识别模块监听到语音标识符后,为识别关键词设定了预设时间(1-2秒),能够将两次土豆分开识别。例如:关键词输入时间设置为1秒,商家喊出:小农,土刀、土豆,第一个土刀用时1秒,此时,后一个土豆便作为第二次输入的关键词,由于第一次输入的“土刀”未能识别出,此时连续输入的“土豆”便被识别出。

但对关键词识别时间设定的阈值存在一个问题,菜品名长短不一,且说话人的习惯不同,可能会超时,导致第一次、第二次输入的关键词都不全(如第一次识别为“土刀土”,第二次识别为“豆”),导致两次识别均为成功。此时,在关键词之间设置分隔标记,即语音信号结束后0.5秒还未监听到语音信号的,则结束监听,将后续的语音信号作为第二次识别的关键词,例如:小农,土刀、(0.5秒)土豆,从而起到语音分割,连续识别的效果。连续识别两次后,重新进入语音标识符监听状态。

步骤五、匹配检索,将关键词与预设库中的数据进行匹配检索,当无匹配项时,返回步骤一,当匹配成功时,输出匹配项,并返回步骤一进入语音标识符监听状态。

步骤六、设置接口,返回函数,给予特定的词/分类,用于与不同智能电子秤的交易系统对接。

步骤七、交易实现,根据关键词,在电子秤屏幕上展示对应菜品,同时直接将对应菜品称重,显示价格,客户通过二维码付款后,打印凭条。现有系统中,为了精准,需要点选上菜品,等待客户支付完成后,再次点确定,才算完成交易并上传交易记录,本申请的系统无需点选菜品操作,也无需点击确定,客户的支付系统与电子秤系统连接,在二维码付款后,直接默认交易完成,上传交易数据。

关键词也可以是菜品的分类,通过菜品分类,在电子秤屏幕上展示该类所有菜品,商家通过再次语音输入或者手动点选完成交易。农贸市场中的嘈杂声可能是间歇性的,客户的购物习惯、商户的操作习惯也各不相同,有些客户可能希望通过电子屏幕先通过菜品类别看下有哪些菜,有些商务可能更习惯于接触式手动点选,例如:客户要求先看下所学菜类的所有菜品,而此时正好非常嘈杂,商家可以通过手动点选展示菜品,客户看好准备下单时,环境不再嘈杂,商户或者客户自己输入语音,或手动点选,选定菜品。

步骤八、存储交易记录,电子秤设有存储单元,临时存储交易数据,实时或定时上传交易数据,只有完成交易的数据,才能上传农贸市场的服务器,从而使得交易数据更为精确,实现智慧化交易的精准,同时减少数据的读写次数;称重未实现交易的数据也可以上传,结合交易完成的数据,构成访问数据,用于展示菜品热度,可以在商家摊位顶部电子屏展示该商家热度菜品,或交易量排名,也可以在整个农贸市场的电子屏展示菜品、菜类、商家的交易量、热度排名及摊位号,用于客户选择、定位,节约客户购买时间,提高效率,督促商户合理定价,促进公平交易。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

7页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:语音唤醒方法、装置、存储介质及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!