结合rpa和ai的语音控制方法及装置

文档序号：170846 发布日期：2021-10-29 浏览：32次 >En<

阅读说明：本技术 结合rpa和ai的语音控制方法及装置 (Voice control method and device combining RPA and AI ) 是由李瑞贞汪冠春胡一川褚瑞李玮于 2021-06-15 设计创作，主要内容包括：本申请实施例公开了一种结合RPA和AI的语音控制方法及装置,其中,结合RPA和AI的语音控制方法包括：获取控制语音；根据控制语音生成对应的控制指令；将控制指令发送至RPA机器人,以控制RPA机器人根据控制指令对待控制设备进行对应的操作。通过采用上述技术方案,可以方便快捷地实现对可视化数字大屏等待控制设备的演示控制。(The embodiment of the application discloses a voice control method and a device combining RPA and AI, wherein the voice control method combining RPA and AI comprises the following steps: acquiring a control voice; generating a corresponding control instruction according to the control voice; and sending the control instruction to the RPA robot to control the RPA robot to perform corresponding operation on the equipment to be controlled according to the control instruction. By adopting the technical scheme, the demonstration control of the visual digital large-screen waiting control equipment can be conveniently and rapidly realized.)

结合RPA和AI的语音控制方法及装置

技术领域

本申请涉及机器人流程自动化(Robotic Process Automation，RPA)、人工智能(Artificial Intelligence，AI)技术领域，尤其涉及一种结合RPA和AI的语音控制方法及装置。

背景技术

机器人流程自动化(Robotic Process Automation，RPA)是通过特定的“机器人软件”，模拟人在计算机上的操作，按规则自动执行流程任务。

人工智能(Artificial Intelligence，AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

RPA和AI技术具有自动化程度高、精确度高、成本低的优点。随着RPA机器人的广泛应用，越来越多的人力工作由RPA机器人进行接管，同时随着数字大屏融合的系统越来越多，在大屏上查找某些数据时，人工操作演示或者调取某些数据时速度很慢，因此如何方便快捷地实现对数字大屏的演示控制成为业界急需解决的技术问题。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种结合RPA和AI的语音控制方法，可以方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

本申请的第二个目的在于提出一种结合RPA和AI的语音控制方法。

本申请的第三个目的在于提出一种结合RPA和AI的语音控制装置。

本申请的第四个目的在于提出一种结合RPA和AI的语音控制装置。

本申请的第五个目的在于提出一种计算设备。

本申请的第六个目的在于提出一种计算机可读存储介质。

为达上述目的，本申请第一方面实施例提出了一种结合RPA和AI的语音控制方法，包括：获取控制语音；根据所述控制语音生成对应的控制指令；将所述控制指令发送至RPA机器人，以控制所述RPA机器人根据所述控制指令对待控制设备进行对应的操作。

本申请实施例提出的结合RPA和AI的语音控制方法，获取控制语音，根据控制语音生成对应的控制指令，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成,通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

根据本申请的一个实施例，所述待控制设备为可视化数字屏幕。

根据本申请的一个实施例，所述语音控制方法还包括：接收所述RPA机器人发送的操作结果；根据所述操作结果生成操作结果语音；输出所述操作结果语音。

根据本申请的一个实施例，所述根据所述控制语音生成对应的控制指令，包括：基于语音转文本ASR将所述控制语音转换为对应的控制文本；根据所述控制文本生成对应的所述控制指令。

根据本申请的一个实施例，所述根据所述操作结果生成操作结果语音，包括：基于文本转语音TTS将所述操作结果转换为对应的所述操作结果语音。

为达上述目的，本申请第二方面实施例提出了一种结合RPA和AI的语音控制方法，包括：接收语音调度机器人发送的控制指令，所述控制指令为所述语音调度机器人根据控制语音生成的；根据所述控制指令对待控制设备进行对应的操作。

本申请实施例提出的结合RPA和AI的语音控制方法，接收语音调度机器人发送的控制指令，控制指令为语音调度机器人根据控制语音生成的，根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

根据本申请的一个实施例，所述待控制设备为可视化数字屏幕。

根据本申请的一个实施例，所述语音控制方法还包括：将操作结果发送至所述语音调度机器人，以供所述语音调度机器人根据所述操作结果输出对应的操作结果语音。

为达上述目的，本申请第三方面实施例提出了一种结合RPA和AI的语音控制装置，包括：获取模块，用于获取控制语音；第一生成模块，用于根据所述控制语音生成对应的控制指令；第一发送模块，用于将所述控制指令发送至RPA机器人，以控制所述RPA机器人根据所述控制指令对待控制设备进行对应的操作。

本申请实施例提出的结合RPA和AI的语音控制装置，获取控制语音，根据控制语音生成对应的控制指令，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

根据本申请的一个实施例，所述待控制设备为可视化数字屏幕。

根据本申请的一个实施例，所述语音控制装置还包括：第一接收模块，用于接收所述RPA机器人发送的操作结果；第二生成模块，用于根据所述操作结果生成操作结果语音；输出模块，用于输出所述操作结果语音。

根据本申请的一个实施例，所述第一生成模块包括：第一转换单元，用于基于语音转文本ASR将所述控制语音转换为对应的控制文本；生成单元，用于根据所述控制文本生成对应的所述控制指令。

根据本申请的一个实施例，所述第二生成模块包括：第二转换单元，用于基于文本转语音TTS将所述操作结果转换为对应的所述操作结果语音。

为达上述目的，本申请第四方面实施例提出了一种结合RPA和AI的语音控制装置，包括：第二接收模块，用于接收语音调度机器人发送的控制指令，所述控制指令为所述语音调度机器人根据控制语音生成的；操作模块，用于根据所述控制指令对待控制设备进行对应的操作。

本申请实施例提出的结合RPA和AI的语音控制装置，接收语音调度机器人发送的控制指令，控制指令为语音调度机器人根据控制语音生成的，根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

根据本申请的一个实施例，所述待控制设备为可视化数字屏幕。

根据本申请的一个实施例，所述语音控制装置还包括：第二发送模块，用于将操作结果发送至所述语音调度机器人，以供所述语音调度机器人根据所述操作结果输出对应的操作结果语音。

为达上述目的，本申请第五方面实施例提出了一种计算设备，包括：存储有可执行程序代码的存储器；与所述存储器耦合的处理器；所述处理器调用所述存储器中存储的所述可执行程序代码，执行如本申请第一方面实施例所述的结合RPA和AI的语音控制方法，或者执行如本申请第二方面实施例所述的结合RPA和AI的语音控制方法。

为达上述目的，本申请第六方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请第一方面实施例所述的结合RPA和AI的语音控制方法，或者实现如本申请第二方面实施例所述的结合RPA和AI的语音控制方法。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中多需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些是实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种结合RPA和AI的语音控制方法的流程图；

图2是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图；

图3是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图；

图4是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图；

图5是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图；

图6是本申请实施例提供的一种结合RPA和AI的语音控制方法的原理图；

图7是本申请实施例提供的一种结合RPA和AI的语音控制方法的整体流程图；

图8是本申请实施例提供的一种结合RPA和AI的语音控制方法的整体流程图对应的信令交互图；

图9是本申请实施例提供的一种结合RPA和AI的语音控制装置的框图；

图10是本申请实施例提供的另一种结合RPA和AI的语音控制装置的框图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面结合附图来描述本申请实施例的结合RPA和AI的语音控制方法及装置。

图1是根据本申请一个实施例的结合RPA和AI的语音控制方法的流程图，如图1所示，该结合RPA和AI的语音控制方法包括以下步骤：

S101，获取控制语音。

本申请实施例的语音控制方法具体可应用于本申请实施例提供的语音控制装置中，该语音控制装置设置在语音调度机器人中。语音调度机器人能通过可视化界面，无代码地搭建、训练、评测、发布机器人，实现多轮对话和个性化问答，并可以根据会话日志持续优化机器人效果。搭建好的机器人可以被集成到H5(Hyper Text Markup Language 5，超文本5.0)页面、小程序、APP(application，手机应用软件)、IM(InstantMessaging，即时通讯)平台和IoT(Internet of things，物联网)设备中，提供7*24小时的稳定服务，并通过文本、语音等多模态的形式产生更友好的交互体验。

本申请实施例中，语音调度机器人获取控制语音，控制语音具体可包括但不限于用户(例如讲解员)通过麦克风说出的想查看的系统名字或一些关键字组成的语音流等。

S102，根据控制语音生成对应的控制指令。

本申请实施例中，语音调度机器人将步骤S101中获取的控制语音，基于自然语言处理(Natural Language Processing，NLP)生成对应的控制指令。

S103，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。

本申请实施例中，语音调度机器人将控制指令发送至对应的RPA机器人，RPA机器人接收到控制指令后，根据控制指令对待控制设备进行对应的操作，例如进行在大屏上点击按钮或查找数据等操作。其中，待控制设备具体可包括但不限于可视化数字屏幕，例如可视化数字大屏等。

本申请实施例提出的结合RPA和AI的语音控制方法，语音调度机器人获取控制语音，根据控制语音生成对应的控制指令，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

图2是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图。如图2所示，在图1所示实施例的基础上，本实施例提出的语音控制方法，具体包括以下步骤：

S201，获取控制语音。

S202，根据控制语音生成对应的控制指令。

S203，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。

本申请实施例中，步骤S201-S203与上述实施例中的步骤S101-S103相同，此处不再赘述。

S204，接收RPA机器人发送的操作结果。

本申请实施例中，语音调度机器人接收RPA机器人操作完成后回传的操作结果。

S205，根据操作结果生成操作结果语音。

本申请实施例中，语音调度机器人可以基于文本转语音(Text To Speech，TTS)将步骤S204中接收到的操作结果转换为对应的操作结果语音。

S206，输出操作结果语音。

本申请实施例中，语音调度机器人可以通过扬声器等声音输出设备输出步骤S205中生成的操作结果语音。

本申请实施例提出的结合RPA和AI的语音控制方法，语音调度机器人获取控制语音，根据控制语音生成对应的控制指令，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作，根据RPA机器人发送的操作结果，基于文本转语音TTS生成并输出操作结果语音。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷的实现对可视化数字大屏等待控制设备的演示控制，语音调度机器人中集成了文本转语音TTS功能，可以支持本地部署，不依赖互联网，适应不同的业务场景。

图3是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图。如图3所示，在上述图1所示实施例的基础上，步骤S102具体可包括：

S301，基于语音转文本ASR将控制语音转换为对应的控制文本。

本申请实施例中，语音调度机器人可以基于语音转文本(Automatic SpeechRecognition，ASR)将控制语音转换为对应的控制文本，例如ASR把讲解员说出的语音实时转换为文字。

S302，根据控制文本生成对应的控制指令。

本申请实施例中，ASR可以通过采用发布/订阅消息模式的即时通讯协议MQTT(Message Queuing Telemetry Transport，消息队列遥测传输)将控制文本传送给语音调度机器人，语音调度机器人接收到控制文本后，把控制文本转换成任务对话，基于自然语言处理NLP生成对应的控制指令。

本申请实施例提出的结合RPA和AI的语音控制方法，获取控制语音，基于语音转文本ASR将控制语音转换为对应的控制文本，根据控制文本生成对应的控制指令，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制，语音调度机器人中集成了文本转语音TTS功能，可以支持本地部署，不依赖互联网，适应不同的业务场景。

图4是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图，如图4所示，该结合RPA和AI的语音控制方法包括以下步骤：

S401，接收语音调度机器人发送的控制指令，控制指令为语音调度机器人根据控制语音生成的。

本申请实施例的语音控制方法具体可应用于本申请实施例提供的语音控制装置中，该语音控制设置在RPA机器人中。RPA机器人可通过用户使用界面，智能理解企业已有应用，将基于规则的常规操作自动化，自动重复读取邮件、读取Office组件、操作数据库及网页和客户端软件等，采集数据，进行繁琐的计算，大批量生成文件和报告，完成枯燥的文件检查等工作。

S402，根据控制指令对待控制设备进行对应的操作。

其中，待控制设备具体可包括但不限于可视化数字屏幕，例如可视化数字大屏等。

关于上述步骤S401～S402的具体说明，可参见上述实施例中的相关内容，此处不再赘述。

本申请实施例提出的结合RPA和AI的语音控制方法，RPA机器人接收语音调度机器人发送的控制指令，控制指令为语音调度机器人根据控制语音生成的，根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

图5是本申请实施例提供的另一种结合RPA和AI的语音控制方法的流程图，如图5所示，在图4所示实施例的基础上，本实施例提出的语音控制方法，具体包括以下步骤：

S501，接收语音调度机器人发送的控制指令，控制指令为语音调度机器人根据控制语音生成的。

S502，根据控制指令对待控制设备进行对应的操作。

S503，将操作结果发送至语音调度机器人，以供语音调度机器人根据操作结果输出对应的操作结果语音。

关于上述步骤S501-S503的具体说明，可参见上述实施例中的相关内容，此处不再赘述。

本申请实施例提出的结合RPA和AI的语音控制方法，RPA机器人接收语音调度机器人发送的控制指令，控制指令为语音调度机器人根据控制语音生成的，根据控制指令对待控制设备进行对应的操作，将操作结果发送至语音调度机器人，以供语音调度机器人根据操作结果输出对应的操作结果语音。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

为清楚说明本申请实施例的语音控制方法，下面结合图6-图7来进行详细描述。

图6是根据本申请实施例提供的一种语音控制方法的原理图。如图6所示，讲解员对着麦克风说出想查看的系统名字或一些关键字，语音转文本ASR将接收到的控制语音转换为对应的控制文本并传给语音调度机器人，语音调度机器人基于自然语言处理NLP生成对应的控制指令，并发送给对应的RPA机器人，RPA机器人执行控制指令后，将操作结果发送至语音调度机器人，语音调度机器人根据操作结果基于文本转语音TTS输出对应的操作结果语音，再由扬声器播放。

图7是根据本申请实施例提供的一种语音控制方法的整体流程图，如图7所示，包括以下步骤：

S701，获取控制语音。

S702，语音调度机器人基于语音转文本ASR将控制语音转换为对应的控制文本。

S703，语音调度机器人根据控制文本基于自然语言处理NLP生成对应的控制指令。

S704，语音调度机器人将控制指令发送至RPA机器人。

S705，RPA机器人根据控制指令对待控制设备进行对应的操作并生成操作结果。

S706，RPA机器人将操作结果发送至语音调度机器人。

S707，语音调度机器人基于文本转语音TTS将操作结果转换为对应的操作结果语音。

S708，语音调度机器人输出操作结果语音。

本申请实施例描述了一种语音控制方法的整体流程，对应的信令交互图如图8所示。

为了实现上述实施例，本申请实施例还提出了一种结合RPA和AI的语音控制装置。如图9所示，本申请实施例提出的语音控制装置900可包括：获取模块901、第一生成模块902和第一发送模块903，其中：

获取模块901，用于获取控制语音。

第一生成模块902，用于根据控制语音生成对应的控制指令。

第一发送模块903，用于将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。

进一步的，在本申请实施例一种可能的实现方式中，待控制设备为可视化数字屏幕。

进一步的，在本申请实施例一种可能的实现方式中，语音控制装置900还包括：第一接收模块，用于接收RPA机器人发送的操作结果；第二生成模块，用于根据操作结果生成操作结果语音；输出模块，用于输出操作结果语音。

进一步的，在本申请实施例一种可能的实现方式中，第一生成模块902包括：第一转换单元，用于基于语音转文本ASR将控制语音转换为对应的控制文本；生成单元，用于根据控制文本生成对应的控制指令。

进一步的，在本申请实施例一种可能的实现方式中，第二生成模块包括：第二转换单元，用于基于文本转语音TTS将操作结果转换为对应的操作结果语音。

需要说明的是，前述对结合RPA和AI的语音控制方法实施例的解释说明也适用于该实施例的结合RPA和AI的语音控制装置，此处不再赘述。

本申请实施例提出的结合RPA和AI的语音控制装置，语音调度机器人获取控制语音，根据控制语音生成对应的控制指令，将控制指令发送至RPA机器人，以控制RPA机器人根据控制指令对待控制设备进行对应的操作。本实施例中，通过将RPA机器人与语音调度机器人集成，通过语音即可控制可视化数字大屏等待控制设备，从而方便快捷地实现对可视化数字大屏等待控制设备的演示控制。

为了实现上述实施例，本申请实施例还提出了一种结合RPA和AI的语音控制装置。如图10所示，本申请实施例提出的语音控制装置1000可包括：第二接收模块1001和操作模块1002，其中：

第二接收模块1001，用于接收语音调度机器人发送的控制指令，控制指令为语音调度机器人根据控制语音生成的。

操作模块1002，用于根据控制指令对待控制设备进行对应的操作。

进一步的，在本申请实施例一种可能的实现方式中，待控制设备为可视化数字屏幕。

进一步的，在本申请实施例一种可能的实现方式中，语音控制装置1000还包括：第二发送模块，用于将操作结果发送至语音调度机器人，以供语音调度机器人根据操作结果输出对应的操作结果语音。

需要说明的是，前述对结合RPA和AI的语音控制方法实施例的解释说明也适用于该实施例的结合RPA和AI的语音控制装置，此处不再赘述。

在本申请的各种实施例中，应理解，上述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在本申请所提供的实施例中，应理解，“与A相应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

另外，在本申请各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器)执行本申请的各个实施例上述方法的部分或全部步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本申请实施例公开的一种结合RPA和AI的语音控制方法及装置进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

17页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：语音动作可发现性系统

结合rpa和ai的语音控制方法及装置

相关技术

网友询问留言