智能语音通话方法、装置及系统

文档序号：9791 发布日期：2021-09-17 浏览：60次 >En<

阅读说明：本技术 智能语音通话方法、装置及系统 (Intelligent voice call method, device and system ) 是由周柳阳陈雄于 2021-08-03 设计创作，主要内容包括：本发明适用于计算机领域,提供了一种智能语音通话方法、装置及系统,通过对客户端上传的通话语音进行分析,得到客户端使用者的问题需求,并判断问题需求是否为预先储备问题；当问题需求不是预先储备问题,根据问题需求驱动执行设备获取回复信息；智能语音通话系统具备根据问题需求向周围环境收集数据或者向周围工作人员求助的能力,将获取的回复信息进行整理,实时反馈给客户端。使得智能语音通话系统能够回答一些答案随环境随时变化的问题,提高智能语音通话系统与周围环境和周围工作人员的配合度,让智能语音通话系统更加智能化,工作范围得到进一步扩展。(The invention is suitable for the field of computers, and provides an intelligent voice call method, device and system, wherein the problem requirements of a user at a client are obtained by analyzing call voices uploaded by the client, and whether the problem requirements are pre-reserve problems or not is judged; when the problem requirement is not a pre-reserve problem, driving the execution equipment to acquire reply information according to the problem requirement; the intelligent voice call system has the capability of collecting data to the surrounding environment or seeking help to surrounding workers according to problem demands, arranges the acquired reply information and feeds the reply information back to the client in real time. The intelligent voice call system can answer some questions with answers changing along with the environment at any time, the degree of cooperation of the intelligent voice call system with the surrounding environment and surrounding workers is improved, the intelligent voice call system is more intelligent, and the working range is further expanded.)

智能语音通话方法、装置及系统

技术领域

本发明属于计算机领域，尤其涉及一种智能语音通话方法、装置及系统。

背景技术

随着人工智能的到来，以及技术的不断革新，一些与语音交互相关的机器人开始走进大众的视野，智能语音机器人与各种产业的结合越来越广泛，它的出现将改变现有电话业务的工作性质。

智能语音是一种认知和识别的过程，智能语音系统首先处理原始语音信号，然后进行特征提取，以消除不同语言人之间的噪音和语音差异所带来的影响，使处理后的信号能更全面地响应语音特征提取的本质。

但是现有的智能语音系统功能单一，只能回复预先设定的内容，当客户问到预先设定的内容之外的问题时，智能语音通话系统就不能回复或者回复的内容是错误的，智能语音通话系统回答不了答案随环境随时变化的问题，与周围环境和周围工作人员的配合度不够，导致工作范围受到局限。

发明内容

本发明实施例提供一种智能语音通话方法、装置及系统，旨在解决现有的智能语音通话系统回答不了答案随环境随时变化的问题，与周围环境和周围工作人员的配合度不够，导致工作范围受到局限的问题。

本发明实施例是这样实现的，一方面，一种智能语音通话方法包括：

获取执行设备的驱动线路编码以及执行设备编码；

为每个执行设备编码对应添加触发词，并将触发词、执行设备编码以及对应的驱动线路编码成组保存在触发索引列表中；所述触发词用于定位和触发执行设备启动工作，所述触发词包括执行设备能够对应完成的工作内容和对应回答的业务主体范围；

获取客户端上传的通话语音；

对通话语音进行分析，得到客户端使用者的问题需求；

判断问题需求是否为预先储备问题；

当问题需求不是预先储备问题，根据问题需求驱动执行设备获取回复信息；

将获取的回复信息实时反馈给客户端。

作为本发明的一种改进方案：所述对通话语音进行分析，得到客户端使用者的问题需求具体包括：

识别通话语音的所有内容，并将语音内容转化为文字内容；

识别文字内容中的业务主体和问题描述词；

将业务主体和问题描述词作为客户端使用者的问题需求，进行对应回复。

作为本发明的又一种改进方案：所述判断问题需求是否为预先储备问题具体包括：

根据识别的业务主体和问题描述词，在预先储备的问题库中进行检索；

当检索到包含业务主体和所有问题描述词的预先储备问题时，将检索到的预先储备问题对应的预先储备答案调出，并将预先储备答案发送给客户端；

当检索到包含业务主体和部分问题描述词的预先储备问题时，将通话语音转化的文字内容和检索到的预先储备问题以及对应的预先储备答案发送给人工判断端进行二次判断。

作为本发明的另一种改进方案：所述二次判断具体包括：

获取人工判断端反馈的判断结果；

当判断结果为预先储备答案可以回答文字内容中的问题需求时，说明问题需求是预先储备问题，将预先储备答案发送给客户端；

当判断结果为预先储备答案不能回答文字内容中的问题需求，说明问题需求不是预先储备问题，不将预先储备答案发送给客户端。

作为本发明的再进一步方案：所述当问题需求不是预先储备问题，根据问题需求驱动执行设备获取回复信息具体包括：

根据业务主体和问题描述词对触发索引列表中的触发词进行检索；

当业务主体和问题描述词均与触发索引列表中的其中一条触发词匹配，通过触发词识别驱动线路编码；

根据识别出的驱动线路编码，从对应驱动线路发送启动信号，启动执行设备；

获取执行设备反馈的回复信息；

将获取的回复信息以固定的格式反馈给客户端。

作为本发明的优化方案：所述智能语音通话方法还包括：

当语音自动回复与客户端上传的通话语音同步进行时，立刻停止语音自动回复内容；

当客户端上传的通话语音停止指定时间之后，将语音自动回复停止之前获取的通话语音和语音自动回复停止之后再次获取的通话语音合并，构成完整的通话语音；

继续对通话语音进行分析。

作为本发明的又一种方案：所述智能语音通话方法还包括：

当客户端上传的通话语音出现杂音或者语音内容不连贯时，说明获取的通话语音为不良通话语音，向客户端反馈通讯状况不佳的提示语音；

获取客户端接收到提示语音后再次重复上传的通话语音；

用再次获取的通话语音覆盖前次获取的不良通话语音；

继续对再次获取的通话语音进行分析。

另一方面，一种智能语音通话装置包括：

编码获取模块，用于获取执行设备的驱动线路编码以及执行设备编码；

触发词添加模块，用于为每个执行设备编码对应添加触发词，并将触发词、执行设备编码以及对应的驱动线路编码成组保存在触发索引列表中；

语音获取模块，用于获取客户端上传的通话语音；

语音分析模块，用于对通话语音进行分析，得到客户端使用者的问题需求；

问题判断模块，用于判断问题需求是否为预先储备问题；

回复信息获取模块，用于当问题需求不是预先储备问题，根据问题需求驱动执行设备获取回复信息；

回复信息反馈模块，用于将获取的回复信息实时反馈给客户端。

另外，一种智能语音通话系统包括：

上述的智能语音通话装置，用于对获取的通话语音进行分析，经过判断处理后对通话语音中的问题需求自动回复；

人工判断端，用于对智能语音通话装置发送的通话语音转化的文字内容和检索到的预先储备问题以及对应的预先储备答案进行二次判断，判断预先储备答案能否回答文字内容中的问题需求，并将判断结果反馈给智能语音通话装置；

数据库，用于保存预先储备问题以及对应的预先储备答案和/或触发索引列表和/或整个智能语音通话过程中产生的语音音频备份和/或智能语音通话装置运行过程中产生的历史数据；

执行设备，当接收到智能语音通话装置发送的启动信号时，主动开始工作，并将获取到的回复信息反馈到智能语音通话装置。

本发明的有益效果：通过对客户端上传的通话语音进行分析，得到客户端使用者的问题需求，并判断问题需求是否为预先储备问题；当问题需求不是预先储备问题，根据问题需求驱动执行设备获取回复信息；智能语音通话系统具备根据问题需求向周围环境收集数据或者向周围工作人员求助的能力，将获取的回复信息进行整理，实时反馈给客户端。使得智能语音通话系统能够回答一些答案随环境随时变化的问题，提高智能语音通话系统与周围环境和周围工作人员的配合度，让智能语音通话系统更加智能化，工作范围得到进一步扩展。

附图说明

图1是一种智能语音通话系统结构示意图；

图2是一种智能语音通话方法主流程图；

图3是一种智能语音通话方法中主动获取回复信息的流程图；

图4是一种智能语音通话方法中主动回复语音中止流程图；

图5是一种智能语音通话方法中通话语音重复获取流程图；

图6是一种智能语音通话装置内部结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明通过对客户端上传的通话语音进行分析，得到客户端使用者的问题需求，并判断问题需求是否为预先储备问题；当问题需求不是预先储备问题，根据问题需求驱动执行设备获取回复信息；智能语音通话系统具备根据问题需求向周围环境收集数据或者向周围工作人员求助的能力，将获取的回复信息进行整理，实时反馈给客户端。使得智能语音通话系统能够回答一些答案随环境随时变化的问题，提高智能语音通话系统与周围环境和周围工作人员的配合度，让智能语音通话系统更加智能化，工作范围得到进一步扩展。

图1示出了本发明实施例的一种智能语音通话系统结构示意图，所述智能语音通话系统包括：

智能语音通话装置1，用于对获取的通话语音进行分析，经过判断处理后对通话语音中的问题需求自动回复。

人工判断端2，用于对智能语音通话装置发送的通话语音转化的文字内容和检索到的预先储备问题以及对应的预先储备答案进行二次判断，判断预先储备答案能否回答文字内容中的问题需求，并将判断结果反馈给智能语音通话装置。

数据库3，用于保存预先储备问题以及对应的预先储备答案和/或触发索引列表和/或整个智能语音通话过程中产生的语音音频备份和/或智能语音通话装置运行过程中产生的历史数据。

执行设备4，当接收到智能语音通话装置1发送的启动信号时，主动开始工作，并将获取到的回复信息反馈到智能语音通话装置1。所述执行设备可以是识别模块或/和请求模块或/和转移模块中的一种或者多组组合；所述识别模块用于识别周围环境变化情况和现有情况，可以是摄像机，红外扫描设备等；所述请求模块用于向人工服务请求帮助或者直接在网络大环境下上网搜索相关信息等；所诉转移模块用于将当前话语权转交给正在空闲状态的人员。

另外，智能语音通话装置1实时与客户端5进行语音通话，对客户端5使用者提出的问题需求进行回复，有些回复是固定答案，可以直接将预先储备答案调用发送给客户端5，还有一些回复信息需要智能语音通话装置1驱使执行设备4向外界获取所得。向外界获取的途径可以是执行设备4扫描周围环境或者搜索网络资源获得，还可以是将整理好的问题需求发送给工作人员，由人工来进行回复。

图2示出了本发明实施例的一种智能语音通话方法主流程图，所述智能语音通话方法包括：

步骤S10：获取执行设备4的驱动线路编码以及执行设备编码。

步骤S11：为每个执行设备编码对应添加触发词，并将触发词、执行设备编码以及对应的驱动线路编码成组保存在触发索引列表中。所述触发词用于定位和触发执行设备4启动工作，所述触发词包括执行设备4能够对应完成的工作内容和对应回答的业务主体范围。

步骤S12：获取客户端5上传的通话语音。

步骤S13：对通话语音进行分析，得到客户端5使用者的问题需求。

步骤S14：判断问题需求是否为预先储备问题。

步骤S15：当问题需求不是预先储备问题，根据问题需求驱动执行设备4获取回复信息。

步骤S16：将获取的回复信息实时反馈给客户端5。

步骤S17：当问题需求是预先储备问题，调出预先储备问题对应的预先储备答案，并将预先储备答案发送给客户端5。

在本实施例的一种情况中，所述对通话语音进行分析，得到客户端5使用者的问题需求具体包括：

步骤S130：识别通话语音的所有内容，并将语音内容转化为文字内容。

步骤S131：识别文字内容中的业务主体和问题描述词。例如，业务主体是银行挂号，问题描述词是人多吗等；又或者业务主体是当前联通营业厅业务，问题描述是在等待中待处理的业务有多少等。

步骤S132：将业务主体和问题描述词作为客户端5使用者的问题需求，进行对应回复。提取客户通话语音中描述的问题，这是对问题需求进行回答的先决条件。

在本实施例的一种情况中，所述判断问题需求是否为预先储备问题具体包括：

步骤S140：根据识别的业务主体和问题描述词，在预先储备的问题库中进行检索。

步骤S141：当检索到包含业务主体和所有问题描述词的预先储备问题时，将检索到的预先储备问题对应的预先储备答案调出，并将预先储备答案发送给客户端5。

步骤S142：当检索到包含业务主体和部分问题描述词的预先储备问题时，将通话语音转化的文字内容和检索到的预先储备问题以及对应的预先储备答案发送给人工判断端2进行二次判断。由于此时情况复杂，需要引入人工判断。

在上述实施例的一种情况中，所述二次判断具体包括：

步骤S20：获取人工判断端2反馈的判断结果。

步骤S21：当判断结果为预先储备答案可以回答文字内容中的问题需求时，说明问题需求是预先储备问题，将预先储备答案发送给客户端5。

步骤S22：当判断结果为预先储备答案不能回答文字内容中的问题需求，说明问题需求不是预先储备问题，不将预先储备答案发送给客户端5。此时需要执行步骤S13之后的步骤。

图3示出了本发明实施例的一种智能语音通话方法中主动获取回复信息的流程图，所述当问题需求不是预先储备问题，根据问题需求驱动执行设备4获取回复信息具体包括：

步骤S150：根据业务主体和问题描述词对触发索引列表中的触发词进行检索。

步骤S151：当业务主体和问题描述词均与触发索引列表中的其中一条触发词匹配，通过触发词识别驱动线路编码。

步骤S152：根据识别出的驱动线路编码，从对应驱动线路发送启动信号，启动执行设备4。

步骤S153：获取执行设备4反馈的回复信息。执行设备4可以探测周围环境或者对其他人工判断端2进行咨询等。例如，检测当前业务厅中有多少人，当前是否适合前来进行业务办理；根据统计，向客户端5推荐办理业务的时间段，将客户分散。

步骤S154：将获取的回复信息以固定的格式反馈给客户端5。

图4示出了本发明实施例的一种智能语音通话方法中主动回复语音中止流程图，所述智能语音通话方法还包括：

步骤S40：当语音自动回复与客户端5上传的通话语音同步进行时，立刻停止语音自动回复内容。

步骤S41：当客户端5上传的通话语音停止指定时间之后，将语音自动回复停止之前获取的通话语音和语音自动回复停止之后再次获取的通话语音合并，构成完整的通话语音。

步骤S42：继续对通话语音进行分析。当语音自动回复与客户端5语音通话同时进行时，自动回复立刻停止，对于客户的内容及上次准备回答的内容，统一回复给客户。

图5示出了本发明实施例的一种智能语音通话方法中通话语音重复获取流程图，所述智能语音通话方法还包括：

步骤S50：当客户端5上传的通话语音出现杂音或者语音内容不连贯时，说明获取的通话语音为不良通话语音，向客户端5反馈通讯状况不佳的提示语音。

步骤S51：获取客户端5接收到提示语音后再次重复上传的通话语音。

步骤S52：用再次获取的通话语音覆盖前次获取的不良通话语音。

步骤S53：继续对再次获取的通话语音进行分析。当客户端5出现杂音或者信号不好收音较差时，提醒客户通讯状况不佳，重复刚才的通话内容。

图6示出了本发明实施例的一种智能语音通话装置内部结构示意图，所述智能语音通话装置1包括：

编码获取模块100，用于获取执行设备的驱动线路编码以及执行设备编码。

触发词添加模块200，用于为每个执行设备编码对应添加触发词，并将触发词、执行设备编码以及对应的驱动线路编码成组保存在触发索引列表中。

语音获取模300，用于获取客户端5上传的通话语音。

语音分析模块400，用于对通话语音进行分析，得到客户端5使用者的问题需求。

问题判断模块500，用于判断问题需求是否为预先储备问题。

回复信息获取模块600，用于当问题需求不是预先储备问题，根据问题需求驱动执行设备4获取回复信息。

回复信息反馈模块700，用于将获取的回复信息实时反馈给客户端5。

为了能够加载上述方法和装置能够顺利运行，该装置除了包括上述各种模块之外，还可以包括比上述描述更多或更少的部件，或者组合某些部件，或者不同的部件，例如可以包括输入输出设备、网络接入设备、总线、处理器和存储器等。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，上述处理器是上述装置的控制中心，利用各种接口和线路连接整个系统的各个部分。

上述存储器可用于存储计算机以及系统程序和/或模块，上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现上述客户端5的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如信息采集模板展示功能、产品信息发布功能等）等；存储数据区可存储根据泊位状态显示系统的使用所创建的数据（比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等）等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（FlashCard）、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本应该理解的是，虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

16页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：语音转换方法、装置、终端及存储介质

智能语音通话方法、装置及系统

相关技术

网友询问留言