一种语音交互测试方法、装置、设备及计算机存储介质

文档序号：89851 发布日期：2021-10-08 浏览：25次 >En<

阅读说明：本技术 一种语音交互测试方法、装置、设备及计算机存储介质 (Voice interaction testing method, device, equipment and computer storage medium ) 是由黎勤松于 2021-06-30 设计创作，主要内容包括：本申请适用于语音测试技术领域,提供了一种语音交互测试方法、装置、设备及计算机存储介质,上述方法包括：触发语音功能模块播放K个问题语音文件,K为大于或者等于1的整数；当检测到语音功能模块完成播放K个问题语音文件中的第一问题语音文件时,播放与第一问题语音文件对应的第一答复语音文件；根据语音功能模块对第一答复语音文件的响应,确定语音功能模块基于第一问题语音文件的语音交互测试结果。利用上述语音交互测试方法可以完成语音交互流程中语音交互功能的测试,打破了自动化测试方法仅能模拟人工对语音功能的用户界面进行互动功能测试的局限,加快了语音交互测试的速度,提高语音交互测试的效率。(The application is applicable to the technical field of voice testing, and provides a voice interaction testing method, a device, equipment and a computer storage medium, wherein the method comprises the following steps: triggering a voice function module to play K question voice files, wherein K is an integer greater than or equal to 1; when the fact that the voice function module finishes playing a first question voice file in the K question voice files is detected, playing a first reply voice file corresponding to the first question voice file; and determining a voice interaction test result of the voice function module based on the first question voice file according to the response of the voice function module to the first answer voice file. The voice interaction testing method can be used for testing the voice interaction function in the voice interaction process, the limitation that an automatic testing method can only simulate manual interaction function testing on the user interface of the voice function is broken through, the speed of the voice interaction testing is increased, and the efficiency of the voice interaction testing is improved.)

技术领域

本申请属于语音测试

技术领域

，尤其涉及一种语音交互测试方法、装置、设备及计算机存储介质。

背景技术

在大量涌现的应用程序(application，app)中，语音功能属于常见的通用功能模块，通常对语音功能的测试是通过人工进行手动测试，这样可以保证测试的完整性，但是采用人工手动测试这种方式会浪费大量的人力及时间。现有技术中为了节省人力，缩短手动测试的时间，一般采取自动化测试方法对语音功能进行测试，但是自动化测试方法仅能模拟人工对语音功能的用户界面(User Interface，UI)进行互动功能(如点击界面上某一按钮)的测试，局限性大。

发明内容

本申请实施例提供了一种语音交互测试方法、装置、设备及计算机可读存储介质，可以打破自动化测试方法测试的局限性，提高语音交互测试的效率。

第一方面，本申请实施例提供了一种语音交互测试方法，所述方法包括：触发语音功能模块播放K个问题语音文件，K为大于或者等于1的整数；当检测到所述语音功能模块完成播放所述K个问题语音文件中的第一问题语音文件时，播放与所述第一问题语音文件对应的第一答复语音文件；根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果。

采用本申请提供的一种语音交互测试方法，通过监控第一语音文件的播放进度，可以获取播放第一答复语音文件的时间，当检测到语音交互中第一语音文件播放完成后，则播放与所述第一语音文件对应的第一答复语音文件，然后基于所述第一答复语音文件的响应确定语音交互的测试结果。利用上述语音交互测试方法可以测试完成语音功能模块中的语音交互功能，打破了自动化测试方法仅能模拟人工对语音功能的用户界面进行互动功能测试的局限，加快了语音交互测试的速度，提高语音交互测试的效率。

可选地，所述触发语音功能模块播放K个问题语音文件，包括：

检测语音功能模块的运行日志信息，当检测到预设的关键字时，触发所述语音功能模块启动播放K个问题语音文件。

可选地，当所述第一问题语音文件为所述K个问题语音文件中的第i个问题语音文件时，i＝{1，2，……，K-1}，所述根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果，包括：

若检测到所述语音功能模块成功识别所述第一答复语音文件，且执行播放与所述第一答复语音文件对应的第二问题语音文件的响应操作，则确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为成功。

可选地，所述根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果，还包括：

若检测到所述语音功能模块成功识别所述第一答复语音文件，且执行未播放与所述第一答复语音文件对应的第二问题语音文件的响应操作，则确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

可选地，当所述第一问题语音文件为所述K个问题语音文件中的第K个问题语音文件时，所述根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果，包括：

若检测到所述语音功能模块成功识别所述第一答复语音文件，且执行预设的提示操作的响应操作，则确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为成功。

可选地，所述方法还包括：若检测到所述语音功能模块识别失败所述第一答复语音文件，则确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

可选地，所述语音功能模块识别失败所述第一答复语音文件时，重复播放所述第一问题语音文件；

若在重复播放N次所述第一问题语音文件后，所述语音功能模块成功识别所述第一答复语音文件，则确定所述语音功能模块识别成功所述第一答复语音文件；

若在重复播放M次所述第一问题语音文件后，所述语音功能模块第M次对所述第一答复语音文件识别失败，则确定所述语音功能模块识别失败所述第一答复语音文件，N为大于等于1且小于等于M的整数，M为允许重复播放的最大次数。

第二方面，本申请实施例提供了一种语音交互测试装置，该装置包括：

触发单元，用于触发语音功能模块播放K个问题语音文件，K为大于或者等于1的整数；

播放单元，用于当检测到所述语音功能模块完成播放所述K个问题语音文件中的第一问题语音文件时，播放与所述第一问题语音文件对应的第一答复语音文件；

确定单元，用于根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果。

第三方面，本申请实施例提供了一种语音交互测试设备，所述设备包括：处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于从所述存储器中调用并运行所述计算机程序，使得所述设备执行第一方面中任一方式所述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储了计算机程序，当所述计算机程序被处理器执行时，使得处理器执行第一方面中任一方式所述的方法。

第五方面，本申请实施例提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得该计算机执行第一方面中任一方式所述的方法。

可以理解的是，上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的一种语音交互测试方法的应用场景示意图；

图2是本申请一实施例提供的一种语音交互测试方法的流程示意图；

图3是本申请一实施例提供的一种语音交互测试方法的交互流程图；

图4是本申请一实施例提供的一种语音交互测试方法的示意图；

图5是本申请一实施例提供的一种语音交互测试装置的示意图；

图6是本申请一实施例提供的一种语音交互测试设备的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在本发明实施例中，通过监控第一问题语音文件的播放进度，可以获取播放第一答复语音文件的时间，当监控到语音交互中第一语音文件播放完成后，则播放与所述第一语音文件对应的第一答复语音文件，然后基于所述第一答复语音文件的响应确定语音交互的测试结果。利用上述语音交互测试方法可以测试完成语音功能模块中的语音交互功能，打破了自动化测试方法仅能模拟人工对语音功能的用户界面进行互动功能测试的局限，加快了语音交互测试的速度，提高语音交互测试的效率。

本申请实施例提供的一种语音交互测试方法可以应用于任何关于语音交互场景的测试中，用于提高语音交互的测试效率。示例性的，本申请提供的语音交互测试方法可以应用于与用户身份认证相关的场景中。

本实施例中，语音交互测试方法应用在视频面签功能中。视频面签是业务人员(即远程面签岗工作人员)利用双向视频的方式与客户通过远程沟通完成在线面签业务的操作，其中，在线面签业务包括：审核客户身份信息、业务事项核对、资料签署及场景见证等。在视频面签功能中嵌入语音交互流程，通过对语音交互流程中语音功能模块的测试能够保证视频面签功能的质量，同时视频面签作为一个通用的功能模块，常见于与金融平台相关的应用程序 (application，app)中，提前对视频面签功能进行测试还可以避免该视频面签功能在正式融入到与金融平台相关的app后发现各种漏洞，提高测试效率。

如图1所示，上述视频面签功能配置有语音交互界面，目前常见的应用中，面签用户可以通过如图1所示的语音交互界面的相关提示进入语音交互流程。其中，语音交互流程是指通过语音交互的方式对当前面签用户的相关信息进行确认的流程。示例性的，在如图1所示的语音交互界面，面签用户通过点击对应的“操作菜单”的按钮进入语音交互流程，在该语音交互流程中，会播放预先设置的第一问题语音文件，并采集用户输入的语音，基于用户输入的语音确定下一步的流程操作，直至完成整个语音交互流程或退出该语音交互流程。在实际应用中，还可以录制用户在该语音交互流程针对各个问题所反馈的语音，以便后续在需要时取证。

以上场景仅仅是本申请的一实施例，对于本领域普通技术人员来讲，其依然可以对前述各场景所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使本申请提供的技术方案的本质脱离本申请各应用场景的精神和范围，均应包含在本申请的保护范围之内。

如图2所示为本发明一实施例提供的语音交互测试方法的流程示意图，如图3所示为本申请实施例提供的语音交互测试方法的交互流程示意图。详细描述如下：

S201，触发语音功能模块播放K个问题语音文件，K为大于或者等于1的整数。

根据实际应用过程，可选地，在步骤S201之前还包括：获取测试指令；响应测试指令触发相应对象启动语音功能模块。其中，测试指令用于调用所要测试的对象(例如，测试app)，上述所要测试的对象中配置有语音功能模块(例如，上述测试app中配置有相应的语音功能)。

不难理解的，本实施例中应用于视频面签中，上述测试指令是指视频面签测试指令，该视频面签测试指令用于调用所要测试的对象，上述所要测试的对象中配置有视频面签功能，视频面签功能中包括语音功能。

其中，所要测试的对象可以是预先开发的一些测试脚本并嵌入所要测试的视频面签功能(例如，在多款金融app中嵌入视频面签功能)，在一些可能的实现方式中，预先开发的一些测试脚本是以开源语言(例如Python、JAVA语言)为基础构建的。

应该理解的，本实施例中上述所要测试的对象能够被自动化测试工具执行，以使自动化测试工具执行对应的脚本启动所要测试的对象中配置的视频面签测试。

另外，所要测试的对象可以嵌入一些与视频面签功能相关的功能模块和通用工具库，例如，光学字符识别(Optical Character Recognition，OCR)功能模块，语音识别功能模块及语音播报功能模块等。其中，OCR功能模块用于对文字或者通过语音转换成的文字的识别；语音识别功能模块用于对播放语音的识别；语音播报功能模块用于播放视频面签功能中的问题及答复语音，也用于由文字转换成语音的播放；通用工具库包括但不限于用于在所测试的对象中实现上述 OCR功能、语音识别功能和语音播报功能所需要的工具库。应该理解，上述所要测试的对象中还可以嵌入其他功能模块(例如人脸识别功能模块)等，可以根据实际应用需求打开或者关闭其中一项或者多项需要测试的功能模块。

值得说明的是，视频面签功能模块中除了语音交互流程外还可以有其他业务流程(例如用户身份验证流程等)，由于本申请提供的语音交互测试方法应用于视频面签的语音功能模块中，因此，本申请提供的实施例仅考虑视频面签功能中的语音功能模块。

不难理解的，自动化测试工具执行对应的脚本启动视频面签测试后，可触发相应对象调用该对象中嵌入的视频面签功能。在实际测试过程中，自动化测试工具执行相应的启动指令以触发所要测试的对象(例如，嵌入视频面签功能的待测试的app)启动视频面签功能。其中的启动指令可以是从上述所要测试的对象运行时产生的日志信息中检索预先设置的关键字，也可以是所要测试的对象中设置的启动功能按钮等，上述启动指令根据不同的语音交互测试应用场景或者应用功能设置不同的启动指令，本申请对此不作任何限定。

通过获取测试指令，响应测试指令触发相应对象启动语音测试功能之后，执行步骤S201，触发语音功能模块播放K个问题语音文件，K为大于或者等于 1的整数，其中，上述语音功能模块包括K个问题语音文件。

本实施例中，自动化测试工具执行对应的测试脚本启动视频面签测试功能后，可触发当前对象调用该对象中嵌入的视频面签功能，并进入视频面签功能配置的语音功能模块，显示语音功能模块对应的语音交互界面。

可选地，所述触发语音功能模块播放K个问题语音文件，包括：

检测语音功能模块的运行日志信息，当检测到预设的关键字时，触发语音功能模块启动播放问题语音文件。

在本实施例中，自动化测试工具执行测试脚本可以实时监控当前对象的运行日志信息，在当前对象的运行日志信息中检索是否存在预设的关键字，当检索到预设的关键字后，语音功能模块播放上述K个问题语音文件中的第一问题语音文件。

例如，假设预设的语音功能模块开始播放K个问题语音文件中的第一问题语音文件的关键字为“开始播放”，当自动化测试工具执行测试脚本在当前对象的运行日志中检索到“开始播放”的字样时，触发语音功能模块启动播放所述视频面签功能对应的语音交互中设置的问题语音文件。

由于不同业务面签所需确定的面签用户信息不同，因此，针对不同对象的视频面签功能所设置的第一问题语音文件也可能有所不同。在实际应用中，可针对具体对象的视频面签功能预先设置相应语音格式的第一问题语音文件。

自动化测试工具执行测试脚本以实时监控所述语音交互流程的运行日志信息，以监控第一问题语音文件的播放进度。其中，第一问题语音文件为当前对象中嵌入的视频面签功能对应的语音交互流程正在播放的问题。第一问题语音文件的播放进度可以根据实际需求对不同的播放进度设置不同的标识。

例如，可以在第一问题语音文件播放完成后跳转至对应的指定页面，测试脚本通过检测是否跳转至对应的指定页面判断第一问题语音文件是否播放结束；又如，还可以在第一问题语音文件播放完成后在当前语音交互页面弹出悬浮按钮，测试脚本通过在当前语音交互页面检测是否存在悬浮按钮判断第一问题语音文件是否播放结束。故本申请对第一问题语音文件播放结束的标识不作任何限制。

S202，当检测到所述语音功能模块完成播放所述K个问题语音文件中的第一问题语音文件时，播放与所述第一问题语音文件对应的第一答复语音文件。

本实施例中，针对每一个第一问题语音文件，预先设置对应的一个或多个第一答复语音文件。第一答复语音文件为与第一问题语音文件对应的第一答复语音文件。在实际应用中，当同一个第一问题语音文件存在多个第一答复语音文件时，可以从中选取任一未被测试的第一答复语音文件(即未在该语音交互流程中被播放过)作为第一答复语音文件。

可选地，上述第一答复语音文件可由人工直接录制语音或者通过文字转化而成，本申请对此不作任何限定。

本实施例中，当自动化测试工具执行测试脚本实时监控所述语音交互流程的运行日志，监控到第一问题语音文件的播放结束时，播放与第一问题语音文件对应的第一答复语音文件。

同样的，监控第一问题语音文件是否播放结束，除了可以通过自动化测试工具执行测试脚本实时监控所述语音交互流程是否有输出播放结束对应的运行日志信息，还可以通过检测当前语音交互界面是否存在预设的悬浮按钮进行判断，当然，第一问题语音文件是否播放结束还可以通过配置结束关键字等方式进行判断，具体实际应用过程中，可以根据不同的需求进行配置，本申请对此不作任何限定。

S203，根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果。

本实施例中，针对不同的第一答复语音文件，可以预先设置与所述第一问题语音文件对应的预设响应结果，故可基于语音交互流程对第一问题语音文件对应的第一答复语音文件的响应和预设响应结果的比较，确定基于当前第一答复语音样本的测试结果。可选地，当所述第一问题语音文件为所述K个问题语音文件中的第i个问题语音文件时，i＝{1，2，……，K-1}，所述根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果，包括：

可选地，若检测到所述语音功能模块成功识别所述第一答复语音文件，且执行未播放与所述第一答复语音文件对应的第二问题语音文件的响应操作，则确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

其中，上述检测到语音功能模块识别成功第一答复语音文件，且执行未播放与第一答复语音文件对应的第二问题语音文件的响应操作包括一下两种情况：第一种情况是检测到语音功能模块识别成功第一答复语音文件后，没有播放与第一答复语音文件对应的第二问题语音文件；第二种情况是检测到语音功能模块识别成功第一答复语音文件后，播放的下一问题语音文件不是与第一答复语音文件对应的第二问题语音文件。

值得说明的是，由于不同的语音功能模块有不同的应用场景，可以针对语音功能模块的特定的应用场景预先设置与第一问题语音文件对应的第二问题语音文件。示例性的，在本实施例中，针对视频面签设置的语音功能模块，可以依次设置3个连续的问题，且上述3个连续的问题是一个整体，以完成语音功能模块的测试，当第一问题语音文件指上述3个连续的问题中的第1个问题，识别完成第一答复语音文件后，与第一问题语音文件对应的第二问题语音文件是第2个问题；同理，当第一问题语音文件指上述3个连续的问题中的第2个问题，识别完成第一答复语音文件后，与第一问题语音文件对应的第二问题语音文件就是第3个问题。

假设语音功能模块包括8个问题语音文件如图4所示，当第一问题语音文件为所述8个问题语音文件中的第3个问题语音文件时，例如，上述第一问题语音文件为：“请问您的银行卡是XXX银行的吗？”，针对当前问题可以有两种不同的答复语音样本，其中第一种第一答复语音文件为：“是”，第二种第一答复语音文件为：“否”，且预先设置的该第一问题语音文件对应的预设响应结果为：“是”。若检测到所述语音功能模块成功识别所述第一答复语音文件(即第一问题语音文件对应的第一答复语音文件的响应和预设响应结果均为“是”)，且播放与第3个问题语音文件对应的第4个问题语音文件，则确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为成功。若检测到所述语音功能模块成功识别所述第一答复语音文件(即第一问题语音文件对应的第一答复语音文件的响应和预设响应结果均为“是”)，且未播放与第3个问题语音文件对应的第4个问题语音文件(或者播放的不是与第3个问题语音文件对应的第4个问题语音文件)，则确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

其中，执行预设的提示操作可以根据实际应用需求输出测试成功提示信息，以使开发人员获知本次对该语音交互流程进行测试的结果。当然，提示操作也可以不设置，例如检测到所述语音功能模块识别成功所述第一答复语音文件但没有提示的情况下，开发人员可以认为本次对语音交互流程进行测试的结果是成功，即没有错误提示的情况下默认测试成功，本申请对此不作任何限定。

不难理解的，假设如图4所示语音功能模块包括8个问题语音文件，当所述第一问题语音文件为所述8个问题语音文件中的第8个问题语音文件，也就是第一问题语音文件是语音功能模块的最后一个问题语音文件时，若检测到所述语音功能模块识别成功第8个问题语音文件，且执行预设的提示操作，则确定所述语音功能模块基于第8个问题语音文件的语音交互测试结果为成功。

值得说明的是，检测到所述语音功能模块识别失败所述第一答复语音文件的情况包括但不限定于语音功能模块没有识别到第一问题语音文件对应的第一答复语音文件的响应；或者语音功能模块识别的与第一问题语音文件对应的第一答复语音文件与预设的响应结果不一致。

其中，当语音功能模块没有识别到第一问题语音文件对应的第一答复语音文件的响应，则确定语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。示例性的，可能由于测试环境及测试过程中网络不稳定等因素，在预设时间内未对语音交互流程中上述第一问题语音文件作出对应的第一答复语音文件的响应，则可确定确定语音功能模块识别失败第一答复语音文件，进而确定语音交互测试结果为失败。例如，由于测试环境嘈杂，在预设时间10s 内未对所述语音交互流程中第一问题语音文件作出对应的第一答复语音文件的响应；又如，由于网络延时在预设时间10s内未获取对所述语音交互流程中第一问题语音文件作出对应的第一答复语音文件的响应，则可确定语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

或者，语音功能模块识别的与第一问题语音文件对应的第一答复语音文件与预设的响应结果不一致，则确定语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。示例性的，假设如图4所示的语音功能模块包括8 个问题语音文件，当第一问题语音文件为所述8个问题语音文件中的第3个问题语音文件时，例如，上述第一问题语音文件为：“请问您的银行卡是XXX 银行的吗？”，针对当前问题可以有两种不同的答复语音样本，其中第一种第一答复语音文件为：“是”，第二种第一答复语音文件为：“否”，且预先设置的该第一问题语音文件对应的响应结果为：“是”。若语音功能模块识别的与第一问题语音文件对应的第一答复语音文件与预设的响应结果不一致(即第一问题语音文件对应的第一答复语音文件的响应为“否”，而预设响应结果均为“是”)，则确定语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

可选地，所述语音功能模块识别失败所述第一答复语音文件时，重复播放所述第一问题语音文件，若在重复播放N次所述第一问题语音文件后，所述语音功能模块识别成功所述第一答复语音文件，则确定所述语音功能模块识别成功所述第一答复语音文件，N为大于等于1且小于等于M的整数，M为允许重复播放的最大次数。

不难理解的，当允许重复播放的最大次数M的取值为3时，若在重复播放 2次所述第一问题语音文件后，所述语音功能模块成功识别所述第一答复语音文件，则确定所述语音功能模块识别成功所述第一答复语音文件。也就是说在小于允许播放的最大次数范围内，语音功能模块成功识别第一答复语音文件，则可以确定语音功能模块识别成功所述第一答复语音文件；反之，在允许播放的最大次数，语音功能模块对第一答复语音文件识别失败，则可以确定语音功能模块识别失败所述第一答复语音文件。

示例性的，若在重复播放3次所述第一问题语音文件后，所述语音功能模块第3次对所述第一答复语音文件仍然识别失败，则确定所述语音功能模块识别失败所述第一答复语音文件。

通过重复执行多次上述测试过程，有利于提高测试的容错性。需要说明的是，为了提高语音交互测试的容错性，重复播放次数可根据实际情况进行设置，当然，还可以采取其他能够提高测试容错性的方法，本申请对此不作任何限定。

示例性的，语音功能模块识别失败所述第一答复语音文件时，则重复播放第一问题语音文件3次，若第一答复语音文件与预设响应结果仍然不一致，则确定基于第一答复语音文件的语音交互测试结果为失败。其中，上述重复播放第一问题语音文件3次是指第1次第一答复语音文件与预设响应结果不一致，则重复播放一次上述第一问题语音文件，然后重复执行步骤S202，当检测到所述第一问题语音文件播放完毕时，则播放与所述第一问题语音文件对应的第一答复语音文件，若第一答复语音文件与预设响应结果还是不一致，那么再次重新播放一次上述第一问题语音文件，然后重复执行步骤S202，当检测到所述第一问题语音文件播放完毕时，则播放与所述第一问题语音文件对应的第一答复语音文件，若此时第一答复语音文件与预设响应结果还是不一致，那么确定本次基于第一答复语音文件的语音交互的测试结果为失败。

应该理解的，当由于测试环境及测试过程中网络不稳定等因素导致语音功能模块基于第一问题语音文件的语音交互测试结果为失败时，上述重复播放N 次所述第一问题语音文件还可以是指连续播放第一问题语音文件N次。例如，由于测试环境及测试过程中网络不稳定等因素导致语音功能模块基于第一问题语音文件的语音交互测试结果为失败时，在连续预设时间(例如10s)重复播放3次所述第一问题语音文件，即在每10s播放1次所述第一问题语音文件，直至播放3次第一问题语音文件。

可选地，当确定语音功能模块基于第一问题语音文件的语音交互测试结果为失败时，可以输出测试失败提示信息，并结束本次对语音交互流程的测试，通过该测试失败提示信息指示开发人员对该语音交互流程中存在问题的地方进行调整。

采用本申请提供的语音交互测试方法可以对配置有例如语音交互流程的视频面签等通用功能模块进行提前测试，避免合入其他相关的应用程序后才发现各种漏洞，便于后期对视频面签等通用功能模块进行优化升级测试工作；同时，该方法可以替代人工对语音交互流程进行测试，摆脱了人力束缚，打破了自动化测试方法仅能模拟人工对语音功能的用户界面进行互动功能测试的局限，加快了语音交互测试的速度，提高语音交互测试的效率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例所述的语音交互测试方法，如图5所示为本申请实施例提供的一种语音交互测试装置的结构示意图，为了便于说明，仅示出了与本申请实施例相关的部分。该装置300包括：触发单元301、播放单元302和确定单元303。

触发单元301，用于触发语音功能模块播放K个问题语音文件，K为大于或者等于1的整数；

播放单元302，用于当检测到所述语音功能模块完成播放所述K个问题语音文件中的第一问题语音文件时，播放与所述第一问题语音文件对应的第一答复语音文件；

确定单元303，用于根据所述语音功能模块对所述第一答复语音文件的响应，确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果。

可选地，所述触发语音功能模块播放K个问题语音文件，包括：

检测语音功能模块的运行日志信息，当检测到预设的关键字时，触发语音功能模块启动播放问题语音文件。

可选地，所述语音功能模块识别失败所述第一答复语音文件时，重复播放所述第一问题语音文件；

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

如图6所示为本申请实施例还提供了一种语音交互测试的设备，该设备400 包括：至少一个处理器401、存储器402以及存储在所述存储器402中并可在所述至少一个处理器上运行的计算机程序403，所述处理器401执行所述计算机程序403时实现上述任意各个方法实施例中的步骤。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在移动终端上运行时，使得移动终端执行时实现可实现上述各个方法实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括” 指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

18页详细技术资料下载

一种语音交互测试方法、装置、设备及计算机存储介质

相关技术

网友询问留言