一种语音交互测试方法、装置、设备及计算机存储介质

文档序号:89851 发布日期:2021-10-08 浏览:25次 >En<

阅读说明:本技术 一种语音交互测试方法、装置、设备及计算机存储介质 (Voice interaction testing method, device, equipment and computer storage medium ) 是由 黎勤松 于 2021-06-30 设计创作,主要内容包括:本申请适用于语音测试技术领域,提供了一种语音交互测试方法、装置、设备及计算机存储介质,上述方法包括:触发语音功能模块播放K个问题语音文件,K为大于或者等于1的整数;当检测到语音功能模块完成播放K个问题语音文件中的第一问题语音文件时,播放与第一问题语音文件对应的第一答复语音文件;根据语音功能模块对第一答复语音文件的响应,确定语音功能模块基于第一问题语音文件的语音交互测试结果。利用上述语音交互测试方法可以完成语音交互流程中语音交互功能的测试,打破了自动化测试方法仅能模拟人工对语音功能的用户界面进行互动功能测试的局限,加快了语音交互测试的速度,提高语音交互测试的效率。(The application is applicable to the technical field of voice testing, and provides a voice interaction testing method, a device, equipment and a computer storage medium, wherein the method comprises the following steps: triggering a voice function module to play K question voice files, wherein K is an integer greater than or equal to 1; when the fact that the voice function module finishes playing a first question voice file in the K question voice files is detected, playing a first reply voice file corresponding to the first question voice file; and determining a voice interaction test result of the voice function module based on the first question voice file according to the response of the voice function module to the first answer voice file. The voice interaction testing method can be used for testing the voice interaction function in the voice interaction process, the limitation that an automatic testing method can only simulate manual interaction function testing on the user interface of the voice function is broken through, the speed of the voice interaction testing is increased, and the efficiency of the voice interaction testing is improved.)

一种语音交互测试方法、装置、设备及计算机存储介质

技术领域

本申请属于语音测试

技术领域

,尤其涉及一种语音交互测试方法、装置、 设备及计算机存储介质。

背景技术

在大量涌现的应用程序(application,app)中,语音功能属于常见的通用 功能模块,通常对语音功能的测试是通过人工进行手动测试,这样可以保证测 试的完整性,但是采用人工手动测试这种方式会浪费大量的人力及时间。现有 技术中为了节省人力,缩短手动测试的时间,一般采取自动化测试方法对语音 功能进行测试,但是自动化测试方法仅能模拟人工对语音功能的用户界面(User Interface,UI)进行互动功能(如点击界面上某一按钮)的测试,局限性大。

发明内容

本申请实施例提供了一种语音交互测试方法、装置、设备及计算机可读存 储介质,可以打破自动化测试方法测试的局限性,提高语音交互测试的效率。

第一方面,本申请实施例提供了一种语音交互测试方法,所述方法包括: 触发语音功能模块播放K个问题语音文件,K为大于或者等于1的整数;当检 测到所述语音功能模块完成播放所述K个问题语音文件中的第一问题语音文件 时,播放与所述第一问题语音文件对应的第一答复语音文件;根据所述语音功 能模块对所述第一答复语音文件的响应,确定所述语音功能模块基于所述第一 问题语音文件的语音交互测试结果。

采用本申请提供的一种语音交互测试方法,通过监控第一语音文件的播放 进度,可以获取播放第一答复语音文件的时间,当检测到语音交互中第一语音 文件播放完成后,则播放与所述第一语音文件对应的第一答复语音文件,然后 基于所述第一答复语音文件的响应确定语音交互的测试结果。利用上述语音交 互测试方法可以测试完成语音功能模块中的语音交互功能,打破了自动化测试 方法仅能模拟人工对语音功能的用户界面进行互动功能测试的局限,加快了语 音交互测试的速度,提高语音交互测试的效率。

可选地,所述触发语音功能模块播放K个问题语音文件,包括:

检测语音功能模块的运行日志信息,当检测到预设的关键字时,触发所述 语音功能模块启动播放K个问题语音文件。

可选地,当所述第一问题语音文件为所述K个问题语音文件中的第i个问 题语音文件时,i={1,2,……,K-1},所述根据所述语音功能模块对所述第一 答复语音文件的响应,确定所述语音功能模块基于所述第一问题语音文件的语 音交互测试结果,包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行播放 与所述第一答复语音文件对应的第二问题语音文件的响应操作,则确定所述语 音功能模块基于所述第一问题语音文件的语音交互测试结果为成功。

可选地,所述根据所述语音功能模块对所述第一答复语音文件的响应,确 定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果,还包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行未播 放与所述第一答复语音文件对应的第二问题语音文件的响应操作,则确定所述 语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

可选地,当所述第一问题语音文件为所述K个问题语音文件中的第K个问 题语音文件时,所述根据所述语音功能模块对所述第一答复语音文件的响应, 确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果,包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行预设 的提示操作的响应操作,则确定所述语音功能模块基于所述第一问题语音文件 的语音交互测试结果为成功。

可选地,所述方法还包括:若检测到所述语音功能模块识别失败所述第一 答复语音文件,则确定所述语音功能模块基于所述第一问题语音文件的语音交 互测试结果为失败。

可选地,所述语音功能模块识别失败所述第一答复语音文件时,重复播放 所述第一问题语音文件;

若在重复播放N次所述第一问题语音文件后,所述语音功能模块成功识别 所述第一答复语音文件,则确定所述语音功能模块识别成功所述第一答复语音 文件;

若在重复播放M次所述第一问题语音文件后,所述语音功能模块第M次 对所述第一答复语音文件识别失败,则确定所述语音功能模块识别失败所述 第一答复语音文件,N为大于等于1且小于等于M的整数,M为允许重复播 放的最大次数。

第二方面,本申请实施例提供了一种语音交互测试装置,该装置包括:

触发单元,用于触发语音功能模块播放K个问题语音文件,K为大于或者 等于1的整数;

播放单元,用于当检测到所述语音功能模块完成播放所述K个问题语音文 件中的第一问题语音文件时,播放与所述第一问题语音文件对应的第一答复语 音文件;

确定单元,用于根据所述语音功能模块对所述第一答复语音文件的响应, 确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果。

第三方面,本申请实施例提供了一种语音交互测试设备,所述设备包括: 处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于从所述存 储器中调用并运行所述计算机程序,使得所述设备执行第一方面中任一方式所 述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可 读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处 理器执行第一方面中任一方式所述的方法。

第五方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产 品包括:计算机程序代码,当所述计算机程序代码被计算机运行时,使得该计 算机执行第一方面中任一方式所述的方法。

可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方 面中的相关描述,在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技 术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅 仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳 动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的一种语音交互测试方法的应用场景示意图;

图2是本申请一实施例提供的一种语音交互测试方法的流程示意图;

图3是本申请一实施例提供的一种语音交互测试方法的交互流程图;

图4是本申请一实施例提供的一种语音交互测试方法的示意图;

图5是本申请一实施例提供的一种语音交互测试装置的示意图;

图6是本申请一实施例提供的一种语音交互测试设备的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅 用以解释本发明,并不用于限定本发明。

在本发明实施例中,通过监控第一问题语音文件的播放进度,可以获取播 放第一答复语音文件的时间,当监控到语音交互中第一语音文件播放完成后, 则播放与所述第一语音文件对应的第一答复语音文件,然后基于所述第一答复 语音文件的响应确定语音交互的测试结果。利用上述语音交互测试方法可以测 试完成语音功能模块中的语音交互功能,打破了自动化测试方法仅能模拟人工 对语音功能的用户界面进行互动功能测试的局限,加快了语音交互测试的速度, 提高语音交互测试的效率。

本申请实施例提供的一种语音交互测试方法可以应用于任何关于语音交互 场景的测试中,用于提高语音交互的测试效率。示例性的,本申请提供的语音 交互测试方法可以应用于与用户身份认证相关的场景中。

本实施例中,语音交互测试方法应用在视频面签功能中。视频面签是业务 人员(即远程面签岗工作人员)利用双向视频的方式与客户通过远程沟通完成 在线面签业务的操作,其中,在线面签业务包括:审核客户身份信息、业务事 项核对、资料签署及场景见证等。在视频面签功能中嵌入语音交互流程,通过 对语音交互流程中语音功能模块的测试能够保证视频面签功能的质量,同时视 频面签作为一个通用的功能模块,常见于与金融平台相关的应用程序 (application,app)中,提前对视频面签功能进行测试还可以避免该视频面签 功能在正式融入到与金融平台相关的app后发现各种漏洞,提高测试效率。

如图1所示,上述视频面签功能配置有语音交互界面,目前常见的应用中, 面签用户可以通过如图1所示的语音交互界面的相关提示进入语音交互流程。 其中,语音交互流程是指通过语音交互的方式对当前面签用户的相关信息进行 确认的流程。示例性的,在如图1所示的语音交互界面,面签用户通过点击对 应的“操作菜单”的按钮进入语音交互流程,在该语音交互流程中,会播放预 先设置的第一问题语音文件,并采集用户输入的语音,基于用户输入的语音确 定下一步的流程操作,直至完成整个语音交互流程或退出该语音交互流程。在 实际应用中,还可以录制用户在该语音交互流程针对各个问题所反馈的语音, 以便后续在需要时取证。

以上场景仅仅是本申请的一实施例,对于本领域普通技术人员来讲,其依 然可以对前述各场景所记载的技术方案进行修改,或者对其中部分技术特征进 行等同替换;而这些修改或者替换,并不使本申请提供的技术方案的本质脱离 本申请各应用场景的精神和范围,均应包含在本申请的保护范围之内。

如图2所示为本发明一实施例提供的语音交互测试方法的流程示意图,如 图3所示为本申请实施例提供的语音交互测试方法的交互流程示意图。详细描 述如下:

S201,触发语音功能模块播放K个问题语音文件,K为大于或者等于1的 整数。

根据实际应用过程,可选地,在步骤S201之前还包括:获取测试指令;响 应测试指令触发相应对象启动语音功能模块。其中,测试指令用于调用所要测 试的对象(例如,测试app),上述所要测试的对象中配置有语音功能模块(例 如,上述测试app中配置有相应的语音功能)。

不难理解的,本实施例中应用于视频面签中,上述测试指令是指视频面签 测试指令,该视频面签测试指令用于调用所要测试的对象,上述所要测试的对 象中配置有视频面签功能,视频面签功能中包括语音功能。

其中,所要测试的对象可以是预先开发的一些测试脚本并嵌入所要测试的 视频面签功能(例如,在多款金融app中嵌入视频面签功能),在一些可能的 实现方式中,预先开发的一些测试脚本是以开源语言(例如Python、JAVA语 言)为基础构建的。

应该理解的,本实施例中上述所要测试的对象能够被自动化测试工具执行, 以使自动化测试工具执行对应的脚本启动所要测试的对象中配置的视频面签测 试。

另外,所要测试的对象可以嵌入一些与视频面签功能相关的功能模块和通 用工具库,例如,光学字符识别(Optical Character Recognition,OCR)功能模块, 语音识别功能模块及语音播报功能模块等。其中,OCR功能模块用于对文字或 者通过语音转换成的文字的识别;语音识别功能模块用于对播放语音的识别; 语音播报功能模块用于播放视频面签功能中的问题及答复语音,也用于由文字 转换成语音的播放;通用工具库包括但不限于用于在所测试的对象中实现上述 OCR功能、语音识别功能和语音播报功能所需要的工具库。应该理解,上述所 要测试的对象中还可以嵌入其他功能模块(例如人脸识别功能模块)等,可以 根据实际应用需求打开或者关闭其中一项或者多项需要测试的功能模块。

值得说明的是,视频面签功能模块中除了语音交互流程外还可以有其他业 务流程(例如用户身份验证流程等),由于本申请提供的语音交互测试方法应 用于视频面签的语音功能模块中,因此,本申请提供的实施例仅考虑视频面签 功能中的语音功能模块。

不难理解的,自动化测试工具执行对应的脚本启动视频面签测试后,可触 发相应对象调用该对象中嵌入的视频面签功能。在实际测试过程中,自动化测 试工具执行相应的启动指令以触发所要测试的对象(例如,嵌入视频面签功能 的待测试的app)启动视频面签功能。其中的启动指令可以是从上述所要测试 的对象运行时产生的日志信息中检索预先设置的关键字,也可以是所要测试的 对象中设置的启动功能按钮等,上述启动指令根据不同的语音交互测试应用场 景或者应用功能设置不同的启动指令,本申请对此不作任何限定。

通过获取测试指令,响应测试指令触发相应对象启动语音测试功能之后, 执行步骤S201,触发语音功能模块播放K个问题语音文件,K为大于或者等于 1的整数,其中,上述语音功能模块包括K个问题语音文件。

本实施例中,自动化测试工具执行对应的测试脚本启动视频面签测试功能 后,可触发当前对象调用该对象中嵌入的视频面签功能,并进入视频面签功能 配置的语音功能模块,显示语音功能模块对应的语音交互界面。

可选地,所述触发语音功能模块播放K个问题语音文件,包括:

检测语音功能模块的运行日志信息,当检测到预设的关键字时,触发语音 功能模块启动播放问题语音文件。

在本实施例中,自动化测试工具执行测试脚本可以实时监控当前对象的运 行日志信息,在当前对象的运行日志信息中检索是否存在预设的关键字,当检 索到预设的关键字后,语音功能模块播放上述K个问题语音文件中的第一问题 语音文件。

例如,假设预设的语音功能模块开始播放K个问题语音文件中的第一问题 语音文件的关键字为“开始播放”,当自动化测试工具执行测试脚本在当前对 象的运行日志中检索到“开始播放”的字样时,触发语音功能模块启动播放所 述视频面签功能对应的语音交互中设置的问题语音文件。

由于不同业务面签所需确定的面签用户信息不同,因此,针对不同对象的 视频面签功能所设置的第一问题语音文件也可能有所不同。在实际应用中,可 针对具体对象的视频面签功能预先设置相应语音格式的第一问题语音文件。

自动化测试工具执行测试脚本以实时监控所述语音交互流程的运行日志信 息,以监控第一问题语音文件的播放进度。其中,第一问题语音文件为当前对 象中嵌入的视频面签功能对应的语音交互流程正在播放的问题。第一问题语音 文件的播放进度可以根据实际需求对不同的播放进度设置不同的标识。

例如,可以在第一问题语音文件播放完成后跳转至对应的指定页面,测试 脚本通过检测是否跳转至对应的指定页面判断第一问题语音文件是否播放结 束;又如,还可以在第一问题语音文件播放完成后在当前语音交互页面弹出悬 浮按钮,测试脚本通过在当前语音交互页面检测是否存在悬浮按钮判断第一问 题语音文件是否播放结束。故本申请对第一问题语音文件播放结束的标识不作 任何限制。

S202,当检测到所述语音功能模块完成播放所述K个问题语音文件中的第 一问题语音文件时,播放与所述第一问题语音文件对应的第一答复语音文件。

本实施例中,针对每一个第一问题语音文件,预先设置对应的一个或多个 第一答复语音文件。第一答复语音文件为与第一问题语音文件对应的第一答复 语音文件。在实际应用中,当同一个第一问题语音文件存在多个第一答复语音 文件时,可以从中选取任一未被测试的第一答复语音文件(即未在该语音交互 流程中被播放过)作为第一答复语音文件。

可选地,上述第一答复语音文件可由人工直接录制语音或者通过文字转化 而成,本申请对此不作任何限定。

本实施例中,当自动化测试工具执行测试脚本实时监控所述语音交互流程 的运行日志,监控到第一问题语音文件的播放结束时,播放与第一问题语音文 件对应的第一答复语音文件。

同样的,监控第一问题语音文件是否播放结束,除了可以通过自动化测试 工具执行测试脚本实时监控所述语音交互流程是否有输出播放结束对应的运行 日志信息,还可以通过检测当前语音交互界面是否存在预设的悬浮按钮进行判 断,当然,第一问题语音文件是否播放结束还可以通过配置结束关键字等方式 进行判断,具体实际应用过程中,可以根据不同的需求进行配置,本申请对此 不作任何限定。

S203,根据所述语音功能模块对所述第一答复语音文件的响应,确定所述 语音功能模块基于所述第一问题语音文件的语音交互测试结果。

本实施例中,针对不同的第一答复语音文件,可以预先设置与所述第一问 题语音文件对应的预设响应结果,故可基于语音交互流程对第一问题语音文件 对应的第一答复语音文件的响应和预设响应结果的比较,确定基于当前第一答 复语音样本的测试结果。可选地,当所述第一问题语音文件为所述K个问题语 音文件中的第i个问题语音文件时,i={1,2,……,K-1},所述根据所述语音 功能模块对所述第一答复语音文件的响应,确定所述语音功能模块基于所述第 一问题语音文件的语音交互测试结果,包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行播放 与所述第一答复语音文件对应的第二问题语音文件的响应操作,则确定所述语 音功能模块基于所述第一问题语音文件的语音交互测试结果为成功。

可选地,若检测到所述语音功能模块成功识别所述第一答复语音文件,且 执行未播放与所述第一答复语音文件对应的第二问题语音文件的响应操作,则 确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为失 败。

其中,上述检测到语音功能模块识别成功第一答复语音文件,且执行未播 放与第一答复语音文件对应的第二问题语音文件的响应操作包括一下两种情 况:第一种情况是检测到语音功能模块识别成功第一答复语音文件后,没有播 放与第一答复语音文件对应的第二问题语音文件;第二种情况是检测到语音功 能模块识别成功第一答复语音文件后,播放的下一问题语音文件不是与第一答 复语音文件对应的第二问题语音文件。

值得说明的是,由于不同的语音功能模块有不同的应用场景,可以针对语 音功能模块的特定的应用场景预先设置与第一问题语音文件对应的第二问题语 音文件。示例性的,在本实施例中,针对视频面签设置的语音功能模块,可以 依次设置3个连续的问题,且上述3个连续的问题是一个整体,以完成语音功 能模块的测试,当第一问题语音文件指上述3个连续的问题中的第1个问题, 识别完成第一答复语音文件后,与第一问题语音文件对应的第二问题语音文件 是第2个问题;同理,当第一问题语音文件指上述3个连续的问题中的第2个 问题,识别完成第一答复语音文件后,与第一问题语音文件对应的第二问题语 音文件就是第3个问题。

假设语音功能模块包括8个问题语音文件如图4所示,当第一问题语音文 件为所述8个问题语音文件中的第3个问题语音文件时,例如,上述第一问题 语音文件为:“请问您的银行卡是XXX银行的吗?”,针对当前问题可以有 两种不同的答复语音样本,其中第一种第一答复语音文件为:“是”,第二种 第一答复语音文件为:“否”,且预先设置的该第一问题语音文件对应的预设 响应结果为:“是”。若检测到所述语音功能模块成功识别所述第一答复语音 文件(即第一问题语音文件对应的第一答复语音文件的响应和预设响应结果均 为“是”),且播放与第3个问题语音文件对应的第4个问题语音文件,则确 定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果为成功。 若检测到所述语音功能模块成功识别所述第一答复语音文件(即第一问题语音 文件对应的第一答复语音文件的响应和预设响应结果均为“是”),且未播放 与第3个问题语音文件对应的第4个问题语音文件(或者播放的不是与第3个 问题语音文件对应的第4个问题语音文件),则确定所述语音功能模块基于所 述第一问题语音文件的语音交互测试结果为失败。

可选地,当所述第一问题语音文件为所述K个问题语音文件中的第K个问 题语音文件时,所述根据所述语音功能模块对所述第一答复语音文件的响应, 确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果,包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行预设 的提示操作的响应操作,则确定所述语音功能模块基于所述第一问题语音文件 的语音交互测试结果为成功。

其中,执行预设的提示操作可以根据实际应用需求输出测试成功提示信息, 以使开发人员获知本次对该语音交互流程进行测试的结果。当然,提示操作也 可以不设置,例如检测到所述语音功能模块识别成功所述第一答复语音文件但 没有提示的情况下,开发人员可以认为本次对语音交互流程进行测试的结果是 成功,即没有错误提示的情况下默认测试成功,本申请对此不作任何限定。

不难理解的,假设如图4所示语音功能模块包括8个问题语音文件,当所 述第一问题语音文件为所述8个问题语音文件中的第8个问题语音文件,也就 是第一问题语音文件是语音功能模块的最后一个问题语音文件时,若检测到所 述语音功能模块识别成功第8个问题语音文件,且执行预设的提示操作,则确 定所述语音功能模块基于第8个问题语音文件的语音交互测试结果为成功。

可选地,所述方法还包括:若检测到所述语音功能模块识别失败所述第一 答复语音文件,则确定所述语音功能模块基于所述第一问题语音文件的语音交 互测试结果为失败。

值得说明的是,检测到所述语音功能模块识别失败所述第一答复语音文件 的情况包括但不限定于语音功能模块没有识别到第一问题语音文件对应的第一 答复语音文件的响应;或者语音功能模块识别的与第一问题语音文件对应的第 一答复语音文件与预设的响应结果不一致。

其中,当语音功能模块没有识别到第一问题语音文件对应的第一答复语音 文件的响应,则确定语音功能模块基于所述第一问题语音文件的语音交互测试 结果为失败。示例性的,可能由于测试环境及测试过程中网络不稳定等因素, 在预设时间内未对语音交互流程中上述第一问题语音文件作出对应的第一答复 语音文件的响应,则可确定确定语音功能模块识别失败第一答复语音文件,进 而确定语音交互测试结果为失败。例如,由于测试环境嘈杂,在预设时间10s 内未对所述语音交互流程中第一问题语音文件作出对应的第一答复语音文件的 响应;又如,由于网络延时在预设时间10s内未获取对所述语音交互流程中第 一问题语音文件作出对应的第一答复语音文件的响应,则可确定语音功能模块 基于所述第一问题语音文件的语音交互测试结果为失败。

或者,语音功能模块识别的与第一问题语音文件对应的第一答复语音文件 与预设的响应结果不一致,则确定语音功能模块基于所述第一问题语音文件的 语音交互测试结果为失败。示例性的,假设如图4所示的语音功能模块包括8 个问题语音文件,当第一问题语音文件为所述8个问题语音文件中的第3个问 题语音文件时,例如,上述第一问题语音文件为:“请问您的银行卡是XXX 银行的吗?”,针对当前问题可以有两种不同的答复语音样本,其中第一种第 一答复语音文件为:“是”,第二种第一答复语音文件为:“否”,且预先设置的该第一问题语音文件对应的响应结果为:“是”。若语音功能模块识别的 与第一问题语音文件对应的第一答复语音文件与预设的响应结果不一致(即第 一问题语音文件对应的第一答复语音文件的响应为“否”,而预设响应结果均 为“是”),则确定语音功能模块基于所述第一问题语音文件的语音交互测试 结果为失败。

可选地,所述语音功能模块识别失败所述第一答复语音文件时,重复播放 所述第一问题语音文件,若在重复播放N次所述第一问题语音文件后,所述语 音功能模块识别成功所述第一答复语音文件,则确定所述语音功能模块识别成 功所述第一答复语音文件,N为大于等于1且小于等于M的整数,M为允许重 复播放的最大次数。

若在重复播放M次所述第一问题语音文件后,所述语音功能模块第M次 对所述第一答复语音文件识别失败,则确定所述语音功能模块识别失败所述第 一答复语音文件,N为大于等于1且小于等于M的整数,M为允许重复播放的 最大次数。

不难理解的,当允许重复播放的最大次数M的取值为3时,若在重复播放 2次所述第一问题语音文件后,所述语音功能模块成功识别所述第一答复语音 文件,则确定所述语音功能模块识别成功所述第一答复语音文件。也就是说在 小于允许播放的最大次数范围内,语音功能模块成功识别第一答复语音文件, 则可以确定语音功能模块识别成功所述第一答复语音文件;反之,在允许播放 的最大次数,语音功能模块对第一答复语音文件识别失败,则可以确定语音功 能模块识别失败所述第一答复语音文件。

示例性的,若在重复播放3次所述第一问题语音文件后,所述语音功能模 块第3次对所述第一答复语音文件仍然识别失败,则确定所述语音功能模块识 别失败所述第一答复语音文件。

通过重复执行多次上述测试过程,有利于提高测试的容错性。需要说明的 是,为了提高语音交互测试的容错性,重复播放次数可根据实际情况进行设置, 当然,还可以采取其他能够提高测试容错性的方法,本申请对此不作任何限定。

示例性的,语音功能模块识别失败所述第一答复语音文件时,则重复播放 第一问题语音文件3次,若第一答复语音文件与预设响应结果仍然不一致,则 确定基于第一答复语音文件的语音交互测试结果为失败。其中,上述重复播放 第一问题语音文件3次是指第1次第一答复语音文件与预设响应结果不一致, 则重复播放一次上述第一问题语音文件,然后重复执行步骤S202,当检测到所 述第一问题语音文件播放完毕时,则播放与所述第一问题语音文件对应的第一 答复语音文件,若第一答复语音文件与预设响应结果还是不一致,那么再次重 新播放一次上述第一问题语音文件,然后重复执行步骤S202,当检测到所述第一问题语音文件播放完毕时,则播放与所述第一问题语音文件对应的第一答复 语音文件,若此时第一答复语音文件与预设响应结果还是不一致,那么确定本 次基于第一答复语音文件的语音交互的测试结果为失败。

应该理解的,当由于测试环境及测试过程中网络不稳定等因素导致语音功 能模块基于第一问题语音文件的语音交互测试结果为失败时,上述重复播放N 次所述第一问题语音文件还可以是指连续播放第一问题语音文件N次。例如, 由于测试环境及测试过程中网络不稳定等因素导致语音功能模块基于第一问题 语音文件的语音交互测试结果为失败时,在连续预设时间(例如10s)重复播 放3次所述第一问题语音文件,即在每10s播放1次所述第一问题语音文件, 直至播放3次第一问题语音文件。

可选地,当确定语音功能模块基于第一问题语音文件的语音交互测试结果 为失败时,可以输出测试失败提示信息,并结束本次对语音交互流程的测试, 通过该测试失败提示信息指示开发人员对该语音交互流程中存在问题的地方进 行调整。

采用本申请提供的语音交互测试方法可以对配置有例如语音交互流程的视 频面签等通用功能模块进行提前测试,避免合入其他相关的应用程序后才发现 各种漏洞,便于后期对视频面签等通用功能模块进行优化升级测试工作;同时, 该方法可以替代人工对语音交互流程进行测试,摆脱了人力束缚,打破了自动 化测试方法仅能模拟人工对语音功能的用户界面进行互动功能测试的局限,加 快了语音交互测试的速度,提高语音交互测试的效率。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后, 各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施 过程构成任何限定。

对应于上文实施例所述的语音交互测试方法,如图5所示为本申请实施例 提供的一种语音交互测试装置的结构示意图,为了便于说明,仅示出了与本申 请实施例相关的部分。该装置300包括:触发单元301、播放单元302和确定 单元303。

触发单元301,用于触发语音功能模块播放K个问题语音文件,K为大于 或者等于1的整数;

播放单元302,用于当检测到所述语音功能模块完成播放所述K个问题语 音文件中的第一问题语音文件时,播放与所述第一问题语音文件对应的第一答 复语音文件;

确定单元303,用于根据所述语音功能模块对所述第一答复语音文件的响 应,确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果。

可选地,所述触发语音功能模块播放K个问题语音文件,包括:

检测语音功能模块的运行日志信息,当检测到预设的关键字时,触发语音 功能模块启动播放问题语音文件。

可选地,当所述第一问题语音文件为所述K个问题语音文件中的第i个问 题语音文件时,i={1,2,……,K-1},所述根据所述语音功能模块对所述第一 答复语音文件的响应,确定所述语音功能模块基于所述第一问题语音文件的语 音交互测试结果,包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行播放 与所述第一答复语音文件对应的第二问题语音文件的响应操作,则确定所述语 音功能模块基于所述第一问题语音文件的语音交互测试结果为成功。

可选地,所述根据所述语音功能模块对所述第一答复语音文件的响应,确 定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果,还包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行未播 放与所述第一答复语音文件对应的第二问题语音文件的响应操作,则确定所述 语音功能模块基于所述第一问题语音文件的语音交互测试结果为失败。

可选地,当所述第一问题语音文件为所述K个问题语音文件中的第K个问 题语音文件时,所述根据所述语音功能模块对所述第一答复语音文件的响应, 确定所述语音功能模块基于所述第一问题语音文件的语音交互测试结果,包括:

若检测到所述语音功能模块成功识别所述第一答复语音文件,且执行预设 的提示操作的响应操作,则确定所述语音功能模块基于所述第一问题语音文件 的语音交互测试结果为成功。

可选地,所述方法还包括:若检测到所述语音功能模块识别失败所述第一 答复语音文件,则确定所述语音功能模块基于所述第一问题语音文件的语音交 互测试结果为失败。

可选地,所述语音功能模块识别失败所述第一答复语音文件时,重复播放 所述第一问题语音文件;

若在重复播放N次所述第一问题语音文件后,所述语音功能模块成功识别 所述第一答复语音文件,则确定所述语音功能模块识别成功所述第一答复语音 文件;

若在重复播放M次所述第一问题语音文件后,所述语音功能模块第M次 对所述第一答复语音文件识别失败,则确定所述语音功能模块识别失败所述第 一答复语音文件,N为大于等于1且小于等于M的整数,M为允许重复播放的 最大次数。

需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与 本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见 方法实施例部分,此处不再赘述。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上 述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上 述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不 同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功 能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在, 也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬 件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模 块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上 述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程, 在此不再赘述。

如图6所示为本申请实施例还提供了一种语音交互测试的设备,该设备400 包括:至少一个处理器401、存储器402以及存储在所述存储器402中并可在 所述至少一个处理器上运行的计算机程序403,所述处理器401执行所述计算 机程序403时实现上述任意各个方法实施例中的步骤。

本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介 质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方 法实施例中的步骤。

本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端 上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或 使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请 实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的 硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机 程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算 机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代 码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括: 能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介 质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储 器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介 质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和 专利实践,计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详 述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示 例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来 实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用 和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现 所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/设备和方法,可 以通过其它的方式实现。例如,以上所描述的装置/设备实施例仅仅是示意性的, 例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有 另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统, 或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或 直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接, 可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为 单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者 也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部 单元来实现本实施例方案的目的。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术 之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当 清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中, 省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节 妨碍本申请的描述。

应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括” 指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个 或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是 指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这 些组合。

如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以 依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测 到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以 依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描 述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第 二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着 在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特 点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一 些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必 然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除 非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的 变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照 前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其 依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特 征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申 请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于双语音口设备的PON网关设备的产测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类