一种文本对应关系构建方法及其相关设备

文档序号:272539 发布日期:2021-11-19 浏览:3次 >En<

阅读说明:本技术 一种文本对应关系构建方法及其相关设备 (Text corresponding relation construction method and related equipment thereof ) 是由 龚笠 杨晶生 于 2021-08-19 设计创作,主要内容包括:本申请公开了一种文本对应关系构建方法及其相关设备,该方法包括:在获取到语音识别文本和该语音识别文本对应的标准语音文本之后,先根据该语音识别文本的至少一个第一切分点和该标准语音文本的至少一个第二切分点,确定至少一个切分点对;再利用该至少一个切分点对中的待使用点对,对该语音识别文本和该标准语音文本进行切分处理,得到至少一个文本对;最后,根据该至少一个文本对,确定该语音识别文本与该标准语音文本之间的文本对应关系,如此能够实现针对语音识别文本及其对应的标准语音文本之间的文本对应关系进行自动构建处理,从而能够有效地避免手动对齐方式造成的不良影响,从而有利于提高语音数据的处理效果。(The application discloses a text corresponding relation construction method and related equipment thereof, wherein the method comprises the following steps: after a voice recognition text and a standard voice text corresponding to the voice recognition text are obtained, determining at least one segmentation point pair according to at least one first segmentation point of the voice recognition text and at least one second segmentation point of the standard voice text; then, segmenting the voice recognition text and the standard voice text by utilizing the point pairs to be used in the at least one segmentation point pair to obtain at least one text pair; finally, according to the at least one text pair, determining a text corresponding relation between the voice recognition text and the standard voice text, so that automatic construction processing can be carried out on the text corresponding relation between the voice recognition text and the standard voice text corresponding to the voice recognition text, adverse effects caused by a manual alignment mode can be effectively avoided, and the processing effect of voice data can be improved.)

一种文本对应关系构建方法及其相关设备

技术领域

本申请涉及数据处理技术领域,尤其涉及一种文本对应关系构建方法及其相关设备。

背景技术

对于一些语音处理场景来说,当针对一个语音数据进行语音识别处理之后,为了能够进一步改善该语音数据的识别文本,可以先由相关技术人员通过手动方式,将语音数据的识别文本与该语音数据的标准语音文本进行文本对应关系构建处理,得到该识别文本与该标准语音文本之间的文本对应关系,以使该文本对应关系用于表示该识别文本中至少一个文本段与该标准语音文本中至少一个文本段之间的对应关系;再依据该文本对应关系,对该语音数据的识别文本进行其他处理操作(例如,文本纠错等操作)。

然而,因上述所示的手动构建方式存在缺陷,使得基于该手动构建方式得到的文本对应关系也存在缺陷,从而使得识别文本的改善效果比较差,进而使得语音数据的处理效果比较差。

发明内容

为了解决上述技术问题,本申请提供了一种文本对应关系构建方法及其相关设备,能够有效地避免手动构建方式造成的不良影响,从而有利于提高语音数据的处理效果。

为了实现上述目的,本申请实施例提供的技术方案如下:

本申请实施例提供一种文本对应关系构建方法,所述方法包括:在获取到语音识别文本和所述语音识别文本对应的标准语音文本之后,根据所述语音识别文本的至少一个第一切分点和所述标准语音文本的至少一个第二切分点,确定至少一个切分点对;其中,所述切分点对包括一个所述第一切分点和一个所述第二切分点;利用所述至少一个切分点对中的待使用点对,对所述语音识别文本和所述标准语音文本进行切分处理,得到至少一个文本对;根据所述至少一个文本对,确定所述语音识别文本与所述标准语音文本之间的文本对应关系。

本申请实施例还提供了一种文本对应关系构建装置,包括:点对确定单元,用于在获取到语音识别文本和所述语音识别文本对应的标准语音文本之后,根据所述语音识别文本的至少一个第一切分点和所述标准语音文本的至少一个第二切分点,确定至少一个切分点对;其中,所述切分点对包括一个所述第一切分点和一个所述第二切分点;文本切分单元,用于利用所述至少一个切分点对中的待使用点对,对所述语音识别文本和所述标准语音文本进行切分处理,得到至少一个文本对;关系确定单元,用于根据所述至少一个文本对,确定所述语音识别文本与所述标准语音文本之间的文本对应关系。

本申请实施例还提供了一种设备,所述设备包括处理器以及存储器:

所述存储器用于存储计算机程序;

所述处理器用于根据所述计算机程序执行本申请实施例提供的文本对应关系构建方法的任一实施方式。

本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行本申请实施例提供的文本对应关系构建方法的任一实施方式。

本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行本申请实施例提供的文本对应关系构建方法的任一实施方式。

与现有技术相比,本申请实施例至少具有以下优点:

本申请实施例提供的技术方案中,在获取到语音识别文本和该语音识别文本对应的标准语音文本之后,先根据该语音识别文本的至少一个第一切分点和该标准语音文本的至少一个第二切分点,确定至少一个切分点对,以使各个切分点对均包括一个第一切分点和一个第二切分点;再利用该至少一个切分点对中的待使用点对,对该语音识别文本和该标准语音文本进行切分处理,得到至少一个文本对,以使该至少一个文本对能够准确地表示出语音识别文本中至少一个第一切分文本段与标准语音文本中至少一个第二切分文本段之间的对应关系;最后,根据该至少一个文本对,确定该语音识别文本与该标准语音文本之间的文本对应关系,如此能够实现针对语音识别文本及其对应的标准语音文本之间的文本对应关系进行自动构建处理,从而能够有效地避免手动对齐方式造成的不良影响,从而有利于提高语音数据的处理效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本申请实施例提供的一种文本对应关系构建方法的流程图;

图2为本申请实施例提供的一种文本对应关系构建过程的示意图;

图3为本申请实施例提供的一种文本对应关系构建装置的结构示意图。

具体实施方式

发明人在针对语音处理过程的研究中发现,在获取到一个语音数据的识别文本之后,为了能够进一步改善该语音数据的识别文本,可以针对该识别文本进行以下处理:先构建识别文本与该语音数据的标准语音文本之间的文本对应关系,以使该文本对应关系用于表示该识别文本中至少一个文本段与该标准语音文本中至少一个文本段之间的对应关系;再依据该文本对应关系,对该语音数据的识别文本进行其他处理操作(例如,文本纠错等操作)。然而,因上文所示的手动构建方式存在缺陷(例如,构建耗时较长、易出现主观错误等),使得基于该手动构建方式得到的文本对应关系也存在缺陷(例如,不准确等),从而使得识别文本的改善效果比较差,进而使得语音数据的处理效果比较差。

基于上述发现,为了解决背景技术部分的技术问题,本申请实施例提供了一种文本对应关系构建方法,该方法包括:在获取到语音识别文本和该语音识别文本对应的标准语音文本之后,先根据该语音识别文本的至少一个第一切分点和该标准语音文本的至少一个第二切分点,确定至少一个切分点对,以使各个切分点对均包括一个第一切分点和一个第二切分点;再利用该至少一个切分点对中的待使用点对,对该语音识别文本和该标准语音文本进行切分处理,得到至少一个文本对,以使该至少一个文本对能够准确地表示出语音识别文本中至少一个第一切分文本段与标准语音文本中至少一个第二切分文本段之间的对应关系;最后,根据该至少一个文本对,确定该语音识别文本与该标准语音文本之间的文本对应关系,如此能够实现针对语音识别文本及其对应的标准语音文本之间的文本对应关系进行自动构建处理,从而能够有效地避免手动对齐方式造成的不良影响,从而有利于提高语音数据的处理效果。

另外,本申请实施例不限定文本对应关系构建方法的执行主体,例如,本申请实施例提供的文本对应关系构建方法可以应用于终端设备或服务器等数据处理设备。其中,终端设备可以为语音处理终端、智能手机、计算机、个人数字助理(Personal DigitalAssitant,PDA)或平板电脑等。服务器可以为独立服务器、集群服务器或云服务器。

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了便于理解本申请,下面结合附图对本申请实施例提供的文本对应关系构建方法进行说明。

参见图1,该图为本申请实施例提供的一种文本对应关系构建方法的流程图。

本申请实施例提供的文本对应关系构建方法,包括S1-S4:

S1:获取到语音识别文本和该语音识别文本对应的标准语音文本。

其中,“语音识别文本”是针对一个语音数据(如,下文待处理语音)进行语音识别处理之后得到的,以使该“语音识别文本”能够表示出该语音数据携带的语音信息;而且本申请实施例不限定“语音识别文本”的获取方式,例如,可以通过针对一个语音数据进行语音识别处理的方式进行实施。

“语音识别文本对应的标准语音文本”用于表示该语音识别文本对应的语音数据实际携带的语音信息;而且本申请实施例不限定“语音识别文本对应的标准语音文本”的获取方式,例如,当上述“语音识别文本”表示一个语音数据的识别文本时,可以将该语音数据的标注文本确定为该“语音识别文本对应的标准语音文本”。其中,“语音数据的识别文本”用于表示针对该语音数据进行语音识别处理的结果。“语音数据的标注文本”是指通过预设标注方式(例如,人工标注方式)针对该语音数据进行语音信息标注所得的文本。

另外,本申请实施例不限定S1的实施方式,例如,可以采用下文S11-S13所示的获取过程进行实施。

S2:根据语音识别文本的至少一个第一切分点和标准语音文本的至少一个第二切分点,确定至少一个切分点对,以使各个切分点对均包括一个第一切分点和一个第二切分点。

其中,“第一切分点”用于表示可以被用于针对语音识别文本进行切分处理的切分位置;而且本申请实施例不限定上述“至少一个第一切分点”的确定方式,例如,其可以根据该语音识别文本中各个标点符号所处位置和/或各个空格所处位置进行确定(例如,当语音识别文本包括至少一个标点符号和至少一个空格时,可以将该语音识别文本中各个标点符号所处位置以及各个空格所处位置均确定为第一切分点)。

“第二切分点”用于表示可以被用于针对标准语音文本进行切分处理的切分位置;而且本申请实施例不限定上述“至少一个第二切分点”的确定方式,例如,其可以根据该标准语音文本中各个标点符号所处位置进行确定(例如,当标准语音文本包括至少一个标点符号时,可以将该标准语音文本中各个标点符号所处位置均确定为第二切分点)。

“切分点对”是由一个第一切分点和一个第二切分点构成的,以使该“切分点对”用于表示出针对语音识别文本的切分位置以及针对标准语音文本的切分位置。

另外,本申请实施例不限定“至少一个切分点对”的确定过程,例如,可以将语音识别文本的各个第一切分点与标准语音文本的各个第二切分点进行随机组合,得到至少一个切分点对。又如,还可以按照预设搭配规则,将语音识别文本的各个第一切分点与标准语音文本的各个第二切分点进行搭配处理,得到至少一个切分点对。其中,“预设搭配规则”可以预先设定。

基于上述S2的相关内容可知,在获取到语音识别文本和该语音识别文本对应的标准语音文本之后,可以将该语音识别文本的至少一个第一切分点和标准语音文本的至少一个第二切分点进行组合处理,得到至少一个切分点对,以使各个切分点对均包括一个第一切分点和一个第二切分点,从而使得各个切分点对均能够表示出针对语音识别文本的切分位置以及针对标准语音文本的切分位置,以便后续能够从这些切分点对中筛选出用于针对语音识别文本以及标准语音文本进行切分处理的切分位置。

S3:利用至少一个切分点对中的待使用点对,对语音识别文本和标准语音文本进行切分处理,得到至少一个文本对。

其中,“待使用点对”用于表示在针对语音识别文本和标准语音文本进行切分处理时所需使用的切分位置。

另外,本申请实施例不限定“待使用点对”的确定过程,例如,该“待使用点对”的确定过程可以包括:从至少一个切分点对中随机筛选一个切分点对,并将筛选得到的切分点对确定为待使用点对。又如,该待使用点对”的确定过程可以包括:从至少一个切分点对中查找满足预设使用条件的一个切分点对,并将上述“预设使用条件的一个切分点对”确定为待使用点对。

此外,“预设使用条件”可以预先设定,而且本申请实施例不限定“预设使用条件”,例如,“预设使用条件”具体可以为:切分得分最大(也就是,从至少一个切分点对中查找具有最大切分得分的一个切分点对)。又如,“预设使用条件”具体可以为:切分得分达到预设得分阈值(也就是,从至少一个切分点对中查找达到预设得分阈值的一个切分点对)。还如,“预设使用条件”具体可以为:切分得分最大且该切分得分达到预设得分阈值(也就是,从至少一个切分点对中查找具有最大切分得分且该最大切分得分达到预设得分阈值的一个切分点对)。需要说明的是,“切分得分”的相关内容请参见下文相关内容。

上述“至少一个文本对”是由语音识别文本的至少一个第一切分文本段和标准语音文本的至少一个第二切分文本段进行组合得到的,以使各个文本对均包括一个第一切分文本段和一个第二切分文本段。其中,“第一切分文本段”是指在针对语音识别文本进行切分处理之后得到的文本段。“第二切分文本段”是指在针对标准语音文本进行切分处理之后得到的文本段。

另外,本申请实施例不限定上述“语音识别文本的至少一个第一切分文本段和标准语音文本的至少一个第二切分文本段”的获取方式,例如,当上述“待使用点对”包括第三识别切分点和第三标准切分点时,按照该第三识别切分点对语音识别文本进行切分处理,得到该语音识别文本的至少一个第一切分文本段,并按照该第三标准切分点对标准语音文本进行切分处理,得到该标准语音文本的至少一个第二切分文本段。

基于上述S3的相关内容可知,在获取到“至少一个切分点对”之后,可以先从该至少一个切分点对中选择出一个切分点,作为待使用点对;再利用该待使用点对,对语音识别文本和标准语音文本进行切分处理,得到该语音识别文本的至少一个第一切分文本段和标准语音文本的至少一个第二切分文本段;最后,将该至少一个第一切分文本段与该至少一个第二切分文本段进行组合处理,得到至少一个文本对,以使各个文本对均包括一个第一切分文本段和一个第二切分文本段,从而使得该“至少一个文本对”能够表示出语音识别文本中至少一个第一切分文本段与标准语音文本中至少一个第二切分文本段之间的对应关系。

S4:根据至少一个文本对,确定语音识别文本与标准语音文本之间的文本对应关系。

其中,“语音识别文本与标准语音文本之间的文本对应关系”用于描述该语音识别文本中文本内容(如,切分文本段等)与该标准语音文本文本内容(如,文本段、句子等)之间的对应关系。

基于上述S1至S4的相关内容可知,对于本申请实施例提供的文本对应关系构建方法来说,在获取到语音识别文本和该语音识别文本对应的标准语音文本之后,先根据该语音识别文本的至少一个第一切分点和该标准语音文本的至少一个第二切分点,确定至少一个切分点对,以使各个切分点对均包括一个第一切分点和一个第二切分点;再利用该至少一个切分点对中的待使用点对,对该语音识别文本和该标准语音文本进行切分处理,得到至少一个文本对,以使该至少一个文本对能够准确地表示出语音识别文本中至少一个第一切分文本段与标准语音文本中至少一个第二切分文本段之间的对应关系;最后,根据该至少一个文本对,确定该语音识别文本与该标准语音文本之间的文本对应关系,如此能够实现针对语音识别文本及其对应的标准语音文本之间的文本对应关系进行自动构建处理,从而能够有效地避免手动对齐方式造成的不良影响,从而有利于提高语音数据的处理效果。

另外,本申请实施例提供的文本对应关系构建方法可以应用各种需要针对两个文本进行内容对齐处理的应用场景(例如,语音数据处理的应用场景等)中。为了便于理解,下面结合示例进行说明。

作为示例,当本申请实施例提供的文本对应关系构建方法应用于语音数据处理时,S1具体可以包括S11-S13:

S11:获取待处理语音。

其中,“待处理语音”是指由语音采集设备(如,拾音设备)采集到的语音数据;而且本申请实施例不限定“待处理语音”,例如,可以是指任一语音数据。又如,为了提高语音数据处理的实时性,该待处理语音可以是指由拾音设备实时采集的语音数据。

S12:对待处理语音进行语音识别处理,得到所述语音识别文本。

本申请实施例中,在获取到待处理语音之后,可以将该待处理语音进行语音识别处理,得到该待处理语音的识别文本,以使该识别文本能够表示出该待处理语音携带的语音信息;再将该待处理语音的识别文本,确定为上述“语音识别文本”,以便后续能够借助上述S2-S4所示的步骤实现针对该待处理语音的识别文本与该待处理语音的语音标注文本进行文本内容对齐处理。

S13:根据待处理语音的语音标注文本,确定语音识别文本对应的标准语音文本。

其中,“待处理语音的语音标注文本”是指通过预设标注方式(例如,人工标注方式)针对该待处理语音进行语音信息标注所得的文本。

基于上述S11至S13的相关内容可知,对于一些应用场景来说,在获取到待处理语音之后,可以针对该待处理语音进行语音识别处理,得到语音识别文本,并将该待处理语音的语音标注文本,确定该语音识别文本对应的标准语音文本,以便后续能够借助“语音识别文本与标准语音文本之间的文本对应关系”的构建过程,确定该待处理语音的识别文本与该待处理语音的语音标注文本之间的文本对应关系,如此能够实现针对该待处理语音的识别文本与该待处理语音的语音标注文本进行的文本内容对齐处理过程。

另外,为了能够进一步改善该语音数据的识别文本,可以利用上述“待处理语音的识别文本与待处理语音的语音标注文本之间的文本对应关系”,对该待处理语音的识别文本进行其他处理过程。基于此,本申请实施例还提供了文本对应关系构建方法的另一种可能的实施方式,在该实施方式中,该文本对应关系构建方法除了包括上述S11-S13、以及S2-S4以外,该文本对应关系构建方法还包括S5:

S5:利用上述“语音识别文本与标准语音文本之间的文本对应关系”,对该语音识别文本进行预设处理,得到该待处理语音对应的待使用语音文本。

其中,“预设处理”可以根据应用场景设定;例如,该“预设处理”可以包括纠错处理。

“待处理语音对应的待使用语音文本”是针对该待处理语音的识别文本进行预设处理之后得到的;而且该“待处理语音对应的待使用语音文本”能够更好的表示出该待处理语音携带的语音信息。

基于上述S11-S13以及S2-S5的相关内容可知,对于一些应用场景来说,可以先借助待处理语音的识别文本和该待处理语音的语音标注文本,确定该待处理语音的识别文本与该待处理语音的语音标注文本之间的文本对应关系;再借助该“待处理语音的识别文本与待处理语音的语音标注文本之间的文本对应关系”,对该语音识别文本进行预设处理,得到该待处理语音对应的待使用语音文本,以使该待使用语音文本能够更好的表示出该待处理语音携带的语音信息,如此有利于改善该语音数据的识别文本。

另外,为了进一步提高上述“文本对应关系”的准确性,可以借助迭代更新的方式构建语音识别文本与标准语音文本之间的文本对应关系。基于此,本申请实施例还提供了文本对应关系构建方法的又一种可能的实施方式,在该实施方式中,该文本对应关系构建方法包括步骤11-步骤18:

步骤11:获取到语音识别文本和该语音识别文本对应的标准语音文本。

需要说明的是,步骤11的相关内容可以参见上文S1的相关内容。

步骤12:根据语音识别文本和标准语音文本,分别确定第一待切分文本和第二待切分文本。

其中,“第一待切分文本”用于表示在每轮对应关系构建过程中需要被切分处理的且与语音识别文本相关的文本数据;且具体可以包括:在首轮对应关系构建过程中,该“第一待切分文本”是指上述“语音识别文本”;但是,在非首轮对应关系构建过程中,该“第一待切分文本”是指上述“语音识别文本”中部分文本内容。

“第二待切分文本”用于表示在每轮对应关系构建过程中需要被切分处理的且与标准语音文本相关的文本数据;且具体可以包括:在首轮对应关系构建过程中,该“第二待切分文本”是指上述“标准语音文本”;但是,在非首轮对应关系构建过程中,该“第二待切分文本”是指上述“标准语音文本”中部分文本内容。

基于上述步骤12的相关内容可知,对于针对文本对应关系的迭代更新过程来说,在获取到语音识别文本和该语音识别文本对应的标准语音文本之后,可以利用该语音识别文本和该标准语音文本,初始化第一待切分文本和第二待切分文本(例如,将该语音识别文本确定为第一待切分文本,并将该标准语音文本确定为第二待切分文本),以便后续能够基于初始化后的第一待切分文本和第二待切分文本,实现针对文本对应关系的第一轮迭代更新过程,如此使得后续能够借助迭代执行针对文本对应关系的多轮迭代更新过程,实现针对“语音识别文本与标准语音文本之间的文本对应关系”的不断更新优化的目的。

步骤13:根据第一待切分文本的至少一个第三切分点和第二待切分文本的至少一个第四切分点,确定至少一个切分点对,以使各个切分点对均包括一个第三切分点和一个第四切分点。

其中,“第三切分点”用于表示可以被用于针对第一待切分文本进行切分处理的切分位置;而且本申请实施例不限定上述“至少一个第三切分点”的确定方式,例如,其可以根据该第一待切分文本中各个标点符号所处位置和/或各个空格所处位置进行确定(例如,当第一待切分文本包括至少一个标点符号和至少一个空格时,可以将该第一待切分文本中各个标点符号所处位置以及各个空格所处位置均确定为第三切分点)。

“第四切分点”用于表示可以被用于针对第二待切分文本进行切分处理的切分位置;而且本申请实施例不限定上述“至少一个第四切分点”的确定方式,例如,其可以根据该第二待切分文本中各个标点符号所处位置和/或各个空格所处位置进行确定(例如,当第二待切分文本包括至少一个标点符号和至少一个空格时,可以将该第二待切分文本中各个标点符号所处位置以及各个空格所处位置均确定为第四切分点)。

“切分点对”是由一个第三切分点和一个第四切分点构成的,以使该“切分点对”用于表示出针对第一待切分文本的切分位置以及针对第二待切分文本的切分位置。

另外,本申请实施例不限定“至少一个切分点对”的确定过程,例如,可以将第一待切分文本的各个第三切分点与第二待切分文本的各个第四切分点进行随机组合,得到至少一个切分点对。又如,还可以按照预设搭配规则,将第一待切分文本的各个第三切分点与第二待切分文本的各个第四切分点进行搭配处理,得到至少一个切分点对。其中,“预设搭配规则”可以预先设定。

基于上述步骤13的相关内容可知,对于针对文本对应关系的当前轮迭代更新过程来说,在获取到第一待切分文本和该第一待切分文本对应的第二待切分文本之后,可以将该第一待切分文本的至少一个第三切分点和第二待切分文本的至少一个第四切分点进行组合处理,得到至少一个切分点对,以使各个切分点对均包括一个第三切分点和一个第四切分点,从而使得各个切分点对均能够表示出针对第一待切分文本的切分位置以及针对第二待切分文本的切分位置,以便后续能够从这些切分点对中筛选出用于针对第一待切分文本以及第二待切分文本进行切分处理的切分位置。

步骤14:利用至少一个切分点对中的待使用点对,对第一待切分文本和第二待切分文本进行切分处理,得到至少一个文本对。

需要说明的是,步骤14的相关内容与上文S3的相关内容类似,只需将上文S3的相关内容中“语音识别文本”替换为“第一待切分文本”、以及“标准语音文本”替换为“第二待切分文本”即可。

步骤15:根据至少一个文本对,更新语音识别文本与标准语音文本之间的文本对应关系。

本申请实施例中,对于针对文本对应关系的当前轮迭代更新过程来说,在获取到至少一个文本对之后,可以借助该至少一个文本对,对上述“语音识别文本与标准语音文本之间的文本对应关系”,以使该“语音识别文本与标准语音文本之间的文本对应关系”能够记录上述“至少一个文本对”中所表示的至少一个对应关系,从而使得该“语音识别文本与标准语音文本之间的文本对应关系”能够更准确地表示出该语音识别文本所携带的文本内容与该标准语音文本所携带的文本内容之间的对应关系,如此有利于提高上述“语音识别文本与标准语音文本之间的文本对应关系”的准确性。

步骤16:判断是否达到预设停止条件,若是,则执行步骤18;若否,则执行步骤17。

其中,预设停止条件是指预先设定的用于判断是否结束针对文本对应关系的迭代更新过程的条件;而且本申请实施例不限定预设停止条件,例如,其具体可以为各个文本对中均存在由一个句子构成的文本段。为了便于理解,下面结合示例。

作为示例,当上述“第一待切分文本”为上述“第二待切分文本”为且上述“至少一个文本对”包括第一文本对(A,B)和第二文本对时,若确定A、B、以及均包括至少两个句子,则可以确定没有达到预设停止条件;若确定A和B中存在至少一个由一个句子构成的文本段(例如,A为单句;或者,B为单句;或者,A和B均为单句),并且确定中存在至少一个由一个句子构成的文本段(例如,为单句;或者,为单句;或者,均为单句),则可以确定达到预设停止条件,故可以结束迭代更新处理,并将当前轮更新得到的“语音识别文本与标准语音文本之间的文本对应关系”进行保存处理,以便后续能够利用该“语音识别文本与标准语音文本之间的文本对应关系”进行后续操作(如,上文“预设处理”)。

需要说明的是,本申请实施例不限定步骤16的实施方式,例如,若在执行完成步骤15之后,再执行步骤16,则该步骤16具体可以包括:判断是否达到预设停止条件,若是,则执行步骤18;若否,则执行步骤17。又如,若在执行步骤15之前先执行步骤16,则该步骤16具体可以包括:判断是否达到预设停止条件,若是,则依次执行步骤15以及步骤18;若否,则依次执行步骤15以及步骤17。

步骤17:根据至少一个文本对,更新第一待切分文本以及第二待切分文本,并返回执行步骤13。

本申请实施例不限定步骤17中“更新”的实施方式,例如,当上述“至少一个文本对”包括第一文本对(A,B)和第二文本对时,可以利用第一文本对(A,B)对第一待切分文本以及第二待切分文本进行更新(例如,将A确定为第一待切分文本,并将B确定为第二待切分文本),以便后续能够针对A和B进行针对文本对应关系的新一轮迭代更新过程;或者,可以利用第一文本对对第一待切分文本以及第二待切分文本进行更新(例如,将确定为第一待切分文本,并将确定为第二待切分文本),以便后续能够针对进行针对文本对应关系的新一轮迭代更新过程。

在一些情况下,为了进一步提高文本对应关系的构建效果(例如,构建效率或者构建准确性),可以利用多个文本对同时更新第一待切分文本以及第二待切分文本,以便后续能够针对该多个文本对进行切分处理。基于此可知,当上述“至少一个文本对”包括第一文本对(A,B)和第二文本对时,可以利用第一文本对(A,B)对第一待切分文本以及第二待切分文本进行更新(例如,将A确定为第一待切分文本,并将B确定为第二待切分文本),得到第一组待切分文本,并利用第一文本对对第一待切分文本以及第二待切分文本进行更新(例如,将确定为第一待切分文本,并将确定为第二待切分文本),得到第二组待切分文本,以便能够借助步骤13及其后续步骤针对多组待切分文本进行并行处理,如此有利于提高针对文本对应关系的新一轮迭代更新过程的更新效果(如,更新效率),从而有利于提高文本对应关系的构建效果(例如,构建效率或者构建准确性)

基于步骤17的相关内容可知,在确定没有达到预设停止条件之后,可以确定针对文本对应关系的迭代更新过程仍未结束,故可以根据至少一个文本对,更新第一待切分文本以及第二待切分文本,以便后续能够基于更新后的第一待切分文本以及第二待切分文本,继续执行步骤13及其后续步骤,以实现针对文本对应关系的新一轮迭代更新过程。

步骤18:结束“针对文本对应关系的迭代更新过程”。

本申请实施例中,在确定达到预设停止条件之后,可以确定针对文本对应关系的迭代更新过程可以结束了,故此时可以结束“针对文本对应关系的迭代更新过程”,以便后续能够利用在针对文本对应关系的当前轮迭代更新过程中更新得到的“语音识别文本与标准语音文本之间的文本对应关系”进行保存或者使用。

基于上述步骤11至步骤18的相关内容可知,在一些情况下,可以借助针对文本对应关系的迭代更新过程构建“语音识别文本与标准语音文本之间的文本对应关系”,以使构建好的“语音识别文本与标准语音文本之间的文本对应关系”能够尽可能地表示出语音识别文本与标准语音文本之间存在的以句子为粒度的对应关系,如此有利于提高“语音识别文本与标准语音文本之间的文本对应关系”的准确性。

另外,对于上述“针对文本对应关系的迭代更新过程”来说,为了进一步提高文本对应关系的构建效果(例如,构建准确性),本申请实施例还提供了“预设停止条件”的另一种可能的实施方式,其具体可以包括以下两个条件中的至少一个;而且该两个条件具体如下:

条件1:对于上述“至少一个文本对”来说,各个文本对中均存在由一个句子构成的文本段。需要说明的是,条件1的相关内容可以参见上文步骤16。

条件2:当从至少一个切分点对中查找满足预设查找条件的切分点对时,该“至少一个切分点对”中不存在满足预设查找条件的切分点对。需要说明的是,“预设查找条件”的相关内容可以参见下文步骤24中“预设查找条件”的相关内容。

基于上述两个条件可知,当上述“预设停止条件”包括条件1和条件2时,若确定满足条件1,则可以确定满足上述“预设停止条件”;若确定满足条件2,则可以确定满足上述“预设停止条件”。

为了便于理解上述“预设停止条件”,下面结合示例进行说明。

作为示例,当预设停止条件包括上述“条件1”和上述“条件2”时,文本对应关系构建方法包括步骤21-步骤30:

步骤21:获取到语音识别文本和该语音识别文本对应的标准语音文本。

步骤22:根据语音识别文本和标准语音文本,分别确定第一待切分文本和第二待切分文本。

步骤23:根据第一待切分文本的至少一个第三切分点和第二待切分文本的至少一个第四切分点,确定至少一个切分点对,以使各个切分点对均包括一个第三切分点和一个第四切分点。

需要说明的是,上述步骤21-步骤23的相关内容请分别参见上文步骤11-步骤13。

步骤24:从至少一个切分点对中查找满足预设查找条件的切分点对,得到点对查找结果。

其中,“预设查找条件”可以预先设定,而且本申请实施例不限定“预设查找条件”,例如,“预设查找条件”具体可以为:切分得分达到预设得分阈值(也就是,从至少一个切分点对中查找达到预设得分阈值的一个切分点对)。又如,“预设查找条件”具体可以为:切分得分最大且该切分得分达到预设得分阈值(也就是,从至少一个切分点对中查找具有最大切分得分且该最大切分得分达到预设得分阈值的一个切分点对)。需要说明的是,“切分得分”的相关内容请参见下文。

“点对查找结果”用于表示至少一个切分点对中是否存在满足预设查找条件的切分点对、以及至少一个切分点对中满足预设查找条件的切分点对是什么。

步骤25:根据点对查找结果,确定至少一个切分点对中是否存在满足预设查找条件的切分点对;若是,则执行步骤26;若否,则执行步骤30。

本申请实施例中,在获取到点对查找结果之后,若该点对查找结果表示至少一个切分点对中存在满足预设查找条件的切分点对,则可以参考该“满足预设查找条件的切分点对”,确定待使用点对,以便后续能够基于该“待使用点对”进行后续的文本切分处理以及文本对应关系的更新处理;若该点对查找结果表示至少一个切分点对中不存在满足预设查找条件的切分点对,则可以确定在针对文本对应关系的当前轮迭代更新过程中无法确定出可用的切分点对,故可以确定针对文本对应关系的迭代更新过程可以结束了。

步骤26:根据点对查找结果确定待使用点对,并利用待使用点对,对第一待切分文本和第二待切分文本进行切分处理,得到至少一个文本对。

其中,“利用待使用点对,对第一待切分文本和第二待切分文本进行切分处理,得到至少一个文本对”的相关内容请参见上文步骤14的相关内容。

另外,本申请实施例不限定步骤26中“待使用点对”的确定过程,例如,若上述“点对查找结果”表示至少一个切分点对中存在多个满足预设查找条件的切分点对,则可以从该“多个满足预设查找条件的切分点对”中选择一个切分点对(例如,选择具有切分得分最大的切分点对),作为待使用点对。又如,若上述“点对查找结果”表示至少一个切分点对中存在一个满足预设查找条件的切分点对,则可以直接将该“满足预设查找条件的切分点”,确定为待使用点对。

基于上述步骤26的相关内容可知,对于针对文本对应关系的当前轮迭代更新过程来说,在确定上述“点对查找结果”表示至少一个切分点对中存在至少一个满足预设查找条件的切分点对之后,可以先从该“至少一个满足预设查找条件的切分点对”中查找待使用点对;再利用该待使用点对,对第一待切分文本和第二待切分文本进行切分处理,得到至少一个文本对,以便后续能够基于该至少一个文本对更新文本对应关系。

步骤27:根据至少一个文本对,更新语音识别文本与标准语音文本之间的文本对应关系。

需要说明的是,步骤27的相关内容请参见上文步骤15的相关内容。

步骤28:判断是否达到上述条件1,若是,则执行步骤30;若否,则执行步骤29。

需要说明的是,步骤28的相关内容与上文步骤16的相关内容类似,只需将上文步骤16的相关内容中“预设停止条件”替换为“条件1”、“步骤18”替换为“步骤30”、“步骤17”替换为“步骤29”、“步骤15”替换为“步骤27”、以及“步骤16”替换为“步骤28”。

步骤29:根据至少一个文本对,更新第一待切分文本以及第二待切分文本,并返回执行步骤23。

步骤30:结束“针对文本对应关系的迭代更新过程”。

需要说明的是,步骤29-步骤30的相关内容请分别参见上文步骤17-步骤18的相关内容。

基于上述步骤21至步骤28的相关内容可知,在一些情况下,针对文本对应关系的迭代更新过程可以按照上述条件1和/或条件2,构建“语音识别文本与标准语音文本之间的文本对应关系”,以使构建好的“语音识别文本与标准语音文本之间的文本对应关系”能够更好地表示出语音识别文本与标准语音文本之间存在的以句子为粒度的对应关系,如此有利于提高“语音识别文本与标准语音文本之间的文本对应关系”的准确性。

另外,为了进一步提高文本对应关系的准确性,本申请实施例还提供了确定上述“待使用点对”的一种可能的实施方式,其具体可以包括步骤31-步骤32:

步骤31:根据待切分识别文本对象、待切分标准文本对象和上文“至少一个切分点对”中各个切分点对,分别确定各个切分点对的切分得分。

其中,“待切分识别文本对象”用于表示需要进行切分处理的且与上文“语音识别文本”相关的文本数据;而且本申请实施例不限定“待切分识别文本对象”,例如,其可以为上文“语音识别文本”,也可以是上文“第一待切分文本”。

“待切分标准文本对象”用于表示需要进行切分处理的且与上文“标准语音文本”相关的文本数据;而且本申请实施例不限定“待切分标准文本对象”,例如,其可以为上文“标准语音文本”,也可以是上文“第二待切分文本”。

“切分得分”用于表示一个切分点对被用于进行后续切分处理的可能性;而且本申请实施例不限定“切分得分”的确定过程。

步骤32:根据至少一个切分点对的切分得分,从该至少一个切分点对中查找满足预设查找条件的切分点对,得到待使用点对。

其中,“预设查找条件”的相关内容可以参见上文步骤24中“预设查找条件”的相关内容。

另外,本申请实施例不限定步骤32中“待使用点对”的确定过程,例如,可以采用上文步骤26所示的任一种“待使用点对”的确定过程进行实施。

基于上述步骤31至步骤32的相关内容可知,在获取到至少一个切分点对之后(也就是,在执行完上文S2之后;或者,在执行完上文步骤23之后),可以先计算该至少一个切分点对中各个切分点对的切分得分;再参考各个切分点对的切分得分从该至少一个切分点对中查找满足预设查找条件的切分点对,得到待使用点对,以使该待使用点对能够更准确地表示出在针对待切分识别文本对象以及待切分标准文本对象进行切分处理时最合理的切分位置,如此有利于提高“语音识别文本与标准语音文本之间的文本对应关系”的准确性。

另外,为了提高上述“切分得分”的准确性,本申请实施例还提供了确定“切分得分”的一种实施方式,而且为了便于理解下面结合“待评分点对的切分得分的确定过程”进行说明。

作为示例,若上述“至少一个切分点对”包括待评分点对,则该待评分点对的切分得分的确定过程,可以包括步骤41-步骤42:

步骤41:利用待评分点对,对待切分识别文本对象和待切分标准文本对象进行切分处理,得到至少一个待比对文本对。

其中,“待评分点对”用于表示上述“至少一个切分点对”中任意一个切分点对。

“至少一个待比对文本对”是由待切分识别文本对象的至少一个第三切分文本段和待切分标准文本对象的至少一个第四切分文本段进行组合得到的,以使各个待比对文本对均包括一个第三切分文本段和一个第四切分文本段。其中,“第三切分文本段”是指在针对待切分识别文本对象进行切分处理之后得到的文本段。“第四切分文本段”是指在针对待切分标准文本对象进行切分处理之后得到的文本段。

另外,本申请实施例不限定“至少一个待比对文本对”的构建方式,例如,可以按照第一组合规则,将待切分识别文本对象的至少一个第三切分文本段和待切分标准文本对象的至少一个第四切分文本段进行组合处理,得到该“至少一个待比对文本对”。其中,“第一组合规则”可以预先设定;而且本申请实施例不限定“第一组合规则”,例如,若待切分识别文本对象被切分为2个第三切分文本段,且待切分标准文本对象被切分为2个第四切分文本段,则该“第一组合规则”具体可以为将上述“2个第三切分文本段”中位置比较靠前的第三切分文本段与上述“2个第四切分文本段”中位置比较靠前的第四切分文本段进行组合,得到一个待比对文本对;并且将上述“2个第三切分文本段”中位置比较靠后的第三切分文本段与上述“2个第四切分文本段”中位置比较靠后的第四切分文本段进行组合,得到另一个待比对文本对。

此外,本申请实施例不限定步骤41中“切分处理”的实施方式,例如,可以采用上文S3所示的切分处理的任一实施方式进行实施。

步骤42:根据至少一个待比对文本对的文本比对结果,确定待评分点对的切分得分。

其中,“待比对文本对的文本比对结果”是指将该待比对文本对所包括的两个文本数据进行文本比对处理所得结果,以使该“待比对文本对的文本比对结果”用于描述该待比对文本对所包括的两个文本数据之间的相似性。

上述“文本比对处理”用于针对两个文本数据进行文本相似度比较;而且本申请实施例不限定上述“文本比对处理”,例如,可以采用现有的或者未来出现的任一种文本比对方法进行实施。

另外,本申请实施例不限定“文本比对结果”,例如,其可以包括文本内容比对结果(如,下文“内容比对得分”)和/或文本长度比对结果(例如,下文“长度比对得分”)。其中,“文本内容比对结果”用于表示两个文本数据之间的内容相似度。“文本长度比对结果”用于表示两个文本数据之间的长度相似度。

此外,本申请实施例不限定步骤42的实施方式,例如,步骤42具体可以包括:先根据各个待比对文本对的文本比对结果,确定各个待比对文本对的文本比对得分;再对至少一个待比对文本对的文本比对得分进行平均值计算,得到该待评分点对的切分得分。

其中,“待比对文本对的文本比对得分”用于表征该待比对文本对所包括的两个文本数据之间的相似程度;而且本申请实施例不限定“待比对文本对的文本比对得分”,例如其具体可以包括:将该待比对文本对的文本内容比对结果和该待比对文本对的文本长度比对结果进行加权求和处理,得到该待比对文本对的文本比对得分。

基于上述步骤41至步骤42的相关内容可知,在获取到待评分点对之后,可以先利用该待评分点对,对待切分识别文本对象和待切分标准文本对象进行切分处理,得到至少一个待比对文本对;再参考各个待比对文本对的文本比对结果,确定待评分点对的切分得分,以使该切分得分能够准确地表示出按照该待评分点对针对待切分识别文本对象和待切分标准文本对象进行切分处理时所达到的合理程度,如此有利于提高文本对应关系的准确性。

另外,为了进一步提高文本比对结果的准确性,本申请实施例还提供了“文本比对结果”的一种可能的实施方式,为了便于理解,下面结合示例进行说明。

作为示例,当上述“至少一个待比对文本对”包括待使用文本段对,且该待使用文本段对包括待使用识别文本段和待使用标准文本段时,该目标文本段对的文本比对结果可以包括待使用识别文本段与待使用标准文本段之间的内容比对得分、和/或待使用识别文本段与待使用标准文本段之间的长度比对得分。

其中,“待使用文本段对”用于表示上述“至少一个待比对文本对”中任意一个待比对文本对。

“待使用识别文本段”是指利用上述“待评分点对”对待切分识别文本对象进行切割得到的一个文本段。

“待使用标准文本段”是指利用上述“待评分点对”对待切分标准文本对象进行切割得到的一个文本段。

“待使用识别文本段与待使用标准文本段之间的内容比对得分”用于表征待使用识别文本段与待使用标准文本段之间的内容相似程度。

“待使用识别文本段与待使用标准文本段之间的长度比对得分”用于表征待使用识别文本段与待使用标准文本段之间的长度相似程度。

基于上述示例的相关内容可知,对于包括待使用识别文本段和待使用标准文本段的待使用文本段对来说,该目标文本段对的文本比对结果可以包括待使用识别文本段与待使用标准文本段之间的内容比对得分;或者,该目标文本段对的文本比对结果可以包括待使用识别文本段与待使用标准文本段之间的内容比对得分、以及待使用识别文本段与待使用标准文本段之间的长度比对得分。

另外,为了提高内容比对得分的准确性,本申请实施例还提供了确定“待使用识别文本段与待使用标准文本段之间的内容比对得分”的一种可能的实施方式,其具体可以包括:根据待使用识别文本段对待使用标准文本段的内容覆盖度、待切分识别文本对象对待使用标准文本段的内容覆盖度、待使用标准文本段对待使用识别文本段的内容覆盖度、以及待切分标准文本对象对待使用识别文本段的内容覆盖度,确定待使用识别文本段与待使用标准文本段之间的内容比对得分。

其中,“待使用识别文本段对待使用标准文本段的内容覆盖度”用于表征该待使用识别文本段所携带的文本信息针对该待使用标准文本段所携带的文本信息所达到的覆盖程度。

“待切分识别文本对象对待使用标准文本段的内容覆盖度”用于表征该待切分识别文本对象所携带的文本信息针对该待使用标准文本段所携带的文本信息所达到的覆盖程度。

“待使用标准文本段对待使用识别文本段的内容覆盖度”用于表征该待使用标准文本段所携带的文本信息针对该待使用识别文本段所携带的文本信息所达到的覆盖程度。

“待切分标准文本对象对待使用识别文本段的内容覆盖度”用于表征该待切分标准文本对象所携带的文本信息针对该待使用识别文本段所携带的文本信息所达到的覆盖程度。

本申请实施例不限定上述“待使用识别文本段与待使用标准文本段之间的内容比对得分”的确定过程,例如,其具体可以包括:对待使用识别文本段对待使用标准文本段的内容覆盖度、待切分识别文本对象对待使用标准文本段的内容覆盖度、待使用标准文本段对待使用识别文本段的内容覆盖度、以及待切分标准文本对象对待使用识别文本段的内容覆盖度进行第一统计处理(例如,加和处理、平均值处理、或者取最大值处理等),得到待使用识别文本段与待使用标准文本段之间的内容比对得分。

另外,为了进一步提高内容比对得分的准确性,本申请实施例还提供了确定“待使用识别文本段与待使用标准文本段之间的内容比对得分”的一种可能的实施方式,其具体可以包括步骤52-步骤53:

步骤51:根据待使用识别文本段对待使用标准文本段的内容覆盖度与待切分识别文本对象对待使用标准文本段的内容覆盖度之间的比值,确定待使用标准文本段对应的内容被覆盖得分。

步骤52:根据待使用标准文本段对待使用识别文本段的内容覆盖度与待切分标准文本对象对待使用识别文本段的内容覆盖度之间的比值,确定待使用识别文本段对应的内容被覆盖得分。

步骤53:根据待使用标准文本段对应的内容被覆盖得分与待使用识别文本段对应的内容被覆盖得分之间的乘积,确定待使用识别文本段与待使用标准文本段之间的内容比对得分。

需要说明的是,本申请实施例不限定步骤53的实施方式,例如,其可以采用公式(1)进行实施。

式中,textscore(TSide,TSnor)表示待使用识别文本段与待使用标准文本段之间的内容比对得分;TSide表示待使用识别文本段;TSnor表示待使用标准文本段;coverscore(TSide,TSnor)表示待使用识别文本段对待使用标准文本段的内容覆盖度;表示待切分识别文本对象对待使用标准文本段的内容覆盖度;表示待切分识别文本对象,而且该待切分识别文本对象被上述“待评分点对”切分成TSide这两个文本段;coverscore(TSnor,TSide)表示待使用标准文本段对待使用识别文本段的内容覆盖度;表示待切分标准文本对象对待使用识别文本段的内容覆盖度;表示待切分标准文本对象,而且该待切分标准文本对象被上述“待评分点对”切分成TSnor这两个文本段。

基于上述步骤51至步骤53的相关内容可知,在一些情况下,可以参考待使用识别文本段对待使用标准文本段的内容覆盖度与待切分识别文本对象对待使用标准文本段的内容覆盖度之间的比值、以及待使用标准文本段对待使用识别文本段的内容覆盖度与待切分标准文本对象对待使用识别文本段的内容覆盖度之间的比值,确定待使用识别文本段与待使用标准文本段之间的内容比对得分(如上述公式(1)所示),以使该“待使用识别文本段与待使用标准文本段之间的内容比对得分”能够更准确地表示出待使用识别文本段与待使用标准文本段之间的内容相似程度。

另外,为了提高内容覆盖度的准确性,本申请实施例还提供了确定“内容覆盖度”的一种可能的实施方式,而且为了便于说明,下面结合示例进行说明。

作为示例,第一对象对第二对象的内容覆盖度的确定过程,具体可以包括步骤61-步骤63:

步骤61:按照第i种划分方式,分别对第一对象和第二对象进行单元划分处理,得到第一对象的第i个单元集合和第二对象的第i个单元集合。其中,i为正整数,i≤I,I为正整数,I表示划分方式的个数。

其中,“第i种划分方式”用于表示第i种单元划分处理方式(例如,可采用i-gram所示的划分方式进行实施);而且该“第i个单元方式”是以i个词汇作为一个划分单元进行划分处理的。其中,i为正整数,i≤I,I为正整数,I表示划分方式的个数。

本申请实施例不限定“第一对象”以及“第二对象”,例如,“第一对象”可以是指上文“待使用识别文本段对待使用标准文本段的内容覆盖度”中“待使用识别文本段”,且“第二对象”可以是指上文“待使用识别文本段对待使用标准文本段的内容覆盖度”中“待使用标准文本段”。又如,“第一对象”可以是指上文“待切分识别文本对象对待使用标准文本段的内容覆盖度”中“待切分识别文本对象”,且“第二对象”可以是指上文“待切分识别文本对象对待使用标准文本段的内容覆盖度”中“待使用标准文本段”。还如,“第一对象”可以是指上文“待使用标准文本段对待使用识别文本段的内容覆盖度”中“待使用标准文本段”,且“第二对象”可以是指上文“待使用标准文本段对待使用识别文本段的内容覆盖度”中“待使用识别文本段”。再如,“第一对象”可以是指上文“待切分标准文本对象对待使用识别文本段的内容覆盖度”中“待切分标准文本对象”,且“第二对象”可以是指上文“待切分标准文本对象对待使用识别文本段的内容覆盖度”中“待使用识别文本段”。

“第一对象的第i个单元集合”用于记录将第一对象按照以i个词汇作为一个划分单元进行划分处理之后得到的所有划分单元,以使该“第一对象的第i个单元集合”所包括的各个划分单元均包括i个词汇。

“第二对象的第i个单元集合”用于记录将第二对象按照以i个词汇作为一个划分单元进行划分处理之后得到的所有划分单元,以使该“第二对象的第i个单元集合”所包括的各个划分单元均包括i个词汇。

步骤62:根据第一对象的第i个单元集合与第二对象的第i个单元集合之间的交集、以及第二对象的第i个单元集合,确定第i个单元方式对应的内容覆盖度。其中,i为正整数,i≤I,I为正整数,I表示划分方式的个数。

作为示例,步骤62具体可以包括步骤621-步骤623:

步骤621:对第一对象的第i个单元集合与第二对象的第i个单元集合之间的交集进行词汇个数统计,得到第i个单元方式对应的交集词汇个数,以使“第i个单元方式对应的交集词汇个数”用于表示第一对象的第i个单元集合与第二对象的第i个单元集合之间所共有的词汇个数。

步骤622:对第二对象的第i个单元集合进行词汇个数统计,得到第i个单元方式对应的待比对词汇个数,以使该“第i个单元方式对应的待比对词汇个数”用于表示该第二对象的第i个单元集合所包括的词汇个数。

步骤623:根据第i个单元方式对应的交集词汇个数与该第i个单元方式对应的待比对词汇个数之间的比值,确定该第i个单元方式对应的内容覆盖度。

本申请实施例中,在获取到第i个单元方式对应的交集词汇个数与该第i个单元方式对应的待比对词汇个数之后,可以根据第i个单元方式对应的交集词汇个数与该第i个单元方式对应的待比对词汇个数之间的比值,确定该第i个单元方式对应的内容覆盖度(例如,将第i个单元方式对应的交集词汇个数与该第i个单元方式对应的待比对词汇个数之间的比值,确定为该第i个单元方式对应的内容覆盖度)。

基于上述步骤62的相关内容可知,在获取到第一对象的第i个单元集合与第二对象的第i个单元集合之后,可以先确定第一对象的第i个单元集合与第二对象的第i个单元集合之间的交集;再参考该交集以及该第二对象的第i个单元集合,确定第i个单元方式对应的内容覆盖度。

步骤63:根据第1个单元方式对应的内容覆盖度至第I个单元方式对应的内容覆盖度之间的平均值,确定第一对象对第二对象的内容覆盖度。

本申请实施例中,在获取到第1个单元方式对应的内容覆盖度至第I个单元方式对应的内容覆盖度之后,可以根据该I个单元方式对应的内容覆盖度之间的平均值,确定第一对象对第二对象的内容覆盖度(如公式(2)所示)。

式中,coverscore(Obj1,Obj2)表示第一对象对第二对象的内容覆盖度;Obj1表示第一对象;Obj2表示第二对象;gramsi(Obj1)表示第一对象的第i个单元集合;gramsi(Obj2)表示第二对象的第i个单元集合;i为正整数,i≤I,I为正整数,I表示划分方式的个数。

基于上述步骤61至步骤63的相关内容可知,本申请实施例中,可以借助I种划分方式实现针对第一对象与第二对象之间的文本内容对比,得到该第一对象对第二对象的内容覆盖度,以使该内容覆盖度能够更准确地表示出该第一对象所携带的文本信息针对该第二对象所携带的文本信息所达到的覆盖程度,如此有利于提高内容覆盖度的准确性。

另外,为了进一步提高上述“长度比对得分”的准确性,本申请实施例还提供了确定“待使用识别文本段与待使用标准文本段之间的长度比对得分”的一种可能的实施方式,其具体可以包括步骤71-步骤73:

步骤71:根据待使用识别文本段的文本长度与待使用标准文本段的文本长度之间的比值,确定第一待使用比值。

本申请实施例不限定步骤71的实施方式,例如,其具体可以为:将待使用识别文本段的文本长度与待使用标准文本段的文本长度之间的比值,确定为第一待使用比值。

步骤72:根据待使用标准文本段的文本长度与待使用识别文本段的文本长度之间的比值,确定第二待使用比值。

本申请实施例不限定步骤72的实施方式,例如,其具体可以为:将待使用标准文本段的文本长度与待使用识别文本段的文本长度之间的比值,确定第二待使用比值。

步骤73:对第一待使用比值和第二待使用比值进行预设数据处理,得到待使用识别文本段与待使用标准文本段之间的长度比对得分。

其中,“预设数据处理”可以预先设定;而且本申请实施例不限定“预设数据处理”,其具体可以为取最小值处理、取最大值处理、或者取平均值处理等。

另外,本申请实施例不限定步骤73的实施方式,例如,其具体可以为:将第一待使用比值和第二待使用比值中最小值,确定为待使用识别文本段与待使用标准文本段之间的长度比对得分。

基于上述步骤71至步骤73的相关内容可知,在一些情况下,可以综合参考待使用识别文本段的文本长度与待使用标准文本段的文本长度之间的比值、以及待使用标准文本段的文本长度与待使用识别文本段的文本长度之间的比值,确定待使用识别文本段与待使用标准文本段之间的长度比对得分,以使该长度比对得分能够更好地表示出待使用识别文本段与待使用标准文本段之间的长度相似程度。

另外,为了进一步提高切分得分的准确性,除了可以参考上述“文本比对结果”以外,可以还参考上述“待评分点对”所包括的两个切分点之间的局部信息相似性。基于此,本申请实施例还提供了上述“步骤42”的另一种可能的实施方式,其具体可以包括:根据至少一个待比对文本对的文本比对结果和待评分点对的邻近词汇比对结果,确定该待评分点对的切分得分。

其中,“待评分点对的邻近词汇比对结果”用于表示该待评分点对所包括的两个切分点之间的局部信息相似性。

另外,本申请实施例不限定“待评分点对的邻近词汇比对结果”的确定过程,例如,当待评分点对包括第一识别切分点和第一标准切分点时,可以根据该第一识别切分点的至少一个邻近词汇与该第一标准切分点的至少一个邻近词汇之间的内容比对得分,确定该待评分点对的邻近词汇比对结果。

“第一识别切分点”用于表示针对待切分识别文本对象进行切分处理时所需参考的切分位置。

“第一标准切分点”用于表示针对待切分标准文本对象进行切分处理时所需参考的切分位置。

“第一识别切分点的至少一个邻近词汇”是指在待切分识别文本对象中距离该第一识别切分点比较近的至少一个词汇;而且本申请实施例不限定“第一识别切分点的至少一个邻近词汇”,例如,其具体可以包括该第一识别切分点的R个左近邻词汇和该第一识别切分点的R个右近邻词汇。其中,“左近邻词汇”是指在待切分识别文本对象中位于该第一识别切分点左边且距离该第一识别切分点比较近的词汇。“右近邻词汇”是指在待切分识别文本对象中位于该第一识别切分点右边且距离该第一识别切分点比较近的词汇。其中,R为正整数。

“第一标准切分点的至少一个邻近词汇”是指在待切分标准文本对象中距离该第一标准切分点比较近的至少一个词汇;而且本申请实施例不限定“第一标准切分点的至少一个邻近词汇”,例如,其具体可以包括该第一标准切分点的R个左近邻词汇和该第一标准切分点的R个右近邻词汇。其中,“左近邻词汇”是指在待切分标准文本对象中位于该第一标准切分点左边且距离该第一标准切分点比较近的词汇。“右近邻词汇”是指在待切分标准文本对象中位于该第一标准切分点右边且距离该第一标准切分点比较近的词汇。其中,R为正整数。

“第一识别切分点的至少一个邻近词汇与该第一标准切分点的至少一个邻近词汇之间的内容比对得分”用于表示该“第一识别切分点的至少一个邻近词汇”与该“第一标准切分点的至少一个邻近词汇”之间的内容相似程度。

另外,本申请实施例不限定“第一识别切分点的至少一个邻近词汇与该第一标准切分点的至少一个邻近词汇之间的内容比对得分”的确定过程,而且该确定过程类似于上文所示的“待使用识别文本段与待使用标准文本段之间的内容比对得分”的确定过程。

为了便于理解,下面结合示例进行说明。

作为示例,当上述“至少一个邻近词汇”包括至少一个左近邻词汇和至少一个右近邻词汇时,上述“第一识别切分点的至少一个邻近词汇与该第一标准切分点的至少一个邻近词汇之间的内容比对得分”的确定过程,具体可以包括步骤81-步骤83:

步骤81:根据第一识别切分点的至少一个左近邻词汇对第一标准切分点的至少一个左近邻词汇的内容覆盖度、第一识别切分点的至少一个邻近词汇对第一标准切分点的至少一个左近邻词汇的内容覆盖度、第一标准切分点的至少一个左近邻词汇对第一识别切分点的至少一个左近邻词汇的内容覆盖度、第一标准切分点的至少一个邻近词汇对第一识别切分点的至少一个左近邻词汇的内容覆盖度,确定左近邻词汇比对得分。

其中,“左近邻词汇比对得分”用于表示第一识别切分点的至少一个左近邻词汇与第一标准切分点的至少一个左近邻词汇之间的内容相似度。

需要说明的是,步骤81的实现方式类似于上述“待使用识别文本段与待使用标准文本段之间的内容比对得分”的确定过程。

步骤82:根据第一识别切分点的至少一个右近邻词汇对第一标准切分点的至少一个右近邻词汇的内容覆盖度、第一识别切分点的至少一个邻近词汇对第一标准切分点的至少一个右近邻词汇的内容覆盖度、第一标准切分点的至少一个右近邻词汇对第一识别切分点的至少一个右近邻词汇的内容覆盖度、第一标准切分点的至少一个邻近词汇对第一识别切分点的至少一个右近邻词汇的内容覆盖度,确定右近邻词汇比对得分。

其中,“右近邻词汇比对得分”用于表示第一识别切分点的至少一个右近邻词汇与第一标准切分点的至少一个右近邻词汇之间的内容相似度。

需要说明的是,步骤82的实现方式类似于上述“待使用识别文本段与待使用标准文本段之间的内容比对得分”的确定过程。

步骤83:根据左近邻词汇比对得分与右近邻词汇比对得分之间的平均值,确定第一识别切分点的至少一个邻近词汇与第一标准切分点的至少一个邻近词汇之间的内容比对得分。

本申请实施例中,在获取到左近邻词汇比对得分与右近邻词汇比对得分之后,可以根据该左近邻词汇比对得分与该右近邻词汇比对得分之间的平均值,确定上述“第一识别切分点的至少一个邻近词汇与第一标准切分点的至少一个邻近词汇之间的内容比对得分”(例如,可以直接将该左近邻词汇比对得分与该右近邻词汇比对得分之间的平均值,确定为上述“第一识别切分点的至少一个邻近词汇与第一标准切分点的至少一个邻近词汇之间的内容比对得分”),以使该内容比对得分能够更准确地表示出该“第一识别切分点的至少一个邻近词汇”与该“第一标准切分点的至少一个邻近词汇”之间的内容相似程度。

基于上述“待评分点对的邻近词汇比对结果”的相关内容可知,对于包括第一识别切分点和第一标准切分点的待评分点对来说,可以依据该该第一识别切分点的至少一个邻近词汇与该第一标准切分点的至少一个邻近词汇之间的内容比对得分,确定该待评分点对的邻近词汇比对结果,以使该邻近词汇比对结果能够准确地表示出该待评分点对所包括的两个切分点之间的局部信息相似性。

此外,本申请实施例不限定上述“待评分点对的切分得分”的确定过程,为了便于理解,下面结合示例进行说明。

作为示例,当上述“至少一个待比对文本对”包括第一文本对(A,B)和第二文本对“至少一个待比对文本对的文本比对结果”包括A与B之间的内容比对得分、A与B之间的长度比对得分、之间的内容比对得分、以及之间的长度比对得分时,该“待评分点对的切分得分”的确定过程具体可以包括步骤91-步骤99:

步骤91:将“A与B之间的内容比对得分”与“之间的内容比对得分”进行平均值处理,得到待评分点对的切分文本关联得分(如公式(3)所示)。

式中,Relevancescore(pointiden,pointnorl)表示待评分点对的切分文本关联得分;(pointiden,pointnorl)表示待评分点对;pointiden表示上文“第一识别切分点”;pointnorl表示上文“第一标准切分点”;textscore(A,B)表示上述“A与B之间的内容比对得分”;表示上述“之间的内容比对得分”;A与是指通过将上述“待切分识别文本对象”按照pointiden进行切分处理得到的两个文本段;B与是指通过将上述“待切分标准文本对象”按照pointnorl进行切分处理得到的两个文本段。

步骤92:将“A与B之间的长度比对得分”与“之间的长度比对得分”进行平均值处理,得到待评分点对的切分长度惩罚值(如公式(4)-(6)所示)。

式中,Lenscore(pointiden,pointnorl)表示待评分点对的切分长度惩罚值;(pointiden,pointnorl)表示待评分点对;pointiden表示上文“第一识别切分点”;pointnorl表示上文“第一标准切分点”;lengthscore(A,B)表示上述“A与B之间的长度比对得分”;表示上述“之间的长度比对得分”;len(A)表示A的文本长度;len(B)表示表示B的文本长度;表示的文本长度;表示表示的文本长度;A与是指通过将上述“待切分识别文本对象”按照pointiden进行切分处理得到的两个文本段;B与是指通过将上述“待切分标准文本对象”按照pointnorl进行切分处理得到的两个文本段。

步骤93:将待评分点对的邻近词汇比对结果,确定为待评分点对的局部相似得分(如公式(7)所示)。

式中,localscore(pointiden,pointnorl)表示待评分点对的局部相似得分(也就是,待评分点对的邻近词汇比对结果);(pointiden,pointnorl)表示待评分点对;pointiden表示上文“第一识别切分点”;pointnorl表示上文“第一标准切分点”;表示上文“左近邻词汇比对得分”;表示上文“右近邻词汇比对得分”;表示第一识别切分点的至少一个左近邻词汇;表示第一标准切分点的至少一个左近邻词汇;表示第一识别切分点的至少一个右近邻词汇;表示第一标准切分点的至少一个右近邻词汇。

步骤94:将待评分点对的切分文本关联得分、待评分点对的切分长度惩罚值以及待评分点对的局部相似得分进行加权求和,得到该待评分点对的切分得分(如公式(8)所示)。

Score(pointiden,pointnorl)=α×Relevancescore(pointiden,pointnorl)+β×Lenscore(pointiden,pointnorl)+γ×localscore(pointiden,pointnorl) (8)

式中,Score(pointiden,pointnorl)表示待评分点对的切分得分;Relevancescore(pointiden,pointnorl)表示待评分点对的切分文本关联得分;α表示待评分点对的切分文本关联得分所对应的加权权重;Lenscore(pointiden,pointnorl)表示待评分点对的切分长度惩罚值;β表示待评分点对的切分长度惩罚值所对应的加权权重;localscore(pointiden,pointnorl)表示待评分点对的局部相似得分;γ表示待评分点对的局部相似得分所对应的加权权重。需要说明的是,α、β、以及γ均可以预先根据应用场景设定。

基于上述步骤91至步骤94的相关内容可知,在一些情况下,对于待评分点对来说,在利用该待评分点对针对待切分识别文本对象和待切分标准文本对象进行切分处理,得到至少一个待比对文本对之后,可以参考该至少一个待比对文本对的文本比对结果、以及该待评分点对的邻近词汇比对结果,确定该待评分点对的切分得分,以使该待评分点对的切分得分能够准确地表示出该待评分点对被用于进行后续切分处理的可能性。

实际上,为了进一步提高切分得分的准确性,可以遍历待切分识别文本对象的至少一个第三切分文本段与待切分标准文本对象的至少一个第四切分文本段之间的各种可能组合,得到上述“至少一个待比对文本对”。基于此,本申请实施例还提供了确定“待评分点对的切分得分”的一种可能的实施方式,其具体可以包括步骤101-步骤105:

步骤101:利用待评分点对,对待切分识别文本对象和待切分标准文本对象进行切分处理,得到该待切分识别文本对象的至少一个第三切分文本段和该待切分标准文本对象的至少一个第四切分文本段。

需要说明的是,“待切分识别文本对象的至少一个第三切分文本段”与“待切分标准文本对象的至少一个第四切分文本段”的相关内容请参见上文步骤41的相关内容。

步骤102:按照第二组合规则,将待切分识别文本对象的至少一个第三切分文本段和该待切分标准文本对象的至少一个第四切分文本段进行组合处理,得到至少一个待比对文本对。

其中,“第二组合规则”可以预先设定;而且该“第二组合规则”可以是遍历上述“待切分识别文本对象的至少一个第三切分文本段”与上述“待切分标准文本对象的至少一个第四切分文本段”之间的各种可能组合。为了便于理解,下面结合示例进行说明。

作为示例,若待切分识别文本对象被切分为2个第三切分文本段,且待切分标准文本对象被切分为2个第四切分文本段,则该“第二组合规则”具体可以为:将上述“2个第三切分文本段”中位置比较靠前的第三切分文本段与上述“2个第四切分文本段”中位置比较靠前的第四切分文本段进行组合,得到第一个待比对文本对;将上述“2个第三切分文本段”中位置比较靠前的第三切分文本段与上述“2个第四切分文本段”中位置比较靠后的第四切分文本段进行组合,得到第二个待比对文本对;将上述“2个第三切分文本段”中位置比较靠后的第三切分文本段与上述“2个第四切分文本段”中位置比较靠后的第四切分文本段进行组合,得到第三个待比对文本对;将上述“2个第三切分文本段”中位置比较靠后的第三切分文本段与上述“2个第四切分文本段”中位置比较靠前的第四切分文本段进行组合,得到第四个待比对文本对。

步骤103:将至少一个待比对文本对按照预设组合方式进行组合处理,得到至少一个待处理组合。其中,待处理组合包括至少一个所述待比对文本对。

其中,“预设组合方式”可以预先设定;而且本申请实施例不限定“预设组合方式”,例如,其具体可以为保证每个待处理组合能够覆盖待切分识别文本对象所携带的文本信息以及待切分标准文本对象所携带的文本信息。为了便于理解,下面结合示例进行说明。

作为示例,当待切分识别文本对象被切分为A和待切分标准文本对象被切分为B和且上述“至少一个待比对文本对”包括第一文本对(A,B)、第二文本对第三文本对以及第四文本对时,可以将第一文本对(A,B)与第二文本对进行组合,得到一个待处理组合;并将第三文本对与第四文本对进行组合,得到另一个待处理组合。

基于上述步骤103的相关内容可知,在获取到至少一个待比对文本对之后,可以按照预设组合方式,对这些待比对文本对进行组合处理,得到至少一个待处理组合,以使各个待处理组合包括至少一个待比对文本对,以便后续能够基于这些待处理组合,确定上述“待评分点对的切分得分”。

步骤104:根据至少一个待比对文本对的文本比对结果,确定至少一个待处理组合的组合得分。

其中,“待处理组合的组合得分”用于表示由该待处理组合所呈现的该待评分点对被用于进行后续切分处理的可能性。

另外,本申请实施例不限定“待处理组合的组合得分”的确定过程,而且该“待处理组合的组合得分”的确定过程类似于上文所示的“待评分点对的切分得分”的确定过程。为了便于理解,下面结合两个示例进行说明,

示例1,当待处理组合包括第一待处理文本对和第二待处理文本对时,该待处理组合的组合得分的确定过程,具体可以包括:根据第一待处理文本对的文本比对结果和第二待处理文本对的文本比对结果,确定待处理组合的组合得分。

需要说明的是,示例1所示的“待处理组合的组合得分的确定过程”类似于上文所示的“根据至少一个待比对文本对的文本比对结果,确定待评分点对的切分得分”的过程。

示例2,当待处理组合包括第一待处理文本对和第二待处理文本对时,该待处理组合的组合得分的确定过程,具体可以包括:根据第一待处理文本对的文本比对结果、第二待处理文本对的文本比对结果、以及待评分点对的邻近词汇比对结果,确定待处理组合的组合得分。

需要说明的是,示例2所示的“待处理组合的组合得分的确定过程”类似于上文所示的“根据至少一个待比对文本对的文本比对结果和待评分点对的邻近词汇比对结果,确定所述待评分点对的切分得分”的过程。

步骤105:对至少一个待处理组合的组合得分进行预设统计分析处理,得到待评分点对的切分得分。

其中,“预设统计分析处理”可以预先设定;而且本申请实施例不限定“预设统计分析处理”,例如,其可以为求和处理、求平均值处理、取最大值处理、或者取最小值处理等。

基于上述步骤101至步骤105的相关内容可知,在一些情况下,可以通过遍历待切分识别文本对象的至少一个第三切分文本段与待切分标准文本对象的至少一个第四切分文本段之间的各种可能组合的方式,来计算待评分点对的切分得分,以使该“待评分点对的切分得分”能够更准确地表示出该待评分点对被用于进行后续切分处理的可能性。

另外,为了改善文本对应关系的构建效果,本申请实施例还提供更新上述“语音识别文本与所述标准语音文本之间的文本对应关系”的一种可能的实施方式,为了便于理解,下面结合示例进行说明。

作为示例,当上述“至少一个文本对”包括目标文本对,且该目标文本对包括目标识别文本段和目标标准文本段时,则上述“语音识别文本与所述标准语音文本之间的文本对应关系”的更新过程可以包括步骤111-步骤112:

步骤111:建立目标识别文本段与目标标准文本段之间的对应关系。

步骤112:将目标识别文本段与目标标准文本段之间的对应关系添加至上述“语音识别文本与所述标准语音文本之间的文本对应关系”。

基于上述步骤111至步骤112的相关内容可知,在获取到至少一个文本对(例如,第一文本对(A,B)与第二文本对)之后,可以将各个文本对所包括的文本数据之间建立对应关系,并将这些对应关系添加至上述“语音识别文本与所述标准语音文本之间的文本对应关系”,以使该上述“语音识别文本与所述标准语音文本之间的文本对应关系”中能够记录这些文本对所表示的文本数据对应关系。

另外,为了改善文本对应关系的表达效果,本申请实施例还提供了步骤112的一种可能的实施方式,其具体可以包括步骤121-步骤122:

步骤121:若上述“语音识别文本与所述标准语音文本之间的文本对应关系”中存在第一待切分文本与第二待切分文本之间的对应关系,则将该第一待切分文本与该第二待切分文本之间的对应关系从该“语音识别文本与所述标准语音文本之间的文本对应关系”中进行删除,并将目标识别文本段与目标标准文本段之间的对应关系添加至该“语音识别文本与所述标准语音文本之间的文本对应关系”。

步骤122:若上述“语音识别文本与所述标准语音文本之间的文本对应关系”中不存在第一待切分文本与第二待切分文本之间的对应关系,则将目标识别文本段与目标标准文本段之间的对应关系添加至该“语音识别文本与所述标准语音文本之间的文本对应关系”。

基于上述步骤121至步骤122的相关内容可知,因上述“至少一个文本对”是通过针对第一待切分文本与第二待切分文本进行切分处理得到的,使得上述“至少一个文本对”所记录的文本数据对应关系能够更准确地表示出上述“第一待切分文本与第二待切分文本之间的对应关系”,故在获取到该目标文本对所记录的文本数据对应关系之后,利用上述“至少一个文本对”所记录的文本数据对应关系替换上述“语音识别文本与所述标准语音文本之间的文本对应关系”中已存在的“第一待切分文本与第二待切分文本之间的对应关系”,如此能够在保证该文本对应关系准确性比较高的前提下简化该文本对应关系,如此有利于提高该文本对应关系的表达效果。

另外,为了改善文本对应关系的构建效果,本申请实施例还提供更新上述“第一待切分文本和第二待切分文本”的一种可能的实施方式,为了便于理解,下面结合示例进行说明。

作为示例,当上述“至少一个文本对”包括目标文本对,且该目标文本对包括目标识别文本段和目标标准文本段时,则上述“第一待切分文本和第二待切分文本”的更新过程,具体可以包括:根据该目标识别文本段确定第一待切分文本,并根据该目标标准文本段确定第二待切分文本。

也就是,在获取到目标文本对之后,可以将该目标文本对中的目标识别文本段确定为第一待切分文本,并将该目标文本对中的目标标准文本段确定为第二待切分文本,以便后续能够执行针对上述“目标识别文本段和目标标准文本段”的切分处理过程以及文本对应关系的构建过程。

可见,在一些情况下,对于上述“至少一个文本对”(例如,第一文本对(A,B)与第二文本对)来说,可以利用各个文本对所包括的文本数据,更新第一待切分文本和第二待切分文本,以便后续能够实现针对各个文本对所包括的文本数据的切分处理过程以及文本对应关系的构建过程,如此能够有效地提高文本对应关系的完整性。

另外,为了提高文本对的准确性,本申请实施例还提供了确定上述“至少一个文本对”的一种可能的实施方式,为了便于理解,下面结合示例进行说明。

作为示例,当上述“待使用点对”包括第二识别切分点和第二标准切分点,且上述“至少一个文本对”包括第一文本对(A,B)和第二文本对时,该“至少一个文本对”的确定过程,包括步骤131-步骤134:

步骤131:利用第二识别切分点,对第一待切分文本进行切分处理,得到前段识别文本A和后段识别文本

步骤132:利用第二标准切分点,对第二待切分文本进行切分处理,得到前段标准文本B和后段标准文本

步骤133:根据前段识别文本A和前段标准文本B,确定第一文本对(A,B)。

步骤134:根据后段识别文本和后段标准文本确定第二文本对

基于上述步骤131至步骤134的相关内容可知,在一些情况下,在利用待使用点对对语音识别文本和标准语音文本进行切分处理,得到该语音识别文本的至少一个第一切分文本段和标准语音文本的至少一个第二切分文本段之后,可以将该至少一个第一切分文本段与该至少一个第二切分文本段按照上述“第一组合规则”进行组合,得到上述“至少一个文本对”。

另外,为了提高文本对的多样性,本申请实施例还提供了确定上述“至少一个文本对”的一种可能的实施方式,为了便于理解,下面结合示例进行说明。

作为示例,当上述“待使用点对”包括第二识别切分点和第二标准切分点,且上述“至少一个文本对”包括第一文本对(A,B)、第二文本对第三文本对以及第四文本对时,该“至少一个文本对”的确定过程,包括步骤141-步骤146:

步骤141:利用第二识别切分点,对第一待切分文本进行切分处理,得到前段识别文本A和后段识别文本

步骤142:利用第二标准切分点,对第二待切分文本进行切分处理,得到前段标准文本B和后段标准文本

步骤143:根据前段识别文本A和前段标准文本B,确定第一文本对(A,B)。

步骤144:根据后段识别文本和后段标准文本确定第二文本对

步骤145:根据后段识别文本和前段标准文本B,确定第三文本对

步骤146:根据前段识别文本A和后段标准文本确定第四文本对

基于上述步骤141至步骤146的相关内容可知,在一些情况下,在利用待使用点对对语音识别文本和标准语音文本进行切分处理,得到该语音识别文本的至少一个第一切分文本段和标准语音文本的至少一个第二切分文本段之后,可以将该至少一个第一切分文本段与该至少一个第二切分文本段按照上述“第二组合规则”进行组合,得到上述“至少一个文本对”,以使该“至少一个文本对”能够遍历上述“语音识别文本的至少一个第一切分文本段”与上述“标准语音文本的至少一个第二切分文本段”之间的各种可能的组合。

此外,为了进一步提高文本对应关系的准确性,本申请实施例还提供了确定上述“语音识别文本与所述标准语音文本之间的文本对应关系”的一种可能的实施方式,其具体可以包括步骤151-步骤152:

步骤151:将上述“至少一个文本对”按照预设组合方式进行组合处理,确定至少一个候选组合。其中,候选组合包括至少一个文本对。

需要说明的是,“至少一个候选组合”的确定过程类似于上文“至少一个待处理组合”的确定过程

步骤152:利用至少一个候选组合中的待使用组合,确定语音识别文本与标准语音文本之间的文本对应关系。

其中,“待使用组合”是指用于更精确地描述语音识别文本与标准语音文本之间的文本对应关系时所需使用的文本数据;而且本申请实施例不限定“待使用组合”的确定过程,例如,该“待使用组合”的确定过程具体可以包括:从上述“至少一个候选组合”中随机选择一个候选组合,确定为待使用组合。又如,该“待使用组合”的确定过程具体可以包括:从上述“至少一个候选组合”中选择组合得分最高的候选组合,确定为待使用组合。

需要说明的是,候选组合的组合得分的确定过程类似于上文“待处理组合的组合得分”的确定过程。

基于上述步骤151至步骤152的相关内容可知,若上述“至少一个文本对”能够遍历上述“语音识别文本的至少一个第一切分文本段”与上述“标准语音文本的至少一个第二切分文本段”之间的各种可能的组合,则可以从这些文本对中查找具有最高组合得分的一组文本对,以便后续能够利用该组文本对所记录的文本数据对应关系,确定语音识别文本与标准语音文本之间的文本对应关系。

为了便于理解本申请实施例提供的文本对应关系构建方法,下面以图2所示的文本对应关系构建过程为例进行说明。其中,图2为本申请实施例提供的一种文本对应关系构建过程的示意图。

作为示例,在图2中,“TD”表示上述“语音识别文本”,“TS”表示上述“语音识别文本对应的标准语音文本”,“TC1”表示文本对1,“TC2”表示文本对2,“TC3”表示文本对3,“TC4”表示文本对4,“TC5”表示文本对5,“TC6”表示文本对6。需要说明的是,在图2中,“TD”中出现的各个黑色长方形均表示能够针对该“TD”进行切分处理的切分点。

如图2所示,在获取到语音识别文本TD以及该语音识别文本对应的标准语音文本TS之后,可以先利用该TD以及TS,执行一轮针对文本对应关系的迭代更新过程,得到TC1和TC2;再针对TC1所包括的两个文本段,执行一轮针对文本对应关系的迭代更新过程,得到TC3和TC4,并针对TC2所包括的两个文本段,也执行一轮针对文本对应关系的迭代更新过程,得到TC5和TC6,以使因TC3、TC4、以及TC6中均存在单句文本段,故可以确定已达到上述“预设停止条件”,从而可以确定结束“针对文本对应关系的迭代更新过程”,此时,得到针对“TD以及TS”构建好的文本对应关系(也就是,由TC3、TC4、TC5、以及TC6所示的文本对应关系)。

基于上述方法实施例提供的文本对应关系构建方法,本申请实施例还提供了一种文本对应关系构建装置,下面结合附图进行解释和说明。需要说明的是,装置实施例提供的文本对应关系构建装置的技术详情,请参照上述方法实施例。

参见图3,该图为本申请实施例提供的一种文本对应关系构建装置的结构示意图。

本申请实施例提供的文本对应关系构建装置300,包括:

点对确定单元301,用于在获取到语音识别文本和所述语音识别文本对应的标准语音文本之后,根据所述语音识别文本的至少一个第一切分点和所述标准语音文本的至少一个第二切分点,确定至少一个切分点对;其中,所述切分点对包括一个所述第一切分点和一个所述第二切分点;

文本切分单元302,用于利用所述至少一个切分点对中的待使用点对,对所述语音识别文本和所述标准语音文本进行切分处理,得到至少一个文本对;

关系确定单元303,用于根据所述至少一个文本对,确定所述语音识别文本与所述标准语音文本之间的文本对应关系。

在一种可能的实施方式中,所述点对确定单元301,具体用于:在获取到语音识别文本和所述语音识别文本对应的标准语音文本之后,根据所述语音识别文本和所述标准语音文本,分别确定第一待切分文本和第二待切分文本;根据所述第一待切分文本的至少一个第三切分点和所述第二待切分文本的至少一个第四切分点,确定至少一个切分点对;其中,所述切分点对包括一个所述第三切分点和一个所述第四切分点;

所述文本切分单元302,具体用于:利用所述至少一个切分点对中的待使用点对,对所述第一待切分文本和所述第二待切分文本进行切分处理,得到至少一个文本对;

所述关系确定单元303,具体用于:根据所述至少一个文本对,更新所述语音识别文本与所述标准语音文本之间的文本对应关系;根据所述至少一个文本对,更新所述第一待切分文本以及所述第二待切分文本,并返回所述点对确定单元301继续执行所述根据所述第一待切分文本的至少一个第三切分点和所述第二待切分文本的至少一个第四切分点,确定至少一个切分点对的步骤,直至达到预设停止条件。

在一种可能的实施方式中,所述待使用点对的确定过程,包括:根据所述待切分识别文本对象、所述待切分标准文本对象和各个所述切分点对,分别确定各个所述切分点对的切分得分;根据所述至少一个切分点对的切分得分,从所述至少一个切分点对中查找满足预设查找条件的切分点对,得到所述待使用点对。

在一种可能的实施方式中,所述至少一个切分点对包括待评分点对;所述待评分点对的切分得分的确定过程,包括:利用所述待评分点对,对所述待切分识别文本对象和所述待切分标准文本对象进行切分处理,得到至少一个待比对文本对;根据所述至少一个待比对文本对的文本比对结果,确定所述待评分点对的切分得分。

在一种可能的实施方式中,所述至少一个待比对文本对包括待使用文本段对,所述待使用文本段对包括待使用识别文本段和待使用标准文本段;所述目标文本段对的文本比对结果包括所述待使用识别文本段与所述待使用标准文本段之间的内容比对得分、和/或所述待使用识别文本段与所述待使用标准文本段之间的长度比对得分。

在一种可能的实施方式中,所述待使用识别文本段与所述待使用标准文本段之间的内容比对得分的确定过程,包括:根据所述待使用识别文本段对所述待使用标准文本段的内容覆盖度、所述待切分识别文本对象对所述待使用标准文本段的内容覆盖度、所述待使用标准文本段对所述待使用识别文本段的内容覆盖度、以及所述待切分标准文本对象对所述待使用识别文本段的内容覆盖度,确定所述待使用识别文本段与所述待使用标准文本段之间的内容比对得分。

在一种可能的实施方式中,所述待使用识别文本段与所述待使用标准文本段之间的内容比对得分的确定过程,包括:根据所述待使用识别文本段对所述待使用标准文本段的内容覆盖度与所述待切分识别文本对象对所述待使用标准文本段的内容覆盖度之间的比值,确定所述待使用标准文本段对应的内容被覆盖得分;根据所述待使用标准文本段对所述待使用识别文本段的内容覆盖度与所述待切分标准文本对象对所述待使用识别文本段的内容覆盖度之间的比值,确定所述待使用识别文本段对应的内容被覆盖得分;根据所述待使用标准文本段对应的内容被覆盖得分与所述待使用识别文本段对应的内容被覆盖得分之间的乘积,确定所述待使用识别文本段与所述待使用标准文本段之间的内容比对得分。

在一种可能的实施方式中,所述内容覆盖度的确定过程,包括:按照第i种划分方式,分别对第一对象和第二对象进行单元划分处理,得到所述第一对象的第i个单元集合和所述第二对象的第i个单元集合;其中,所述第i个单元方式是以i个词汇作为一个划分单元进行划分处理的;i为正整数,i≤I,I为正整数,I表示所述划分方式的个数;根据所述第一对象的第i个单元集合与所述第二对象的第i个单元集合之间的交集、以及所述第二对象的第i个单元集合,确定所述第i个单元方式对应的内容覆盖度;其中,i为正整数,i≤I,I为正整数,I表示所述划分方式的个数;根据第1个单元方式对应的内容覆盖度至第I个单元方式对应的内容覆盖度之间的平均值,确定所述第一对象对所述第二对象的内容覆盖度。

在一种可能的实施方式中,所述第i个单元方式对应的内容覆盖度的确定过程,包括:对所述第一对象的第i个单元集合与所述第二对象的第i个单元集合之间的交集进行词汇个数统计,得到所述第i个单元方式对应的交集词汇个数;对所述第二对象的第i个单元集合进行词汇个数统计,得到所述第i个单元方式对应的待比对词汇个数;根据所述第i个单元方式对应的交集词汇个数与所述第i个单元方式对应的待比对词汇个数之间的比值,确定所述第i个单元方式对应的内容覆盖度。

在一种可能的实施方式中,所述待使用识别文本段与所述待使用标准文本段之间的长度比对得分的确定过程,包括:根据所述待使用识别文本段的文本长度与所述待使用标准文本段的文本长度之间的比值,确定第一待使用比值;根据所述待使用标准文本段的文本长度与所述待使用识别文本段的文本长度之间的比值,确定第二待使用比值;对所述第一待使用比值和所述第二待使用比值进行预设数据处理,得到所述待使用识别文本段与所述待使用标准文本段之间的长度比对得分。

在一种可能的实施方式中,所述待评分点对的切分得分的确定过程,包括:根据所述至少一个待比对文本对的文本比对结果和所述待评分点对的邻近词汇比对结果,确定所述待评分点对的切分得分。

在一种可能的实施方式中,所述待评分点对包括第一识别切分点和第一标准切分点,且所述待评分点对的邻近词汇比对结果是根据所述第一识别切分点的至少一个邻近词汇与所述第一标准切分点的至少一个邻近词汇之间的内容比对得分确定的。

在一种可能的实施方式中,所述至少一个邻近词汇包括至少一个左近邻词汇和至少一个右近邻词汇,所述第一识别切分点的至少一个邻近词汇与所述第一标准切分点的至少一个邻近词汇之间的内容比对得分的确定过程,包括:根据所述第一识别切分点的至少一个左近邻词汇对所述第一标准切分点的至少一个左近邻词汇的内容覆盖度、所述第一识别切分点的至少一个邻近词汇对所述第一标准切分点的至少一个左近邻词汇的内容覆盖度、所述第一标准切分点的至少一个左近邻词汇对所述第一识别切分点的至少一个左近邻词汇的内容覆盖度、所述第一标准切分点的至少一个邻近词汇对所述第一识别切分点的至少一个左近邻词汇的内容覆盖度,确定左近邻词汇比对得分;根据所述第一识别切分点的至少一个右近邻词汇对所述第一标准切分点的至少一个右近邻词汇的内容覆盖度、所述第一识别切分点的至少一个邻近词汇对所述第一标准切分点的至少一个右近邻词汇的内容覆盖度、所述第一标准切分点的至少一个右近邻词汇对所述第一识别切分点的至少一个右近邻词汇的内容覆盖度、所述第一标准切分点的至少一个邻近词汇对所述第一识别切分点的至少一个右近邻词汇的内容覆盖度,确定右近邻词汇比对得分;根据所述左近邻词汇比对得分与所述右近邻词汇比对得分之间的平均值,确定所述第一识别切分点的至少一个邻近词汇与所述第一标准切分点的至少一个邻近词汇之间的内容比对得分。

在一种可能的实施方式中,所述待评分点对的切分得分的确定过程包括:利用所述待评分点对,对所述待切分识别文本对象和所述待切分标准文本对象进行切分处理,得到至少一个待比对文本对;将所述至少一个待比对文本对按照预设组合方式进行组合处理,得到至少一个待处理组合;其中,所述待处理组合包括至少一个所述待比对文本对;根据所述至少一个待比对文本对的文本比对结果,确定所述至少一个待处理组合的组合得分;对所述至少一个待处理组合的组合得分进行预设统计分析处理,得到所述待评分点对的切分得分。

在一种可能的实施方式中,当所述待处理组合包括第一待处理文本对和第二待处理文本对时,所述待处理组合的组合得分的确定过程,包括:根据所述第一待处理文本对的文本比对结果和所述第二待处理文本对的文本比对结果,确定所述待处理组合的组合得分。

在一种可能的实施方式中,所述至少一个文本对包括目标文本对,且所述目标文本对包括目标识别文本段和目标标准文本段;而且所述文本对应关系的更新过程,包括:建立所述目标识别文本段与所述目标标准文本段之间的对应关系;将所述目标识别文本段与所述目标标准文本段之间的对应关系添加至所述文本对应关系。

在一种可能的实施方式中,所述将所述目标识别文本段与所述目标标准文本段之间的对应关系添加至所述文本对应关系,包括:若所述文本对应关系中存在所述第一待切分文本与所述第二待切分文本之间的对应关系,则将所述第一待切分文本与所述第二待切分文本之间的对应关系从所述文本对应关系中进行删除,并将所述目标识别文本段与所述目标标准文本段之间的对应关系添加至所述文本对应关系;若所述文本对应关系中不存在所述第一待切分文本与所述第二待切分文本之间的对应关系,则将所述目标识别文本段与所述目标标准文本段之间的对应关系添加至所述文本对应关系。

在一种可能的实施方式中,所述至少一个文本对包括目标用文本对,且所述目标文本对包括目标识别文本段和目标标准文本段;而且所述第一待切分文本和所述第二待切分文本的更新过程,包括:根据所述目标识别文本段确定所述第一待切分文本,并根据所述目标标准文本段确定第二待切分文本。

在一种可能的实施方式中,所述待使用点对包括第二识别切分点和第二标准切分点;而且当所述至少一个文本对包括第一文本对和第二文本对时,所述至少一个文本对的确定过程,包括:利用所述第二识别切分点,对所述第一待切分文本进行切分处理,得到前段识别文本和后段识别文本;利用所述第二标准切分点,对所述第二待切分文本进行切分处理,得到前段标准文本和后段标准文本;根据所述前段识别文本和所述前段标准文本,确定所述第一文本对;根据所述后段识别文本和所述后段标准文本,确定所述第二文本对。

在一种可能的实施方式中,所述语音识别文本与所述标准语音文本之间的文本对应关系的确定过程,包括:将所述至少一个文本对按照预设组合方式进行组合处理,确定至少一个候选组合;其中,所述候选组合包括至少一个所述文本对;利用所述至少一个候选组合中的待使用组合,确定所述语音识别文本与所述标准语音文本之间的文本对应关系。

在一种可能的实施方式中,所述文本对应关系构建装置300还包括:

信息获取单元,用于获取待处理语音;对所述待处理语音进行语音识别处理,得到所述语音识别文本;

文本处理单元,用于利用所述文本对应关系,对所述语音识别文本进行预设处理,得到所述待处理语音对应的待使用语音文本。

基于上述文本对应关系构建装置300的相关内容可知,对于文本对应关系构建装置300来说,在获取到语音识别文本和该语音识别文本对应的标准语音文本之后,先根据该语音识别文本的至少一个第一切分点和该标准语音文本的至少一个第二切分点,确定至少一个切分点对,以使各个切分点对均包括一个第一切分点和一个第二切分点;再利用该至少一个切分点对中的待使用点对,对该语音识别文本和该标准语音文本进行切分处理,得到至少一个文本对,以使该至少一个文本对能够准确地表示出语音识别文本中至少一个第一切分文本段与标准语音文本中至少一个第二切分文本段之间的对应关系;最后,根据该至少一个文本对,确定该语音识别文本与该标准语音文本之间的文本对应关系,如此能够实现针对语音识别文本及其对应的标准语音文本之间的文本对应关系进行自动构建处理,从而能够有效地避免手动对齐方式造成的不良影响,从而有利于提高语音数据的处理效果。

进一步地,本申请实施例还提供了一种设备,所述设备包括处理器以及存储器:

所述存储器用于存储计算机程序;

所述处理器用于根据所述计算机程序执行本申请实施例提供的文本对应关系构建方法的任一实施方式。

进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行本申请实施例提供的文本对应关系构建方法的任一实施方式。

进一步地,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行本申请实施例提供的文本对应关系构建方法的任一实施方式。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

39页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:视频处理方法及装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!