模型生成方法、问答质量判断方法、装置、设备及介质

文档序号：830122 发布日期：2021-03-30 浏览：6次 >En<

阅读说明：本技术 模型生成方法、问答质量判断方法、装置、设备及介质 (Model generation method, question and answer quality judgment method, device, equipment and medium ) 是由张新松柴琛林李航于 2020-11-03 设计创作，主要内容包括：本公开实施例公开了一种模型生成方法、答质量判断方法、装置、设备及介质,其中,模型生成方法包括：获取预设数量的问答对样本集合,并对每一个问答对样本集合中样本数据进行分析得到词向量；将所述词向量输入预训练语言模型,得到每一个问答对样本的表示向量；基于所述表示向量确定各问答对样本的预测标签为正确标签的似然概率,并根据所述似然概率中最大值对应的问答对样本的预测标签计算损失函数；当所述损失函数结果满足预设条件时生成问答对质量判断模型。本公开实施例解决了在问答对内容多或者复杂的情况下,问答质量判断的准确性较低的问题,实现了在问答内容复杂的情况下做出问答质量的判断,提高对问答质量判断的准确度。(The embodiment of the disclosure discloses a model generation method, a response quality judgment method, a device, equipment and a medium, wherein the model generation method comprises the following steps: obtaining a preset number of question-answer pair sample sets, and analyzing sample data in each question-answer pair sample set to obtain word vectors; inputting the word vectors into a pre-training language model to obtain the expression vector of each question-answer pair sample; determining the likelihood probability that the prediction label of each question-answer pair sample is a correct label based on the expression vector, and calculating a loss function according to the prediction label of the question-answer pair sample corresponding to the maximum value in the likelihood probability; and generating a question-answer pair quality judgment model when the loss function result meets a preset condition. The method and the device solve the problem that the accuracy of the question and answer quality judgment is low under the condition that the content of the question and answer is large or complex, realize the judgment of the question and answer quality under the condition that the content of the question and answer is complex, and improve the accuracy of the question and answer quality judgment.)

具体实施方式

，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。

图1是本公开实施例一中的模型生成方法的流程图；

图2是本公开实施例二中的模型生成方法的流程图；

图3是本公开实施例二中的问答质量判断模型的结构示意图；

图4是本公开实施例三中的问答质量判断方法的流程图；

图5是本公开实施例四中的模型生成装置的结构示意图；

图6是本公开实施例五中的问答质量判断装置的结构示意图

图7是本公开实施例六中的电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

实施例一

图1示出了本公开实施例一提供的一种模型生成方法的流程图，本公开实施例可适用于基于大量的问答对数据训练问答质量判断模型的情况，该方法可以由模型生成装置实现，具体可通过电子设备中的软件和/或硬件来实施。

如图1所示，本公开实施例中提供的模型生成方法，包括如下步骤：

S110、获取预设数量的问答对样本集合，并对每一个问答对样本集合中样本数据进行分析得到词向量。

具体的，问答对样本数据是指在问答、知识分享等平台中的问题数据和答案数据，针对一个问题可能会有多个回答，一个问题就会有多个答案。那么，该问题便分别与各个答案组成了多个问答对数据。问答对样本数据也可以是书本上的问题与相应的答案，例如，语文书中的课后问题，课后问题的答案包含教案中的标准答案，以及每一个学生给出的相应的答案，一个问题和一个对应的答案就组成一个问答对样本。

在本实施例中的问答对样本是预先经过数据标注的样本，每一个问答对样本都拥有一个答非所问标签或答即所问标签。数据标注的方式包括人工标注，即认为的识别判断一个问答对样本对应的标签，或者是从标准且可信的平台获取问答对对应的标签。

进一步的，在一个样本集合中，所包含的是标签相同的问答对样本。集合中问答对样本的数量可以根据模型生成过程的计算量以及硬件的计算能力，或是模型训练效率等指标综合确定一个数值。在进行问答对样本数据分析时，也是同时对一个样本集合中的多个问答对样本进行分析，类似于批量同步处理。具体的数据分析过程包括：针对每一个问答对样本进行分词，例如，“今天是植树节吗？不是，明天才是”，经过语义分词之后可以得到“今天/是/植树节/吗/不是/明天/才是”。然后，根据分词结果查询预训练语言模型的词表初始化每个词的表示向量，例如“今天”对应的表示向量是“XXXXX”。

其中，预训练语言模型是采用自监督学习的方法，将大量的无监督文本送入到模型中进行学习，即可得到通用的预训练模型，有利于后续的文本语言处理过程，目前，预训练语言模型对应的词表是一个较为成熟的，具有丰富内容的词向量数据库，将分词结果映射到预训练语言模型的词表中，能够获得高频共现世界知识的帮助，有利于对问答对样本语义的理解以及后续问答质量判断。

预训练语言模型包括自回归语言模型以及自编码语言模型，可以根据具体应用场景特征，选择适合的预训练语言模型。在本实施例中，预训练语言模型，可以应用在问答质量判断中。预训练语言模型的目标是利用大规模无标注语料训练、获得文本的包含丰富语义信息的Representation，即文本的语义表示，然后将文本的语义表示在特定自然语言处理任务中作微调，最终应用于该自然语言处理任务。在本实施例中，自然语言处理任务即判断问答对是否为答非作问。

S120、将所述词向量输入预训练语言模型，得到每一个问答对样本的表示向量。

经过了上述步骤中，问答对样本的分子结果到预训练语言模型词表的映射，可以获得分词结果中各中文词的词向量。进而，将每个问答对样本的词向量输入至预训练语言模型，以得到了问答对样本的语义表示向量。

在本实施例中，将问答对中的问题和答案拼接在一起，作为一个整体进行处理，相比于将问题与答案分别进行建模处理，能够更好的捕捉到问题与答案之间的有效词汇依赖，针对较为复杂的答非所问的情况判断，能够有更高的准确性。具体的，“复杂的答非所问情况”即当问题文本和答案文本具有较强相关性的情况。在该情况下，现有技术很难判断是否存在答非所问现象。例如：黑米的功效是什么？紫米是水稻的一个品种，属于糯米类，分紫粳、紫糯两种，一般来说，紫糯米就是黑糯米；而黑米为黑稻加工产品，属于粳米类，粒型有籼、粳两种，且黑米是非糯性稻米。

S130、基于所述表示向量确定各问答对样本的预测标签为正确标签的似然概率，并根据所述似然概率中最大值对应的问答对样本的预测标签计算损失函数。

具体的，可以通过将集合中各个问答对样本的表示向量输入至一个全连接神经网络中，该神经网络的激活函数为Softmax函数。通过全连接神经网络计算出各个问答对样本的预测标签与真实标签相同的概率。

进一步的，可以将一个问答对样本集合中各个问答对样本对应的概率值进行排序，将其中最大概率值对应的问答对作为一个优选的模型训练样本，去调节神经网络的参数。这是由于在进行问答对样本数据标注时，标注成本较高，并且质量难以把控，很多问题是否答非所问需要主观判断。因此，答非所问的训练数据中并不能保证标注的标签是完全正确的，会存在大量的噪音数据，即标注错误的标签。在本实施例中，通过在多个问答对样本中选择预测标签为标注标签的最大概率值对应的问答对样本计算损失函数，进而调整模型参数，可以提升模型效果，在模型训练阶段(即模型生成过程)进行有效的降噪。

S140、当所述损失函数结果满足预设条件时生成问答对质量判断模型。

模型生成的过程，是通过对样本的学习，不断的调整模型参数，以使模型功能达到最优化的状态。具体的，在本实施例中，通过预测结果置信度最高的问答对样本，计算损失函数，直到损失函数收敛于预先设定的数值条件，确定模型参数，即生成问答对质量判断模型。

本公开实施例的技术方案，通过以包含多个问答对样本的集合作为一个样本输入单位，对集合中的问答对样本进行语义分析，进而计算一个集合中的各个问答对的预测标签为真实标签的概率值，并选择概率值最高的问答对作为优选模型训练数据，调整模型的参数，当损失函数结果满足预设条件时生成问答对质量判断模型。解决了现有技术中判断复杂的问答对的问答质量准确度不高的问题，实现了增强了生成的问答对质量判断模型的稳定性，使问答对质量判断模型在问答内容复杂的情况下做出的判断准确度更高。

实施例二

本实施例在上述实施例基础上，进一步地，从模型的结构角度对模型生成过程进行了描述，与上述实施例提出的模型训练方法属于同一发明构思，未在本实施例中详尽描述的技术细节可参见上述实施例。

图2示出了本公开实施例二提供的一种模型生成方法的流程图，本公开实施例中提供的模型生成方法包括如下步骤：

S210、通过待训练模型的输入层，以组为单位输入一组包含预设数量的问答对样本。

待训练模型的输入层，用于输入待训练模型的处理对象。在本实施例中，待训练模型为问答质量判断模型，该模型处理的对象即为问答对文本数据。在模型的训练过程中，以一组问答对样本作为一个单位的训练样本，各组中的问答对为标签一致的问答对。各组样本中问答对的数量可以是相同的，也可以是不同的，具体的问答对数量可以根据超参数确定。其中，超参数是指在开始学习过程之前设置值的参数，不是通过模型训练得到的参数数据。通常情况下，需要对超参数进行优化，可以提高模型训练的性能和效果。

示例性的，在图3所示的模型结构示意图中，输入层中输入的是一组标签为“答非所问”的问答对，为“黑米的功效是什么？紫米是……稻米”和“黑米的功效是什么？黑米滋阴补肾……”等等。

S220、通过待训练模型的表示层将各所述问答对进行语义分词，并确定分词结果中各词的表示向量。

待训练模型的表示层用于将输入的问答对文本初始化为问答对文本中各词的表示向量，为了将问答对文本以与预训练语言模型向匹配的格式输入至预训练语言模型中。

具体的，首先，针对每一个问答对样本进行分词；然后，根据分词结果查询预训练语言模型的词表初始化每个词的表示向量。通过词和词表的映射，得到了图3中，表示层所展示的问答对文本的词向量表示。其中，每个序列的第一个token始终是特殊分类嵌入[CLS]，一个token表示一个词向量；句子对被打包成一个序列时，多用特殊标记[SEP]将它们分开。

S230、通过待训练模型的预训练语言模型编码层计算各所述问答对样本的表示向量。

预训练语言模型编码层即Transformer层中的Encoder编码器，Transformer层是由若干个编码器和解码器堆叠形成的，用于将输入语料转化成特征向量。其中，输入语料即为各问答对样本的词向量表示，特征向量即能够表示出相应问答对文本语义的特征向量。

S240、在所述待训练模型的预测层，基于所述表示向量确定各所述问答对样本的预测标签为正确标签的似然概率，并通过多示例学习机制选择目标问答对样本，计算损失函数。

预测层则用于对各问答对样本标签进行预测，得到预测标签。具体的，实在预训练语言模型的基础上叠加一全连接层，计算预测标签为哪一类标签的概率，计算结果是满足损失函数的要求的。

在模型训练的过程中，即调整待训练模型参数的过程。在本实施例中，采用多示例学习机制，将一个问答对样本集合中各个问答对样本对应的概率值进行排序，将其中最大概率值对应的问答对作为一个优选的模型训练样本，去调节待训练模型的参数。这是由于在进行问答对样本数据标注时，标注成本较高，并且质量难以把控，很多问题是否答非所问需要主观判断。因此，答非所问的训练数据中并不能保证标注的标签是完全正确的，会存在大量的噪音数据，即标注错误的标签。在本实施例中，通过在多个问答对样本中选择预测标签为标注标签的最大概率值对应的问答对样本计算损失函数，进而调整模型参数，可以提升模型效果，在模型训练阶段(即模型生成过程)进行有效的降噪。

如图3所示，在预测层中，输入的是由预训练语言模型编码层输出的问答对的向量表示(如r_t，r_m)，将问答对的向量表示输入至全连接网络，从而得到问答对预测标签为真实标签的概率值(如p_t，p_m)。这里需要说明的是，在模型训练阶段，输入全连接网络的问答对表示向量的数量为多个，具体的数量与输入层输入的一组样本集合中的问答对数量一致，相应的得到的概率值也有多个，进而，选择概率值中的最大值对应的样本对的表示向量进行损失函数的计算，调整模型参数，最终的到训练好的问答质量判断模型。在模型应用的过程中，大多数情况下，一次只对一个问答对进行判断，即只有一个问答对最终表示向量输入至全连接网络中，得到模型输出结果。

S250、当所述损失函数结果满足预设条件时，所述待训练模型训练结束，得到问答对质量判断模型。

当待训练模型的参数可以是损失函数收敛，满足预设条件时，待训练模型的训练过程完成，得到问答质量判断模型。当有一个需要判断是否为答非所问的问答对时，便可以将该问答对输入至问答质量判断模型，以得到该问答对的标签，即“答非所问”或“答即所问”。

本公开实施例的技术方案，通过为待训练的问答质量判断模型设置输入层、表示层、预训练语言模型转换层以及预测层，逐步对输入的问答对文本进行处理，得到问答对的预测标签，并在预测层通过多示例学习机制保障了问答质量判断模型稳定性，使模型输出结果准确度有所提高。解决了现有技术中判断复杂的问答对的问答质量准确度不高问题，实现了在问答内容复杂的情况下做出问答质量的判断，提高对问答质量判断的准确度。

实施例三

图4示出了本公开实施例三提供的一种问答质量判断方法的流程图，本公开实施例可适用于判断问题答案对是否为答非所问的情况，该方法可以由问答质量判断装置实现，具体可通过移动终端中的软件和/或硬件来实施。

如图4所示，问答质量判断方法包括如下步骤：

S310、获取待判断问答对文本，并基于本公开任一实施例所述的模型生成方法生成问答对质量判断模型。

具体的，问答对样文本可以是在问答、知识分享等平台中的问题数据和答案数据。而基于上述任一实施例中的模型生成方法生成的问答对质量判断模型，可以判断一个问答对是否为答非所问的问答对。

该问答对质量判断模型是以问题和答案文本整体为对象进行分析判断的，能够捕捉到问题答案之间的有效词汇依赖，在复杂情况下较好的作出是否为答非所问的判断。例如，针对问答对“问题：黑米的功效是什么？回答：紫米是水稻的一个品种，属于糯米类，分紫粳、紫糯两种，一般来说，紫糯米就是黑糯米；而黑米为黑稻加工产品，属于粳米类，粒型有籼、粳两种，且黑米是非糯性稻米”该技术能判断答案没有匹配到“功效”而给出答非所问的判定。

而且，该问答质量判断模型，是基于预训练语言模型训练生成的，利用了预训练语言模型的词表，可学习的预料丰富，能够更好的捕捉文本语义特征，并且能够获得高频共现世界知识的帮助，辅助判断问答对是否是答非所问。例如，模型可以学到“营养成分”～“蛋白质、DHA”；“奶粉”～“婴儿”，从而顺利判断出“问题：奶粉有哪些营养成分都不知道？答案：蛋白质：乳清蛋白有调节睡眠的神经递质，有助于婴儿的睡眠，促进婴儿的大脑发育...”这个问答对不是答非所问。

此外，在该问答质量判断模型的训练过程中，通过多示例学习的技术能够降低训练数据集噪声对于模型的影响，从而提高模型的稳定性，使模型的输出结果置信度更高。

S320、将所述待判断问答对文本输入所述问答对质量判断模型，得到所述待判断问答对的质量判断结果。

将待判断是否为答非所问问答对的问答对文本输入至问答对质量判断模型中，便可以得到一个判断结果，即该问答对是“答非所问”还是“答及所问”。

本公开实施例的技术方案，通过将待判断的问答对输入至基于上述实施例中的模型生成方法得到问答质量判断模型中，得到待判断问答对的判断结果，该结果的准确性置信度较高。解决了现有技术中判断复杂的问答对的问答质量准确度不高问题，实现了在问答内容复杂的情况下做出问答质量的判断，提高对问答质量判断的准确度。

实施例四

图5示出了本公开实施例四提供的一种模型生成装置的结构示意图，本公开实施例可适用于的情况，通过本公开提供的问答质量判断装置可实现上述实施例提供的模型生成方法。

如图所示，本公开实施例中模型生成装置，包括：第一样本分析模块410、第二样本分析模块420、第三样本分析模块430和模型生成模块440。

其中，第一样本分析模块410，用于获取预设数量的问答对样本集合，并对每一个问答对样本集合中样本数据进行分析得到词向量；第二样本分析模块420，用于将所述词向量输入预训练语言模型，得到每一个问答对样本的表示向量；第三样本分析模块430，基于所述表示向量确定各问答对样本的预测标签为正确标签的似然概率，并根据所述似然概率中最大值对应的问答对样本的预测标签计算损失函数；模型生成模块440，用于当所述损失函数结果满足预设条件时生成问答对质量判断模型。

可选的，所述第一样本分析模块具体用于：获取标签相同的问答对文本；将所述标签相同的问答对文本分成预设数量的问答对样本集合，其中，所述标签包括答非所问标签和答即所问标签。

可选的，所述第一样本分析模块，还用于：将所述问答对样本与所述预训语言模型的词表进行匹配，得到每一个问答对样本集合中样本数据对应的词向量。

可选的，第三样本分析模块，具体用于：将各所述表示向量输入至全连接网络得到对应的各问答对样本数据对的预测标签为正确分类标签的似然概率。

可选的，所述第三样本分析模块是通过模型生成过程中的多示例学习机制实现相应的功能。

可选的，所述第二样本分析模块是通过所述问答对质量判断模型的预训练语言模型编码层实现相应的功能。

本公开实施例提供的模型生成装置，与上述实施例提供的模型生成方法属于同一发明构思，未在本公开实施例中详尽描述的技术细节可参见上述实施例，并且本公开实施例与上述实施例具有相同的有益效果。

实施例五

图6示出了本公开实施例五提供的一种问答质量判断装置的结构示意图，本公开实施例可适用于对问题和答案对是否为答非所问进行判断的情况，通过本公开提供的问答质量判断装置可实现上述实施例提供的问答质量判断方法。

如图6所示，本公开实施例中问答质量判断装置，包括：文本与模型获取模块510和问答质量判断模块520。

其中，文本与模型获取模块510，用于获取待判断问答对文本，并基于本公开任一实施例所述的模型生成方法生成问答对质量判断模型；问答质量判断模块520，用于将所述待判断问答对文本输入所述问答对质量判断模型，得到所述待判断问答对的质量判断结果。

本公开实施例提供的问答质量判断装置，与上述实施例提供的问答质量判断方法属于同一发明构思，未在本公开实施例中详尽描述的技术细节可参见上述实施例，并且本公开实施例与上述实施例具有相同的有益效果。

实施例六

下面参考图7，其示出了适于用来实现本公开实施例的电子设备600的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图7所示，电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置606加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

通常，以下装置可以连接至I/O接口605：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置604；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607；包括例如磁带、硬盘等的存储装置606；以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备600，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置609从网络上被下载和安装，或者从存储装置606被安装，或者从ROM 602被安装。在该计算机程序被处理装置601执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是，但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

在一些实施方式中，客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol，超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信(例如，通信网络)互连。通信网络的示例包括局域网(“LAN”)，广域网(“WAN”)，网际网(例如，互联网)以及端对端网络(例如，ad hoc端对端网络)，以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：获取预设数量的问答对样本集合，并对每一个问答对样本集合中样本数据进行分析得到词向量；将所述词向量输入预训练语言模型，得到每一个问答对样本的表示向量；基于所述表示向量确定各问答对样本的预测标签为正确标签的似然概率，并根据所述似然概率中最大值对应的问答对样本的预测标签计算损失函数；当所述损失函数结果满足预设条件时生成问答对质量判断模型。

或者，上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：

获取待判断问答对文本，并基于本公开任一实施例所述的模型生成方法生成问答对质量判断模型；将所述待判断问答对文本输入所述问答对质量判断模型，得到所述待判断问答对的质量判断结果。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言，诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称在某种情况下并不构成对该单元本身的限定，例如，第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

根据本公开的一个或多个实施例，【示例一】提供了一种模型生成方法包括：

获取预设数量的问答对样本集合，并对每一个问答对样本集合中样本数据进行分析得到词向量；

将所述词向量输入预训练语言模型，得到每一个问答对样本的表示向量；

基于所述表示向量确定各问答对样本的预测标签为正确标签的似然概率，并根据所述似然概率中最大值对应的问答对样本的预测标签计算损失函数；

当所述损失函数结果满足预设条件时生成问答对质量判断模型。

根据本公开的一个或多个实施例，【示例二】提供了示例一的方法，还包括：

所述获取预设数量的问答对样本集合，包括：

获取标签相同的问答对文本；

将所述标签相同的问答对文本分成预设数量的问答对样本集合，其中，所述标签包括答非所问标签和答即所问标签。

根据本公开的一个或多个实施例，【示例三】提供了示例一的方法，还包括：

所述对每一个问答对样本集合中样本数据进行分析得到词向量，包括：

对所述样本数据进行语义分词，得到分词结果；

将所述分词结果与所述预训语言模型的词表进行匹配，得到每一个问答对样本集合中样本数据对应的词向量。

根据本公开的一个或多个实施例，【示例四】提供了示例三的方法，还包括：

所述基于所述表示向量确定各样本数据对的预测标签为正确分类标签的似然概率，包括：

将各所述表示向量输入至全连接网络得到对应的各问答对样本数据对的预测标签为正确分类标签的似然概率。

根据本公开的一个或多个实施例，【示例五】提供了示例一的方法，还包括：

所述基于所述表示向量确定各问答对样本的预测标签为正确标签的似然概率，并根据所述似然概率中最大值对应的问答对样本的预测标签计算损失函数，是通过模型生成过程中的多示例学习机制实现的。

根据本公开的一个或多个实施例，【示例六】提供了示例一的方法，还包括：

所述将所述词向量输入预训练语言模型，得到每一个问答对样本的表示向量，是通过所述问答对质量判断模型的预训练语言模型编码层实现的。

根据本公开的一个或多个实施例，【示例七】提供了一种问答质量判断方法包括：

获取待判断问答对文本，并基于任一示例中所述的模型生成方法生成问答对质量判断模型；

将所述待判断问答对文本输入所述问答对质量判断模型，得到所述待判断问答对的质量判断结果。

根据本公开的一个或多个实施例，【示例八】提供了一种模型生成装置，包括：

第一样本分析模块，用于获取预设数量的问答对样本集合，并对每一个问答对样本集合中样本数据进行分析得到词向量；

第二样本分析模块，用于将所述词向量输入预训练语言模型，得到每一个问答对样本的表示向量；

第三样本分析模块，基于所述表示向量确定各问答对样本的预测标签为正确标签的似然概率，并根据所述似然概率中最大值对应的问答对样本的预测标签计算损失函数；

模型生成模块，用于当所述损失函数结果满足预设条件时生成问答对质量判断模型。

根据本公开的一个或多个实施例，【示例九】提供了示例八的装置，还包括：

所述第一样本分析模块，用于：

获取标签相同的问答对文本；

将所述标签相同的问答对文本分成预设数量的问答对样本集合，其中，所述标签包括答非所问标签和答即所问标签。

根据本公开的一个或多个实施例，【示例十】提供了示例八的装置，还包括：

所述第一样本分析模块，还用于：

对所述样本数据进行语义分词，得到分词结果；

将所述分词结果与所述预训语言模型的词表进行匹配，得到每一个问答对样本集合中样本数据对应的词向量。

根据本公开的一个或多个实施例，【示例十一】提供了示例十的装置，还包括：

第三样本分析模块，用于：

将各所述表示向量输入至全连接网络得到对应的各问答对样本数据对的预测标签为正确分类标签的似然概率。

根据本公开的一个或多个实施例，【示例十二】提供了示例八的装置，还包括：

根据本公开的一个或多个实施例，【示例十三】提供了示例八的装置，还包括：

所述将所述词向量输入预训练语言模型，得到每一个问答对样本的表示向量，是通过所述问答对质量判断模型的预训练语言模型编码层实现的。

根据本公开的一个或多个实施例，【示例十四】提供了问答质量判断装置，还包括：

文本与模型获取模块，用于获取待判断问答对文本，并基于权利要求1-6中任一所述的模型生成方法生成问答对质量判断模型；

问答质量判断模块，用于将所述待判断问答对文本输入所述问答对质量判断模型，得到所述待判断问答对的质量判断结果。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

21页详细技术资料下载

模型生成方法、问答质量判断方法、装置、设备及介质

相关技术

网友询问留言