评论用户身份识别方法、装置、计算机设备和存储介质

文档序号：1922151 发布日期：2021-12-03 浏览：12次 >En<

阅读说明：本技术 评论用户身份识别方法、装置、计算机设备和存储介质 (Comment user identity identification method and device, computer equipment and storage medium ) 是由王济宣顾扬于 2021-08-20 设计创作，主要内容包括：本申请涉及一种评论用户身份识别方法、装置、计算机设备和存储介质。该方法包括：获取待识别用户评论文本内容和匹配的关联用户评论文本内容；根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；将用户评论文本内容向量集输入至目标用户身份类型识别模型中,得到目标用户身份属性索引；根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型,根据目标用户身份类型对已识别用户评论文本内容进行监控。采用本方法能够通过识别评论文本内容的用户身份,监控评论文本内容,提高评论文本内容的识别准确率。(The application relates to a comment user identity identification method and device, computer equipment and a storage medium. The method comprises the following steps: acquiring the text content of the user comment to be identified and the matched associated text content of the user comment; obtaining a user comment text content vector set according to the user comment text content to be identified and the associated user comment text content; inputting the user comment text content vector set into a target user identity type identification model to obtain a target user identity attribute index; and determining the identity type of the target user corresponding to the comment text content of the user to be identified according to the identity attribute index of the target user, and monitoring the comment text content of the identified user according to the identity type of the target user. By adopting the method, the comment text content can be monitored by identifying the user identity of the comment text content, and the identification accuracy of the comment text content is improved.)

技术领域

本申请涉及计算机技术领域，特别是涉及一种评论用户身份识别方法、装置、计算机设备和存储介质。

背景技术

对评论文本进行自然语言处理是文本处理中一个应用很广泛的模块。现有的评论文本分类主要是先使用字典对文本分词，然后将分词后的句子使用加权平均的方式转换成句向量，再通过分类模型来获取评论文本内的相关属性。该方法存在一个很大的弊端，无法理解文本上下文的语义，同时相似的语句或是相同的字词在不同场景下也存在不同的语义，这就会导致句向量存在一些问题，从而导致评论文本识别的准确率低。

发明内容

基于此，有必要针对上述技术问题，提供一种能够通过识别评论文本内容的用户身份，监控评论文本内容，提高评论文本内容的识别准确率的评论用户身份识别方法、装置、计算机设备和存储介质。

一种评论用户身份识别方法，该方法包括：

获取待识别用户评论文本内容和匹配的关联用户评论文本内容；

根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；

将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；

根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

在其中一个实施例中，获取待识别用户评论文本内容和匹配的关联用户评论文本内容，包括：获取待识别用户评论文本内容对应的待识别用户标识和评论平台标识；根据待识别用户标识和评论平台标识获取匹配的关联用户评论文本内容。

在其中一个实施例中，根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集，包括：对待识别用户评论文本内容和关联用户评论文本内容进行分割，得到多个文字；获取各个文字对应的数字向量；获取预设向量维度；根据预设向量维度和各个数字向量组成用户评论文本内容向量集。

在其中一个实施例中，根据预设向量维度和各个数字向量组成用户评论文本内容向量集，包括：在数字向量对应的数目未达到预设向量维度时，获取默认向量；根据默认向量和数字向量组成用户评论文本内容向量集。

在其中一个实施例中，目标用户身份类型识别模型训练步骤包括：获取训练评论文本内容，训练评论文本内容关联有标准训练用户身份属性索引；将训练评论文本内容转换为对应的训练评论文本内容向量，输入至原始用户身份类型识别模型中，得到目标训练用户身份属性索引；根据标准训练用户身份属性索引和目标训练用户身份属性索引计算得到训练损失值；根据训练损失值对原始用户身份类型识别模型进行模型参数调整，直至满足收敛条件，得到目标用户身份类型识别模型。

在其中一个实施例中，根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，包括：获取预设用户身份类型映射表，用户身份类型映射表反映用户身份属性索引与对应的用户身份类型之间的映射关系；根据预设用户身份类型映射表确定目标用户身份属性索引对应的目标用户身份类型。

在其中一个实施例中，根据目标用户身份类型对已识别用户评论文本内容进行监控，包括：在目标用户身份类型为非合法用户身份时，对已识别用户评论文本内容进行删除处理；在目标用户身份类型为合法用户身份时，根据已识别用户评论文本内容进行相应的产品调整。

一种评论用户身份识别装置，该装置包括：

第一获取模块，用于获取待识别用户评论文本内容和匹配的关联用户评论文本内容；

第二获取模块，用于根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；

输入模块，用于将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；

生成模块，用于根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取待识别用户评论文本内容和匹配的关联用户评论文本内容；

根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；

将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；

根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取待识别用户评论文本内容和匹配的关联用户评论文本内容；

根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；

将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；

根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

上述评论用户身份识别方法、装置、计算机设备和存储介质，获取待识别用户评论文本内容和匹配的关联用户评论文本内容；根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。通过对待识别用户评论文本内容和匹配的关联用户评论文本内容进行分析，确定相应的用户身份类型，根据用户身份类型对已识别用户评论文本内容进行相应的处理，通过识别评论文本内容的用户身份，监控评论文本内容，提高评论文本内容的识别准确率。

附图说明

图1为一个实施例中评论用户身份识别方法的应用环境图；

图2为一个实施例中评论用户身份识别方法的流程示意图；

图3为一个实施例中待识别用户评论文本内容获取步骤的流程示意图；

图4为一个实施例中用户评论文本内容向量集获取步骤的流程示意图；

图5为一个实施例中用户评论文本内容向量集组成步骤的流程示意图；

图6为一个实施例中目标用户身份类型识别模型训练步骤的流程示意图；

图7为一个实施例中目标用户身份类型确定步骤的流程示意图；

图8为一个实施例中已识别用户评论文本内容监控步骤的流程示意图；

图9为一个实施例中评论用户身份识别装置的结构框图；

图10为一个实施例中计算机设备的内部结构图；

图11为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的评论用户身份识别方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

具体地，终端102获取待识别用户评论文本内容和匹配的关联用户评论文本内容，并发送至服务器104，服务器104获取到待识别用户评论文本内容和匹配的关联用户评论文本内容，根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集，将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引，根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

在另一个实施例中，终端102获取待识别用户评论文本内容和匹配的关联用户评论文本内容，根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集，将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引，根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

在一个实施例中，如图2所示，提供了一种评论用户身份识别方法，以该方法应用于图1中的终端或服务器为例进行说明，包括以下步骤：

步骤202，获取待识别用户评论文本内容和匹配的关联用户评论文本内容。

其中，待识别用户评论文本内容是与待识别用户相关的文本内容，可以是待识别用户发表的用户评论文本，也可以是与待识别用户所在评论平台中与待识别用户相关的其他文本内容等。而关联用户评论文本内容是与待识别用户评论文本内容相关联的用户评论文本内容，可以是待识别用户评论文本内容所在的评论平台其他用户相关的文本内容。具体地，可以根据待识别用户的用户标识获取待识别用户评论文本内容，再根据待识别用户评论文本内容获取匹配的关联用户评论文本内容。

例如，待识别用户评论文本内容可以是输入用户评论文本，而匹配的关联用户评论文本内容可以是输入用户回复对象的评论文本，论坛主楼评论文本，论坛板块名称，用户名。

步骤204，根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集。

具体地，在得到待识别用户评论文本内容和关联用户评论文本内容后，可以对待识别用户评论文本内容和关联用户评论文本内容进行向量转换，具体可以是，获取预设向量字典，根据预设向量字典查找与待识别用户评论文本内容和关联用户评论文本对应的用户评论文本内容向量，得到用户评论文本内容向量集。

步骤206，将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引。

其中，目标用户身份类型识别模型是用来识别待识别用户评论文本内容对应的待识别用户的用户身份属性索引，用户身份属性索引是用来标识用户身份类型的，不同的用户身份属性索引对应不同的用户身份类型。其中，目标用户身份类型识别模型可以预先有监督训练得到，具体可以根据实际业务需求、产品需求或实际应用场景进行样本数据的训练得到。

具体地，在获取到用户评论文本内容向量集后，可以将用户评论文本内容向量集作为目标用户身份类型识别模型的输入，通过目标身份类型识别模型对用户评论文本内容向量集进行识别，得到对应的目标用户身份属性索引。

步骤208，根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

其中，用户身份属性索引是用来标识用户身份类型的，不同的用户身份属性索引对应不同的用户身份类型，因此，可以预先根据实际业务需求、产品需求或实际应用场景建立用户身份属性索引和匹配的用户身份类型之间的映射关系。具体地，在获得目标身份类型识别模型输出的目标用户身份属性索引后，可以根据预先建立好的映射关系，确定目标用户身份属性索引对应的目标用户身份类型，最后，根据目标用户身份类型对已识别用户评论文本内容进行监控。通过目标用户身份类型对用户评论文本内容进行监控，能够有效避免一些非法用户的评论文本内容带来的影响和损失。

上述评论用户身份识别方法中，获取待识别用户评论文本内容和匹配的关联用户评论文本内容；根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。通过对待识别用户评论文本内容和匹配的关联用户评论文本内容进行分析，确定相应的用户身份类型，根据用户身份类型对已识别用户评论文本内容进行相应的处理，通过识别评论文本内容的用户身份，监控评论文本内容，提高评论文本内容的识别准确率。

在一个实施例中，如图3所示，获取待识别用户评论文本内容和匹配的关联用户评论文本内容，包括：

步骤302，获取待识别用户评论文本内容对应的待识别用户标识和评论平台标识。

步骤304，根据待识别用户标识和评论平台标识获取匹配的关联用户评论文本内容。

其中，这里的待识别用户标识是用来标识待识别用户评论文本内容的发表用户的，而评论平台标识是用来标识待识别用户评论文本内容所在的平台的。具体地，可以根据待识别用户标识确定待识别用户评论文本内容的发表用户，而根据评论平台标识可以确定该发表用户具体在哪个平台发表的。因此，可以待识别用户标识对应的发表用户，在评论平台标识对应的平台发表，该平台其他用户针对该发表用户发表的内容进行评论，将其他用户的评论可以确定为匹配的关联用户评论文本内容。

在另一个实施例中，评论平台标识对应的评论平台，有多个评论子平台，如论坛，获取待识别用户标识对应的发表用户所在的评论子平台，将这个评论子平台的所有相关的评论文本确定为匹配的关联用户评论文本内容。例如，匹配的关联用户评论文本内容可以是发表用户回复对象的评论文本，论坛主楼评论文本，论坛板块名称，用户名等等。

在一个实施例中，如图4所示，根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集，包括：

步骤402，对待识别用户评论文本内容和关联用户评论文本内容进行分割，得到多个文字。

步骤404，获取各个文字对应的数字向量。

步骤406，获取预设向量维度。

步骤408，根据预设向量维度和各个数字向量组成用户评论文本内容向量集。

其中，待识别用户评论文本内容和关联用户评论文本内容进行分割，得到多个文字，其中，分割可以是将待识别用户评论文本内容和关联用户评论文本内容进行逐字分割，得到各个文字。其实，这些文字就是组成待识别用户评论文本内容和关联用户评论文本内容的最小单元。

进一步地，获取各个文字对应的数字向量，可以预先根据实际业务需求、产品需求或实际应用场景建立所有文字与对应的数字向量之间的关联关系，因此，在得到待识别用户评论文本内容和关联用户评论文本内容对应的文字后，根据该关联关系获取各个文字对应的数字向量。

其中，这里预设向量维度是指用户评论文本内容向量集的长度大小，具体可以根据实际业务需求、产品需求进行确定得到，最后，由各个数字向量组成符合预设向量维度用户评论文本内容向量集。

例如，待识别用户评论文本内容和关联用户评论文本内容为“这个商品很好”，那么转为向量就是(203,166,122,150,34,15,0,0,0,0,…,0)，其中，向量的前六个数字对应的是“这个商品很好”，之后的194个0是填补的，使向量长度满足200，其中200就是预设向量维度。

在一个实施例中，如图5所示，根据预设向量维度和各个数字向量组成用户评论文本内容向量集，包括：

步骤502，在数字向量对应的数目未达到预设向量维度时，获取默认向量。

步骤504，根据默认向量和数字向量组成用户评论文本内容向量集。

其中，预设向量维度可以根据实际业务需求、产品需求或者实际应用场景进行确定得到，预设向量维度是指用户评论文本内容向量集的长度大小。具体地，检测数字向量对应的数量是否达到预设向量维度，如果达到，说明数字向量对应的数目符合预设向量维度，则无需任何操作，直接由所有数字向量组成用户评论文本内容向量集。反之，如果数字向量对应的数量未达到预设向量维度时，说明数字向量对应的数目不符合向量维度，则需要获取默认向量。

其中，这里的默认向量是根据实际业务需求、产品需求或实际应用场景确定得到的默认的数字向量。最后，由默认向量和数字向量组成用户评论文本内容向量集。

例如，待识别用户评论文本内容和关联用户评论文本内容为“这个商品很好”，那么转为向量就是(203,166,122,150,34,15,0,0,0,0,…,0)，其中，向量的前六个数字对应的是“这个商品很好”，之后的194个0是填补的，使向量长度满足200，其中200就是预设向量维度。其中，由于“这个商品很好”对应的数字向量没有达到预设向量维度200，则获取194个默认向量0，最后，由默认向量0和6个数字向量组成用户评论文本内容向量集。

在一个实施例中，如图6所示，目标用户身份类型识别模型训练步骤包括：

步骤602，获取训练评论文本内容，训练评论文本内容关联有标准训练用户身份属性索引。

步骤604，将训练评论文本内容转换为对应的训练评论文本内容向量，输入至原始用户身份类型识别模型中，得到目标训练用户身份属性索引。

其中，训练评论文本内容可以通过大数据爬取得到，或者从其他业务系统中爬取得到，在此不作限制。其中，标准训练用户身份属性索引是训练评论文本内容对应的正确的用户身份属性索引，用来评判用户身份类型识别模型输出的用户身份属性索引是否正确，模型是否达到训练目的。

进一步地，将训练评论文本内容转换为对应的训练评论文本内容向量，具体可以是，对训练评论文本内容进行逐字分割，得到分割后的各个字，获取各个字对应的数字向量，得到训练评论文本内容向量。最后，将训练评论文本内容向量输入至原始用户身份类型识别模型中，通过原始用户身份类型识别模型对其进行识别分析，得到目标训练用户身份属性索引。

步骤606，根据标准训练用户身份属性索引和目标训练用户身份属性索引计算得到训练损失值。

步骤608，根据训练损失值对原始用户身份类型识别模型进行模型参数调整，直至满足收敛条件，得到目标用户身份类型识别模型。

具体地，在得到目标训练用户身份属性索引，可以通过标准训练用户身份属性索引和目标训练用户身份属性索引来判断原始用户身份类型识别模型是否达到训练目的，具体可以是，根据标准训练用户身份属性索引和目标训练用户身份属性索引计算得到训练损失值，具体的计算可以是但不限于求均值，差值等等，目前的训练损失值算法都可以应用，在此不作限制。因此，训练损失值可以用来判断原始用户身份类型识别模型是否达到收敛条件，如果没有达到，则根据训练损失值不断调整原始用户身份类型识别模型的模型参数，直至训练损失值达到收敛条件，完成模型训练，得到目标用户身份类型识别模型。其中，收敛条件可以根据实际业务需求、产品需求或实际应用场景进行确定得到，例如，收敛条件可以是训练损失值不再发生变化时，或者训练损失值达到最小时，或者是训练次数达到预设训练次数阈值时，则确定模型训练已经达到收敛条件。

在一个实施例中，如图7所示，根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，包括：

步骤702，获取预设用户身份类型映射表，用户身份类型映射表反映用户身份属性索引与对应的用户身份类型之间的映射关系。

步骤704，根据预设用户身份类型映射表确定目标用户身份属性索引对应的目标用户身份类型。

其中，预设用户身份类型映射表是预先根据实际业务需求、产品需求或实际应用场景建立的，用来描述用户身份属性索引与匹配的用户身份类型之间的映射关系。具体地，在获取到目标用户身份属性索引后，根据该预设用户身份类型映射表所描述的映射关系，查找出与目标用户身份属性索引对应的目标用户身份类型。

在一个实施例中，如图8所示，根据目标用户身份类型对已识别用户评论文本内容进行监控，包括：

步骤802，在目标用户身份类型为非合法用户身份时，对已识别用户评论文本内容进行删除处理。

步骤804，在目标用户身份类型为合法用户身份时，根据已识别用户评论文本内容进行相应的产品调整。

其中，在得到目标用户身份类型后，可以根据目标用户身份类型的合法性进行相应的处理，不同的目标用户身份类型可进行不同的处理。具体地，确定目标用户身份类型是否是合法用户身份，如果目标用户身份类型为合法用户身份，则可以根据已识别用户评论文本内容进行相应的产品调整。例如，已识别用户评论文本内容为：“A产品的产品界面过于繁杂。”因为目标用户身份类型为合法用户身份，因此，可以参考该已识别用户评论文本内容对A产品的产品界面进行产品调整。

反之，如果目标用户身份类型为非合法用户身份时，说明已识别用户评论文本内容的发表用户可能是个非法用户，因此，为了避免该用户评论文本内容产生不好的影响，则可以对已识别用户评论文本内容进行删除处理，避免一些不好的言论对产品产生不利的影响。

在一个具体的实施例中，提供了一种评论用户身份识别方法，具体包括了以下内容：

1、获取训练评论文本内容，训练评论文本内容关联有标准训练用户身份属性索引。

2、将训练评论文本内容转换为对应的训练评论文本内容向量，输入至原始用户身份类型识别模型中，得到目标训练用户身份属性索引。

3、根据标准训练用户身份属性索引和目标训练用户身份属性索引计算得到训练损失值。

4、根据训练损失值对原始用户身份类型识别模型进行模型参数调整，直至满足收敛条件，得到目标用户身份类型识别模型。

5、获取待识别用户评论文本内容和匹配的关联用户评论文本内容。

5-1、获取待识别用户评论文本内容对应的待识别用户标识和评论平台标识。

5-2、根据待识别用户标识和评论平台标识获取匹配的关联用户评论文本内容。

6、根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集。

6-1、对待识别用户评论文本内容和关联用户评论文本内容进行分割，得到多个文字。

6-2、获取各个文字对应的数字向量。

6-3、获取预设向量维度。

6-4、根据预设向量维度和各个数字向量组成用户评论文本内容向量集。

6-4-1、在数字向量对应的数目未达到预设向量维度时，获取默认向量。

6-4-2、根据默认向量和数字向量组成用户评论文本内容向量集。

7、将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引。

8、根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型。

8-1、获取预设用户身份类型映射表，用户身份类型映射表反映用户身份属性索引与对应的用户身份类型之间的映射关系。

8-2、根据预设用户身份类型映射表确定目标用户身份属性索引对应的目标用户身份类型。

9、根据目标用户身份类型对已识别用户评论文本内容进行监控。

9-1、在目标用户身份类型为非合法用户身份时，对已识别用户评论文本内容进行删除处理。

9-2、在目标用户身份类型为合法用户身份时，根据已识别用户评论文本内容进行相应的产品调整。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图9所示，提供了一种评论用户身份识别装置900，包括：第一获取模块902、第二获取模块904、输入模块906和生成模块908，其中：

第一获取模块902，用于获取待识别用户评论文本内容和匹配的关联用户评论文本内容。

第二获取模块904，用于根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集。

输入模块906，用于将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引。

生成模块908，用于根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

在一个实施例中，第一获取模块902获取待识别用户评论文本内容对应的待识别用户标识和评论平台标识，根据待识别用户标识和评论平台标识获取匹配的关联用户评论文本内容。

在一个实施例中，第二获取模块904对待识别用户评论文本内容和关联用户评论文本内容进行分割，得到多个文字，获取各个文字对应的数字向量，获取预设向量维度，根据预设向量维度和各个数字向量组成用户评论文本内容向量集。

在一个实施例中，第二获取模块904在数字向量对应的数目未达到预设向量维度时，获取默认向量，根据默认向量和数字向量组成用户评论文本内容向量集。

在一个实施例中，评论用户身份识别装置900获取训练评论文本内容，训练评论文本内容关联有标准训练用户身份属性索引，将训练评论文本内容转换为对应的训练评论文本内容向量，输入至原始用户身份类型识别模型中，得到目标训练用户身份属性索引，根据标准训练用户身份属性索引和目标训练用户身份属性索引计算得到训练损失值，根据训练损失值对原始用户身份类型识别模型进行模型参数调整，直至满足收敛条件，得到目标用户身份类型识别模型。

在一个实施例中，生成模块908获取预设用户身份类型映射表，用户身份类型映射表反映用户身份属性索引与对应的用户身份类型之间的映射关系，根据预设用户身份类型映射表确定目标用户身份属性索引对应的目标用户身份类型。

在一个实施例中，生成模块908在目标用户身份类型为非合法用户身份时，对已识别用户评论文本内容进行删除处理，在目标用户身份类型为合法用户身份时，根据已识别用户评论文本内容进行相应的产品调整。

关于评论用户身份识别装置的具体限定可以参见上文中对于评论用户身份识别方法的限定，在此不再赘述。上述评论用户身份识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标用户身份类型识别模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种评论用户身份识别方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种评论用户身份识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图10或图11中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：获取待识别用户评论文本内容和匹配的关联用户评论文本内容；根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取待识别用户评论文本内容对应的待识别用户标识和评论平台标识；根据待识别用户标识和评论平台标识获取匹配的关联用户评论文本内容。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：对待识别用户评论文本内容和关联用户评论文本内容进行分割，得到多个文字；获取各个文字对应的数字向量；获取预设向量维度；根据预设向量维度和各个数字向量组成用户评论文本内容向量集。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：在数字向量对应的数目未达到预设向量维度时，获取默认向量；根据默认向量和数字向量组成用户评论文本内容向量集。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取训练评论文本内容，训练评论文本内容关联有标准训练用户身份属性索引；将训练评论文本内容转换为对应的训练评论文本内容向量，输入至原始用户身份类型识别模型中，得到目标训练用户身份属性索引；根据标准训练用户身份属性索引和目标训练用户身份属性索引计算得到训练损失值；根据训练损失值对原始用户身份类型识别模型进行模型参数调整，直至满足收敛条件，得到目标用户身份类型识别模型。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取预设用户身份类型映射表，用户身份类型映射表反映用户身份属性索引与对应的用户身份类型之间的映射关系；根据预设用户身份类型映射表确定目标用户身份属性索引对应的目标用户身份类型。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：在目标用户身份类型为非合法用户身份时，对已识别用户评论文本内容进行删除处理；在目标用户身份类型为合法用户身份时，根据已识别用户评论文本内容进行相应的产品调整。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取待识别用户评论文本内容和匹配的关联用户评论文本内容；根据待识别用户评论文本内容和关联用户评论文本内容得到用户评论文本内容向量集；将用户评论文本内容向量集输入至目标用户身份类型识别模型中，得到目标用户身份属性索引；根据目标用户身份属性索引确定待识别用户评论文本内容对应的目标用户身份类型，根据目标用户身份类型对已识别用户评论文本内容进行监控。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

20页详细技术资料下载

评论用户身份识别方法、装置、计算机设备和存储介质

相关技术

网友询问留言