词库更新方法和装置、风险控制方法、装置和系统

文档序号:1952644 发布日期:2021-12-10 浏览:17次 >En<

阅读说明:本技术 词库更新方法和装置、风险控制方法、装置和系统 (Word stock updating method and device, risk control method, device and system ) 是由 肖翔 何刚 朱彬 于 2020-09-14 设计创作,主要内容包括:本公开提供一种词库更新方法和装置、风险控制方法、装置和系统。词库更新装置在接收到用户输入的敏感词后,查询敏感词是否包括在敏感词库中;若敏感词未包括在敏感词库中,则将敏感词添加到敏感词库中;在列表库中创建新列表,并将敏感词和用户的用户标识添加到新列表中,以便使敏感词和用户的用户标识相关联。风险控制装置利用敏感词库构建敏感词字典树;利用敏感词字典树识别出在当前用户使用的业务数据中包括的敏感词;从列表库中查询出与敏感词相关联的用户标识;若在与敏感词相关联的用户标识中包括当前用户的用户标识,则根据预设的风险控制策略对业务数据进行风险控制操作。本公开能够在多用户场景下有效隔离不同用户的敏感词配置。(The disclosure provides a word stock updating method and device, and a risk control method, device and system. After receiving the sensitive words input by the user, the word bank updating device inquires whether the sensitive words are included in the sensitive word bank; if the sensitive word is not included in the sensitive word stock, adding the sensitive word into the sensitive word stock; a new list is created in the list store and the sensitive word and the user identification of the user are added to the new list to associate the sensitive word with the user identification of the user. The risk control device constructs a sensitive word dictionary tree by using the sensitive word library; recognizing a sensitive word included in the service data used by the current user by using the sensitive word dictionary tree; querying a user identification associated with the sensitive word from a list library; and if the user identification associated with the sensitive word comprises the user identification of the current user, performing risk control operation on the service data according to a preset risk control strategy. The method and the device can effectively isolate the sensitive word configuration of different users in a multi-user scene.)

词库更新方法和装置、风险控制方法、装置和系统

技术领域

本公开涉及信息处理领域,特别涉及一种词库更新方法和装置、风险控制方法、装置和系统。

背景技术

为了能够对存在于论坛、商家咨询系统、网络评论、个人信息网站、微博等各类社区和业务领域中的色情、骚扰、辱骂、涉政、诈骗等敏感信息进行检测,通过采用敏感词监测、语义理解、情绪识别、账户风控标签等方案进行敏感信息管控。敏感词监测方案由于具有设置简单、识别准确、监测效率极高的特点,因此被普遍采用。

在相关技术中,敏感词检测方案首先由用户进行敏感词库设置,然后利用敏感词库对发布、传输的文本进行关键词匹配,若匹配成功,则会使用对应的风控策略进行拦截、验证、拉黑、警告等操作。

发明内容

发明人通过研究发现,在相关技术中,采用的是一个用户对应一个敏感词库的风控策略。在多用户场景下,就会出现敏感词库的管理问题。例如,用户A认为某个词是敏感词,但是用户B认为该词正常,在这种情况下无法用一个敏感词库来服务于多个用户。可通过为每个用户单独配置一个敏感词库来解决这一问题。在用户量较大时,这种方式会占用大量的存储资源。此外,还可将各用户的公共敏感词放置在一个公共词库中,各用户的敏感词库中仅放置各用户的个性化敏感词。这种方式的词库维护成本很高,例如在某个用户进行敏感词更新时,需要判断该敏感词是该用户的个性化敏感词还是共有敏感词,从而导致更新速度慢、维护复杂。

据此,本公开提供一种风控方案,能够在多用户场景下有效隔离不同用户敏感词配置。

根据本公开实施例的第一方面,提供一种词库更新方法,包括:在接收到用户输入的敏感词后,查询所述敏感词是否包括在敏感词库中;若所述敏感词未包括在敏感词库中,则将所述敏感词添加到所述敏感词库中;在列表库中创建新列表,并将所述敏感词和所述用户的用户标识添加到所述新列表中,以便使所述敏感词和所述用户的用户标识相关联。

在一些实施例中,若所述敏感词包括在敏感词库中,则在所述列表库中查询与所述敏感词相关联的列表;若所述用户的用户标识未包括在与所述敏感词相关联的列表中,则将所述用户的用户标识添加到与所述敏感词相关联的列表中。

在一些实施例中,若所述用户的用户标识已包括在与所述敏感词相关联的列表中,则删除所述用户的用户标识。

根据本公开实施例的第二方面,提供一种种词库更新装置,包括:查询模块,被配置为在接收到用户输入的敏感词后,查询所述敏感词是否包括在敏感词库中;第一更新模块,被配置为若所述敏感词未包括在敏感词库中,则将所述敏感词添加到所述敏感词库中;第二更新模块,被配置为在列表库中创建新列表,并将所述敏感词和所述用户的用户标识添加到所述新列表中,以便使所述敏感词和所述用户的用户标识相关联。

根据本公开实施例的第三方面,提供一种风险控制方法,包括:获取利用上述任一实施例所述的词库更新方法得到的敏感词库和列表库;利用所述敏感词库构建敏感词字典树;利用所述敏感词字典树识别出在当前用户使用的业务数据中包括的敏感词;从所述列表库中查询出与所述敏感词相关联的用户标识;检测在与所述敏感词相关联的用户标识中是否包括所述当前用户的用户标识;若在与所述敏感词相关联的用户标识中包括所述当前用户的用户标识,则根据预设的风险控制策略对所述业务数据进行风险控制操作。

在一些实施例中,若在与所述敏感词相关联的用户标识中不包括所述当前用户的用户标识,则不对所述业务数据进行风险控制操作。

根据本公开实施例的第四方面,提供一种风险控制装置,包括:词库获取模块,被配置为获取利用上述任一实施例所述的词库更新方法得到的敏感词库和列表库;字典树构建模块,被配置为利用所述敏感词库构建敏感词字典树;第一识别模块,被配置为利用所述敏感词字典树识别出在当前用户使用的业务数据中包括的敏感词;第二识别模块,被配置为从所述列表库中查询出与所述敏感词相关联的用户标识;风控模块,被配置为检测在与所述敏感词相关联的用户标识中是否包括所述当前用户的用户标识,若在与所述敏感词相关联的用户标识中包括所述当前用户的用户标识,则根据预设的风险控制策略对所述业务数据进行风险控制操作。

根据本公开实施例的第五方面,提供一种电子装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的方法。

根据本公开实施例的第六方面,提供一种风险控制系统,包括如上述任一实施例所述的电子装置。

根据本公开实施例的第七方面,提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上述任一实施例涉及的方法。

通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本公开一个实施例的词库更新方法的流程示意图;

图2为本公开另一个实施例的词库更新方法的流程示意图;

图3为本公开一个实施例的词库更新装置的结构示意图;

图4为本公开一个实施例的风险控制方法的流程示意图;

图5为本公开一个实施例的风险控制装置的结构示意图;

图6为本公开一个实施例的电子装置的结构示意图;

图7为本公开一个实施例的风险控制系统的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

图1为本公开一个实施例的词库更新方法的流程示意图。在一些实施例中,下列的词库更新方法步骤由词库更新装置执行。

在步骤101,在接收到用户输入的敏感词后,查询敏感词是否包括在敏感词库中。

在步骤102,若敏感词未包括在敏感词库中,则将敏感词添加到敏感词库中。

在步骤103,在列表库中创建新列表,并将敏感词和用户的用户标识添加到新列表中,以便使敏感词和用户的用户标识相关联。

例如,列表库中的列表如表1所示。

敏感词 用户标识
词1 ID1、ID2、ID3
词2 ID2
词3 ID1、ID3

表1

如表1所示,用户1将词1和词3作为敏感词,用户2将词1和词2作为敏感词,用户3将词1和词3作为敏感词。通过使敏感词和用户的用户标识相关联,从而在多用户场景下有效隔离不同用户的敏感词配置。

图2为本公开另一个实施例的词库更新方法的流程示意图。在一些实施例中,下列的词库更新方法步骤由词库更新装置执行。

在步骤201,在接收到用户输入的敏感词后,查询敏感词是否包括在敏感词库中。

在步骤202,若敏感词包括在敏感词库中,则在列表库中查询与敏感词相关联的列表。

在步骤203,检测用户的用户标识是否包括在与敏感词相关联的列表中。

若用户的用户标识未包括在与敏感词相关联的列表中,则执行步骤204;若用户的用户标识已包括在与敏感词相关联的列表中,则执行步骤205。

在步骤204,将用户的用户标识添加到与敏感词相关联的列表中。

在步骤205,删除用户的用户标识。

在一些实施例中,用户4输入的敏感词为词2。由于词2已经包括在敏感词库中,则在列表库中查询出于词2相关联的列表。由于在所查询出的列表中不包括用户4的用户标识ID4,则将ID4添加到与词2相关联的列表中。若ID4已经包括在与词2相关联的列表中,则表明用户4的用户标识ID4已经与词2相关联,在这种情况下删除ID4。相应结果如表2所示。

敏感词 用户标识
词1 ID1、ID2、ID3
词2 ID2、ID4
词3 ID1、ID3

表2

图3为本公开一个实施例的词库更新装置的结构示意图。如图3所示,词库更新装置包括查询模块31、第一更新模块32和第二更新模块33。

查询模块31被配置为在接收到用户输入的敏感词后,查询敏感词是否包括在敏感词库中。

第一更新模块32被配置为若敏感词未包括在敏感词库中,则将敏感词添加到敏感词库中。

第二更新模块33被配置为在列表库中创建新列表,并将敏感词和用户的用户标识添加到新列表中,以便使敏感词和用户的用户标识相关联。

在一些实施例中,第二更新模块33被配置为若敏感词包括在敏感词库中,则在列表库中查询与敏感词相关联的列表,若用户的用户标识未包括在与敏感词相关联的列表中,则将用户的用户标识添加到与敏感词相关联的列表中。

在一些实施例中,第二更新模块33还被配置为若用户的用户标识已包括在与敏感词相关联的列表中,则删除所述用户的用户标识。

图4为本公开一个实施例的风险控制方法的流程示意图。在一些实施例中,下列的风险控制方法步骤由风险控制装置执行。

这里需要说明的是,敏感词库和列表库通过利用图1或图2中任一实施例涉及的词库更新方法获得。

在步骤402,利用敏感词库构建敏感词字典树。

在步骤403,利用敏感词字典树识别出在当前用户使用的业务数据中包括的敏感词。

在步骤404,从列表库中查询出与敏感词相关联的用户标识。

在步骤405,检测在与敏感词相关联的用户标识中是否包括当前用户的用户标识。

在步骤406,若在与敏感词相关联的用户标识中包括当前用户的用户标识,则根据预设的风险控制策略对业务数据进行风险控制操作。

在一些实施例中,若在与敏感词相关联的用户标识中不包括当前用户的用户标识,则不对业务数据进行风险控制操作。

例如,利用敏感词字典树识别出用户1使用的业务数据中包括词3,从列表库中查询出与词3相关联的用户标识。由于用户1的用户标识ID1包括在与词3相关联的用户标识中,因此根据预设的风险控制策略对用户1的业务数据进行风险控制操作。

又例如,利用敏感词字典树识别出用户2使用的业务数据中包括词3,从列表库中查询出与词3相关联的用户标识。由于用户2的用户标识ID2不包括在与词3相关联的用户标识中,因此不对用户2的业务数据进行风险控制操作。由此有效实现了多用户风险控制策略的隔离。

图5为本公开一个实施例的风险控制装置的结构示意图。如图5所示,风险控制装置包括词库获取模块51、字典树构建模块52、第一识别模块53、第二识别模块54和风控模块55。

词库获取模块51被配置为获取敏感词库和列表库。

这里需要说明的是,敏感词库和列表库通过利用图1或图2中任一实施例涉及的词库更新方法获得。

字典树构建模块52被配置为利用敏感词库构建敏感词字典树。

第一识别模块53被配置为利用敏感词字典树识别出在当前用户使用的业务数据中包括的敏感词。

第二识别模块54被配置为从列表库中查询出与敏感词相关联的用户标识。

风控模块55被配置为检测在与敏感词相关联的用户标识中是否包括当前用户的用户标识,若在与敏感词相关联的用户标识中包括当前用户的用户标识,则根据预设的风险控制策略对业务数据进行风险控制操作。

在一些实施例中,风控模块55还被配置为若在与敏感词相关联的用户标识中不包括当前用户的用户标识,则不对业务数据进行风险控制操作。

图6为本公开一个实施例的电子装置的结构示意图。如图6所示,电子装置包括存储器61和处理器62。

存储器61用于存储指令,处理器62耦合到存储器61,处理器62被配置为基于存储器存储的指令执行实现如图1、2、4中任一实施例涉及的方法。

如图6所示,该电子装置还包括通信接口63,用于与其它设备进行信息交互。同时,该电子装置还包括总线64,处理器62、通信接口63、以及存储器61通过总线64完成相互间的通信。

存储器61可以包含高速RAM存储器,也可还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。存储器61也可以是存储器阵列。存储器61还可能被分块,并且块可按一定的规则组合成虚拟卷。

此外,处理器62可以是一个中央处理器CPU,或者可以是专用集成电路ASIC,或是被配置成实施本公开实施例的一个或多个集成电路。

本公开同时还涉及一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图1、2、4中任一实施例涉及的方法。

图7为本公开一个实施例的风险控制系统的结构示意图。如图7所示,风险控制系统70包括电子装置71,电子装置71为图6中任一实施例涉及的电子装置。

在一些实施例中,在上面所描述的功能单元模块可以实现为用于执行本公开所描述功能的通用处理器、可编程逻辑控制器(Programmable Logic Controller,简称:PLC)、数字信号处理器(Digital Signal Processor,简称:DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,简称:ASIC)、现场可编程门阵列(Field-ProgrammableGate Array,简称:FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意适当组合。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:主键的获取方法和装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!