一种基于自修复建模的反洗钱系统及其方法

文档序号:170246 发布日期:2021-10-29 浏览:40次 >En<

阅读说明:本技术 一种基于自修复建模的反洗钱系统及其方法 (Self-repairing modeling based money laundering prevention system and method thereof ) 是由 俞书浩 于 2021-06-28 设计创作,主要内容包括:本发明涉及一种基于自修复建模的反洗钱系统及其方法,该系统包括依次连接的洗钱识别装置和洗钱告警装置,洗钱识别装置用于对输入的交易数据进行洗钱识别,并输出对应的识别结果给洗钱告警装置,洗钱识别装置包括依次连接的特征加工模块、建模模块、自修复模块和模型优化模块,特征加工模块用于从输入的交易数据中提取出对应的高维全量特征;建模模块用于根据高维全量特征,构建初版洗钱识别模型;自修复模块用于进行自修复闭环投产操作,持续得到反馈数据;模型优化模块用于根据反馈数据,对当前洗钱识别模型进行更新优化。与现有技术相比,本发明针对快速变化的洗钱场景,解决了投产后模型衰减的问题,同时不需要反复人工建模,节省人力资源。(The invention relates to an anti-money laundering system based on self-repairing modeling and a method thereof, wherein the system comprises a money laundering identification device and a money laundering alarm device which are sequentially connected, the money laundering identification device is used for carrying out money laundering identification on input transaction data and outputting a corresponding identification result to the money laundering alarm device, the money laundering identification device comprises a feature processing module, a modeling module, a self-repairing module and a model optimization module which are sequentially connected, and the feature processing module is used for extracting a corresponding high-dimensional full-scale feature from the input transaction data; the modeling module is used for constructing an initial money laundering identification model according to the high-dimensional full-scale features; the self-repairing module is used for carrying out self-repairing closed-loop production operation to continuously obtain feedback data; and the model optimization module is used for updating and optimizing the current money laundering identification model according to the feedback data. Compared with the prior art, the method solves the problem of model attenuation after production aiming at the money laundering scene with quick change, and simultaneously does not need repeated artificial modeling, thereby saving human resources.)

一种基于自修复建模的反洗钱系统及其方法

技术领域

本发明涉及反洗钱技术领域,尤其是涉及一种基于自修复建模的反洗钱系统及其方法。

背景技术

随着银行业务交易量的增长,反洗钱案件的发生风险也逐步增长,每月反洗钱规则系统中筛选的待审查可疑交易数量呈增长趋势,加大了反洗钱工作的工作负荷。仅通过人工规则优化来减少可疑案件量,难以建立规则优化的长效机制,因此使用AI机器学习技术来生成反洗钱模型逐步成为现有技术的研究热点。

但是由于进行洗钱的手段经常变化,会针对银行的洗钱规则来改变策略,这就使得洗钱的行为特征总在变化中,而普通的的反洗钱模型并不能很好地适用这种变化情况,导致花费几个月时间构建的反洗钱模型在经历一两个月之后就不能准确地识别出洗钱交易,只能依靠人工重新反复建模,耗费大量人力资源。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于自修复建模的反洗钱系统及其方法,以针对不断变化的洗钱行为特征,通过高维全量特征进行模型自修复,从而解决反洗钱模型衰减的问题。

本发明的目的可以通过以下技术方案来实现:一种基于自修复建模的反洗钱系统,包括依次连接的洗钱识别装置和洗钱告警装置,所述洗钱识别装置用于对输入的交易数据进行洗钱识别,并输出对应的识别结果给洗钱告警装置,所述洗钱识别装置包括依次连接的特征加工模块、建模模块、自修复模块和模型优化模块,所述特征加工模块用于从输入的交易数据中提取出对应的高维全量特征;

所述建模模块用于根据高维全量特征,以构建初版洗钱识别模型;

所述自修复模块用于进行自修复闭环投产操作,以持续得到反馈数据;

所述模型优化模块用于根据反馈数据,以对当前的洗钱识别模型进行更新优化。

进一步地,所述特征加工模块包括依次连接的数据清洗单元和数据加工单元,所述数据清洗单元用于对输入的交易数据进行数据清洗,以筛选掉异常数据;

所述数据加工单元根据清洗后的交易数据,以生成对应的高维全量特征。

进一步地,所述自修复模块包括闭环连接的自动建模单元、云投产单元和反馈数据清洗加工单元,所述反馈数据清洗加工单元用于从云投产单元获取反馈数据,并对获取的反馈数据进行清洗加工,以生成对应的高维全量特征;

所述自动建模单元根据反馈数据清洗加工单元输出的高维全量特征,自动建立新的模型;

所述云投产单元用于将新的模型进行云部署投产。

一种基于自修复建模的反洗钱方法,包括以下步骤:

S1、设定建模目标,将历史样本数据输入特征加工模块,经过建模模块,得到初版洗钱识别模型;

S2、将待识别交易数据输入包含初版洗钱识别模型的洗钱识别装置,以输出得到对应的洗钱识别结果,同时通过自修复模块和模型优化模块对初版洗钱识别模型进行模型持续优化,不断更新洗钱识别装置内的洗钱识别模型;

S3、洗钱告警装置根据洗钱识别结果,输出对应的告警信息给用户。

进一步地,所述步骤S1具体包括以下步骤:

S11、设定建模目标,并获取历史样本数据;

S12、对历史样本数据进行数据清洗;

S13、根据数据清洗后的历史样本数据,构建对应的宽表,其中,宽表中包含全量特征;

S14、对宽表中的全量特征进行数据加工,得到对应的高维全量特征;

S15、基于步骤S14得到的高维全量特征,建立初版洗钱识别模型。

进一步地,所述建模目标具体为:洗钱交易1和非洗钱交易0。

进一步地,所述步骤S15具体是采用加入L0、L1、L2正则化的xgboost或 lightgbm算法,以建立初版洗钱识别模型,由此解决使用高维全量特征建模时产生的过拟合和多重共线性问题。

进一步地,所述步骤S2中更新洗钱识别模型的过程具体为:

S21、将待识别交易数据输入当前洗钱识别模型,在输出对应洗钱识别结果的同时得到对应的反馈数据;

S22、对反馈数据依次进行数据清洗和数据加工,得到对应的高维全量特征;

S23、根据步骤S22得到的高维全量特征,通过自动建模构建得到新的模型;

S24、将新的模型进行云部署投产,之后返回步骤S21;

S25、根据累积的反馈数据,按照预设的优化周期,对当前的洗钱识别模型进行更新优化。

进一步地,所述数据加工具体是进行包括10天、1个月、3个月、6个月的滑动窗口统计,并计算得到最大值、最小值、平均值、中值以及求和值。

进一步地,所述步骤S23具体是采用贝叶斯随机自动建模算法构建得到新的模型。

与现有技术相比,本发明具有以下优点:

一、本发明针对洗钱行为特征快速变化的洗钱场景,通过在洗钱识别装置内设置依次连接的特征加工模块、建模模块、自修复模块和模型优化模块,利用特征加工模块和建模模块得到初版洗钱识别模型,利用自修复模块和模型优化模型对当前洗钱识别模型不断进行修复更新,以此解决洗钱识别模型投产后衰减的问题,由于模型的修复更新是基于不断累积的新的反馈数据,一方面能够持续提高洗钱识别的准确性,另一方面也不需要人工重新反复建立新的模型,大大节省了人力资源。

二、本发明基于高维全量特征进行洗钱识别模型的构建,以高维全量特征作为自修复的基础,使得每次重新建模的输入都是相同的,从而能够全自动地执行后续的机器学习建模以及投产,而投产后得到的“反馈数据”经过加工后,其数据格式与初版的“高维全量特征”也是一致的,所以也不需要人工参与,由此保证本发明的自修复快速更新性能。

附图说明

图1为本发明的系统结构示意图;

图2为本发明的方法流程示意图;

图3为洗钱识别装置的工作过程示意图;

图中标记说明:1、洗钱识别装置,2、洗钱告警装置,11、特征加工模块, 12、建模模块,13、自修复模块,14、模型优化模块,110、数据清洗单元,111、数据加工单元,130、自动建模单元,131、云投产单元,132、反馈数据清洗加工单元。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

如图1所示,一种基于自修复建模的反洗钱系统,包括依次连接的洗钱识别装置1和洗钱告警装置2,洗钱识别装置1用于对输入的交易数据进行洗钱识别,并输出对应的识别结果给洗钱告警装置2,洗钱识别装置1包括依次连接的特征加工模块11、建模模块12、自修复模块13和模型优化模块14,特征加工模块11用于从输入的交易数据中提取出对应的高维全量特征,特征加工模块11包括依次连接的数据清洗单元110和数据加工单元111,数据清洗单元110用于对输入的交易数据进行数据清洗,以筛选掉异常数据;

数据加工单元111根据清洗后的交易数据,以生成对应的高维全量特征;

建模模块12用于根据高维全量特征,以构建初版洗钱识别模型;

自修复模块13用于进行自修复闭环投产操作,以持续得到反馈数据,自修复模块13包括闭环连接的自动建模单元130、云投产单元131和反馈数据清洗加工单元132,反馈数据清洗加工单元132用于从云投产单元131获取反馈数据,并对获取的反馈数据进行清洗加工,以生成对应的高维全量特征;

自动建模单元130根据反馈数据清洗加工单元132输出的高维全量特征,自动建立新的模型;

云投产单元131用于将新的模型进行云部署投产;

模型优化模块14用于根据反馈数据,以对当前的洗钱识别模型进行更新优化。

将上述系统应用于实际,以实现一种基于自修复建模的反洗钱方法,如图2 所示,包括以下步骤:

S1、设定建模目标,将历史样本数据输入特征加工模块11,经过建模模块12,得到初版洗钱识别模型,具体的:

首先设定建模目标:洗钱交易1和非洗钱交易0,并获取历史样本数据;

之后对历史样本数据进行数据清洗;

再根据数据清洗后的历史样本数据,构建对应的宽表,其中,宽表中包含全量特征;

最后对宽表中的全量特征进行数据加工,得到对应的高维全量特征,并基于得到的高维全量特征,建立初版洗钱识别模型;

S2、将待识别交易数据输入包含初版洗钱识别模型的洗钱识别装置1,以输出得到对应的洗钱识别结果,同时通过自修复模块13和模型优化模块14对初版洗钱识别模型进行模型持续优化,不断更新洗钱识别装置1内的洗钱识别模型,具体的:

S21、将待识别交易数据输入当前洗钱识别模型,在输出对应洗钱识别结果的同时得到对应的反馈数据;

S22、对反馈数据依次进行数据清洗和数据加工,得到对应的高维全量特征,其中,数据加工具体是进行包括10天、1个月、3个月、6个月的滑动窗口统计,并计算得到最大值、最小值、平均值、中值以及求和值;

S23、根据步骤S22得到的高维全量特征,通过自动建模构建得到新的模型;

S24、将新的模型进行云部署投产,之后返回步骤S21;

S25、根据累积的反馈数据,按照预设的优化周期,对当前的洗钱识别模型进行更新优化;

S3、洗钱告警装置2根据洗钱识别结果,输出对应的告警信息给用户。

本技术方案考虑到传统的反洗钱模型也能够根据反馈数据自动迭代优化模型,但在交易流水生成特征时,由于计算力的问题,若仅仅通过简单统计交易笔数和金额等特征来建模,并筛选有效的特征,然后通过机器学习得到最终优化的模型来投产,由于行为特征的变化,很多旧特征可能淘汰,需要新特征来支持,所以在这种优化模型的方式下,模型准确率依旧会迅速衰减。

为此,本技术方案通过实现自修复反洗钱建模方式,以改进建模的流程,解决投产后模型衰减的问题,克服了快速应对变化的难题,同时不需要反复人工建模,从而节省大量人力资源,在普通反洗钱建模的基础上,自动生成大量高维特征,并且不需要筛选特征,而且当模型效果衰减后能自我修复。

在传统的反洗钱建模基础上,生成“高维全量特征”,并使用效果一般的初版模型建立一个修复环。修复环包括“高维全量特征”,“自动建模算法”,“模型自动投产”以及“反馈数据”四部分,从而形成一个闭环。

如图3所示:

1、特征加工模块

包括需求分析、数据准备、数据清洗和探索以及简单特征工程形成宽表。首先根据目标,收集手机客户的行为数据,然后进行数据加工,筛除异常数据,并生成“高维全量特征”,本实施例中,指定建模的目标:反洗钱交易和非反洗钱交易(1,0);接着是数据准备、清洗数据、发现异常数据、提高数据质量;生成“高维全量特征”: 300个主特征,每个主特征均依次进行10天、1个月、3个月、6个月的滑动窗口统计,并计算最大值、最小值、平均值、中值、求和值。

2、建模模块

宽表完成后,可以进行首次建模,得到初版模型(或者称为基线模型),初版模型会尝试几种算法并选择其中最好的一种;之后针对选好的特定算法,调优模型参数,并进行特征筛选,把模型的效果调整到令人满意的程度,本实施例考虑到自我修复的反洗钱建模技术使用高维全量特征,很容易导致过拟合,因此需要能够抵御过拟合和多重共线性的算法,因此在开源的xgboost和lightgbm算法基础上中加入L0、L1、L2正则化,以有效解决过拟合和多重共线性问题。

3、自修复模块

自修复的基础是“高维全量特征”,由于普通方法中特征筛选导致每次建模的输入不同,所以每次重新建模都需要人工干预;而使用高维全量特征,则每次重新建模的输入是相同的,可以全自动执行后续流程,即自动机器学习算法和自动投产。投产后得到的“反馈数据”经过加工后,其数据格式与初版的“高维全量特征”也是一致的,所以也不需要人工参与,本实施例中,主要包括以下过程:(1)反馈数据自动清洗(2)生成高维全量特征(2)采用贝叶斯随机自动建模算法(3)云部署方式自动部署。

4、模型优化模块

自修复反洗钱建模流程打通后,初始几个版本的模型不追求很高准确性,但模型会在运行中积累新的“反馈数据”逐渐提升,提高准确性;等到准确性稳定后,模型能快速应对变化,避免迅速衰减。整个嵌入了自修复的建模流程只需要一次开发,投产之后不用担心模型衰减的问题,解决了快速应对变化的难题,同时不需要反复人工建模,从而节省大量人力资源,本实施例中,自修复建模法投产后,每月一次执行自学习自修复。

本技术方案中,初始几个版本的模型不追求很高准确性,但模型会在运行中积累新的“反馈数据”逐渐提升,提高准确性;等到准确性稳定后,模型能快速应对变化,避免迅速衰减。整个自修复反洗钱建模流程只需要一次开发,投产之后不用担心模型衰减的问题,解决了快速应对变化的难题,同时不需要反复人工建模,从而节省大量人力资源。而传统的模型在刚投产时,效果非常好,但1个月后快速衰减,衰减后然后又开始投入人力进行建模,3个月后新模型也是同样的命运。自修复模型在一开始可能效果不如普通模型,但是之后随着数据积累,模型逐渐提升,准确率逐渐上升,再之后同样依靠的快速修复,始终能够保持较高的准确率。普通方法的模型更新周期需要人工3个月,而使用自修复的模型更新周期可以非常短,可以2周、1周,不需要人工干预。

本技术方案针对快速变化的洗钱场景,采用自修复建模方式,以高维全量特征为基础实现自动闭环修复,通过自动云部署投产,不需要反复人工建模,节省大量人力资源。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于代理重加密的区块链支付通道监管方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!