外挂操作识别方法、装置及设备
阅读说明:本技术 外挂操作识别方法、装置及设备 (Plug-in operation identification method, device and equipment ) 是由 蒋通通 余建利 叶晓龙 穆铁马 李伟 竺士杰 乔柏林 胡林熙 林昊 刘苗苗 于 2020-03-30 设计创作,主要内容包括:本发明实施例涉及通信技术领域,公开了一种外挂操作识别方法、装置及设备。其中,该方法包括:采集业务系统的样本操作数据;从所述样本操作数据中提取与外挂操作有关的样本特征数据;将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据;确定所述异常样本数据的异常类别;根据所述异常样本数据和所述异常类别,建立外挂操作识别模型;根据所述外挂操作识别模型,进行外挂操作识别。通过上述方式,本发明实施例能够节省人力,并且提高识别的准确性。(The embodiment of the invention relates to the technical field of communication, and discloses a plug-in operation identification method, device and equipment. Wherein, the method comprises the following steps: collecting sample operation data of a business system; extracting sample characteristic data related to plug-in operation from the sample operation data; inputting the sample characteristic data into an abnormal data identification model, and acquiring abnormal sample data output by the abnormal data identification model; determining an exception category of the exception sample data; establishing a plug-in operation identification model according to the abnormal sample data and the abnormal category; and identifying the plug-in operation according to the plug-in operation identification model. Through the mode, the embodiment of the invention can save labor and improve the accuracy of identification.)
技术领域
本发明实施例涉及通信
技术领域
,具体涉及一种外挂操作识别方法、装置及设备。背景技术
目前,包含CRM(Customer Relationship Management,客户关系管理)、BOSS(Business Operation Support System,业务运营支撑系统)等的电信系统中,普遍存在通过外挂脚本、程序批量查询用户信息、详单信息或者办理业务等操作,这类操作具有发生时间间隔较短、批量调用次数较多、隐蔽性强等特点,容易带来用户信息泄露和违规业务办理的风险,从而导致业务的安全性降低。
对于外挂操作识别的方法主要通过人工统计分析,例如将业务办理日志中包含相同操作内容或者操作类型的重复字段进行统计,筛选出在一天内操作次数超过预设次数阈值的同一账号或者地址,判定为外挂账号。这种方式需要大量的人力,并且识别的准确性较低。
发明内容
鉴于上述问题,本发明实施例提供了一种外挂操作识别方法、装置及设备,能够节省人力,并且提高识别的准确性。
根据本发明实施例的第一方面,提供了一种外挂操作识别方法,包括:采集业务系统的样本操作数据;从所述样本操作数据中提取与外挂操作有关的样本特征数据;将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据;确定所述异常样本数据的异常类别;根据所述异常样本数据和所述异常类别,建立外挂操作识别模型;根据所述外挂操作识别模型,进行外挂操作识别。
在一种可选的方式中,所述的样本操作数据包括用户信息数据、总线调用数据、权限日志数据中的一种或多种。
在一种可选的方式中,所述样本特征数据包括用户画像数据、业务画像数据、操作数据;所述从所述样本操作数据中提取与外挂操作有关的样本特征数据,具体包括:基于所述用户信息数据、所述总线调用数据、所述权限日志数据,提取出所述用户画像数据、所述业务画像数据、所述操作数据。
在一种可选的方式中,在所述将所述样本特征数据输入异常数据识别模型之前,所述方法还包括:对所述样本特征数据进行编码和归一化处理。
在一种可选的方式中,所述异常数据识别模型包括编码器和解码器;
所述将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据,具体包括:将所述样本特征数据输入所述编码器,并获取所述编码器输出的压缩特征数据;将所述压缩特征数据输入所述解码器,并获取所述解码器输出的还原特征数据;根据所述样本特征数据与所述还原特征数据,计算所述还原特征数据的还原误差;若所述还原误差大于预设误差阈值,则确定所述还原特征数据为异常样本数据。
在一种可选的方式中,所述根据所述异常样本数据和所述异常类别,建立外挂操作识别模型,具体包括:根据所述异常样本数据和所述异常类别,训练随机森林模型;将训练后的所述随机森林模型确定为所述外挂操作识别模型。
在一种可选的方式中,所述根据所述外挂操作识别模型,进行外挂操作识别,具体包括:采集所述业务系统的在线操作数据;从所述在线操作数据中提取与外挂操作有关的在线特征数据;将所述在线特征数据输入所述外挂操作识别模型,并获取所述外挂操作识别模型输出的异常操作数据;确定所述异常操作数据所属的异常账号;将所述异常账号确定为外挂操作账号。
根据本发明实施例的第二方面,提供了一种外挂操作识别装置,包括:业务数据模块,用于采集业务系统的样本操作数据;特征工程模块,用于从所述样本操作数据中提取与外挂操作有关的样本特征数据;智慧模型模块,用于将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据,确定所述异常样本数据的异常类别,并根据所述异常样本数据和所述异常类别,建立外挂操作识别模型;应用服务模块,用于根据所述外挂操作识别模型,进行外挂操作识别。
根据本发明实施例的第三方面,提供了一种外挂操作识别设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的外挂操作识别方法的操作。
根据本发明实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使外挂操作识别设备/系统执行上述的外挂操作识别方法。
本发明实施例通过采集业务系统的样本操作数据,从样本操作数据中提取与外挂操作有关的样本特征数据,将样本特征数据输入异常数据识别模型,并获取异常数据识别模型输出的异常样本数据,确定异常样本数据的异常类别,根据异常样本数据和异常类别,建立外挂操作识别模型,根据外挂操作识别模型,进行外挂操作识别,能够快速从样本操作数据中提取与外挂操作有关的样本特征数据,同时,通过无监督模型实现异常样本的快速筛选和异常类别的聚合,减少了人工工作量,并为后续外挂操作识别模型的训练提供了相对准确的样本数据,从而能够自动识别外挂操作账号,节省人力,并且提高识别的准确性。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的
具体实施方式
。
附图说明
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了发明实施例提供的外挂操作识别装置的结构示意图;
图2示出了发明实施例提供的外挂操作识别方法的流程示意图;
图3示出了本发明实施例提供的外挂操作识别设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
目前,对于外挂操作识别的方法主要通过人工统计分析,例如将业务办理日志中包含相同操作内容或者操作类型的重复字段进行统计,筛选出在一天内操作次数超过预设次数阈值的同一账号或者地址,判定为外挂账号。这种方式需要大量的人力,并且识别的准确性较低。
基于此,本发明实施例提供了一种外挂操作识别系统及方法,能够自动识别外挂操作账号,节省人力,并且提高识别的准确性。
图1示出了发明实施例提供的外挂操作识别装置的结构示意图。如图1所示,该外挂操作识别装置100包括:业务数据模块110、特征工程模块120、智慧模型模块130、应用服务模块140。
其中,业务数据模块110用于采集业务系统的样本操作数据;特征工程模块120用于从所述样本操作数据中提取与外挂操作有关的样本特征数据;智慧模型模块130用于将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据,确定所述异常样本数据的异常类别,并根据所述异常样本数据和所述异常类别,建立外挂操作识别模型;应用服务模块140用于根据所述外挂操作识别模型,进行外挂操作识别。
其中,业务数据模块110可以包括:分布式流处理单元、文件流处理单元和数据库连接单元。分布式流处理单元可以通过Kafka Stream流处理技术实现,文件流处理单元可以通过File Stream流处理技术实现,数据库连接单元可以通过Java数据库连接(JavaDatabase Connectivity,JDBC)技术实现。
其中,特征工程模块120可以包括:数据仓库单元。数据仓库单元可以为hive,hive构建在基于静态批处理的Hadoop之上,它能够提供丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据,例如可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能。
其中,智慧模型模块130可以部署如TensorFlow、Keras、Scikit-Learn等学习框架,以提供算法的训练能力。
其中,应用服务模块140可以使用tornado部署web和接口服务,采用Nginx组件提供负载均衡,利用supervisor进行进程监控,从而提供外挂操作识别的在线服务能力。
在一些实施例中,该装置100还包括数据存储模块150。数据存储模块150包括第一存储单元和第二存储单元。第一存储单元可以通过该HBase实现,第二存储单元可以通过MySQL实现。第一存储单元与业务数据模块110、特征工程模块120连接,第二存储单元与智慧模型模块130、应用服务模块140连接。
在一些实施例中,特征工程模块120还用于:对所述样本特征数据进行编码和归一化处理。
在一些实施例中,所述异常数据识别模型包括编码器和解码器;智慧模型模块130具体用于:将所述样本特征数据输入所述编码器,并获取所述编码器输出的压缩特征数据;将所述压缩特征数据输入所述解码器,并获取所述解码器输出的还原特征数据;根据所述样本特征数据与所述还原特征数据,计算所述还原特征数据的还原误差;若所述还原误差大于预设误差阈值,则确定所述还原特征数据为异常样本数据。
在一些实施例中,智慧模型模块130具体还用于:根据所述异常样本数据和所述异常类别,训练随机森林模型;将训练后的所述随机森林模型确定为所述外挂操作识别模型。
在一些实施例中,业务数据模块还用于:采集所述业务系统的在线操作数据;特征工程模块还用于:从所述在线操作数据中提取与外挂操作有关的在线特征数据;应用服务模块还用于:将所述在线特征数据输入所述外挂操作识别模型,并获取所述外挂操作识别模型输出的异常操作数据,确定所述异常操作数据所属的异常账号,将所述异常账号确定为外挂操作账号。
本发明实施例通过业务数据模块110采集业务系统的样本操作数据;特征工程模块120从所述样本操作数据中提取与外挂操作有关的样本特征数据;智慧模型模块130将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据,确定所述异常样本数据的异常类别,并根据所述异常样本数据和所述异常类别,建立外挂操作识别模型;应用服务模块140用根据所述外挂操作识别模型,进行外挂操作识别,能够自动识别外挂操作账号,节省人力,并且提高识别的准确性。
图2示出了发明实施例提供的外挂操作识别方法的流程示意图。该外挂操作识别方法可以应用于外挂操作识别装置。如图2所示,该方法包括以下步骤:
步骤210、采集业务系统的样本操作数据。
其中,业务系统可以例如是业务运营支撑系统。本文所使用的术语“业务运营支撑系统”可以指应用于通信行业的业务系统,用于对用户执行相应块业务操作。例如,业务运营支撑系统可以是CRM、BOSS、BASS(Business Analysis Support System,经营分析系统)、4A(Authentication Account Authorization Audit,认证、账号、授权、审计)平台等等。但是,本发明的实施例不限于此方面。
其中,所有账号的调用都需要经过企业级的4A认证中心,只有通过4A认证的账号才被视为合法的调用,同时所有账号的认证记录可以用来分析每个账号的登录、登出情况。另外,现有业务系统通常采用企业服务总线(Enterprise Service Bus,EBS)对后端服务进行统一收口,并统一对外提供调用。总线调用记录可以精准展现任一外围调用的操作轨迹。同时,账号归属具有特殊性,操作号码也具有特有属性,则可以进一步分析出是否异地操作、号码端内操作等特征。因此,在本实施例中,样本操作数据包括用户信息数据、总线调用数据、权限日志数据中的一种或多种。用户信息数据是指用户的静态信息,例如用户账号ID、账号归属地市、用户所办理的业务ID、业务类别、业务敏感程度等等。总线调用数据是指EBS记录数据。权限日志数据是指4A权限日志文件数据。
其中,在业务数据模块中,用户信息数据可以通过业务数据模块的数据库连接单元定时获取,总线调用数据可以通过业务数据模块的分布式流处理单元按时间窗口进行提取,权限日志数据可以通过业务数据模块的文件流处理单元进行抽取,并且,用户信息数据、总线调用数据、权限日志数据可以存储到数据存储模块中的HBase中。
在一些实施例中,该方法还可以包括:对样本操作数据进行预处理。其中,预处理可以包括时序处理、数据清洗、白名单剔除等。对样本操作数据进行时序处理,取出不规则、日期格式破碎等无效信息,从而进行数据清洗。另外,由于某些渠道点的特殊性,存在少部分测试使用、业务探测使用等账号,将这些账号标记为白名单用户,并从样本操作数据中剔除白名单用户。当然,白名单用户可以根据实际业务需求进行设置,以使得外挂操作识别适用于各种业务。
步骤220、从样本操作数据中提取与外挂操作有关的样本特征数据。
其中,与外挂操作有关的样本特征数据是指预先设定的与外挂操作有关的几类特征的数据。在本实施例中,样本特征数据可以包括用户画像数据、业务画像数据、操作数据。用户画像数据是指与用户有关的特征数据,例如可以包括用户账号ID、账号归属地市、账号常用登陆IP等。业务画像数据是指与用户办理的业务有关的特征数据,例如可以包括业务ID、业务类别、业务敏感程度等。操作数据可以包括调用量、查询量、本地/异地登陆调用量、工作时间/非工作时间调用量、敏感/非敏感业务操作量等。
则步骤220具体包括:基于用户信息数据、总线调用数据、权限日志数据,提取出用户画像数据、业务画像数据、操作数据。例如可以为:从用户信息数据和权限日志数据提取出用户画像数据,从用户信息数据提取出业务画像数据,从总线调用数据提取出操作数据。
在特征工程模块中,可以通过Hadoop集群的hive处理聚合,提取样本特征数据后将样本特征数据存储到HBase中。
步骤230、将样本特征数据输入异常数据识别模型,并获取异常数据识别模型输出的异常样本数据。
由于样本特征数据的数据量庞大,异常的部分占比十分微弱,相当于正样本/负样本占比十分不均衡,因此在本实施例中,将样本特征数据输入异常数据识别模型,以对数据量庞大的样本特征数据进行初步筛选。
其中,异常数据识别模型是无监督模型,异常数据识别模型可以基于自编码器(Autoencoder,AE)算法来建立。异常数据识别模型可以包括编码器(encoder)和解码器(decoder),编码器用于对数据进行压缩,解码器用于对压缩后的数据进行重建。
在将样本特征数据输入异常数据识别模型之前,该方法还包括:通过正常操作数据对异常数据识别模型的编码器和解码器进行训练。其中,正常操作数据是指预先设定的不属于外挂操作的操作数据。通过正常操作数据训练得到的异常数据识别模型,能够将正常操作数据进行还原,而异常操作数据则不能较好地还原,因此能够通过训练后的异常数据识别模型识别出异常操作数据。
具体地,步骤230可以包括:
步骤231、将样本特征数据输入编码器,并获取编码器输出的压缩特征数据;
步骤232、将压缩特征数据输入解码器,并获取解码器输出的还原特征数据;
步骤233、根据样本特征数据与还原特征数据,计算还原特征数据的还原误差;
步骤234、若还原误差大于预设误差阈值,则确定还原特征数据为异常样本数据。
其中,压缩特征数据是编码器对样本特征数据进行压缩后得到的数据。将压缩特征数据输入解码器,解码器会对压缩特征数据进行重建,并还原得到原来的维度,得到还原特征数据。即,还原特征数据的数据维度与样本特征数据的数据维度相同。
其中,当还原特征数据的还原误差较大时,则表明该还原特征数据相对于正常特征数据差别较大,当还原特征数据的还原误差较小时,则表明该还原特征数据相对于正常特征数据差别较小。可以通过计算MSE或者MAE得到还原特征数据的还原误差。MSE和MAE可以根据以下公式计算:
其中,Xi为样本特征数据,为还原特征数据,n为样本特征数据和还原特征数据的数据维度。
其中,预设误差阈值可以根据实际需要进行设置,若设置的预设误差阈值较大,则异常样本数据的识别较宽松,若设置的预设误差阈值较小,则异常样本数据的识别较严格。
步骤240、确定异常样本数据的异常类别。
其中,异常类别是指对异常样本数据进行分类后得到的类别。异常类别可以通过人工进行分类,或者可以通过系统自动分类。异常类别可以包括:固定时间点高频调用、同一天内触发高频调用的时间间隔大致相同、某时间段内调用服务数量接近、调用时间点是非工作时间等等。
步骤250、根据异常样本数据和异常类别,建立外挂操作识别模型。
其中,外挂操作识别模型是能够从异常操作数据中识别出外挂操作数据的模型。步骤250具体包括:
步骤251、根据异常样本数据和异常类别,训练随机森林模型;
步骤252、将训练后的随机森林模型确定为外挂操作识别模型。
其中,随机森林模型是基于随机森林(Random Forest,RF)算法建立的模型。随机森林模型是有监督模型。随机森林模型的基本单元是决策树,对于一个输入样本,N个决策树会有N个分类结果,而随机森林集成了所有的分类结果,将投票次数最多的类别指定为最终的输出。通过将异常样本数据和异常类别作为训练样本,对随机森林模型进行分类训练,从而得到外挂操作识别模型。
步骤260、根据外挂操作识别模型,进行外挂操作识别。
在得到外挂操作识别模型后,应用服务模块可以拉取智慧模型模块中的外挂操作识别模型,进行外挂操作识别。
本发明实施例通过采集业务系统的样本操作数据,从样本操作数据中提取与外挂操作有关的样本特征数据,将样本特征数据输入异常数据识别模型,并获取异常数据识别模型输出的异常样本数据,确定异常样本数据的异常类别,根据异常样本数据和异常类别,建立外挂操作识别模型,根据外挂操作识别模型,进行外挂操作识别,能够快速从样本操作数据中提取与外挂操作有关的样本特征数据,同时,通过无监督模型实现异常样本的快速筛选和异常类别的聚合,减少了人工工作量,并为后续外挂操作识别模型的训练提供了相对准确的样本数据,从而能够自动识别外挂操作账号,节省人力,并且提高识别的准确性。
在一些实施例中,在步骤220之后、在步骤230之前,该方法还可以包括:步骤270、对样本特征数据进行编码和归一化处理。其中,可以采用Embedding将特征数据随机映射为连续的高密度低维向量,以对样本特征数据进行编码,能够为后续模型训练提供有效的输入文本。同时,由于不同账号、不同业务类别、不同时间段对应的业务操作数据量等的差异较大,则先对样本特征数据进行归一化处理,例如采用均值和标准差的归一化方式进行归一化处理,从而提高数据处理效率。
在一些实施例中,步骤260可以包括:
步骤261、采集业务系统的在线操作数据;
步骤262、从在线操作数据中提取与外挂操作有关的在线特征数据;
步骤263、将在线特征数据输入外挂操作识别模型,并获取外挂操作识别模型输出的异常操作数据;
步骤264、确定异常操作数据所属的异常账号;
步骤265、将异常账号确定为外挂操作账号。
其中,在线操作数据是指在进行外挂操作识别时实时获取的操作数据。在步骤262之前,可以对在线操作数据进行时序处理、数据清洗、白名单剔除等预处理,以对在线操作数据进行清洗。
其中,在步骤263中,从在线操作数据中提取与外挂操作有关的在线特征数据的实施方式与从样本操作数据中提取与外挂操作有关的样本特征数据的实施方式相同,此处不再赘述。在提取得到在线特征数据后,还可以对在线特征数据进行编码和归一化处理,再输入外挂操作识别模型。
其中,外挂操作模型对在线特征数据进行分类识别,输出异常操作数据。由于在线操作数据中包括用户画像数据、业务画像数据、操作数据等特征数据,因此可以从异常操作数据中确定异常操作数据所属的异常账号,并将该异常账号确定为外挂操作账号。在本实施例中,应用服务模块可以将得到的外挂操作账号存储在数据存储模块的MySQL中。
在一些实施例中,该方法还可以包括:步骤280、对外挂操作账号进行封停处理。具体地,可以通过应用服务模块调用4A认证中心封停接口,进行实时会话数据删除和权限注销动作,从而实现账号快速提出和账号权限封禁。通过利用旁挂数据流分析,调用4A认证中心封停接口实现实时封停,降低了对生产系统的入侵性,还达到了识别后快速截断的效果。
图3示出了本发明实施例提供的外挂操作识别设备的结构示意图,本发明具体实施例并不对外挂操作识别设备的具体实现做限定。
如图3所示,该外挂操作识别设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。处理器302,用于执行程序310,具体可以执行上述用于外挂操作识别方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机可执行指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。外挂操作识别设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以被处理器302调用使外挂操作识别设备执行以下操作:
采集业务系统的样本操作数据;
从所述样本操作数据中提取与外挂操作有关的样本特征数据;
将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据;
确定所述异常样本数据的异常类别;
根据所述异常样本数据和所述异常类别,建立外挂操作识别模型;
根据所述外挂操作识别模型,进行外挂操作识别。
本发明实施例通过采集业务系统的样本操作数据,从样本操作数据中提取与外挂操作有关的样本特征数据,将样本特征数据输入异常数据识别模型,并获取异常数据识别模型输出的异常样本数据,确定异常样本数据的异常类别,根据异常样本数据和异常类别,建立外挂操作识别模型,根据外挂操作识别模型,进行外挂操作识别,能够快速从样本操作数据中提取与外挂操作有关的样本特征数据,同时,通过无监督模型实现异常样本的快速筛选和异常类别的聚合,减少了人工工作量,并为后续外挂操作识别模型的训练提供了相对准确的样本数据,从而能够自动识别外挂操作账号,节省人力,并且提高识别的准确性。
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在外挂操作识别装置/设备上运行时,使得外挂操作识别装置/设备执行上述任意方法实施例中的外挂操作识别方法。
可执行指令具体可以用于使得外挂操作识别系统/设备执行以下操作:
采集业务系统的样本操作数据;
从所述样本操作数据中提取与外挂操作有关的样本特征数据;
将所述样本特征数据输入异常数据识别模型,并获取所述异常数据识别模型输出的异常样本数据;
确定所述异常样本数据的异常类别;
根据所述异常样本数据和所述异常类别,建立外挂操作识别模型;
根据所述外挂操作识别模型,进行外挂操作识别。
本发明实施例通过采集业务系统的样本操作数据,从样本操作数据中提取与外挂操作有关的样本特征数据,将样本特征数据输入异常数据识别模型,并获取异常数据识别模型输出的异常样本数据,确定异常样本数据的异常类别,根据异常样本数据和异常类别,建立外挂操作识别模型,根据外挂操作识别模型,进行外挂操作识别,能够快速从样本操作数据中提取与外挂操作有关的样本特征数据,同时,通过无监督模型实现异常样本的快速筛选和异常类别的聚合,减少了人工工作量,并为后续外挂操作识别模型的训练提供了相对准确的样本数据,从而能够自动识别外挂操作账号,节省人力,并且提高识别的准确性。
本发明实施例提供一种外挂操作识别装置,用于执行上述外挂操作识别方法。
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使外挂操作识别系统执行上述任意方法实施例中的外挂操作识别方法。
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的外挂操作识别方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。