一种对海量用户生产内容进行自动内容管控的方法

文档序号：1504922 发布日期：2020-02-07 浏览：1次 >En<

阅读说明：本技术 一种对海量用户生产内容进行自动内容管控的方法 (Method for automatically managing and controlling mass user production content ) 是由李森和于 2019-09-20 设计创作，主要内容包括：本发明提供了一种对海量用户生产内容进行自动内容管控的方法,包括如下的步骤：步骤1)用户输入内容,点击发送至客户端,客户端提示包含敏感词的窗口命令,是否进行确认修改；步骤2)客户端根据其内设置的本地敏感词库验证,查看是否存在敏感词；如过包含敏感词,返回至步骤1),如果不包含敏感词进入下一步骤；步骤3)客户端将用户ID以及发送的内容推送至服务器端；步骤4)服务器端接收用户ID以及发送的内容,通过敏感词系统判断风险,步骤5)依据步骤4)的结果判断是否存在高风险,依次判断频道风险等级和文章风险等级,若频道风险等级和文章风险等级均在正常范围内,服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。(The invention provides a method for automatically managing and controlling mass user production content, which comprises the following steps: step 1) a user inputs content, clicks and sends the content to a client, and the client prompts a window command containing sensitive words and determines whether to modify the window command; step 2) the client checks whether the sensitive words exist according to the verification of a local sensitive word bank arranged in the client; if the sensitive word is contained, returning to the step 1), and if the sensitive word is not contained, entering the next step; step 3) the client pushes the user ID and the sent content to the server; and 4) the server receives the user ID and the sent content, judges the risk through a sensitive word system, and 5) judges whether high risk exists according to the result of the step 4), sequentially judges the channel risk level and the article risk level, and pushes the received content sent by the user ID to a related channel if the channel risk level and the article risk level are both in a normal range.)

技术领域

本发明提供了计算机技术领域，涉及一种内容发布管控技术，尤其涉及一种对海量用户生产内容进行自动内容管控的方法。

背景技术

“内容”一词，源于出版媒体业，书报杂志、唱片影带里的创作，叫做内容，所以早期的内容管理CM(Content Management)，偏向出版产品的管理，以储存、流程、元数据(Metadata)为要件来制作系统。内容管理是指对组织机构内部多种格式和媒体类型的信息资源（通常称为信息资产）的组织、分类、管理等有序化过程，常常作为数字图书馆或企业知识管理的一个组成部分。

随着网络的普遍使用，内容管理呈现大数据管理的趋势，现有的内容管理仅是对发布的内容进行关键敏感词进行过滤，关键敏感词进行过滤不能完全的过滤一些例如谐音字、藏头字等，也不能进行语义分析，获取内容中的风险因素。

发明内容

有鉴于此，本发明提供了一种对海量用户生产内容进行自动内容管控的方法。

本发明采用的技术方案为：

一种对海量用户生产内容进行自动内容管控的方法，包括如下的步骤：

步骤1）用户输入内容，点击发送至客户端，客户端提示包含敏感词的窗口命令，是否进行确认修改；

步骤2）客户端根据其内设置的本地敏感词库验证，查看是否存在敏感词；如过包含敏感词，返回至步骤1），如果不包含敏感词进入下一步骤；

步骤3）客户端将用户ID以及发送的内容推送至服务器端；

步骤4）服务器端接收用户ID以及发送的内容，通过敏感词系统以及大数据语义分析判断风险，具体包括：

在风险判断之前，先将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端；

一：通过敏感词系统判断风险，包括

服务器设置一扫描窗口模块，扫描窗口模块用于识别可读格式的图片的边界，在扫描窗口模块内嵌入一驱动模块，该驱动模块驱动滑动模板在扫描窗口模块识别的边界内滑动，识别可读格式的图片上的文字信息，并对识别的文字信息与服务器设置的敏感词库进行比对，查看是否存在敏感词，并遍历整个边界，判断并汇总敏感词风险结果；

二：大数据语义分析判断风险，包括

服务器设置一扫描窗口模块，扫描窗口模块用于识别可读格式的图片的边界，在扫描窗口模块内嵌入一驱动模块，该驱动模块驱动一浮动窗口模块在扫描窗口模块识别的边界内滑动，浮动窗口模块依据识别的特殊字段进行断句，并将获取的断句发送至语义分析模块，语义分析模块对断句进行处理，记录语句表达的情绪等级，并遍历整个边界，判断并汇总语句表达的情绪等级风险结果；

步骤5）依据步骤4）的结果判断是否存在高风险，如果存在高风险，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理；如果不存在高风险，根据用户ID下的历史数据等级判断用户的风险等级并记录，若用户的风险等级超过设定的阈值，则服务器发送至人工审查客户端进行人工审查，若用户的风险等级未超过设定的阈值，依次判断频道风险等级和文章风险等级，若频道风险等级和文章风险等级均在正常范围内，服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。

在步骤5）中，若人工审查存在高风险，人工客户端键入反馈命令至服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理；若人工审查未存在高风险，依次判断频道风险等级和文章风险等级，若频道风险等级和文章风险等级均在正常范围内，服务器端将接收到的用户ID发送的内容进行推送并发布至相关频道下。

在步骤5）中，判断频道风险等级，若频道风险等级不在正常范围内，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。

在步骤5）中，判断文章风险等级，若文章风险等级不在正常范围内，服务器屏蔽其发送的内容并记录用户的ID，并根据用户ID下的历史数据及严重等级执行限制登陆、用户禁言、频道禁言、文章禁言的处理。

本发明的有益效果为：

与传统的技术相比，通过敏感词进行扫描，将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端，扫描窗口模块用于识别可读格式的图片的边界，扫描窗口模块识别的边界内滑动，识别可读格式的图片上的文字信息，并对识别的文字信息与服务器设置的敏感词库进行比对，查看是否存在敏感词，并遍历整个边界，判断并汇总敏感词风险结果；该扫描窗口模块可以在识别的边界内进行横向、纵向以及按照某一角度斜向滑动，因此其可以对整个内容进行全方位的敏感词查看。

与传统的技术相比，通过大数据语义分析判断风险，将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端，浮动窗口模块在扫描窗口模块识别的边界内滑动，浮动窗口模块依据识别的特殊字段进行断句，并将获取的断句发送至语义分析模块，语义分析模块对断句进行处理，记录语句表达的情绪等级，并遍历整个边界，判断并汇总语句表达的情绪等级风险结果；语句表达的情绪等级包括是否包含愤怒情绪，是否包含谐音词汇语句等。

说明书附图

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图。

具体实施例

下面将结合附图以及具体实施例来详细说明本发明，在此本发明的示意性实施例以及说明用来解释本发明，但并不作为对本发明的限定。

实施例1

参照图1，一种对海量用户生产内容进行自动内容管控的方法，包括如下的步骤：

步骤1）用户输入内容，点击发送至客户端，客户端提示包含敏感词的窗口命令，是否进行确认修改；

步骤2）客户端根据其内设置的本地敏感词库验证，查看是否存在敏感词；如过包含敏感词，返回至步骤1），如果不包含敏感词进入下一步骤；

步骤3）客户端将用户ID以及发送的内容推送至服务器端；

步骤4）服务器端接收用户ID以及发送的内容，通过敏感词系统判断风险，具体包括：

在风险判断之前，先将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端；

实施例2

参照图1，一种对海量用户生产内容进行自动内容管控的方法，包括如下的步骤：

步骤1）用户输入内容，点击发送至客户端，客户端提示包含敏感词的窗口命令，是否进行确认修改；

步骤2）客户端根据其内设置的本地敏感词库验证，查看是否存在敏感词；如过包含敏感词，返回至步骤1），如果不包含敏感词进入下一步骤；

步骤3）客户端将用户ID以及发送的内容推送至服务器端；

步骤4）服务器端接收用户ID以及发送的内容，通过敏感词系统以及大数据语义分析判断风险，具体包括：

在风险判断之前，先将接收到的用户发送的内容预存为至少一种可读格式的图片，将该可读格式的图片缓存至服务器端；

以上对本发明实施例所公开的技术方案进行了详细介绍，本文中应用了具体实施例对本发明实施例的原理以及实施方式进行了阐述，以上实施例的说明只适用于帮助理解本发明实施例的原理；同时，对于本领域的一般技术人员，依据本发明实施例，在

具体实施方式

以及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

9页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种更新数据库的方法及系统

一种对海量用户生产内容进行自动内容管控的方法

相关技术

网友询问留言