多媒体数据识别方法和系统

文档序号：1744964 发布日期：2019-11-26 浏览：27次 >En<

阅读说明：本技术 多媒体数据识别方法和系统 (Multi-medium data recognition methods and system ) 是由丁一肖长杰廉亚男徐刚黄海宇于 2018-05-18 设计创作，主要内容包括：本申请公开了一种多媒体数据识别方法和系统。其中,该方法包括：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据,则获取从原始多媒体数据或录制数据中采集到的第二数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据,则确定原始多媒体数据属于非法多媒体数据。本申请解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。(This application discloses a kind of multi-medium data recognition methods and systems.Wherein, this method comprises: identification whether there is invalid data from the first data collected in original multimedia data；If there are invalid datas in the first data, collected second data from original multimedia data or data recording are obtained；It identifies in the second data with the presence or absence of invalid data；If in the second data, there are invalid datas, it is determined that original multimedia data belongs to illegal multi-medium data.Present application addresses the low technical problems of multi-medium data recognition methods recognition efficiency in the prior art and accuracy.)

多媒体数据识别方法和系统

技术领域

本申请涉及多媒体数据安全领域，具体而言，涉及一种多媒体数据识别方法和系统。

背景技术

对于多媒体数据直播，例如在视频直播的应用场景中，为了确保视频内容的有效健康，需要对视频内容进行审核。目前常用的多媒体数据识别方法为在多媒体数据直播的过程中，按照固定截取频率对多媒体数据进行截取，并通过对截取到的数据进行识别，判断截取到的数据中是否存在敏感信息或者疑似敏感信息，从而确定多媒体数据是否通过审核。

但是，基于成本和实时直播的特殊性，现有多媒体数据识别方法只能针对全局设置固定的截图频率，导致多媒体数据中的一些存在敏感信息或者疑似敏感信息的时间点被遗漏，另外，对于特定视频，需要逐一进行人工配置和人工确认。为了提高识别准确度，需要在系统验证的基础上，通过人工介入进行二次审核，费时费力。

针对现有技术中的多媒体数据识别方法识别效率和准确度低的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种多媒体数据识别方法和系统，以至少解决现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

根据本申请实施例的一个方面，提供了一种多媒体数据识别方法，包括：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

根据本申请实施例的另一方面，还提供了一种多媒体数据识别方法，包括：播放原始多媒体数据中采集到的第一数据；在第一数据中存在非法数据的情况下，播放从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据；在确定第二数据中存在非法数据的情况下，显示原始多媒体数据的识别结果，其中，识别结果用于表征原始多媒体数据属于非法多媒体数据。

根据本申请实施例的另一方面，还提供了一种多媒体数据识别系统，包括：识别设备，用于识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；录制设备，用于通过录制原始多媒体数据得到录制数据；识别设备，与录制设备连接，还用于如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

根据本申请实施例的另一方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行如下步骤：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

根据本申请实施例的另一方面，还提供了一种处理器，处理器用于运行程序，其中，程序运行时执行如下步骤：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

根据本申请实施例的另一方面，还提供了一种多媒体数据识别系统，包括：处理器；以及存储器，与处理器连接，用于为处理器提供处理以下处理步骤的指令：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

在本申请实施例中，可以识别从原始多媒体数据中采集到的第一数据中是否存在非法数据，当第一数据中存在非法数据时，进一步获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，当确定第二数据中存在非法数据时，可以确定原始多媒体数据属于非法多媒体数据，从而实现多媒体数据审核的目的。

容易注意到的是，由于在确定第一数据中存在非法数据之后，会通过原始多媒体数据或录制数据中采集到的第二数据进行识别，来确定原始多媒体数据是否属于非法多媒体数据，与现有技术相比，无需按照固定审核频率进行审核，而且无需通过人工进行二次审核，达到提高识别准确度，节省识别时间和成本，提高识别效率，提升用户体验感的技术效果。

由此，本申请提供的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例一种用于实现多媒体数据识别方法的计算机终端(或移动设备)的硬件结构框图；

图2是根据本申请实施例一种用于实现多媒体数据识别方法的计算机终端作为接收端的示意图；

图3是根据本申请实施例1的一种多媒体数据识别方法的流程图；

图4是根据本申请实施例的一种可选的多媒体数据识别方法的流程图；

图5是根据本申请实施例的另一种可选的多媒体数据识别方法的流程图；

图6是根据本申请实施例2的一种多媒体数据识别方法的流程图；

图7是根据本申请实施例3的一种多媒体数据识别装置的示意图；

图8是根据本申请实施例4的一种多媒体数据识别装置的示意图；

图9是根据本申请实施例5的一种多媒体数据识别系统的示意图；

图10是根据本申请实施例5的一种可选的多媒体数据识别系统的示意图；

图11是根据本申请实施例5的另一种可选的多媒体数据识别系统的示意图；以及

图12是根据本申请实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释：

网络直播：可以是同一时间通过网络在不同的交流平台观看视频。

敏感信息：涉及色情、低俗、暴力等不良行为的内容。

CDN：内容分发网络，全称是Content Delivery Network，通过在网络各处放置节点服务器所构成的在现有的互联网基础之上的一层智能虚拟网络，能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。

OSS存储服务：对象存储服务，Object Storage Service，是一种海量、安全、低成本、高可靠的云存储服务器。

实施例1

根据本申请实施例，提供了一种多媒体数据识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现多媒体数据识别方法的计算机终端(或移动设备)的硬件结构框图。如图1所示，计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b，……，102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外，还可以包括：显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外，数据处理电路可为单个独立的处理模块，或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的识别设备，该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的多媒体数据识别方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的多媒体数据识别方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

图1示出的硬件结构框图，不仅可以作为上述计算机终端10(或移动设备)的示例性框图，还可以作为上述服务器的示例性框图，一种可选实施例中，图2以框图示出了使用上述图1所示的计算机终端10(或移动设备)作为接收端的一种实施例。如图2所示，计算机终端10(或移动设备)可以经由数据网络连接或电子连接到一个或多个客户端。一种可选实施例中，上述计算机终端10(或移动设备)可以是服务器。数据网络连接可以是局域网连接、广域网连接、因特网连接，或其他类型的数据网络连接。计算机终端10(或移动设备)可以执行以连接到由一个服务器(例如安全服务器)或一组服务器执行的网络服务。网络服务器是基于网络的用户服务，诸如社交网络、云资源、电子邮件、在线支付或其他在线应用。

在上述运行环境下，本申请提供了如图3所示的多媒体数据识别方法。图3是根据本申请实施例1的一种多媒体数据识别方法的流程图。如图3所示，该方法可以包括如下步骤：

步骤S32，识别从原始多媒体数据中采集到的第一数据中是否存在非法数据。

可选地，非法数据用于表征属于敏感信息的概率大于或等于预设概率的数据。

具体地，上述的非法数据可以是敏感信息或者疑似敏感信息。

步骤S34，如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据。

具体地，由于原始多媒体数据在直播过程中，为了提高识别准确度，可以按照指令的格式对原始多媒体数据进行录制，从而可以通过对录制数据进行二次审核；在多媒体数据为视频的场景中，上述的第二数据可以是图像。

需要说明的是，为了避免遗漏存在非法数据的时间点，提高识别准确度，可以将用于截取第一数据的截取频率调高，也即将截取周期缩短，从而能够获取到更多的第二数据。

步骤S36，识别第二数据中是否存在非法数据。

需要说明的是，由于截取第一数据的截取频率和截取第二数据的截取频率不同，获取到的第一数据和第二数据可以相同也可以不同，从而第二数据中存在的非法数据与第一数据中存在的非法数据可以相同，也可以不同。

步骤S38，如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

在一种可选的方案中，在视频直播的过程中，可以通过视频审核服务器对原始视频进行截图，并判断第一图像中是否存在敏感信息或者疑似敏感信息，如果不存在，则继续按照原始截取频率对原始视频进行截图，如果存在，则可以将截图的截取频率调高，按照调整后的截取频率对原始视频进行截图，进一步判断第二图像中是否存在敏感信息或者疑似敏感信息，如果存在，则可以确定原始视频中存在敏感信息，该原始视频属于违禁视频，上传该视频的主播为违禁主播。

在另一种可选的方案中，在视频直播的过程中，可以预先按照指定的格式，录制成录制视频并进行保存，同时可以通过视频审核服务器对原始视频进行截图，并判断第一图像中是否存在敏感信息或者疑似敏感信息，如果不存在，则继续对原始视频进行截图，如果存在，则可以将截图的截取频率调高，按照调整后的截取频率对预先录制好的录制视频进行截图，进一步判断第二图像中是否存在敏感信息或者疑似敏感信息，如果存在，则可以确定原始视频中存在敏感信息，该原始视频属于违禁视频，上传该视频的主播为违禁主播。

需要说明的是，对于上述两种方案，在实际审核过程中，可以根据需要进行选择，可以选择仅采用其中的一种方案，也可以将两种方案进行结合。

还需要说明的是，在通过对原始视频进行审核之后，可以及时将每次审核结果回调给用户，从而第一时间实时通知用户违禁视频以及需要重点审核关注的主播。

图4是根据本申请实施例的一种可选的多媒体数据识别方法的流程图，图5是根据本申请实施例的另一种可选的多媒体数据识别方法的流程图，下面结合图4和图5以视频直播的应用场景为例对本申请优选的实施例进行详细说明。

如图4和图5所示的多媒体数据识别系统主要包括如下部分：主播、用户、CDN节点、CDN直播中心源站、视频直播截图服务、视频直播录制服务、OSS存储服务、视频直播视频审核服务和视频直播二次复审服务。其中，主播可以通过直播平台自有推流工具，OBS推流设备、手机等设备，在通过合法性验证之后，即可进行直播推流；CDN节点可以是直播CDN边缘节点，方便用户就近访问，可以缩短用户访问直播推流的时延；CDN直播中心源站可以是直播CDN源站，接收并存储直播的多媒体数据；视频截图服务主要针对视频的截图服务，在视频审核中，截图是主要的审核手段；视频直播录制服务主要用于将实时直播视频按照指定的格式，录制成视频文件并进行保存；OSS存储服务用于存储录制的视频；视频直播视频审核服务主要用于可以接收视频截图服务产生的截图，并进行视频审核以及结果回调；视频直播二次复审服务主要用于针对视频直播视频审核服务的初审结果，进行规则定制，并通过设置的审核规则，对初审结果进行自动的复审，其中，复审依赖于原始视频的录制视频。

如图4所示，在一种优选的实施例中，主播将原始视频直播推流给CDN节点(如图4中的步骤41所示)，由CDN节点直播推流给CDN直播中心源站(如图4中的步骤42所示)，视频直播截图服务可以从CDN直播中心源站中进行截图拉流(如图4中的步骤43所示)，并判断是否进行高频审核截图(如图4中的步骤44所示)，如果不进行高频审核截图，则按照全局审核频率，例如10s一次关键帧审核频率进行截图(如图4中的步骤45所示)，视频直播视频审核服务可以对截图进行审核，判断截图中是否存在敏感信息或者疑似敏感信息(如图4中的步骤46所示)，如果存在，则触发疑似违禁阈值，并配置视频直播截图服务进行高频审核截图(如图4中的步骤47所示)，视频直播截图服务确定进行高频审核截图，可以按照高频审核频率，例如1s一次非关键帧审核频率进行截图，视频直播视频审核服务可以对截图进行审核(如图4中的步骤48所示)，并回调用户(如图4中的步骤49所示)。

通过上述方案，一旦视频审核系统发现有截图存在敏感信息或者疑似敏感信息，则自动触发审核频率自适应调整，下发指令至截图系统，即可开始对原始视频进行调整后的高频审核频率进行审核，并回调用户，从而达到在视频直播过程中提升视频审核的识别率，并减少人工介入。

如图5所示，在另一种优选的实施例中，图5中步骤51至53与图4中的步骤41至43相同，视频直播截图服务可以按照全局审核频率进行截图(如图5中的步骤54所示)，视频直播视频审核服务可以通过用户配置的视频审核规则对截图进行审核(如图5中的步骤55所示)，判断截图中是否存在敏感信息或者疑似敏感信息，并将审核结果回调用户(如图5中的步骤56所示)，如果存在，则触发视频直播二次复审服务自动进行二次审核(如图5中的步骤57所示)。视频直播录制服务可以从CDN直播中心源站中进行录制拉流(如图5中的步骤58所示)，并将录制视频存储在OSS存储服务器(如图5中的步骤59所示)，视频直播二次复审服务从OSS存储服务中获取需要二次审核时间段的录制视频(如图5中的步骤510所示)，也即，可以获取敏感时间点往前一段时间或者前后一段时间的录制视频，针对录制视频，重新截图，截图周期小于全局截图周期，例如3s一次关键帧审核频率进行截图，并通过用户配置的视频审核次复审规则对录制视频进行审核(如图5中的步骤511所示)，判断截图中是否存在敏感信息或者疑似敏感信息，如果存在，则在审核结果回调用户(如图5中的步骤512所示)的同时，保留证据视频打标，并保存到指定存储目录中(如图5中的步骤513所示)。

通过上述方案，可以在视频直播中实时进行内容审核，并在发现敏感信息或者疑似敏感信息时，进行自动二次审核，从而达到在视频直播过程中提升视频审核的识别率，并减少人工介入。

需要说明的是，如图4和图5所示的视频直播截图服务、视频直播录制服务、OSS存储服务、视频直播视频审核服务和视频直播二次复审服务可以是同一个服务器中的服务，也可以是不同服务器中的服务，也即，分别对应的服务器为视频直播截图服务器、视频直播录制服务器、OSS存储服务器、视频直播视频审核服务器和视频直播二次复审服务器。

本申请上述实施例1所提供的方案，可以识别从原始多媒体数据中采集到的第一数据中是否存在非法数据，当第一数据中存在非法数据时，进一步获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，当确定第二数据中存在非法数据时，可以确定原始多媒体数据属于非法多媒体数据，从而实现多媒体数据审核的目的。

由此，本申请提供的上述实施例1的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

本申请上述实施例中，在步骤S34，获取从录制数据中采集到的第二数据之前，该方法还可以包括如下步骤：

步骤S310，获取第一数据在原始多媒体数据中的播放时间。

步骤S312，确定播放时间对应的录制时间段，其中，录制时间段为播放时间之前或之后的预设时间段。

具体地，为了提高识别准确度，在第一次审核之后，需要对第一次审核中的敏感时间点进行二次复审，为了确保二次复审的准确度，可以获取敏感时间点附近的原始视频；上述的预设时间段可以是用户希望能够获取到的录制视频的录制时间，可以根据实际识别准确度、识别效率以及成本进行配置。

步骤S314，通过录制该录制时间段内的原始多媒体数据，得到录制数据。

在一种可选的方案中，在视频直播过程中，当确定某个截图图像中存在敏感信息或者疑似敏感信息时，可以选取该图像的播放时间前后一段时间或前一段时间作为录制时间，并录制相应的原始视频，得到录制视频。

需要说明的是，为了确保能够及时录制原始视频，可以在视频直播的同时，对整个原始视频进行录制，当确定某个截图图像中存在敏感信息或者疑似敏感信息时，可以从整个录制视频中选择该图像的播放时间前后一段时间或前一段时间的录制视频，得到需要进行截图的录制视频。

还需要说明的是，步骤S314可以变更为：从对整个原始视频进行录制所得到的视频文件中，获取录制时间段对应的视频，得到录制视频。

本申请上述实施例中，在确定原始多媒体数据属于非法多媒体数据之后，标记录制数据，并存储标记后的录制数据。

在一种可选的方案中，在视频直播的过程中，由于对原始视频进行录制，为了保留相应的证据，在确定录制视频中存在敏感信息或者疑似敏感信息，也即确定视频属于非法视频之后，可以对该录制视频进行标记，并对标记后的录制视频进行存储，从而当需要证明视频属于非法视频的证据时，可以根据标记直接从大量的录制视频中快速获取到存在敏感信息或者疑似敏感信息的录制视频。

通过上述方案，通过将录制数据进行标记以及存储，从而达到提升识别可靠性的效果。

本申请上述实施例中，在第二数据是从原始多媒体数据中采集到的情况下，该方法可以包括如下步骤：

步骤S316，在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据。

具体地，上述的第一采集频率可以是全局审核频率，例如可以是10s一次关键帧审核频率，可以由用户进行设置。

步骤S318，当第一数据中存在非法数据时，调高第一采集频率，得到调整后的第一采集频率。

具体地，上述的调整后的第一采集频率可以是高频审核频率，例如可以是1s一次非关键帧审核频率，可以由用户进行设置。

步骤S320，按照调整后的第一采集频率截取原始多媒体数据，得到第二数据。

在一种可选的方案中，如图4所示，对于视频直播截图服务，在原始视频开始直播之后，首先按照第一采集频率进行截图，并将第一图像传输给视频直播视频审核服务进行审核，如果第一图像中存在敏感信息或者疑似敏感信息，则不再按照第一采集频率进行截图，改为按照调整后的第一采集频率进行截图，得到第二图像，并将第二图像传输给视频直播视频审核服务进行审核，从而确定原始视频是否属于非法视频。

本申请上述实施例中，在第二数据是从录制数据中采集到的情况下，该方法可以包括如下步骤：

步骤S322，在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据。

具体地，上述的第一采集频率可以是常规审核频率，例如可以是10s一次，可以由用户进行设置。

步骤S324，当第一数据中存在非法数据时，按照第二采集频率截取录制数据，得到第二数据，且，按照第一采集频率继续截取原始多媒体数据，其中，第二采集频率大于第一采集频率。

具体地，上述的第二采集频率可以为常规审核频率高，也即截图的周期比常规端，例如，常规审核频率是10s一次，则第二采集频率可以是3s一次，可以由用户进行设置。

在一种可选的方案中，如图5所示，由于视频直播二次复审服务是对录制视频进行审核，与视频直播视频审核服务可以同时进行，因此，对于视频直播截图服务，可以在原始视频直播过程中始终按照第一采集频率对原始视频进行截图，并将第一图像传输给视频直播视频审核服务进行审核，一旦发现第一图像中存在敏感信息或者疑似敏感信息，则可以触发按照第二采集频率对录制视频进行截图，并将第二图像传输给视频直播二次复审服务进行审核，从而实现自动进行视频二次审核。

本申请上述实施例中，步骤S32，识别第一数据中是否存在非法数据，或步骤S36，识别第二数据中是否存在非法数据包括：

步骤S326，确定第一数据或第二数据的打分值。

步骤S328，将第一数据与第一预设打分值和第二预设打分值进行比较，或将第二数据的打分值与第一预设打分值和第二预设打分值进行比较。

具体地，上述的第一预设打分值可以是确定第一数据或第二数据存在敏感信息或疑似敏感信息的疑似违规阈值，上述的第二预设打分值可以是确定第一数据或第二数据不存在敏感信息或疑似敏感信息的未违规阈值，例如，如果违禁敏感分数是90分，及格是60分，则可以预先设置80-90分区间，作为疑似违规阈值，并预先设置60分为未违规阈值，如果图像的打分值大于或等于该阈值，可以确定图像中存在敏感信息或者疑似敏感信息，需要调整审核频率或者进行二次审核。

需要说明的是，在如图4所示的实施例中，疑似违规阈值可以设置成多个，不同疑似违规阈值对应的审核频率不同，疑似违规阈值内打分值越高，表明图像中存在敏感信息或者疑似敏感信息的概率越高，为了提高识别准确度，对应的审核频率越高，截图周期越短，从而可以及时确定原始视频是否属于非法视频。

步骤S330，如果第一数据或第二数据的打分值大于或等于第一预设打分值，则确定第一数据或第二数据中存在非法数据。

步骤S332，如果第一数据或第二数据的打分值小于或等于第二预设打分值，则确定第一数据或第二数据中不存在非法数据。

在一种可选的方案中，为了实现对原始视频进行审核，可以通过对第一图像或者第二图像进行打分，判断第一图像或者第二图像的打分值是否大于或等于疑似违禁阈值，如果大于或等于，则可以确定第一数据或第二数据中存在敏感信息或者疑似敏感信息；如果小于，则进一步判断第一图像或者第二图像的打分值是否小于或等于未违规阈值，如果小于或等于，则可以确定第一数据或第二数据中不存在敏感信息或者疑似敏感信息。

本申请上述实施例中，在步骤S32，识别从原始多媒体数据中采集到的第一数据中是否存在非法数据之前，从源服务器中获取原始多媒体数据，其中，原始多媒体数据由推送设备推送至源服务器。

具体地，上述源服务器可以是如图4和图5所示的CDN直播中心源站，上述的推送设备可以是图4和图5中主播使用的推流工具，OBS推流设备、手机等设备。

在一种可选的方案中，如图4和图5所示，主播可以通过直播平台自有推流工具，OBS推流设备、手机等设备，在通过合法性验证之后，将原始视频直播推流给CDN节点，由CDN节点直播推流给CDN直播中心源站进行存储，从而视频直播截图服务可以对原始视频进行截图，视频直播录制服务可以对原始视频进行录制。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

实施例2

根据本申请实施例，还提供了一种多媒体数据识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图6是根据本申请实施例2的一种多媒体数据识别方法的流程图。如图6所示，该方法可以包括如下步骤：

步骤S62，播放从原始多媒体数据中采集到的第一数据。

具体地，上述的原始多媒体数据可以是当前直播的视频、音频等，在原始多媒体数据直播过程中，可以通过对原始多媒体数据进行截取，例如，对视频进行截图，从而采集到第一数据，上述的第一数据可以是图像、音频等，本申请对此不做具体限定，在本申请实施例中，以多媒体数据为视频为例进行详细说明。

步骤S64，在第一数据中存在非法数据的情况下，播放从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据。

可选地，非法数据用于表征属于敏感信息的概率大于或等于预设概率的数据。

具体地，由于原始多媒体数据是由用户拍摄上传的，为了确保原始多媒体数据的有效健康，需要判断原始多媒体数据中是否存在非法数据，上述的非法数据可以是敏感信息或者疑似敏感信息；于原始多媒体数据在直播过程中，为了提高识别准确度，可以按照指令的格式对原始多媒体数据进行录制，从而可以通过对录制数据进行二次审核；在多媒体数据为视频的场景中，上述的第二数据可以是图像。

步骤S66，在第二数据中存在非法数据的情况下，显示原始多媒体数据的识别结果，其中，识别结果用于表征原始多媒体数据属于非法多媒体数据。

需要说明的是，对于上述两种方案，在实际审核过程中，可以根据需要进行选择，可以选择仅采用其中的一种方案，也可以将两种方案进行结合。

本申请上述实施例2所提供的方案，可以播放从原始多媒体数据中采集到的第一数据，可以识别第一数据中是否存在非法数据，在第一数据中存在非法数据的情况下，播放从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，在第二数据中存在非法数据的情况下，显示原始多媒体数据的识别结果，从而实现多媒体数据审核的目的。

由此，本申请提供的上述实施例2的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

实施例3

根据本申请实施例，还提供了一种用于实施上述多媒体数据识别方法的多媒体数据识别装置，如图7所示，该装置700包括：第一识别模块702、获取模块704、第二识别模块706和确定模块708。

其中，第一识别模块702用于识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；获取模块704用于如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据；第二识别模块706用于识别第二数据中是否存在非法数据；确定模块708用于如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

可选地，非法数据用于表征属于敏感信息的概率大于或等于预设概率的数据。

具体地，上述的原始多媒体数据可以是当前直播的视频、音频等，在原始多媒体数据直播过程中，可以通过对原始多媒体数据进行截取，例如，对视频进行截图，从而采集到第一数据，上述的第一数据可以是图像、音频等，本申请对此不做具体限定，在本申请实施例中，以多媒体数据为视频为例进行详细说明；由于原始多媒体数据是由用户拍摄上传的，为了确保原始多媒体数据的有效健康，需要判断原始多媒体数据中是否存在非法数据，上述的非法数据可以是敏感信息或者疑似敏感信息；由于原始多媒体数据在直播过程中，为了提高识别准确度，可以按照指令的格式对原始多媒体数据进行录制，从而可以通过对录制数据进行二次审核；在多媒体数据为视频的场景中，上述的第二数据可以是图像。

此处需要说明的是，上述第一识别模块702、获取模块704、第二识别模块706和确定模块708对应于实施例1中的步骤S32至步骤S38，四个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

本申请上述实施例3所提供的方案，可以识别从原始多媒体数据中采集到的第一数据中是否存在非法数据，当第一数据中存在非法数据时，进一步获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，当确定第二数据中存在非法数据时，可以确定原始多媒体数据属于非法多媒体数据，从而实现多媒体数据审核的目的。

由此，本申请提供的上述实施例3的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

本申请上述实施例中，该装置还包括：录制模块。

其中，获取模块还用于获取第一数据在原始多媒体数据中的播放时间；确定模块还用于确定播放时间对应的录制时间段，其中，录制时间段为播放时间之前或之后的预设时间段；录制模块还用于通过录制该录制时间段内的原始多媒体数据，得到录制数据。

本申请上述实施例中，该装置还包括：第一截取模块、调整模块和第二截取模块。

其中，第一截取模块用于在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据；调整模块用于第一数据中存在非法数据时，调高第一采集频率，得到调整后的第一采集频率；第二截取模块用于按照调整后的第一采集频率截取原始多媒体数据，得到第二数据。

本申请上述实施例中，该装置还包括：第一截取模块和第三截取模块。

其中，第一截取模块用于在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据；第三截取模块用于当第一数据中存在非法数据时，按照第二采集频率截取录制数据，得到第二数据，其中，第二采集频率大于第一采集频率；第一截取模块还用于当第一数据中存在非法数据时，按照第一采集频率继续截取原始多媒体数据。

本申请上述实施例中，第一识别模块或第二识别模块包括：第一确定单元、比较单元和第二确定单元。

其中，第一确定单元用于确定第一数据或第二数据的打分值；判断单元用于将第一数据与第一预设打分值和第二预设打分值进行比较，或将第二数据的打分值与第一预设打分值和第二预设打分值进行比较；第二确定单元用于如果第一数据或第二数据的打分值大于或等于第一预设打分值，则确定第一数据或第二数据中存在非法数据，如果第一数据或第二数据的打分值小于或等于第二预设打分值，则确定第一数据或第二数据中不存在非法数据。

本申请上述实施例中，获取模块还用于从源服务器中获取原始多媒体数据，其中，原始多媒体数据由推送设备推送至源服务器。

实施例4

根据本申请实施例，还提供了一种用于实施上述多媒体数据识别方法的多媒体数据识别装置，如图8所示，该装置800包括：第一播放模块802、第二播放模块804、和显示模块806。

其中，第一播放模块802用于播放从原始多媒体数据中采集到的第一数据；第二播放模块804用于在第一数据中存在非法数据的情况下，播放从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据得到的数据；显示模块806用于在第二数据中存在非法数据的情况下，显示原始多媒体数据的识别结果，其中，识别结果用于表征原始多媒体数据属于非法多媒体数据。

可选地，非法数据用于表征属于敏感信息的概率大于或等于预设概率的数据。

具体地，上述的原始多媒体数据可以是当前直播的视频、音频等，在原始多媒体数据直播过程中，可以通过对原始多媒体数据进行截取，例如，对视频进行截图，从而采集到第一数据，上述的第一数据可以是图像、音频等，本申请对此不做具体限定，在本申请实施例中，以多媒体数据为视频为例进行详细说明；由于原始多媒体数据是由用户拍摄上传的，为了确保原始多媒体数据的有效健康，需要判断原始多媒体数据中是否存在非法数据，上述的非法数据可以是敏感信息或者疑似敏感信息；于原始多媒体数据在直播过程中，为了提高识别准确度，可以按照指令的格式对原始多媒体数据进行录制，从而可以通过对录制数据进行二次审核；在多媒体数据为视频的场景中，上述的第二数据可以是图像。

此处需要说明的是，上述第一播放模块802、第二播放模块804、和显示模块806对应于实施例2中的步骤S62至步骤S66，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例2所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。

本申请上述实施例4所提供的方案，可以播放从原始多媒体数据中采集到的第一数据，可以识别第一数据中是否存在非法数据，在第一数据中存在非法数据的情况下，播放从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，在第二数据中存在非法数据的情况下，显示原始多媒体数据的识别结果，从而实现多媒体数据审核的目的。

由此，本申请提供的上述实施例4的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

实施例5

根据本申请实施例，还提供了一种多媒体数据识别系统的实施例。

图9是根据本申请实施例5的一种多媒体数据识别系统的示意图。如图9所示，该系统可以包括：识别设备92和录制设备94。

其中，识别设备92用于识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；录制设备94用于通过录制原始多媒体数据得到录制数据；识别设备与录制设备连接，还用于如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

可选地，非法数据用于表征属于敏感信息的概率大于或等于预设概率的数据。

具体地，上述的识别设备可以是用于对原始多媒体数据进行识别的服务器，该服务器可以运行如图4和图5所示的视频直播视频审核服务和视频直播二次复审服务，上述的录制设备可以是用于对原始多媒体数据进行录制的服务器，该服务器可以运行如图4和图5所示的视频直播录制服务，两个服务器可以通过互联网进行连接；上述的原始多媒体数据可以是当前直播的视频、音频等，在原始多媒体数据直播过程中，可以通过对原始多媒体数据进行截取，例如，对视频进行截图，从而采集到第一数据，上述的第一数据可以是图像、音频等，本申请对此不做具体限定，在本申请实施例中，以多媒体数据为视频为例进行详细说明；由于原始多媒体数据是由用户拍摄上传的，为了确保原始多媒体数据的有效健康，需要判断原始多媒体数据中是否存在非法数据，上述的非法数据可以是敏感信息或者疑似敏感信息；由于原始多媒体数据在直播过程中，为了提高识别准确度，可以按照指令的格式对原始多媒体数据进行录制，从而可以通过对录制数据进行二次审核；在多媒体数据为视频的场景中，上述的第二数据可以是图像。

需要说明的是，对于上述两种方案，在实际审核过程中，可以根据需要进行选择，可以选择仅采用其中的一种方案，也可以将两种方案进行结合。

本申请上述实施例5所提供的方案，可以识别从原始多媒体数据中采集到的第一数据中是否存在非法数据，当第一数据中存在非法数据时，进一步获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，当确定第二数据中存在非法数据时，可以确定原始多媒体数据属于非法多媒体数据，从而实现多媒体数据审核的目的。

由此，本申请提供的上述实施例5的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

本申请上述实施例中，录制设备包括：处理器和录制装置。

其中，处理器用于获取第一数据在原始多媒体数据中的播放时间，并确定播放时间对应的录制时间段，其中，录制时间段为播放时间之前或之后的预设时间段；录制装置与处理器连接，用于通过录制该录制时间段内的原始多媒体数据，得到录制数据。

还需要说明的是，录制设备可以对整个原始多媒体数据进行录制，并由识别设备获取第一数据在原始多媒体数据中的播放时间，并确定播放时间对应的录制时间段，从而可以从录制设备中获取到对应的录制数据。

本申请上述实施例中，如图10所示，该系统还可以包括：存储设备96。

其中，识别设备还用于在确定原始多媒体数据属于非法多媒体数据之后，标记录制数据；存储设备与识别设备连接，用于存储标记后的录制数据。

具体地，上述的存储设备可以是用于对录制视频进行存储的服务器，该服务器可以运行如图4和图5所示的OSS存储服务，与其他两个服务器可以通过互联网进行连接。

通过上述方案，通过将录制数据进行标记以及存储，从而达到提升识别可靠性的效果。

本申请上述实施例中，如图10所示，该系统还可以包括：第一截取设备98。

其中，第一截取设备与识别设备连接，用于在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据，当第一数据中存在非法数据时，调高第一采集频率，得到调整后的第一采集频率，并按照调整后的第一采集频率截取原始多媒体数据，得到第二数据。

具体地，上述的第一截取设备可以是用于对原始视频进行截图的服务器，该服务器可以运行如图4和图5所示的视频直播截图服务，与其他三个服务器可以通过互联网进行连接；上述的第一采集频率可以是全局审核频率，例如可以是10s一次关键帧审核频率，可以由用户进行设置；上述的调整后的第一采集频率可以是高频审核频率，例如可以是1s一次非关键帧审核频率，可以由用户进行设置。

本申请上述实施例中，如图11所示，该系统还可以包括：第一截取设备98和第二截取设备910。

其中，第一截取设备与识别设备连接，用于在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据，当第一数据中存在非法数据时，按照第一采集频率继续截取原始多媒体数据；第二截取设备，与识别设备和录制设备连接，用于当第一数据中存在非法数据时，按照第二采集频率截取录制数据，得到第二数据，其中，第二采集频率大于第一采集频率。

具体地，上述的第一截取设备可以是用于对原始视频进行存储的服务器，上述的第二截取设备可以是用于对录制视频进行存储的服务器，两个服务器可以运行如图4和图5所示的视频直播截图服务，与其他三个服务器可以通过互联网进行连接；上述的第一采集频率可以是常规审核频率，例如可以是10s一次，可以由用户进行设置；上述的第二采集频率可以为常规审核频率高，也即截图的周期比常规端，例如，常规审核频率是10s一次，则第二采集频率可以是3s一次，可以由用户进行设置。

本申请上述实施例中，识别设备还用于确定第一数据或第二数据的打分值，将第一数据与第一预设打分值和第二预设打分值进行比较，或将第二数据的打分值与第一预设打分值和第二预设打分值进行比较，如果第一数据或第二数据的打分值大于或等于第一预设打分值，则确定第一数据或第二数据中存在非法数据，如果第一数据或第二数据的打分值小于或等于第二预设打分值，则确定第一数据或第二数据中不存在非法数据。

本申请上述实施例中，该系统还可以包括：推送设备和源服务器。

其中，推送设备用于推送原始多媒体数据；源服务器，与推送设备、第一截图设备和录制设备连接，用于存储原始多媒体数据。

实施例6

根据本申请实施例，还提供了一种多媒体数据识别系统的实施例，包括：

处理器。以及

存储器，与处理器连接，用于为处理器提供处理以下处理步骤的指令：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据进行录制得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

本申请上述实施例6所提供的方案，可以识别从原始多媒体数据中采集到的第一数据中是否存在非法数据，当第一数据中存在非法数据时，进一步获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，当确定第二数据中存在非法数据时，可以确定原始多媒体数据属于非法多媒体数据，从而实现多媒体数据审核的目的。

由此，本申请提供的上述实施例6的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

实施例7

本申请的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述计算机终端可以执行多媒体数据识别方法中以下步骤的程序代码：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据进行录制得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

可选地，图12是根据本申请实施例的一种计算机终端的结构框图。如图12所示，该计算机终端A可以包括：一个或多个(图中仅示出一个)处理器1202以及存储器1204。

其中，存储器可用于存储软件程序以及模块，如本申请实施例中的多媒体数据识别方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的多媒体数据识别方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据进行录制得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

可选的，上述处理器还可以执行如下步骤的程序代码：非法数据用于表征属于敏感信息的概率大于或等于预设概率的数据。

可选的，上述处理器还可以执行如下步骤的程序代码：在获取从录制数据中采集到的第二数据之前，获取第一数据在原始多媒体数据中的播放时间；确定播放时间对应的录制时间段，其中，录制时间段为播放时间之前或之后的预设时间段；通过录制该录制时间段内的原始多媒体数据，得到录制数据。

可选的，上述处理器还可以执行如下步骤的程序代码：在确定原始多媒体数据属于非法多媒体数据之后，标记录制数据，并存储标记后的录制数据。

可选的，上述处理器还可以执行如下步骤的程序代码：在第二数据是从原始多媒体数据中采集到的情况下，在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据；当第一数据中存在非法数据时，调高第一采集频率，得到调整后的第一采集频率；按照调整后的第一采集频率继续截取原始多媒体数据，得到第二数据。

可选的，上述处理器还可以执行如下步骤的程序代码：在第二数据是录制数据中采集到的情况下，在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据；当第一数据中存在非法数据时，按照第二采集频率截取录制数据，得到第二数据，且，按照第一采集频率继续截取原始多媒体数据，其中，第二采集频率大于第一采集频率。

可选的，上述处理器还可以执行如下步骤的程序代码：确定第一数据或第二数据的打分值；将第一数据与第一预设打分值和第二预设打分值进行比较，或将第二数据的打分值与第一预设打分值和第二预设打分值进行比较；如果第一数据或第二数据的打分值大于或等于第一预设打分值，则确定第一数据或第二数据中存在非法数据；如果第一数据或第二数据的打分值小于或等于第二预设打分值，则确定第一数据或第二数据中不存在非法数据。

可选的，上述处理器还可以执行如下步骤的程序代码：在识别从原始多媒体数据中采集到的第一数据中是否存在非法数据之前，从源服务器中获取原始多媒体数据，其中，原始多媒体数据由推送设备推送至源服务器。

采用本申请实施例，可以识别从原始多媒体数据中采集到的第一数据中是否存在非法数据，当第一数据中存在非法数据时，进一步获取从原始多媒体数据或录制数据中采集到的第二数据，并识别第二数据中是否存在非法数据，当确定第二数据中存在非法数据时，可以确定原始多媒体数据属于非法多媒体数据，从而实现多媒体数据审核的目的。

由此，本申请提供的方案解决了现有技术中的多媒体数据识别方法识别效率和准确度低的技术问题。

本领域普通技术人员可以理解，图12所示的结构仅为示意，计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices，MID)、PAD等终端设备。图12其并不对上述电子装置的结构造成限定。例如，计算机终端A还可包括比图12中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图12所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccess Memory，RAM)、磁盘或光盘等。

实施例8

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的多媒体数据识别方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：识别从原始多媒体数据中采集到的第一数据中是否存在非法数据；如果第一数据中存在非法数据，则获取从原始多媒体数据或录制数据中采集到的第二数据，其中，录制数据为通过录制原始多媒体数据进行录制得到的数据；识别第二数据中是否存在非法数据；如果第二数据中存在非法数据，则确定原始多媒体数据属于非法多媒体数据。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：非法数据用于表征属于敏感信息的概率大于或等于预设概率的数据。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在获取从录制数据中采集到的第二数据之前，获取第一数据在原始多媒体数据中的播放时间；确定播放时间对应的录制时间段，其中，录制时间段为播放时间之前或之后的预设时间段；通过录制该录制时间段内的原始多媒体数据，得到录制数据。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在确定原始多媒体数据属于非法多媒体数据之后，标记录制数据，并存储标记后的录制数据。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在第二数据是从原始多媒体数据中采集到的情况下，在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据；当第一数据中存在非法数据时，调高第一采集频率，得到调整后的第一采集频率；按照调整后的第一采集频率继续截取原始多媒体数据，得到第二数据。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在第二数据是录制数据中采集到的情况下，在原始多媒体数据的播放过程中，按照第一采集频率截取原始多媒体数据，得到第一数据；当第一数据中存在非法数据时，按照第二采集频率截取录制数据，得到第二数据，且，按照第一采集频率继续截取原始多媒体数据，其中，第二采集频率大于第一采集频率。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：确定第一数据或第二数据的打分值；将第一数据与第一预设打分值和第二预设打分值进行比较，或将第二数据的打分值与第一预设打分值和第二预设打分值进行比较；如果第一数据或第二数据的打分值大于或等于第一预设打分值，则确定第一数据或第二数据中存在非法数据；如果第一数据或第二数据的打分值小于或等于第二预设打分值，则确定第一数据或第二数据中不存在非法数据。

可选地，上述存储介质还被设置为存储用于执行以下步骤的程序代码：在识别从原始多媒体数据中采集到的第一数据中是否存在非法数据之前，从源服务器中获取原始多媒体数据，其中，原始多媒体数据由推送设备推送至源服务器。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

31页详细技术资料下载

多媒体数据识别方法和系统

相关技术

网友询问留言