多媒体文件的侵权检测方法、装置、电子设备及存储介质

文档序号:1904823 发布日期:2021-11-30 浏览:17次 >En<

阅读说明:本技术 多媒体文件的侵权检测方法、装置、电子设备及存储介质 (Multimedia file infringement detection method and device, electronic equipment and storage medium ) 是由 李锦春 于 2021-08-31 设计创作,主要内容包括:本申请实施例公开了一种多媒体文件的侵权检测方法、装置、电子设备及存储介质。该方法包括:获取多媒体文件的音频数据,以及影视文件的第一文本信息;对多媒体文件的音频数据进行语音文本转换处理,得到多媒体文件的第二文本信息;获取第一文本信息与第二文本信息之间的匹配度,匹配度用于表征第一文本信息与第二文本信息之间的相似程度;若第一文本信息与第二文本信息之间的匹配度大于预设匹配度阈值,则确定多媒体文件发生侵权。通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测多媒体文件是否发生侵权,该过程无需人工参与,从而节省人工成本,提高检测效率。(The embodiment of the application discloses an infringement detection method and device for a multimedia file, electronic equipment and a storage medium. The method comprises the following steps: acquiring audio data of a multimedia file and first text information of a movie file; performing voice text conversion processing on the audio data of the multimedia file to obtain second text information of the multimedia file; acquiring the matching degree between the first text information and the second text information, wherein the matching degree is used for representing the similarity degree between the first text information and the second text information; and if the matching degree between the first text information and the second text information is greater than a preset matching degree threshold value, determining that the multimedia file infringes. By the method, the first text information of the movie file and the second text information of the multimedia file are automatically matched through the server, whether the multimedia file infringes or not is detected based on the matching degree, manual participation is not needed in the process, accordingly, labor cost is saved, and detection efficiency is improved.)

多媒体文件的侵权检测方法、装置、电子设备及存储介质

技术领域

本申请涉及内容安全审核技术领域,更具体地,涉及一种多媒体文件的侵权检测方法、装置、电子设备及存储介质。

背景技术

随着互联网技术的发展,直播视频的应用也越来越广泛。然而,侵犯影视版权的直播视频也屡见不鲜。

为维护影视文件的版权,直播平台需要在诸多直播场次中快速地识别侵权的直播视频,并及时作出处罚。相关技术中,直播平台对直播视频进行侵权判断主要依靠人工审核,审核人员通过自身的影视文件储备来判断直播视频是否发生侵权。

相关技术提供的版权检测方法,人工成本耗费巨大,并且检测效率低下。

发明内容

鉴于上述问题,本申请提出了一种多媒体文件的侵权检测方法、装置、电子设备及存储介质,以解决上述技术问题。

第一方面,本申请提供了一种多媒体文件的侵权检测方法,应用于服务器,该方法包括:获取多媒体文件的音频数据,以及影视文件的第一文本信息;对多媒体文件的音频数据进行语音文本转换处理,得到多媒体文件的第二文本信息;获取第一文本信息与第二文本信息之间的匹配度,匹配度用于表征第一文本信息与第二文本信息之间的相似程度;若第一文本信息与第二文本信息之间的匹配度大于预设匹配度阈值,则确定多媒体文件发生侵权。

第二方面,本申请提供了一种多媒体文件的侵权检测方法,应用于终端,方法包括:显示影视文件登记页面,影视文件登记页面包括地址输入窗口;在地址输入窗口获取影视文件的获取地址;向服务器发送样本登记请求,样本登记请求携带影视文件的地址;服务器用于基于影视文件的获取地址,获取影视文件;对影视文件中的音频数据进行语音文本转换处理,得到影视文件的第一文本信息,基于第一文本信息与多媒体文件的第二文本信息之间的匹配度,确定多媒体文件是否发生侵权。

第三方面,本申请提供了一种多媒体文件的侵权检测装置,应用于服务器,该装置包括:第一获取模块,用于获取多媒体文件的音频数据,以及影视文件的第一文本信息;转写模块,用于对多媒体文件的音频数据进行语音文本转换处理,得到多媒体文件的第二文本信息;匹配模块,用于获取第一文本信息与第二文本信息之间的匹配度,匹配度用于表征第一文本信息与第二文本信息之间的相似程度;确定模块,用于若第一文本信息与第二文本信息之间的匹配度大于预设匹配度阈值,则确定多媒体文件发生侵权。

第四方面,本申请提供了一种多媒体文件的侵权检测装置,应用于终端,该装置包括:显示模块,用于显示影视文件登记页面,影视文件登记页面包括地址输入窗口;第二获取模块,用于在地址输入窗口获取影视文件的获取地址;发送模块,用于向服务器发送样本登记请求,样本登记请求携带影视文件的获取地址;服务器用于基于影视文件的获取地址,获取影视文件;对影视文件中的音频数据进行语音文本转换处理,得到影视文件的第一文本信息,基于第一文本信息与多媒体文件的第二文本信息之间的匹配度,确定多媒体文件是否发生侵权。

第五方面,本申请提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于执行上述的方法。

第六方面,本申请提供的一种存储有处理器可执行的程序代码的计算机可读存储介质,该计算机可读存储介质包括存储的程序代码,其中,在程序代码运行时执行上述的方法。

本申请提供一种多媒体文件的侵权检测方法、装置、电子设备及存储介质。在该方法中,会获取多媒体文件的音频数据和影视文件的第一文本信息,然后将多媒体文件的音频数据进行语音文本转换得到多媒体文件的第二文本信息,然后获取第一文本信息和第二文本信息之间的匹配度,若匹配度大于预设匹配度阈值,就能够确定多媒体文件发生侵权;通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测多媒体文件是否发生侵权,该过程无需人工参与,从而节省人工成本,提高检测效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本申请提出的一种多媒体文件的侵权检测方法的应用环境示意图;

图2示出了本申请提出的一种多媒体文件的侵权检测方法的流程图;

图3示出了本申请一实施例提出的一种多媒体文件的侵权检测方法的流程图;

图4示出了本申请中审核终端与服务器的交互流程图;

图5示出了本申请的影视文件登记页面的示意图;

图6示出了本申请的终端版权管理页面的示意图;

图7示出了本申请另一实施例提出的一种多媒体文件的侵权检测方法的流程图;

图8示出了本申请提供的一种多媒体文件的侵权检测装置的结构框图;

图9示出了本申请提供的一种多媒体文件的侵权检测装置的结构框图;

图10示出了本申请实施例提出的电子设备的结构框图;

图11示出了本申请实施例提出的计算机可读存储介质的结构框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例提供一种多媒体文件的侵权检测方法、装置、电子设备及存储介质,在该方法中,会获取多媒体文件的音频数据和影视文件的第一文本信息,然后将多媒体文件的音频数据进行语音文本转换得到多媒体文件的第二文本信息,然后获取第一文本信息和第二文本信息之间的匹配度,若匹配度大于预设匹配度阈值,就能够确定多媒体文件发生侵权;通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测多媒体文件是否发生侵权,该过程无需人工参与,从而节省人工成本,提高检测效率。

下面对本申请实施例提供的多媒体文件的侵权检测方法涉及的实施环境进行介绍。

请参阅图1,图1是本申请提出的一种多媒体文件的侵权检测方法的应用环境示意图。如图1所示,该实施环境可以包括服务器110、审核终端120以及直播终端130。

服务器110可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,还可以是提供车联网服务、路网协同、车路协同、智能交通、自动驾驶、工业互联网服务、数据通信(如4G、5G等)等专门或平台服务器。

在本申请实施例中,服务器110具有版权检测功能,也即计算多媒体文件的音频数据转换得到的文本信息,与影视文件的音频文件的音频数据转换得到的文本信息之间的匹配度,来判断多媒体文件是否侵犯影视文件的版权。其中,上述影视文件是审核人员通过审核终端120指定的影视文件。

审核终端120可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。可选地,审核人员通过审核终端120访问影视文件版权管理平台,并在影视文件管理平台上管理影视文件的版权,例如设置需要进行版权检测的影视文件、设置侵权判断条件(也即预设匹配度阈值)、设置侵权惩罚措施(也即处置手段等等)。在一些实施例中,审核终端120上运行有影视文件版权管理客户端,通过上述影视文件版权管理客户端实现上述影视文件版权管理功能。审核终端120以及服务器110可以通过有线或无线通信方式进行直接或间接地连接,本申请对此不做限制。

其中,直播终端130可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。在本申请实施例中,直播终端130具有直播功能。可选地,直播终端130上运行有客户端,通过客户端实现上述直播功能,客户端包括且不限于直播客户端、浏览器客户端、即时通讯类客户端、内容交互类客户端、短视频客户端或者购物类客户端等。直播终端130以及服务器110可以通过有线或无线通信方式进行直接或间接地连接,本申请对此不做限制。

具体实现时,服务器110获得审核终端120发送的样本等级登记请求,样本登记请求中包含影视文件的获取地址、预设匹配度阈值以及处置手段,服务器110从获取地址中获取影视文件。服务器110获得直播终端130发送的多媒体文件音频数据,通过执行本申请提供的多媒体文件的侵权检测方法,将影视文件的音频数据语音文本转换成第一文本信息,将多媒体文件音频数据语音文本转换成第二文本信息,然后通过匹配算法确定检测结果。若确定多媒体文件发生侵权,服务器110便对直播终端130中的多媒体文件对应的用户帐号采取处置手段。

请参阅图2,服务器将获取到的影视样本的音频数据进行切片和自动语音识别处理,将得到的文本信息存入到影视样本字幕近似库中。然后服务器再从直播流中获取音频数据,对音频数据切片成音频片段并缓存下来,然后进行自动语音识别处理,得到片段文本信息。最后,再将片段文本信息和影视样本字幕近似库中的文本信息进行匹配,检出结果。

下面将结合附图具体描述本申请的各实施例。

请参阅图3,本申请提供的一种多媒体文件的侵权检测方法,应用于服务器。该方法包括:

S210,获取多媒体文件的音频数据,以及影视文件的第一文本信息。

在一些实施例中,多媒体文件包括直播流。在另一些实施例中,多媒体文件包括用户在视频平台上传的视频文件。

当多媒体文件包括直播流时,多媒体文件的音频数据由直播终端的麦克风组件采集得到。在一些实施例中,服务器获取直播终端发送的多媒体文件的音频数据。在另一些实施例中,服务器获取推流服务器发送的多媒体文件的音频数据,推流服务器用于接收直播终端上传的多媒体文件,并向观看直播的各个观众终端发送多媒体文件。当多媒体文件包括用户在视频平台上上传的视频文件时,服务器从视频平台对应的服务器获取多媒体文件的音频数据。

影视文件可以是一个,也可以是多个。在一些实施例中,影视文件是影视样本字幕近似库中的所有影视文件。在另一些实施例中,影视文件是审核人员所登记的影视文件。在另一些实施例中,影视文件是审核人员指定的目标影视文件。影视文件的第一文本信息是对影视文件的音频数据语音文本转换处理得到的文本信息。可选地,服务器从影视样本近似库中获取影视文件的第一文本信息。

在一些实施例中,在获取多媒体文件的音频数据之前,还需要检测多媒体文件对应的帐号是否具有影视文件的版权,例如影视剧的官方账号,视频播放平台的官方账号,均有可能具有部分影视文件的版权。在确认多媒体文件对应的帐号不具有该影视文件的版权,则执行获取多媒体文件的音频数据的步骤;若确认多媒体文件对应的账号具有该影视文件的版权,则无需执行后续的侵权检测步骤。这样可以避免对具有影视文件版权的帐号的误处理,影响多媒体文件的播放。

S220,对多媒体文件的音频数据进行语音文本转换处理,得到多媒体文件的第二文本信息。

在本申请实施例中,服务器通过自动语音识别技术,将多媒体文件的音频数据转换成文本数据,得到第二文本信息。在一些实施例中,自动语音识别技术可以是随机模型算法,采用提取特征、训练模板、对模板进行分类及对模板进行判断的步骤来对语音进行识别,随机模型算法包括动态时间规整、隐马尔科夫模型理论和矢量量化技术等。在另一些实施例中,自动语音识别技术也可以是神经网络算法,通过对音频数据的反复学习训练,逐步调整改变神经元连接权重的方法,来对语音进行识别。

在一些实施例中,服务器将多媒体文件的音频数据划分为至少一个音频子数据,之后对上述音频子数据进行语音文本转换处理,得到每个音频子数据的第二文本信息。这样可以实现对多媒体文件的实时语音文本转换。可选地,服务器将多媒体文件的音频数据按第一预设时间间隔切片提取至少一个多媒体文件音频子数据,第一预设时间间隔根据实验或经验设定。示例性地,第一预设时间间隔通常设置为30秒至60秒之间。

进一步地,在对音频子数据进行语音文本转换处理之前,需要对多媒体文件的音频子数据进行筛选,以去除无效音频子数据,例如静音的音频子数据、其它非人声的音频子数据。这样可以减少音频子数据的数量,节省语音文本转换的时间,从而提高侵权检测的效率。

S230,获取第一文本信息与第二文本信息之间的匹配度。

匹配度表示第一文本信息与第二文本信息之间的相似程度。匹配度越高,则表示第一文本信息与第二文本信息之间的相似程度越高。匹配程度越低,则表示第一文本信息与第二文本信息之间的相似程度越低。

在一些实施例中,服务器获取第一文本信息与第二文本信息之间的编辑距离,基于编辑距离确定第一文本信息与第二文本信息之间的匹配度。上述通过编辑距离来确定匹配度的算法可以称之为“编辑距离相似算法”。

编辑距离用于表征将第一文本信息转换成第二文本信息所需的编辑操作的最小次数。编辑操作包括以下一项或多项的组合:删除操作、插入操作、替换操作。删除操作是指删除第一文本信息或第二文本信息中的字符。插入操作是指在第一文本信息或第二文本信息中插入字符。替换操作是指将第一文本信息或第二文本信息中的字符替换成其他字符。编辑距离与匹配度之间呈负相关关系。也即,编辑距离越小,则匹配度越大;编辑距离越大,则匹配度越小。可选地,匹配度与编辑距离之间的关系通过如下公式表示。

匹配度=1-编辑距离/文本信息长度值max

文本信息长度值max表示第一文本信息的长度值和第二文本信息的长度值中较大的值。

例如,第一文本信息为“我爱看电视”,第二文本信息为“我想看电视”,将第一文本信息转换成第二文本信息需要进行一次替换操作,所以,编辑距离为1,相应地,匹配度=1-1/5=0.8。

S240,若第一文本信息与第二文本信息之间的匹配度大于预设匹配度阈值,则确定多媒体文件发生侵权。

预设匹配度阈值可以是服务器或审核终端默认设置的,也可以是由审核人员自定义设置的。不同影视文件的预设匹配度阈值可以相同,也可以不相同。一般情况下,阈值可以是0.8至0.99之间的任意数值,示例性地,预设匹配度阈值为90%。

当第一文本信息与第二文本信息之间的匹配度小于或等于预设匹配度阈值时,则确认多媒体文件没有发生侵权。

在一些实施例中,在确定多媒体文件发生侵权之后,服务器还会对多媒体文件对应的用户帐号采取处置手段。

处置手段是指确定多媒体文件发生侵权后对多媒体文件对应的用户帐号执行的操作手段。处置手段包括,警告手段、停播手段、封号手段。警告手段是指通过报警信息提示多媒体文件存在侵权。停播手段是指停止播放多媒体文件。封号手段是指将多媒体文件对应的帐号设置为不可用状态。此外,服务器还会删除多媒体文件。

在一种可能的实现方式中,服务器根据第一文本信息与第二文本信息之间的匹配度所属的区间,确定处置手段,不同区间对应不同的处置手段。

可选地,若匹配度属于第一区间,确定处置手段为警告手段;若匹配度属于第二区间,确定处置手段为停播手段;若匹配度属于第三区间,确定处置手段为封号手段。。其中,第一区间的下限值大于或等于预设匹配度阈值,第二区间的下限值大于第一区间的上限值,第三区间的下限值大于第二区间的上限值。

例如,某影视文件的预设匹配度阈值为0.8,第一区间为0.8-0.9,第二区间为0.9-0.95,第三区间为0.95-0.99。则当匹配度为0.85时,处置手段为警告手段;当匹配度为0.92时,处置手段为停播手段;当匹配度为0.98时,处置手段为封号手段。

在另一些实施例中,处置手段也可以由审核人员设定,服务器按照审核人员设定的处置手段对多媒体文件对应的用户帐号进行处理。

本申请实施例提供的一种多媒体文件的侵权检测方法,在该方法中,会获取多媒体文件的音频数据和影视文件的第一文本信息,然后将多媒体文件的音频数据进行语音文本转换得到多媒体文件的第二文本信息,然后获取第一文本信息和第二文本信息之间的匹配度,若匹配度大于预设匹配度阈值,就能够确定多媒体文件发生侵权;通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测多媒体文件是否发生侵权,该过程无需人工参与,从而节省人工成本,提高检测效率。

请参阅图4,本申请提供了一种多媒体文件的侵权检测方法,本实施例描述的是审核终端与服务器的交互流程,该方法可以包括:

S211,终端显示影视文件登记页面。

影视文件登记页面用于供审核人员登记存在侵权检测需求的影视文件。影视文件登记页面包括名称输入窗口以及地址输入窗口。名称输入窗口用于输入影视文件的名称。地址输入窗口用于输入影视文件的获取地址。

在一些实施例中,影视文件登记页面还包括阈值设置窗口,用于输入预设匹配度阈值。在另一些实施例中,影视文件登记页面还包括处置手段设置窗口,用于输入处置手段。

如图5所示,审核终端会显示影视文件登记页面50,影视文件登记页面50上含有地址输入窗口51、名称输入窗口52、阈值设置窗口53以及处置手段设置窗口54。

在一些实施例中,终端在版权管理页面接收登记指示,之后根据登记指示跳转显示影视文件登记页面。版权管理页面用于对存在侵权检测的影视文件进行管理,比如查询、删除、新增等。可选地,版权管理页面显示新增按钮,终端接收到对应于该新增按钮的触发信号,则接收到登记指示。

如图6所示,版权管理页面60包括存在侵权检测需求的影视文件信息61、查询按钮62、新增按钮63、删除按钮64。上述影视文件信息61包括每个影视文件的序号、影视名称、获取路径、入库时间、预设匹配度阈值以及处置手段等等。审核人员想要新增影视文件,可以在版权管理页面60点击新增按钮63,之后终端跳转显示影视文件登记页面。

S212,终端在地址输入窗口获取影视文件的获取地址。

影视文件的获取地址可以由审核人员输入。参见图5,审核终端可以在地址输入窗口51获取审核人员输入的影视文件的获取地址“http://wlwzdownload.com”。

S213,终端在阈值设置窗口获取预设匹配度阈值。

预设匹配度阈值由审核人员输入,或者,由终端默认设置。在审核人员未设置预设匹配度阈值的情况下,由终端默认设置预设匹配度阈值。参见图5,审核人员可以在阈值设置窗口53输入预设匹配度阈值“0.8”。

S214,终端在处置手段设置窗口获取处置手段。

处置手段由审核人员输入,或者,由终端默认设置。在审核人员未设置处置手段的情况下,由终端默认设置处置手段。在一些实施例中,当终端接收到针对处置手段设置窗口的编辑指示,终端显示处置手段列表,终端接收针对处置手段列表中的目标处置手段的选择信号,将目标处置手段确定为对存在侵权的多媒体文件的处置手段。处置手段列表包括停播手段、封号手段、警告手段、自动手段等。警告手段是指通过报警信息提示多媒体文件存在侵权。停播手段是指停止播放多媒体文件。封号手段是指将多媒体文件对应的帐号设置为不可用状态。在审核人员未选择处置手段的情况下,终端将处置手段确认为自动,此时服务器按照匹配度所属的区间来确定处置手段。

参见图5,审核人员可以在处置手段设置窗口54输入处置手段“停播”。

S215,终端向服务器发送样本登记请求。

样本登记请求包括影视文件的名称、获取地址、预设匹配度阈值以及处置手段。在一些实施例中,影视文件登记页面包括提交按钮,审核人员在确认影视文件登记页面的信息无误后,触发该提交按钮,此时终端向服务器发送样本登记请求。

如图5所示,影视文件登记页面50上还包括提交按钮55以及取消按钮56。审核人员在确认影视文件登记页面50的信息无误后,触发提交按钮55,此时终端向服务器发送样本登记请求。当审核人员取消影视文件的相关信息的设置,触发取消按钮56,关闭影视文件登记页面50。

相应地,服务器接收终端发送地样本登记请求。

S216,服务器基于影视文件的获取地址,获取影视文件。

服务器基于获取地址从影视文件信息库下载影视文件。

S217,对影视文件中的音频数据进行语音文本转换处理,得到影视文件的第一文本信息。

服务器通过自动语音识别技术,将影视文件的音频数据转换成文本数据,得到第一文本信息并将第一文本信息存入到影视样本字幕近似库中,以便于后续的侵权检测。自动语音识别技术可以是随机模型法,采用提取特征、训练模板、对模板进行分类及对模板进行判断的步骤来对语音进行识别,随机模型算法包括动态时间规整,隐马尔科夫模型理论和矢量量化技术等等。在另一些实施例中,自动语音识别技术也可以是神经网络方法,通过对音频数据的反复学习训练,逐步调整改变神经元连接权重的方法,来对语音进行识别。

在一些实施例中,服务器将影视文件的音频数据划分为至少一个音频子数据,之后对上述音频子数据进行语音文本转换处理,得到每个音频子数据的第二文本信息。可选地,服务器将影视文件的音频数据按第二预设时间间隔切片提取至少一个影视文件音频子数据,其中,第二预设时间间隔可以等于第一预设时间间隔,也可以大于第一预设时间间隔。

进一步地,在对音频子数据进行语音文本转换处理之前,需要对影视文件的音频子数据进行筛选,以去除无效音频子数据,例如静音的音频子数据、其它非人声的音频子数据。这样可以减少音频子数据的数量,节省语音文本转换的时间,从而提高侵权检测的效率。

本申请实施例提供的一种多媒体文件的侵权检测方法,审核人员可以在终端上进行影视文件登记,并设置侵权检测所涉及的匹配度阈值以及发生侵权后的处置手段,并将上述信息发送至服务器,实现对影视文件的版权管理。

请参阅图7,本申请提供了一种多媒体文件的侵权检测方法,应用于审核终端,该方法可以包括:

S710,显示影视文件登记页面,影视文件登记页面包括地址输入窗口。

S720,在地址输入窗口获取影视文件的获取地址。

S730,向服务器发送样本登记请求,样本登记请求携带影视文件的获取地址。

服务器用于基于影视文件的获取地址,获取影视文件;对影视文件中的音频数据进行语音文本转换处理,得到影视文件的第一文本信息,基于第一文本信息与多媒体文件的第二文本信息之间的匹配度,确定多媒体文件是否发生侵权。

本申请实施例提供的一种多媒体文件的侵权检测方法,在该方法中,服务器会获取多媒体文件的音频数据和影视文件的第一文本信息,然后将多媒体文件的音频数据进行语音文本转换得到多媒体文件的第二文本信息,然后获取第一文本信息和第二文本信息之间的匹配度,若匹配度大于预设匹配度阈值,就能够确定多媒体文件发生侵权;通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测对是否发生侵权该过程无需人工参与,从而节省人工成本,提高检测效率。

请参阅图8,本申请提供的一种多媒体文件的侵权检测装置的结构框图,运行于电子设备,该装置800包括:第一获取模块810、转写模块820、匹配模块830和确定模块840。

第一获取模块810,用于获取多媒体文件的音频数据,以及影视文件的第一文本信息;转写模块820,用于对多媒体文件的音频数据进行语音文本转换处理,得到多媒体文件的第二文本信息;匹配模块830,用于获取第一文本信息与第二文本信息之间的匹配度,匹配度用于表征第一文本信息与第二文本信息之间的相似程度;确定模块840,用于若第一文本信息与第二文本信息之间的匹配度大于预设匹配度阈值,则确定多媒体文件发生侵权。

本申请提供的一种多媒体文件的侵权检测装置,该装置会获取多媒体文件的音频数据和影视文件的第一文本信息,然后将多媒体文件的音频数据进行语音文本转换得到多媒体文件的第二文本信息,然后获取第一文本信息和第二文本信息之间的匹配度,若匹配度大于预设匹配度阈值,就能够确定多媒体文件发生侵权;通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测对是否发生侵权,该过程无需人工参与,从而节省人工成本,提高检测效率。

在一些实施例中,匹配模块830,用于获取第一文本信息与第二文本信息之间的匹配度,匹配度用于表征第一文本信息与第二文本信息之间的相似程度。匹配模块430,还用于获取第一文本信息与第二文本信息之间的编辑距离,编辑距离用于表征将第一文本信息转换成第二文本信息所需的编辑操作的最小次数,编辑操作包括以下一项或多项的组合:删除操作、插入操作、替换操作;基于编辑距离确定第一文本信息与第二文本信息之间的匹配度,编辑距离与匹配度之间呈负相关关系。

在一些实施例中,第一获取模块810,还用于接收终端发送的样本登记请求,样本登记请求携带影视文件的获取地址;基于影视文件的获取地址,获取影视文件;对影视文件中的音频数据进行语音文本转换处理,得到影视文件的第一文本信息。

在一些实施例中,样本登记请求还携带预设匹配度阈值。

在一些实施例中,样本登记请求还携带处置手段,处置手段是指确定多媒体文件发生侵权后对所述多媒体文件对应的用户帐号执行的操作手段,处置手段包括以下一项或多项的组合:警告手段、停播手段、封号手段。

在一些实施例中,该装置800还包括:处置模块,用于对多媒体文件对应的用户帐号采取处置手段;处置手段包括以下一项或多项的组合:警告手段、停播手段、封号手段。

在一些实施例中,处置模块还用于根据第一文本信息与第二文本信息之间的匹配度所属的区间,确定处置手段,不同区间对应不同的处置手段;按照处置手段对多媒体文件对应的用户帐号进行处理。

在一些实施例中,处置模块还用于若匹配度属于第一区间,确定处置手段为警告手段;若匹配度属于第二区间,确定处置手段为停播手段;若匹配度属于第三区间,确定处置手段为封号手段;第一区间的下限值大于或等于预设匹配度阈值,第二区间的下限值大于第一区间的上限值,第三区间的下限值大于第二区间的上限值。

作为一种方式,该装置800还包括:检测模块,用于检测多媒体文件对应的帐号是否具有影视文件的版权;若多媒体文件对应的帐号不具有影视文件的版权,则执行获取多媒体文件的音频数据的步骤。

请参阅图9,本申请提供的一种多媒体文件的侵权检测装置的结构框图,运行于电子设备,该装置900包括:显示模块910、第二获取模块920、发送模块930。

显示模块910,用于显示影视文件登记页面,影视文件登记页面包括地址输入窗口;第二获取模块920,用于在地址输入窗口获取影视文件的获取地址;发送模块930,用于向服务器发送样本登记请求,样本登记请求携带影视文件的获取地址;服务器用于基于影视文件的获取地址,获取影视文件;对影视文件中的音频数据进行语音文本转换处理,得到影视文件的第一文本信息,基于第一文本信息与多媒体文件的第二文本信息之间的匹配度,确定多媒体文件是否发生侵权。

在一些实施例中,影视文件登记页面还包括处置手段设置窗口,样本登记请求还携带处置手段;第二获取模块920,还用于在处置手段设置窗口,获取处置手段;处置手段是指确定多媒体文件发生侵权后采取的惩罚措施,处置手段包括以下一项或多项的组合:警告手段、停播手段、封号手段;警告手段是指通过报警信息提示多媒体文件存在侵权,停播手段是指停止播放多媒体文件,封号手段是指将多媒体文件对应的帐号设置为不可用状态。

在一些实施例中,影视文件登记页面还包括阈值设置窗口,样本登记请求还携带预设匹配度阈值;第二获取模块920,还用于在阈值设置窗口,获取预设匹配度阈值。

本申请提供的一种多媒体文件的侵权检测装置,该装置会获取多媒体文件的音频数据和影视文件的第一文本信息,然后将多媒体文件的音频数据进行语音文本转换得到多媒体文件的第二文本信息,然后获取第一文本信息和第二文本信息之间的匹配度,若匹配度大于预设匹配度阈值,就能够确定多媒体文件发生侵权;通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测对是否发生侵权该过程无需人工参与,从而节省人工成本,提高检测效率。

本申请提供的一种多媒体文件的侵权检测装置的结构框图,需要说明的是,本申请中装置实施例与前述方法实施例是相互对应的,装置实施例中各个单元的具体实施原理与前述方法实施例中的原理是相似的,装置实施例中的具体内容可以参见方法实施例,而在装置实施例中不再赘述。

请参阅图10,本申请提供的一种电子设备的结构框图。

基于上述的文本处理方法、装置,本申请实施例还提供的另一种可以执行前述文本处理方法的电子设备1000。该电子设备1000可以是智能手机、平板电脑、笔记本电脑、台式计算机等能够运行应用程序的电子设备。电子设备1000包括相互耦合的一个或多个(图中仅示出一个)处理器1010、存储器1020、网络模块1030、语音识别器件1040以及屏幕1050。其中,该存储器1020中存储有可以执行前述实施例中内容的程序,而处理器1010可以执行该存储器1020中存储的程序。

其中,处理器1010可以包括一个或者多个用于处理数据的核。处理器1010利用各种接口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1020内的指令、程序、代码集或指令集,以及调用存储在存储器1020内的数据,执行电子设备1000的各种功能和处理数据。可选地,处理器1010可以采用数字信号处理(Digital SignalProcessing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1010可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics ProcessingUnit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1010中,单独通过一块通信芯片进行实现。

存储器1020可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器1020可用于存储指令、程序、代码、代码集或指令集。存储器1020可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储审核终端120在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

网络模块1030用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。网络模块1030可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。网络模块1030可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如,网络模块1030可以与基站进行信息交互。

语音识别器件1040可以用于语音文本转换,从而使得电子设备1000可以将影视文件的音频数据和多媒体文件的音频数据转换成第一文本信息和第二文本信息。

请参阅图11,本申请提供的一种计算机可读存储介质。该计算机可读介质1100中存储有程序代码,程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质1100可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质1100包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质1100具有执行上述方法中的任何方法步骤的程序代码1110的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码1110可以例如以适当形式进行压缩。

综上所述,本申请提供的一种多媒体文件的侵权检测方法、装置以及电子设备。在该方法中,会获取多媒体文件的音频数据和影视文件的第一文本信息,然后将多媒体文件的音频数据进行语音文本转换得到多媒体文件的第二文本信息,然后获取第一文本信息和第二文本信息之间的匹配度,若匹配度大于预设匹配度阈值,就能够确定多媒体文件发生侵权;通过上述方式,通过服务器将影视文件的第一文本信息和多媒体文件的第二文本信息自动匹配,基于匹配度来检测对是否发生侵权该过程无需人工参与,从而节省人工成本,提高检测效率。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征图进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

23页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:终端设备控制方法、装置、电子设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类