一种视频播放的方法、计算机存储介质、播放器及服务器

文档序号：1470505 发布日期：2020-02-21 浏览：7次 >En<

阅读说明：本技术 一种视频播放的方法、计算机存储介质、播放器及服务器 (Video playing method, computer storage medium, player and server ) 是由刘雷晴于 2018-08-07 设计创作，主要内容包括：本申请实施方式公开了一种视频播放的方法、计算机存储介质、播放器及服务器，其中，所述方法提供有第一参考声纹特征库和播放的目标视频；所述方法包括：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，停止播放所述目标视频。本申请提供的技术方案，能够有效避免进入私人空间的其他人听到播放的视频。(The embodiment of the application discloses a video playing method, a computer storage medium, a player and a server, wherein the method is provided with a first reference voiceprint feature library and a played target video; the method comprises the following steps: receiving a sound signal emitted by a sound source, and identifying at least one voiceprint feature included in the sound signal; judging whether the at least one voiceprint feature comprises a reference voiceprint feature in the first reference voiceprint feature library; and if not, stopping playing the target video. According to the technical scheme, other people who enter the private space can be effectively prevented from hearing the played video.)

技术领域

本申请涉及互联网技术领域，特别涉及一种视频播放的方法、计算机存储介质、播放器及服务器。

背景技术

在日常生活中，当在自己的卧室或书房等私人空间观看正在播放的视频时，人们通常不希望进入私人空间的其他人听到播放的视频。

目前仅在用户自己察觉到其他人进入私人空间时，才会手动停止播放视频，以避免其他人听到正在播放的视频。然而，在用户认真观看视频时，往往不容易察觉到其他人进入自己的私人空间，这时，便很难避免其他人听到播放的视频。

发明内容

本申请实施方式的目的是提供一种视频播放的方法、计算机存储介质、播放器及服务器，能够有效避免进入私人空间的其他人听到播放的视频。

为实现上述目的，本申请实施方式提供一种视频播放的方法，所述方法提供有第一参考声纹特征库和播放的目标视频；所述方法包括：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，停止播放所述目标视频。

为实现上述目的，本申请实施方式还提供一种计算机存储介质，所述计算机存储介质用于存储第一参考声纹特征库和播放的目标视频，以及计算机程序；所述计算机程序被处理器执行时，实现以下步骤：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，停止播放所述目标视频。

为实现上述目的，本申请实施方式还提供一种播放器，所述播放器中包括处理器以及计算机存储介质，并且所述播放器上设置有至少两个声波式传感器；所述至少两个声波式传感器用于接收声源发来的声音信号。

为实现上述目的，本申请实施方式还提供一种视频播放的方法，所述方法提供有第一参考声纹特征库，以及客户端播放的目标视频；所述方法包括：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，向所述客户端反馈表征停止播放所述目标视频的指定信息。

为实现上述目的，本申请实施方式还提供一种服务器，所述服务器包括存储器和处理器，所述存储器中存储有第一参考声纹特征库和客户端播放的目标视频，以及计算机程序，所述计算机程序被所述处理器执行时，实现以下步骤：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，向所述客户端反馈表征停止播放所述目标视频的指定信息。

为实现上述目的，本申请实施方式还提供一种视频播放的方法，所述方法提供有第二参考声纹特征库和播放的目标视频；所述方法包括：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，停止播放所述目标视频。

为实现上述目的，本申请实施方式还提供一种计算机存储介质，所述计算机存储介质用于存储第二参考声纹特征库和播放的目标视频，以及计算机程序；所述计算机程序被处理器执行时，实现以下步骤：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，停止播放所述目标视频。

为实现上述目的，本申请实施方式还提供一种视频播放的方法，所述方法提供有第二参考声纹特征库，以及客户端播放的目标视频；所述方法包括：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，向所述客户端反馈表征停止播放所述目标视频的指定信息。

为实现上述目的，本申请实施方式提供一种服务器，所述服务器包括存储器和处理器，所述存储器中存储有第二参考声纹特征库和客户端播放的目标视频，以及计算机程序，所述计算机程序被所述处理器执行时，实现以下步骤：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征；判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，向所述客户端反馈表征停止播放所述目标视频的指定信息。

由上可见，在本申请中，第一参考声纹特征库中包括至少一种参考声纹特征，所述参考声纹特征例如可以是用户自己的声纹特征。当用户在自己的私人空间观看正在播放的目标视频时，可以通过客户端不断接收声源发出的声音信号，例如，如果有其他人进入该私人空间，便可以通过客户端接收到其他人发出的声音信号，并识别该声音信号中包括的至少一种声纹特征。那么，可以通过客户端进一步判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征，例如，用户自己的声纹特征；如果不包含，便可以停止播放所述目标视频。这样，尽管在用户认真观看视频时，有其他人进入自己的私人空间，仍可以即时发现，并停止播放视频，从而可以有效避免进入私人空间的其他人听到播放的视频。

附图说明

为了更清楚地说明本申请实施方式或现有技术中的技术方案，下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施方式中视频播放的方法的一种实施例的流程图；

图2是本申请实施方式中播放器的结果示意图；

图3是本申请实施方式中视频播放的方法的另一种实施例的流程图；

图4是本申请实施方式中服务器的结构示意图；

图5是本申请实施方式中视频播放的方法的另一种实施例的流程图；

图6是本申请实施方式中视频播放的方法的另一种实施例的流程图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案，下面将结合本申请实施方式中的附图，对本申请实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式仅仅是本申请一部分实施方式，而不是全部的实施方式。基于本申请中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式，都应当属于本申请保护的范围。

本申请实施方式提供一种视频播放的方法，所述视频播放的方法可以应用于客户端和服务器的系统架构中。所述服务器可以是存储视频数据的设备。具体地，所述服务器可以是能够提供视频服务的网站的后台业务服务器。所述网站例如可以是爱奇艺、搜狐视频、腾讯视频、Acfun等。在本实施方式中，所述服务器可以为一个具有数据运算、存储功能以及网络交互功能的电子设备；也可以为运行于该电子设备中，为数据处理、存储和网络交互提供支持的软件。在本实施方式中并不具体限定所述服务器的数量。所述服务器可以为一个服务器，还可以为几个服务器，或者，若干服务器形成的服务器集群。

在本实施方式中，所述客户端可以是用于渲染视频数据并可以捕获声音信号的电子设备。具体地，所述客户端例如可以是具备声音信号捕获功能的台式电脑、平板电脑、笔记本电脑、智能手机、数字助理、智能可穿戴设备、具有网络访问功能的电视机等。或者，所述客户端也可以为能够运行于上述电子设备中的软件。具体的，所述客户端可以为电子设备中的浏览器，所述浏览器中可以加载视频网站平台提供的访问入口。所述视频网站平台例如可以是爱奇艺、搜狐视频、Acfun等，所述访问入口可以是上述网站平台的首页。所述客户端还可以是视频网站平台提供的在智能终端中运行的应用。

本申请实施方式提供一种视频播放的方法，所述视频播放的方法可以应用于上述的客户端中。所述方法可以提供有第一参考声纹特征库和播放的目标视频。

在本实施方式中，所述服务器中可以提供有第一参考声纹特征库。所述第一参考声纹特征库可以是存储声纹特征的数据集。所述第一参考声纹特征库可以采用MySQL、Oracle、DB2、Sybase等数据库格式中的任意一种。所述第一参考声纹特征库可以部署在服务器中的存储介质上。不仅如此，所述客户端可以从所述服务器中下载所述第一参考声纹特征库，并将下载的第一参考声纹特征库存储于存储器中，以便进行后续声纹特征对比。其中，所述存储器可以是内存或缓存。

在本实施方式中，所述第一参考声纹特征库中可以包括至少一种参考声纹特征。所述第一参考声纹特征库中包括的参考声纹特征例如可以是用户自己的声纹特征，也可以是用户设定的其他声纹特征。其他声纹特征具体可以根据用户自己的意愿来选择，例如，可以是用户的家属的声纹特征，或者用户的亲密朋友的声纹特征等等。

在本实施方式中，所述客户端上播放的目标视频可以是用户当前观看的视频。用户当前观看的视频可以是所述客户端对表征所述目标视频的视频数据进行渲染后播放的。其中，所述视频数据可以是所述客户端从所述服务器内存储的视频数据库中下载的。所述视频数据库可以是存储视频数据的数据集。所述视频数据库可以采用MySQL、Oracle、DB2、Sybase等数据库格式中的任意一种。

请参阅图1，所述视频播放的方法可以包括以下步骤。

S11：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征。

在本实施方式中，所述声源可以是发出声音的人。具体地，所述声源可以是进入用户的私人空间的人或在所述用户的私人空间附近的人等。所述用户的私人空间例如可以是所述用户的卧室或书房等。在实际情况下，当用户在自己的卧室或者书房里观看所述客户端播放的视频时，进入用户的卧室或书房的人，或者在用户的卧室或书房附近的人，会因为说话而发出不同的声音信号。然而，由于在用户的私人空间内或附近，这些人可能会听到所述客户端播放的视频。这样，有必要通过所述客户端捕获这些声源发出的声音信号，并进行后续处理，以有效控制视频的播放，从而避免这些人听到用户观看的视频。

在本实施方式中，所述声源可以是一个人或多个人，不同的人的声音具有不同的声纹特征。那么，所述声音信号中可以包括至少一个人发出的声音信号。这样，所述声音信号中可以至少包括一种声纹特征。

在本实施方式中，所述客户端可以接收声源发出的声音信号。具体地，例如，可以通过装载在所述客户端上的麦克风接收所述声源发出的声音信号。其中，所述客户端上装载的麦克风的数量可以是一个或多个。在实际应用过程中，通常可以在所述客户端上的不同方向上分别设置麦克风，以便所述客户端可以尽可能准确地接收来自不同方向传播过来的声音信号。

在本实施方式中，在接收声源发出的声音信号之后，所述客户端还可以识别所述声音信号中包括的至少一种声纹特征。具体地，例如，在接收到所述声源发出的声音信号后，所述客户端可以将所述声音信号从时间域转换至频率域，得到频率域的声音信号，并可以从所述频率域的声音信号中识别信号强度大于指定强度的声波信号的声纹特征。

S13：判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，停止播放所述目标视频。

在本实施方式中，在识别所述声音信号中包括的至少一种声纹特征之后，所述客户端可以判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征。具体地，所述客户端可以将识别出的声纹特征分别与所述第一参考声纹特征库中的各个参考声纹特征进行一一对比，判断识别出的每个声纹特征是否与所述参考声纹特征相匹配。如果判断结果均为不相匹配，则所述至少一种声纹特征中不包含所述第一参考特征库中的参考声纹特征；如果判断结果为识别出的声纹特征与所述第一参考声纹特征库中的参考声纹特征相匹配，则所述至少一种声纹特征中包含所述第一参考特征库中的参考声纹特征。例如，所述客户端识别出多个声纹特征，当判断结果为所述多个声纹特征中至少一个声纹特征与所述第一参考声纹特征库中的参考声纹特征相匹配时，则表明所述至少一种声纹特征中包含所述第一参考特征库中的参考声纹特征。在本实施方式中，所述客户端判断识别出的声纹特征与所述参考声纹特征是否相匹配，具体可以包括，所述客户端可以计算识别出的声纹特征与所述参考声纹特征之间的匹配度，当所述匹配度大于或等于指定匹配度阈值时，可以判定识别出的声纹特征与所述参考声纹特征相匹配；当所述匹配度小于指定匹配度阈值时，可以判定识别出的声纹特征与所述参考声纹特征不相匹配。其中，所述指定匹配度阈值的取值范围具体可以为80百分比至100百分比。

在本实施方式中，当判断结果为不包含时，所述客户端可以停止播放所述目标视频。这样，尽管在用户认真观看视频的情况下，当其他人进入自己的私人空间时，一旦所述客户端判断出这些人发出的声音信号中的声纹特征不包含所述参考声纹特征，便可以自动停止播放视频，从而可以有效避免进入私人空间的其他人听到播放的视频。

在一个具体应用场景中，所述客户端可以是平板电脑。用户可以将自己的声纹特征作为所述第一参考声纹特征库中的参考声纹特征。用户正在自己的卧室观看该平板电脑播放的视频。这时，其他人一边说话一边进入用户的卧室，该平板电脑可以接收这些人发出的声音信号，并可以识别出声音信号中包括的多种声纹特征。在识别出这些声纹特征后，该平板电脑可以判断这些声纹特征中是否包含用户自己的声纹特征。由于其他人的声纹特征与用户自己的声纹特征不相匹配，那么该平板电脑便可以判定为不包含，并直接停止播放用户正在观看的视频。这样，尽管在用户认真观看视频的情况下，当其他人进入自己的私人空间时，一旦所述客户端判断出这些人发出的声音信号中的声纹特征不包含所述参考声纹特征，便可以自动停止播放视频，从而可以有效避免进入私人空间的其他人听到播放的视频。

在本申请一个实施方式中，对于距离用户的私人空间较远的人来说，通常很难听到或听清楚用户在自己的私人空间里观看的客户端播放的视频，然而这些人发出的声音信号仍可能被客户端接收到，并导致视频停止播放。为了避免这种情况发生，客户端还可以将声音信号的音量作为控制视频播放的因素。在判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征之后，所述方法还可以包括：若判断结果为不包含，所述客户端可以基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，停止播放所述目标视频，若小于，继续播放所述目标视频。例如，某些人在距离用户的私人空间较远的地方聊天，在判定这些人发出的声音信号中的多个声纹特征不包含所述参考声纹特征之后，所述客户端可以基于识别出的多个声纹特征，将该声音信号拆分为多路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值。由于这些人在距离用户的私人空间较远，所述客户端通常接收到的声音信号的音量小于所述指定音量阈值，可以继续播放所述目标视频。这样，便可以避免因距离用户的私人空间较远的人聊天，而导致视频停止播放的情况。所述指定音量阈值的取值范围可以为15～25分贝。需要说明的是，所述指定音量阈值具体可以根据实际应用情况来设定，此处不作限定。

在本实施方式中，所述客户端可以基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号。具体地，所述客户端可以将所述声音信号从时间域转换至频率域，得到频率域的声音信号，接着可以从所述频率域的声音信号识别出与所述声纹特征相匹配的频率域的子声音信号，并将频率域的子声音信号转换为时间域的子声音信号。这样，可以将包含有至少一种声纹特征的声音信号中拆分为至少一路子声音信号。

在本申请一个实施方式中，在实际应用情况下，进入用户的私人空间的人可能会迅速离开，也可能会在用户的私人空间内与用户进行短暂地聊天，这样，需要所述客户端在停止播放所述目标视频之后，继续接收声源发出的声音信号，并根据具体情况进一步控制视频播放，而不是始终停止播放视频。具体地，在停止播放所述目标视频之后，所述方法还包括：所述客户端可以继续接收所述声源发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；可以判断所述至少一种新的声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续停止播放所述目标视频，若小于所述指定音量阈值，播放所述目标视频。例如，在停止播放所述目标视频之后，所述客户端可以继续接收其他人发出的新的声音信号，并再次识别所述新的声音信号中包括的多种新的声纹特征，当判断结果仍为不包含时，可以基于识别出的所述新的声纹特征，将所述新的声音信号拆分为多路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值。这时，在进入用户的私人空间的人与用户进行短暂地聊天的情况下，判断结果为大于或等于所述指定音量阈值，所述客户端将继续停止播放所述目标视频，而在进入用户的私人空间的人可能会迅速离开的情况下，判断结果为小于所述指定音量阈值，所述客户端便可以继续播放所述目标视频。

在本申请一个实施方式中，在实际应用情况下，在停止播放所述目标视频之后，通常进入用户的私人空间的人不会立刻离开或者在用户的私人空间附近聊天的人不会立刻结束，往往会维持一段时间，这时，为了减少客户端的硬件运行负荷，可以先停止接受声源发出的声音信号，等一段时间后，再继续接收。具体地，在停止播放所述目标视频之后，所述方法还包括：所述客户端可以停止接收所述声源发出的声音信号，等待指定时长后，再次接收所述声源发出的新的声音信号，并识别所述新的声音信号中包括的至少一种新的声纹特征；可以判断所述至少一种新的声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，可以基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续停止播放所述目标视频。其中，所述指定时长的取值可以为1分钟～5分钟。需要说明的是，所述指定时长具体可以根据实际应用情况来设定，此处不作限定。

在本实施方式中，上述方法步骤中实现的功能，可以由计算机程序实现，所述计算机程序可以被存储于计算机存储介质中。具体的，所述计算机存储介质可以与处理器进行耦合，处理器从而可以读取计算机存储介质中的计算机程序。所述计算机存储介质可以用于存储第一参考声纹特征库和播放的目标视频。所述计算机程序被处理器执行时，可以实现以下步骤：

S11：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征；

S13：判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，停止播放所述目标视频。

在一个实施方式中，所述计算机程序被处理器执行时，还实现以下步骤：

若不包含，基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，停止播放所述目标视频。

在一个实施方式中，所述计算机程序被处理器执行时，还实现以下步骤：

继续接收所述声源发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；

判断所述至少一种新的声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；

若不包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续停止播放所述目标视频。

需要说明的是，上述计算机存储介质中的计算机程序所能实现的功能，均可以参照前述的方法实施实施方式，实现的技术效果也与前述方法实施方式中实现的技术效果类似，这里便不再赘述。

请参阅图2，本申请还提供一种播放器。所述播放器可以是上述的客户端。所述播放器中包括处理器以及上述的计算机存储介质。所述计算机存储介质可以与处理器进行耦合，处理器从而可以读取计算机存储介质中的计算机程序。此外，所述播放器上设置有至少两个声波式传感器。所述声波式传感器可以是能够对声波进行检测的传感器。所述声波可以具备不同的频率范围，其中，所述声波可以是能够被人感知到的声音。因此，所述声波式传感器可以是声音传感器。其中，所述声音传感器例如可以是各种形式的麦克风。所述至少两个声波式传感器可以用于接收声源发来的声音信号。以两个声波式传感器为例，这两个声波式传感器可以部署于播放器上的不同位置处，这两个声波式传感器均可以接收到声源发来的声音信号。

在本实施方式中，所述计算机存储介质可以包括用于存储信息的物理装置，通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式所述的计算机存储介质又可以包括：利用电能方式存储信息的装置，如RAM、ROM等；利用磁能方式存储信息的装置，如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘；利用光学方式存储信息的装置，如CD或DVD。当然，还有其他方式的计算机存储介质，例如量子存储器、石墨烯存储器等等。

在本实施方式中，所述处理器可以按任何适当的方式实现。例如，所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。

本说明书实施方式提供的计算机存储介质以及播放器，其实现的具体功能，可以与本说明书中的前述实施方式相对照解释，并能够达到前述实施方式的技术效果，这里便不再赘述。

在本申请一个实施方式中，还可以将上述方法的执行主体拆分为客户端和服务器，以便减轻原来单独执行主体客户端的运行压力，提高运行效率，同时，还可以减少客户端的制作成本。这样，本申请还可以提供一种视频播放的方法，所述方法的执行主体为上述的服务器。所述方法提供有第一参考声纹特征库，以及客户端播放的目标视频。请参阅图3，所述方法包括以下步骤。

S21：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征。

在本实施方式中，所述服务器可以接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征。其中，所述声音信号是由声源发出后，被所述客户端接收到的。具体地，所述客户端接收所述声源发出的声音信号的具体实施过程，以及所述服务器识别所述声音信号中包括的至少一种声纹特征的具体实施过程，可以参照步骤S11中对应的实施步骤。

S23：判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，向所述客户端反馈表征停止播放所述目标视频的指定信息。

在本实施方式中，所述服务器可以判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征，若不包含，向所述客户端反馈表征停止播放所述目标视频的指定信息，以使得所述客户端接收到所述指定信息后，停止播放所述目标视频。具体地，所述服务器判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征的具体实施过程，可以参照步骤S13中对应的实施步骤。

在本申请一个实施方式中，在所述服务器判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征之后，所述方法还可以包括：若不包含，所述服务器基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，向所述客户端反馈表征停止播放所述目标视频的指定信息。

在本申请一个实施方式中，在向所述客户端反馈表征停止播放所述目标视频的指定信息之后，所述方法还可以包括：所述服务器可以继续接收所述客户端发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；判断所述至少一种新的声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；若不包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续向所述客户端反馈表征停止播放所述目标视频的指定信息。

请参阅图4，本申请还提供一种服务器，所述服务器包括存储器和处理器，所述存储器中存储有第一参考声纹特征库和客户端播放的目标视频，以及计算机程序，所述计算机程序被所述处理器执行时，实现以下步骤：

S21：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征；

在本实施方式中，所述存储器可以包括用于存储信息的物理装置，通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式所述的存储器又可以包括：利用电能方式存储信息的装置，如RAM、ROM等；利用磁能方式存储信息的装置，如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘；利用光学方式存储信息的装置，如CD或DVD。当然，还有其他方式的存储器，例如量子存储器、石墨烯存储器等等。

在一个实施方式中，所述计算机程序被所述处理器执行时，还实现以下步骤：若不包含，所述服务器基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，向所述客户端反馈表征停止播放所述目标视频的指定信息。

在一个实施方式中，所述计算机程序被所述处理器执行时，还实现以下步骤：

继续接收所述客户端发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；

判断所述至少一种新的声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征；

若不包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续向所述客户端反馈表征停止播放所述目标视频的指定信息。

本说明书实施方式提供的服务器，其存储器和处理器实现的具体功能，可以与本说明书中的前述实施方式相对照解释，并能够达到前述实施方式的技术效果，这里便不再赘述。

本申请还提供一种视频播放的方法。所述方法可以应用于上述的客户端。所述方法提供有第二参考声纹特征库和播放的目标视频。

在本实施方式中，所述服务器中还可以提供有第二参考声纹特征库。所述第二参考声纹特征库可以是存储声纹特征的数据集。所述第二参考声纹特征库可以采用MySQL、Oracle、DB2、Sybase等数据库格式中的任意一种。所述第二参考声纹特征库可以部署在服务器中的存储介质上。不仅如此，所述客户端可以从所述服务器中下载所述第二参考声纹特征库，并将下载的第二参考声纹特征库存储于存储器中，以便进行后续声纹特征对比。其中，所述存储器可以是内存或缓存。

在本实施方式中，所述第二参考声纹特征库中可以包括至少一种参考声纹特征。所述第二参考声纹特征库中包括的参考声纹特征例如可以进入用户自己的私人空间的其他人的声纹特征，也可以是用户设定的某些人的声纹特征。某些人的声纹特征具体可以根据用户自己的意愿来选择。

请参阅图5，所述视频播放的方法可以包括以下步骤。

S31：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征。

在本实施方式中，所述客户端可以接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征。本步骤的具体实施过程与步骤S11类似，可以参照步骤S11对应的实施步骤。

S33：判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，停止播放所述目标视频。

在本实施方式中，所述客户端可以判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征，若包含，停止播放所述目标视频。其中，所述客户端判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征的具体实施过程，与步骤S13中的判断所述至少一种声纹特征中是否包含所述第一参考声纹特征库中的参考声纹特征的具体实施过程类似，可以参照步骤13对应的实施步骤。

在本申请一个实施方式中，在判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征之后，所述方法还可以包括：若包含，基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，停止播放所述目标视频。

在本申请一个实施方式中，在停止播放所述目标视频之后，所述方法还可以包括：所述客户端可以继续接收所述声源发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；判断所述至少一种新的声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续停止播放所述目标视频。

在本实施方式中，上述方法步骤中实现的功能，可以由计算机程序实现，所述计算机程序可以被存储于计算机存储介质中。具体的，所述计算机存储介质可以与处理器进行耦合，处理器从而可以读取计算机存储介质中的计算机程序。所述计算机存储介质可以用于存储第二参考声纹特征库和播放的目标视频。所述计算机程序被处理器执行时，可以实现以下步骤：

S31：接收声源发出的声音信号，并识别所述声音信号中包括的至少一种声纹特征；

S33：判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，停止播放所述目标视频。

在一个实施方式中，所述计算机程序被处理器执行时，还实现以下步骤：

若包含，基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，停止播放所述目标视频。

在一个实施方式中，所述计算机程序被处理器执行时，还实现以下步骤：

继续接收所述声源发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；

判断所述至少一种新的声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；

若包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续停止播放所述目标视频。

本申请还提供一种播放器。所述播放器可以是上述的客户端。所述播放器中包括处理器以及上述的计算机存储介质。所述计算机存储介质可以与处理器进行耦合，处理器从而可以读取计算机存储介质中的计算机程序。此外，所述播放器上设置有至少两个声波式传感器。所述声波式传感器可以是能够对声波进行检测的传感器。所述声波可以具备不同的频率范围，其中，所述声波可以是能够被人感知到的声音。因此，所述声波式传感器可以是声音传感器。其中，所述声音传感器例如可以是各种形式的麦克风。所述至少两个声波式传感器可以用于接收声源发来的声音信号。以两个声波式传感器为例，这两个声波式传感器可以部署于播放器上的不同位置处，这两个声波式传感器均可以接收到声源发来的声音信号。

在本申请一个实施方式中，还可以将上述方法的执行主体拆分为客户端和服务器，以便减轻原来单独执行主体客户端的运行压力，提高运行效率，同时，还可以减少客户端的制作成本。这样，本申请还可以提供一种视频播放的方法，所述方法的执行主体为上述的服务器。所述方法提供有第二参考声纹特征库，以及客户端播放的目标视频。请参阅图6，所述方法包括以下步骤。

S41：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征。

S43：判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，向所述客户端反馈表征停止播放所述目标视频的指定信息。

在本实施方式中，所述服务器可以判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征，若包含，向所述客户端反馈表征停止播放所述目标视频的指定信息，以使得所述客户端接收到所述指定信息后，停止播放所述目标视频。具体地，所述服务器判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征的具体实施过程，可以参照步骤S33中对应的实施步骤。

在本申请一个实施方式中，在所述服务器判断所述至少一种声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征之后，所述方法还可以包括：若包含，所述服务器可以基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，向所述客户端反馈表征停止播放所述目标视频的指定信息。

在本申请一个实施方式中，在向所述客户端反馈表征停止播放所述目标视频的指定信息之后，所述方法还可以包括：所述服务器可以继续接收所述客户端发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；可以判断所述至少一种新的声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续向所述客户端反馈表征停止播放所述目标视频的指定信息。

本申请还提供一种服务器，所述服务器包括存储器和处理器，所述存储器中存储有第二参考声纹特征库和客户端播放的目标视频，以及计算机程序，所述计算机程序被所述处理器执行时，实现以下步骤：

S41：接收客户端发来的声音信号，并识别所述声音信号中包括的至少一种声纹特征。

在一个实施方式中，所述计算机程序被所述处理器执行时，还实现以下步骤：

若包含，基于识别出的所述声纹特征，将所述声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于，向所述客户端反馈表征停止播放所述目标视频的指定信息。

在一个实施方式中，所述计算机程序被所述处理器执行时，还实现以下步骤：

继续接收所述客户端发出的新的声音信号，并再次识别所述新的声音信号中包括的至少一种新的声纹特征；可以判断所述至少一种新的声纹特征中是否包含所述第二参考声纹特征库中的参考声纹特征；若包含，基于识别出的所述新的声纹特征，将所述新的声音信号拆分为至少一路子声音信号，并判断音量最大的子声音信号的音量是否大于或等于指定音量阈值；若大于或等于所述指定音量阈值，继续向所述客户端反馈表征停止播放所述目标视频的指定信息。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现客户端、服务器以外，完全可以通过将方法步骤进行逻辑编程来使得客户端、服务器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种客户端、服务器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。

本说明书中的各个实施方式均采用递进的方式描述，各个实施方式之间相同相似的部分互相参见即可，每个实施方式重点说明的都是与其他实施方式的不同之处。尤其，针对计算机存储介质、服务器和客户端的实施方式来说，均可以参照前述方法的实施方式的介绍对照解释。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

虽然通过实施方式描绘了本申请，本领域普通技术人员知道，本申请有许多变形和变化而不脱离本申请的精神，希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

22页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种安防高清录像倒播方法及装置

一种视频播放的方法、计算机存储介质、播放器及服务器

相关技术

网友询问留言