适用于多人k歌的音频同步方法、装置及存储介质

文档序号：211045 发布日期：2021-11-05 浏览：1次 >En<

阅读说明：本技术 适用于多人k歌的音频同步方法、装置及存储介质 (Audio synchronization method, device and storage medium suitable for multiple K songs ) 是由牛继华魏耀都陈华于 2021-07-08 设计创作，主要内容包括：本发明提供一种适用于多人K歌的音频同步方法、装置及存储介质,在执行本方法的步骤前,预先设置多组扬声器和麦克风,每一组扬声器和麦克风对应一个歌唱人员,包括以下步骤：通过多个扬声器对多个歌唱人员同步播放伴奏信息；每个麦克风获取音频生成第一音频信息；将每个麦克风得到的第一音频信息发送至其他麦克风形成其他麦克风的第二音频信息；每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后得到播放音频通过对应的扬声器播放。本发明提供的技术方案,能够在多个人进行K歌时通过扬声器同时播放伴奏和每个人的歌声,使得每个人基于扬声器听到的音频是多个人合唱的歌声,实用性较强。(The invention provides an audio synchronization method, a device and a storage medium suitable for multiple K songs, wherein a plurality of groups of loudspeakers and microphones are preset before the steps of the method are executed, each group of loudspeakers and microphones corresponds to a singer, and the method comprises the following steps: synchronously playing accompaniment information for a plurality of singers through a plurality of loudspeakers; each microphone acquires audio to generate first audio information; sending the first audio information obtained by each microphone to other microphones to form second audio information of other microphones; and each microphone performs sound mixing processing on the collected first audio information, the received second audio information and the accompaniment information to obtain playing audio to be played through a corresponding loudspeaker. According to the technical scheme provided by the invention, the accompaniment and the singing voice of each person can be played simultaneously through the loudspeaker when a plurality of persons carry out the K song, so that the audio heard by each person based on the loudspeaker is the singing voice of the plurality of persons, and the practicability is high.)

适用于多人K歌的音频同步方法、装置及存储介质

技术领域

本发明涉及音频数据传输技术领域，尤其涉及一种适用于多人K歌的音频同步方法、装置及存储介质。

背景技术

随着科学技术和音乐文化的迅速发展，K歌(唱歌)的方式越来越多样化。基于移动终端进行K歌的方式具有方便、易操作的优点，最受大家青睐。在K歌的过程中，可能会存在多个人合唱的情况。在现有技术方案中，通过以下方式进行合唱音频的同步，包括：

1)移动终端+真无线耳机：

移动终端由蓝牙协议与两只耳机相连，移动终端通过蓝牙协议连接其中一只耳机，该耳机通过蓝牙协议连接另一只耳机。在两只耳机都收到了当前要播放的音乐内容之后，两只耳机同步播放当前要播放的音乐。

2)两个移动终端：

在两个移动终端之间建立数据连接，通过数据连接在两个移动终端之间传输要播放的音频，在两个移动终端都具备了要播放的内容之后，两个移动终端同步播放当前要播放的音乐。

在以上的2种K歌、合唱方式中，都会将伴奏的音频、音乐内容对多个歌唱人员进行播放，但是并无法将不同人员之间的歌声进行相互的反馈、返送，实用性较差。

发明内容

本发明实施例提供一种适用于多人K歌的音频同步方法、装置及存储介质，能够在多个人进行K歌时通过扬声器同时播放伴奏和每个人的歌声，使得每个人基于扬声器听到的音频是多个人合唱的歌声，实用性较强。

本发明实施例的第一方面，提供一种适用于多人K歌的音频同步方法，在执行本方法的步骤前，预先设置多组扬声器和麦克风，每一组扬声器和麦克风对应一个歌唱人员，包括：

通过多个扬声器对多个歌唱人员同步播放伴奏信息；

每个麦克风获取音频生成第一音频信息；

将每个麦克风得到的第一音频信息发送至其他麦克风形成其他麦克风的第二音频信息；

每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后得到播放音频通过对应的扬声器播放。

可选地，在第一方面的一种可能实现方式中，每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后通过对应的扬声器播放包括：

对所述第一音频信息、第二音频信息以及伴奏信息进行混音得到播放音频；

对所述播放音频进行声反馈抑制处理和扩音处理以使扬声器对所述播放音频播放。

可选地，在第一方面的一种可能实现方式中，每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后得到播放音频通过对应的扬声器播放包括：

预先设置最大延迟时间；

获取当前接收的第二音频信息的传输延迟，将所述传输延迟与最大延迟时间比对；

若传输延迟大于最大延迟时间，则在最大延迟时间后播放接收到的第二音频信息。

可选地，在第一方面的一种可能实现方式中，将每个麦克风得到的第一音频信息发送至其他麦克风形成其他麦克风的第二音频信息包括：

获取调整函数，所述调整函数用于对任意两组扬声器和麦克风之间的第二音频信息进行调整；

基于所述调整函数对当前时刻接收到的第二音频信息调整得到调整后的第二音频信息。

可选地，在第一方面的一种可能实现方式中，所述获取调整函数包括：

任意一个扬声器播放白噪声信号；

其他组的麦克风对白噪声信号录制；

对录制的白噪声信号与播放的白噪声信号进行互相关计算及低通滤波，得到任意两组设备之间的传递函数；

将第二音频信息经过传递函数后的初始幅度调整系数为1。

可选地，在第一方面的一种可能实现方式中，通过以下步骤对初始幅度调整系数调整，包括：

基于声反馈信息获取任意两组设备之间的距离信息，所述距离信息包括先前时刻距离和当前时刻距离；

通过以下公式计算幅度调整系数，包括：

其中，A为先前时刻距离，B为先前时刻距离。

可选地，在第一方面的一种可能实现方式中，每个麦克风获取音频生成第一音频信息包括：

接收每个麦克风所对应的音频特征；

提取所述音频中与音频特征对应的音频信息作为第一音频信息。

本发明实施例的第二方面，提供一种适用于多人K歌的音频同步装置，预先设置多组扬声器和麦克风，每一组扬声器和麦克风对应一个歌唱人员，包括：

同步播放模块，用于通过多个扬声器对多个歌唱人员同步播放伴奏信息；

生成模块，用于使每个麦克风获取音频生成第一音频信息；

发送模块，用于将每个麦克风得到的第一音频信息发送至其他麦克风形成其他麦克风的第二音频信息；

混音模块，用于对每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后得到播放音频通过对应的扬声器播放。

可选地，在第二方面的一种可能实现方式中，所述混音模块还用于执行以下步骤，包括：

对所述第一音频信息、第二音频信息以及伴奏信息进行混音得到播放音频；

对所述播放音频进行声反馈抑制处理和扩音处理以使扬声器对所述播放音频播放。

可选地，在第二方面的一种可能实现方式中，所述混音模块还用于执行以下步骤，包括：

预先设置最大延迟时间；

获取当前接收的第二音频信息的传输延迟，将所述传输延迟与最大延迟时间比对；

若传输延迟大于最大延迟时间，则在最大延迟时间后播放接收到的第二音频信息。

可选地，在第二方面的一种可能实现方式中，所述生成模块还用于执行以下步骤，包括：

接收每个麦克风所对应的音频特征；

提取所述音频中与音频特征对应的音频信息作为第一音频信息。

本发明实施例的第三方面，提供一种可读存储介质，所述可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时用于实现本发明第一方面及第一方面各种可能设计的所述方法。

本发明提供的一种适用于多人K歌的音频同步方法、装置及存储介质，能够在多个人进行K歌时通过每个人对应的麦克风采集各自的人声，然后将各自的人声发送至其他人的麦克风处，最后将所有人的人声与伴奏混音得到播放的音频，以此实现多个人同时K歌、合唱的目的和效果。并且在人声互相发送的过程中，会对人声的数据进行检测，避免出现丢包的情况出现回音，保障办发明提供的技术方案的稳定性。

附图说明

图1为适用于多人K歌的音频同步方法的第一种实施方式的流程图；

图2为本发明实施例中声音信息、数据传输的其中一种实施方式示意图；

图3为声反馈回路特征的测量阶段的示意图；

图4为声反馈回路特征的跟踪阶段的示意图；

图5为适用于多人K歌的音频同步装置的第一种实施方式的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

应当理解，在本发明的各种实施例中，各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

应当理解，在本发明中，“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本发明中，“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含，“包含A、B或C”是指包含A、B、C三者之一，“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。

应当理解，在本发明中，“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”，表示B与A相关联，根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。A与B的匹配，是A与B的相似度大于或等于预设的阈值。

取决于语境，如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

本发明提供一种适用于多人K歌的音频同步方法，在执行本方法的步骤前，预先设置多组扬声器和麦克风，每一组扬声器和麦克风对应一个歌唱人员。

在一个可能的实施方式中，包括多个移动终端，每个移动终端分别具有一组扬声器和麦克风，每个歌唱人员可以持有一个移动终端同时进行K歌。

在一个可能的实施方式中，包括1个移动终端，该1个移动终端连接有多个一体耳机、蓝牙耳机等等，每个一体耳机、蓝牙耳机对应一个歌唱人员，通过1个移动终端和多个一体耳机、蓝牙耳机实现多个歌唱人员同时进行K歌。

如图1所示其流程图，本发明包括以下步骤：

步骤S110、通过多个扬声器对多个歌唱人员同步播放伴奏信息。在同步播放伴奏信息的过程中，可以是基于一个终端同时对扬声器进行控制，也可以是基于多个终端分别对扬声器进行控制，但是不管是怎样的控制方式，都需要控制扬声器同步播放伴奏信息。

步骤S120、每个麦克风获取音频生成第一音频信息。由于每个麦克风会离持有其的歌唱人员较近，所以其更容易获取相应歌唱人员的人声，该第一音频信息中主要是相应歌唱人员的人声。

步骤S130、将每个麦克风得到的第一音频信息发送至其他麦克风形成其他麦克风的第二音频信息。在多个歌唱人员同时歌唱的情况下，需要将每个歌唱人员的歌声发送至其他麦克风处形成第二音频信息。

步骤S140、每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后得到播放音频通过对应的扬声器播放。在每个麦克风都得到其他麦克风采集的歌声后，会对所有歌唱人员的歌声与伴奏信息进行处理得到播放音频，该播放音频为合唱的音频，通过每个扬声器对合唱的音频进行播放以使每个歌唱人员都能够听到合唱的歌声。

在一个可能的实施方式中，如图2所示为2个歌唱用户同时歌唱的声音信息、数据传输示意图，包括歌唱用户A和歌唱用户B，歌唱用户A和歌唱用户B处分别设置有一组麦克风和扬声器，此时的终端可以是2个终端，也可以是1个终端，即图中的终端A和终端B可以是相同的、也可以是不同的。通过麦克风分别采集相应的人声后进行录音缓存得到第一音频信息，在得到第一音频信息后将第一音频信息缓存发送至其他终端，与此同时，缓存接收其他终端发送的第二音频信息，当出现丢包情况时，引入丢包隐藏(差错隐藏)处理，对丢失的包进行预测。并根据丢包隐藏的情况对第一音频信息、第二音频信息、伴奏信息进行混音和声反馈抑制处理得到播放音频。

进一步的，每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后通过对应的扬声器播放包括：

对所述第一音频信息、第二音频信息以及伴奏信息进行混音得到播放音频；

对所述播放音频进行声反馈抑制处理和扩音处理以使扬声器对所述播放音频播放。

在一种可能的实施方式中，如图3所示，预先对移动终端进行配置，在未进行扬声/K歌时，需要先对移动终端进行配置，此时移动终端的扬声器没有播放歌声或者音乐。首先，使用移动终端扬声器主动播放多种声反馈探测信号、记录移动终端麦克风记录这些信号，通过分析计算得到回声功率、频率响应、环境混音脉冲响应。将所获得的计算结果保存为声反馈回路特征，根据声反馈回路特征对播放音频进行声反馈抑制处理。

在一种可能的实施方式中，如图4所示，在扬声/K歌的过程中，移动终端所处的环境可能会发生变化，本发明能够根据移动终端所处的环境变化进而改变声反馈回路特征，使得移动终端能够自动的适应环境环境变化而改变声反馈回路特征，即在移动终端所处的环境信息、位置信息发生改变时，其中环境信息、位置信息包括移动终端的姿态、位置以及移动速度，基于环境信息、位置信息改变回声功率、频率响应以及环境混音的脉冲响应。

进一步的，步骤S140包括：

预先设置最大延迟时间。在实际的K歌过程中，人耳对声音的分辨是具有时间性的，如果两个声音的间隔足够短，此时人耳听到的为同一个声音，所以对于本发明中设置的最大延迟时间可以是根据人耳对声音的分辨间隔来得到的。

获取当前接收的第二音频信息的传输延迟，将所述传输延迟与最大延迟时间比对。通过将接收到他麦克风发送的第二音频信息的传输延迟与最大延迟比对，可以判断是否可能会出现K歌、合唱不同步的情况。

若传输延迟大于最大延迟时间，则在最大延迟时间后播放接收到的第二音频信息。当传输延迟大于最大延迟时间时，此时已经可能会出现合唱不同步的情况，所以先将接收到的其他麦克风发送的第二音频信息进行播放，以避免出现K歌、合唱不同步的情况。

进一步的，将每个麦克风得到的第一音频信息发送至其他麦克风形成其他麦克风的第二音频信息包括：

获取调整函数，所述调整函数用于对任意两组扬声器和麦克风之间的第二音频信息进行调整；

基于所述调整函数对当前时刻接收到的第二音频信息调整得到调整后的第二音频信息。在对第二音频信息调整后进行人声增强处理，对第一音频信息、所有的第二音频信息以及伴奏分别进行声反馈抑制处理，最后增强扩音音效后放音。

进一步的，所述获取调整函数包括：

任意一个扬声器播放白噪声信号；

其他组的麦克风对白噪声信号录制；

对录制的白噪声信号与播放的白噪声信号进行互相关计算及低通滤波，得到任意两组设备之间的传递函数；

将第二音频信息经过传递函数后的初始幅度调整系数为1。

进一步的，通过以下步骤对初始幅度调整系数调整，包括：

基于声反馈信息获取任意两组设备之间的距离信息，所述距离信息包括先前时刻距离和当前时刻距离。其中声反馈信息可以是上述的声反馈回路特征。声反馈信息也可以是对声反馈回路特征进行处理得到的，因为声反馈回路特征包括了环境变化、不同终端间影响的变化，所以声反馈回路特征也可以是去除了环境变化，只保留了不同终端间影响的变化。

通过以下公式计算幅度调整系数，包括：

其中，A为先前时刻距离，B为先前时刻距离。

本发明提供的技术方案，可以根据声反馈信息中的位置信息变化关系，计算出终端之间距离的变化，调整经过传递函数后的幅度调整系数。终端间距离变近，幅度调大，终端间距离变远，幅度调小。进一步的，步骤S120包括：

接收每个麦克风所对应的音频特征。音频特征可以是音色，因为每个人的音色都不相同，所以可以根据音色对音频的归属进行区分。

提取所述音频中与音频特征对应的音频信息作为第一音频信息。例如说歌唱用户对应麦克风A，则对麦克风A在K歌时录制的歌声(音频信息)进行处理，提取音频信息中具有A相应音色特征的第一音频信息，该第一音频信息默认为是持有该麦克风的歌唱用户的歌声。

本发明提供的同步过程至少包含以下特征：

1)每个终端分别下载伴奏，播放时只同步播放开始时间。

2)当前终端在采集声音后，直接将采集到的声音发送到其他终端，以缩短延迟时间。

3)当前终端在接收其他终端发送来的声音时，设置一个最大延迟时间，该时间作为传输丢包的判决门限，即所有传输延迟大于该门限的数据均被认为是丢包。当前终端在等待这个时间后就开始播放接收到的人声，当数据丢失时，引入丢包隐藏(差错隐藏)处理，对丢失的包进行预测。

4)当前终端接收到的其他终端的声音在当前终端播放时，其音效是由当前终端进行控制。

本发明还提供一种适用于多人K歌的音频同步装置，预先设置多组扬声器和麦克风，每一组扬声器和麦克风对应一个歌唱人员，如图5所示其结构示意图，包括：

同步播放模块，用于通过多个扬声器对多个歌唱人员同步播放伴奏信息；

生成模块，用于使每个麦克风获取音频生成第一音频信息；

发送模块，用于将每个麦克风得到的第一音频信息发送至其他麦克风形成其他麦克风的第二音频信息；

混音模块，用于对每个麦克风将采集的第一音频信息、接收到的第二音频信息以及伴奏信息进行混音处理后得到播放音频通过对应的扬声器播放。

在一个实施例中，所述混音模块还用于执行以下步骤，包括：

对所述第一音频信息、第二音频信息以及伴奏信息进行混音得到播放音频；

对所述播放音频进行声反馈抑制处理和扩音处理以使扬声器对所述播放音频播放。

在一个实施例中，所述混音模块还用于执行以下步骤，包括：

预先设置最大延迟时间；

获取当前接收的第二音频信息的传输延迟，将所述传输延迟与最大延迟时间比对；

若传输延迟大于最大延迟时间，则在最大延迟时间后播放接收到的第二音频信息。

在一个实施例中，所述生成模块还用于执行以下步骤，包括：

接收每个麦克风所对应的音频特征；

提取所述音频中与音频特征对应的音频信息作为第一音频信息。

其中，可读存储介质可以是计算机存储介质，也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如，可读存储介质耦合至处理器，从而使处理器能够从该可读存储介质读取信息，且可向该可读存储介质写入信息。当然，可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(ApplicationSpecific Integrated Circuits，简称：ASIC)中。另外，该ASIC可以位于用户设备中。当然，处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本发明还提供一种程序产品，该程序产品包括执行指令，该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令，至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的方法。

在上述终端或者服务器的实施例中，应理解，处理器可以是中央处理单元(英文：Central Processing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：Digital Signal Processor，简称：DSP)、专用集成电路(英文：Application SpecificIntegrated Circuit，简称：ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

13页详细技术资料下载

适用于多人k歌的音频同步方法、装置及存储介质

相关技术

网友询问留言