一种生成并比对音乐数据的方法、设备和计算机存储介质

文档序号：1567443 发布日期：2020-01-24 浏览：21次 >En<

阅读说明：本技术 一种生成并比对音乐数据的方法、设备和计算机存储介质 (Method, equipment and computer storage medium for generating and comparing music data ) 是由胡晨鹏于 2018-06-29 设计创作，主要内容包括：本发明提供一种用于终端的生成并比对音乐数据的方法,包括：采集用户的声音数据；将用户的声音数据发送至网络端；接收由网络端基于声音数据生成并返回的音乐数据；将音乐数据发布至用户所入驻的社交空间,社交空间入驻有多个用户；接收网络端返回的、音乐数据与入驻社交空间的其他至少一个用户发布的音乐数据的比对结果。本发明还提供一种用于网络端的生成并比对音乐数据的方法,包括：接收终端所发送的用户的声音数据；对用户的声音数据进行补充渲染,得到音乐数据；将音乐数据发送至终端；将音乐数据与用户入驻的社交空间的其他至少一个用户发布的音乐数据进行比对,获得比对结果；将比对结果发送至终端。本发明能够智能地生成并比对音乐数据。(The invention provides a method for generating and comparing music data for a terminal, which comprises the following steps: collecting voice data of a user; sending the voice data of the user to a network end; receiving music data generated and returned by the network side based on the sound data; the music data are published to a social space where the users reside, and the social space where the users reside is provided with a plurality of users; and receiving a comparison result of the music data returned by the network side and the music data published by at least one other user residing in the social space. The invention also provides a method for generating and comparing music data for a network terminal, which comprises the following steps: receiving voice data of a user, which is sent by a terminal; performing supplementary rendering on the sound data of the user to obtain music data; transmitting the music data to the terminal; comparing the music data with the music data issued by at least one other user in the social space where the user resides to obtain a comparison result; and sending the comparison result to the terminal. The invention can intelligently generate and compare music data.)

【技术领域】

本发明涉及数据处理技术领域，尤其涉及一种生成并比对音乐数据的方法、设备和计算机存储介质。

【背景技术】

目前的计算机技术已经能够支持对音乐的分析和评估。在一些现有技术中，用户可以在诸如卡拉OK等歌唱活动场所中进行演唱，计算机可直接对用户的演唱进行评分并公布。但这种处理方式仍十分单一，且使用场合受限。因此，需要新的分析和评估音乐的方式。

【

发明内容

】

有鉴于此，本发明提供了一种生成并比对音乐数据的方法、设备和计算机存储介质，能够智能地生成并比对音乐数据。

本发明为解决技术问题所采用的技术方案是提供一种用于终端的生成并比对音乐数据的方法，所述方法包括：采集用户的声音数据；将所述用户的声音数据发送至网络端；接收由所述网络端基于所述声音数据生成并返回的音乐数据；将所述音乐数据发布至所述用户所入驻的社交空间，所述社交空间入驻有多个用户；接收所述网络端返回的、所述音乐数据与入驻所述社交空间的其他至少一个用户发布的音乐数据的比对结果。

本发明为解决技术问题所采用的技术方案是提供一种用于网络端的生成并比对音乐数据的方法，所述方法包括：接收终端所发送的用户的声音数据；对所述用户的声音数据进行补充渲染，得到音乐数据；将所述音乐数据发送至所述终端；将所述音乐数据与所述用户入驻的社交空间的其他至少一个用户发布的音乐数据进行比对，获得比对结果；将所述比对结果发送至所述终端。

由以上技术方案可以看出，本发明仅利用用户的声音数据，便能够通过预先训练得到的音乐生成模型生成音乐数据，并能够智能地对音乐数据进行比对。上述方案能够基于用户提供的声音数据实现智能化的音乐数据创作，并能够自动对关联用户发布的音乐数据进行自动比对。简化用户在生成歌曲的音乐数据的过程中的操作消耗，并提供了智能化的音乐数据自动比对方案。

【附图说明】

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1为本发明一实施例提供的用于终端的生成并比对音乐数据的方法流程图；

图2为本发明一实施例提供的用于网络端的生成并比对音乐数据的方法流程图；

图3为本发明一实施例提供的计算机系统/服务器的框图。

【

具体实施方式

】

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

图1为本发明一实施例提供的用于终端的生产并比对音乐数据的方法流程图。所述终端可以是能够通过网络访问所述网络端的各种电子设备，其可以实现为硬件设备或软件。当终端包括硬件时，其可包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端包括软件时，可以安装在上述各种电子设备中。图1所示方法包括：

在101中，采集用户的声音数据。

在本步骤中，由终端对用户的声音数据进行采集。在一些实施例中，所接收的用户的声音数据包括用户录制的该用户的声音数据。在一些实施例中，该声音数据可能包括用户哼唱的纯音乐，且该声音数据不体现歌词；在一些实施例中，该声音数据可能包括用户读出的歌词数据，且该声音数据不体现歌曲的音调；在一些实施例中，该声音数据可能包括用户演唱的含歌词的歌曲，即该声音数据体现歌词以及歌曲的曲调。

在一些实施例中，在采集用户的声音数据时，可以采用以下方式：获取到用户触发声音采集的功能时，例如用户点击声音采集的按钮时，或者用户发出声音采集的语音指令时，则通过终端的麦克风来采集用户的声音数据。

在102中，将所述用户的声音数据发送至网络端。

在本步骤中，将步骤101中所采集的用户的声音数据发送至网络端，由网络端根据所接收到的声音数据生成对应的音乐数据。所述网络端可以包括支持网络连接从而提供各种网络服务的硬件设备或软件。当网络端包括硬件时，其可以实现成多个网络设备组成的分布式设备群，也可以实现成单个网络设备，如实现成分布式服务器或单个服务器。当网络设备包括软件时，可以安装在上述所列举的网络设备中。这时，作为软件，其可以实现成例如用来提供分布式服务的多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

在一些实施例中，本步骤将用户的声音数据发送至第一网络端，由第一网络端生成并返回对应用户的声音数据的音乐数据。

在103中，接收由所述网络端基于所述声音数据生成并返回的音乐数据。

在本步骤中，步骤102将所采集的用户的声音数据发送至网络端后，接收由网络端基于用户的声音数据生成并返回的音乐数据。同样，在一些实施例中，本步骤接收由第一网络端生成并返回的音乐数据。

在104中，将所述音乐数据发布至所述用户所入驻的社交空间，所述社交空间入驻有多个用户。

在本步骤中，在步骤103接收网络端生成并返回的音乐数据后，将所接收到的音乐数据发布至用户入驻的社交空间，该社交空间中入驻有多个用户。其中，用户入驻的社交空间为用户进行展示自我或与他人进行交流的虚拟网络空间，包括但不限于聊天群、虚拟房间、朋友圈等。

另外，本步骤将音乐数据发布至用户入驻的社交空间时，可以根据用户的选择来确定是否将音乐数据发布至社交空间；也可以由终端在接收到音乐数据后，自动地将所接收到的音乐数据发布至社交空间。可以理解的是，本步骤在将音乐数据发布至社交空间时，实际上是将音乐数据发送至服务于社交应用的网络端，例如第二网络端，如服务聊天群的第二网络端、服务朋友圈的第二网络端等。

在105中，接收所述网络端返回的、所述音乐数据与入驻所述社交空间的其他至少一个用户发布的音乐数据的比对结果。

在一些实施例中，用户所入驻的社交空间中的其他所有用户对该用户均可见，例如，对于入驻聊天群或虚拟房间的用户，该聊天群或虚拟房间中的其他用户通常对该用户均可见。在此情况下，所述比对结果可包括所述用户在该社交空间中发布的音乐数据与该社交空间中的其他所有用户发布的音乐数据的比对结果；或者，所述比对结果可包括所述用户在该社交空间中发布的音乐数据与该社交空间中的其他所有用户在预定时间段内发布的音乐数据的比对结果，该预定时间段可包括自当前时间起倒退预定时间长度的时间段。在一些实施例中，用户可选择该社交空间中的其他用户或其他用户发布的音乐数据，终端可将用户的选择通知网络端，由网络端返回该用户在社交空间中发布的音乐数据，与该用户选择的音乐数据或该用户选择的其他用户发布的音乐数据的比对结果。

在一些实施例中，用户所入驻的社交空间中的一些用户对该用户可能是不可见的；例如，对于入驻朋友圈的用户，通常仅该用户的好友才对该用户可见。在此情况下，所述比对结果可包括所述用户在该社交空间中发布的音乐数据与该社交空间中的其他可见用户发布的音乐数据的比对结果；或者，所述比对结果可包括所述用户在该社交空间中发布的音乐数据与该社交空间中的其他可见用户在预定时间段内发布的音乐数据的比对结果，该预定时间段可包括自当前时间起倒退预定时间长度的时间段。在一些实施例中，用户可选择该社交空间中的其他可见用户或其他可见用户发布的音乐数据，终端可将用户的选择通知网络端，由网络端返回该用户在社交空间中发布的音乐数据，与该用户选择的音乐数据或该用户选择的其他可见用户发布的音乐数据的比对结果。

在本步骤中，在步骤104将音乐数据发布至社交空间后，接收由网络端返回的、该音乐数据与入驻社交空间的其他至少一个用户发布的音乐数据的比对结果。其中，比对结果包括但不限于对所发布的音乐数据的评分、对所发布的多个音乐数据分析比对结果等。在一些实施例中，本步骤中从服务于社交空间的第二网络端接收用户的音乐数据与其他用户的音乐数据的比对结果。

比对结果可以多种形式发布在社交空间中；例如，以与该社交空间发布消息的形式相适应的方式发布在社交空间中。例如，以聊天消息或消息链接的形式发布在聊天群中、以多媒体形式发布在虚拟房间中、以朋友圈消息的形式发布在朋友圈中，等等。

另外，在一些实施例中，本步骤还可进一步包括：接收网络端返回的、该网络端根据社交空间的其他至少一个用户新发布的音乐数据以及用户的音乐数据更新后的比对结果。也就是说，在其他用户将新创作的音乐数据发布至社交应用后，终端能够接收到网络端所返回的、用户已发送的音乐数据与其他用户新发布的音乐数据之间更新后的比对结果。

图2为本发明一实施例提供的用于网络端的生产并比对音乐数据的方法流程图。如图2中所示，所述方法包括：

在201中，接收终端所发送的用户的声音数据。

在本步骤中，网络端接收由终端所发送的用户的声音数据。其中，所述音乐数据已在前述参照图1所示实施例中予以详述，在此不再赘述。

在一些实施例中，本步骤中由第一网络端接收终端所发送的用户的声音数据，从而得到对应用户的声音数据的音乐数据。

在202中，对所述用户的声音数据进行补充渲染，得到音乐数据。

在本步骤中，对步骤201所接收到的用户的声音数据进行补充渲染，从而得到对应用户声音数据的音乐数据。

可选地，在对用户的声音数据进行补充渲染得到音乐数据时，可以采用以下方式：获取用户的声音数据的旋律特征；基于所获取的旋律特征，利用预先训练得到的音乐生成模型对用户的声音数据进行补充渲染，得到音乐数据。

上述过程使用的音乐生成模型可以采用以下方式预先训练得到：获取多个音乐样本及其旋律特征；将多个音乐样本及其旋律特征作为训练数据；将训练数据中多个音乐样本的旋律特征作为输入，多个音乐样本作为输出，训练深度学习模型，得到音乐生成模型。因此，利用该方式训练得到的音乐生成模型，能够根据用户声音数据的旋律特征生成对应的音乐数据。

另外，在对用户的声音数据进行补充渲染得到音乐数据时，还可以采用以下方式：对用户的声音数据中用户的声音进行文本转换，并获取用户的声音数据的旋律特征；基于旋律特征和转换得到的文本信息，利用预先训练得到的音乐生成模型对用户的声音数据进行补充渲染，得到音乐数据。

上述过程使用的音乐生成模型则可以采用以下方式预先训练得到：获取多个音乐样本以及多个音乐样本的旋律特征和文本信息；将多个音乐样本的旋律特征和文本信息作为输入，音乐样本作为输出，训练深度学习模型，得到音乐生成模型。因此，利用该方式训练得到的音乐生成模型，能够根据用户声音数据的旋律特征以及文本信息生成对应的音乐数据。

其中，上述两个训练过程所使用的深度学习模型包括但不限于循环神经网络模型、深度神经网络模型或卷积神经网络模型中的一种。

在203中，将所述音乐数据发送至所述终端。

在本步骤中，将步骤202所得到的音乐数据发送至终端。

在204中，将所述音乐数据与所述用户入驻的社交空间的其他至少一个用户发布的音乐数据进行比对，获得比对结果。

在本步骤中，将音乐数据与用户入驻的社交空间的其他至少一个用户发布的音乐数据进行比对，从而获得比对结果。在一些实施例中，由第二网络端进行音乐数据的比对，第二网络端所得到的比对结果可以但不限于评分、音乐数据分析比对结果等。

另外可以理解的是，第二网络端所接收的音乐数据可以为终端所发送的音乐数据；也可以为第一网络端所发送的音乐数据，即第一网络端除了将音乐数据发送至终端外，还将其发送至第二网络端。

在一些实施例中，本步骤还可以进一步包括：接收社交空间的其他至少一个用户新发布的音乐数据；将用户的音乐数据与其他用户新发布的音乐数据进行比对，获得更新后的比对结果。即实时地将用户的音乐数据与其他用户最新发布的音乐数据进行比对，得到不断更新的用户的音乐数据与其他用户的音乐数据之间的比对结果，从而能够持续地激发用户的创作热情，提升本发明的使用频率。

在205中，将所述比对结果发送至所述终端。

在本步骤中，将步骤204所得到的比对结果发送至终端，从而便于用户查看由自己的声音数据所得到的音乐数据与其他用户音乐数据的比对情况。

图3示出了适于用来实现本发明的一些实施方式的示例性计算机系统/服务器012的框图。图3显示的计算机系统/服务器012仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图3所示，计算机系统/服务器012以通用计算设备的形式表现。计算机系统/服务器012的组件可以包括但不限于：一个或者多个处理器或者处理单元016，系统存储器028，连接不同系统组件(包括系统存储器028和处理单元016)的总线018。

总线018表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，***总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。

计算机系统/服务器012典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机系统/服务器012访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器028可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)030和/或高速缓存存储器032。计算机系统/服务器012可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统034可以用于读写不可移动的、非易失性磁介质(图3未显示，通常称为“硬盘驱动器”)。尽管图3中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线018相连。存储器028可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块042的程序/实用工具040，可以存储在例如存储器028中，这样的程序模块042包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块042通常执行本发明所描述的实施例中的功能和/或方法。

计算机系统/服务器012也可以与一个或多个外部设备014(例如键盘、指向设备、显示器024等)通信，在本发明的一些实施例中，计算机系统/服务器012与外部雷达设备进行通信，还可与一个或者多个使得用户能与该计算机系统/服务器012交互的设备通信，和/或与使得该计算机系统/服务器012能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口022进行。并且，计算机系统/服务器012还可以通过网络适配器020与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器020通过总线018与计算机系统/服务器012的其它模块通信。应当明白，尽管图中未示出，可以结合计算机系统/服务器012使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元016通过运行存储在系统存储器028中的程序，从而执行各种功能应用以及数据处理，例如实现一种用于终端的生成并比对音乐数据的方法，可以包括：

采集用户的声音数据；

将所述用户的声音数据发送至网络端；

接收由所述网络端基于所述声音数据生成并返回的音乐数据；

将所述音乐数据发布至所述用户所入驻的社交空间，所述社交空间入驻有多个用户；

接收所述网络端返回的、所述音乐数据与入驻所述社交空间的其他至少一个用户发布的音乐数据的比对结果。

也可以实现一种用于网络端的生成并比对音乐数据的方法，可以包括：

接收终端所发送的用户的声音数据；

对所述用户的声音数据进行补充渲染，得到音乐数据；

将所述音乐数据发送至所述终端；

将所述音乐数据与所述用户入驻的社交空间的其他至少一个用户发布的音乐数据进行比对，获得比对结果；

将所述比对结果发送至所述终端。

上述的计算机程序可以设置于计算机存储介质中，即该计算机存储介质被编码有计算机程序，该程序在被一个或多个计算机执行时，使得一个或多个计算机执行本发明上述实施例中所示的方法流程和/或装置操作。例如，被上述一个或多个处理器执行本发明实施例所提供的方法流程。

随着时间、技术的发展，介质含义越来越广泛，计算机程序的传播途径不再受限于有形介质，还可以直接从网络下载等。可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

由以上技术方案可以看出，本发明能够基于用户提供的声音数据实现智能化的音乐数据创作，并能够自动对关联用户发布的音乐数据进行自动比对。简化用户在生成歌曲的音乐数据的过程中的操作消耗，并提供了智能化的音乐数据自动比对方案。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

13页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：利用多重交互注意力机制解决视频中对象关系问答任务的方法

一种生成并比对音乐数据的方法、设备和计算机存储介质

相关技术

网友询问留言