一种音频流量的压缩算法

文档序号：36639 发布日期：2021-09-24 浏览：35次 >En<

阅读说明：本技术 一种音频流量的压缩算法 (Compression algorithm of audio flow ) 是由黄超蒋泽飞于 2021-06-20 设计创作，主要内容包括：本发明公开了一种音频流量的压缩算法,包括以下步骤；步骤一、进行去噪处理；步骤二、对去噪处理后的音频数据计算功率谱密度,如果功率谱密度小于所设定的阈值,则把音频数据包标识为音频静态帧格式,并把向服务器发送的音频数据包数据字段填为空；步骤三、服务端收到带有音频静态帧的数据包之后,对音频数据进行转发；步骤四、客户端PC软件或APP软件收到服务端转发的音频数据包之后,在播放的时候客户端对带有音频静态帧的数据包标识为静音。本发明能够对前端摄像机芯片编码输出的音频数据的噪声进行去除,可以改善客户端播放音频声音的用户体验,减轻了服务端的流量压力,降低了服务器的使用费用。(The invention discloses a compression algorithm of audio flow, which comprises the following steps of; step one, carrying out denoising treatment; step two, calculating the power spectral density of the audio data after the denoising treatment, if the power spectral density is smaller than a set threshold value, marking the audio data packet into an audio static frame format, and filling the data field of the audio data packet sent to the server into a null; step three, after receiving the data packet with the audio static frame, the server side forwards the audio data; and fourthly, after the client PC software or the APP software receives the audio data packet forwarded by the server, the client marks the data packet with the audio static frame as mute in the playing process. The invention can remove the noise of the audio data output by the front-end camera chip code, can improve the user experience of playing audio sound by the client, reduces the flow pressure of the server and reduces the use cost of the server.)

一种音频流量的压缩算法

技术领域

本发明涉及电子信息

技术领域

，具体为一种音频流量的压缩算法。

背景技术

音频压缩技术主要是对原始的数字音频信号(PCM)进行编码，编码成G.711A、G.711U、AAC、Opus等格式进行传输，或者在不损失有用音频信息的基础上，对一些可忽略的音频数据进行滤除，减少传输过程中占用网络带宽的压力，但是，在对原始PCM格式的音频信号进行编码的时候，会使得音频信号出现大量的噪声和失真的现象，而且，直接采用PCM格式的音频数据进行存储和传输会占用大量的物理空间和网络带宽，所以，数字音频信号在数据存储和传输上有尤为突出的优点，也有相应的缺点。数字音频压缩编码是在确保音频信号在听觉上不产生失真的情况下，对音频数据进行尽可能的压缩，而且，对声音中冗余的信息进行去除，冗余成分指的是音频中不能被人耳感知到的信息，这些冗余信息对确定声音的音色，音调等信息没有任何的帮助，所以，在安防行业摄像机音频码流网络传输中同样存在相应急需解决的问题。

摄像机编码输出的音频数据存在一些无用的噪声信息和用户认为无用的音频信息，一旦接入平台的摄像机达到千万甚至上亿级别，这么多摄像机在向服务器同时传送巨量的音频数据的时候，会对服务器造成较大的流量压力，为了节省服务器的流量费用，需要对摄像机传输的音频数据进行优化。

发明内容

本发明的目的在于提供一种音频流量的压缩算法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种音频流量的压缩算法，包括以下步骤；

步骤一、进行去噪处理；

步骤二、对去噪处理后的音频数据计算功率谱密度，如果功率谱密度小于所设定的阈值，则把音频数据包标识为音频静态帧格式，并把向服务器发送的音频数据包数据字段填为空；

步骤三、服务端收到带有音频静态帧的数据包之后，对音频数据进行转发；

步骤四、客户端PC软件或APP软件收到服务端转发的音频数据包之后，在播放的时候客户端对带有音频静态帧的数据包标识为静音。

优选的，在所述客户端PC软件或者APP中有对音频的功率谱密度值配置的配置项。

优选的，用户可以根据当前监控的周围环境声音情况，通过配置项对功率谱密度值进行调节，选择要保留的有用的声音信息，滤除用户认为无用的声音信息。

本发明提出的一种音频流量的压缩算法，有益效果在于：

1、本发明能够对前端摄像机芯片编码输出的音频数据的噪声进行去除，可以改善客户端播放音频声音的用户体验；

2.本发明剔除噪声之后的音频数据不再向服务端进行发送和低于用户配置音频静态帧阈值的音频数据内容不会向服务端进行发送，减轻了服务端的流量压力，降低了服务器的使用费用。

附图说明

图1为本发明CameraSDK内部音频数据的处理流程图；

图2为本发明的直播和回放的音频数据包的处理流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-2，本发明提供一种技术方案：一种音频流量的压缩算法，包括以下步骤；

步骤一、进行去噪处理；

步骤三、服务端收到带有音频静态帧的数据包之后，对音频数据进行转发；

步骤四、客户端PC软件或APP软件收到服务端转发的音频数据包之后，在播放的时候客户端对带有音频静态帧的数据包标识为静音；

在客户端PC软件或者APP中有对音频的功率谱密度值配置的配置项，由于摄像机采集到的音频信息和周围环境息息相关，用户可以根据当前监控的周围环境声音情况，对功率谱密度值进行调节，选择要保留的有用的声音信息，滤除用户认为无用的声音信息。

实施例：在CameraSDK中对音频数据进行预处理的时候，首先，进行去噪处理，摄像机芯片编码输出的音频数据中包含有白噪声和有色噪声，需要对塞入CameraSDK中的音频数据包进行解码转成PCM音频格式，然后，对PCM音频数据进行傅里叶展开，利用数字滤波器滤除白噪声和有色噪声，再把去噪之后PCM的音频数据编码成原来塞入CameraSDK中的音频编码格式；

其次，统计塞入CameraSDK中最近2秒内转成PCM经过去噪处理之后音频数据的功率谱密度，同时，摄像机CameraSDK内部会上报一个音频功率谱密度的默认值到ESD(配置中心服务器)，这个音频的功率谱密度默认值大小是支持客户端PC软件或者APP软件进行用户配置，CameraSDK内部会根据计算出音频的功率谱密度值和用户配置的功率谱密度值进行比较，如果，小于当前配置的音频功率谱密度值，则把之后塞入CameraSDK中的音频数据包都标识为音频静态帧格式，在向服务端发送音频数据包的时候把音频数据字段填为空(NULL)；

如果再经过两秒后计算的音频功率谱密度值大于用户配置的音频功率谱密度值，则把之后塞入CameraSDK中的音频数据包都标识为正常音频格式，向服务端发送音频数据包的时候音频数据字段填的是去噪之后的音频数据；

服务端收到音频数据包的静态帧标识之后，对音频数据包进行转发，客户端PC软件或者APP软件播放的时候对收到带有音频静态帧标识的音频数据包标识为静音。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

6页详细技术资料下载

一种音频流量的压缩算法

相关技术

网友询问留言