一种语音信号分离方法

文档序号:1339716 发布日期:2020-07-17 浏览:6次 >En<

阅读说明:本技术 一种语音信号分离方法 (Voice signal separation method ) 是由 李一兵 吴静 孙骞 吕威 田园 于 2020-03-19 设计创作,主要内容包括:本发明提出了一种语音信号分离方法,首先建立观测信号的线性瞬时混合模型,针对随着源信号数目增多的情况下分离精度下降明显的问题,提出改进的最小化l&lt;Sub&gt;1&lt;/Sub&gt;范数算法。算法首先对观测信号和混合矩阵进行预处理,而后根据向量的长度和方向来找到最接近观测信号的向量,在此基础上,又将混合矩阵的形式进行改变,利用变化后的混合矩阵估计某时刻的源信号,进而估计出所有时刻的源信号。本发明所提方法解决了随着源信号数目增多的情况下分离精度下降明显的问题,同时有效地分离出源信号。(The invention provides a voice signal separation method, which comprises the steps of firstly establishing a linear instantaneous mixed model of an observation signal, and aiming at the problem that the separation precision is obviously reduced under the condition that the number of source signals is increased, providing improved minimum l 1 And (4) carrying out norm algorithm. The algorithm firstly preprocesses an observation signal and a mixing matrix, then finds a vector closest to the observation signal according to the length and the direction of the vector, changes the form of the mixing matrix on the basis, estimates a source signal at a certain moment by using the changed mixing matrix, and further estimates source signals at all moments. The method provided by the invention solves the problem that the separation precision is obviously reduced under the condition that the number of the source signals is increased, and simultaneously, the source signals are effectively separated.)

一种语音信号分离方法

技术领域

本发明涉及一种在欠定模型下的语音信号分离方法,具体涉及一种语音信号分离方法,属于信号处理领域。

背景技术

近几年,在信号处理领域,语音信号的分离已经成为了一个研究热点。它在电话会议,助听器和机器语音识别等方面有很多应用和影响。由于接收到的声音通常是有噪的,在这样的环境中识别感兴趣的声音并获得清晰的声音的问题成为值得探讨的问题,也就是所谓的盲源分离问题。

盲源分离一般根据源信号和观测信号的数目进行划分,可以分为超定、适定和欠定盲源分离,其中欠定盲源分离更加符合实际情况,在生活中应用更广,同时也更具有挑战。欠定盲源分离是指在传感器或者麦克风数目少于源信号数目的情况。通常情况下,解决欠定盲源分离的方法同样适用于超定和适定情况,所以对于欠定盲源分离方法的研究是很有必要的。一般解决欠定盲源分离的方法是利用稀疏分量分析法,一般也称为“两步法”。第一步是通过观测信号对混合矩阵进行估计,第二步是利用估计出的混合矩阵对源信号进行分离。根据源信号分离的研究现状,针对在源信号数目增多情况下,目前的源信号分离算法普遍存在下降明显的问题。

发明内容

针对上述现有技术,本发明要解决的技术问题是提供一种可以改善源信号数目增多情况下分离精度下降明显问题的基于改进最小化l1范数的语音信号分离方法。

为解决上述技术问题,本发明提供一种语音信号分离方法,包括以下步骤:

步骤1:建立观测信号的线性瞬时混合模型,具体为:

其中x(t)=[x1(t),x2(t),L,xN(t)]T是一个N维观测信号向量,A=[a1,a2,L,aM]是一个N×M维的混合矩阵,s(t)=[s1(t),s2(t),L,sM(t)]T是一个M维的源信号向量,t是时间采样点并且ai表示混合矩阵的第i个列向量;

步骤2:去除观测信号中全为零的列向量,之后将观测信号对称到上平面:

步骤3:采用改进的最小化l1范数分离源信号:

最小化l1范数为:

包括以下步骤:

(3a)计算t时刻下观测信号角度θ(t)和混合矩阵的列向量方向角度αi

计算公式为:

αi=arctan(ai2/ai1)i=1,2,K,n

式中,表示两路观测信号,ain表示混合矩阵中第i个列向量中第n个元素。

(3b)通过正弦定理和余弦定理计算混合矩阵中的任意两个列向量混合后的方向:

具体过程如下:

∠AOB=∠AOx-∠BOx

AB2=OA2+OB2-2OAOBcos∠AOB

OC2=OA2+AC2-2OAACcos∠OAC

其中,向量OA和OB为估计出的混合矩阵中的任意两个列向量,向量OA的角度∠AOx和向量OB的角度∠BOx分别为混合矩阵中的列向量所对应的方向,向量OA和OB的长度则对应混合矩阵的列向量的长度。

(3c):计算θ(t)和αi的夹角Δθ:

若有Δθ=0,则利用:

x(t)=aisi(t)

式中,x(t)为t时刻的观测信号向量,ai为混合矩阵第i个列向量,si(t)为t时刻估计出的第i路源信号。

若是Δθ≠0,利用:

式中,Wr=Ar -1,其中ac和ad是在t时刻上最接近观测信号向量的两个向量。

(3d):遍历所有时刻,得到源信号在所有时刻的表示s(t)。

本发明有益效果:本发明是针对稀疏分量分析方法的第二步进行的。本发明中,源信号分离采用基于改进的最小化l1范数的分离方法。

(1)所提出的源信号分离算法适用于两路观测信号;

(2)随着源信号数目的增多,源信号分离算法的分离精度下降较平稳。

附图说明

图1为本发明算法流程图;

图2为三路初始源信号图;

图3为混合成的两路观测信号;

图4为求任意两个列向量混合后的示意图;

图5为分离出的三路源信号图。

具体实施方式

本发明处理的对象是语音信号,首先考虑根据向量的长度和角度来找到最接近观测信号的向量,之后将混合矩阵的形式进行改变,利用变化后的混合矩阵估计某时刻的源信号,进而估计出所有时刻的源信号。

以下结合附图和具体实施案例,对本发明进行详细说明。

参照图1,本发明的一种基于改进最小化l1范数的语音信号分离方法具体实现步骤如下:

步骤1:建立观测信号的线性瞬时混合模型;图2为三路初始源信号,图3为混合成的两路观测信号。

在步骤1中,所述建立的数学模型为线性瞬时混合模型。选取语音信号作为源信号,所考虑的噪声为加性噪声,且信噪比为30dB。

建立观测信号的线性瞬时混合模型,具体表达式如下所示。

其中x(t)=[x1(t),x2(t),L,xN(t)]T是一个N维观测信号向量,A=[a1,a2,L,aM]是一个N×M维的混合矩阵,s(t)=[s1(t),s2(t),L,sM(t)]T是一个M维的源信号向量,t是时间采样点并且ai表示混合矩阵的第i个列向量。

步骤2:去除观测信号中全为零的列向量,之后将观测信号对称到上平面;

在步骤2中,由于观测信号中的全为零的列向量对分离源信号无作用,故需要将全为零的列向量去除掉。为了便于后期处理信号,将观测信号对称到上平面。

步骤3:利用改进的最小化l1范数分离源信号。

为了分离源信号,本发明采用最小化l1范数准则。

具体步骤如下:

(3a):计算t时刻下观测信号角度θ(t)和混合矩阵的列向量方向角度αi

为了使分离出的源信号模值和最小,本发明将混合矩阵的列向量的长度和角度一同考虑,来寻求源信号的最小模值。源信号分离算法为稀疏分量分析方法中的第二步,是建立在混合矩阵被估计出来的基础上。对于每个采样时刻的源信号,都可以由该时刻的观测信号x(t)分离出来,这样,源信号分离问题就转化成了单个采样时刻的源信号分离问题。首先计算下t时刻下观测信号方向θ(t)和混合矩阵的列向量方向αi

计算公式为:

θ(t)=arctan(xt2/xt1)

αi=arctan(ai2/ai1)i=1,2,K,n

式中,表示两路观测信号,ain表示混合矩阵中第i个列向量中第n路元素。

(3b)通过正弦定理和余弦定理计算混合矩阵中的任意两个列向量混合后的方向。图4为求任意两个列向量混合后的示意图。

由于同时考虑列向量的长度和方向来寻求源信号模值和的最小化,在已知混合矩阵的列向量的长度和方向的基础上,需要使用正弦定理和余弦定理来求任意两个列向量混合后的方向。

具体过程如下:

∠AOB=∠AOx-∠BOx

AB2=OA2+OB2-2OAOBcos∠AOB

OC2=OA2+AC2-2OAACcos∠OAC

其中,向量OA和OB为混合矩阵中的任意两个列向量,向量OA的角度∠AOx和向量OB的角度∠BOx分别为混合矩阵中的列向量所对应的方向,向量OA和OB的长度则对应混合矩阵的列向量的长度。

(3c):计算θ(t)和αi的夹角Δθ:

若有Δθ=0,说明观测信号采样点的斜率与混合矩阵的某一个列向量方向相同,则利用下式求得;

x(t)=aisi(t)

式中,x(t)为t时刻的观测信号向量,ai为混合矩阵第i个列向量,si(t)为t时刻估计出的第i路源信号。

若是Δθ≠0,则说明观测信号采样点的斜率与混合矩阵的某一个列向量方向不同,此时利用(3b)中求得的混合矩阵的任意两个列向量混合后的方向,寻找使其源信号模值和最小的两个列向量ac和ad。之后利用下式求得相应时刻下的源信号。

式中,Wr=Ar -1,其中ac和ad是在t时刻上最接近x的两个向量。

(3d):遍历所有时刻,得到源信号在所有时刻的表示s(t),图5为分离出的三路源信号图。

本发明的基于改进最小化l1范数的语音信号分离方法随着源信号数目增多分离精度下降平缓。

本发明的基于改进最小化l1范数的语音信号分离方法,只适用于两路观测信号。

综上所述:本发明提出了一种基于改进的最小化l1范数方法,首先建立观测信号的线性瞬时混合模型,针对随着源信号数目增多的情况下分离精度下降明显的问题,提出改进的最小化l1范数算法。算法首先对观测信号和混合矩阵进行预处理,而后根据向量的长度和方向来找到最接近观测信号的向量,在此基础上,又将混合矩阵的形式进行改变,利用变化后的混合矩阵估计某时刻的源信号,进而估计出所有时刻的源信号。本发明所提方法解决了随着源信号数目增多的情况下分离精度下降明显的问题,同时有效地分离出源信号。

需要说明的是,上述实施案例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:语音分离方法、模型训练方法及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!