一种基于半监督学习的声信号非视距识别方法

文档序号：1741148 发布日期：2019-11-26 浏览：26次 >En<

阅读说明：本技术 一种基于半监督学习的声信号非视距识别方法 (A kind of acoustical signal non line of sight recognition methods based on semi-supervised learning ) 是由胡志新张磊白旭晶钟宇薛文涛左文斌焦侃杨伟婷王楠于 2019-08-20 设计创作，主要内容包括：本发明公开了一种基于半监督学习的声信号非视距识别方法,采集原始声信号x[n],对采集的原始声信号x[n]进行探测及分割,获得互相关结果片段R<Sub>i</Sub>[τ],对得到的互相关结果片段R<Sub>i</Sub>[τ]进行特征提取及非视距识别。能够获取有标签声信号数据样本和无标签数据样本,并提取出声信号数据样本的多个特征,然后基于这些特征值利用半监督学习进行非视距识别。本发明方法根据少量已知类别的声信号数据,自动区分大量未知声信号数据,本发明方法不必获取大量训练数据,节省了人力物力,且分类识别效果较好,解决了只有少量已知样本情况下声信号非视距识别的难题,为基于声技术的室内定位系统的实际应用提供了基础。(The acoustical signal non line of sight recognition methods based on semi-supervised learning that the invention discloses a kind of acquires original sound signals x [n], the original sound signals x [n] of acquisition is detected and divided, and obtains cross correlation results segment R i [τ], to obtained cross correlation results segment R i [τ] carries out feature extraction and non line of sight identification.Label acoustical signal data sample can be obtained and without label data sample, and extract multiple features of acoustical signal data sample, be then based on these characteristic values using semi-supervised learning and carry out non line of sight identification.The method of the present invention is according to the acoustical signal data of a small amount of known class, the a large amount of unknown acoustical signal data of automatic distinguishing, the method of the present invention need not obtain a large amount of training datas, save manpower and material resources, and Classification and Identification effect is preferable, acoustical signal non line of sight identifies in the case of solving the problems, such as only a small amount of known sample, and the practical application for the indoor locating system based on audio technology provides the foundation.)

技术领域

本发明属于基于室内位置的服务技术领域，具体涉及一种基于半监督学习的声信号非视距识别方法。

背景技术

随着智能手机的普及，基于室内位置的服务需求越来越大，如室内导航、精准营销、公共安全等，尤其是在地下停车场、商场以及展馆等大型建筑中需求更大。针对以上需求，现已提出基于声音、GSM、蓝牙、Wi-Fi、磁场等技术的多种定位方法，而基于声音的定位技术具有与智能手机完全兼容、定位精度高及成本低等优点，成为最有可能解决手机室内定位的系统之一。然而，从2018年微软室内定位大赛的结果来看以及依据室内几何声学理论，当声源广播设备与接收设备间的视距(LOS)路径被遮挡，非视距(NLOS)现象会为距离量测引入一个较大的非负偏差，如图1所示，会降低定位系统的性能和稳定性。非视距(NLOS)现象已成为该类技术的技术瓶颈之一，成为基于声技术的智能移动终端在实际场景中应用的巨大挑战。

通过识别和丢弃NLOS量测值，仅利用LOS量测值可以提高定位精度，由此可得非视距识别的准确度成为室内定位精度的决定因素之一。现基于有监督学习的非视距识别方法运用的是声信号数据的历史信息，当已标记数据量较大时，非视距的识别情况较好。但是，在实际应用中，获得大量声信号数据的“标记”信息十分困难，需要耗费大量人力物力。这一问题限制了有监督学习方法在声信号非视距识别中的应用，迫切需要一种能够基于少量带标签的训练数据，对大量未知输入声信号数据进行非视距识别的方法。

发明内容

针对现在有技术中的技术问题，本发明提供了一种基于半监督学习的声信号非视距识别方法，本发明方法根据少量已知类别的训练数据，自动区分大量未知声信号数据，解决了声信号非视距识别的实际应用问题。

为解决上述技术问题，本发明通过以下技术方案予以解决：

一种基于半监督学习的声信号非视距识别方法，包括以下步骤：

S1：采集原始声信号x[n]；

S2：对S1中采集的原始声信号x[n]进行探测及分割，获得互相关结果片段R_i[τ]；

S3：对S2中得到的互相关结果片段R_i[τ]进行特征提取及非视距识别。

进一步地，S2包括如下步骤：

S2.1：对原始声信号x[n]进行滤波与增强，获得增强后的声信号x'[n]；

S2.2：构造参考信号r[n]，利用参考信号r[n]对增强后的声信号x'[n]进行互相关计算，获得结果R_x'r[τ]；

S2.3：对S2.2中获得的结果R_x'r[τ]进行探测并进行分割提取，获得互相关结果片段R_i[τ]，记第i个增强后的声信号的互相关结果片段为R_i[τ]。

进一步地，S2.1中，x'[n]＝IFFT{FFT{x[n]}w[n]}，其中w[n]为窗函数；

S2.2中，其中N为x'[n]的长度；

S2.3具体方法如下：

对R_x'r[τ]进行序贯检测，设定序贯装载信号片段的长度为T_s，序贯装载信号片段为seg[τ]＝R_x'r[τ_s]，其中τ_s＝[(i-1)T_s+1:iT_s]；seg[τ]中包含有效信号的判定方式为K{seg[τ]}≥thd，其中thd为判定阈值，K{·}为波形峰度计算符；若seg[τ]中包含有效信号，则依据信标节点的广播时序将序贯装载信号片段及互相关结果片段与信标节点的ID进行匹配，结果记为a_i；计算互相关结果片段中的最大峰值位置，记作截取声信号及互相关结果片段的下标索引为：

信标节点a_i声信号的信号片段x′_i[n]＝x'[idx_s:idx_e]，互相关结果片段R_i[τ]＝R_x'r[idx_s:idx_e]。

进一步地，所述窗函数为矩形窗与布莱克曼窗组成的复合窗函数，利用矩形窗的长度来对原始声信号x[n]进行带通滤波。

进一步地，S3包括如下步骤：

S3.1：对互相关结果片段R_i[τ]的相对增益-时延分布进行估计，获得{Γ_a,Γ_τ}；

S3.2：从S3.1获得的{Γ_a,Γ_τ}中提取能够提取的特征值，记作特征集F^N，其中N为特征集的维度，N与所提取和使用的特征值种类数量有关；

S3.3：基于S3.2得到的特征集F^N，使用半监督学习的方法对互相关结果片段R_i[τ]进行非视距识别。

进一步地，S3.1中，{Γ_a,Γ_τ}表示为：

S3.2中，从{Γ_a,Γ_τ}中提取的特征值包括：时延特征、波形特征和莱斯K系数；

S3.3包括如下步骤：

S3.3.1：在视距和非视距样本中分别各取部分数据作为已知类别的监督数据，进行标签扩散；

S3.3.2：对S3.3.1中经过标签扩散后的声信号数据进行分类识别。

进一步地，S3.3.1的具体方法为：

S3.3.1.1：设置标签扩散参数为L；

S3.3.1.2：计算每个标记已知类别的声信号数据和各个未知类别的声信号数据间距离，距离计算公式如下：

其中d为两个声信号数据特征集间的距离，x,y分别为两个声信号数据的特征集，N为特征集维度，i为从1到N的索引，x_i和y_i为x,y在当前索引维数下的特征值；

S3.3.1.3：根据距离计算结果，从小到大对所有未知类别的声信号数据进行排序；

S3.3.1.4：将距离最小的未知类别的声信号数据，标记成与该已知数据相同的类别标签。

进一步地，S3.3.2的具体方法为：

S3.3.2.1：设置分类参数为K；

S3.3.2.2：计算每个未知类别的声信号数据和各个已知类别的声信号数据间距离，所采用计算公式与S3.3.1.2中的计算公式相同；

S3.3.2.3：对每个未知类别的声信号数据，根据距离值计算结果，从小到大对所有已知类别的声信号数据进行排序；

S3.3.2.4：将距离值最小的已知类别的声信号数据中，出现频率最高的类别标签作为该未知数据的标签。

与现有技术相比，本发明至少具有以下有益效果：本发明一种基于半监督学习的声信号非视距识别方法，包括数据采集、声信号的探测及分割、特征提取及非视距识别，能够获取有标签声信号数据样本和无标签数据样本，并提取出声信号数据样本的多个特征，然后基于这些特征值利用半监督学习进行非视距识别。现有利用监督学习进行非视距识别方法，该方法仅在获取大量已知类别的声信号数据作为训练数据时，识别效果较理想，然而，实际应用中获取已知类别数据远远比获取未知类别数据难度大得多，本发明方法在获取少量已知类别的声信号数据后，充分利用大量未知类别的声信号数据，二者共同作为训练数据进行非视距识别，节省了人力物力，且分类识别效果较好，解决了只有少量已知样本情况下声信号非视距识别的难题，为基于声技术的室内定位系统的实际应用提供了基础。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明

具体实施方式

中的技术方案，下面将对具体实施方式描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为室内声信号视距及非视距传播场景描述；

图2为数据采集场景示意图；

图3为本发明方法对所采集的测试数据集进行识别后的结果展示；

图4为所采集原始声信号的图像展示。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例以某地下停车库为实验场景，搭建基于声技术的室内定位系统，进行原始声信号的数据采集，并完成非视距识别，说明基于半监督学习方法在声信号非视距识别中的应用，为进一步提高基于声技术的室内定位精度奠定基础。

本发明一种基于半监督学习的声信号非视距识别方法，包括以下步骤：

S1：采集原始声信号x[n]，原始声信号作为样本数据，其中包括视距和非视距样本；如图4所示为采集到的某一个原始声信号图像展示，由图4可知该原始信号包括6个有效信号片段，分别由6个不同信标节点广播产生；

在如图2所示示意场景中搭建基于声技术的室内定位系统，整个系统由6个信标节点(编号1-6)、1个标签组成，其中，信标节点固定高度为2.5米进行声信号的广播，按照固定时序发送线性调频信号，即其中f₀为起始频率，b₀为调频斜率，b₀t为信号的时域带宽。而标签进行声信号的接收；

所选数据采集场景可划分为4个区域，其中，区域1接收到信标节点1，2，4，5的声信号为视距信号，接收到信标节点3，6的声信号为非视距信号；区域2接收到信标节点3，4，5的声信号为视距信号，接收到信标节点1，2，6的声信号为非视距信号；区域3接收到信标节点1，2，3，4，5的声信号为视距信号，接收到信标节点6的声信号为非视距信号；区域4接收到信标节点6的声信号为视距信号，接收到信标节点1，2，3，4，5的声信号均为非视距信号；

将每个区域大致划分成由1m×1m的网格组成，网格交点即为数据采集点；

将定制标签安装在三角架上并调节高度为1.2m，由区域1到区域4，放于网格交点依次进行声信号数据采集，原始声信号记作x[n]。

S2：对S1中采集的原始声信号x[n]进行探测及分割，获得互相关结果片段R_i[τ]，具体包括如下步骤：

S2.1：对原始声信号x[n]进行滤波与增强，获得增强后的声信号x'[n]，通过x'[n]＝IFFT{FFT{x[n]}w[n]}获得，其中w[n]为窗函数，本实施例中窗函数为矩形窗与布莱克曼窗组成的复合窗函数，利用矩形窗的长度来对原始声信号x[n]进行带通滤波；

S2.2：构造参考信号r[n]，利用参考信号r[n]对增强后的声信号x'[n]进行互相关计算，获得结果R_x'r[τ]，其中N为x'[n]的长度；

S2.3：对S2.2中获得的结果R_x'r[τ]进行探测并进行分割提取，获得互相关结果片段R_i[τ]，记第i个增强后的声信号的互相关结果片段为R_i[τ]，具体方法为：

对R_x'r[τ]进行序贯检测，以确定有效信号的下标索引号；设定序贯装载信号片段的长度为50ms，记作T_s＝0.05f_s，序贯装载信号片段为seg[τ]＝R_x'r[τ_s]，其中τ_s＝[(i-1)T_s+1:iT_s]；那么seg[τ]中包含有效信号的判定方式为K{seg[τ]}≥thd，其中thd为判定阈值，K{·}为波形峰度计算符；若seg[τ]中包含有效信号，则依据信标节点的广播时序将序贯装载信号片段及互相关结果片段与信标节点的ID进行匹配，结果记为a_i；计算互相关结果片段中的最大峰值位置，记作截取声信号及互相关结果片段的下标索引为：

信标节点a_i声信号的信号片段x′_i[n]＝x'[idx_s:idx_e]，互相关结果片段R_i[τ]＝R_x'r[idx_s:idx_e]，随后依次截取和存储所有信标节点的声信号片段及互相关结果片段；

S3：对S2中得到的互相关结果片段R_i[τ]进行特征提取及非视距识别，具体包括如下步骤：

S3.1：对互相关结果片段R_i[τ]的相对增益-时延分布进行估计，获得{Γ_a,Γ_τ}，表示为：

S3.2：从S3.1获得的{Γ_a,Γ_τ}中提取能够提取的特征值，记作特征集F^N，其中N为特征集的维度，N与所提取和使用的特征值种类数量有关；本实施例中，提取的特征值包括：时延特征、波形特征和莱斯K系数；

S3.3：基于S3.2得到的特征集F^N，使用半监督学习的方法对互相关结果片段R_i[τ]进行非视距识别，具体包括如下步骤：

S3.3.1：在视距和非视距样本中分别各取部分数据(该实施例设置标签扩散参数L＝30，即已知视距和非视距类别的样本各为30个)作为已知类别的监督数据，进行标签扩散，具体方法为：

S3.3.1.1：设置标签扩散参数为L＝30；

S3.3.1.2：计算每个标记已知类别的声信号数据和各个未知类别的声信号数据间距离，距离计算公式如下：

S3.3.1.3：根据距离计算结果，从小到大对所有未知类别的声信号数据进行排序；

S3.3.1.4：将距离最小的未知类别的声信号数据，标记成与该已知数据相同的类别标签；

S3.3.2：对S3.3.1中经过标签扩散后的声信号数据进行分类识别，具体方法为：

S3.3.2.1：设置分类参数为K＝5；

S3.3.2.2：计算每个未知类别的声信号数据和各个已知类别的声信号数据间距离，所采用计算公式与S3.3.1.2中的计算公式相同；

S3.3.2.3：对每个未知类别的声信号数据，根据距离值计算结果，从小到大对所有已知类别的声信号数据进行排序；

S3.3.2.4：将距离值最小的5个已知类别的声信号数据中，出现频率最高的类别标签作为该未知数据的标签。

对于样本数量较少的训练集，监督学习和半监督学习对声信号非视距识别的结果如图3所示。识别结果表明所提出的半监督学习方法可以在只获得少量已知类别的声信号数据情况下，对大量未知类别声信号数据进行识别分类，分类效果优于监督学习分类算法。本方法不必获取大量训练数据，节省了人力物力，解决了只有少量已知样本情况下声信号非视距识别的难题。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

11页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种基于MIMO雷达低旁瓣发射方向图设计方法

一种基于半监督学习的声信号非视距识别方法

相关技术

网友询问留言