一种基于cnn的多水下信标信号识别方法

文档序号:172500 发布日期:2021-10-29 浏览:36次 >En<

阅读说明:本技术 一种基于cnn的多水下信标信号识别方法 (Multi-underwater beacon signal identification method based on CNN ) 是由 赵冬冬 毛威波 陈朋 蔡天诚 梁世慧 于 2021-06-16 设计创作,主要内容包括:一种基于CNN的多水下信标信号识别方法,每个信标发射信号的设计,运用扩频编码技术并结合相频同移混合键控方式调制,使不同的信标信号具有不同的相位特征和频率特征;将采样的信标信号序列转换为二维图片,通过短时傅里叶变换得到相位图和频谱图进而融合而成相频特征图,以此作为信号识别的依据;轻量化的卷积神经网络结构的搭建,共由1个输入层、4个卷积层、3个池化层、1个全连接层和1个softmax层组成,完成从相频特征图到信标序号的映射;不仅在相频特征图上进行数据扩充,而且在采样信号序列上进行数据扩充,使训练的模型具有较强鲁棒性。该方法可有效提升信标的作用距离和识别精度,轻量化的模型设计也适用于信号的实时识别。(A CNN-based multi-underwater beacon signal identification method is characterized in that each beacon emission signal is designed, and different beacon signals have different phase characteristics and frequency characteristics by applying a spread spectrum coding technology and combining a phase-frequency homoshift hybrid keying mode for modulation; converting the sampled beacon signal sequence into a two-dimensional picture, obtaining a phase diagram and a spectrogram through short-time Fourier transform, and further fusing the phase diagram and the spectrogram into a phase-frequency characteristic diagram which is used as a basis for signal identification; the method comprises the following steps of (1) building a lightweight convolutional neural network structure, wherein the lightweight convolutional neural network structure consists of 1 input layer, 4 convolutional layers, 3 pooling layers, 1 full-connection layer and 1 softmax layer, and mapping from a phase-frequency characteristic diagram to a beacon sequence number is completed; the method not only carries out data expansion on the phase-frequency characteristic diagram, but also carries out data expansion on the sampling signal sequence, so that the trained model has stronger robustness. The method can effectively improve the acting distance and the recognition precision of the beacon, and the lightweight model design is also suitable for real-time recognition of the signal.)

一种基于CNN的多水下信标信号识别方法

技术领域

本发明涉及水下声学导航与定位技术领域,具体涉及一种基于CNN的多信标信号识别方法。

背景技术

随着时代进步,人们对海洋资源的开发需求越发强烈,自助式水下航行器应运而生。无论在民事领域的资源勘探方面,还是在军事领域的国防部署方面都发挥着举足轻重的作用。而水下声学导航与定位技术作为水下航行器关键技术之一,目前存在诸多问题,如声学信号传输距离短和易受噪声干扰等,因此对水下声学导航与定位技术的研究刻不容缓。

造成上述问题主要有两方面因素,其一是信标发射信号的类型,在水下通信领域目前有多多种多样的声学通信方式,如单频信号、线性调频信号和一些数字调制技术信号,包括幅移键控(ASK)、频移键控(FSK)和相移键控调制(PSK)等。但是由于水下环境复杂多变,存在不确定的噪声干扰、多径效应干扰和多普勒效应干扰,导致传统声学信号在水下的传输质量受到了不同程度影响,主要表现为信噪比低和作用距离短,从而促生了不同信标信号间误识别的隐患。其二是与发射信号对应的捕获算法,一般有小波去噪算法、匹配滤波算法、分数间隔均衡函数算法等。但是在实际复杂多变的应用环境下这些算法存在局限性,不能实时调整算法参数以满足多变的去噪需求,很难达到多信标信号远距离识别的目的。

在雷达和地面定位系统中,常常使用扩频编码技术,该技术因其长周期性和尖锐的自相关特性,具有抗干扰能力强和测量距离远、测距精度高等优点,且在测距的同时兼具信息通信功能。卷积神经网络作为深度学习的代表算法之一,在对像素和音频的学习上有稳定的效果,且对数据没有额外的特征工程要求。

发明内容

鉴于上述,本发明提供了一种基于CNN的多水下信标信号识别方法。该方法可以提升水下信标的作用距离和识别精度,有效地解决长基线信标系统传输距离不足的问题。

本发明的技术方案为:

一种基于CNN的多水下信标信号识别方法,所述方法包括以下步骤:

1)信标发射信号的调制,采用n阶的扩频编码技术,使每一个水下信标有且只有一种对应的编码序列,并且对该编码序列进行相频同移键控混合调制,不同的码元具有不同的相位与频率,以此构成信标的发射信号,因每个信标拥有独特的相位与频率特征,有利于卷积神经网络的识别,每个信标共由2n-1个1或-1的码元组成,分别是2n-1个1码元和2n-1-1个-1码元,其中1表示用m1个相位为0°的f1Hz正弦波填充;-1表示用m2个相位为180°的f2Hz正弦波填充。调制后的信标模拟信号如式(1):

时,化简为如式(2):

其中Y表示信标调制后的模拟信号,T表示时间,X[i]表示2n-1个码元中第[i]个序列值,1或者-1;

2)采集到多种信标信号;

3)对采样的信标信号序列集进行数据增强;

进行数据集扩充的采样信号序列包括实际采样信号序列和理论采样信号序列,实际采样信号序列进行幅值大小的变换;理论采样信号序列做以下处理:对信标信号本身设置不同的幅值;添加不同幅值的白噪声;随机对部分信号进行失真处理;

4)通过短时傅里叶变换将一维的信号信息转换为二维的图片信息,其过程如下:取一个信标信号周期t1ms时间的采样序列为一帧的变换目标,以t2ms时间的信号采样序列长度为窗口长度,以t3ms时间的信号采样序列长度为平移步长对一帧的变换目标做分帧处理,分裂的子帧数量Mf如式(3):

式中|表示整除,|.表示非整除;

然后对每一个子帧序列x(n)进行离散傅里叶变换如式(4):

其中X(k)是序列x(n)经过DFT后的结果序列,fs表示采样率(KHz),t2表示时间(ms),fs t2表示一个窗口长度的采样点数,此时频率分辨率为1/t2

由此根据式(5)得0-fs频率的分量幅值,根据式(6)得相对于余弦的偏移相位。

P(k)=real(X(k))2+imag(X(k))2 (5)

计算得到一个子帧的分量幅值和偏移相位并以此绘制t3ms时间的时频图和时间相位图,将Mf个子帧的时频图和相位图分别拼接成一张时间长度为t3*Mfms(一帧)的时频图和相位图,最后将上述一帧信号序列所生成的两种特征图融合为一张像素为100*100*3的相频特征图;

其中短时傅里叶变换的窗口长度采用重叠滑窗的设计,将一段较长时间的信息以频率分量强度的形式映射在一个较短的时间间隔内。使用较长时间(t2ms)的序列长度作为窗口长度以确保频率分辨率精度;同时使用较短时间(t3ms)的序列长度作为滑窗的步长以确保时间分辨率精度,使相邻子帧之间的信息差异体仅体现在上一个子帧头部的t3ms间隔和下一个子帧尾部的t3ms间隔,这种方法是以提高对信号变化的敏感度来兼顾频率分辨率和时间分辨率的,适用于多水下信标的识别;

5)对图片数据集再次进行数据增强;

相频特征图的数据集进行数据增强方式有以下三种:第一、以信标信号频带为基准,对相频图设置不同亮度、饱和度、对比度;第二、对图片做高斯滤波处理和不同程度的模糊处理;第三、同时进行上述两种处理。

6)使用轻量化的CNN网络对上述数据集进行训练,得到的网络模型实现对多种信标信号的实时识别;

该卷积神经网络将频谱图映射到信标序号上,其网络结构由许多非线性结构构成,共由1个输入层、4个卷积层、3个池化层、1个全连接层和1个softmax层组成,其中前三层卷积层具有池化层,从输入层到输出层依次是图片输入层、具有64个3×3卷积核的卷积层、2×2的最大池化层、具有32个3×3卷积核的卷积层、2×2的最大池化层、具有12个3×3卷积核的卷积层、2×2的最大池化层、具有8个3×3卷积核的卷积层、具有128个神经元的全连接层和最后一个softmax层作为输出层。

本发明的有益效果为:有效提升信标的作用距离和识别精度,轻量化的模型设计也适用于信号的实时识别。

附图说明

图1是基于CNN的多水下信标信号识别方法的流程图。

图2是1号信标的7阶扩频编码序列表图。

图3是基于7阶扩频编码、相频同移键控的信标部分发射信号示意图。

图4是短时傅里叶变换原理示意图。

图5是用于CNN网络模型训练的信标信号的时间相频图。

图6是卷积神经网络结构示意图。

具体实施方式

为了更为具体地描述本发明,下面结合附图进行更进一步的详细说明。

参照图1,一种基于CNN的多水下信标信号识别方法,包括以下步骤:

1)信标发射信号的调制,采用7阶的扩频编码技术,使每一个水下信标有且只有一种对应的编码序列,并且对该编码序列进行相频同移键控混合调制,不同的码元具有不同的相位与频率,以此构成信标的发射信号,因每个信标拥有独特的相位与频率特征,有利于卷积神经网络的识别,如图2所示的是1号信标的7阶扩频编码序列表,共由127个1或-1的码元组成,分别是64个1码元和63个-1码元,以相频同移的方式进行信号混合调制,其中1表示用5个相位为0°的10KHz正弦波填充;-1表示用10个相位为180°的20KHz正弦波填充,此时公式化简如式(7):

其中Y表示信标调制后的模拟信号,T表示时间,X[i]表示127个码元中第[i]个序列值,1或者-1;从公式中可以计算出一个信标信号的周期为63.5ms,1号信标的部分发射信号如图3所示,可见由不同相位和频率的正弦波组成;

2)采集到多种信标信号;

3)对采样的信标信号序列集进行数据增强;

进行数据集扩充的采样信号序列包括实际采样信号序列和理论采样信号序列。这两者的数据集扩充方法并不相同,前者已经包含了各种不同的环境噪声,所以仅进行幅值大小的变换;对于后者做以下处理:对信标信号本身设置不同的幅值;添加不同幅值的白噪声;随机对部分信号进行失真处理;

4)通过短时傅里叶变换将一维的信号信息转换为二维的图片信息,其过程如图4所示:取一个信标信号周期64ms时间的采样序列为一帧的变换目标,以0.5ms时间的信号采样序列长度为窗口长度,以0.1ms时间的信号采样序列长度为平移步长对一帧的变换目标做分帧处理,分裂的子帧数量Mf如式(8):

式中|表示整除,|.表示非整除。根据计算可得Mf为636。

然后对每一个子帧序列x(n)进行离散傅里叶变换如式(9):

其中X(k)是序列x(n)经过DFT后的结果序列,fs表示采样率(KHz),t2表示时间(ms),fs t2表示一个窗口长度的采样点数,此处fs取100KHz,t2为0.5ms,计算可得一个窗口的长度为50个采样点数,频率分辨率为2KHz;

由此根据式(10)得0-100KHz频率的分量幅值,根据式(11)得相对于余弦的偏移相位;

P(k)=real(X(k))2+imag(X(k))2 (10)

计算得到一个子帧的分量幅值和偏移相位并以此绘制0.1ms时间的时频图和时间相位图,将636个子帧的时频图和相位图分别拼接成一张时间长度为63.6ms(一帧)的时频图和相位图。最后将上述一帧信号序列所生成的两种特征图融合为一张像素为100*100*3的相频特征图,如图5所示。

其中短时傅里叶变换的窗口长度采用重叠滑窗的设计,将一段较长时间的信息以频率分量强度的形式映射在一个较短的时间间隔内,使用较长时间(0.5ms)的序列长度作为窗口长度以确保频率分辨率精度;同时使用较短时间(0.1ms)的序列长度作为滑窗的步长以确保时间分辨率精度,使相邻子帧之间的信息差异体仅体现在上一个子帧头部的0.1ms间隔和下一个子帧尾部的0.1ms间隔,这种方法是以提高对信号变化的敏感度来兼顾频率分辨率和时间分辨率的,适用于多水下信标的识别;

5)对图片数据集再次进行数据增强;

相频特征图的数据集进行数据增强方式有以下三种:第一、以信标信号频带为基准,对相频图设置不同亮度、饱和度、对比度;第二、对图片做高斯滤波处理和不同程度的模糊处理;第三、同时进行上述两种处理。

6)使用轻量化的CNN网络对上述数据集进行训练,得到的网络模型实现对多种信标信号的实时识别;

如图6所示的是卷积神经网络结构示意图,该卷积神经网络将频谱图映射到信标序号上,其网络结构由许多非线性结构构成,共由1个输入层、4个卷积层、3个池化层、1个全连接层和1个softmax层组成,其中前三层卷积层具有池化层,具体地,从输入层到输出层依次是图片输入层、具有64个3×3卷积核的卷积层、2×2的最大池化层、具有32个3×3卷积核的卷积层、2×2的最大池化层、具有12个3×3卷积核的卷积层、2×2的最大池化层、具有8个3×3卷积核的卷积层、具有128个神经元的全连接层和最后一个softmax层作为输出层。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于5G通信网络的数据传输系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!