基于半监督深度神经网络的有限数据频谱感知方法

文档序号：169821 发布日期：2021-10-29 浏览：3次 >En<

阅读说明：本技术 基于半监督深度神经网络的有限数据频谱感知方法 (Limited data spectrum sensing method based on semi-supervised deep neural network ) 是由张煜培赵知劲于 2021-06-11 设计创作，主要内容包括：本发明提供了一种基于半监督深度神经网络的有限数据频谱感知方法,包括：S1.搭建深度学习网络；S2.通过有标签样本对深度学习网络进行预训练得到预训练网络；S3.使用预训练网络对无标签样本进行类别预测,并将预测结果作为相应无标签样本的标签,得到伪标签样本；S4.对伪标签样本进行置信度计算,并修正网络的交叉熵损失函数；S5.使用高置信度的伪标签样本重新训练网络得到频谱感知预测模型。本方法通过少量有标签样本对深度学习网络进行预训练,并通过预训练网络对大量无标签样本进行标记,然后使用置信度函数计算伪标签的置信度提高拓展样本中正确标签的比例,同时对交叉熵损失函数进行修正,降低错误标签对训练模型的干扰,提高最终模型的性能。(The invention provides a limited data spectrum sensing method based on a semi-supervised deep neural network, which comprises the following steps: s1, building a deep learning network; s2, pre-training the deep learning network through the labeled samples to obtain a pre-training network; s3, performing class prediction on the unlabeled samples by using a pre-training network, and taking a prediction result as a label of the corresponding unlabeled sample to obtain a pseudo label sample; s4, performing confidence calculation on the pseudo label sample, and correcting a cross entropy loss function of the network; and S5, retraining the network by using the pseudo label sample with high confidence level to obtain a spectrum sensing prediction model. According to the method, a deep learning network is pre-trained through a small number of labeled samples, a large number of unlabeled samples are marked through the pre-training network, then the confidence coefficient of a pseudo label is calculated through a confidence coefficient function, the proportion of a correct label in an expanded sample is improved, meanwhile, a cross entropy loss function is corrected, the interference of the wrong label on a training model is reduced, and the performance of a final model is improved.)

技术领域

本发明属于无线通信中认知无线电领域，尤其是涉及一种基于半监督深度神经网络的有限数据频谱感知方法。

背景技术

随着通信技术的飞速发展，无线频谱被广泛应用于广播、卫星、军事等通信系统中。研究表明，已授权频段利用率为15％～80％，未授权频段则日益短缺。认知无线电(cognitive radio，CR)作为一个智能无线通信技术，能够智能地发现可用空闲频谱供用户使用，从而提高频谱利用率。频谱感知(spectrum sensing，SS) 是CR的关键技术，通过次级用户(secondary user，SU)节点检测兴趣频段上是否存在主用户(primary user，PU)，以判断是否有可用的空闲频谱。因此，提高频谱感知准确率可以有效地提高频谱利用率。

相比于传统的频谱感知算法，深度学习(deep learning，DL) 是一种基于大规模数据的表征学习算法，它可以自动从大量数据寻找特征，同时它具有深层结构，因此有更强的特征提取能力。近来，许多基于DL的频谱感知方法被提出。

传统的典型频谱感知方法包括能量检测、循环平稳特征检测、匹配滤波检测及基于频域熵的方法等。由于实际通信环境复杂，故无论是单节点频谱感知还是协作频谱感知，都要求它们具有适应复杂多变的通信环境的能力和快速进行频谱感知的能力，而传统的频谱感知方法并不总是能够满足实际通信环境的要求。

随着深度学习技术的发展，神经网络的特征提取能力不断提升，基于深度学习的频谱感知算法层出不穷。利用深度学习的频谱感知方法具有强大的特征提取能力和检测性能，它通过收集CR 网络中的环境信息和用户状态进行建模和推理学习，使得CR网络频谱感知变得智能化，从而适应实际的通信环境并获得较高的性能。

但是现有基于深度学习频谱感知方法可以在训练数据充足的情况下获得优异的检测性能，但是网络的训练依赖于大量带标记的训练样本以及扩充数据集。为了收集这些数据，SU需要和PU 频繁通信以确定它们的真实状态，这将增加巨大的通信开销，同时，当PU或者SU位置发生变化时，可能需要重新获取一个新的数以万计的训练集。而在真实无线电环境中，大量的数据都是无标记样本，因此，花较小的精力获取少量带标记的训练样本，并使用半监督学习方法对大量无标记样本数据进行有效利用，是一种提升频谱感知性能的更实际的解决方案。

发明内容

本发明的目的是针对上述问题，提供一种基于半监督深度神经网络的有限数据频谱感知方法。

为达到上述目的，本发明采用了下列技术方案：

一种基于半监督深度神经网络的有限数据频谱感知方法，该方法包括以下步骤：

S1.搭建深度学习网络；

S2.通过有标签样本对所述的深度学习网络进行预训练得到预训练网络；

S3.使用所述的预训练网络对无标签样本进行类别预测，并将预测结果作为相应无标签样本的标签，得到伪标签样本；

S4.对伪标签样本进行置信度计算，并修正网络的交叉熵损失函数；

S5.使用高置信度的伪标签样本重新训练网络得到频谱感知预测模型。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S2中，通过有限的有标签样本对所述的深度学习网络进行预训练得到预训练网络；

在步骤S3中，使用预训练网络得到大量的伪标签样本。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，在步骤S5中，同时使用高置信度的伪标签样本和有标签样本重新训练网络得到频谱感知预测模型。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S5中，所训练的网络为交叉熵损失函数经过修正的初始搭建网络或预训练网络。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S1中，所搭建的深度学习网络包括卷积层、池化层、全连接层和输出层。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S2中，深度学习网络深度学习网络的输入为a¹＝x⁽ⁱ⁾，初始化网络的权值参数为W和偏置参数为b，网络的总层数为L，各层的输出如下：

a^i,j＝σ(z^i,j)＝σ(a^i,j-1*W^j+b^j) (2)

a^i,j＝pool(a^i,j-1) (3)

a^i,j＝σ(z^i,j)＝σ(a^i,j-1W^j+b^j) (4)

a^i,L＝softmax(z^i,L)＝softmax(a^i,L-1W^L+b^L) (5)

上述公式中，j表示第j层，L表示第L层，若第j层为卷积层，则输出为公式(2)；若第j层为池化层，则输出为公式(3)；若第j层为全连接层，则输出为公式(4)；公式(5)为输出层的输出。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S2中，使用下方公式(6)计算输出端的期望输出和实际输出的二进制交叉熵损失；

当误差大于期望值时将误差传回网络，依次求得全连接层、池化层、卷积层的误差，由误差梯度调整并更新权值参数，重新进行网络训练，直到误差等于或小于期望值。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S2中，各层的误差输出和权值参数更新如下：

由代价函数计算得到输出层的传播敏感度δ^i,L：

其中，“e”表示Hadamard积；

卷积层误差输出：

δ^i,j＝δ^i,j+1*rot180(W^j+1)eσ′(z^i,j) (8)

其中，rot180(·)表示卷积核旋转180度，权值参数W和偏置参数b的更新式为：

其中，(δ^i,j)_u,v表示δ^i,j的子矩阵；

池化层误差输出：

δ^i,j＝upsample(δ^i,j+1)eσ′(z^i,j) (11)

其中，upsample(·)函数完成池化误差矩阵放大与误差重新分配的逻辑；

全连接层误差输出：

δ^i,j＝(W^j+1)^Tδ^i,j+1eσ′(z^i,j) (12)

权值参数W和偏置参数b的更新式为：

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S4中，第i个样本从输出层输出的2个神经元为 a^i,L＝[prob(x⁽ⁱ⁾,H₁),prob(x⁽ⁱ⁾,H₀)]，并通过如下置信度函数计算伪标签样本的置信度：

Confidence(prob(x⁽ⁱ⁾,H₁),prob(x⁽ⁱ⁾,H₀))＝|prob(x⁽ⁱ⁾,H₁)-prob(x⁽ⁱ⁾,H₀)|(15)。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，将置信度函数输出的置信值大于置信阈值的伪标签样本视为高置信度的伪标签样本。

在上述的基于半监督深度神经网络的有限数据频谱感知方法中，步骤S4中，通过如下方式修正交叉熵损失函数：

J(W,b)＝J_l(W,b)+J_u(W,b)

其中，

λ表示平衡系数；|X^U'|指伪标签数据集大小；表示x⁽ⁱ⁾对应的伪标签样本。

本发明的优点在于：本方法通过少量有标签样本对深度学习网络进行预训练，并通过预训练网络对大量无标签样本进行标记，然后使用置信度函数计算伪标签的置信度提高拓展样本中正确标签的比例，同时对交叉熵损失函数进行修正，降低错误标签对训练模型的干扰，提高最终模型的性能；

能够充分利用少量有标签样本和大量无标签样本，大大降低对有标签样本的依赖，在使用少量有标签样本的前提下也能够具有不逊于传统全监督深度学习方法使用大量有标签样本的性能。

具体实施方式

下面通过具体实施方式对本发明做进一步详细的说明。

一般情况下，基于频谱感知的研究可以描述为如下二元假设检验问题：

其中，n＝0,1,2…,N-1,r(n)表示接收机收到的复信号，x(n)表示经过多径衰落的PU信号，v(n)为服从高斯分布N(0,σ²)的加性高斯白噪声(additional white gaussiannoise，AWGN)，H₀表示信道当前未被占用，H₁表示信道被占用。

本方案提出一种基于半监督深度神经网络的有限数据频谱感知方法，该方法包括以下步骤：

S1.搭建深度学习网络，包括卷积层、池化层、全连接层和输出层；

S2.通过有限的有标签样本对所述的深度学习网络进行预训练得到预训练网络；

预训练阶段是所提模型的关键步骤，只有预训练的网络达到一定的准确率，加入无标记数据才会对模型有提升效果。其主要流程是先将带标记数据输入到搭建好的深度学习网络中，依次经过卷积层、池化层、全连接层得到输出值，设置深度学习的输入为a¹＝x⁽ⁱ⁾，初始化网络的权值参数W和偏置参数b，初始化网络各层的权值参数W和偏置参数b可以相同也可以不同，网络的总层数为L，当层数j取值为2～L–1时，j层可能是卷积层、池化层和全连接层三种情况，第L层是softmax分类器的输出 a^i,L＝[prob(x⁽ⁱ⁾,H₁),prob(x⁽ⁱ⁾,H₀)]分别表示第i个样本属于H₁或者H₀的概率，选择最大概率取值对应的标签作为当前样本的分类结果y⁽ⁱ⁾。 prob(x⁽ⁱ⁾,H₁)+prob(x⁽ⁱ⁾,H₀)＝1。各层的输出如下：

若第j层是卷积层，则输出为：

a^i,j＝σ(z^i,j)＝σ(a^i,j-1*W^j+b^j) (2)

其中，i代表样本序号，j代表层序号，σ(·)表示激活函数。

若第j层是池化层，则输出为：

a^i,j＝pool(a^i,j-1) (3)

其中，pool(·)指按照池化模板大小和池化标准将输入特征维数缩小的过程。

若第j层是全连接层，则输出为：

a^i,j＝σ(z^i,j)＝σ(a^i,j-1W^j+b^j) (4)

对于第L层(输出层)，计算公式为：

a^i,L＝softmax(z^i,L)＝softmax(a^i,L-1W^L+b^L) (5)

然后使用式(6)计算出输出端的期望输出和实际输出值的二进制交叉熵损失：

比较网络的输出值与期望值之间的误差，当误差大于期望值时将误差传回网络，依次求得全连接层、池化层、卷积层的误差，由误差梯度调整并更新权值参数，重新进行网络训练。由代价函数可计算得到输出层的传播敏感度(误差)δ^i,L：

其中，“e”表示Hadamard积。

若第j层是卷积层，则误差输出为：

δ^i,j＝δ^i,j+1*rot180(W^j+1)eσ′(z^i,j) (8)

其中，rot180(·)表示卷积核旋转180度，可通过行对称变换和列对称变换实现。对于每一个卷积核，学习率设为η时，参数W和 b的更新式为：

其中，(δ^i,j)_u,v表示δ^i,j的子矩阵。

若第j层是池化层，则误差输出为：

δ^i,j＝upsample(δ^i,j+1)eσ′(z^i,j) (11)

其中，upsample(·)函数完成池化误差矩阵放大与误差重新分配的逻辑。

若第j层是全连接层，则误差输出为：

δ^i,j＝(W^j+1)^Tδ^i,j+1eσ′(z^i,j) (12)

参数W和b的更新式为：

直到误差等于或小于期望值，结束训练。

S3.使用所述的预训练网络对大量无标签样本进行类别预测，并将预测结果作为相应无标签样本的标签，得到大量的伪标签样本；

S4.对伪标签样本进行置信度计算，并修正网络的交叉熵损失函数；

利用预训练好的深度学习网络，预测出无标记数据的分类类别(H0或H1)，以此类别的标签作为无标记数据的标签(即伪标签)，由于最初的分类器数据量较小而无法具备良好性能，因此由模型生成的伪标签很可能是不正确的，并且可能阻止了新信息的学习。一旦在自训练中加入大量错误标签，不仅不能提高分类准确性，还会降低分类器性能。本方案通过设置置信度函数和修正交叉熵损失函数两种手段提高拓展样本中正确标签比例和降低错误标签对训练模型的干扰，具体为：

S41.标记置信度高的样本。为了伪标签样本中找到正确率最大的样本以及最具代表性的样本，定义一个置信度量函数。利用该函数提供的样本置信值，可求出需要加入到下一轮自训练中正确率最大的示例。第i个样本从softmax分类器输出的2个神经元为 a^i,L＝[prob(x⁽ⁱ⁾,H₁),prob(x⁽ⁱ⁾,H₀)]，定义的置信度函数如下：

Confidence(prob(x⁽ⁱ⁾,H₁),prob(x⁽ⁱ⁾,H₀))＝|prob(x⁽ⁱ⁾,H₁)-prob(x⁽ⁱ⁾,H₀)|(15)

式(15)所得值越高，置信值越大，即输出为正确分类的概率越大，将置信度函数输出的置信值大于置信阈值的伪标签样本视为高置信度的伪标签样本，或者将置信值最高的一个或若干个伪标签样本视为高置信度样本。

S42.修正交叉熵损失函数。如果直接将伪标签当作真实标签利用式(6)计算出无标记数据的损失，并使用随机梯度下降法将损失的梯度回传给网络，以调整模型的参数，会把训练的模型指向错误的方向。因为这部分无标记数据并不都拥有正确的标签，因此本方案将它给模型带来的损失梯度乘以一个平衡系数λ，以避免网络被错误的信息过度影响:

其中：|X^U'|指伪标签数据集大小，表示x⁽ⁱ⁾对应的伪标签。

由此得到结合带标记样本和未标记样本的修正交叉熵损失函数为：J(W,b)＝J_l(W,b)+J_u(W,b) (17)。

S5.使用高置信度的伪标签样本重新训练网络得到频谱感知预测模型，或者，同时使用高置信度的伪标签样本和有标签样本重新训练网络得到频谱感知预测模型。

本方案通过设置置信度函数和修正交叉熵损失函数两种手段提高拓展样本中正确标签比例和降低错误标签对训练模型的干扰。能够充分利用少量有标签样本和大量无标签样本的同时具有不逊于使用大量有标签样本的传统深度学习方法的性能。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

尽管本文较多地使用了有标签样本、伪标签样本、交叉熵损失函数、置信度函数、预训练网络、频谱感知预测模型等术语，但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质；把它们解释成任何一种附加的限制都是与本发明精神相违背的。

9页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：神经网络处理单元、神经网络的处理方法及其装置

基于半监督深度神经网络的有限数据频谱感知方法

相关技术

网友询问留言