基于跨维度注意力机制的自监督单遥感图像超分辨率方法

文档序号：1964752 发布日期：2021-12-14 浏览：16次 >En<

阅读说明：本技术 基于跨维度注意力机制的自监督单遥感图像超分辨率方法 (Self-supervision single remote sensing image super-resolution method based on cross-dimension attention mechanism ) 是由刘宝弟赵丽飞姜文宗王延江刘伟锋于 2021-09-18 设计创作，主要内容包括：本发明公开了一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法,属于模式识别技术领域,提出跨维度注意力机制引导网络,跨维度注意力机制引导网络是一种自监督超分辨率方法,利用单张图像内部信息的可再现性,避免模型性能对于大规模训练数据集的依赖,通过将输入的图像进行下采样,组成自训练对,在训练过程中学习图像内部的自相似性和退化过程,然后将输入的低分辨率图像进行图像超分辨率重建。其次还提出跨维度注意力机制模块,通过对图片特征的通道与空间特征之间的相互依赖关系建模,考虑通道维度与空间维度之间的相互作用,通过学习得到通道与空间的特征权重,选择性地捕捉更多的信息特征,进而提高静态卷积神经网络的学习能力。(The invention discloses an automatic supervision single remote sensing image super-resolution method based on a cross-dimensional attention machine system, belongs to the technical field of pattern recognition, and provides a cross-dimensional attention machine system guide network which is an automatic supervision super-resolution method. And secondly, a cross-dimension attention mechanism module is provided, the mutual dependence relationship between the channel of the picture features and the space features is modeled, the interaction between the channel dimensions and the space dimensions is considered, the feature weight of the channel and the space is obtained through learning, more information features are selectively captured, and the learning capability of the static convolutional neural network is further improved.)

技术领域

本发明涉及模式识别技术领域，特别涉及一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法。

背景技术

图像超分辨率是指由一幅低分辨率图像或图像序列恢复出高分辨率图像。图像超分辨率技术分为超分辨率复原和超分辨率重建，目前，主要的图像超分辨率方法有以下几种：(1)基于插值的图像超分辨率方法；(2)基于重构的图像超分辨率方法；(3)基于学习的图像超分辨率方法。

在过去的几年中，基于深度学习的遥感图像超分辨率方法在某些情况下已经可以有效的克服遥感成像传感器物理分辨率的限制，这类方法成功的一个不可缺少的因素是大量的特定数据集。但是，在实际获取遥感图像的过程中，因受到各种复杂因素的影响，真实遥感图像的退化方式与特定数据集的退化方式大相径庭，导致训练后的模型在实际应用中的性能大幅下降。

发明内容

为了解决现有图像超分辨率方法对于大规模训练数据集的依赖问题，本发明实施例提供一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法，通过提出跨维度注意力机制引导网络，利用单张图像内部的信息的可再现性，避免模型性能对于大规模训练数据集的依赖，通过将输入的图像进行下采样，组成自训练对，在训练过程中学习图像内部的自相似性和退化过程，然后将输入的低分辨率图像进行图像超分辨率重建。所述技术方案如下：

本发明提供了一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法包括：

将输入图像进行下采样；

提取图像的卷积特征；

计算通道特征和空间特征的权重，其中，图像卷积特征中不同通道的权值矩阵为T_c：

T_c＝Sigmoid(f^1×1(ReLU(f^1×1(Avg(F)))))

其中，F∈R^C×H×W为图像卷积特征；Avg为全局平均池化，f^1×1为卷积核大小为1×1的卷积操作；

图像卷积特征中不同空间的权值矩阵为T_s：

T_s＝Sigmoid(f^1×1(F))

其中，F∈R^C×H×W为图像卷积特征；f^1×1为卷积核大小为1×1的卷积操作；

计算带有通道权重和空间权重的通道-空间特征权重T∈R^C×H×W：

其中，f^1×1为卷积核大小为1×1的卷积操作；

计算跨维度注意力机制的输出图像特征

使用最小绝对值偏差作为损失函数，优化训练过程，其中，最小绝对值偏差L₁为：

其中，θ为跨维度注意力机制网络(CDAN)的参数，LR是输入的低分辨率图像，是将LR进行s倍下采样后的图像。

在上述的基于跨维度注意力机制的自监督单遥感图像超分辨率方法中，可选的是，所述将输入图像进行下采样，具体为：利用一张低分辨率遥感图像作为输入，进行s倍的下采样操作得到对应于输入图像的更低分辨率图像，其大小为构造出对于输入图像的匹配图像对。

在上述的基于跨维度注意力机制的自监督单遥感图像超分辨率方法中，可选的是，所述提取图像的卷积特征，具体为：通过ReLU层、卷积层得到图像卷积特征。

本发明实施例提供的技术方案带来的有益效果是：

本发明实施例提供的一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法，提出了一种新的图像超分辨率卷积神经网络——跨维度注意力机制引导网络，跨维度注意力机制引导网络是一种自监督超分辨率方法，利用单张图像内部的信息的可再现性，避免模型性能对于大规模训练数据集的依赖，通过将输入的图像进行下采样，组成自训练对，在训练过程中学习图像内部的自相似性和退化过程，然后将输入的低分辨率图像进行图像超分辨率重建。其次，还提出了跨维度注意力机制模块，通过对图片特征的通道与空间特征之间的相互依赖关系建模，考虑通道维度与空间维度之间的相互作用，通过学习得到通道与空间的特征权重，选择性地捕捉更多的信息特征，进而提高静态卷积神经网络的学习能力。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法的流程示意图；

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

下面将结合附图1，对本发明实施例的一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法进行详细说明。

参考附图1所示，本发明实施例的一种基于跨维度注意力机制的自监督单遥感图像超分辨率方法包括：

步骤110：将输入图像进行下采样；

需要说明的是，理论上，低分辨率图像与高分辨率图像之间的关系表示为:

I_LR＝(I_HR*k)↓_s+n

其中，I_LR表示低分辨率图像，I_HR表示高分辨率图像，*表示卷积操作，k表示模糊核，↓_s表示s倍的下采样，n表示噪声，如散斑噪声、声波噪声。

由于获取实际遥感图像时，其高分辨率图像I_HR未知，模糊核k和噪声n不确定，没有可靠的成对数据集对网络进行训练。因此，利用一张低分辨率遥感图像作为输入，进行s倍的下采样操作得到对应于输入图像的更低分辨率图像，其大小为构造出对于输入图像的匹配图像对。使用大小的低分辨率图像作为训练过程的输入。

步骤120：提取图像的卷积特征；

需要说明的是，利用卷积神经网络提取训练过程输入的大小为的图像卷积特征，具体而言，通过ReLU层、卷积层得到图像卷积特征F∈R^C×H×W，其中C为通道数，H和W为图像特征的高和宽。图像卷积特征F∈R^C×H×W作为跨维度注意力机制模块(CDAM)的输入。

步骤130：计算通道特征和空间特征的权重，其中，图像卷积特征中不同通道的权值矩阵为T_c：

T_c＝Sigmoid(f^1×1(ReLU(f^1×1(Avg(F)))))

其中，F∈R^C×H×W表示图像卷积特征；Avg表示全局平均池化，f^1×1表示卷积核大小为1×1的卷积操作；Sigmoid表示激活函数；

图像卷积特征中不同空间的权值矩阵为T_s：

T_s＝Sigmoid(f^1×1(F))

其中，F∈R^C×H×W表示图像卷积特征；f^1×1表示卷积核大小为1×1的卷积操作；

需要说明的是，通过步骤120得到的卷积特征作为跨维度注意力机制模块(CDAM)的输入，具体而言，跨维度注意力机制模块(CDAM)分为两条支路，第一条支路将图像卷积特征F∈R^C×H×W经过全局平均池化层，把图像卷积特征F∈R^C×H×W的全局信息压缩到图片卷积特征的通道中，然后通过卷积层、ReLU层和Sigmoid激活函数得到图片卷积特征中不同通道的权值矩阵T_c∈R^C×1×1；第二条支路，将图片卷积特征F∈R^C×H×W经过卷积层和Sigmoid激活函数得到具有不同空间信息的权值矩阵T_s∈R^1×H×W，通过以上建模过程得到通道注意力特征和空间注意力特征。

步骤140：计算带有通道权重和空间权重的通道-空间特征权重T∈R^C×H×W：

其中，f^1×1表示卷积核大小为1×1的卷积操作；

需要说明的是，采用矩阵乘法将已经获得权重的通道特征和空间特征进行加权融合，然后通过卷积层和Sigmoid激活函数得到跨维度通道-空间特征权重T∈R^C×H×W。

步骤150：计算跨维度注意力机制的输出图像特征

需要说明的是，采用元素乘法将图像的通道-空间特征权重T与输入网络的卷积特征F进行融合，得到跨维度注意力机制模块的输出图像特征并作为后续的网络的输入。

整个跨维度注意力机制模块对于输入图像特征的通道和空间特征信息进行联合学习，得到两者之间的相互依赖关系，建立了通道和空间特征信息的跨维度注意力机制模型，有效的得到了二者在整个图像特征中的注意力权重。这种针对图片的卷积神经网络利用了图像内部跨尺度信息重现的特点，不受到基于补丁方法的限制。

步骤160：使用最小绝对值偏差作为损失函数，优化训练过程，其中，最小绝对值偏差L₁为：

其中，θ表示跨维度注意力机制网络(CDAN)的参数，LR表示输入的低分辨率图像，表示将LR进行s倍下采样后的图像。

需要说明的是，训练过程具体而言，步骤110将输入图片根据超分辨率倍数s，缩小为通过跨维度注意力机制网络(CDAN)，将大小为图片，超分辨率大小为LR的超分辨率图片。跨维度注意力机制网络(CDAN)含有六个跨维度注意力机制模块(CDAM)，跨维度注意力机制网络整体使用最小绝对值偏差L₁作为损失函数，使真值I_LR与预测值I'_LR之间的误差最小，当学习率达到10^-6时，整个训练过程结束。

以上方法不需要额外大量的成对数据集对网络进行训练，输入图像经过下采样的图片可以视作LR，经过跨维度注意力机制网络，超分辨率得到的图片为SR，而输入图片可作为HR，利用最小绝对偏差L₁作为网络的损失函数。基于这种方法，可以实现自监督超分辨率。尤其对于具有较多重复结构的遥感图像，通过六个跨维度注意力机制模块(CDAM)，通过训练，使得跨维度注意力机制网络(CDAN)学习图像内部的自相似性和退化过程，得到特定于输入图像的训练模型。

训练结束后，将训练好的超分辨率模型进行测试，即将输入低分辨率图像I_LR超分辨率为I_SR(s×I_LR)。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

7页详细技术资料下载

基于跨维度注意力机制的自监督单遥感图像超分辨率方法

相关技术

网友询问留言