一种图像生成方法及装置

文档序号：1890989 发布日期：2021-11-26 浏览：5次 >En<

阅读说明：本技术 一种图像生成方法及装置 (Image generation method and device ) 是由陈玉辉杨彭举于 2021-07-02 设计创作，主要内容包括：本申请实施例提供了一种图像生成方法和装置,获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像；对目标未遮挡人脸图像和目标遮挡物图像进行融合,得到待优化融合图像；将待优化融合图像输入至预先训练的生成器网络,得到生成器网络输出的目标融合图像；生成器网络属于基于判别器网络和身份一致网络进行训练获得的生成式对抗网络,其中,判别器网络用于对融合图像细节信息的约束,身份一致网络用于对身份一致性的约束。如此,能够生成有效的遮挡人脸图像。(The embodiment of the application provides an image generation method and device, which are used for acquiring a target unobstructed face image to be fused and a corresponding target obstruction image; fusing the target non-shielding face image and the target shielding object image to obtain a fused image to be optimized; inputting the fusion image to be optimized to a generator network trained in advance to obtain a target fusion image output by the generator network; the generator network belongs to a generation type countermeasure network obtained by training based on a discriminator network and an identity consistency network, wherein the discriminator network is used for restricting the fusion image detail information, and the identity consistency network is used for restricting the identity consistency. Thus, an effective occlusion face image can be generated.)

一种图像生成方法及装置

技术领域

本申请涉及图像处理技术领域，特别是涉及一种图像生成方法及装置。

背景技术

人脸识别技术已广泛应用于门禁考勤、安检通关、安防监控和金融支付等诸多领域。相关技术中，可以基于预先训练的人脸识别网络对人脸图像进行识别，然而，针对人脸的面部区域被遮挡的人脸图像(可以称为遮挡人脸图像)，已有的人脸识别网络的识别精确度较低。

为了提高人脸识别网络对遮挡人脸图像的识别精确度，可以获取人脸的面部区域被遮挡的样本图像，并基于获取的样本图像对人脸识别网络进行训练，使得训练后的人脸识别网络能够有效地对遮挡人脸图像进行识别。

然而，在实际场景中获取的人脸图像往往是未遮挡人脸图像，因此，亟需一种方法以生成有效的遮挡人脸图像。

发明内容

本申请实施例的目的在于提供一种图像生成方法及装置，以生成有效的遮挡人脸图像。具体技术方案如下：

第一方面，为了达到上述目的，本申请实施例公开了一种图像生成方法，所述方法包括：

获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像；

对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像；

将所述待优化融合图像输入至预先训练的生成器网络，得到所述生成器网络输出的目标融合图像；其中，所述生成器网络属于基于判别器网络和身份一致网络进行训练获得的生成式对抗网络，所述判别器网络用于对融合图像细节信息的约束，所述身份一致网络用于对身份一致性的约束。

可选的，所述目标遮挡物图像为：从与所述目标未遮挡人脸图像相匹配的遮挡人脸图像中获取的。

可选的，所述获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像，包括：

获取待融合的目标未遮挡人脸图像，以及多个包含目标遮挡物的遮挡人脸图像；

基于人脸姿态和/或人脸属性，从所述多个遮挡人脸图像中，确定与所述目标未遮挡人脸图像相匹配的遮挡人脸图像，作为目标遮挡人脸图像；

获取所述目标遮挡人脸图像中的目标遮挡物图像。

可选的，所述获取所述目标遮挡人脸图像中的目标遮挡物图像，包括：

基于图像分割算法，从所述目标遮挡人脸图像中提取所述目标遮挡物所占区域的图像，作为待处理遮挡物图像；

对所述待处理遮挡物图像进行高斯模糊处理，得到目标遮挡物图像。

可选的，所述对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像，包括：

获取所述目标未遮挡人脸图像中的人脸关键点，以及所述目标遮挡物图像中的人脸关键点；

计算所述目标未遮挡人脸图像中的人脸关键点，与所述目标遮挡物图像中的人脸关键点之间的仿射变换参数；

基于所述仿射变换参数，对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像。

可选的，所述基于所述仿射变换参数，对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像，包括：

基于所述仿射变换参数，按照预设公式，对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像；

其中，所述预设公式为：

A_mix表示所述待优化融合图像，T表示所述仿射变换参数，α表示预设融合系数，G[I_c]表示所述目标遮挡物图像，I_o表示所述与所述目标未遮挡人脸图像相匹配的遮挡人脸图像，I表示所述目标未遮挡人脸图像。

可选的，所述生成器网络采用如下步骤训练获得：

获得未遮挡人脸样本图像、目标遮挡物样本图像及包含目标遮挡物的遮挡人脸样本图像；

将所述未遮挡人脸样本图像和目标遮挡物样本图像进行融合，得到待优化融合样本图像；

将所述待优化融合样本图像输入待训练的生成器网络，获得目标融合样本图像；

将所述目标融合样本图像和所述未遮挡人脸样本图像，输入预先训练的身份一致网络，得到用于确定所述目标融合样本图像和所述未遮挡人脸样本图像中人脸的身份是否一致的特征图；

将所述目标融合样本图像和所述包含目标遮挡物的遮挡人脸样本图像，输入待训练的判别器网络，得到所述目标融合样本图像为真实图像的概率，以及所述包含目标遮挡物的遮挡人脸样本图像为真实图像的概率；

基于所述目标融合样本图像和所述未遮挡人脸样本图像各自对应的特征图，计算所述身份一致网络的特征损失值；

基于所述目标融合样本图像为真实图像的概率，以及所述包含目标遮挡物的遮挡人脸样本图像为真实图像的概率，计算所述判别器网络的损失值；

基于所述目标融合样本图像与所述待优化融合样本图像之间的差异，计算所述生成器网络的损失值；

基于总损失值调整所述生成器网络和判别器网络的网络参数，继续训练，直到所述生成器网络和判别器网络收敛；其中，所述总损失值为基于所述生成器网络的损失值、判别器网络的损失值和身份一致网络的特征损失值确定的。

可选的，所述基于所述目标融合样本图像和所述未遮挡人脸样本图像各自对应的特征图，计算所述身份一致网络的特征损失值，包括：

针对每一预设通道，计算所述目标融合样本图像和所述未遮挡人脸样本图像在该预设通道对应的特征图之间的距离；

计算各个预设通道对应的距离的平均值，作为所述身份一致网络的特征损失值；

所述基于所述目标融合样本图像与所述待优化融合样本图像之间的差异，计算所述生成器网络的损失值，包括：

基于所述目标融合样本图像与所述待优化融合样本图像之间的距离，和/ 或所述目标融合样本图像与所述待优化融合样本图像的全变分的差值，计算所述生成器网络的损失值。

可选的，所述总损失值为：

L＝L_gan+γL_re+μL_ip

其中，L表示所述总损失值，L_gan表示所述判别器网络的损失值，L_re表示所述生成器网络的损失值，L_ip表示所述身份一致网络的特征损失值，γ表示第一预设系数，μ表示第二预设系数。

第二方面，为了达到上述目的，本申请实施例公开了一种图像生成装置，所述装置包括：

图像获取模块，用于获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像；

图像融合模块，用于对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像；

图像生成模块，用于将所述待优化融合图像输入至预先训练的生成器网络，得到所述生成器网络输出的目标融合图像；其中，所述生成器网络属于基于判别器网络和身份一致网络进行训练获得的生成式对抗网络，所述判别器网络用于对融合图像细节信息的约束，所述身份一致网络用于对身份一致性的约束。

可选的，所述目标遮挡物图像为：从与所述目标未遮挡人脸图像相匹配的遮挡人脸图像中获取的。

可选的，所述图像获取模块，包括：

第一图像获取子模块，用于获取待融合的目标未遮挡人脸图像，以及多个包含目标遮挡物的遮挡人脸图像；

图像匹配子模块，用于基于人脸姿态和/或人脸属性，从所述多个遮挡人脸图像中，确定与所述目标未遮挡人脸图像相匹配的遮挡人脸图像，作为目标遮挡人脸图像；

第二图像获取子模块，用于获取所述目标遮挡人脸图像中的目标遮挡物图像。

可选的，所述第二图像获取子模块，包括：

图像分割单元，用于基于图像分割算法，从所述目标遮挡人脸图像中提取所述目标遮挡物所占区域的图像，作为待处理遮挡物图像；

模糊处理单元，用于对所述待处理遮挡物图像进行高斯模糊处理，得到目标遮挡物图像。

可选的，所述图像融合模块，包括：

人脸关键点获取模块子模块，用于获取所述目标未遮挡人脸图像中的人脸关键点，以及所述目标遮挡物图像中的人脸关键点；

仿射变换参数计算子模块，用于计算所述目标未遮挡人脸图像中的人脸关键点，与所述目标遮挡物图像中的人脸关键点之间的仿射变换参数；

图像融合子模块，用于基于所述仿射变换参数，对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像。

可选的，所述图像融合子模块，具体用于基于所述仿射变换参数，按照预设公式，对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像；

其中，所述预设公式为：

可选的，所述装置还包括：

样本图像获取模块，用于获得未遮挡人脸样本图像、目标遮挡物样本图像及包含目标遮挡物的遮挡人脸样本图像；

待优化融合样本图像获取模块，用于将所述未遮挡人脸样本图像和目标遮挡物样本图像进行融合，得到待优化融合样本图像；

目标融合样本图像获取模块，用于将所述待优化融合样本图像输入待训练的生成器网络，获得目标融合样本图像；

特征图获取模块，用于将所述目标融合样本图像和所述未遮挡人脸样本图像，输入预先训练的身份一致网络，得到用于确定所述目标融合样本图像和所述未遮挡人脸样本图像中人脸的身份是否一致的特征图；

概率获取模块，用于将所述目标融合样本图像和所述包含目标遮挡物的遮挡人脸样本图像，输入待训练的判别器网络，得到所述目标融合样本图像为真实图像的概率，以及所述包含目标遮挡物的遮挡人脸样本图像为真实图像的概率；

第一损失值计算模块，用于基于所述目标融合样本图像和所述未遮挡人脸样本图像各自对应的特征图，计算所述身份一致网络的特征损失值；

第二损失值计算模块，用于基于所述目标融合样本图像为真实图像的概率，以及所述包含目标遮挡物的遮挡人脸样本图像为真实图像的概率，计算所述判别器网络的损失值；

第三损失值计算模块，用于基于所述目标融合样本图像与所述待优化融合样本图像之间的差异，计算所述生成器网络的损失值；

训练模块，用于基于总损失值调整所述生成器网络和判别器网络的网络参数，继续训练，直到所述生成器网络和判别器网络收敛；其中，所述总损失值为基于所述生成器网络的损失值、判别器网络的损失值和身份一致网络的特征损失值确定的。

可选的，所述第一损失值计算模块，具体用于针对每一预设通道，计算所述目标融合样本图像和所述未遮挡人脸样本图像在该预设通道对应的特征图之间的距离；计算各个预设通道对应的距离的平均值，作为所述身份一致网络的特征损失值；

基于第三损失值计算模块，具体用于基于所述目标融合样本图像与所述待优化融合样本图像之间的距离，和/或所述目标融合样本图像与所述待优化融合样本图像的全变分的差值，计算所述生成器网络的损失值。

可选的，所述总损失值为：

L＝L_gan+γL_re+μL_ip

为了达到上述目的，本申请实施例还公开了一种电子设备，所述电子设备包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的程序时，实现如上述第一方面所述的图像生成方法。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现如上述第一方面所述的图像生成方法。

本申请实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的图像生成方法。

本申请实施例有益效果：

本申请实施例提供的图像生成方法，可以获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像；对目标未遮挡人脸图像和目标遮挡物图像进行融合，得到待优化融合图像；将待优化融合图像输入至预先训练的生成器网络，得到生成器网络输出的目标融合图像；其中，生成器网络属于基于判别器网络和身份一致网络进行训练获得的生成式对抗网络，判别器网络用于对融合图像细节信息的约束，身份一致网络用于对身份一致性的约束。

由于生成器网络属于基于判别器网络和身份一致网络进行训练获得的生成式对抗网络，且判别器网络用于对融合图像细节信息的约束，身份一致网络用于对身份一致性的约束，因此，基于生成器网络得到的图像能够保证图像中人脸的身份的一致性，且真实度较高。即，使得目标融合图像包含目标遮挡物，与目标未遮挡人脸图像中人脸的身份一致，且真实度较高。也就是说，本申请实施例提供的图像生成方法，能够生成有效的遮挡人脸图像。

当然，实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的实施例。

图1为本申请实施例提供的一种图像生成方法的流程图；

图2为本申请实施例提供的另一种图像生成方法的流程图；

图3为本申请实施例提供的另一种图像生成方法的流程图；

图4为本申请实施例提供的另一种图像生成方法的流程图；

图5为本申请实施例提供的一种训练生成器网络的流程图；

图6为本申请实施例提供的一种生成目标融合图像的流程示意图；

图7为本申请实施例提供的一种生成式对抗网络的框架示意图；

图8为本申请实施例提供的一种图像生成装置的结构图；

图9为本申请实施例提供的一种电子设备的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员基于本申请所获得的所有其他实施例，都属于本申请保护的范围。

为了提高人脸识别网络对遮挡人脸图像的识别精确度，可以获取人脸的面部区域被遮挡的样本图像，并基于获取的样本图像对人脸识别网络进行训练，使得训练后的人脸识别网络能够有效地对遮挡人脸图像进行识别。然而，相关技术中，并未提供相应的方法，以生成有效的遮挡人脸图像。

为了解决上述问题，本申请实施例提供了一种图像生成方法，该方法可以应用于电子设备，该电子设备用于生成遮挡人脸图像，生成遮挡人脸图像可以用于对人脸识别网络进行训练。

参见图1，图1为本申请实施例提供的一种图像生成方法的流程图，该方法可以包括以下步骤：

S101：获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像。

S102：对目标未遮挡人脸图像和目标遮挡物图像进行融合，得到待优化融合图像。

S103：将待优化融合图像输入至预先训练的生成器网络，得到生成器网络输出的目标融合图像。

其中，生成器网络属于基于判别器网络和身份一致网络进行训练获得的生成式对抗网络，判别器网络用于对融合图像细节信息的约束，身份一致网络用于对身份一致性的约束。

在一个实施例中，针对步骤S101，目标未遮挡人脸图像也就是当前需要进行融合的人脸图像，且该人脸图像中不包含遮挡人脸的遮挡物。目标遮挡物图像也就是当前需要与目标未遮挡人脸图像进行融合的，只包含目标遮挡物的图像。目标遮挡物可以为眼镜、口罩或其他物品。

在一个实施例中，目标遮挡物图像可以为：从与目标未遮挡人脸图像相匹配的遮挡人脸图像中获取的。

在本申请实施例中，可以获取包含目标遮挡物，且与目标未遮挡人脸图像相匹配的遮挡人脸图像(可以称为目标遮挡人脸图像)，进而，可以从目标遮挡人脸图像中获取目标遮挡物图像。

目标遮挡人脸图像与目标未遮挡人脸图像相匹配，也就是说，从目标遮挡人脸图像中获取的目标遮挡物图像与目标未遮挡人脸图像的匹配度也较高，相应的，对二者进行融合，能够提高待优化融合图像的真实度，进而，能够提高生成的目标融合图像的真实度。

相应的，在一个实施例中，参见图2，在图1的基础上，上述步骤S101 可以包括以下步骤：

S1011：获取待融合的目标未遮挡人脸图像，以及多个包含目标遮挡物的遮挡人脸图像。

S1012：基于人脸姿态和/或人脸属性，从多个遮挡人脸图像中，确定与目标未遮挡人脸图像相匹配的遮挡人脸图像，作为目标遮挡人脸图像。

S1013：获取目标遮挡人脸图像中的目标遮挡物图像。

在本申请实施例中，人脸姿态可以用人脸的头部角度表示；人脸属性可以包括人脸的年龄、人脸的性别等信息。

基于人脸姿态和/或人脸属性，可以确定遮挡人脸图像与目标未遮挡人脸图像的匹配度，该匹配度能够表示该遮挡人脸图像中的目标遮挡物与目标未遮挡人脸图像的匹配度。

基于上述处理，从目标遮挡人脸图像中获取目标遮挡物所占区域的图像，以进行图像融合，而目标遮挡人脸图像是与目标未遮挡人脸图像相匹配的图像，也就是说，确定出的目标遮挡物图像与目标未遮挡人脸图像的匹配度也较高，相应的，对二者进行融合，能够提高待优化融合图像的真实度，进而，能够提高生成的目标融合图像的真实度。

在一个实施例中，可以按照人脸的头部角度、人脸的年龄、人脸的性别的顺序进行图像匹配。

例如，基于人脸的头部角度，将目标未遮挡人脸图像，分别与每一遮挡人脸图像(可以称为第一遮挡人脸图像)进行比较，确定出匹配度最高的第一遮挡人脸图像，作为目标遮挡人脸图像。

若存在多个头部角度匹配度最高的遮挡人脸图像(可以称为第二遮挡人脸图像)，则可以基于人脸的年龄，将目标未遮挡人脸图像，分别与每一第二遮挡人脸图像进行比较，确定出匹配度最高的第二遮挡人脸图像，作为目标遮挡人脸图像。

若存在多个年龄匹配度最高的遮挡人脸图像(可以称为第三遮挡人脸图像)，则可以基于人脸的性别，将目标未遮挡人脸图像，分别与每一第三遮挡人脸图像进行比较，确定出匹配度最高的第三遮挡人脸图像，作为目标遮挡人脸图像。

在一个实施例中，目标未遮挡人脸图像和多个遮挡人脸图像可以为同源的图像，例如，目标未遮挡人脸图像和多个遮挡人脸图像，可以为街道路口的监控设备获取的人脸图像；或者，目标未遮挡人脸图像和多个遮挡人脸图像，可以为机场安检入口的监控设备获取的人脸图像。

目标未遮挡人脸图像和多个遮挡人脸图像为同源的图像，也就能进一步提高目标未遮挡人脸图像与目标遮挡人脸图像的匹配度，进而，能够提高待优化融合图像的真实度，进而，能够提高生成的目标融合图像的真实度。

在一个实施例中，参见图3，在图2的基础上，上述步骤S1013可以包括以下步骤：

S10131：基于图像分割算法，从目标遮挡人脸图像中提取目标遮挡物所占区域的图像，作为待处理遮挡物图像。

S10132：对待处理遮挡物图像进行高斯模糊处理，得到目标遮挡物图像。

在本申请实施例中，可以基于图像分割算法，从目标遮挡人脸图像中提取目标遮挡物所占区域的图像(即待处理遮挡物图像)，进而，还可以对待处理遮挡物图像进行高斯模糊处理，处理后的遮挡物图像也就是目标遮挡物图像。

例如，可以基于全卷积网络(Fully Convolutional Networks，FCN)，从目标遮挡人脸图像中提取待处理遮挡物图像；或，也可以基于Roberts算子，从目标遮挡人脸图像中提取待处理遮挡物图像。

基于上述处理，对待处理遮挡物图像进行高斯模糊处理，以基于处理得到的目标遮挡物图像进行图像融合，使得待优化融合图像的图像边缘更加平滑，进而，能够提高生成的目标融合图像的真实度。

在一个实施例中，参见图4，在图1的基础上，上述步骤S102可以包括以下步骤：

S1021：获取目标未遮挡人脸图像中的人脸关键点，以及目标遮挡物图像中的人脸关键点。

S1022：计算目标未遮挡人脸图像中的人脸关键点，与目标遮挡物图像中的人脸关键点之间的仿射变换参数。

S1023：基于仿射变换参数，对目标未遮挡人脸图像和目标遮挡物图像进行融合，得到待优化融合图像。

在本申请实施例中，在确定出目标遮挡人脸图像后，可以基于人脸关键点检测算法，分别确定出目标遮挡人脸图像和目标遮挡物图像中的人脸关键点。例如，确定出的人脸关键点可以为3个点，或者，也可以为5个点，或者，还可以为21个点，但并不限于此。

上述仿射变换参数，可以表示目标未遮挡人脸图像中的人脸关键点，与目标遮挡物图像中的人脸关键点之间的变换关系。

例如，目标未遮挡人脸图像中的人脸关键点的坐标为Tp，目标遮挡物图像中的人脸关键点的坐标为Tq，则可以得到Tp＝T*Tq，利用SVD(Singular Value Decomposition，奇异值分解)算法，求得T(即仿射变换参数)。

在一个实施例中，可以采用alpha-blending(透明度-混合)框架进行图像融合。例如，可以基于仿射变换参数，按照预设公式，对目标未遮挡人脸图像和目标遮挡物图像进行融合，得到待优化融合图像。

其中，预设公式为：

A_mix表示待优化融合图像，T表示仿射变换参数，α表示预设融合系数，G[I_c] 表示目标遮挡物图像，I_o表示目标遮挡人脸图像，I表示目标未遮挡人脸图像。α可以为0.7，或者，也可以为0.8，但并不限于此。

在一个实施例中，参见图5，图5为本申请实施例提供的一种训练生成器网络的流程图，可以包括以下步骤：

S501：获得未遮挡人脸样本图像、目标遮挡物样本图像及包含目标遮挡物的遮挡人脸样本图像。

S502：将未遮挡人脸样本图像和目标遮挡物样本图像进行融合，得到待优化融合样本图像。

S503：将待优化融合样本图像输入待训练的生成器网络，获得目标融合样本图像。

S504：将目标融合样本图像和未遮挡人脸样本图像，输入预先训练的身份一致网络，得到用于确定目标融合样本图像和未遮挡人脸样本图像中人脸的身份是否一致的特征图。

S505：将目标融合样本图像和包含目标遮挡物的遮挡人脸样本图像，输入待训练的判别器网络，得到目标融合样本图像为真实图像的概率，以及包含目标遮挡物的遮挡人脸样本图像为真实图像的概率。

S506：基于目标融合样本图像和未遮挡人脸样本图像各自对应的特征图，计算身份一致网络的特征损失值。

S507：基于目标融合样本图像为真实图像的概率，以及包含目标遮挡物的遮挡人脸样本图像为真实图像的概率，计算判别器网络的损失值。

S508：基于目标融合样本图像与待优化融合样本图像之间的差异，计算生成器网络的损失值。

S509：基于总损失值调整生成器网络和判别器网络的网络参数，继续训练，直到生成器网络和判别器网络收敛。

在一个实施例中，在对生成器网络的网络参数进行调整，即，可以获取训练好的身份一致网络，进而，在对生成器网络的网络参数进行调整的过程中，保持身份一致网络的网络参数不变，以使训练完成时，基于生成器网络得到的图像能够保证身份的一致性。

例如，可以预先基于预设样本图像对待训练的身份一致网络进行训练。可以将第一预设样本图像和第二预设样本图像，输入对待训练的身份一致网络，身份一致网络可以得到第一预设样本图像和第二预设样本图像的特征图，并基于特征图得到第一预设样本图像和第二预设样本图像中人脸的身份一致的概率，进而，计算该概率与预设标签之间的差值，作为身份一致网络的损失值，并根据该损失值调整身份一致网络的网络参数，直至收敛。预设标签表示第一预设样本图像和第二预设样本图像中人脸的身份是否一致。对身份一致网络的网络参数进行调整使用的损失值，与上述身份一致网络的特征损失值不同。

其中，总损失值为基于生成器网络的损失值、判别器网络的损失值和身份一致网络的特征损失值确定的。生成器网络、判别器网络和身份一致网络构成生成式对抗网络(Generative adversarial networks，GANs)。

生成器网络可以为自编码器(Auto Encoder，AE)网络，其可以将输入数据作为学习目标，对输入数据进行表征学习，得到输出数据。例如，可以包括编码器(Encoder)和解码器(Decoder)，编码器将输入数据变换成编码数据，而解码器将编码数据转换成输出数据。

判别器网络的输出数据为输入数据对应的标签，表示输入数据为真实图像的概率，也就是说，判别器网络用于确定输入的图像是否为真实图像(即为真实图像，或者，为融合的图像)。判别器网络可以为深度学习网络，例如，判别器网络可以包括卷积层和激活函数层，卷积层用于对输入的图像进行特征提取，激活函数层可以基于特征提取的结果，生成相应的标签。

身份一致网络的输出数据为目标融合样本图像和未遮挡人脸样本图像对应的标签，表示目标融合样本图像和未遮挡人脸样本图像中人脸的身份一致的概率。也就是说，身份一致网络用于确定输入的两个图像中人脸的身份是否一致。身份一致网络可以为深度学习网络，例如，身份一致网络可以包括卷积层和激活函数层，卷积层用于对输入的两个图像分别进行特征提取，得到各自对应的图像特征，进而，可以对两个图像的图像特征进行比较，激活函数层可以基于图像特征的比较结果，得到两个图像中人脸的身份一致的概率。

在一个实施例中，上述步骤S506可以包括以下步骤：

针对每一预设通道，计算目标融合样本图像和未遮挡人脸样本图像在该预设通道对应的特征图之间的距离；计算各个预设通道对应的距离的平均值，作为身份一致网络的特征损失值。

在本申请实施例中，身份一致网络可以对输入的图像进行卷积处理，得到该图像在各个预设通道对应的特征图。其中，预设通道的数目为基于身份一致网络中卷积层的卷积核的个数确定的。

也就是说，基于身份一致网络可以分别得到输入的两个图像在各个预设通道对应的特征图，进而，针对每一预设通道，可以计算该两个图像在该预设通道对应的特征图之间的距离，然后，可以计算各个预设通道对应的距离的平均值，得到身份一致网络的特征损失值。

另外，还可以结合预设次数的训练过程的平均损失值，对网络参数进行调整，相应的，身份一致网络的特征损失值可以用于公式(1)表示。

L_ip表示身份一致网络的特征损失值，k表示预设次数，δ[P(I_gen)]表示目标融合样本图像在一个通道对应的特征图，δ[P(I)]表示未遮挡人脸样本图像在该通道对应的特征图，表示计算各个预设通道对应的特征图之间的距离的平均值。

上述步骤S508可以包括以下步骤：

基于目标融合样本图像与待优化融合样本图像之间的距离，和/或目标融合样本图像与待优化融合样本图像的全变分的差值，计算生成器网络的损失值。

一种实现方式中，可以计算目标融合样本图像与待优化融合样本图像之间的距离，作为生成器网络的损失值。

例如，可以用公式(2)，计算目标融合样本图像与待优化融合样本图像之间的距离。

L₁＝‖I_mix-I_gen‖₁ (2)

L₁表示目标融合样本图像与待优化融合样本图像之间的距离，I_mix表示待优化融合样本图像，I_gen表示目标融合样本图像。

一种实现方式中，可以计算目标融合样本图像与待优化融合样本图像的全变分的差值，作为生成器网络的损失值。

例如，可以基于公式(3)，计算目标融合样本图像与待优化融合样本图像的全变分的差值。

L_TV表示目标融合样本图像与待优化融合样本图像的全变分的差值，I_mix表示待优化融合样本图像，I_gen表示目标融合样本图像。

一种实现方式中，可以计算目标融合样本图像与待优化融合样本图像之间的距离，与目标融合样本图像与待优化融合样本图像的全变分的差值的加权和，得到生成器网络的损失值。

例如，生成器网络的损失值可以用于公式(4)表示。

L_re＝L₁+βL_TV (4)

L_re表示生成器网络的损失值，β表示第三预设系数。

在一个实施例中，还可以结合预设次数的训练过程的平均损失值，对网络参数进行调整，相应的，判别器网络的损失值可以用于公式(5)表示。

L_gan表示判别器网络的损失值，k表示预设次数，D(x_i)表示目标融合样本图像为真实图像的概率；D(G(z_i))表示包含目标遮挡物的遮挡人脸样本图像为真实图像的概率。

在一个实施例中，总损失值为：

L＝L_gan+γL_re+μL_ip

其中，L表示总损失值，L_gan表示判别器网络的损失值，L_re表示生成器网络的损失值，L_ip表示身份一致网络的特征损失值，γ表示第一预设系数，μ表示第二预设系数。例如，γ可以为0.1，或者，也可以为0.2；μ可以为0.1，或者，也可以为0.2，但并不限于此。

也就是说，可以基于总损失值对生成器网络和判别器网络的网络参数进行调整，直至达到收敛。

参见图6，图6为本申请实施例提供的一种生成目标融合图像的流程示意图。

原始图像也就是待融合的未遮挡人脸图像，针对每一待融合的未遮挡人脸图像(即本申请实施例中的目标未遮挡人脸图像)，可以从包含目标遮挡物(即墨镜)的遮挡人脸图像中，确定与目标未遮挡人脸图像相匹配的遮挡人脸图像 (即目标遮挡人脸图像)，并获取目标遮挡人脸图像中目标遮挡物对应的图像 (即目标遮挡物图像)。目标遮挡物图像也就是图6中只包含墨镜的图像。

进而，将每一目标未遮挡人脸图像与对应的目标遮挡物图像进行融合，得到融合图像(即待优化融合图像)，并将待优化融合图像输入至生成式对抗网络中的生成器网络，以生成图像(即得到目标融合图像)。

参见图7，图7为本申请实施例提供的一种生成式对抗网络的框架示意图。

图7中，G表示生成器网络，D表示判别器网络，P表示身份一致网络。I表示未遮挡人脸样本图像。I_mix表示待优化融合样本图像。I_gen表示目标融合样本图像。I_real表示包含目标遮挡物的遮挡人脸样本图像，图7中，目标遮挡物为墨镜。L_re表示生成器网络的损失值，L_ip表示身份一致网络的特征损失值，L_gan表示判别器网络的损失值。

基于相同的发明构思，本申请实施例还提供了一种图像生成装置，参见图 8，图8为本申请实施例提供的一种图像生成装置的结构图，该装置可以包括：

图像获取模块801，用于获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像；

图像融合模块802，用于对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像；

图像生成模块803，用于将所述待优化融合图像输入至预先训练的生成器网络，得到所述生成器网络输出的目标融合图像；其中，所述生成器网络属于基于判别器网络和身份一致网络进行训练获得的生成式对抗网络，所述判别器网络用于对融合图像细节信息的约束，所述身份一致网络用于对身份一致性的约束。

可选的，所述目标遮挡物图像为：从与所述目标未遮挡人脸图像相匹配的遮挡人脸图像中获取的。

可选的，所述图像获取模块801，包括：

第一图像获取子模块，用于获取待融合的目标未遮挡人脸图像，以及多个包含目标遮挡物的遮挡人脸图像；

第二图像获取子模块，用于获取所述目标遮挡人脸图像中的目标遮挡物图像。

可选的，所述第二图像获取子模块，包括：

图像分割单元，用于基于图像分割算法，从所述目标遮挡人脸图像中提取所述目标遮挡物所占区域的图像，作为待处理遮挡物图像；

模糊处理单元，用于对所述待处理遮挡物图像进行高斯模糊处理，得到目标遮挡物图像。

可选的，所述图像融合模块802，包括：

人脸关键点获取模块子模块，用于获取所述目标未遮挡人脸图像中的人脸关键点，以及所述目标遮挡物图像中的人脸关键点；

仿射变换参数计算子模块，用于计算所述目标未遮挡人脸图像中的人脸关键点，与所述目标遮挡物图像中的人脸关键点之间的仿射变换参数；

图像融合子模块，用于基于所述仿射变换参数，对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像。

其中，所述预设公式为：

I_mix表示所述待优化融合图像，T表示所述仿射变换参数，α表示预设融合系数，G[I_c]表示所述目标遮挡物图像，I_o表示所述与所述目标未遮挡人脸图像相匹配的遮挡人脸图像，I表示所述目标未遮挡人脸图像。

可选的，所述装置还包括：

样本图像获取模块，用于获得未遮挡人脸样本图像、目标遮挡物样本图像及包含目标遮挡物的遮挡人脸样本图像；

待优化融合样本图像获取模块，用于将所述未遮挡人脸样本图像和目标遮挡物样本图像进行融合，得到待优化融合样本图像；

目标融合样本图像获取模块，用于将所述待优化融合样本图像输入待训练的生成器网络，获得目标融合样本图像；

第一损失值计算模块，用于基于所述目标融合样本图像和所述未遮挡人脸样本图像各自对应的特征图，计算所述身份一致网络的特征损失值；

第三损失值计算模块，用于基于所述目标融合样本图像与所述待优化融合样本图像之间的差异，计算所述生成器网络的损失值；

可选的，所述总损失值为：

L＝L_gan+γL_re+μL_ip

本申请实施例还提供了一种电子设备，如图9所示，包括处理器901、通信接口902、存储器903和通信总线904，其中，处理器901，通信接口902，存储器903通过通信总线904完成相互间的通信，

存储器903，用于存放计算机程序；

处理器901，用于执行存储器903上所存放的程序时，实现如下步骤：

获取待融合的目标未遮挡人脸图像和对应的目标遮挡物图像；

对所述目标未遮挡人脸图像和所述目标遮挡物图像进行融合，得到待优化融合图像；

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器 (DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一图像生成方法的步骤。

在本申请提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一图像生成方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、计算机可读存储介质以及计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

25页详细技术资料下载

一种图像生成方法及装置

相关技术

网友询问留言