一种检测模型的训练方法及装置

文档序号:191710 发布日期:2021-11-02 浏览:20次 >En<

阅读说明:本技术 一种检测模型的训练方法及装置 (Training method and device for detection model ) 是由 范坤 于 2021-07-02 设计创作,主要内容包括:本发明公开了一种检测模型的训练方法及装置、计算机可读存储介质,其中方法包括:从样本集合中随机选择第一未标注样本集;对第一未标注样本集进行标注,得到第一已标注样本集;对第一已标注样本集进行数据增强,获得第一增强样本集;通过第一增强样本集对待训练的检测模型进行第一次训练;从样本集合中随机选择第二未标注样本集;利用经过第一次训练后的检测模型对第二未标注样本集进行检测,得到第一检测结果集;对第一检测结果进行数据增强,得到第二增强样本集;通过第二增强样本集对第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。本发明实现了利用少量标注数据训练模型,且模型泛化能力更好的技术效果。(The invention discloses a training method and a device for a detection model and a computer readable storage medium, wherein the method comprises the following steps: randomly selecting a first unlabeled sample set from the sample set; labeling the first unlabeled sample set to obtain a first labeled sample set; performing data enhancement on the first labeled sample set to obtain a first enhanced sample set; training the detection model to be trained for the first time through the first enhancement sample set; randomly selecting a second unlabeled sample set from the sample set; detecting the second unlabeled sample set by using the detection model after the first training to obtain a first detection result set; performing data enhancement on the first detection result to obtain a second enhanced sample set; and carrying out secondary training on the detection model after the primary training through a second enhanced sample set to obtain the trained detection model. The invention realizes the technical effect of training the model by using a small amount of labeled data and having better generalization capability of the model.)

一种检测模型的训练方法及装置

技术领域

本发明涉及自动驾驶技术领域,尤其涉及一种检测模型的训练方法及装置。

背景技术

自动驾驶技术依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让计算机可以在没有任何人类主动的操作下,自动安全地操作机动车辆。

在自动驾驶技术中,车辆检测模型是非常重要的组成部分,其可用于对道路上的车辆进行检测,并确定车辆的位置。

目前的车辆检测模型,一般采用大规模深度神经网络,而它需要大量的人工标注数据,模型需要在大量的人工标注数据中慢慢学到真实的数据分布,最后达到精确检测车辆的目的。但是这种方法成本高昂,且泛化能力弱。

发明内容

本申请实施例通过提供一种检测模型的训练方法及装置,解决了现有技术中的检测模型,训练时需要大量的人工标注数据,存在训练成本过高且泛化能力弱的技术问题,实现了利用少量标注数据来训练检测模型,且模型的泛化能力更好的技术效果。

第一方面,本申请通过本申请的一实施例提供如下技术方案:

一种检测模型的训练方法,包括:

从样本集合中随机选择具有第一预定数量样本的第一未标注样本集;

对所述第一未标注样本集中的每一样本进行标注,得到第一已标注样本集;

对所述第一已标注样本集中的每一样本进行数据增强,获得第一增强样本集;

通过所述第一增强样本集对待训练的检测模型进行第一次训练;

从所述样本集合中随机选择具有第二预定数量样本的第二未标注样本集;

利用所述经过第一次训练后的检测模型对所述第二未标注样本集中的每一样本进行检测,得到第一检测结果集;

对所述第一检测结果集中的每一检测结果进行数据增强,得到第二增强样本集;

通过所述第二增强样本集对所述第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。

第二方面,基于同一发明构思,本申请通过本申请的一实施例,提供如下技术方案:

一种检测模型的训练装置,包括:

第一选择模块,用于从样本集合中随机选择具有第一预定数量样本的第一未标注样本集;

第一标注模块,用于对所述第一未标注样本集中的每一样本进行标注,得到第一已标注样本集;

第一增强模块,用于对所述第一已标注样本集中的每一样本进行数据增强,获得第一增强样本集;

第一训练模块,用于通过所述第一增强样本集对待训练的检测模型进行第一次训练;

第二选择模块,用于从所述样本集合中随机选择具有第二预定数量样本的第二未标注样本集;

第一检测模块,用于利用所述经过第一次训练后的检测模型对所述第二未标注样本集中的每一样本进行检测,得到第一检测结果集;

第二增强模块,用于对所述第一检测结果集中的每一检测结果进行数据增强,得到第二增强样本集;

第二训练模块,用于通过所述第二增强样本集对所述第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。

第三方面,基于同一发明构思,本申请通过本申请的一实施例提供如下技术方案:

一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时可以实现上述第一方面任一实施方式所述的方法步骤。

第四方面,基于同一发明构思,本申请通过本申请的一实施例提供如下技术方案:

一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可可以实现上述第一方面任一实施方式所述的方法步骤。

本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:

在本申请实施例中,公开了一种检测模型的训练方法,包括:从样本集合中随机选择具有第一预定数量样本的第一未标注样本集;对所述第一未标注样本集中的每一样本进行标注,得到第一已标注样本集;对所述第一已标注样本集中的每一样本进行数据增强,获得第一增强样本集;通过所述第一增强样本集对待训练的检测模型进行第一次训练;从所述样本集合中随机选择具有第二预定数量样本的第二未标注样本集;利用所述经过第一次训练后的检测模型对所述第二未标注样本集中的每一样本进行检测,得到第一检测结果集;对所述第一检测结果集中的每一检测结果进行数据增强,得到第二增强样本集;通过所述第二增强样本集对所述第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。如此,模型在每一轮训练过程中,由于数据增强方式不同,模型会侧重探索学习不同的数据模式,反复迭代就可以实现基于少量的标注数据来训练大规模神经网络的目的,且获得的测模型的泛化能力更好。故而,解决了现有技术中的检测模型,训练时需要大量的人工标注数据,存在训练成本过高且泛化能力弱的技术问题,实现了利用少量标注数据来训练检测模型,且模型的泛化能力更好的技术效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例中一种检测模型的训练方法的流程图;

图2为本申请实施例中判断第二检测模型是否满足预设条件的细化流程图;

图3为本申请实施例中一种检测模型的训练方法的步骤示意图;

图4为本申请实施例中一种检测模型的训练装置的结构图;

图5为本申请实施例中第一判断模块的结构图;

图6为本申请实施例中一种电子设备的结构图。

具体实施方式

本申请实施例通过提供一种检测模型的训练方法及装置,解决了现有技术中的检测模型,训练时需要大量的人工标注数据,存在训练成本过高且泛化能力弱的技术问题,实现了利用少量标注数据来训练检测模型,且模型的泛化能力更好的技术效果。

申请概述

如上所述,现有技术在对检测模型进行训练时(尤其是在对大规模神经网络进行训练时),需要大量的标注数据,而这些标注数据一般都是由人工方式进行标注,这将导致训练成本极高,又难以获得足够多的标注数据。若标注数据的数量不足,则会影响模型的训练效果,降低模型的检测准确度,且模型的泛化能力也比较弱。

基于上述技术问题,本申请的基本构思是“循环自举标注”+“数据随机增强”的训练方法,模型在每一轮训练中由于数据增强方式不同,会侧重探索学习不同的数据模式,反复迭代就可以实现少量标注训练大规模神经网络的目标,且模型泛化能力更好。

具体来讲,本申请提供的检测模型的训练方法及装置、电子设备、计算机可读存储介质:可以从样本集合中随机选择具有第一预定数量样本的第一未标注样本集;对所述第一未标注样本集中的每一样本进行标注,得到第一已标注样本集;对所述第一已标注样本集中的每一样本进行数据增强,获得第一增强样本集;通过所述第一增强样本集对待训练的检测模型进行第一次训练;从所述样本集合中随机选择具有第二预定数量样本的第二未标注样本集;利用所述经过第一次训练后的检测模型对所述第二未标注样本集中的每一样本进行检测,得到第一检测结果集;对所述第一检测结果集中的每一检测结果进行数据增强,得到第二增强样本集;通过所述第二增强样本集对所述第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。如此,模型在每一轮训练过程中,由于数据增强方式不同,模型会侧重探索学习不同的数据模式,反复迭代就可以实现基于少量的标注数据来训练大规模神经网络的目的,且获得的测模型的泛化能力更好。故而,解决了现有技术中的检测模型,训练时需要大量的人工标注数据,存在训练成本过高且泛化能力弱的技术问题,实现了利用少量标注数据来训练检测模型,且模型的泛化能力更好的技术效果。

在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

本实施例提供了一种检测模型的训练方法,应用在电子设备中,所述电子设备可以是PC(Personal Computer,个人电脑)、或平板电脑、或智能手机、或可移动设备、等等。其中,所述可移动设备可以为:电动车、机器人、汽车等设备,其可以在驱动装置(例如:电动机或内燃机)的驱动下行驶。此处,对于所述电子设备具体是何种设备,本实施例不做具体限定。

具体而言,如图1所示,所述检测模型的训练方法,包括:

步骤S101:从样本集合中随机选择具有第一预定数量样本的第一未标注样本集。

在具体实施过程中,所述样本集合中包含大量的未标注的样本,这些样本可以是图像数据(例如:图片或视频),也可以为音频数据。

本文将主要以训练车辆检测模型为例,对本方法进行说明。其中,车辆检测模型主要用于对图片中的车辆进行检测,例如,检测图片中是否有车辆,检测图片中车辆的位置,其可为车辆的导航、自动驾驶以及构建地图提供帮助。

需要说明:本文中的“检测模型”也可以简称为“模型”。

在具体实施过程中,在样本集合中包含大量的未标注图片(例如:N张未标注图片),这些未标注图片也可以被称为“原始图片”,这里,可以从样本集合中随机选择第一预定数量的未标注图片作为第一未标注样本集。其中,第一未标注样本集即为模型训练的起始数据集。

在具体实施过程中,第一预定数量可以参考训练池的大小来确定,例如,训练池的大小为M(即:可容纳M张图片),则第一预定数量等于M,也就是说,需要从样本集合中随机选择M张未标注图片作为第一未标注样本集。一般来讲,训练池的大小M要远小于样本集合中未标注图片的总数N。

步骤S102:对第一未标注样本集中的每一样本进行标注,得到第一已标注样本集。

在具体实施过程中,如图3所示,请看标号①,可以采用人工标注方式对第一未标注样本集中的每张未标注图片进行标注。具体地,可以对上述M张未标注图片中的每张图片进行人工标注,获得M张已标注图片,所述M张已标注图片即为第一已标注样本集,如图3所示,标号②代表训练池,第一次存储的是人工标注的第一已标注样本集。

在具体实施过程中,在训练车辆检测模型时,则需要在第一未标注样本集中的每张图片中标注出车辆的位置。具体可以在每张已标注图片中加入一标注信息,例如,车辆的位置坐标。

步骤S103:对第一已标注样本集中的每一样本进行数据增强,获得第一增强样本集。具体的数据增强方法,详见后文【方式一】至【方式五】。

一般而言,在对车辆检测模型进行训练时,通常采用(大规模)深度神经网络,而比较成功的神经网络需要大量的参数,许多的神经网络的参数都是数以百万计,而使得这些参数可以正确工作则需要大量的数据样本进行训练。而实际情况中,很难获得足够多的数据样本,尤其是已标注的数据样本。所以,需要对少量的数据样本进行数据增强。如图3所示,标号③即代表对第一已标注样本集中的每一样本进行数据增强。

在具体实施过程中,在步骤S103中,需要对第一已标注样本集进行数据增强,数据增强的效果有:(1)增加样本的数据量,提高模型的泛化能力;(2)增加噪声数据,提升模型的鲁棒性。

在具体实施过程中,可以对M张已标注图片进行数据增强,获得M张增强图片,所述M张增强图片即为所述第一增强样本集。

步骤S104:通过第一增强样本集对待训练的检测模型进行第一次训练。

在具体实施过程中,此处的检测模型可以为基于深度神经网络构建的初始模型。

在具体实施过程中,所述M张未标注图片(即:原始图片)和所述M张增强图片(即:对原始图片进行标注和数据增强的图片)一一对应,组成M对图片。在步骤S104中,则以所述M对图片作为第一训练样本集,对第一检测模型进行训练;如图3所示,标号④即代表通过第一增强样本集对待训练的检测模型进行第一次训练。

需要说明,步骤S104是对模型进行的第一轮训练,其用到的标注数据为人工标注的数据。而后续对模型的每一轮训练,其用到的标注数据都不再是人工标注的数据。如图3所示,标号⑧代表后续对模型的每一轮训练。

步骤S105:从样本集合中随机选择具有第二预定数量样本的第二未标注样本集。

在具体实施过程中,由于第一训练样本的数据量较少,不足以训练出理想的模型,所以可以进一步从样本集合中随机选择具有第二预定数量的第二未标注样本集。与第一预定数量类似,第二预定数量也需要参考练池的大小来确定。此处,第二预定数量与第一预定数量相同,都是M。

步骤S106:利用经过第一次训练后的检测模型对第二未标注样本集中的每一样本进行检测,得到第一检测结果集。

在具体实施过程中,步骤S106与步骤S102的不同之处在于,步骤S106不再基于人工标注方式对第二未标注样本集进行标注,而是直接利用第二检测模型对第二未标注样本集进行检测。具体地,是直接利用第二检测模型检测第二未标注样本集中每张图片中的车辆的位置(相当于利用第二检测模型对第二未标注样本集进行了标注)获得第一检测结果(相当于已标注数据)。第一检测结果中包含M张检测结果图片,且在每张检测结果图片中都含有检测结果信息(相当于标注信息,用于表示车辆的位置坐标)。如图3所示,标号⑤代表:从样本集合中随机选择具有第二预定数量样本的第二未标注样本集,利用经过第一次训练后的检测模型对第二未标注样本集中的每一样本进行检测。标号⑥即代表得到第一检测结果集。

步骤S107:对第一检测结果集中的每一检测结果进行数据增强,得到第二增强样本集。

在具体实施过程中,步骤S107与步骤S103类似,都是进行数据增强,但二者用到的数据增强方法不同,具体的数据增强方法,详见后文【方式一】至【方式五】。

需要说明:在本方法中,模型会经过多轮训练,而在每一轮训练过程中,数据的增强方式都不同,这样有助于提高模型的泛化能力。

步骤S108:通过第二增强样本集对第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。

在具体实施过程中,步骤S108与步骤S104类似,都是进行模型训练,但二者利用的训练样本不同。

需要说明:步骤S108是对模型进行的第二轮训练,其用到的标注数据不再是人工标注的数据,而是利用上一轮训练得到的模型(即:第一次训练后的检测模型)对第二未标注样本集进行检测获得的。

在具体实施过程中,若第二次训练后的检测模型不满足预设条件,则可以参考步骤S105~步骤S108,对第二次训练后的检测模型继续进行训练,直到获得的检测模型满足预设条件。如图3所示,标号⑦代表:对第二次训练后的检测模型继续进行训练,直到获得的检测模型满足预设条件。

如图3所示,标号⑧代表:每一轮迭代检测模型训练都会自动在上一轮得到的模型基础上继续训练,保留上一轮中模型学习到的数据分布。

具体来讲,若第二次训练后的检测模型不满足预设条件,则启动对模型的第三轮训练:从样本集合中随机选择具有第三预定数量的第三未标注样本集;利用第二次训练后的检测模型对第三未标注样本集进行检测,得到第二检测结果(相当于已标注数据);对第二检测结果集中的每一检测结果进行数据增强,得到第三增强样本集;基于第三增强样本集对第二次训练后的检测模型进行训练,得到第三次训练后的检测模型。与第一预定数量类似,第三预定数量也需要参考练池的大小来确定。此处,第三预定数量与第一预定数量相同,都是M。

若第三次训练后的检测模型仍不满足预设条件,则启动对模型的第四轮训练:从样本集合中随机选择具有第四预定数量的第四未标注样本集;利用第三次训练后的检测模型对第四未标注样本集进行检测,得到第三检测结果(相当于已标注数据);对第三检测结果集中的每一检测结果进行数据增强,得到第四增强样本集;基于第四增强样本对第四次训练后的检测模型进行训练,得到第四次训练后的检测模型。与第一预定数量类似,第四预定数量也需要参考练池的大小来确定。此处,第四预定数量与第一预定数量相同,都是M。

反复迭代,直到获得的检测模型满足预设条件为止。

需要说明:从对模型的第二轮训练开始,每一轮训练用到的标注数据,都是利用上一轮训练得到的模型对未标注样本进行检测获得的,反复迭代,这也就是前文中“循环自举标注”的含义。

在本实施例中,模型在每一轮训练过程中,由于数据增强方式不同,模型会侧重探索学习不同的数据模式,反复迭代,就可以实现基于少量的标注数据来训练大规模神经网络的目的,且获得的检测模型的泛化能力更好。如此,解决了现有技术中的车辆检测模型,存在训练成本过高且泛化能力弱的技术问题,实现了降低训练成本,且提高模型泛化能力的技术效果。

作为一种可选的实施例,所述检测模型的训练方法,还包括:

判断第一次训练后的检测模型是否满足预设条件,当第一次训练后的检测模型满足预设条件时,再执行步骤S105。

在具体实施过程中,在执行步骤S105之前,还需要判断第一次训练后的检测模型是否满足预设条件。具体地,可以判断第一次训练后的检测模型的检测准确度是否达到预期(例如:是否达到预期的准确度),若不满足预设条件(即:准确度未达到预期),则执行步骤S105~步骤S108,以对第一次训练后的检测模型继续进行训练;若满足预设条件(即:准确度达到预期),则不再执行后续步骤(即:不再执行步骤S105~步骤S108),此时,第一次训练后的检测模型就是最终的模型。

作为一种可选的实施例,如图2所示,所述判断第一次训练后的检测模型是否满足预设条件,包括:

步骤S201:获取第二已标注样本集;

步骤S202:利用第一次训练后的检测模型对第二已标注样本集进行检测,得到第二检测结果;

步骤S203:根据第二检测结果与第二已标注样本集中的标注信息,确定第一次训练后的检测模型的检测准确度;

步骤S204:判断第一次训练后的检测模型的检测准确度是否满足预设条件。

在具体实施过程中,除了有上述样本集合以外,还需要准备一验证集合,验证集合不参与模型的训练,是用来评估每一轮训练后得到的模型的准确度。具体地,验证集合包含V张未标注图片和V张已标注图片,每张已标注图片中含有标注信息(例如:车辆的坐标),所述V张未标注图片和所述V张已标注图片一一对应,构成V对图片;在每一轮训练完成后,则从验证集合取出若干对图片,然后利用模型对将其中的未标注图片进行检测,获得检测结果后,将检测结果与对应的已标出图片进行比对,从而确定模型的检测准确度。

在具体实施过程中,对于每一轮训练得到的模型,都需要确定其检测准确度,若模型的检测准确度没达到预期的准确度,则可以参考步骤S105~步骤S108对模型继续训练,直到模型的检测准确度达到预期的准确度。

作为一种可选的实施例,步骤S103,包括:从预设的数据增强方法集合中随机选取一种或多种数据增强方法;利用随机选取出的一种或多种数据增强方法对第一已标注样本集中的每一样本进行数据增强;此时,步骤S107,包括:从预设的数据增强方法集合中随机选取一种或多种数据增强方法;利用选取出的一种或多种数据增强方法对第一检测结果集中的每一检测结果进行数据增强。

在具体实施过程中,对于每一轮数据增强,所采用的数据增强方法都不同,具体可以从预设的数据增强方法集合中随机选取一种或多种数据增强方法。

作为一种可选的实施例,在预设的数据增强方法集合中,包括以下数据增强方法:

【方法一】:在预设尺度范围内随机放缩数据。例如:在步骤S103中,可以在预设尺度范围内随机放缩第一已标注样本中的每张已标注图片以及对应的原始图片;在步骤S107中,可以在预设尺度范围内随机放缩第一检测结果中的每张检测结果图片以及对应的原始图片。

【方法二】:在预设角度范围内随机旋转数据。例如:在步骤S103中,可以在预设角度范围内随机旋转第一已标注样本中的每张已标注图片以及对应的原始图片;在步骤S107中,可以在预设角度范围内随机旋转第一检测结果中的每张检测结果图片以及对应的原始图片。在进行旋转时,可以以图片的中心点为轴心进行旋转。

【方法三】:在数据中随机加入高斯噪声。例如:在步骤S103中,可以向第一已标注样本中的每张已标注图片对应的原始图片中随机加入高斯噪声;在步骤S107中,可以向第一检测结果中的每张检测结果图片对应的原始图片中随机加入高斯噪声。

【方法四】:随机翻转数据。例如:在步骤S103中,可以随机翻转第一已标注样本中的每张已标注图片以及对应的原始图片;在步骤S107中,可以随机翻转第一检测结果中的每张检测结果图片以及对应的原始图片。

【方法五】:随机改变数据的对比度。例如:在步骤S103中,可以随机改变第一已标注样本中的每张已标注图片对应的原始图片的对比度;在步骤S107中,可以随机改变第一检测结果中的每张检测结果图片对应的原始图片的对比度。

在本实施例中,提供了一数据增强方法集合,其中包含多种不同数据增强方法,在对模型的每一轮训练时,都可以从该集合中随机选取至少一种数据增强方法来进行数据增强,由于是随机选取,使得每次用到的数据增强方法都不同,如此,丰富了训练样本,加大了每一轮训练过程中训练样本的差异性,有助于进一步提高模型的泛化能力。

作为一种可选的实施方式,在利用随机选取出的一种或多种数据增强方法对第一已标注样本进行数据增强的步骤之前,所述方法还包括:

确定随机选取的一种或多种数据增强方法中的每一种数据增强方法的参数。

举例来讲,在上述【方法一】中,所述预设尺度范围具体为0.5~2,这里的“尺度”就是“比例”的意思。

举例来讲,在上述【方法二】中,所述预设角度范围具体为+90~-90度,具体是指:以图片中心点为轴心,在预设角度范围内,随机旋转一定的角度。

举例来讲,在上述【方法三】中,所述高斯噪声的具体参数为:均值为0、方差小于等于0.1。

作为一种可选的实施例,所述确定随机选取的一种或多种数据增强方法中的每一种数据增强方法的参数,包括:

获取每一种数据增强方法各自对应的预设参数选取范围;在预设参数选取范围中随机选择参数。

举例来讲,在上述【方法一】中,可以在0.5~2的尺度范围内随机确定一个尺度来放缩数据。例如,随机确定为0.5、或0.8、或1、或1.2、或1.5、或1.8、或2、等等。此处,放缩前的图片即为输入,缩放后的图片即为输出。

举例来讲,在上述【方法二】中,可以在-90~+90度的角度范围随机确定一个角度来旋转数据。例如,随机确定为-90度、或-70度、或-45度、或-30度、或+30度、或+45度、或+70度、或+90度、等等。此处,旋转前的图片即为输入,旋转后的图片即为输出。

举例来讲,在上述【方法三】中,可以在均值为0、方差小于等于0.1的范围内随机确定高斯噪声的参数。例如,随机确定均值为0、方差为0.01,或均值为0、方差为0.03,或均值为0、方差为0.05,或均值为0、方差为0.07,或均值为0、方差为0.1,等等。此处,加入高斯噪声前的图片即为输入,加入高斯噪声后的图片即为输出。

在本实施例中,每种数据增强方法所用到的参数也是随机确定的,如此,进一步丰富了训练样本,进一步加大了每一轮训练过程中训练样本的差异性,有助于进一步提高模型的泛化能力。

由此可见,前文中的“数据随机增强”包含两层含义:(1)数据增强方法是随机的;(2)数据增强方法用到的参数也是随机的。如此,提高了模型的泛化能力。

上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:

在本申请实施例中,公开了一种检测模型的训练方法,包括:从样本集合中随机选择具有第一预定数量样本的第一未标注样本集;对所述第一未标注样本集中的每一样本进行标注,得到第一已标注样本集;对所述第一已标注样本集中的每一样本进行数据增强,获得第一增强样本集;通过所述第一增强样本集对待训练的检测模型进行第一次训练;从所述样本集合中随机选择具有第二预定数量样本的第二未标注样本集;利用所述经过第一次训练后的检测模型对所述第二未标注样本集中的每一样本进行检测,得到第一检测结果集;对所述第一检测结果集中的每一检测结果进行数据增强,得到第二增强样本集;通过所述第二增强样本集对所述第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。如此,模型在每一轮训练过程中,由于数据增强方式不同,模型会侧重探索学习不同的数据模式,反复迭代就可以实现基于少量的标注数据来训练大规模神经网络的目的,且获得的测模型的泛化能力更好。故而,解决了现有技术中的检测模型,训练时需要大量的人工标注数据,存在训练成本过高且泛化能力弱的技术问题,实现了利用少量标注数据来训练检测模型,且模型的泛化能力更好的技术效果。

示例性装置

基于同一发明构思,如图4所示,本实施例提供了一种检测模型的训练装置300,包括:

第一选择模块301,用于从样本集合中随机选择具有第一预定数量样本的第一未标注样本集;

第一标注模块302,用于对所述第一未标注样本集中的每一样本进行标注,得到第一已标注样本集;

第一增强模块303,用于对所述第一已标注样本集中的每一样本进行数据增强,获得第一增强样本集;

第一训练模块304,用于通过所述第一增强样本集对待训练的检测模型进行第一次训练;

第二选择模块305,用于从所述样本集合中随机选择具有第二预定数量样本的第二未标注样本集;

第一检测模块306,用于利用所述经过第一次训练后的检测模型对所述第二未标注样本集中的每一样本进行检测,得到第一检测结果集;

第二增强模块307,用于对所述第一检测结果集中的每一检测结果进行数据增强,得到第二增强样本集;

第二训练模块308,用于通过所述第二增强样本集对所述第一次训练后的检测模型进行第二次训练,得到训练后的检测模型。

作为一种可选的实施例,所述装置300,还包括:

第一判断模块,用于判断第一次训练后的检测模型是否满足预设条件;当第一次训练后的检测模型满足预设条件时,通过所述第二选择模块305执行从所述样本集合中随机选择具有第二预定数量样本的第二未标注样本集的步骤。

作为一种可选的实施例,如图5所示,第一判断模块,具体用于:

获取子模块401,用于获取第二已标注样本集;

检测子模块402,用于利用第一次训练后的检测模型对所述第二已标注样本集进行检测,得到第二检测结果;

确定子模块403,用于根据所述第二检测结果与所述第二已标注样本集中的标注信息,确定第一次训练后的检测模型的检测准确度;

判断子模块404,用于第一次训练后的检测模型的检测准确度是否满足预设条件。

作为一种可选的实施例,第一增强模块303,具体用于:

从预设的数据增强方法集合中随机选取一种或多种数据增强方法;利用所述随机选取出的一种或多种数据增强方法对所述第一已标注样本集中的每一样本进行数据增强;

此时,第二增强模块307,具体用于:

从预设的数据增强方法集合中随机选取一种或多种数据增强方法;利用选取出的一种或多种数据增强方法对所述第一检测结果集中的每一检测结果进行数据增强。

作为一种可选的实施例,所述数据增强方法,包括:

在预设尺度范围内随机放缩数据、在预设角度范围内随机旋转数据、以及在数据中随机加入高斯噪声。

作为一种可选的实施例,所述装置300,还包括:

第一确定模块,用于在所述利用所述随机选取出的一种或多种数据增强方法对所述第一已标注样本进行数据增强的步骤之前,确定所述随机选取的一种或多种数据增强方法中的每一种数据增强方法的参数。

作为一种可选的实施例,第一确定模块,具体用于:

获取每一种数据增强方法各自对应的预设参数选取范围;在所述预设参数选取范围中随机选择参数。

这里本领域技术人员可以理解,上述检测模型的训练装置300中的各个单元/模块的具体功能和操作已经在上面参考图1到图2的检测模型的训练方法的描述中得到了详细介绍,并因此,将省略其重复描述。

如上所述,根据本申请实施例的检测模型的训练装置300可以实现在各种可移动设备的设备终端中,例如用于自动驾驶汽车、机器人等中的计算机或者微处理器中。在一个示例中,根据本申请实施例的检测模型的训练装置300可以作为一个软件模块和/或硬件模块而集成到可移动设备的设备终端中。例如,该检测模型的训练装置300可以是该设备终端的操作系统中的一个软件模块,或者可以是针对于该设备终端所开发的一个应用程序;当然,该检测模型的训练装置300同样可以是该设备终端的众多硬件模块之一。

替换地,在另一示例中,该检测模型的训练装置300与可移动设备的设备终端也可以是分立的设备,并且该可移动设备的定位装置300可以通过有线和/或无线网络连接到该设备终端,并且按照约定的数据格式来传输交互信息。

示例性电子设备

基于同一发明构思,下面,参考图6来描述根据本申请实施例的电子设备。

图6图示了根据本申请实施例的电子设备的框图。

如图6所示,电子设备500包括一个或多个处理器501和存储器502。

处理器501可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备500中的其他组件以执行期望的功能。

存储器502可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器501可以运行所述程序指令,以实现上文所述的本申请的各个实施例的可移动设备的定位方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中,电子设备500还可以包括:输入装置503和输出装置504,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入装置503还可以包括例如键盘、鼠标等等。

该输出装置504可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置504可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图6中仅示出了该电子设备500中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备500还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

基于同一发明构思,除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的可移动设备的定位方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的可移动设备的定位方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于多视角和卷积注意力模块的车辆重识别方法和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!