目标对象标注方法、装置、计算机设备和存储介质

文档序号:1490769 发布日期:2020-02-04 浏览:3次 >En<

阅读说明:本技术 目标对象标注方法、装置、计算机设备和存储介质 (Target object labeling method and device, computer equipment and storage medium ) 是由 叶明� 于 2019-09-18 设计创作,主要内容包括:本申请涉及一种基于研发管理的目标对象标注方法、装置、计算机设备和存储介质。所述方法包括:在接收到标注指令时,获取对待处理图像的标注操作,标注操作携带在待处理图像上的标注点标识,获得至少四个标注点。通过设定第一坐标轴与第二坐标轴构建的平面坐标系,各标注点在平面坐标系中具有确定的坐标值。基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框,并采用目标对象标记框,对待处理图像进行目标对象标注。采用本方法,不同于现有技术中直接选取目标的左上角以及右下角的坐标,生成物体框的方式,可提高所生成的物体标记框的精确程度,以及对目标对象进行框定和标注的准确度。(The application relates to a target object labeling method and device based on research and development management, computer equipment and a storage medium. The method comprises the following steps: when an annotation instruction is received, the annotation operation of the image to be processed is obtained, and the annotation operation carries the annotation point identification on the image to be processed, so that at least four annotation points are obtained. And setting a plane coordinate system constructed by the first coordinate axis and the second coordinate axis, wherein each marking point has a determined coordinate value in the plane coordinate system. And sequentially connecting and generating target object marking frames based on the extracted target marking poles meeting the preset conditions, and marking the target object on the image to be processed by adopting the target object marking frames. By adopting the method, the method is different from the mode that the coordinates of the upper left corner and the lower right corner of the target are directly selected to generate the object frame in the prior art, and the accuracy of the generated object marking frame and the accuracy of framing and marking the target object can be improved.)

目标对象标注方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域,特别是涉及一种目标对象标注方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术的发展,以及对于图像处理的需求日益增加,使得物体检测标注技术的应用较为广泛,其主要目的在于输入一张图片,用鼠标画矩形框选中在该图片中感兴趣的区域,然后保存框选的感兴趣的区域的同时,输出感兴趣区域的图像在原图中的左上角点的坐标以及框选的图像的宽和高。

但现有的物体标记框是直接选取目标的左上角以及右下角的坐标,生成物体框,而标记物体的左上角和右下角坐标位置的对齐方式过于简单,导致坐标位置的获取存在较大误差,比如人体的上端多由头部决定,在标记框的中上位置,而左上、右下位置多为背景,则没有实际意义,这就导致直接目测所选取的位置很容易出现偏差,得到的物体框并不能准确地圈定目标物体。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高目标物体框定准确度的目标对象标注方法、装置、计算机设备和存储介质。

一种目标对象标注方法,所述方法包括:

在接收到标注指令时,获取对待处理图像的标注操作,所述标注操作携带在所述待处理图像上的标注点标识,获得至少四个标注点;

设定第一坐标轴与第二坐标轴构建的平面坐标系,各所述标注点在所述平面坐标系中具有确定的坐标值;

基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框;

采用所述目标对象标记框,对所述待处理图像进行目标对象标注。

在其中一个实施例中,所述获取对待处理图像的标注操作,所述标注操作携带在所述待处理图像上的标注点标识,包括:

检测到标注操作,所述标注操作携带当前操作点位置;

获取所述待处理图像中,与所述当前操作点位置对应的当前图像数据,并将获取的当前图像数据进行放大显示,所述当前操作点位置位于所述当前图像数据的中心位置;

检测与所述标注操作连续的移动操作,在移动操作过程中,获得移动后位置坐标,获取所述待处理图像中,与所述移动后位置坐标对应的移动后图像数据,并将获取的移动后图像数据进行放大显示,所述移动后位置坐标位于所述移动后图像数据的中心位置;

在标注操作结束时,将所述移动后位置坐标,确定为所述标注操作在所述待处理图像上的标注点。

在其中一个实施例中,所述获取对待处理图像的标注操作之前,还包括:

当接收到对待处理图像的标注指令时,获取所述标注指令对应的标注信息,并生成与所述标注信息对应的标注操作;所述标注信息包括标注方式、待处理图像应用场景以及标注精度。

在其中一个实施例中,所述当接收到对待处理图像的标注指令时,获取所述标注指令对应的标注信息,并生成与所述标注信息对应的标注操作,包括:

当接收到对待处理图像的标注指令时,确定所述标注指令对应的待处理图像应用场景;所述待处理图像应用场景包括但不限于保险理赔业务场景、车辆定损业务场景;

获取与所述待处理图像应用场景对应的预设标注精度;所述预设标注精度包括第一标注精度、第二标注精度和第三标注精度;所述标注精度大小按照所述第一标注精度至所述第三标注精度依次降低;

获取所述标注信息对应的标注方式;所述标注方式包括文字标注、箭头标注以及批注框标注;

根据对应的标注方式以及标注精度,生成所述待处理图像的图片标注操作。

在其中一个实施例中,在所述基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框之前,还包括:

根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型;

将各所述标注极点的坐标值输入训练后的极点校正模型中,输出修正后的各标注极点的坐标值,得到满足预设条件的目标标注极点。

在其中一个实施例中,在所述根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型之前,还包括:

获取实际场景数据,并将所述实际场景数据输入所述深度检测模型,生成预测数据;

根据预设筛选规则对所述预测数据进行筛选,获得符合所述筛选规则的模糊数据;

对所述模糊数据进行修正处理,生成训练数据。

在其中一个实施例中,所述根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型,包括:

迭代执行所述模糊数据的提取和修正,在预设周期内更新所述训练数据;

根据更新后的所述训练数据对所述深度检测模型进行微调,直至不产生所述模糊数据,得到训练后的极点校正模型。

一种目标对象标注装置,所述装置包括:

标注指令接收模块,用于在接收到标注指令时,获取对待处理图像的标注操作,所述标注操作携带在所述待处理图像上的标注点标识,获得至少四个标注点;

平面坐标系构建模块,用于设定第一坐标轴与第二坐标轴构建的平面坐标系,各所述标注点在所述平面坐标系中具有确定的坐标值;

目标对象标记框生成模块,用于基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框;

目标对象标注模块,用于采用所述目标对象标记框,对所述待处理图像进行目标对象标注。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

在接收到标注指令时,获取对待处理图像的标注操作,所述标注操作携带在所述待处理图像上的标注点标识,获得至少四个标注点;

设定第一坐标轴与第二坐标轴构建的平面坐标系,各所述标注点在所述平面坐标系中具有确定的坐标值;

基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框;

采用所述目标对象标记框,对所述待处理图像进行目标对象标注。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

在接收到标注指令时,获取对待处理图像的标注操作,所述标注操作携带在所述待处理图像上的标注点标识,获得至少四个标注点;

设定第一坐标轴与第二坐标轴构建的平面坐标系,各所述标注点在所述平面坐标系中具有确定的坐标值;

基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框;

采用所述目标对象标记框,对所述待处理图像进行目标对象标注。

上述目标对象标注方法、装置、计算机设备和存储介质,在接收到标注指令时,获取对待处理图像的标注操作,标注操作携带在待处理图像上的标注点标识,获得至少四个标注点。通过设定第一坐标轴与第二坐标轴构建的平面坐标系,各标注点在平面坐标系中具有确定的坐标值。基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框,进而通过采用目标对象标记框,可实现对待处理图像进行目标对象标注,不同于现有技术中直接选取目标的左上角以及右下角的坐标,生成物体框的方式,进一步提高了所生成的物体标记框的精确程度,可提高对目标对象进行框定和标注的准确度。

附图说明

图1为一个实施例中目标对象标注方法的流程示意图;

图2为另一个实施例中目标对象标注方法的流程示意图;

图3为一个实施例中目标对象标注装置的结构框图;

图4为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的目标对象标注方法,可以应用于用户终端。其中,用户终端在接收到用户发出标注指令时,获取对待处理图像的标注操作,标注操作携带在待处理图像上的标注点标识,获得至少四个标注点。设定第一坐标轴与第二坐标轴构建的平面坐标系,各标注点在平面坐标系中具有确定的坐标值。基于提取的满足预设条件的目标标注极点,生成目标对象标记框,并采用目标对象标记框,对待处理图像进行目标对象标注。其中,用户终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。

在一个实施例中,如图1所示,提供了一种目标对象标注方法,以该方法应用于用户终端为例进行说明,包括以下步骤:

步骤S102,在接收到标注指令时,获取对待处理图像的标注操作,标注操作携带在待处理图像上的标注点标识,获得至少四个标注点。

具体地,用户可在终端的应用程序上发出标注指令,包括鼠标点击操作以及键盘输入操作,均可实现标注指令的发送。其中,用户可通过使用鼠标点击应用程序标注界面的标注按钮,包括具体选择何种标注方式,以及待处理图像的应用场景等,或者再应用程序标注界面输入具体的标注指令,包括标注方式,应用场景以及标注结果精确度等。当终端检测到应用程序上存在用户发送的标注指令时,根据与标注指令的标注信息对应的标注操作。

其中,应用场景可包括人体标注和车辆标注,具体来说,在需要对人体图像进行标注时,可分为对人体图像上半部分,即头部进行标注,也可以针对整个人体进行标注,可将标注的人体图像应用于保险理赔业务等用户身份审核中。还可在车辆识别场景下,对图像中的车辆进行标注,获得清晰的车辆图像,可将标注的车辆图像应用于对车辆的定损业务,以及车辆保险理赔业务等。

进一步地,通过识别待处理图像上的各标注点,并获取各标注点的坐标值,各标注点的坐标值包括第一坐标值和第二坐标值,进而分别比较各标注点的第一坐标值大小或第二坐标值大小,获得符合预设条件的目标标注极点。由于标注操作携带在待处理图像上的标注点标识,而根据标注操作需要形成对应的目标对象标注框,最少需要四个标注点,则当在接收到标注指令时,获取对待处理图像的标注操作,以及标注操作携带的在待处理图像上的至少四个标注点。

步骤S104,设定第一坐标轴与第二坐标轴构建的平面坐标系,各标注点在平面坐标系具有确定的坐标值。

具体地,通过设定第一坐标轴与第二坐标轴构建的平面坐标系,并确定各标注点在平面坐标系内确定的坐标值。基于各标注点的坐标值,提取所有标注点中的四个标注极点,标注极点满足下述任一条件:标注极点在第一坐标轴的坐标值,为所有标注点在第一坐标轴的坐标值中的最小值或者最大值,或者,标注极点在第二坐标轴的坐标值,为所有标注点在第二坐标轴的坐标值中的最小值或者最大值。

进一步地,基于各标注点的坐标值,提取所有标注点中的四个标注极点具体包括:识别待处理图像上的各标注点,并获取各标注点的坐标值,其中,各标注点的坐标值包括第一坐标值和第二坐标值。通过分别比较各标注点的第一坐标值大小或第二坐标值大小,获得符合预设条件的四个标注极点。

其中,预设条件包括:标注极点在第一坐标轴的坐标值,为所有标注点在第一坐标轴的坐标值中的最小值或者最大值,或者,标注极点在第二坐标轴的坐标值,为所有标注点在第二坐标轴的坐标值中的最小值或者最大值。

在本实施例中,第一坐标轴可以是横坐标轴,第二坐标轴可以是纵坐标轴,横坐标轴用于表示待处理图像的长度,纵坐标轴用于表示待处理图像的高度,通过为横坐标轴和纵坐标轴分别设置最大值和最小值,可形成对应的取值范围。其中,选取横坐标轴和纵坐标轴形成的四个象限中的第一象限,作为图像导入区域,并可在获取到待处理图像后,将待处理图像导入第一象限。所提取的四个标注极点,分别为待处理图像上各标注点中横坐标值最大、纵坐标值最大、横坐标值最小以及纵坐标值最小对应的四个标注点。

步骤S106,基于提取的满足预设条件的目标标注极点,生成目标对象标记框。

具体地,基于所提取到的满足预设条件的目标标注极点,生成目标对象标记框具体包括以下步骤:

在标注极点在第一坐标轴的坐标值,为所有标注点在第一坐标轴的坐标值中的最小值或者最大值时,确定通过标注极点、且与第二坐标轴平行的第二坐标轴平行直线。而在标注极点在第二坐标轴的坐标值,为所有标注点在第二坐标轴的坐标值中的最小值或者最大值时,确定通过标注极点、且与第一坐标轴平行的第一坐标轴平行直线。通过确定第一坐标轴平行直线与第二坐标轴平行直线的四个交点,即可基于第一坐标轴平行直线、第二坐标轴平行直线以及四个交点,生成目标对象标记框。

其中,基于各标注点的坐标值,提取所有标注点中的四个标注极点,标注极点满足下述任一预设条件:标注极点在第一坐标轴的坐标值,为所有标注点在第一坐标轴的坐标值中的最小值或者最大值,或者,标注极点在第二坐标轴的坐标值,为所有标注点在第二坐标轴的坐标值中的最小值或者最大值。

进一步地,在本实施例中,第一坐标轴可以为横坐标轴,第二坐标轴可以为纵坐标轴。当所提取的标注极点在横坐标轴的坐标值,为所有标注点中的最大横坐标值或最小横坐标值时,确定通过该标注极点,且与纵坐标轴平行的纵坐标平行直线。而当所提取的标注极点在纵坐标轴的坐标值,为所有标注点中的最大纵坐标值或最小纵坐标值时,确定通过该标注极点,且与横坐标轴平行的横坐标轴平行直线。通过确定两条横坐标轴平行直线,以及两条纵坐标轴平行直线的四个交点,并基于横坐标轴平行直线、纵坐标轴平行直线以及确定的四个交点,生成目标对象标记框,得到的目标对象标记框可准确框定待处理图像上的目标对象,将目标对象所有的像素点均框定在目标对象标记框中。

步骤S108,采用目标对象标记框,对待处理图像进行目标对象标注。

具体地,通过采用目标对象标记框,对待处理图像上的目标对象进行标注。通过提取待处理图像上的目标对象对应的各标注极点,并基于标注极点生成目标对象标记框,则可利用获得的目标对象标记框,对待处理图像上的目标对象进行框定和标注,由于所提取的四个标注极点,包括了目标图像上第一坐标轴、第二坐标轴上的最大值和最小值对应的标注极点,则根据四个标注极点形成的目标对象标记框,可将待处理图像上的目标对象准确地框定起来。

上述目标对象标注方法中,在接收到标注指令时,获取对待处理图像的标注操作,标注操作携带在待处理图像上的标注点标识,获得至少四个标注点。通过设定第一坐标轴与第二坐标轴构建的平面坐标系,各标注点在平面坐标系中具有确定的坐标值。基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框,进而通过采用目标对象标记框,可实现对待处理图像进行目标对象标注,不同于现有技术中直接选取目标的左上角以及右下角的坐标,生成物体框的方式,进一步提高了所生成的物体标记框的精确程度,可提高对目标对象进行框定和标注的准确度。

在一个实施例中,如图2所示,提供了一种目标对象标注方法,还包括以下步骤:

步骤S202,检测到标注操作,标注操作携带当前操作点位置。

具体地,当在终端检测到标注操作时,需获取标注操作携带的当前操作点位置,可对所获得的当前操作点的位置进行放大操作,查看标注极点的显示尺寸。

步骤S204,获取待处理图像中,与当前操作点位置对应的当前图像数据,并将获取的当前图像数据进行放大显示,当前操作点位置位于当前图像数据的中心位置。

具体地,获取到标注操作携带的当前操作点位置之后,基于当前操作点位置,从待处理图像上获取与当前操作点对应饿当前图像数据,当对获取到的当前图像数据进行放大显示时,通过将用户执行的鼠标点击放大操作,改进为用户执行鼠标按压操作,当检测到鼠标按压操作时,表明需要对按压操作执行时对应的当前图像数据进行放大操作,生成按下区域的放大镜图,中心区域为鼠标按下即鼠标点击的位置。

步骤S206,检测与标注操作连续的移动操作,在移动操作过程中,获得移动后位置坐标,获取待处理图像中,与移动后位置坐标对应的移动后图像数据,并将获取的移动后图像数据进行放大显示,移动后位置坐标位于移动后图像数据的中心位置。

具体地,用户可在按压鼠标的同时进行鼠标移动操作,可通过检测与标注操作连续的移动操作,来判定用户是否执行鼠标的移动操作。在移动过程中,通过获取鼠标移动操作结束时标注点的位置,即移动后位置坐标,进而在待处理图像中获取与移动后位置对应的移动后图像,并将移动后位置坐标对应的移动后图像进行放大显示,中心位置为鼠标按压操作和移动操作,同时结束的坐标位置对应的标注点,则移动后位置坐标同样位于移动后图像数据的中心位置。

步骤S208,在标注操作结束时,将移动后位置坐标,确定为标注操作在待处理图像上的标注点。

具体地,标注操作结束后,将位于移动后图像数据的中心位置的移动后坐标,确定为标注操作在待处理图像上的标注点,标注点的显示尺寸,在标注操作结束后的原有尺寸,不随鼠标点击、按压以及松开操作相应变化,可保证标注点的标记精度。

上述目标对象标记方法中,通过获取待处理图像中,与当前操作点位置对应的当前图像数据,并将获取的当前图像数据进行放大显示,且当前操作点位置位于当前图像数据的中心位置,通过检测与标注操作连续的移动操作,并获取待处理图像中与移动后位置坐标对应的移动后图像数据,将获取的移动后图像数据进行放大显示,移动后位置坐标位于移动后图像数据的中心位置,在标注操作结束时,将移动后位置坐标,确定为标注操作在待处理图像上的标注点,得到的标注点的显示尺寸与标注操作中放大操作以及移动操作无关,避免标注点的显示尺寸过多发生变化,可提高标注点的标记精度。

在一个实施例中,在获取对待处理图像的标注操作之前,还包括:

当接收到对待处理图像的标注指令时,获取标注指令对应的标注信息,并生成与标注信息对应的标注操作;标注信息包括标注方式、待处理图像应用场景以及标注精度其中,待处理图像可以通过用户导入,或者用户输入待处理图像的存储位置,终端根据存储路径进行获取,以及当待处理图像为非本地存储的图像时,获取用户输入的在线存储路径,根据在线存储路径实时下载待处理图像。与标注指令对应的标注信息,包括标注方式、待处理图像应用场景以及标注精度。

具体地,标注方式表示在标注页面可供选择的多种标注方式,可以是目标对象标记框进行框定后,采用文字标注、箭头指向性标注或者批注框指示标注等多种标注方式。待处理图像应用场景包括:1)保险理赔业务中对待处理图像中的用户进行标注,并对所标注的用户进行身份审核;2)车辆定损业务中,识别待处理图像中的车辆,并利用目标对象标记框对车辆进行框定以及标注,等等其他场景。标注精度包括高标注精度需求以及中、低标注精度需求,针对不同待处理图像的应用场景,根据实际需求可设置相应的标注精度。上述步骤,当接收到对待处理图像的标注指令时,获取标注指令对应的标注信息,并生成与标注信息对应的标注操作,获取并执行所生成的标注操作可更好地满足用户的需求。

在一个实施例中,当接收到对待处理图像的标注指令时,获取标注指令对应的标注信息,并生成与标注信息对应的标注操作,包括以下步骤:

当接收到对待处理图像的标注指令时,确定标注指令对应的待处理图像应用场景;待处理图像应用场景包括但不限于保险理赔业务场景、车辆定损业务场景;

获取与待处理图像应用场景对应的预设标注精度;预设标注精度包括第一标注精度、第二标注精度和第三标注精度;标注精度大小按照第一标注精度至第三标注精度依次降低;

获取标注信息对应的标注方式;标注方式包括文字标注、箭头标注以及批注框标注;

根据对应的标注方式以及标注精度,生成待处理图像的图片标注操作。

具体地,应用场景可包括人体标注和车辆标注,具体来说,在需要对人体图像进行标注时,可分为对人体图像上半部分,即头部进行标注,也可以针对整个人体进行标注,可将标注的人体图像应用于保险理赔业务等用户身份审核中。还可在车辆识别场景下,对图像中的车辆进行标注,获得清晰的车辆图像,可将标注的车辆图像应用于对车辆的定损业务,以及车辆保险理赔业务等。

标注方式表示在标注页面可供选择的多种标注方式,可以是目标对象标记框进行框定后,采用文字标注、箭头指向性标注或者批注框指示标注等多种标注方式。标注精度包括第一标注精度需求以及第二标注精度、第三标注精度需求,标注精度大小按照第一标注精度至第三标注精度依次降低,可在不同待处理图像的应用场景下,根据实际需求,可设置与待处理图像应用场景对应的标注精度。

进一步地,根据标注方式以及对应的标注精度,对相应待处理图像应用场景下的待处理图像进行标注操作。

上述步骤,当接收到对待处理图像的标注指令时,确定标注指令对应的待处理图像应用场景,并获取与待处理图像应用场景对应的预设标注精度,以及标注信息对应的标注方式,根据对应的标注方式以及标注精度,生成待处理图像的图片标注操作,实现针对不同应用场景按照符合需求的标注方式,生成对应预设标注精度的图片标注操作,更好地满足用户需求。

在一个实施例中,在所述基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框之前,还包括:

获取实际场景数据,并将实际场景数据输入深度检测模型,生成预测数据;

根据预设筛选规则对预测数据进行筛选,获得符合筛选规则的模糊数据;

对模糊数据进行修正处理,生成训练数据;

根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型;

将各标注极点的坐标值输入训练后的极点校正模型中,输出修正后的各标注极点的坐标值,得到满足预设条件的目标标注极点。

具体地,通过将待处理图像应用场景下的已有实际场景数据,输入深度检测模型,得到预测数据,并利用预设筛选规则,对预测数据进行筛选,获得符合预设筛选规则的模糊数据,其中,通过利用自动程序,从预测结果中找出符合下列两种情况之一的模糊数据(如果符合条件的较多,可以先抽样其中一部分,比如1000张):第一,预测框置信度在0.5-0.7之间;第二,有两个置信度在0.7以上的预测框,交叠率(IOU)在0.3~0.5之间。

其中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,给出的是被测量参数的测量值的可信程度。置信水平是指总体参数值落在样本统计值某一区内的概率,而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

进一步地,通过对获得的模糊数据进行修正处理,生成训练数据,并根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型。将获得的将各标注极点的坐标值输入训练后的极点校正模型中,输出修正后的各标注极点的坐标值,得到满足预设条件的目标标注极点。

上述步骤,通过获取实际场景数据,并将实际场景数据输入深度检测模型,生成预测数据,根据预设筛选规则对预测数据进行筛选,获得符合筛选规则的模糊数据,进一步对模糊数据进行修正处理,生成训练数据,进而通过利用训练数据对深度检测模型进行训练,获得训练后的极点校正模型,实现对获得的各标注极点的修正,输出符合要求的目标标注极点,提高所得到的各目标标注极点的准确度。

在一个实施例中,根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型,包括:

迭代执行模糊数据的提取和修正,在预设周期内更新训练数据;

根据更新后的训练数据对深度检测模型进行微调,直至不产生模糊数据,得到训练后的极点校正模型。

上述步骤,通过重复执行模糊数据的提取和修正,实现训练数据的更新和增加,并利用更新后的训练数据,可实现深度检测模型的微调,逐步训练深度检测模型,得到训练好的极点校正模型,用于实现对获得的各标注极点的修正,输出符合要求的目标标注极点,进一步提高所得到的各目标标注极点的准确度。应该理解的是,虽然图1-2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图3所示,提供了一种目标对象标注装置,包括:标注指令接收模块302、平面坐标系构建模块304、目标对象标记框生成模块306以及目标对象标注模块308,其中:

标注指令接收模块302,用于在接收到标注指令时,获取对待处理图像的标注操作,标注操作携带在待处理图像上的标注点标识,获得至少四个标注点。

平面坐标系构建模块304,用于设定第一坐标轴与第二坐标轴构建的平面坐标系,各标注点在平面坐标系中具有确定的坐标值。

目标对象标记框生成模块306,用于基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框。

目标对象标注模块308,用于采用目标对象标记框,对待处理图像进行目标对象标注。

上述目标对象标注装置,在接收到标注指令时,在接收到标注指令时,获取对待处理图像的标注操作,标注操作携带在待处理图像上的标注点标识,获得至少四个标注点。通过设定第一坐标轴与第二坐标轴构建的平面坐标系,各标注点在平面坐标系中具有确定的坐标值。基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框,进而通过采用目标对象标记框,可实现对待处理图像进行目标对象标注,不同于现有技术中直接选取目标的左上角以及右下角的坐标,生成物体框的方式,进一步提高了所生成的物体标记框的精确程度,可提高对目标对象进行框定和标注的准确度。

在一个实施例中,提供了一种目标对象标注装置,还包括标注极点放大模块,用于:

检测到标注操作,标注操作携带当前操作点位置;获取待处理图像中,与当前操作点位置对应的当前图像数据,并将获取的当前图像数据进行放大显示,当前操作点位置位于当前图像数据的中心位置;检测与标注操作连续的移动操作,在移动操作过程中,获得移动后位置坐标,获取待处理图像中,与移动后位置坐标对应的移动后图像数据,并将获取的移动后图像数据进行放大显示,移动后位置坐标位于移动后图像数据的中心位置;在标注操作结束时,将移动后位置坐标,确定为标注操作在待处理图像上的标注点。

上述目标对象标注装置,通过获取待处理图像中,与当前操作点位置对应的当前图像数据,并将获取的当前图像数据进行放大显示,且当前操作点位置位于当前图像数据的中心位置,通过检测与标注操作连续的移动操作,并获取待处理图像中与移动后位置坐标对应的移动后图像数据,将获取的移动后图像数据进行放大显示,移动后位置坐标位于移动后图像数据的中心位置,在标注操作结束时,将移动后位置坐标,确定为标注操作在待处理图像上的标注点,得到的标注点的显示尺寸与标注操作中放大操作以及移动操作无关,避免标注点的显示尺寸过多发生变化,可提高标注点的标记精度。

在一个实施例中,提供了一种目标对象标注装置,还包括标注操作生成模块,用于:

当接收到对待处理图像的标注指令时,获取标注指令对应的标注信息,并生成与标注信息对应的标注操作;标注信息包括标注方式、待处理图像应用场景以及标注精度。

上述目标对象标注装置中,当接收到对待处理图像的标注指令时,获取标注指令对应的标注信息,并生成与标注信息对应的标注操作,获取并执行所生成的标注操作可更好地满足用户的需求。

在一个实施例中,标注操作生成模块,还用于:

当接收到对待处理图像的标注指令时,确定所述标注指令对应的待处理图像应用场景;所述待处理图像应用场景包括但不限于保险理赔业务场景、车辆定损业务场景;

获取与所述待处理图像应用场景对应的预设标注精度;所述预设标注精度包括第一标注精度、第二标注精度和第三标注精度;所述标注精度大小按照所述第一标注精度至所述第三标注精度依次降低;

获取所述标注信息对应的标注方式;所述标注方式包括文字标注、箭头标注以及批注框标注;

根据对应的标注方式以及标注精度,生成所述待处理图像的图片标注操作。

上述标注操作生成模块,当接收到对待处理图像的标注指令时,确定标注指令对应的待处理图像应用场景,并获取与待处理图像应用场景对应的预设标注精度,以及标注信息对应的标注方式,根据对应的标注方式以及标注精度,生成待处理图像的图片标注操作,实现针对不同应用场景按照符合需求的标注方式,生成对应预设标注精度的图片标注操作,更好地满足用户需求。

在一个实施例中,提供了一种目标对象标注装置,还包括:

目标标注极点获取模块,用于:

根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型;将各所述标注极点的坐标值输入训练后的极点校正模型中,输出修正后的各标注极点的坐标值,得到满足预设条件的目标标注极点。

上述目标标注极点获取模块,通过利用训练数据对深度学习模型进行训练,得到训练后的极点校正模型,并将各所述标注极点的坐标值输入训练后的极点校正模型中,输出修正后的各标注极点的坐标值,得到满足预设条件的目标标注极点,实现针对各标注极点的修正,进一步提高根据目标标注极点所生成的目标对象标记框的准确度。

在一个实施例中,提供了一种目标对象标注装置,还包括:

训练数据生成模块,用于:

获取实际场景数据,并将所述实际场景数据输入所述深度检测模型,生成预测数据;根据预设筛选规则对所述预测数据进行筛选,获得符合所述筛选规则的模糊数据;对所述模糊数据进行修正处理,生成训练数据。

上述训练数据生成模块,通过获取实际场景数据,并将所述实际场景数据输入所述深度检测模型,生成预测数据,进而根据预设筛选规则对所述预测数据进行筛选,获得符合所述筛选规则的模糊数据,并对所述模糊数据进行修正处理,生成训练数据,可更好地根据训练数据进行训练得到极点校正模型。

在一个实施例中,提供了一种目标对象标注装置,还包括:

极点校正模型生成模块,用于:

迭代执行所述模糊数据的提取和修正,在预设周期内更新所述训练数据;根据更新后的所述训练数据对所述深度检测模型进行微调,直至不产生所述模糊数据,得到训练后的极点校正模型。

上述极点校正模型生成模块,通过重复执行模糊数据的提取和修正,实现训练数据的更新和增加,并利用更新后的训练数据,可实现深度检测模型的微调,逐步训练深度检测模型,得到训练好的极点校正模型,用于实现对获得的各标注极点的修正,输出符合要求的目标标注极点,进一步提高所得到的各目标标注极点的准确度。

关于目标对象标注装置的具体限定可以参见上文中对于目标对象标注方法的限定,在此不再赘述。上述目标对象标注装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标对象标注方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

在接收到标注指令时,获取对待处理图像的标注操作,所述标注操作携带在所述待处理图像上的标注点标识,获得至少四个标注点;

设定第一坐标轴与第二坐标轴构建的平面坐标系,各所述标注点在所述平面坐标系中具有确定的坐标值;

基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框;

采用所述目标对象标记框,对所述待处理图像进行目标对象标注。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

检测到标注操作,标注操作携带当前操作点位置;

获取待处理图像中,与当前操作点位置对应的当前图像数据,并将获取的当前图像数据进行放大显示,当前操作点位置位于当前图像数据的中心位置;

检测与标注操作连续的移动操作,在移动操作过程中,获得移动后位置坐标,获取待处理图像中,与移动后位置坐标对应的移动后图像数据,并将获取的移动后图像数据进行放大显示,移动后位置坐标位于移动后图像数据的中心位置;

在标注操作结束时,将移动后位置坐标,确定为标注操作在待处理图像上的标注点。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

当接收到对待处理图像的标注指令时,获取所述标注指令对应的标注信息,并生成与所述标注信息对应的标注操作;所述标注信息包括标注方式、待处理图像应用场景以及标注精度。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

当接收到对待处理图像的标注指令时,确定所述标注指令对应的待处理图像应用场景;所述待处理图像应用场景包括但不限于保险理赔业务场景、车辆定损业务场景;

获取与所述待处理图像应用场景对应的预设标注精度;所述预设标注精度包括第一标注精度、第二标注精度和第三标注精度;所述标注精度大小按照所述第一标注精度至所述第三标注精度依次降低;

获取所述标注信息对应的标注方式;所述标注方式包括文字标注、箭头标注以及批注框标注;

根据对应的标注方式以及标注精度,生成所述待处理图像的图片标注操作。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型;

将各所述标注极点的坐标值输入训练后的极点校正模型中,输出修正后的各标注极点的坐标值,得到满足预设条件的目标标注极点。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取实际场景数据,并将所述实际场景数据输入所述深度检测模型,生成预测数据;

根据预设筛选规则对所述预测数据进行筛选,获得符合所述筛选规则的模糊数据;

对所述模糊数据进行修正处理,生成训练数据。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

迭代执行所述模糊数据的提取和修正,在预设周期内更新所述训练数据;

根据更新后的所述训练数据对所述深度检测模型进行微调,直至不产生所述模糊数据,得到训练后的极点校正模型。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

在接收到标注指令时,获取对待处理图像的标注操作,所述标注操作携带在所述待处理图像上的标注点标识,获得至少四个标注点;

设定第一坐标轴与第二坐标轴构建的平面坐标系,各所述标注点在所述平面坐标系中具有确定的坐标值;

基于提取的满足预设条件的目标标注极点,依次连接生成目标对象标记框;

采用所述目标对象标记框,对所述待处理图像进行目标对象标注。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

检测到标注操作,标注操作携带当前操作点位置;

获取待处理图像中,与当前操作点位置对应的当前图像数据,并将获取的当前图像数据进行放大显示,当前操作点位置位于当前图像数据的中心位置;

检测与标注操作连续的移动操作,在移动操作过程中,获得移动后位置坐标,获取待处理图像中,与移动后位置坐标对应的移动后图像数据,并将获取的移动后图像数据进行放大显示,移动后位置坐标位于移动后图像数据的中心位置;

在标注操作结束时,将移动后位置坐标,确定为标注操作在待处理图像上的标注点。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

当接收到对待处理图像的标注指令时,获取所述标注指令对应的标注信息,并生成与所述标注信息对应的标注操作;所述标注信息包括标注方式、待处理图像应用场景以及标注精度。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

当接收到对待处理图像的标注指令时,确定所述标注指令对应的待处理图像应用场景;所述待处理图像应用场景包括但不限于保险理赔业务场景、车辆定损业务场景;

获取与所述待处理图像应用场景对应的预设标注精度;所述预设标注精度包括第一标注精度、第二标注精度和第三标注精度;所述标注精度大小按照所述第一标注精度至所述第三标注精度依次降低;

获取所述标注信息对应的标注方式;所述标注方式包括文字标注、箭头标注以及批注框标注;

根据对应的标注方式以及标注精度,生成所述待处理图像的图片标注操作。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据训练数据对深度学习模型进行训练,得到训练后的极点校正模型;

将各所述标注极点的坐标值输入训练后的极点校正模型中,输出修正后的各标注极点的坐标值,得到满足预设条件的目标标注极点。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取实际场景数据,并将所述实际场景数据输入所述深度检测模型,生成预测数据;

根据预设筛选规则对所述预测数据进行筛选,获得符合所述筛选规则的模糊数据;

对所述模糊数据进行修正处理,生成训练数据。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

迭代执行所述模糊数据的提取和修正,在预设周期内更新所述训练数据;

根据更新后的所述训练数据对所述深度检测模型进行微调,直至不产生所述模糊数据,得到训练后的极点校正模型。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

19页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于FPGA的二值神经网络车牌识别方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!