基于机器人的夹具组的控制方法及装置

文档序号:551886 发布日期:2021-05-14 浏览:1次 >En<

阅读说明:本技术 基于机器人的夹具组的控制方法及装置 (Robot-based control method and device for clamp group ) 是由 段文杰 夏冬青 丁有爽 邵天兰 于 2021-02-05 设计创作,主要内容包括:本发明公开了一种基于机器人的夹具组的控制方法及装置,方法包括:沿预设深度方向获取与三维物品区域相对应的二维彩色图以及对应于二维彩色图的深度图;将二维彩色图以及深度图输入深度学习模型,根据输出结果预测二维彩色图中包含的可抓取区域;根据可抓取区域的轮廓线确定可抓取区域的几何特征,根据几何特征确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识;控制机器人调用夹具组中包含的与夹具标识相对应的各个夹具执行抓取操作。该方式根据可抓取区域的轮廓线确定可抓取区域的几何特征,从而确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。通过几何特征确定夹具数量以及夹具标识的方式能够显著提升夹具抓取的可靠性。(The invention discloses a robot-based control method and a robot-based control device for a clamp group, wherein the method comprises the following steps: acquiring a two-dimensional color image corresponding to the three-dimensional object area and a depth image corresponding to the two-dimensional color image along a preset depth direction; inputting the two-dimensional color image and the depth image into a depth learning model, and predicting a graspable area contained in the two-dimensional color image according to an output result; determining the geometric characteristics of the grippable region according to the contour line of the grippable region, and determining the number of the clamps corresponding to the grippable region and the clamp identification of each clamp according to the geometric characteristics; and controlling the robot to call each clamp corresponding to the clamp identification in the clamp group to execute the grabbing operation. The method determines the geometric characteristics of the graspable region according to the contour line of the graspable region, thereby determining the number of jigs corresponding to the graspable region and the jig identification of each jig. The reliability of clamp grabbing can be remarkably improved by determining the number of the clamps and the identification of the clamps through the geometric characteristics.)

基于机器人的夹具组的控制方法及装置

技术领域

本发明涉及机械手控制技术领域,具体涉及一种基于智能程控机器人的夹具组的控制方法及装置。

背景技术

目前,随着智能程控机器人的广泛普及,越来越多的物品能够借助智能程控机器人实现抓取以及运输操作。例如,物流包装能够通过智能程控机器人进行抓取,从而大幅提升抓取效率。为了提升抓取效率,也为了能够灵活适配多种物品对象,智能程控机器人通常会安装由多个夹具构成的夹具组,以便根据不同的物品对象灵活调用夹具组中的不同夹具。

但是,常规的智能机器人只能用于抓取已知的物品对象。例如,在预先知晓物品对象的放置位置、尺寸、类型等特征时,通过与尺寸和类型相匹配的夹具进行针对性抓取。然而,对于未知的任意物品而言,由于无法预先确定该物品的形状以及位置等信息,则无法准确抓取,更无法预先判断该调用哪些夹具进行抓取。

发明内容

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于机器人的夹具组的控制方法及装置。

根据本发明的一个方面,提供了一种基于机器人的夹具组的控制方法,包括:

沿预设深度方向获取与三维物品区域相对应的二维彩色图以及对应于所述二维彩色图的深度图;

将所述二维彩色图以及所述深度图输入深度学习模型,根据输出结果预测所述二维彩色图中包含的可抓取区域;

根据所述可抓取区域的轮廓线确定所述可抓取区域的几何特征,根据所述可抓取区域的几何特征确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识;

控制机器人调用夹具组中包含的与所述夹具标识相对应的各个夹具执行抓取操作。

可选的,所述根据所述可抓取区域的轮廓线确定所述可抓取区域的几何特征包括:

根据所述可抓取区域的轮廓线,绘制所述可抓取区域的最大内接圆、最小内接圆、最大内接矩形和/或最小内接矩形。

可选的,所述根据所述可抓取区域的几何特征确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识包括:

获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的主轴长度;

将所述半径与第一半径阈值进行比较,和/或将所述主轴长度与主轴阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述根据所述可抓取区域的几何特征确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识包括:

获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的最大内接矩形的长度;

将所述半径与第二半径阈值进行比较,和/或将所述最大内接矩形的长度与第一长度阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述根据所述可抓取区域的几何特征确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识包括:

获取可抓取区域的最大内接矩形的宽度,和/或获取可抓取区域的最大内接矩形的长度;

将所述宽度与宽度阈值进行比较,和/或将所述最大内接矩形的长度与第二长度阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述控制机器人调用夹具组中包含的与所述夹具标识相对应的各个夹具执行抓取操作包括:

获取相机坐标系与机器人坐标系之间的转换关系,根据所述转换关系,将对应于相机坐标系的可抓取区域的位置信息转换到机器人坐标系中,向机器人输出转换后的各个可抓取对象的位置信息以及夹具标识。

可选的,所述夹具组包括:多个吸盘式夹具。

根据本发明的又一个方面,还提供了一种基于机器人的夹具组的控制装置,包括:

获取模块,适于沿预设深度方向获取与三维物品区域相对应的二维彩色图以及对应于所述二维彩色图的深度图;

预测模块,适于将所述二维彩色图以及所述深度图输入深度学习模型,根据输出结果预测所述二维彩色图中包含的可抓取区域;

确定模块,适于根据所述可抓取区域的轮廓线确定所述可抓取区域的几何特征,根据所述可抓取区域的几何特征确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识;

控制模块,适于控制机器人调用夹具组中包含的与所述夹具标识相对应的各个夹具执行抓取操作。

可选的,所述确定模块具体适于:

根据所述可抓取区域的轮廓线,绘制所述可抓取区域的最大内接圆、最小内接圆、最大内接矩形和/或最小内接矩形。

可选的,所述确定模块具体适于:

获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的主轴长度;

将所述半径与第一半径阈值进行比较,和/或将所述主轴长度与主轴阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述确定模块具体适于:

获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的最大内接矩形的长度;

将所述半径与第二半径阈值进行比较,和/或将所述最大内接矩形的长度与第一长度阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述确定模块具体适于:

获取可抓取区域的最大内接矩形的宽度,和/或获取可抓取区域的最大内接矩形的长度;

将所述宽度与宽度阈值进行比较,和/或将所述最大内接矩形的长度与第二长度阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述控制模块具体适于:

获取相机坐标系与机器人坐标系之间的转换关系,根据所述转换关系,将对应于相机坐标系的可抓取区域的位置信息转换到机器人坐标系中,向机器人输出转换后的各个可抓取对象的位置信息以及夹具标识。

可选的,所述夹具组包括:多个吸盘式夹具。

根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述基于机器人的夹具组的控制方法对应的操作。

根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述基于机器人的夹具组的控制方法对应的操作。

在本发明所提供的基于机器人的夹具组的控制方法及装置中,能够沿预设深度方向获取与三维物品区域相对应的二维彩色图以及对应于所述二维彩色图的深度图,并通过深度学习模型预测二维彩色图中包含的可抓取区域;根据可抓取区域的轮廓线确定可抓取区域的几何特征,根据可抓取区域的几何特征确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识,从而控制机器人调用夹具组中包含的与夹具标识相对应的各个夹具执行抓取操作。由此可见,在本发明中,一方面,能够借助深度学习模型预测出可抓取区域的形状和位置;另一方面,能够根据可抓取区域的轮廓线确定可抓取区域的几何特征,从而确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。通过几何特征确定夹具数量以及夹具标识的方式能够显著提升夹具抓取的可靠性。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的

具体实施方式

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的基于机器人的夹具组的控制方法的流程示意图;

图2示出了根据本发明另一个实施例的基于机器人的夹具组的控制方法的流程示意图;

图3示出了根据本发明又一个实施例的基于机器人的夹具组的控制装置的结构示意图;

图4示出了根据本发明的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的基于机器人的夹具组的控制方法的流程示意图,其中,机器人可以为智能程控机器人,如图1所示,该方法包括:

步骤S110:沿预设深度方向获取与三维物品区域相对应的二维彩色图以及对应于二维彩色图的深度图。

其中,预设深度方向可以根据实际业务场景灵活设定,具体的,预设深度方向包括以下中的至少一个:相机拍照方向、重力方向以及物品承载面的垂直线所在的方向。

在一种实现方式中,预设深度方向为:相机拍照时所沿的深度方向,也叫相机拍照方向。具体的,相机的摄像头产生的光线从第一方位出发,并向第二方位延伸,则预设深度方向为从第一方位指向第二方位的方向。例如,当相机的摄像头从上往下拍照时,预设深度方向则为从上往下的方向;当相机的摄像头从左往右拍照时,预设深度方向则为从左往右的方向。例如,若通过一台相机进行拍照,则预设深度方向为:由相机指向物品区域的方向。又如,若通过两台相机进行拍照,则预设深度方向为:由两台相机的中点位置指向物品区域的方向。当然,对于多台相机的场景与之类似,可以根据多台相机的中心位置指向物品区域的方向设置预设深度方向,本发明对具体细节不作限定。

在又一种实现方式中,预设深度方向为:物品承载面的垂直线所在的方向,即:垂直于物品承载面的方向。具体的,考虑到相机的拍摄角度可以灵活设定,例如,相机的拍摄角度可能与物品放置方向之间呈现一定角度,即:相机呈倾斜状态。因此,为了准确描述,预设深度方向还可以是垂直于物品承载面的方向,具体实施时,该预设深度方向可以为任意方向,例如,既可以是竖直方向,也可以是某一倾斜方向,本发明对其不作限定。

其中,物品承载面是指:用于放置三维物品的载体所在的平面。例如,当三维物品放置于地面上时,地面即为用于放置三维物品的载体,相应的,物品承载面即为地面所在的平面;又如,当三维物品放置于托盘、传送带、或物料筐等部件上时,该托盘、传送带、或物料筐等部件即为用于放置三维物品的载体,相应的,物品承载面即为该托盘、传送带、或物料筐所在的平面。在特定场景中,托盘、传送带、或物料筐等载体可能是倾斜设置的,例如,为了便于装卸,传送带所在的平面可能与水平面之间呈预设角度,相应的,预设深度方向垂直于传送带所在的平面,因而也与竖直方向之间呈预设角度,本发明对具体实现细节不作限定。

另外,预设深度方向还可以为重力方向。例如,当物品承载面与水平面一致时,预设深度方向即为重力方向。

例如,在一个具体示例中,预设深度方向是指:相机拍照时所沿的深度方向,也叫拍照方向。具体的,相机的摄像头产生的光线从第一方位出发,并向第二方位延伸,则预设深度方向为从第一方位指向第二方位的方向。例如,当相机的摄像头从上往下拍照时,预设深度方向则为从上往下的方向;当相机的摄像头从左往右拍照时,预设深度方向则为从左往右的方向。另外,三维物品区域是指:堆叠有多个物品的三维区域。由于本实施例中的多个物品之间往往存在堆叠现象,仅通过平面图像无法准确描述物品间的方位关系,因而通过三维物品区域进行描述。

具体实施时,通过3D相机获取与三维物品区域相对应的二维彩色图以及对应于二维彩色图的深度图。其中,二维彩色图对应于与预设深度方向垂直的平面区域的图像;对应于二维彩色图的深度图中的各个像素点与二维彩色图中的各个像素点一一对应,且各个像素点的取值为该像素点的深度值。其中,深度值根据物品距离相机摄像头的远近确定。例如,当相机从上向下拍摄时,二维彩色图对应于俯视平面图,而深度图则用于表示各个物品距离相机的远近。

由此可见,通过二维彩色图以及对应于二维彩色图的深度图能够从三维立体角度准确描述物品之间的方位关系。

步骤S120:将二维彩色图以及深度图输入深度学习模型,根据输出结果预测二维彩色图中包含的可抓取区域。

其中,深度学习模型通过预先生成的多个训练样本训练得到。具体的,深度学习模型通过学习训练样本,能够基于二维彩色图以及深度图预测二维彩色图中包含的一个或多个可抓取区域。具体实施时,可以预先对多个训练样本中包含的可抓取区域进行标注,相应的,基于标注后的深度学习模型预测二维彩色图中包含的可抓取区域。其中,深度学习模型可以为各种类型的机器学习模型,本发明对具体细节不作限定。

步骤S130:根据可抓取区域的轮廓线确定可抓取区域的几何特征,根据可抓取区域的几何特征确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。

具体的,根据可抓取区域的轮廓线能够确定可抓取区域的几何特征,该几何特征用于表示可抓取区域的几何形状,如圆形、椭圆形、矩形、梯形等各类形状。相应的,根据可抓取区域的几何特征确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。例如,对于圆形可抓取区域而言,对应于可抓取区域的夹具用于针对圆心位置进行抓取;对于矩形可抓取区域而言,对应于可抓取区域的夹具用于针对矩形的长边位置进行抓取。总之,根据几何特征确定夹具的方式有助于确保夹具数量与几何特征相匹配,从而提升抓取效果。

步骤S140:控制机器人调用夹具组中包含的与夹具标识相对应的各个夹具执行抓取操作。

具体的,向机器人输出夹具控制指令,在夹具控制指令中包含至少一个夹具标识,以使机器人调用夹具组中包含的与夹具标识相对应的至少一个夹具执行抓取操作。

其中,本实施例中的夹具包括多种类型,例如,包括各类通用夹具,通用夹具是指结构已经标准化,且有较大适用范围的夹具,例如,车床用的三爪卡盘和四爪卡盘,铣床用的平口钳及分度头等。又如,按夹具所用夹紧动力源,可将夹具分为手动夹紧夹具、气动夹紧夹具、液压夹紧夹具、气液联动夹紧夹具、电磁夹具、真空夹具等。本发明不限定夹具的具体类型,只要能够实现物品抓取操作即可。

由此可见,在本发明中,一方面,能够借助深度学习模型预测出可抓取区域的形状和位置;另一方面,能够根据可抓取区域的轮廓线确定可抓取区域的几何特征,从而确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。通过几何特征确定夹具数量以及夹具标识的方式能够显著提升夹具抓取的可靠性。

图2示出了根据本发明另一个实施例的基于机器人的夹具组的控制方法的流程示意图。如图2所示,该方法包括:

步骤S200:通过预先采集的与三维样本区域相对应的样本图像,训练深度学习模型。

具体的,深度学习模型通过以下方式训练得到:

首先,采集与三维样本区域相对应的样本图像,确定样本图像中包含的多个物品对象。其中,三维样本区域中包含多个作为样本的待抓取物品。与三维样本区域相对应的样本图像包括:沿预设深度方向获取的与三维样本区域相对应的二维彩色图以及对应于该二维彩色图的深度图。具体获取方式可参照步骤S110中的相应描述,此次不再赘述。其中,在确定样本图像中包含的多个物品对象时,可通过实例分割的方式识别各个物品之间的轮廓、边界线等信息,进而根据识别结果分割出样本图像中包含的多个物品对象。

然后,根据多个物品对象之间的位置关系,对样本图像中包含的可抓取区域以及不可抓取区域分别进行标注。由于本实施例中的多个物品对象之间存在堆叠现象,因此,被堆放在下方的物品对象可能不易抓取,因而需要标注出可抓取的物品对象对应的区域以及不可抓取的物品对象对应的区域。具体的,在根据多个物品对象之间的位置关系,对样本图像中包含的可抓取区域以及不可抓取区域分别进行标注时,可通过以下实现方式中的至少一种实现:

在一种可选的实现方式中,确定各个物品对象沿预设深度方向的堆叠次序,将位于顶层的物品对象所对应的区域标注为可抓取区域,将位于底层的物品对象所对应的区域标注为不可抓取区域。常规的实例分割算法对场景中物品是否可抓没有区分,即:对场景中全部的物品都需要给出完整准确的实例掩码。因此,若直接将传统的实例分割算法应用于可抓取区域的识别,会造成位于底层的被压物品被识别为可抓取物品或将背景无关物品识别为可抓取物品,进而造成识别错误。为了防止上述问题,在该实现方式中,确定各个物品对象沿预设深度方向的堆叠次序,从而将位于顶层的物品对象所对应的区域标注为可抓取区域,将位于底层的物品对象所对应的区域标注为不可抓取区域,从而避免机器人抓取底层物品所导致的异常。例如,在纸箱拆垛场景中,需要由最上层至最下层逐层拆垛,不可在一层纸箱未被完全抓取的情况下抓取下层纸箱。因此,在类似场景中,仅标注最上层的纸箱为可抓取对象,除此之外的其余纸箱都标注为不可抓取对象。通过该标注方式能够准确区分最上层与非最上层的物品,进而给出准确的像素级物品定位。

在又一种可选的实现方式中,根据各个物品对象的暴露比例,将暴露比例大于预设阈值的物品对象所对应的区域标注为可抓取区域,将暴露比例不大于预设阈值的物品对象所对应的区域标注为不可抓取区域。在一些场景中,物品之间的相互堆叠关系不容易确定,且同层物品之间可能存在相互压叠的情况,此时,难以准确标注顶层物品。例如,在商超货品拣选场景中,货品之间的上下层关系并不明确,同时同一层物品之间还存在压叠情况,因此,对于抓取顺序的要求并不严格,而对于可抓取物品以及不可抓取物品之间的区分较为严格。此时,对于表面暴露较少的物品,或者抓取后可能造成场景内其他物品飞出的物品,则不应将其标注为可抓取物品。相应的,在上述场景中,可以设定一个标注阈值,如85%。若物品暴露的表面积大于85%,则标注为可抓取物品;若物品暴露的表面积不大于85%,则标注为不可抓取物品。当然,物品的暴露比例除通过暴露表面积进行量化外,也可以通过暴露体积进行量化,本发明对具体细节不作限定。

在再一种可选的实现方式中,根据各个物品对象的形状和/或类型确定各个物品对象中包含的接触区域,将接触区域未受到遮挡的物品对象所对应的区域标注为可抓取区域,将接触区域受到遮挡的物品对象所对应的区域标注为不可抓取区域。其中,接触区域是指物品对象中便于抓取的受力区域。例如,对于金属零件类的物品而言,为了防止零件损坏,需要抓取金属零件中的特定区域,该特定区域即为接触区域,通常是金属零件中较为牢固且不易脱落的区域。因此,在标注该类物品时,还需要判断接触区域是否完整暴露且无遮挡。若该类物品虽暴露表面积较大,但接触区域受到遮挡,则仍将其标注为不可抓取物品。

上述的几种标注方式既可以单独使用,也可以结合使用,本发明对此不作限定。

最后,根据标注后的样本图像训练深度学习模型。为了提升模型效果效果,样本数量越大,训练效果越好,为了防止因样本量少而导致的训练效果不佳的问题,在本实施例中,通过对样本数据应用倍增方式,增加训练样本的数量,以达到训练深度学习模型的目标。其中,为了实现数据倍增的效果,可以采用多种方式。具体的,可以将标注后的样本图像作为原始训练集,通过亮度对比度调节方式、图片仿射变换方式和/或图片白平衡随机变换方式,对原始训练集进行扩充处理,通过扩充后得到的扩充训练集训练深度学习模型。通过扩充处理方式,能够增加样本数量,提升训练效果。

步骤S210:沿预设深度方向获取与三维物品区域相对应的二维彩色图以及对应于二维彩色图的深度图。

其中,预设深度方向可以根据实际业务场景灵活设定,具体的,预设深度方向包括以下中的至少一个:相机拍照方向、重力方向以及物品承载面的垂直线所在的方向。

在一种实现方式中,预设深度方向为:相机拍照时所沿的深度方向,也叫相机拍照方向。具体的,相机的摄像头产生的光线从第一方位出发,并向第二方位延伸,则预设深度方向为从第一方位指向第二方位的方向。例如,当相机的摄像头从上往下拍照时,预设深度方向则为从上往下的方向;当相机的摄像头从左往右拍照时,预设深度方向则为从左往右的方向。例如,若通过一台相机进行拍照,则预设深度方向为:由相机指向物品区域的方向。又如,若通过两台相机进行拍照,则预设深度方向为:由两台相机的中点位置指向物品区域的方向。当然,对于多台相机的场景与之类似,可以根据多台相机的中心位置指向物品区域的方向设置预设深度方向,本发明对具体细节不作限定。

在又一种实现方式中,预设深度方向为:物品承载面的垂直线所在的方向,即:垂直于物品承载面的方向。具体的,考虑到相机的拍摄角度可以灵活设定,例如,相机的拍摄角度可能与物品放置方向之间呈现一定角度,即:相机呈倾斜状态。因此,为了准确描述,预设深度方向还可以是垂直于物品承载面的方向,具体实施时,该预设深度方向可以为任意方向,例如,既可以是竖直方向,也可以是某一倾斜方向,本发明对其不作限定。

其中,物品承载面是指:用于放置三维物品的载体所在的平面。例如,当三维物品放置于地面上时,地面即为用于放置三维物品的载体,相应的,物品承载面即为地面所在的平面;又如,当三维物品放置于托盘、传送带、或物料筐等部件上时,该托盘、传送带、或物料筐等部件即为用于放置三维物品的载体,相应的,物品承载面即为该托盘、传送带、或物料筐所在的平面。在特定场景中,托盘、传送带、或物料筐等载体可能是倾斜设置的,例如,为了便于装卸,传送带所在的平面可能与水平面之间呈预设角度,相应的,预设深度方向垂直于传送带所在的平面,因而也与竖直方向之间呈预设角度,本发明对具体实现细节不作限定。

另外,预设深度方向还可以为重力方向。例如,当物品承载面与水平面一致时,预设深度方向即为重力方向。

例如,在一个具体示例中,预设深度方向是指:相机拍照时所沿的深度方向,也叫拍照方向。具体的,相机的摄像头产生的光线从第一方位出发,并向第二方位延伸,则预设深度方向为从第一方位指向第二方位的方向。例如,当相机的摄像头从上往下拍照时,预设深度方向则为从上往下的方向;当相机的摄像头从左往右拍照时,预设深度方向则为从左往右的方向。另外,三维物品区域是指:堆叠有多个物品的三维区域。由于本实施例中的多个物品之间往往存在堆叠现象,仅通过平面图像无法准确描述物品间的方位关系,因而通过三维物品区域进行描述。

具体实施时,通过3D相机获取与三维物品区域相对应的二维彩色图以及对应于二维彩色图的深度图。其中,二维彩色图对应于与预设深度方向垂直的平面区域的图像;对应于二维彩色图的深度图中的各个像素点与二维彩色图中的各个像素点一一对应,且各个像素点的取值为该像素点的深度值。其中,深度值根据物品距离相机摄像头的远近确定。例如,当相机从上向下拍摄时,二维彩色图对应于俯视平面图,而深度图则用于表示各个物品距离相机的远近。由此可见,通过二维彩色图以及对应于二维彩色图的深度图能够从三维立体角度准确描述物品之间的方位关系。

步骤S220:将二维彩色图以及深度图输入上述的深度学习模型,根据输出结果预测二维彩色图中包含的可抓取区域。

由于深度学习模型根据标注了可抓取区域以及不可抓取区域的样本生成,因此,通过该模型能够预测二维彩色图中包含的可抓取区域。具体的,将二维彩色图以及深度图输入上述的深度学习模型后,模型将输出二维彩色图中包含的可抓取区域以及不可抓取区域,其中,可抓取区域对应于可抓取对象。

具体实施时,模型在输出与各个像素区域相对应的预测结果时,可通过多种方式表示该预测结果。例如,在一种表示方式中,预测结果包括:可抓取以及不可抓取两种状态。又如,在又一种表示方式中,预测结果可以为各个像素区域的抓取点预测概率:当输入二维彩色图和相应的深度图后,深度学习模型预测出图像2D空间中,各个像素点上能用吸盘或其他抓取工具成功将物体抓取起来的2D概率图,图中的每一个像素的值,都表示模型所预测的“控制吸盘运动至此点,能成功将一个物体从框中捡出的概率”。由此可见,在后一种方式中,预测结果能够精确到各个像素点所对应的可抓取概率。可抓取概率越大,说明从对应的像素点执行抓取操作的成功率越大;可抓取概率越小,说明从对应的像素点执行抓取操作的成功率越小。

步骤S230:根据可抓取区域的轮廓线确定可抓取区域的几何特征,根据可抓取区域的几何特征确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。

具体的,根据可抓取区域的轮廓线能够确定可抓取区域的几何特征,该几何特征用于表示可抓取区域的几何形状,如圆形、椭圆形、矩形、梯形等各类形状。相应的,根据可抓取区域的几何特征确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。例如,对于圆形可抓取区域而言,对应于可抓取区域的夹具用于针对圆心位置进行抓取;对于矩形可抓取区域而言,对应于可抓取区域的夹具用于针对矩形的长边位置进行抓取。总之,根据几何特征确定夹具的方式有助于确保夹具数量与几何特征相匹配,从而提升抓取效果。

具体实施时,根据可抓取区域的轮廓线,绘制可抓取区域的最大内接圆、最小内接圆、最大内接矩形和/或最小内接矩形,进而根据最大内接圆、最小内接圆、最大内接矩形和/或最小内接矩形确定可抓取区域的形状特征,进而分配与形状特征相匹配的夹具进行抓取。

在一种可选的实现方式中,获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的主轴长度;将半径与第一半径阈值进行比较,和/或将主轴长度与主轴阈值进行比较,根据比较结果确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。其中,可抓取区域的最大内接圆的半径用于反映可抓取区域在较窄的方向上的长度,可抓取区域的主轴长度用于反映可抓取区域在较长的方向上的长度。具体实施时,预先将夹具组中包含的各个夹具划分为多种组合,如四种组合。当可抓取区域的最大内接圆的半径大于第一半径阈值,且主轴长度大于主轴阈值时,说明可抓取区域的形状又宽又长,因而采用第一种组合方式中包含的夹具进行抓取,该第一种组合方式中包含的夹具数量较多;当可抓取区域的最大内接圆的半径大于第一半径阈值,且主轴长度小于主轴阈值时,采用第二种组合方式中包含的夹具进行抓取;当可抓取区域的最大内接圆的半径小于第一半径阈值,且主轴长度大于主轴阈值时,采用第三种组合方式中包含的夹具进行抓取,说明可抓取区域的形状又细又长,该第三种组合方式中包含的夹具形状也较为狭长;当可抓取区域的最大内接圆的半径小于第一半径阈值,且主轴长度小于主轴阈值时,说明可抓取区域的形状又窄又短,因而采用第四种组合方式中包含的夹具进行抓取,该第四种组合方式中包含的夹具数量较少。

在又一种可选的实现方式中,获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的最大内接矩形的长度;将半径与第二半径阈值进行比较,和/或将最大内接矩形的长度与第一长度阈值进行比较,根据比较结果确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。其中,可抓取区域的最大内接矩形的长度也能够反映可抓取区域的整体长度。与前一种实现方式类似,也可以预先将夹具组中包含的各个夹具划分为多种组合,如四种组合。当可抓取区域的最大内接圆的半径大于第二半径阈值,且最大内接矩形的长度大于第一长度阈值时,说明可抓取区域的形状又宽又长,因而采用第一种组合方式中包含的夹具进行抓取,该第一种组合方式中包含的夹具数量较多;当可抓取区域的最大内接圆的半径大于第二半径阈值,且最大内接矩形的长度小于第一长度阈值时,采用第二种组合方式中包含的夹具进行抓取;当可抓取区域的最大内接圆的半径小于第二半径阈值,且最大内接矩形的长度大于第一长度阈值时,采用第三种组合方式中包含的夹具进行抓取,说明可抓取区域的形状又细又长,该第三种组合方式中包含的夹具形状也较为狭长;当可抓取区域的最大内接圆的半径小于第二半径阈值,且最大内接矩形的长度小于第一长度阈值时,说明可抓取区域的形状又窄又短,因而采用第四种组合方式中包含的夹具进行抓取,该第四种组合方式中包含的夹具数量较少。

在再一种可选的实现方式中,获取可抓取区域的最大内接矩形的宽度,和/或获取可抓取区域的最大内接矩形的长度;将最大内接矩形的宽度与宽度阈值进行比较,和/或将最大内接矩形的长度与第二长度阈值进行比较,根据比较结果确定对应于可抓取区域的夹具数量以及各个夹具的夹具标识。与前两种实现方式类似,也可以预先将夹具组中包含的各个夹具划分为多种组合,如四种组合。本发明对具体细节不再赘述。

具体实施时,可以灵活组合各种参数以及阈值进行判断,本发明对具体细节不作限定。

步骤S240:控制机器人调用夹具组中包含的与夹具标识相对应的各个夹具执行抓取操作。

具体的,向机器人输出夹具控制指令,在夹具控制指令中包含至少一个夹具标识,以使机器人调用夹具组中包含的与夹具标识相对应的至少一个夹具执行抓取操作。其中,夹具组包括:多个吸盘式夹具。

具体实施时,需要获取相机坐标系与机器人坐标系之间的转换关系,根据该转换关系,将对应于相机坐标系的可抓取区域的位置信息转换到机器人坐标系中,向机器人输出转换后的各个可抓取对象的位置信息以及夹具标识。其中,考虑到相机所处位置与机器人所处位置往往并不相同。因此,可通过坐标系转换的方式定位可抓取对象。由于上述各个步骤中描述的可抓取对象的三维位姿信息都是根据相机坐标系确定的,为了便于机器人实现抓取操作,需要将其转换至机器人坐标系中。其中,相机坐标系与机器人坐标系之间的转换过程可根据相机所处方位与机器人所处方位之间的相对关系确定。

综上可知,通过本实施例中的方式,能够通过深度学习模型能够实现任意物品的抓取操作,并且,根据可抓取区域的几何特征,能够灵活设置夹具的数量和夹具标识,从而调用与区域特征匹配的夹具进行抓取操作,从而提升抓取效果。

另外,本领域技术人员还能够针对上述实施例进行各种改动和变形:

当可抓取区域为多个时,还可以进一步设置各个可抓取区域对应的可抓取对象的抓取顺序,具体可通过如下方式设置:

根据与三维物品区域相对应的点云信息,计算各个可抓取对象的三维位姿信息,根据三维位姿信息将各个可抓取对象沿预设深度方向进行排序,根据排序结果确定各个可抓取对象的抓取顺序。其中,点云是预设坐标系下的点的数据集。点包含了丰富的信息,包括三维坐标X,Y,Z、颜色、分类值、强度值、时间等。点云能够将现实世界原子化,通过高精度的点云数据可以还原现实世界。由此可见,点云信息能够反映三维物品区域的三维立体特征。在本实施例中,根据上述的二维彩色图以及深度图能够构建点云信息。或者,也可以另外结合激光探测器、LED等可见光探测器、红外探测器甚至雷达探测器等元件生成点云信息,从而使点云信息更加准确。通过点云信息能够计算各个可抓取对象的三维位姿信息。其中,三维位姿信息用于描述可抓取对象在三维世界的立体姿态。其中,可抓取对象的三维位姿信息也叫物体位置信息、对象位置信息,可通过多种方式确定。其中,三维位姿信息可通过可抓取对象中包含的抓取点或抓取区域描述。例如,三维位姿信息通过抓取点表示。相应的,在确定可抓取对象对应的抓取点时,可通过多种方式实现:可以将可抓取对象对应的区域内可抓取概率最大的点作为抓取点;也可以计算可抓取对象的2D重心,从而根据2D重心确定抓取点。抓取点用于描述可抓取对象在三维空间中的大致方位。另外,由于抓取点为三维坐标系下的点,因此,能够根据三维位姿信息确定抓取点对应的深度值信息,即:可抓取对象距离相机摄像头的远近。在一个具体示例中,通过以下方式计算各个可抓取对象的三维位姿信息:首先,建立与三维物品区域相对应的三维坐标系;其中,三维坐标系中包含的第一坐标轴以及第二坐标轴的方向与二维彩色图相匹配,三维坐标系中的第三坐标轴(也叫深度坐标轴)的方向与预设深度方向相匹配。其中,预设深度方向可通过上文提到的三种方式中的任一方式设置。然后,计算各个可抓取对象对应于第三坐标轴的深度坐标值,根据深度坐标值计算各个可抓取对象的三维位姿信息。由此可见,当深度坐标轴的方向根据相机拍照方向设置时,深度坐标值用于反映可抓取对象到相机摄像头之间的距离。具体的,根据三维位姿信息能够确定各个可抓取对象的深度坐标值,该深度坐标值的数值即可反映各个可抓取对象沿预设深度方向的排序情况。具体实施时,将各个可抓取对象按照与摄像头之间的距离远近进行排序,并根据排序结果确定各个可抓取对象的抓取顺序;其中,距离摄像头越近的可抓取对象的抓取顺序越靠前;距离摄像头越远的可抓取对象的抓取顺序越靠后。通常情况下,由于相机从上往下拍摄,因此,距离摄像头近的可抓取对象位于顶层,而距离摄像头远的可抓取对象位于底层。因此,通过排序结果能够将各个可抓取对象按照从顶层到底层的顺序依次排列,进而在抓取时能够按照从顶层到底层的顺序依次抓取,从而防止先抓取下层物品时导致上层物品飞出的问题。或者,当预设深度方向为物品承载面的垂直线所在的方向时,距离物品承载面越远的可抓取对象的抓取顺序越靠前,距离物品承载面越近的可抓取对象的抓取顺序越靠后。其中,可抓取对象与物品承载面之间的距离为:可抓取对象沿物品承载面的垂直线到物品承载面的间隔距离。即:可抓取对象与物品承载面之间的距离是指可抓取对象与物品承载面之间的垂直距离。

其中,本实施例中可抓取的物品包括:纸箱、纸盒、信封、文件袋、明信片等片状物体包装、塑料软包(包括但不限于零食包装、牛奶利乐枕包装、牛奶塑料包装等等)、药妆瓶、药妆品、和/或不规则的玩具等物品等。

图3示出了根据本发明又一个实施例的基于机器人的夹具组的控制装置的结构示意图,如图3所示,该装置包括:

获取模块31,适于沿预设深度方向获取与三维物品区域相对应的二维彩色图以及对应于所述二维彩色图的深度图;

预测模块32,适于将所述二维彩色图以及所述深度图输入深度学习模型,根据输出结果预测所述二维彩色图中包含的可抓取区域;

确定模块33,适于根据所述可抓取区域的轮廓线确定所述可抓取区域的几何特征,根据所述可抓取区域的几何特征确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识;

控制模块34,适于控制机器人调用夹具组中包含的与所述夹具标识相对应的各个夹具执行抓取操作。

可选的,所述确定模块具体适于:

根据所述可抓取区域的轮廓线,绘制所述可抓取区域的最大内接圆、最小内接圆、最大内接矩形和/或最小内接矩形。

可选的,所述确定模块具体适于:

获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的主轴长度;

将所述半径与第一半径阈值进行比较,和/或将所述主轴长度与主轴阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述确定模块具体适于:

获取可抓取区域的最大内接圆的半径,和/或获取可抓取区域的最大内接矩形的长度;

将所述半径与第二半径阈值进行比较,和/或将所述最大内接矩形的长度与第一长度阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述确定模块具体适于:

获取可抓取区域的最大内接矩形的宽度,和/或获取可抓取区域的最大内接矩形的长度;

将所述宽度与宽度阈值进行比较,和/或将所述最大内接矩形的长度与第二长度阈值进行比较,根据比较结果确定对应于所述可抓取区域的夹具数量以及各个夹具的夹具标识。

可选的,所述控制模块具体适于:

获取相机坐标系与机器人坐标系之间的转换关系,根据所述转换关系,将对应于相机坐标系的可抓取区域的位置信息转换到机器人坐标系中,向机器人输出转换后的各个可抓取对象的位置信息以及夹具标识。

可选的,所述夹具组包括:多个吸盘式夹具。

上述各个模块的具体结构和工作原理可参照方法实施例中相应步骤的描述,此处不再赘述。

本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于机器人的夹具组的控制方法。

图4示出了根据本发明实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。

如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。

其中:

处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。

通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。

处理器402,用于执行程序410,具体可以执行上述域名解析方法实施例中的相关步骤。

具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。

处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。

存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。

程序410具体可以用于使得处理器402执行上述方法实施例中的各项操作。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的电子设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

20页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:目标对象定位方法、装置、电子设备及可读存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!