用于考验农业环境的深度和视觉传感器

文档序号:1865427 发布日期:2021-11-19 浏览:10次 >En<

阅读说明:本技术 用于考验农业环境的深度和视觉传感器 (Depth and vision sensor for challenging agricultural environments ) 是由 瑞安·R·克诺夫 约书亚·亚伦·莱辛 米歇尔·普拉图塞维奇 詹森·A·里斯托斯 什雷亚斯·爱 于 2020-02-14 设计创作,主要内容包括:提供了一种用于在室内农业环境中对植物进行三维成像的方法,所述室内农业环境具有与自然室外光的功率谱不同的环境光功率谱。该方法包括:将一对空间分离的立体相机对准包括植物的场景,用投影仪提供的非均匀图案照亮该场景,该投影仪利用室内农业环境中具有的低于平均环境强度的频段中的光;利用滤波器过滤进入每个相机的图像传感器的光,该滤波器选择性地使投影仪所利用的频段中的光通过;利用每个相机捕获场景的图像,以获得第一和第二相机图像;以及生成深度图,该深度图包括与第一相机图像中的每个像素对应的深度值。(A method is provided for three-dimensional imaging of a plant in an indoor agricultural environment having an ambient light power spectrum that is different from the power spectrum of natural outdoor light. The method comprises the following steps: directing a pair of spatially separated stereo cameras at a scene including a plant, the scene being illuminated with a non-uniform pattern provided by a projector that utilizes light in a frequency band having a lower than average ambient intensity in an indoor agricultural environment; filtering light entering the image sensor of each camera with a filter that selectively passes light in a frequency band utilized by the projector; capturing an image of a scene with each camera to obtain first and second camera images; and generating a depth map comprising a depth value corresponding to each pixel in the first camera image.)

用于考验农业环境的深度和视觉传感器

技术领域

本文公开的方面和实施例涉及农产品的机器成像以确定农产品的三维位置。

背景技术

为了指导自动化多自由度系统(机器人系统)与活体植物相互作用以进行收获、修剪、网格化或各种形式的分析,植物的高精度实时三维成像经常被用作完全自动化系统中的多种传感器模式之一。在室内农业环境中,存在独特的照明条件,这在其他任何地方都不是典型的。另外,藤蔓作物和叶类作物的实际形状,不规则性和表面颜色或纹理为传统的三维(3D)成像传感器提供了独特的挑战性目标。现有的和市售的3D成像系统在这些独特的条件下表现非常差。

发明内容

根据本文所公开的方面,提供了一种用于在室内农业环境中对植物进行三维成像的方法,该室内农业环境具有与自然室外光的功率谱不同的环境光功率谱。该方法包括将一对空间分离的立体相机对准包括植物的场景,用光投射器提供的非均匀图案照亮场景,该光投射器利用具有低于室内农业环境中平均环境强度的频段中的光。用过滤器过滤进入每个相机的图像传感器的光,该过滤器选择性地通过投影仪使用的频段中的光,用每个相机捕捉场景的图像以获得第一和第二相机图像,并生成深度包括与第一相机图像中的每个像素对应的深度值的地图。

在一些实施例中,滤波器是带通滤波器,并且该方法还包括用带通滤波器阻挡大部分环境光进入每个相机的图像传感器。

在一些实施例中,投影仪发射紫光。从投影仪发射的光的频段可以从400nm到430nm。可以用光学低通滤波器对进入每个相机的图像传感器的光进行滤波。

在一些实施例中,投影仪发射红光。从投影仪发射的光的频段可以从620nm到680nm。可以利用光学带通滤波器对进入每个相机的图像传感器的光进行滤波。

在一些实施例中,投影仪发射绿光。从投影仪发射的光的频段可以从520nm到560nm。可以利用光学带通滤波器对进入每个相机的图像传感器的光进行滤波。

在一些实施例中,非均匀图案是通过使从投影仪发射的激光通过衍射光学元件而产生的非均匀点阵图。

在一些实施例中,该方法还包括表征室内农业环境中的环境光功率谱并基于该表征选择频段。

在一些实施例中,该方法还包括基于用于室内农业环境中的植物的照明形式来选择频段。

在一些实施例中,该方法还包括以选定的偏振角对来自投影仪的光进行偏振,并使用滤波器选择性地以选定的偏振角过滤进入每个相机的图像传感器的光。

在一些实施例中,该方法还包括用频段中的非图案化光源照射场景。

在一些实施例中,生成深度图包括对第一和第二相机图像进行校正,使得通过第一和第二相机图像绘制的水平线对应于真实世界空间中的同一对极线。

在一些实施例中,生成深度图还包括通过沿着对极线搜索候选对应像素来匹配第一相机图像中的像素与第二相机图像中的对应像素来执行相机图像中的每个像素的深度测量,对候选对应像素中的每一个进行排序,以及

在候选对应像素中选择排序最高的候选对应像素作为对应像素。生成深度图还可以包括根据第一相机图像中的每个像素与其在第二相机图像中的对应像素之间的分离距离来确定每个像素距立体相机对的距离。

在一些实施例中,该方法进一步包括在深度图中识别农产品物品的位置。该方法还可以包括将该农产品的位置传送到配置为收获该农产品的机器人系统。该方法还可以包括利用机器人系统收获农产品。

根据另一方面,提供了一种用于在室内农业环境中对植物进行三维成像的系统,所述室内农业环境具有与自然室外光的功率谱不同的环境光功率谱。该系统包括:空间分离的立体相机对,每个立体相机对包括图像传感器;放置在相机图像传感器前面的滤波器,该滤波器被配置为阻挡具有高于室内农业环境中平均环境强度的波长的光;被配置为将非均匀光图案投影到包括植物的场景上的投影仪;以及被配置为从立体相机对所捕获的图像生成场景的深度图的处理器。

在一些实施例中,滤波器阻挡室内农业环境中的大部分环境光。

在一些实施例中,投影仪发射紫光。该投影仪可以发射从400nm到430nm的频段中的光。滤波器可以是光学低通滤波器。

在一些实施例中,投影仪发射红光。该投影仪可以发射620nm到680nm的频段中的光。滤波器可以是光学带通滤波器。

在一些实施例中,投影仪发射绿光。该投影仪可以发射520nm到560nm的频段中的光。滤波器可以是光学带通滤波器。

在一些实施例中,该系统还包括光谱分析仪,该光谱分析仪被配置为表征室内农业环境中的环境光功率谱,并提供具有低于室内农业环境中的平均环境强度的光的带宽的指示。

在一些实施例中,基于用于室内农业环境中的植物的照明形式来选择由投影仪发射的光的频率。

在一些实施例中,所述投影仪包括激光发射器,其被配置为以基本上不被所述滤波器衰减的频率发射激光器,以及在所述激光器的光路中的衍射光学元件,其被配置为产生作为非均匀点阵图的所述非均匀图案。

在一些实施例中,该投影仪还包括偏振器,该偏振器被配置为以选定的偏振角偏振该投影仪投射的光,并且滤波器被配置为使选定的偏振角的光选择性地进入相机的图像传感器。

在一些实施例中,该系统还包括第二投影仪,该第二投影仪被配置为利用非图案化光源在由滤波器选择性地通过的频段中照射场景。

在一些实施例中,处理器进一步被配置为在深度图中识别农产品物品的位置。

在一些实施例中,该系统进一步包括机器人收割机,其与处理器通信并被配置为收获农产品品物品。

根据另一个方面,提供了一种机器人收割机,其被配置为从由上述系统的实施例所识别的位置收割农产品物品。

附图说明

附图不是按比例绘制的。在附图中,在各附图中示出的每个相同或几乎相同的部件由相同的数字表示。为清楚起见,并非每个组件都可能在每张图中标出。在附图中:

图1A示出了立体成像系统中的图像设备的布置;

图1B示出了立体成像系统的另一示例中的图像和照明设备的布置;

图2示出了如何可以确定被观察对象与立体视觉成像系统的距离;

图3a示出了可以被投影在场景上以有助于确定场景中特征的深度的图案;

图3B示出了可以投影在场景上以有助于确定场景中特征的深度的另一个图案;

图4示出了在一些近红外成像系统中使用的光与典型工业环境中的环境光的相对波长;

图5示出了日光和温室实例内的环境对于不同波长的光的相对强度;

图6示出了在不同频率下与温室内的环境光相比的紫光源的相对强度;

图7示出了在不同频率下与温室内的环境光相比的红光源的相对强度;

图8示出了在不同频率下与温室内的环境光相比的绿光源的相对强度;

图9示出了用于在室内农业环境中对植物进行三维成像的系统的示例;以及

图10示出了机器人收割机的示例。

具体实施方式

本文所公开的方面和实施方式不限于以下描述中阐述或在附图中说明的构造和组件的布置的细节。本文所公开的方面和实施方式能够以各种方式实践或实施。

应用于机器人的3D成像

许多机器人系统利用能够在环境中移动的机械操纵器和工具以某种方式自动操纵目标物品。通常,与广泛应用的工业自动化的情况一样,任务是简单的并且受高度限制的:将单一类型的物品从一个位置移动到另一个位置,或者按照许多制造过程中所希望的高度可重复性以某种方式操作。然而,最近,机器人技术已经被应用于日益复杂的任务。例如,在电子商务行业中,正在开发机器人系统来处理甚至具有成千上万的不同物品的乱序物品,以便将其放入包装中以便运输。正在研究仿人机器人,它们可以在危险和复杂的环境中导航,以执行日常的人工任务,例如打开门或容器。最后,一些组织已经开始开发直接操纵活体作物的农业机器人系统,以实现播种、繁殖、去叶、架设和收割等程序的自动化。

为了规划和执行避免损害碰撞和优化速度的运动,机器人系统应该能够确定其在本地环境中的位置并了解其可以在其中操作的本地环境的范围。这些任务通常被统称为“导航”——自我定位、绘制地图和规划的综合能力。存在许多技术用于将一个或多个传感器信号合成到先验地图的位置或构建地图。在该过程中使用的一种传感器模式是范围成像。范围成像是指最终生成2D图像的技术的集合,其中图像中的每个像素或元素对从参考点到环境中的相应点的距离进行编码。

立体视觉3D相机的优点

在一些示例中,负责产生场景的3D图像的机器人可以利用立体视觉相机。

虽然许多范围成像传感器模式已经存在了一段时间(例如结构光,雷达,LiDAR,飞行时间和干涉测量),但是这些往往要么过于昂贵,要么受到表面类型或辐射变化的限制,或者它们的测量是鲁棒的,或者不能实时地提供完整的范围图像。用于实时操作的阈值根据系统中的相关动态的速度而变化,但是对于大多数机器人系统来说通常在几分之一秒内。

具体地,LiDAR系统通常将具有非常高的分辨率和可重复性。不幸的是,它们通常由各种机械移动部件构成,这些部件容易发生故障并使得仪器对机械振动或冲击高度敏感。飞行传感器的时间也是高度精确的,但是由于飞行时间测量所需的高速(在每处理器周期几十皮秒的范围内),往往具有较长的最小测量距离。当表面具有极端的反射或透射特性时,这两种技术都会导致精度下降或数据无效。许多型号在具有高度近红外(NIR)照明度的环境(例如户外)中也无法实现足够的信噪比。因此,具有高空间分辨率、能够在不利的照明条件下操作并且能够测量接近最小距离(小于几米)的这些传感器的版本是非常昂贵的(通常几千美元或更多)。

幸运的是,一些能够实时生成范围图像的新型传感器已经上市(例如RealSenseTM D415、ASUS Xtion、Occipital Structure和Stereolabs ZED相机)。每一种都利用立体视觉的变化从一个或多个CCD或CMOS图像传感器中提取距离信息,在一些示例中,还利用投影光图案来解决对应问题,并对二维“深度图”内每个位置的距离进行三角测量。立体视觉作为深度成像技术已经被研究了许多年,但是,直到最近,与解决对应问题(其中一个图像中的一个区域在另一个图像中被识别以确定其视差,也被称为“立体匹配”)相关的计算复杂度令人难以承受,并且将这些传感器限制在非常低的空间分辨率或无法满足实时要求的异常慢的速度。

这种限制已经通过一些发展而被克服。改进的算法更精确地解决了对应问题,并减少了计算所需的资源。现成的CCD和CMOS图像传感器已经变得更便宜和高性能。此外,这些新的基于立体的传感器中的每一个都利用专用的集成电路或ASIC来比通用处理器更有效地执行立体匹配。一些上述传感器系统使用两个没有附加照明的彩色图像传感器(双目立体视觉),一些使用一个颜色传感器以及颜色传感器的精确已知且独特的可见投影光图案(立体视觉变化被称为结构光视觉),而另一些则结合了这两种技术。在许多示例中,这些传感器将先前描述的2D深度图或范围图像与2D彩色图像融合,以创建投影的3D点云,其中点被赋予了在彩色图像中测量的准确颜色。这样做的相机通常被称为RGB-D相机(或“红绿蓝深度”相机)。

双目立体匹配和点阵图

在一些示例中,在要成像的场景上提供光图案可以促进机器人利用立体视觉相机对场景进行三维成像。

双目RGBD相机通常依靠称为双目立体匹配的过程来评估每个给定像素的场景深度。双目立体匹配通过将两个相机指向相同的场景而工作,在它们的基线中具有小的空间间隔,如图1A和1B所示。这两个相机一起被称为立体对。在这里公开的各种实施例中,双目视觉系统不仅可以包括两个相机,而且可以包括照明系统,例如,激光照明器,其可以生成激光并且引导激光通过点阵图生成器,以在如下所述的要成像的场景上生成点阵图,和/或彩色非激光光源,用于进一步照亮如下文进一步描述的场景。适当的透镜和/或滤波器可以与相机和光源相关联,如图1B所示。

对两个捕获的图像进行校正,使得通过两个图像绘制的水平线对应于真实世界空间中的同一对极线。参见图2。

通过沿极线搜索,将左图像中的像素与右图像中的相应像素相匹配,在每个像素处计算深度测量。使用一组启发式算法(例如围绕N×N像素图像窗口的L2范数)来对所有候选像素进行排序,并且得分最高的候选像素是对应的匹配像素。两个匹配像素之间的水平像素间隔距离与该像素距相机的距离成比例。该过程的输出被称为深度图,该深度图中,对每个输入像素生成深度值,或者对无效或低置信度测量值生成零值。匹配标准启发式算法随着不同的实现而变化很大,但是通常包括RGB和亮度差异度量的分量。

在像素匹配搜索期间,具有从像素到像素的高变化的场景增加了能够以高置信度找到匹配项的机会,特别是在图像的每个区域是唯一的情况下。例如,如果传感器正在用圣诞树测量场景,则树上的亮光将从暗松针背景中突出,并且因此亮像素的匹配将具有比所有其它候选像素高得多的置信度得分。相反,在无纹理或低对比度场景(例如平坦的墙壁)中,像素匹配是模糊的,因为没有一组启发式算法可以在相邻像素之间消除歧义。当这种情况发生时,应用于场景的大部分或全部区域的深度测量技术会返回不准确或无效的数据。

为了克服这些问题并降低传感器对特定场景的内容的独特特性的依赖性以产生可靠的深度测量,最近的相机(例如实感TM和微软Kinect相机)采用由投影仪提供的人工点阵图。在一些情况下,投影仪的图案被设计成保证其每个子区域是唯一的(如图3B所示的DeBruijn点阵图的情况)。当使用这种类型时,如果它们之间的基线和投影仪的全局唯一图案是先验已知的(这是微软Kinect相机使用的方法),则可以仅用一个相机和投影仪来完成立体匹配。在其它示例中,随机化的点阵图,例如,如图3A所示,使用不保证唯一性但补充了正常的双目(双相机)立体匹配过程。随机点阵图将对比度和纹理添加到场景中的表面,并且在检查图像的小局部区域时仍然倾向于大部分是独特的。这明显地降低了通常不具有许多固有纹理的表面(例如,均匀颜色的平面或弯曲表面)上的匹配模糊性。

添加到投影到场景上的点阵图将使得像素窗口启发式算法在同一图像对中正确匹配的可能性更大。

在实践中,适当投影和成像的点阵图可能意味着能够分辨每个像素的深度的传感器、根本不能分辨任何深度测量的传感器或提供具有高错误率的测量值的传感器之间的差异机器人应用。

在双目立体深度传感器和结构光视觉传感器的实现中,现在普遍采用投影点阵图以增强立体匹配能力的实施。然而,这些传感器的设计或优化并没有考虑在植被丰富的室内和室外农业环境中的操作,并且由于下面将进一步描述的原因而在那些环境中遭受严重的性能退化。

双目立体深度投影仪的工作波长

可以通过利用基于特定环境中的背景环境光选择的光波长来增强场景的三维成像的有效性。

近红外(NIR)的辐射波长(例如800-960nm)在计算机视觉和双目立体映射应用中通常当将光的图案投影到场景上时选择(对于所有先前提到的商业立体视觉相机来说是这种情况)。这是由于许多市场上可买到的硅CMOS成像芯片对NIR光的适中的光谱灵敏度,以及在典型的工业感测环境(例如工厂或办公室)中没有NIR光。

在办公室或工厂环境中,照明主要由荧光灯或LED光源提供。这些能源是节能的,主要是因为它们只发射人眼可见的光子,主要波长在400和700nm之间,中心波长为555nm,以匹配用于测量流明的CIE亮度曲线。

在设计用于双目立体深度相机的激光或基于LED的图案投影仪的发射波长时,传感器设计者希望发射和成像的图案不会被周围照明条件所克制或“洗掉”,因为这将会抵消第一位置处的投影图案的优势。因为这些室内环境没有太多波长超过700nm的环境照明(参见图4),并且如果传感器在人类用户身上或周围使用,则可见图案的投影可能是不符合需要的,所以典型的现成的双目立体相机被设计成在近红外(830-860nm,因为在这些波长下廉价且高光功率的激光源的共同可用性)下工作。此外,硅CMOS成像传感器的典型光谱灵敏度在该范围内(有时高达20-40%的量子效率)比在较长的波长上高得多。这些因素都会导致传感器设计者更喜欢在近红外环境中操作,在近红外环境中,通用部件可用,并且在预期的操作环境(家庭,办公室或仓库)中,环境干扰最低。

高植被农业环境中环境照明

场景的近红外照明对促进场景的三维成像可能不是所有环境中的最佳选择。虽然860nm的投影仪可以很好地适用于家庭或办公室环境,但是它们几乎是在高植被室内农业环境(例如商用温室)中使用的最坏情况的选择。它们也不适于户外操作。这是因为,在这些具有挑战性的环境中,在750-1000nm的NIR波段中存在非常强的照明。

现有传感器不过滤这些波长,以观察它们在830-860nm内的投影图案。因此,在农业环境中,没有修改的这些传感器将产生过曝光的、低对比度的图像区域,该图像区域几乎没有或几乎没有用于执行立体匹配的细节。它们的投影图案被环境NIR光洗掉,并且在图像中几乎不提供或不提供额外的对比度。

为了理解为什么在典型的室内农业生产环境中存在如此多的NIR光污染,我们必须连同植物的光吸收特性一起反思它们是如何构造的。塑料或玻璃覆盖的温室、高隧道,环式温室(即,受保护的栽培或“室内农场”)常常努力使作物能够获得的光量最大化。这些环境中的大多数使用天然阳光来最大限度地产量和生长潜力。尽管在受保护的培养环境中覆盖玻璃或塑料可以衰减UV辐射,但是几乎不会阻挡IR光。

这是通过设计实现的,因为保留的IR光(由于“温室效应”)在覆盖的生长环境内提供额外的热量,从而减少或消除了在较冷的月份内对补充热量的需要。此外,健康的植物植被是近红外光(在830-860nm处接近60%)的适度有效的反射器。当组合使用时,屋顶材料的透射率和健康植被的吸收光谱产生了预期看起来像图5所示的环境归一化光谱(其与在海平面处的太阳辐射的参考漫反射ASTM日光光谱叠加)。

注意,与其它照明环境相比,关键的区别在于,在植被环境中保持如此多的NIR光强度,使得其光谱功率显著高于可见光谱。因此,对NIR敏感并利用NIR投影仪的传统立体视觉传感器不能在这些环境中有效地操作。

调整波长以最大限度地提高性能

利用具有不同于那些落在近红外波段中的波长的光的成像的性能可以促进在某些环境中的场景的三维成像。为了创建在先前描述的农业环境中表现出色的专用立体成像传感器,本文公开了成像系统配置的三个新颖示例。系统的每个变型包括两个修改后的元件。首先,一对CMOS相机传感器可以以与先前构造的深度成像传感器相同的方式用作立体成像对。然而,可以将过滤介质放置在每个传感器上方,其将所接收的光的波长限制在感兴趣的窄的和特定的频段(“带通”过滤介质),或者其阻挡特定波长以上的光(“低通”过滤介质)。其次,采用光图案投影仪将光图案投射到成像场景上。

在一些实施例中,CMOS立体相机传感器对上的窄带通滤波器消除了场景中的几乎所有环境照明,并且在每个CMOS传感器上形成最终图像的光主要来自由图案投影仪发射的场景中的表面反射的光。在该实施例中,可以使用基于激光的图案投影仪,其中激光源穿过衍射光学元件以产生所需的的图案。可以使用其它光源和光学器件来实现类似的效果(例如,具有通过外部光学元件来聚焦的非相干点光源的Gobo盘)。激光源是有利的(特别是半导体固态激光器),因为它们消耗非常少的电能并且可以集成到非常小的机械封装中。这两个属性使得它们对于在场中操作的移动的电池供电的机器人系统成为理想选择。在在利用带通滤波器介质的实施例中,可以选择所使用的光源来精确地匹配放置在每个CMOS传感器上的带通滤波器介质。要投影的图案可以是标准的随机或全局唯一的点阵图,如前面所述的那些。

在这三种配置的每一种中,不同的主波段被用于过滤介质和图案投影仪光源。这些成对的传感和投影波长的使用在立体视觉中是新颖的,并且选择三个主要频段中的每一个以提供对特定的室内农业环境一组不同的优势。

实施例#1:400-430nm工作波段-紫

为了在主要由自然阳光照明的封闭(温室,环棚等)作物环境中对环境光具有最大的免疫力,可见的紫外传感是特别合适的,因为大多数商业上使用的温室覆盖材料阻挡了阳光中大部分环境UV辐射。通过选择从400-430nm的深蓝色到紫色可见波长作为所关注的区域,深度传感器可以近似地工作在接近完全消除环境光的情况下。(参见图6)由于400nm以下的硅(Si)CMOS传感器的低灵敏度,可以使用具有430nm截止频率的光学低通滤波器来代替带通滤波器,以获得期望的最终结果。应该将低通波长设计成尽可能地紧靠投影仪的发射光谱功率分布(SPD)的高端。在这种情况下,传感器设计者可以确定成像传感器读取从被测量的环境反射的投影点阵图的能力。

对于图案投影,可以使用匹配波长的固态半导体激光二极管。这种中心波长在405-415nm范围内的二极管即使在高连续波(CW)功率下也可广泛且廉价地获得(特别是由于使用405nm InGaN固态激光二极管的蓝光光盘读写技术的普及)。由于在这种配置中实际上没有可读取的环境光,因此可能需要具有尽可能高的光功率的激光源。双目立体相机仍然可以非常有效和精确地在完全黑暗的情况下操作,这仅依赖于它们可以匹配的纹理的投影图案,但是纹理图案越亮和对比度越高,所使用的CMOS曝光持续时间越短。来自通过衍射光学器件的激光源的激光可以产生对比度非常高的图案。在这种设计中,激光图案投影仪的总光谱功率应该足够高,鉴于此配置中使用的特定CMOS传感器的灵敏度,曝光持续时间仍然能够以实时速率分解具有适度运动量的场景(这通常意味着需要数十毫秒或更短的时间内曝光)。

一些实际的考虑使得设计一个系统以在这种短的波段中操作在技术上具有一定的挑战性。可以选择在可见紫光400-430nm范围(例如,在最近发布的索尼IMX265传感器的情况下为55-60%)内具有中等至高灵敏度的CMOS传感器,但是它们对UV辐射不特别敏感。很难获得高CW功率的单模激光源,同样很难设计和制造廉价的衍射光学元件,这些衍射光学元件具有在该范围内的设计波长,低的0级强度和宽的视场。纠正这些问题的衍射光学器件尚未广泛商用。这些设计约束可以被克服,但是可以使这种波长选择的开发和生产成本比将作为替换实施例讨论的其它两个昂贵得多。

此外,植被在该带宽内吸收90-95%的光,这意味着对光源的亮度甚至存在更高的要求,以获得能够以实时速度曝光的高对比度图案。

实施例#2:620-680nm工作波段-红色

为了便于通用的现成部件的使用以及加速开发和部署,在620-680nm范围内的可见红光传感是一种有吸引力的工作波长范围,这是由于经历光合作用的植被植物材料对该光带的高吸收率。此外,可以获得在该范围内高度敏感的标准CMOS传感器(例如,在SonyIMX365传感器的情况下,65-75%)。类似地,用于集成基于激光的模式投影仪的激光光源可以在这些波长上以100+mW连续波输出功率轻松且廉价地获得(得益于通用的InGaAlP固态激光二极管化学)。最后,在这些具有低0级强度和宽视场的设计波长下,可以容易地制造低成本的模制塑料衍射光学器件。

希望每个立体CMOS图像传感器窗口上的带通滤波器介质的接收带尽可能紧密地匹配图案投影仪光源的发射。例如,在激光源以660nm为中心并且分布与2nm半峰全宽(FWHM)相匹配的情况下,带通滤波器将衰减656nm以下和664nm以上的光。这并不是该波段内唯一可以选择的波长,而是一个常见的现有部件示例。或者,如果在半峰全宽处不能达到,则滤波器可以与光源发射光谱的最大全宽25%相匹配。例如,对于所描述的CWL 660nm和FWHM 2nm发射器,相应的1/4最大值将大约为5nm。因此,匹配滤波器将衰减650nm以下和660nm以上的光。

与前面的实施例一样,几乎所有的环境光都从场景中被剔除,并且只有高对比度投影图案被用于执行立体匹配。然而,在该实施例中,用于构建系统的部件更容易制造并且成本低得多。这种带宽内85-90%的光仍然被健康植被吸收,但是结合了更高的CMOS灵敏度、更强的可用光源、更有效的衍射光学以及更高但仍然较小量的可用环境光的组合意味着与在可见紫光中操作的先前实施例相比,构建一种实时完成曝光和深度测量的系统实质上更容易。也就是说,在该带宽内存在明显更多的环境光污染(参见图7),并且因此产生这种隔离的精度和性能优势可能不如它们在可见紫光中操作时那样明显。

该限制有一个与该深度传感器实施例的应用特别相关的例外。许多通过生物合成产生各种胡萝卜素而成长或成熟的水果和蔬菜在这一带宽内具有高度反射性。例如,成熟和未成熟的番茄都反射接近95%的630-670nm的可用光。对于其它成熟的水果和蔬菜,如甜椒(bell peppers)来说,这也是如此,当它们成长和成熟时,它们也从β-胡萝卜素(橙色水果),叶黄素(黄色水果)或番茄红素(红色水果)的生物合成生产中获得它们的色素沉着。因此,在可见红光范围内的带宽内操作将特别在果实本身的表面上提供极好的图案对比度,从而在那些区域中产生更高的质量和更精确的深度测量,而无论水果成熟度如何。这种能力为机器人系统提供了巨大的优势,机器人系统将使用从深度测量中估计的位置数据来物理地操纵生长在植物上的果实。

实施例#3:520-560nm工作波段-绿色

在另一个预期的实施例中,将可见绿波长用于图案投影仪和CMOS带通滤波器介质。520-560nm的范围由于具体与农业用途的设备相关的两个原因而受到特别关注。首先,虽然在自然照明下在该波长存在明显更多的环境光(如前面所讨论的),但是许多较新的室内农业设施利用人工照明,该人工照明为了提高能量效率而几乎排他地使用LED二极管发射可见蓝光和红光。这是因为这些是在光合作用过程中主要被吸收和利用的波长。

在本实施例中,带通过滤介质被放置在尽可能接近与投影仪波长匹配的每个CMOS成像传感器上(如在其它实施例中)。标准CMOS传感器通常对绿光非常敏感。固态520nm GaN激光二极管和532nm二极管泵浦固态激光器模块通常在高输出功率下可用,并且都为投影仪光源的中心波长作出适当的选择。

即使在温室工业中也变得普遍,在使用人造红蓝LED照明操作的情况下,紫色和红色操作波长都可能受到环境照明的负面影响。因此,可见绿光实施例变得优选。如图8所示,选择以532nm为中心的工作波段在这种类型的照明环境中提供了出色的抗扰性。

另外,该波长在叶状植物(大约20%)和未成熟果实(在番茄的情况下大约37%,如上图所示)上仍表现出中等反射率。较高的反射率意味着,在任何给定的投影仪亮度下,CMOS传感器所感知的图案将具有较高的亮度和对比度,从而改善了深度测量的质量,减少了曝光持续时间,并且显著降低了组成硬件的成本。

在工作波长范围内增强照明

除了选择合适波长的光来捕捉场景的三维图像之外,还可以调整或提供其它照明参数以增强图像质量。

另一个有助于抑制环境干扰的有用物理特性是极化。与基于波长的选择性滤波器的设计一样,如果图案投影源以已知的角度偏振,并且成像系统也被滤波以接受以投影仪偏振角偏振的光,则可以进一步增强深度图案投影仪亮度与环境干扰的对比度。这可以使得在可见绿光下的操作更易于处理,并且有助于克服自然照明场景中存在的更大量的环境光。

立体匹配受益于图像曝光中存在的任何额外的和独特的细节。在上述实施例中的任何一个中,可能希望使用容易获得的高功率LED模块(在窄波带内几乎排他地发射的高亮度单二极管模块可从诸如Lumileds的各制造商处获得)在系统的设计波长下人为地提供“大量”照明。通过这种方式,可以提供在由立体传感器使用的窄波段内的漫反射和可能的偏振照明,并且允许在CMOS传感器曝光中分辨场景中表面的自然纹理(除了投影的光图案之外)。在许多情况下,组合照明将是有益的,并将提高深度测量的完整性和准确性。此外,场景上添加的光将进一步减少分辨和成像所需的曝光持续时间,从而帮助整个立体视觉系统以较高的实时帧速率操作。由于经由“大量”漫反射照明添加的所有光都落在CMOS滤波器介质的带通范围内,所以不会浪费能量来产生最终将被系统滤除的光,这是电池供电的移动机器人系统的重要标准。

示例系统

图9示意性地示出了用于室内农业环境210中的植物200的三维成像的系统100的示例。该系统包括空间分离的立体相机对105A,105B,每个立体相机对105A,105B包括图像传感器110A,110B。相机105A,105B可以是物理分离的,或者可以在同一主体或包装中。相机105A,105B可以是具有投影仪的有源立体相机,或者在其它实施例中,可以是没有投影仪的无源立体相机。可用于相机105A、105B的市售相机的示例包括RealsenseTM D415或D435相机或ZED Mini相机。当在24英寸的距离处对物体成像时,相机105A、105B可表现出约3mm或更小、2.5mm或更小、或2mm或更小的深度精度的均方根误差(RMSE)。相机105A,105B可以体现出密度,当在24英寸的距离处对物体成像时,该密度以像素/mm2为单位,定义深度像素的数量,其中,每单位成像区域的误差容限在2mm以内。

滤波器115A,115B放置在相机105A,105B的图像传感器的前面,或者在一些实施例中,放置在整个相机的前面,例如放置在相机105A,105B的物镜的前面。滤波器115A,115B被配置为阻挡具有高于室内农业环境中的平均环境强度的波长的光和/或选择性地使具有特定偏振的光通过。系统100还包括投影仪120,其被配置为将非均匀的并且在一些实施例中是偏振的光的图案投影到包括植物的场景上。投影仪120可以包括或采用激光发射器的形式,该激光发射器被配置为以基本上不被所述滤波器115A,115B衰减的频率发射激光器,以及在所述激光器的光路中的衍射光学元件122,衍射光学元件122被配置为产生作为非均匀点阵图的所述非均匀图案。衍射光学元件125可以包括偏振器或由偏振器替代,偏振器被配置为以偏振角偏振从从投影仪120投射的光,滤波器115A,115B被配置为选择性地使光通过。因此,图9所示的元件125可以代表衍射光学元件和/或偏振器。在一些实施例中,相机105A,105B可以是有源立体相机,其可以在与相机105A,105B的其它特征相同的封装或主体内包括投影仪120。

该系统还包括处理器130,其被配置为根据由立体相机对捕获的图像生成场景的深度图。处理器130可操作地连接到存储器135,例如磁盘驱动器或固态存储器,用于存储编程指令或记录的图像。

系统100还可以包括光谱分析仪140,其被配置为表征室内农业环境中的环境光功率谱,并提供具有低于室内农业环境中的平均环境强度的光的带宽的指示。光谱分析仪140可以与处理器130和/或存储器135通信,以接收指令或输出结果。

第二投影仪145可以被包括在系统100中,并且被配置为利用在由滤波器115A,115B选择性地通过的频段中的非图案化光源来照明场景。

系统100可以包括在图10中示意性示出的机器人收割机300中。机器人收割机可以包括自己的处理器330,其中,处理器330与系统100的处理器130通信,或者可以与处理器130通信并由处理器130操作。收割机300可以被配置为使用例如机器人臂305从系统100所识别的位置收割农产品205。机器人收割机300可包括轮子310或履带或其它形式的动力装置,以在整个环境中移动,来自环境中的不同植物200的收割产品205。

已经如此描述了至少一种实施方式的几个方面,应当理解,本领域技术人员将容易想到各种改变、修改和改进。这种改变,修改和改进是本公开的一部分,并且在本公开的精神和范围内。本文所公开的方法的动作可以以不同于所示的交替顺序来执行,并且可以省略,替换或添加一个或多个动作。本文所公开的任何一个示例的一个或多个特征可以与所公开的任何其它示例的一个或多个特征组合或替代。因此,前面的描述和附图仅作为示例。

本文所用的措辞和术语是出于描述的目的,不应被认为是限制性的。如本文所用,术语“多个”是指两个或更多个项目或组件。如本文所用,被描述为“基本相似”的尺寸应被视为彼此相差约25%以内。术语“包括”、“包含”、“带有”、“具有”、“含有”和“涉及”,无论是在书面说明还是权利要求等中,都是开放式术语,即表示“包括但不仅限于”。因此,这种术语的使用意味着包括其后列出的项目及其等同物,以及附加的项目。对于权利要求,仅连接短语“由……组成”和“基本上由……组成”分别是封闭或半封闭的连接短语。在权利要求中使用诸如“第一”、“第二”、“第三”等序数词来修饰权利要求要素,其本身并不意味着一个权利要求要素相对于另一个权利要求要素的任何优先权、优先级或顺序或时间方法的动作执行的顺序,但仅用作标签以将具有特定名称的一个权利要求要素与具有相同名称的另一个要素(但用于序数词)区分开来,以区分权利要求要素。

26页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:作业车、收割机以及作业机

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!