CN110634159A - 一种目标检测方法和装置 - Google Patents
一种目标检测方法和装置 Download PDFInfo
- Publication number
- CN110634159A CN110634159A CN201810642205.8A CN201810642205A CN110634159A CN 110634159 A CN110634159 A CN 110634159A CN 201810642205 A CN201810642205 A CN 201810642205A CN 110634159 A CN110634159 A CN 110634159A
- Authority
- CN
- China
- Prior art keywords
- histogram
- dimensional coordinate
- point
- point cloud
- angle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S17/00—Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
- G01S17/02—Systems using the reflection of electromagnetic waves other than radio waves
- G01S17/06—Systems determining position data of a target
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
Abstract
本发明公开了一种目标检测方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标;通过利用深度残差网络构造的网络模型,对所述柱状图进行卷积和降采样,得到多通道特征图;对所述多通道特征图进行反卷积,得到与所述柱状图相同大小的两通道特征图;根据所述两通道特征图,确定检测目标所在的位置信息。该实施方式能够直接对激光点云数据进行处理来检测其中的检测目标,而不依赖于激光雷达和摄像头之间的标定,从而提高检测结果的准确性和可靠性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种目标检测方法和装置。
背景技术
随着计算机技术的发展和图像技术的广泛应用,目标检测技术的应用场景也越来越广泛,目前在自动驾驶领域,车辆检测大多都是依靠图像,因为图像的信息非常丰富,但是图像难以得到准确的位置信息,因此需要对激光雷达与摄像头进行标定,标定准确之后再把从图像中检测到的车辆映射到激光点云上,再根据点云上的位置信息做决策。如果标定得不准确,则映射到激光点云上的车辆的位置就不准确,从而会影响无人驾驶的决策。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有方法依赖于对激光雷达与摄像头的标定,检测结果的准确性和可靠性差。
发明内容
有鉴于此,本发明实施例提供一种目标检测方法和装置,能够直接对激光点云数据进行处理来检测其中的检测目标,而不依赖于激光雷达和摄像头之间的标定,从而提高检测结果的准确性和可靠性。
为实现上述目的,根据本发明实施例的一个方面,提供了一种目标检测方法。
一种目标检测方法,包括:将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标;通过利用深度残差网络构造的网络模型,对所述柱状图进行卷积和降采样,得到多通道特征图;对所述多通道特征图进行反卷积,得到与所述柱状图相同大小的两通道特征图;根据所述两通道特征图,确定检测目标所在的位置信息。
可选地,将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标的步骤,包括:根据采集的点云数据的三维坐标的值,计算所述三维坐标对应的第一角度和第二角度;根据水平角分辨率、垂直角分辨率、所述第一角度和第二角度,得到所述三维坐标的点映射在所述柱状图上的二维坐标,其中,所述水平角分辨率为:激光雷达到所述点云数据中水平相邻的两个三维坐标点之间的最小角度差;所述垂直角分辨率为:所述激光雷达到所述点云数据中垂直相邻的两个三维坐标点之间的最小角度差,其中,一三维坐标对应的第一角度表示:该三维坐标的点在三维坐标轴的xy平面的投影点向水平方向偏离x轴的角度;该三维坐标对应的第二角度表示:该三维坐标的点向垂直方向偏离三维坐标轴的xy平面的角度,所述水平方向是沿着y轴的方向,所述垂直方向是沿着z轴的方向。
可选地,通过利用深度残差网络构造的网络模型,对所述柱状图进行卷积和降采样,得到多通道特征图的步骤,包括:选择深度残差网络的特定层对所述柱状图进行卷积,以得到卷积后的特征图;对所述卷积后的特征图在宽度维度上进行降采样,以得到所述多通道特征图。
可选地,根据所述两通道特征图,确定检测目标所在的位置信息的步骤,包括:比较所述两通道特征图的两个通道的输出值,根据所述比较的结果,确定所述两通道特征图每一点的标签,所述标签指示该点是否属于所述检测目标;选取标签指示为属于所述检测目标的各点,根据与所述选取的各点相对应的三维坐标,确定所述检测目标所在的位置信息。
根据本发明实施例的另一方面,提供了一种目标检测装置。
一种目标检测装置,包括:点云坐标映射模块,用于将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标;第一特征图生成模块,用于通过利用深度残差网络构造的网络模型,对所述柱状图进行卷积和降采样,得到多通道特征图;第二特征图生成模块,用于对所述多通道特征图进行反卷积,得到与所述柱状图相同大小的两通道特征图;位置信息确定模块,用于根据所述两通道特征图,确定检测目标所在的位置信息。
可选地,所述点云坐标映射模块还用于:根据采集的点云数据的三维坐标的值,计算所述三维坐标对应的第一角度和第二角度;根据水平角分辨率、垂直角分辨率、所述第一角度和第二角度,得到所述三维坐标的点映射在所述柱状图上的二维坐标,其中,所述水平角分辨率为:激光雷达到所述点云数据中水平相邻的两个三维坐标点之间的最小角度差;所述垂直角分辨率为:所述激光雷达到所述点云数据中垂直相邻的两个三维坐标点之间的最小角度差,其中,一三维坐标对应的第一角度表示:该三维坐标的点在三维坐标轴的xy平面的投影点向水平方向偏离x轴的角度;该三维坐标对应的第二角度表示:该三维坐标的点向垂直方向偏离三维坐标轴的xy平面的角度,所述水平方向是沿着y轴的方向,所述垂直方向是沿着z轴的方向。
可选地,所述第一特征图生成模块还用于:选择深度残差网络的特定层对所述柱状图进行卷积,以得到卷积后的特征图;对所述卷积后的特征图在宽度维度上进行降采样,以得到所述多通道特征图。
可选地,所述位置信息确定模块还用于:比较所述两通道特征图的两个通道的输出值,根据所述比较的结果,确定所述两通道特征图每一点的标签,所述标签指示该点是否属于所述检测目标;选取标签指示为属于所述检测目标的各点,根据与所述选取的各点相对应的三维坐标,确定所述检测目标所在的位置信息。
根据本发明实施例的又一方面,提供了一种电子设备。
一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明提供的目标检测方法。
根据本发明实施例的又一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明提供的目标检测方法。
上述发明中的一个实施例具有如下优点或有益效果:将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标;通过利用深度残差网络构造的网络模型,对柱状图进行卷积和降采样,得到多通道特征图;对多通道特征图进行反卷积,得到与柱状图相同大小的两通道特征图;根据两通道特征图,确定检测目标所在的位置信息。能够直接对激光点云数据进行处理来检测其中的检测目标,而不依赖于激光雷达和摄像头之间的标定,从而提高检测结果的准确性和可靠性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的目标检测方法的主要步骤示意图;
图2是根据本发明实施例的目标检测装置的主要模块示意图;
图3是本发明实施例可以应用于其中的示例性系统架构图;
图4是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的目标检测方法的主要步骤示意图。
如图1所示,本发明实施例的目标检测方法主要包括如下的步骤S101至步骤S104。
步骤S101:将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标。
采集的点云数据即通过激光雷达采集的点云,点云中的点有各自的三维坐标。
步骤S101具体可以包括:根据采集的点云数据的三维坐标的值,计算该三维坐标对应的第一角度和第二角度;根据水平角分辨率、垂直角分辨率、计算出的第一角度和第二角度,得到该三维坐标的点映射在柱状图上的二维坐标。
其中,水平角分辨率为:激光雷达到点云数据中水平相邻的两个三维坐标点之间的最小角度差;垂直角分辨率为:激光雷达到点云数据中垂直相邻的两个三维坐标点之间的最小角度差。
某一三维坐标对应的第一角度表示:该三维坐标的点在三维坐标轴的xy平面的投影点向水平方向偏离x轴的角度;该三维坐标对应的第二角度表示:该三维坐标的点向垂直方向偏离三维坐标轴的xy平面的角度,其中,水平方向是沿着y轴的方向,垂直方向是沿着z轴的方向。
柱状图上每一点具有四维特征,该四维特征包括该点对应的三维坐标(即三维空间坐标的x,y,z三个值)以及该点对应的激光反射强度。
步骤S102:通过利用深度残差网络构造的网络模型,对柱状图进行卷积和降采样,得到多通道特征图。
深度残差网络可以采用ResNet50网络,其为深度是50的深度残差网络,还可以采用ResNet101网络等其他深度残差网络。
步骤S102具体可以包括:选择深度残差网络的特定层对柱状图进行卷积,以得到卷积后的特征图;对卷积后的特征图在宽度维度上进行降采样,以得到多通道特征图。
步骤S103:对多通道特征图进行反卷积,得到与柱状图相同大小的两通道特征图。
步骤S104:根据两通道特征图,确定检测目标所在的位置信息。
步骤S104具体可以包括:比较两通道特征图的两个通道的输出值,根据该比较的结果,确定两通道特征图每一点的标签,该标签指示该点是否属于检测目标;选取标签指示为属于检测目标的各点,根据与该选取的各点相对应的三维坐标,确定检测目标所在的位置信息。
下面以无人驾驶领域检测车辆为例,介绍本发明实施例的目标检测方法。本发明实施例的目标检测方法不仅适用于检测车辆,还可以用于检测行人等其他目标。
为了检测出车辆的位置,需要把属于车辆的点云全部识别出来,从而根据点云的三维坐标得到车辆的位置信息。
首先,把激光雷达采集的点云映射到柱状图上,假定点云中某一点的三维坐标是(x,y,z),那么根据该三维坐标的值计算以下两个角度θ(即第一角度)和
(即第二角度):
其中,θ(即第一角度)表示该点在xy平面(即三维坐标轴中x轴和y轴形成的平面)的投影点(坐标为(x,y))向水平方向偏离x轴的角度;
(即第二角度)表示该点向垂直方向偏离xy平面(即三维坐标轴中x轴与y轴形成的平面)的角度。换言之,以W表示投影点,θ(即第一角度)即W与坐标原点(对应二维坐标即为(0,0),三维坐标即为(0,0,0))之间的连线与x轴的夹角。(即第二角度)即该(x,y,z)点与坐标原点(三维坐标为(0,0,0))之间的连线与xy平面的夹角。然后根据θ(即第一角度)和
(即第二角度),以及水平角分辨率Δθ和垂直角分辨率计算点(x,y,z)在柱状图上的二维坐标(X,Y),具体地,
从而将点(x,y,z)映射到柱状图上,对于点云中每个点按照上述过程映射到柱状图上,即完成将激光雷达采集的点云映射到柱状图上。其中,水平角分辨率Δθ为:激光雷达到点云数据中水平相邻的两个三维坐标点之间的最小角度差,其数值上等于水平相邻的两个三维坐标点对应的θ值之差的最小值;垂直角分辨率
为:激光雷达到点云数据中垂直相邻的两个三维坐标点之间的最小角度差,其数值上等于垂直相邻的两个三维坐标点对应的值之差的最小值。需要说明的是,上述水平方向指的是沿着y轴的方向,垂直方向指的是沿着z轴的方向,同理,水平相邻的两个三维坐标点指的是在y轴方向相邻的两个三维坐标点,垂直相邻的两个三维坐标点指的是在z轴方向相邻的两个三维坐标点。
假定激光雷达的传感器有16线,每条线发射2016个点,那么柱状图就是16*2016的点阵,16是图像的高度,2016是图像的宽度,单位是像素点。柱状图的每个位置(即点,或称像素点)有四个特征(四维特征):即点云的x、y、z坐标,以及激光雷达在点云的反射强度(激光反射强度)。该四维特征是点云中每个点都包含的特征。从而,对于每一帧点云,可以得到4*16*2016的三维的矩阵,如果在柱状图的某个位置上丢失了点云,那么该位置的四维特征用0补充。
在得到柱状图后,通过利用ResNet50网络(一种深度是50的深度残差网络)构造的网络模型,对柱状图进行卷积操作。该网络模型不是采用ResNet50网络网络的所有层,而是只保留res5c_relu(一个激活层)及其之前的层,res5c_relu后面的层对于本发明实施例的车辆检测任务没有用途,导致信息丢失。同时,由于柱状图的高度只有16,因此对ResNet50网络的降采样层进行修改(网络模型中保留的ResNet50网络的层中只有一个降采样层),改为只在宽度这一维度上进行缩小。具体地,将ResNet50网络原降采样层的步长(在宽度和高度这两个维度上都是2),改为在宽度维度的步长为2,在高度维度的步长为1。从而,经过降采样之后,在宽度这一维度上将缩小为原来的维度的二分之一,而高度这一维的维度不变。此外,对ResNet50网络的所有步长为2的卷积层进行修改,改为在宽度维度上的步长为2,高度维度上的步长为1,而卷积核的大小仍然是原ResNet50网络的3*3或5*5等,而不必改成1*3或1*5等,这样做的好处在于,使得在网络模型的训练阶段,即保证了高度这一维不发生维度的减小,并且也可以让卷积层学习到了3*3区域或5*5区域的特征,而不是1*3或1*5区域的特征,换言之,使得卷积层也学习到了高度这一维的临近的特征。通过上述修改,即利用ResNet50网络构造得到本发明实施例的网络模型。
柱状图在经过上述构造的网络模型进行卷积与降采样之后,在高度这一维的维度没发生变化,而宽度这一维缩小为原来的三十二分之一的大小,即得到了2048*16*63的多通道特征图,2048是通道数,16*63是特征图的大小。
在构造的网络模型后面连接一个反卷积层,该反卷积层的卷积核的数量是2,卷积核的大小是1*64,即卷积核的高度是1,宽度是64;高度这一维的步长是1,宽度这一维的步长是32。经过反卷积的操作之后,得到2*16*2016的两通道特征图,其中,2代表两个通道,16*2016是两通道特征图的大小,从而通过反卷积层将两通道特征图还原到与源输入(柱状图)相同的大小。
比较两通道特征图中16*2016个点(即位置)中每个点的两通道(第一通道和第二通道)的输出值,例如,对于某一点,第一通道的输出值大于第二通道的输出值,则该点标签为1,表示该点属于车辆,否则,该点标签为0,表示该点不属于车辆。两通道特征图中每个点对应一三维坐标,即与输入网络模型的柱状图中对应相同位置的点所对应三维坐标(根据柱状图中点的四维特征得到该三维坐标的值)。
由于柱状图中的点是通过激光雷达采集的点云映射得到的,因此,确定出两通道特征图中所有点的标签,即确定出点云中每个点是否属于车辆,当属于车辆的部分点云全部被识别出来,车辆即被识别出来。根据属于车辆的点云的三维坐标,即两通道特征图中每个点对应的三维坐标,即可确定出车辆所在的位置信息,车辆所在的位置信息包括属于车辆的点云的各三维坐标。
根据上文所述,本发明实施例在在构造的网络模型后面连接一个反卷积层,从而构建出新的目标检测模型。在基于本发明实施例的目标检测模型检测车辆等目标之前,需要对该目标检测模型进行训练。在训练阶段,模型的学习采用反向传播算法,模型参数的学习采用随机梯度下降方法。具体地,在训练之前标注好训练样本的真值标签(指示是否为车辆),每次训练时根据标注好的真值标签,以及目标检测模型的输出结果,计算代价函数值(Loss值),不断地缩小Loss值,最后得到输出比较准确的标签。梯度下降通过使Loss值向当前点对应梯度的反方向不断移动,来降低Loss,随机梯度下降每次只更新一个训练样本所计算的梯度,其中,采用反向传播算法来求梯度。
在测试阶段,输入一帧新的点云,通过目标检测模型输出的学习准确的指示属于车辆的各点的标签,即可以根据这些点对应的点云中的三维坐标,得到车辆的位置信息。
通过本发明实施例的车辆检测方法,直接对激光点云数据进行处理,来检测其中的检测目标,而不依赖于激光雷达和摄像头之间的标定,从而提高检测结果的准确性和可靠性,进而也就不会影响无人驾驶的决策。
图2是根据本发明实施例的目标检测装置的主要模块示意图。
如图2所示,本发明实施例的目标检测装置200主要包括:点云坐标映射模块201、第一特征图生成模块202、第二特征图生成模块203、位置信息确定模块204。
点云坐标映射模块201用于将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标,柱状图上每一点具有四维特征,四维特征包括该点对应的三维坐标以及该点对应的激光反射强度。
点云坐标映射模块201具体可以用于:根据采集的点云数据的三维坐标的值,计算三维坐标对应的第一角度和第二角度;根据水平角分辨率、垂直角分辨率、第一角度和第二角度,得到三维坐标的点映射在柱状图上的二维坐标,其中,水平角分辨率为:激光雷达到点云数据中水平相邻的两个三维坐标点之间的最小角度差;垂直角分辨率为:激光雷达到所述点云数据中垂直相邻的两个三维坐标点之间的最小角度差。
第一特征图生成模块202用于通过利用深度残差网络构造的网络模型,对柱状图进行卷积和降采样,得到多通道特征图。
第一特征图生成模块202具体可以用于:选择深度残差网络的特定层对柱状图进行卷积,以得到卷积后的特征图;对卷积后的特征图在宽度维度上进行降采样,以得到多通道特征图。
第二特征图生成模块203用于对多通道特征图进行反卷积,得到与柱状图相同大小的两通道特征图。
位置信息确定模块204用于根据两通道特征图,确定检测目标所在的位置信息。
位置信息确定模块204具体可以用于:比较两通道特征图的两个通道的输出值,根据比较的结果,确定两通道特征图每一点的标签,标签指示该点是否属于所述检测目标;选取标签指示为属于检测目标的各点,根据与选取的各点相对应的三维坐标,确定检测目标所在的位置信息。
目标检测装置200的第二特征图生成模块的功能可以利用上述目标检测模型的反卷积层来实现。
通过本发明实施例的车辆检测装置,直接对激光点云数据进行处理,来检测其中的检测目标,而不依赖于激光雷达和摄像头之间的标定,从而提高检测结果的准确性和可靠性。
另外,在本发明实施例中所述目标检测装置的具体实施内容,在上面所述目标检测方法中已经详细说明了,故在此重复内容不再说明。
图3示出了可以应用本发明实施例的目标检测方法或目标检测装置的示例性系统架构300。
如图3所示,系统架构300可以包括终端设备301、302、303,网络304和服务器305。网络304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网络304可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备301、302、303通过网络304与服务器305交互,以接收或发送消息等。终端设备301、302、303上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备301、302、303可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器305可以是提供各种服务的服务器,例如对用户利用终端设备301、302、303所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的信息查询请求等数据进行分析等处理,并将处理结果(例如目标信息)反馈给终端设备。
需要说明的是,本发明实施例所提供的目标检测方法可以由服务器305或终端设备301、302、303执行,相应地,目标检测装置可以设置于服务器305或终端设备301、302、303中。
应该理解,图3中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图4,其示出了适于用来实现本申请实施例的服务器或终端设备的计算机系统400的结构示意图。图4示出的服务器或终端设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统400包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本发明公开的实施例,上文参考主要步骤示意图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤示意图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的主要步骤示意图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,主要步骤示意图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或主要步骤示意图中的每个方框、以及框图或主要步骤示意图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括点云坐标映射模块201、第一特征图生成模块202、第二特征图生成模块203、位置信息确定模块204。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,点云坐标映射模块201还可以被描述为“用于将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标;通过利用深度残差网络构造的网络模型,对所述柱状图进行卷积和降采样,得到多通道特征图;对所述多通道特征图进行反卷积,得到与所述柱状图相同大小的两通道特征图;根据所述两通道特征图,确定检测目标所在的位置信息。
根据本发明实施例的技术方案,将采集的点云数据的三维坐标,按照预设的映射规则映射为在柱状图上的二维坐标;通过利用深度残差网络构造的网络模型,对柱状图进行卷积和降采样,得到多通道特征图;对多通道特征图进行反卷积,得到与柱状图相同大小的两通道特征图;根据两通道特征图,确定检测目标所在的位置信息。能够直接对激光点云数据进行处理来检测其中的检测目标,而不依赖于激光雷达和摄像头之间的标定,从而提高检测结果的准确性和可靠性。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。