一种箱号识别方法和装置

文档序号:1253280 发布日期:2020-08-21 浏览:7次 >En<

阅读说明:本技术 一种箱号识别方法和装置 (Box number identification method and device ) 是由 王宸 罗永祥 刘键涛 魏秋新 于 2020-04-10 设计创作,主要内容包括:一种箱号识别方法和装置,包括如下步骤:1)输入集装箱原始图片;2)使用图像语义分割模型进行箱面粗定位,分割出图像中的集装箱,进行图像预处理,得到箱型图像;3)采用CPTN模型对箱型图像进行文本检测;4)采用CRNN模型对文本检测的所有结果进行OCR识别;5)将识别结果按照箱号格式进行正则化,输出最终的箱号。(A box number identification method and device comprises the following steps: 1) inputting an original picture of the container; 2) roughly positioning the box surface by using an image semantic segmentation model, segmenting containers in the image, and preprocessing the image to obtain a box type image; 3) performing text detection on the box-type image by adopting a CPTN (continuous phase propagation) model; 4) performing OCR recognition on all results of the text detection by adopting a CRNN model; 5) and regularizing the identification result according to a box number format, and outputting a final box number.)

一种箱号识别方法和装置

技术领域

本发明涉及集装箱领域,特别是指一种箱号识别方法和装置。

背景技术

随着科技进步与世界各国贸易的巨大增长,物流运输行业逐年加速发展,其中全球海运量逐年创下新高。集装箱作为海运的主要运输装载方式,在海运中有着十分重要的地位。在海运繁荣的同时,对集装箱的管理需要更加现代化的手段,实现对巨量的集装箱进行追踪、货物中转与货船存储规划等目的。

集装箱箱号是每个集装箱的专有标识码,对箱号进行自动识别是对集装箱进行各种高效管理操作的基础,如:所属公司、集装箱追踪、货物中转等。然而,由于全球对于集装箱箱号自动化识别并没有制定统一的标准,目前主要是使用图像处理技术实现对箱号的自动识别。但是,对错误识别的集装箱只能通过人工识别记录与校对箱号,这无疑增加了人力成本与流转时间。

目前,箱号识别系统对于箱号中残缺、粘连等字符,不能进行完整分割;同时对于分割出的残缺字符识别准确率低。而对于错误识别的集装箱仍然只能通过人工识别记录与校对箱号,这无疑增加了人力成本与流转时间。现有箱号识别技术采用单个字符进行识别,识别速度较慢;并且带有箱号的图像有些存在一定拍摄的角度,识别准确率较低。

发明内容

本发明的主要目的在于克服现有技术中的上述缺陷,提出一种箱号识别方法和装置,具有更高的识别准确率和识别速率。

本发明采用如下技术方案:

一种箱号识别方法,其特征在于,包括如下步骤:

1)输入集装箱原始图片;

2)使用图像语义分割模型进行箱面粗定位,分割出图像中的集装箱,进行图像预处理,得到箱型图像;

3)采用CPTN模型对箱型图像进行文本检测;

4)采用CRNN模型对文本检测的所有结果进行OCR识别;

5)将识别结果按照箱号格式进行正则化,输出最终的箱号。

优选的,所述图像语义分割模型为TextonForest、基于随机森林分类器或深度学习方法。

优选的,采用基于卷积神经网络的图像语义分割模型。

优选的,所述图像预处理包括开运算,闭运算和最小外接矩阵以去除图像中的噪声。

优选的,步骤3)中,还包括对文本检测结果进行透射变换以调整角度。

优选的,步骤4)中所述CRNN模型包括:卷积层、循环层和转录层,该卷积层从输入图像中提取特征序列;该循环层预测每一帧的标签分布,该转录层将每一帧的预测变为最终的标签序列。

一种箱号识别装置,其特征在于,包括:

输入模块,用于输入集装箱原始图片;

粗定位模块,采用图像语义分割模型进行箱面粗定位,分割出图像中的集装箱,进行图像预处理,得到箱型图像;

文本检测模块,采用CPTN模型对箱型图像进行文本检测;

OCR识别模块,采用CRNN模型对文本检测的所有结果进行OCR识别;

输出模块,将识别结果按照箱号格式进行正则化,输出最终的箱号。

由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:

1、本发明的方法和装置,采用CPTN+CRNN,该方法可以是端到端的识别,不需要进行字符分割,识别的速度更快,识别效果更好。

2、本发明的方法和装置,采用卷积神经网络结构的语义分割模型,该模型具有学习能力,能够适应多角度多场景的箱面定位。

3、本发明的方法和装置,有效减少了人工校验记录成本,减少了集装箱流转时间,加快了港口工作效率。

附图说明

图1为本发明方法流程图;

图2为本发明输入集装箱原始图片;

图3为基于卷积神经网络的图像语义分割模型图;

图4为图像语义分割模型的效果图;

图5为分割出的箱面图像;

图6为箱型的文本检测示意图;

图7为存在角度问题的箱型图片示意图;

图8为透射变换前后示意图;

图9为CRNN模型结构图;

图10为输出结果示意图;

以下结合附图和具体实施例对本发明作进一步详述。

具体实施方式

以下通过具体实施方式对本发明作进一步的描述。

一种箱号识别方法,包括如下步骤:

1)输入集装箱原始图片,参见图1,其不限于灰度图,可以是彩色图片。

2)使用图像语义分割模型进行箱面粗定位,分割出图像中的集装箱,进行图像预处理,得到箱型图像,参见图5。

该步骤中的图像语义分割模型用于实现在像素级别上的分类,可采用TextonForest、基于随机森林分类器或深度学习方法等语义分割方法实现,优选的,采用基于卷积神经网络的图像语义分割模型,其网络结构如图3,从左到右依次是:卷积层、池化层、上采样层、卷积层、上采样层和全连接层。语义分割后的效果如图4。

卷积层是卷积神经网络的重要组成部分,通过卷积运算可以提取输入数据的特征。池化层也叫做上采样层,它可以压缩信号特征,降低网络计算复杂度,减少下一层的计算量,防止过拟合。全连接层可以起到连接的作用,将卷积层与普通神经网络层连接起来。

其中,图像预处理包括开运算,闭运算和最小外接矩阵以去除图像中的噪声,裁剪出完整的箱面。

3)采用CPTN模型对箱型图像进行文本检测,该模型可以进行不定长序列文本检测,通过该CPTN模型可以检测箱面上的文字位置,参见图6。该CPTN模型为训练好的CPTN模型。该步骤通过目标检测方法将图像中每一行里的每个字给框出来,然后把每一行里所有字的框合并,得到一行文字的框。

另外,因存在集装箱图片存在拍摄角度问题,例如参见图7,可对裁剪的文字进行透射变换,实现角度调整,参见图8。

4)采用CRNN模型对文本检测的所有结果进行OCR识别,通过该方法把图像中每一行文字里的每个字给识别出来。CRNN为端到端文字识别模型,该模型不需要字符分割,且可以识别任意长度的序列。

具体的,参见图9,该CRNN模型从上到下包括卷积层、循环层和转录层,该卷积层从输入图像中提取特征序列;该循环层预测每一帧的标签分布,该转录层将每一帧的预测变为最终的标签序列,即为识别结果。

5)将识别结果按照箱号格式进行正则化,通过正则化防止模型过拟合,输出最终的箱号。例如:箱号的格式是4个字母+7个数字(DRYU4128939),将所有识别结果按照“4个字母+7个数字”进行正则化,即可输出箱号。

本发明还提出一种箱号识别装置,采用上述的方法实现箱号识别,包括:

输入模块,用于输入集装箱原始图片。

粗定位模块,采用图像语义分割模型进行箱面粗定位,分割出图像中的集装箱,进行图像预处理,得到箱型图像。

文本检测模块,采用CPTN模型对箱型图像进行文本检测。

OCR识别模块,采用CRNN模型对文本检测的所有结果进行OCR识别。

输出模块,将识别结果按照箱号格式进行正则化,输出最终的箱号。

上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种合格证识别装置及合格证识别方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!