一种图像文字识别的方法及装置

文档序号：908017 发布日期：2021-02-26 浏览：6次 >En<

阅读说明：本技术 一种图像文字识别的方法及装置 (Image character recognition method and device ) 是由王晶于 2020-12-09 设计创作，主要内容包括：本发明公开了一种图像文字识别的方法及装置,包括图像文字识别的方法和图像文字识别的装置,该方法中,能够检测到图像中的文字,并识别出文字的内容,然后将其以文本的方式输出,本发明相对现有技术能够更快的识别图像中的文字内容,具有很高的识别准确度。而且本发明能够支持文字方向检测,对倾斜或倒置的图像自动进行校正,增强了文字识别的适用性。图像文字识别的装置,该装置能够检测到图像中的文字,并识别出文字的内容,然后将其以文本的方式输出,而且具有很高的识别速度和识别准确度。本装置能够支持文字方向检测,对倾斜或倒置的图像自动进行校正,增强了文字识别的适用性。(The invention discloses a method and a device for recognizing image characters, which comprises a method for recognizing image characters and a device for recognizing image characters. The invention can support character direction detection, automatically correct the inclined or inverted image, and enhance the applicability of character recognition. The device for recognizing the characters in the image can detect the characters in the image, recognize the content of the characters and output the characters in a text mode, and has high recognition speed and recognition accuracy. The device can support character direction detection, automatically correct inclined or inverted images, and enhance the applicability of character recognition.)

一种图像文字识别的方法及装置

技术领域

本发明涉及深度学习的技术领域，具体为一种图像文字识别的方法及装置。

背景技术

目前，目前多数图像文字识别系统只是能对一些标准的规整的图像进行文字检测和文字识别，一旦输入的文字图像与预期的不符，则会造成文字识别的准确度大幅降低，造成系统可用性不高。

有的图像文字识别系统只是简单的实现文字的检测与识别，未对要识别的图像进行分类处理，导致在处理一些特定类型的图片时，系统的准确率大大降低。

发明内容

本发明的目的在于提供一种图像文字识别的方法及装置，解决了现在密室逃脱游戏中缺少信息传递的装置的问题。

为实现上述目的，本发明提供如下技术方案：一种图像文字识别的方法，该方法包括：

A、首先获取文字图像，并对文字图像进行缩放、归一化处理，然后读取处理后的图像并识别图像文字方向；

B、根据图像文字方向的识别结果，对文字图像进行校正；

C、对校正后的文字图像进行缩放、归一化处理，然后读取校正后的文字图像；

D、确定图像中每行文字所在的区域坐标，并确定出图像中每行文字倾斜的角度；

E、获取每行文字所在图像的区域坐标，以及对应行文字的倾斜度，在图像中截取每个区域坐标位置的图片，保存为image box，将这些生成的image box进行缩放和归一化处理，将将处理后的image box存入链表；

F、获取链表，并且识别出传入图像的文字内容，并返回识别出的文字在字典中的下标。

进一步的，步骤A中行文字方向识别的角度包括90°、180°、270°。

进一步的，步骤B会根据步骤A的结果，对文字图像进行相应的校正。

进一步的，步骤C中对校正后的文字图像进行缩放、归一化处理，其内容包括：

C1、将文字图像缩放成符合文件检测模型需要的shape；

C2、对图像的RGB内容进行归一化处理。

进一步的，还包括对文字图像分类。

一种图像文字识别的装置，所述的装置包括：图像文字方向检测模块、文字检测模块、文字识别模块，

图像文字方向检测模块

获取文字图像，并对文字图像进行缩放、归一化处理，然后读取处理后的图像并识别图像文字方向；

根据图像文字方向的识别结果，对文字图像进行校正，并且对校正后的文字图像进行缩放、归一化处理；

文字检测模块

获取处理后的文字图像，确定图像中每行文字所在的区域坐标，并确定出图像中每行文字倾斜的角度；

获取每行文字所在图像的区域坐标，以及对应行文字的倾斜度，在图像中截取每个区域坐标位置的图片，保存为image box，将这些生成的image box进行缩放和归一化处理，将将处理后的image box存入链表；

文字识别模块

获取链表，并且识别出传入图像的文字内容，并返回识别出的文字在字典中的下标。

有益效果：

本发明提供了一种图像文字识别的方法。该方法中，能够检测到图像中的文字，并识别出文字的内容，然后将其以文本的方式输出。

本发明相对现有技术能够更快的识别图像中的文字内容，具有很高的识别准确度。而且本发明能够支持文字方向检测，对倾斜或倒置的图像自动进行校正，增强了文字识别的适用性。本发明提供了一种图像文字识别的装置，该装置能够检测到图像中的文字，并识别出文字的内容，然后将其以文本的方式输出，而且具有很高的识别速度和识别准确度。本装置能够支持文字方向检测，对倾斜或倒置的图像自动进行校正，增强了文字识别的适用性。

附图说明

图1为本发明的方法的示意图；

图2为本发明的装置的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“设置有”、“连接”等，应做广义理解，例如“连接”，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

请参阅附图，本发明提供的一种实施例：一种图像文字识别的方法，该方法包括：

A、首先获取文字图像，并对文字图像进行缩放、归一化处理，然后读取处理后的图像并识别图像文字方向；

B、根据图像文字方向的识别结果，对文字图像进行校正；

C、对校正后的文字图像进行缩放、归一化处理，然后读取校正后的文字图像；

D、确定图像中每行文字所在的区域坐标，并确定出图像中每行文字倾斜的角度；

F、获取链表，并且识别出传入图像的文字内容，并返回识别出的文字在字典中的下标。

上述方法的具体步骤为：

A、首先对文字图像进行缩放、归一化处理，然后将处理后的图像送入图像文字方向检测模型进行图像文字方向的识别；

B、根据图像文字方向检测模型的识别结果，对文字图像进行校正；

C、对校正后的文字图像进行缩放、归一化处理，然后将其输入到文字检测模型当中；

D、文字检测模型能够准确地识别出图像中文字所在的区域，并能够识别出图像中文字行倾斜的角度，然后将识别的文字区域(以行为单位)以及文字行的倾斜角度输出出来；

E、根据文字检测模型输出的单行文字所在图像的区域坐标，以及文字行的倾斜度，在图像中截取相应位置的图片，保存为一个image box，如果图像中有多行文字则会生成多个image box,将这些生成的image box进行缩放和归一化处理，将处理后的image box存入链表，-然后将该链表作为输入传入文字识别模型当中；

F、文字识别模型识别出传入图像的文字内容(每个image box返回一个识别结果)，并返回识别出的文字在字典中的下标。

具体的，步骤A中行文字方向识别的角度包括90°、180°、270°。

具体的，步骤B会根据步骤A的结果，对文字图像进行相应的校正。

具体的，步骤C中对校正后的文字图像进行缩放、归一化处理，其内容包括：

C1、将文字图像缩放成符合文件检测模型需要的shape；

C2、对图像的RGB内容进行归一化处理。

具体的，还包括对文字图像分类。

一种图像文字识别的装置，所述的装置包括：图像文字方向检测模块、文字检测模块、文字识别模块，

图像文字方向检测模块

获取文字图像，并对文字图像进行缩放、归一化处理，然后读取处理后的图像并识别图像文字方向；

根据图像文字方向的识别结果，对文字图像进行校正，并且对校正后的文字图像进行缩放、归一化处理；

文字检测模块

获取处理后的文字图像，确定图像中每行文字所在的区域坐标，并确定出图像中每行文字倾斜的角度；

文字识别模块

获取链表，并且识别出传入图像的文字内容，并返回识别出的文字在字典中的下标。

文字检测模块通过以下方式提高文字检测的精准度：

1、对文字图像进行分类，如：身份证图像、营业证图像等。每一种类型的图像文字所在区域相对固定，从而提高了文字检测的准确度；

2、对一些不太规整的图像进行校正处理，如有的图像因拍摄角度问题，造成图像发生变形(有的原本是矩形的图像因拍摄角度问题变成了梯形)，这时通过识别文字图像四个角的坐标，叫不规整的图像转换为规整的图像；

文字识别模块通过以下方式提高文字识别的精准度：

1、对文字图像进行分类训练，如：身份证图像、营业证图像等。从而增加了模型训练的针对性，提高了文字识别的准确度；

2、在传统文字识别的基础上增加分类处理的思想，从而提高文字识别的准确度，如：身份证照片上的性别只有男和女两个类别，不会出现其他的类别。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

7页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：用于定位服饰关键点的方法、装置和叠衣机

一种图像文字识别的方法及装置

相关技术

网友询问留言