一种基于栅格的图片分离方法

文档序号:1832047 发布日期:2021-11-12 浏览:3次 >En<

阅读说明:本技术 一种基于栅格的图片分离方法 (Picture separation method based on grids ) 是由 王志锋 于 2021-07-20 设计创作,主要内容包括:本发明涉及一种基于栅格的图片分离方法,具体包括以下步骤:S1:利用ORB算法提取出空白图像和包含手写图像的特征向量;S2:利用图像特征配准所述空白图像和包含手写字的图像,使所述空白图像和包含手写字的图像中打印体的相对位置一致,获得新图像NP;S3:利用像素的栅格覆盖住所述空白图像,计算每个栅格内部像素的灰度的平均值h;取阈值n,当h&gt;n时标记该栅格为待删除状态;S4:获得步骤S3中所有待删除栅格的位置,将步骤S2中新图像NP中相同位置的栅格全部涂成白色,从而获得原始的手写体文字。该方法能从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变同时实现分离出结果更加可靠性的手写体字符图像。(The invention relates to a picture separation method based on grids, which specifically comprises the following steps: s1: extracting blank images and feature vectors containing handwritten images by using an ORB algorithm; s2: registering the blank image and the image containing the handwritten words by utilizing image features to enable the relative positions of the printing bodies in the blank image and the image containing the handwritten words to be consistent, and obtaining a new image NP; s3: covering the blank image by using grids of pixels, and calculating an average value h of the gray scale of the pixels in each grid; taking a threshold value n, and marking the grid as a state to be deleted when h is greater than n; s4: the positions of all the grids to be deleted in step S3 are obtained, and the grids at the same positions in the new image NP in step S2 are all painted white, thereby obtaining the original handwritten text. The method can completely separate clean handwritten font characters from the original image, and can ensure that the gray value of the handwritten font characters is unchanged and simultaneously realize the separation of the handwritten character image with more reliable result.)

一种基于栅格的图片分离方法

技术领域

本发明涉及图像处理技术领域,尤其涉及一种基于栅格的图片分离方法。

背景技术

伴随着人工智能和大数据技术在实际应用中的发展,智能化教育从互联网终端发起,开始逐渐被人们所熟知,正悄无声息地改变着人们的生活观念和生活方式。智能化教育的背后,离不开庞大的数据做支撑,其中在线教育平台和考试的自动化批阅平台都需要大数据的题库。

随着人工智能的广泛应用,智能OCR变的愈发火热。而与OCR相关的图像处理

技术领域

更是离不开人工智能和传统技术相结合的身影。

在当今较为流行的OCR识别方面,如:手写字符的提取涉及到复杂的手印分离技术,而传统的手印分离技术虽然有着很多优势,但也存在诸多弊端,如:分离结果存在其他干扰且不够理想,分离图丢失了原始的手写像素灰度信息等。

因此,本发明为了解决传统手印分离技术存在的弊端问题,针对印刷和手写分离不干净的情形,以及二值化导致手写字符信息的丢失情况。提出了一种图像栅格化的处理方式,它可从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。

发明内容

本发明要解决的技术问题是,提供一种基于栅格的图片分离方法,提供一种基于栅格的手写字体图像分离方法,旨在使用空白的图像和包含手写字符图像的基础上,利用栅格做进一步处理,最后分离出原始的、干净的手写字,以便识别;且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。

为了解决上述技术问题,本发明采用的技术方案是:该基于栅格的图片分离方法,具体包括以下步骤:

S1:利用ORB算法提取出空白图像和包含手写图像的特征向量;

S2:利用图像特征配准所述空白图像和包含手写字的图像,使所述空白图像和包含手写字的图像中打印体的相对位置一致,并获得新图像NP;

S3:利用n*n(3<n<10)像素的栅格覆盖住所述空白图像,计算每个栅格内部像素的灰度平均值h;取阈值p,当h>p时标记该栅格为待删除状态;

S4:获得步骤S3中所有待删除栅格的位置,将步骤S2中新图像NP中相同位置的栅格全部涂成白色,从而获得原始的手写体文字。

采用上述技术方案,针对印刷和手写分离不干净的情形,以及二值化导致手写字符信息的丢失情况;利用ORB算法提取出空白的图像和包含手写字符图像,再利用栅格作进一步处理,最后分离出原始的、干净的手写字,以便识别;可从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。

作为本发明的优选技术方案,所述步骤S1的所述ORB算法是基于FAST算法与BRIEF算法的算法组合,具体步骤为:

S11利用FAST算法寻找图像的关键点:设定一个像素点P,将像素点P与多个距离该像素点P的像素为2的像素点相比较,如果至少有一对连续像素点的亮度高于或低于像素点P,则将像素点P选作关键点,从而获取若干对关键点;

S12使用BRIEF算法将关键点转换为向特征量:根据步骤S11获取的若干对关键点创建特征向量。

作为本发明的优选技术方案,所述步骤S12的具体步骤为:

S121:以关键点P为圆心,以d为半径做圆A;

S122:在圆A内随机选择N对像素点,

S123:设(x,y)是其中的任意一对像素点,x表示像素点1,y表示像素点2;对该对像素点采用公式(1)进行转换,公式(1)为:

其中p(x),p(y)分别是像素点x,y的灰度值;

S124:重复N次步骤S123,从而获得一个长度为N的向量,该向量即为特征向量。

作为本发明的优选技术方案,所述步骤S2的具体步骤为:

S21:采用仿射变换矩阵描述手写字的图像中打印体的字迹和空白图像中字迹的偏差;

S22:仿射变换矩阵拥有6个自由度:a、b、c、d、e、f,利用下式(2)的形式法作用到某一个点上,公式(2)为:

其中(x,y)是旧的坐标点,即为包含手写字的图像上的坐标点;(x’,y’)是新的坐标点即为空白图像的坐标点;要计算出该仿射变换矩阵的6个自由度,至少需要3组对应的坐标点;

S23:根据步骤S1中获得两张图像的所有特征向量之后,再计算特征向量之间的汉明距离,如果该距离小于阈值N,那么就认定两张图像上的特征点能配成一对,再使用通用的最小二乘法计算仿射变换矩阵,最小二乘法是一种数学优化技术;通过最小化误差的平方和寻找数据的最佳函数匹配;

S24:在得到相应仿射变换矩阵之后,将该矩阵作用到包含手写字的图像就能得到一张消除误差后的新图像NP。

与现有技术相比,本发明具有的有益效果是:该基于栅格的图片分离方法可从原图像中完全分离出干净的手写字体字符,且能够保证其灰度值不变的条件下,分离出结果更加可靠性的手写体字符图像。

附图说明

下面结合附图进一步描述本发明的技术方案:

图1是本发明的基于栅格的图片分离方法的流程图;

图2是本发明的基于栅格的图片分离方法的分离后的效果图;

图3是采用本发明的基于栅格的图片分离方法对图2进行分离后的效果图。

具体实施方式

为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。

实施例:如图1所示,该基于栅格的图片分离方法,具体包括以下步骤:

S1:利用ORB算法提取出空白图像和包含手写图像的特征向量;

所述步骤S1的所述ORB算法是基于FAST算法与BRIEF算法的算法组合,具体步骤为:

S11利用FAST算法寻找图像的关键点:设定一个像素点P,将像素点P与多个距离该像素点P的像素为2的像素点相比较,如果至少有一对连续像素点的亮度高于或低于像素点P,则将像素点P选作关键点,从而获取若干对关键点;FAST是Features from AcceleratedSegments Test的简称;

S12使用BRIEF算法将关键点转换为向特征量:根据步骤S11获取的若干对关键点创建特征向量;BRIEF是Binary Robust Independent Elementary Features的简称,它的作用是根据一组关键点创建特征向量;

所述步骤S12的具体步骤为:

S121:以关键点P为圆心,以d为半径做圆A;

S122:在圆A内随机选择N对像素点,

S123:设(x,y)是其中的任意一对像素点,x表示像素点1,y表示像素点2;对该对像素点采用公式(1)进行转换,公式(1)为:

其中p(x),p(y)分别是像素点x,y的灰度值;

S124:重复N次步骤S123,从而获得一个长度为N的向量,该向量即为特征向量;

S2:利用图像特征配准所述空白图像和包含手写字的图像,使所述空白图像和包含手写字的图像中打印体的相对位置一致,并获得新图像NP;

包含手写字的图像中打印体的字迹是和空白图像一模一样的;但是由于扫描/打印的问题,会使打印体的相对位置出现偏差;这种偏差可以是“平移”、“旋转”、“缩放”,“剪切”等等原因或者他们的组合造成的;“配准”就是消除这种偏差,使两种图像中打印体的相对位置一致;数学上可以使用仿射变换矩阵矩阵描述这种偏差;

所述步骤S2的具体步骤为:

S21:采用仿射变换矩阵描述手写字的图像中打印体的字迹和空白图像中字迹的偏差;

S22:仿射变换矩阵拥有6个自由度:a、b、c、d、e、f,利用下式(2)的形式法作用到某一个点上,公式(2)为:

其中(x,y)是旧的坐标点,即为包含手写字的图像上的坐标点;(x’,y’)是新的坐标点即为空白图像的坐标点;要计算出该仿射变换矩阵的6个自由度,至少需要3组对应的坐标点;

S23:根据步骤S1中获得两张图像的所有特征向量之后,再计算特征向量之间的汉明距离,如果该距离小于阈值N,那么就认定两张图像上的特征点能配成一对,再使用通用的最小二乘法计算仿射变换矩阵,最小二乘法是一种数学优化技术;通过最小化误差的平方和寻找数据的最佳函数匹配;

S24:在得到相应仿射变换矩阵之后,将该矩阵作用到包含手写字的图像就能得到一张消除误差后的新图像NP;

S3:利用n*n(3<n<10)像素的栅格覆盖住所述空白图像,计算每个栅格内部像素的灰度平均值h;取阈值p,当h>p时标记该栅格为待删除状态;此实施例中具体是利用5*5像素的栅格覆盖住所述空白图像,计算每个栅格内部共25个像素的灰度的平均值h;取阈值n,当h>n时标记该栅格为待删除状态;

S4:获得步骤S3中所有待删除栅格的位置,将步骤S2中新图像NP中相同位置的栅格全部涂成白色,从而获得原始的手写体文字。如图2~图3所示,图2为原包含手写字的图像,图3为采用本发明的基于栅格的图片分离方法对图2进行分离后的效果图。

对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于特征加权与网络微调的小样本目标检测方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!