一种基于像素概率分布统计的熵最大化涂卡识别方法

文档序号:1832024 发布日期:2021-11-12 浏览:9次 >En<

阅读说明:本技术 一种基于像素概率分布统计的熵最大化涂卡识别方法 (Entropy maximization card-smearing identification method based on pixel probability distribution statistics ) 是由 田博帆 于 2021-07-20 设计创作,主要内容包括:本发明涉及一种基于像素概率分布统计的熵最大化涂卡识别方法,具体包括以下步骤:S1答题卡对齐:将已涂答题卡与空白答题卡对齐;S2试卷模板相减:将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存,再对空白答题卡和已涂答题卡的数字化矩阵做减法操作,得到像素差值集合矩阵;S3涂卡答案区定位;S4裁剪获取答案区:根据步骤S3获得每个小题所对应的填涂答案区坐标,利用填涂答案区坐标对每个小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域;S5区域像素灰度统计;S6计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵;S7识别结果判断获得涂卡结果。(The invention relates to an entropy maximization card-smearing identification method based on pixel probability distribution statistics, which specifically comprises the following steps: s1 answer sheet alignment: aligning the coated answer sheet with the blank answer sheet; s2 subtraction of test paper templates: storing the read-in digital matrix images of the blank answer sheet and the coated answer sheet, and then carrying out subtraction operation on the digital matrices of the blank answer sheet and the coated answer sheet to obtain a pixel difference value set matrix; s3 positioning the answer area of card coating; s4 cutting to obtain a solution area: according to the step S3, acquiring the coordinates of the filled-in answer area corresponding to each small question, and respectively cutting each small question by using the coordinates of the filled-in answer area to acquire a blank answer sheet answer cutting area and a coated answer sheet answer cutting area; s5 area pixel gray statistics; s6, calculating the maximum entropy of the image of the blank answer sheet answer cutting area and the image of the painted answer sheet answer cutting area; s7 judges the result to obtain the card-coating result.)

一种基于像素概率分布统计的熵最大化涂卡识别方法

技术领域

本发明涉及计算机应用技术领域,尤其涉及一种基于像素概率分布统计的熵最大化涂卡识别方法。

背景技术

随着技术的不断迭代更新,在自动化批阅领域诞生了许多新的技术方法,如某些自动识别方法可以一改过去传统方法的弊端,带来更多的便捷性和最佳的用户体验感,从而得到广泛应用。

在答题卡涂卡识别方面,传统的涂卡识别方法存在着较多的局限性,通常需要必备一台特定的扫描阅卡机。由于传统涂卡识别方法是基于涂卡颜料中所含的碳含量做为填涂识别的参考标准,导致对识别场景的要求和填涂的规范都较为苛刻,同时对使用的涂卡纸张也有较高的要求。传统涂卡识别方法不仅受限于纸张的厚度、涂卡铅笔的类型等,甚至需要有固定的答题卡规范设计形式。正是这些必要的条件因素,导致其不便于通用化地使用,对考生的填涂规范也提出了更高的要求。

现有技术中关于答题卡的识别是基于规范格式的扫描系统所得到的图像数据,而对于智能手机移动终端而言,其对于答题卡的拍照存在种客观因素的影响,使得不同手机不同环境得到的图像互不相同,给正确识别答题卡内容带来严重干扰,另一方面,答题卡种类多样,格式各不相同现有的识别系统不能灵活根据答题卡的样式选择相对应的识别规则,造成应用上的限制。

发明内容

本发明要解决的技术问题是,提供一种基基于像素概率分布统计的熵最大化涂卡识别方法,能够不受限于答题卡的涂卡形式和答题卡的纸张样式,实现达到答题卡涂卡识别的目的,主要用于解决传统方法所带来的不足问题,摆脱更多的条件束缚,有着更加合理且人性化的识别转变。

为了解决上述技术问题,本发明采用的技术方案是:该基于像素概率分布统计的熵最大化涂卡识别方法,具体包括以下步骤:

S1答题卡对齐:将已涂答题卡与空白答题卡对齐;

S2试卷模板相减:将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存,分别记作:I0和I1;再对空白答题卡和已涂答题卡的数字化矩阵做减法操作,得到像素差值集合矩阵Id,记作:Id=I1-I0

S3涂卡答案区定位:首先对每个小题的题号进行识别,得到题号字符的坐标;再结合题号次序对题号次序坐标进行排序分析,获得每个小题的横纵分布并记录每个题号所对应的字符的坐标位置,再经过处理和分析后统计获得每道小题对应的填涂答案区的坐标和答案总个数并对答案总个数进行编号;

S4裁剪获取答案区:根据步骤S3获得每个小题所对应的填涂答案区坐标,利用填涂答案区坐标对每个小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域;

S5区域像素灰度统计:根据步骤S2得到的像素差矩阵Id,统计不同像素灰度值的分布D(X),再结合像素差矩阵Id,获得已填涂且近似黑色像素的概率密度函数FX(x);

S6图像最大化熵计算:根据步骤S5的概率密度函数FX(x)和像素差矩阵Id,计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵;

S7识别结果判断:根据步骤S1~S6完成空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像最大化熵的计算,再计算已填涂且近似黑色像素的占比大小P,再判断获得涂卡结果。

采用上述技术方案,首先采用图像定位技术获取空白答题卡和已涂答题卡对应的答案区进行裁剪;接着,将裁剪得到的答案区域图像做像素灰度值的概率分布统计并计算出对应的最大熵;最后,根据对应答案区的关系做答案结果的进行判断,实现答题卡的涂卡识别,该识别方法能够不受限于答题卡的涂卡形式和答题卡的纸张样式,实现达到答题卡涂卡识别的目的,解决了传统方法所带来的不足问题,摆脱更多的条件束缚,有着更加合理且人性化的识别转变。

作为本发明的优选技术方案,所述步骤S1答题卡对齐的具体包括以下步骤:

S11:选定两张答题卡分别为空白答题卡和已涂答题卡,且空白答题卡和已涂答题卡都存在背景色,空白答题卡背景色为非纯白色;

S12:选择从空白答题卡和已涂答题卡的左上角点(0,0)开始,随机裁剪一个固定大小的图像区域,分别得到空白答题卡区域图像和已涂答题卡区域图像,再通过仿射变换算法计算出空白答题卡区域图像的和已涂答题卡区域图像坐标偏移量offset和缩放比例s;其中放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放,作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像,具体变换如公式1-1所示;

通过公式的变换矩阵得知,仿射变换的变换矩阵有6个自由度,表示为:(scos(θ),-ssin(θ),tx,ssin(θ),scos(θ),ty);其中s为缩放倍数即缩放比例;θ为仿射迭代的限定角度;t为平移自由度,tx为水平方向的平移自由度,ty为垂直方向的平移自由度。

S13:将空白答题卡区域图像的坐标偏移量offse和缩放比例s的大小作用至已涂答题卡图像上,使空白答题卡和已涂答题卡达到近似对齐的状态。

作为本发明的优选技术方案,所述步骤S3涂卡答案区定位具体步骤为:

S31:采用Yolo v3目标识别网络对空白答题卡中的题号做识别和检测,它将输入图像分为13x13、26x26、52x52的网格,每个格子负责预测中心在此格子中的题号字符;每个格子预测出3个bounding box,每个bounding box预测内容包括:字符的具体坐标、置信度和所属的类别概率;最终获得每个题号字符的具体坐标,再结合题号次序对题号字符坐标进行上下左右排序分析,得出每个小题的横纵分布情形,并记录所有题号对应的字符的坐标位置;

S32:采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析,用于识别和定位答案的坐标位置;其中水平投影算法目的是对目标识别遗漏的答案做补充,若目标识别丢失了字符B,水平投影根据每个字符在水平方向投影的间隔相等原则,依次排序并分析确认丢失的答案为字符B;

S33:根据记录的题号字符的坐标,统计每道小题对应的填涂答案区的答案的总个数,并依次对答案总个数进行编号;其中对答案总个数依次编号为:1,2,3,4,...;对应的结果分别为:A,B,C,D,...。

作为本发明的优选技术方案,所述步骤S32中的目标检测算法采用faster rcnn算法或SSD算法。

作为本发明的优选技术方案,所述步骤S5具体步骤为:

S51:根据步骤S2得到的像素差矩阵Id,统计不同像素灰度值的分布,记作:D(X);其中,X为像素灰度值的连续随机变量;

S52:根据像素灰度值的分布统计,设定自定义的像素灰度值区域的范围Ri,记作:Ri=[v1,v2](v1<v2;v1∈[0,255),v2∈(0,255]);

其中,v1和v2均为像素灰度值大小;

S53:再根据像素差矩阵Id和像素灰度值分布D(X),得到已填涂且近似黑色像素的概率密度函数FX(x),记作:

作为本发明的优选技术方案,所述步骤S6中的计算公式为1-2所示;

其中,xi为像素差矩阵Id中的随机像素值,n为不大于零的像素值个数。

作为本发明的优选技术方案,所述步骤S7中的占比大小的计算公式为1-3所示:

其中Id是像素差矩阵。

作为本发明的优选技术方案,所述步骤S7中判断获得涂卡结果的方法具体为:结合已涂答题卡的规范性要求,自定义符合占比的最大值和最大化熵的设置经验值分别为:70%和70;若不满足此条件,则表示该区域未被填涂,否则为已填涂。

与现有技术相比,本发明具有的有益效果是:首先采用图像定位技术获取空白答题卡和已涂答题卡对应的答案区进行裁剪;接着,将裁剪得到的答案区域图像做像素灰度值的概率分布统计并计算出对应的最大熵;最后,根据对应答案区的关系做答案结果的进行判断,实现答题卡的涂卡识别,该识别方法能够不受限于答题卡的涂卡形式和答题卡的纸张样式,实现达到答题卡涂卡识别的目的,解决了传统方法所带来的不足问题,摆脱更多的条件束缚,有着更加合理且人性化的识别转变。

附图说明

下面结合附图进一步描述本发明的技术方案:

图1是本发明的基于像素概率分布统计的熵最大化涂卡识别方法的流程图;

图2是采用本发明的基于像素概率分布统计的熵最大化涂卡识别方法进行识别的效果图。

具体实施方式

为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。

实施例:如图1所示,该基于像素概率分布统计的熵最大化涂卡识别方法,具体包括以下步骤:

S1答题卡对齐:将已涂答题卡与空白答题卡对齐;

所述步骤S1答题卡对齐的具体包括以下步骤:

S11:选定两张答题卡分别为空白答题卡和已涂答题卡,且空白答题卡和已涂答题卡都存在背景色,空白答题卡背景色为非纯白色;

S12:选择从空白答题卡和已涂答题卡的左上角点(0,0)开始,随机裁剪一个固定大小的图像区域,分别得到空白答题卡区域图像和已涂答题卡区域图像,再通过仿射变换算法计算出空白答题卡区域图像的和已涂答题卡区域图像坐标偏移量offset和缩放比例s;放射变换算法是通过引入含有平移特性的齐次变换矩阵做s倍缩放,作用于待矫正的图像将其变换至矫正后的图像矩阵以获得矫正的图像,具体变换如公式1-1所示:

通过公式的变换矩阵得知,仿射变换的变换矩阵有6个自由度,表示为:(scos(θ),-ssin(θ),tx,ssin(θ),scos(θ),ty);其中s为缩放倍数即缩放比例;θ为仿射迭代的限定角度;t为平移自由度,tx为水平方向的平移自由度,ty为垂直方向的平移自由度;

S13:将空白答题卡区域图像的坐标偏移量offse和缩放比例s的大小作用至已涂答题卡图像上,使空白答题卡和已涂答题卡达到近似对齐的状态;

S2试卷模板相减:将读入的空白答题卡和已涂答题卡的数字化矩阵图像保存,分别记作:I0和I1;再对空白答题卡和已涂答题卡的数字化矩阵做减法操作,得到像素差值集合矩阵Id,记作:Id=I1-I0

S3涂卡答案区定位:首先对每个小题的题号进行识别,得到题号字符的坐标;再结合题号次序对题号次序坐标进行排序分析,获得每个小题的横纵分布并记录每个题号所对应的字符的坐标位置,再经过处理和分析后统计获得每道小题对应的填涂答案区的坐标和答案总个数并对答案总个数进行编号;

所述步骤S3涂卡答案区定位具体步骤为:

S31:采用Yolo v3目标识别网络对空白答题卡中的题号做识别和检测,它将输入图像分为13x13、26x26、52x52的网格,每个格子负责预测中心在此格子中的题号字符;每个格子预测出3个bounding box,每个bounding box预测内容包括:字符的具体坐标、置信度和所属的类别概率;最终获得每个题号字符的具体坐标,再结合题号次序对题号字符坐标进行上下左右排序分析,得出每个小题的横纵分布情形,并记录所有题号对应的字符的坐标位置;

S32:采用目标检测算法和水平投影算法对空白答题卡的图像字符作进一步的处理和分析,用于识别和定位答案的坐标位置;其中水平投影算法目的是对目标识别遗漏的答案做补充,若目标识别丢失了字符B,水平投影根据每个字符在水平方向投影的间隔相等原则,依次排序并分析确认丢失的答案为字符B;其中目标检测算法采用faster rcnn算法或SSD算法;

S33:根据记录的题号字符的坐标,统计每道小题对应的填涂答案区的答案的总个数,并依次对答案总个数进行编号;其中对答案总个数依次编号为:1,2,3,4,...;对应的结果分别为:A,B,C,D,...;

S4裁剪获取答案区:根据步骤S3获得每个小题所对应的填涂答案区坐标,利用填涂答案区坐标对每个小题分别裁剪获取空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域;

S5区域像素灰度统计:根据步骤S2得到的像素差矩阵Id,统计不同像素灰度值的分布D(X),再结合像素差矩阵Id,获得已填涂且近似黑色像素的概率密度函数FX(x);

所述步骤S5的具体步骤为:

S51:根据步骤S2得到的像素差矩阵Id,统计不同像素灰度值的分布,记作:D(X);其中,X为像素灰度值的连续随机变量;

S52:根据像素灰度值的分布统计,设定自定义的像素灰度值区域的范围Ri,记作:Ri=[v1,v2](v1<v2;v1∈[0,255),v2∈(0,255]);

其中,v1和v2均为像素灰度值大小;

S53:根据像素差矩阵Id和像素灰度值分布D(X),得到已填涂且近似黑色像素的概率密度函数FX(x),记作:

S6图像最大化熵计算:根据步骤S5的概率密度函数FX(x)和像素差矩阵Id,计算空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像的最大化熵;

所述步骤S6中的计算公式为1-2所示;

其中,xi为像素差矩阵Id中的随机像素值,n为不大于零的像素值个数;

S7识别结果判断:根据步骤S1~S6完成空白答题卡答案裁剪区域和已涂答题卡答案裁剪区域的图像最大化熵的计算,再计算已填涂且近似黑色像素的占比大小P,再结合已涂答题卡的规范性要求,自定义符合占比的最大值和最大化熵的设置经验值分别为:70%和70;若不满足此条件,则表示该区域未被填涂,否则为已填涂,从而获得涂卡结果,如图2所示。

所述步骤S7中的占比大小的计算公式为1-3所示:

其中Id是像素差矩阵。

对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:指甲关键点检测方法、装置、电子设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!