字符批量识别方法、装置和计算机设备

文档序号:1490760 发布日期:2020-02-04 浏览:4次 >En<

阅读说明:本技术 字符批量识别方法、装置和计算机设备 (Character batch recognition method and device and computer equipment ) 是由 张凡 魏华 陈志� 于 2019-09-16 设计创作,主要内容包括:本发明实施例公开了一种字符批量识别方法、装置和计算机设备,包括:获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;获取对所述识别结果进行校对得到的校对结果;根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。上述方式,能够提高校对效率。(The embodiment of the invention discloses a method and a device for batch recognition of characters and computer equipment, wherein the method comprises the following steps: acquiring a target image set, wherein the target image set comprises a plurality of target images, the target images comprise character areas to be recognized, and the character areas comprise a plurality of target characters; carrying out segmentation recognition on the target characters in the character region to be recognized to obtain a single character image of each target character and a recognition result corresponding to the single character image, and displaying the single character image and the recognition result corresponding to the single character image; obtaining a proofreading result obtained by proofreading the identification result; and obtaining the recognition result of the character area to be recognized in each target image according to the proofreading result. By the aid of the mode, the correction efficiency can be improved.)

字符批量识别方法、装置和计算机设备

技术领域

本发明涉及图像识别技术领域,尤其涉及一种字符批量识别方法、装置和计算机设备。

背景技术

在很多应用场景下,纸质单据的填写是很重要的一项工作,如何将纸质单据与电子信息系统衔接起来是企业信息高效流转的一项重点工作。目前,纸质单据转电子单据的方法主要是采用人工录入的方式,这样的方式使得人力成本大大提高且效率低下。随着光学字符识别(Optical Character Recognition,OCR)技术的发展,采用机器识别来替代人工录入已经形成趋势,从而提高录入效率。但是,受工况下各类噪点、污损、成像质量等的制约,OCR技术并不能实现100%的识别率,需要人工对OCR识别结果进行检查。

人工检查的步骤通常有:1、记忆纸质单据图片上的内容;2、转移视线到OCR识别结果区域进行识别结果的确认;3、如果发现某一个字符识别错误,需要重新查看纸质单据图片上的内容进行确认。由于人工短期记忆的能力一般情况下不会超过6个字符,当纸质单据图片上的内容过长时,例如,内容为身份证号码时,需要反复进行短期记忆以及视线转移,核对效率较低。

发明内容

基于此,有必要针对上述问题,提出一种效率高的字符批量识别方法、装置和计算机设备。

一种字符批量识别方法,所述方法包括:

获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;

对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;

获取对所述识别结果进行校对得到的校对结果;

根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

在一个实施例中,所述目标图像中包括多个待识别的字符区域;所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:根据所述校对结果,得到各个目标图像中的所述多个待识别的字符区域对应的识别结果。

在一个实施例中,所述显示所述单字符图像和所述单字符图像对应的识别结果,包括:根据所述单字符图像对应的识别结果,生成多个同类集,每个所述同类集中的单字符图像的识别结果相同;根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示。

在一个实施例中,所述根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示,包括:获取用户输入的类别标识,根据所述类别标识确定目标同类集;将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示。

在一个实施例中,在所述将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示之后,还包括:若在字符显示区域检测到第一预置操作,则确定所述第一预置操作对应的第一单字符图像,确定所述第一单字符图像对应的目标字符区域;将所述目标字符区域中的各个目标字符的单字符图像在第一显示区域显示;将所述目标字符区域中的各个目标字符的单字符图像的识别结果在第二显示区域显示。

在一个实施例中,所述获取对所述识别结果进行校对得到的校对结果,包括:若在字符显示区域检测到第二预置操作,则确定所述第二预置操作对应的第二单字符图像,显示校对结果输入框;获取用户通过所述校对结果输入框输入的所述第二单字符图像的校对结果。

在一个实施例中,所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:获取每个目标图像对应的字符位置表,所述字符位置表记录了所述目标图像中的目标字符在字符区域中的位置;按照所述字符位置表将各个单字符图像对应的校对结果进行组合,得到各个目标图像中待识别的字符区域的识别结果。

一种字符批量识别装置,包括:

第一获取模块,用于获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;

分割识别模块,用于对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;

第二获取模块,用于获取对所述识别结果进行校对得到的校对结果;

校对识别模块,用于根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

在一个实施例中,所述目标图像中包括多个待识别的字符区域;所述校对识别模块,包括:多区域校对模块,用于根据所述校对结果,得到各个目标图像中的所述多个待识别的字符区域对应的识别结果。

在一个实施例中,所述分割识别模块,包括:同类汇总模块,用于根据所述单字符图像对应的识别结果,生成多个同类集,每个所述同类集中的单字符图像的识别结果相同;同类显示模块,用于根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示。

在一个实施例中,所述同类显示模块,包括:标识获取模块,用于获取用户输入的类别标识,根据所述类别标识确定目标同类集;标识显示模块,用于将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示。

在一个实施例中,所述装置,还包括:第一检测模块,用于若在字符显示区域检测到第一预置操作,则确定所述第一预置操作对应的第一单字符图像,确定所述第一单字符图像对应的目标字符区域;第一显示模块,用于将所述目标字符区域中的各个目标字符的单字符图像在第一显示区域显示;第二显示模块,用于将所述目标字符区域中的各个目标字符的单字符图像的识别结果在第二显示区域显示。

在一个实施例中,所述第二获取模块,包括:第二检测模块,用于若在字符显示区域检测到第二预置操作,则确定所述第二预置操作对应的第二单字符图像,显示校对结果输入框;用户校对模块,用于获取用户通过所述校对结果输入框输入的所述第二单字符图像的校对结果。

在一个实施例中,所述校对识别模块,包括:字符表获取模块,用于获取每个目标图像对应的字符位置表,所述字符位置表记录了所述目标图像中的目标字符在字符区域中的位置;位置组合模块,用于按照所述字符位置表将各个单字符图像对应的校对结果进行组合,得到各个目标图像中待识别的字符区域的识别结果。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:

获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;

对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;

获取对所述识别结果进行校对得到的校对结果;

根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:

获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;

对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;

获取对所述识别结果进行校对得到的校对结果;

根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

实施本发明实施例,将具有如下有益效果:

本发明提出了一种字符批量识别方法、装置和计算机设备,首先获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;然后对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;同时获取对所述识别结果进行校对得到的校对结果;最后根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。可见,上述方式,由于同时进行多个目标图像的字符区域中的字符的校对,实现了批量校对,在一定程度上提高了校对效率;同时,由于显示的是单字符图像和单字符图像对应的识别结果,相较于区域校对(例如,校对包含十几个数字的身份证号码)的方式,一一比对的方式出错的概率更小,从而提高了校对精度;最后,由于是单字符进行校对,相较于区域校对,不用反复记忆,而只用直接校对,因此,这样的方式也具有更高的效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

其中:

图1为一个实施例中字符批量识别方法的实现流程示意图;

图2为一个实施例中单字符图像的示意图;

图3为一个实施例中单字符图像和识别结果的显示方式的示意图;

图4为一个实施例中各个显示区域的示意图;

图5为一个实施例中步骤106的实现流程示意图;

图6为一个实施例中步骤108的实现流程示意图;

图7为一个实施例中字符批量识别装置的结构框图;

图8为一个实施例中计算机设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,在一个实施例中,提供了一种字符批量识别方法,本发明实施例所述的字符批量识别方法的执行主体为能够实现本发明实施例所述的字符批量识别方法的设备,该设备可以包括但不限于终端和服务器,其中,终端可以包括但不限于手机、平板电脑、台式电脑以及笔记本电脑,服务器可以包括但不限于高性能计算机和高性能计算机集群。该字符批量识别方法,具体包括如下步骤:

步骤102,获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符。

其中,字符区域,目标图像中的多个距离近的字符构成一个字符区域,例如图2所示的目标图像为支票图像,字符区域为19105371或者为7788283596,一个目标图像中可能包括多个字符区域,如图2所示的支票图像,包括三个字符区域,分别为支票号码字符区域、支票金额字符区域以及付款银行字符区域。

其中,字符,包括:汉字、数字、字母和符号。

步骤104,对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果。

其中,单字符图像,为只包含一个字符的图像,例如图2所示。

对所述待识别的字符区域中的目标字符进行分割,得到每个目标字符的单字符图像;对得到的单字符图像进行识别,得到所述单字符图像对应的识别结果。可以采用图像分割算法对字符区域中的目标字符进行分割,分割算法可以采用空间域分割算法和频率域分割算法,在此不做具体的限定;图像识别的方法可以包括图像匹配识别、神经网络模型进行识别,在此不做具体的限定。

示例性的,如图3所示,展示了两种单字符图像和单字符对应的识别结果的显示方式。方式一、将相同识别结果的单字符图像按行显示;方式二、将相同识别结果的单字符图像按列显示。

在一个实施例中,步骤104所述显示所述单字符图像和所述单字符图像对应的识别结果,包括:

步骤104A,根据所述单字符图像对应的识别结果,生成多个同类集,每个所述同类集中的单字符图像的识别结果相同。

对目标图像集合中的各个目标图像的各个目标字符的单字符图像,按照识别结果进行同类组合生成同类集。例如,假设目标字符的识别结果只有1到9,此时,生成9个同类集,每个同类集中的识别结果只包括1或2或…9。

步骤104B,根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示。

示例性的,不同的同类集在不同行进行显示或者在不同列进行显示。

示例性的,根据用户的选择展示不同同类集对应的识别结果,如图4所示,用户选择展示的同类集为同类集0,从而在显示界面中将识别结果为0的同类集中的单字符图像进行显示。

具体的,当目标图像集合中的目标图像很多并且目标字符也很多的时候,为了防止屏幕没法很好的将各个不同识别结果的单字符图像进行同屏显示,此时,根据用户的选择将某一类别的单字符图像进行显示。具体的,步骤104B所述根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示,包括:

步骤104B1,获取用户输入的类别标识,根据所述类别标识确定目标同类集。

其中,类别标识,用于唯一标识一个同类集。

步骤104B2,将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示。

其中,字符显示区域,用于显示一个单字符图像和该单字符图像的识别结果。

在一个实施例中,在步骤104B2之后,还包括:步骤104B3,若在字符显示区域检测到第一预置操作,则确定所述第一预置操作对应的第一单字符图像,确定所述第一单字符图像对应的目标字符区域;步骤104B4,将所述目标字符区域中的各个目标字符的单字符图像在第一显示区域显示;步骤104B5,将所述目标字符区域中的各个目标字符的单字符图像的识别结果在第二显示区域显示。

其中,第一预置操作,包括单击字符显示区域的操作。用户单击某一字符显示区域,从而将用户点击的字符显示区域中的单字符图像确定为第一单字符图像。

预先建立单字符图像与字符区域的关联关系,如表1所示,后续根据该关联关系直接根据单字符图像确定其对应的字符区域,或者根据字符区域确定其对应的多个单字符图像。需要说明的是,需要对目标图像中的字符区域进行区分,方式一、不同目标图像中的字符区域具有唯一的区域标识,例如,目标图像1中的字符区域有:Quyu1-1和Quyu1-2,目标图像2中的字符区域有Quyu2-1和Quyu2-2;方式二、不同目标图像中的字符区域具有相同的区域标识,此时,根据单字符图像与目标图像的对应关系确定目标图像,进而确定字符区域,例如,首先根据单字符图像DzftxN确定该单字符图像属于图像1,然后再确定该单字符图像属于图像1中的Quyu1。

表1

Figure BDA0002203184680000091

其中,字符显示区域的内容、第一显示区域的内容以及第二显示区域的内容均在当前显示的界面进行显示。第一显示区域,可以如图4所示,显示在当前显示的界面的右下角,各个单字符图像按从左到右的顺序显示;第二显示区域,可以如图4所示,显示在当前显示的界面的左下角,各个识别结果也按照从左到右的顺序与第一显示区域中的单字符图像对应显示。

通过上述方式,用户通过第一预置操作便可以查看到某一个单字符图像对应的字符区域,从而直接实现该字符区域所有字符的核对,提高核对效率。

进一步的,在第三显示区域显示第一单字符图像的识别结果的准确率,以便对用户进行提醒,对准确率不高的单字符图像进行重点查看。进一步的,如果某一个第一单字符图像的识别结果的准确率低于预设准确率,则将第一显示区域中显示的该单字符图像进行标记,例如标记为设置红色方框;或者,如果某一个第一单字符图像的识别结果的准确率低于预设准确率,则将该第一单字符图像所在的字符显示区域进行标记,例如标记为设置红色方框,或者,标记为将该第一单字符图像标记为特定颜色。

在一个实施例中,为了在上述实施例的基础上扩大显示内容,选择进行目标图像中的各个字符区域的目标字符的单字符图像进行显示。具体的,在步骤104B2之后,还包括:步骤104B6,若在字符显示区域检测到第一预置操作,则确定所述第一预置操作对应的第一单字符图像,确定所述第一单字符图像对应的第一目标图像;步骤104B7,将所述第一目标图像中的各个目标字符的单字符图像在第一显示区域显示;步骤104B8,将所述第一目标图像中的各个目标字符的单字符图像的识别结果在第二显示区域显示。

预先建立目标图像与单字符图像的对应关系,如表2所示。

表2

Figure BDA0002203184680000101

步骤106,获取对所述识别结果进行校对得到的校对结果。

具体的,提供了一种用户校对的方式。具体的,如图5所示,步骤106所述获取对所述识别结果进行校对得到的校对结果,包括:

步骤106A,若在字符显示区域检测到第二预置操作,则确定所述第二预置操作对应的第二单字符图像,显示校对结果输入框。

其中,第二预置操作,包括但不限于双击操作。例如,用户在发现某一个单字符图像识别错误的时候,比如,单字符图像是8,而识别结果是0,该单字符图像被分到了同类集0中,并在显示同类集0的时候进行了显示,用户发现分类错误,于是,双击单字符图像8对应的字符显示区域,此时弹出校对结果输入框,在弹出的校对结果输入框中输入8,从而得到该单字符图像的校对结果。

步骤106B,获取用户通过所述校对结果输入框输入的所述第二单字符图像的校对结果。

步骤108,根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

在一个实施例中,提供了一种字符区域的识别结果的确定方式。如图6所示,步骤108所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:

步骤108A,获取每个目标图像对应的字符位置表,所述字符位置表记录了所述目标图像中的目标字符在字符区域中的位置。

目标图像集合中的每个目标图像都有各自的字符位置表。示例性的,可以根据字符出现的顺序确定字符在字符区域中的位置,其中,字符出现的顺序可以是从左到右、从右到左、从上到下或者从下到上的顺序,例如,以从左到右为例,若某一字符区域为3749,则字符3的位置为Quyu1-1,字符7的位置为Quyu1-2,字符4的位置为Quyu1-3,字符9的位置为Quyu1-4。

其中,字符位置表,可如表3所示,其中,字符标识用于唯一标识一个字符,位置标识用于唯一标识一个位置。

表3

Figure BDA0002203184680000111

步骤108B,按照所述字符位置表将各个单字符图像对应的校对结果进行组合,得到各个目标图像中待识别的字符区域的识别结果。

需要说明的是,如果单字符图像的识别结果正确,则不需要校对,此时直接将改单字符图像对应的识别结果作为校对结果。

在一个实施例中,所述目标图像中包括多个待识别的字符区域;步骤108所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:根据所述校对结果,得到各个目标图像中的所述多个待识别的字符区域对应的识别结果。

由于一个目标图像中可能有多个字符区域,于是,为了确定字符在字符区域中的位置,将位置用字符标识和位置标识结合表达的方式,例如,字符Zifu&3,其位置标识为Quyu1-3,说明字符Zifu&3在区域1的位置3。

通过上述方式,能够实现一个目标图像中的多个字符区域的识别。

上述字符批量识别方法,首先获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;然后对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;同时获取对所述识别结果进行校对得到的校对结果;最后根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。可见,上述方式,由于同时进行多个目标图像的字符区域中的字符的校对,实现了批量校对,在一定程度上提高了校对效率;同时,由于显示的是单字符图像和单字符图像对应的识别结果,相较于区域校对(例如,校对包含十几个数字的身份证号码)的方式,一一比对的方式出错的概率更小,从而提高了校对精度;最后,由于是单字符进行校对,相较于区域校对,不用反复记忆,而只用直接校对,因此,这样的方式也具有更高的效率。

如图7所示,提供了一种字符批量识别装置700,具体包括:

第一获取模块702,用于获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;

分割识别模块704,用于对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;

第二获取模块706,用于获取对所述识别结果进行校对得到的校对结果;

校对识别模块708,用于根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

上述字符批量识别装置,首先获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;然后对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;同时获取对所述识别结果进行校对得到的校对结果;最后根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。可见,上述方式,由于同时进行多个目标图像的字符区域中的字符的校对,实现了批量校对,在一定程度上提高了校对效率;同时,由于显示的是单字符图像和单字符图像对应的识别结果,相较于区域校对(例如,校对包含十几个数字的身份证号码)的方式,一一比对的方式出错的概率更小,从而提高了校对精度;最后,由于是单字符进行校对,相较于区域校对,不用反复记忆,而只用直接校对,因此,这样的方式也具有更高的效率。

在一个实施例中,所述目标图像中包括多个待识别的字符区域;所述校对识别模块708,包括:多区域校对模块,用于根据所述校对结果,得到各个目标图像中的所述多个待识别的字符区域对应的识别结果。

在一个实施例中,所述分割识别模块704,包括:同类汇总模块,用于根据所述单字符图像对应的识别结果,生成多个同类集,每个所述同类集中的单字符图像的识别结果相同;同类显示模块,用于根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示。

在一个实施例中,所述同类显示模块,包括:标识获取模块,用于获取用户输入的类别标识,根据所述类别标识确定目标同类集;标识显示模块,用于将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示。

在一个实施例中,所述装置700,还包括:第一检测模块,用于若在字符显示区域检测到第一预置操作,则确定所述第一预置操作对应的第一单字符图像,确定所述第一单字符图像对应的目标字符区域;第一显示模块,用于将所述目标字符区域中的各个目标字符的单字符图像在第一显示区域显示;第二显示模块,用于将所述目标字符区域中的各个目标字符的单字符图像的识别结果在第二显示区域显示。

在一个实施例中,所述第二获取模块706,包括:第二检测模块,用于若在字符显示区域检测到第二预置操作,则确定所述第二预置操作对应的第二单字符图像,显示校对结果输入框;用户校对模块,用于获取用户通过所述校对结果输入框输入的所述第二单字符图像的校对结果。

在一个实施例中,所述校对识别模块708,包括:字符表获取模块,用于获取每个目标图像对应的字符位置表,所述字符位置表记录了所述目标图像中的目标字符在字符区域中的位置;位置组合模块,用于按照所述字符位置表将各个单字符图像对应的校对结果进行组合,得到各个目标图像中待识别的字符区域的识别结果。

图8示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端或服务器。如图8所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现字符批量识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行字符批量识别方法。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的字符批量识别方法可以实现为一种计算机程序的形式,计算机程序可在如图8所示的计算机设备上运行。计算机设备的存储器中可存储组成字符批量识别装置的各个程序模板。比如,第一获取模块702、第二获取模块706和分割识别模块704。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;

对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;

获取对所述识别结果进行校对得到的校对结果;

根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

上述计算机设备,首先获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;然后对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;同时获取对所述识别结果进行校对得到的校对结果;最后根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。可见,上述方式,由于同时进行多个目标图像的字符区域中的字符的校对,实现了批量校对,在一定程度上提高了校对效率;同时,由于显示的是单字符图像和单字符图像对应的识别结果,相较于区域校对(例如,校对包含十几个数字的身份证号码)的方式,一一比对的方式出错的概率更小,从而提高了校对精度;最后,由于是单字符进行校对,相较于区域校对,不用反复记忆,而只用直接校对,因此,这样的方式也具有更高的效率。

在一个实施例中,所述目标图像中包括多个待识别的字符区域;所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:根据所述校对结果,得到各个目标图像中的所述多个待识别的字符区域对应的识别结果。

在一个实施例中,所述显示所述单字符图像和所述单字符图像对应的识别结果,包括:根据所述单字符图像对应的识别结果,生成多个同类集,每个所述同类集中的单字符图像的识别结果相同;根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示。

在一个实施例中,所述根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示,包括:获取用户输入的类别标识,根据所述类别标识确定目标同类集;将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示。

在一个实施例中,所述计算机程序被所述处理器执行时,还用于:在所述将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示之后,若在字符显示区域检测到第一预置操作,则确定所述第一预置操作对应的第一单字符图像,确定所述第一单字符图像对应的目标字符区域;将所述目标字符区域中的各个目标字符的单字符图像在第一显示区域显示;将所述目标字符区域中的各个目标字符的单字符图像的识别结果在第二显示区域显示。

在一个实施例中,所述获取对所述识别结果进行校对得到的校对结果,包括:若在字符显示区域检测到第二预置操作,则确定所述第二预置操作对应的第二单字符图像,显示校对结果输入框;获取用户通过所述校对结果输入框输入的所述第二单字符图像的校对结果。

在一个实施例中,所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:获取每个目标图像对应的字符位置表,所述字符位置表记录了所述目标图像中的目标字符在字符区域中的位置;按照所述字符位置表将各个单字符图像对应的校对结果进行组合,得到各个目标图像中待识别的字符区域的识别结果。

在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:

获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;

对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;

获取对所述识别结果进行校对得到的校对结果;

根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。

上述计算机可读存储介质,首先获取目标图像集合,所述目标图像集合中包括多个目标图像,所述目标图像中包括待识别的字符区域,所述字符区域中包括多个目标字符;然后对所述待识别的字符区域中的目标字符进行分割识别,得到每个目标字符的单字符图像和所述单字符图像对应的识别结果,显示所述单字符图像和所述单字符图像对应的识别结果;同时获取对所述识别结果进行校对得到的校对结果;最后根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果。可见,上述方式,由于同时进行多个目标图像的字符区域中的字符的校对,实现了批量校对,在一定程度上提高了校对效率;同时,由于显示的是单字符图像和单字符图像对应的识别结果,相较于区域校对(例如,校对包含十几个数字的身份证号码)的方式,一一比对的方式出错的概率更小,从而提高了校对精度;最后,由于是单字符进行校对,相较于区域校对,不用反复记忆,而只用直接校对,因此,这样的方式也具有更高的效率。

在一个实施例中,所述目标图像中包括多个待识别的字符区域;所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:根据所述校对结果,得到各个目标图像中的所述多个待识别的字符区域对应的识别结果。

在一个实施例中,所述显示所述单字符图像和所述单字符图像对应的识别结果,包括:根据所述单字符图像对应的识别结果,生成多个同类集,每个所述同类集中的单字符图像的识别结果相同;根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示。

在一个实施例中,所述根据每个所述同类集,将所述单字符图像和所述单字符图像对应的识别结果进行显示,包括:获取用户输入的类别标识,根据所述类别标识确定目标同类集;将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示。

在一个实施例中,所述计算机程序被所述处理器执行时,还用于:在所述将所述目标同类集中的各个单字符图像和所述单字符图像对应的识别结果在不同的字符显示区域进行显示之后,若在字符显示区域检测到第一预置操作,则确定所述第一预置操作对应的第一单字符图像,确定所述第一单字符图像对应的目标字符区域;将所述目标字符区域中的各个目标字符的单字符图像在第一显示区域显示;将所述目标字符区域中的各个目标字符的单字符图像的识别结果在第二显示区域显示。

在一个实施例中,所述获取对所述识别结果进行校对得到的校对结果,包括:若在字符显示区域检测到第二预置操作,则确定所述第二预置操作对应的第二单字符图像,显示校对结果输入框;获取用户通过所述校对结果输入框输入的所述第二单字符图像的校对结果。

在一个实施例中,所述根据所述校对结果,得到各个目标图像中待识别的字符区域的识别结果,包括:获取每个目标图像对应的字符位置表,所述字符位置表记录了所述目标图像中的目标字符在字符区域中的位置;按照所述字符位置表将各个单字符图像对应的校对结果进行组合,得到各个目标图像中待识别的字符区域的识别结果。

需要说明的是,上述字符批量识别方法、字符批量识别装置、计算机设备及计算机可读存储介质属于一个总的发明构思,字符批量识别方法、字符批量识别装置、计算机设备及计算机可读存储介质实施例中的内容可相互适用。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

20页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种表计读数识别方法、装置、终端设备及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!