图像处理装置、图像处理系统及非暂时性记录介质

文档序号:1188155 发布日期:2020-09-22 浏览:22次 >En<

阅读说明:本技术 图像处理装置、图像处理系统及非暂时性记录介质 (Image processing apparatus, image processing system, and non-transitory recording medium ) 是由 渡边浩 富沢肇 佐久间翔 于 2019-11-14 设计创作,主要内容包括:本发明涉及图像处理装置、图像处理系统及非暂时性记录介质。实施方式的图像处理装置具有控制部。控制部使用定义有在通过读取片材上形成的图像而获得的图像信息中应进行图像识别的区域的多个格式中所选择的格式,在所述图像信息中进行通过所述格式定义的区域内的图像识别处理,当所述图像识别处理的结果不良时,所述控制部进行确认继续进行所述图像识别处理这一意思的输出。(The invention relates to an image processing apparatus, an image processing system, and a non-transitory recording medium. The image processing apparatus of an embodiment has a control unit. The control unit performs image recognition processing on image information in an area defined by a format selected from a plurality of formats defining an area to be subjected to image recognition in image information obtained by reading an image formed on a sheet, and when a result of the image recognition processing is defective, the control unit performs output to confirm continuation of the image recognition processing.)

图像处理装置、图像处理系统及非暂时性记录介质

技术领域

本文描述的实施方式总体上涉及图像处理装置、图像处理系统及非暂时性记录介质。

背景技术

以往,在诸如扫描仪之类的图像读取装置中,存在能够通过OCR(OpticalCharacter Reader:光学字符阅读器)对片材上的指定位置处的字符进行字符识别的产品。这种产品需要在执行读取之前选择预先定义了应由OCR识别的区域的信息的格式。然而,如果用户错误地选择格式,则有时不能通过OCR正确地进行字符识别。其结果,有时对于不必要的处理的处理负荷增大。这种问题不仅发生在通过OCR的字符识别中,而且也是同样会发生在条形码、QR码(注册商标)等标记的识别处理中的问题。

发明内容

本发明的第一方面涉及的图像处理装置包括控制部,所述控制部使用定义有在通过读取片材上形成的图像而获得的图像信息中应进行图像识别的区域的多个格式中所选择的格式,在所述图像信息中进行通过所选择的所述格式定义的区域内的图像识别处理,当所述图像识别处理的结果不良时,所述控制部进行确认继续进行所述图像识别处理这一意思的输出。

本发明的第二方面涉及的图像处理系统包括:图像读取装置,通过读取形成于片材上的图像而生成图像信息;以及图像处理装置,经由网络获取由所述图像读取装置生成的所述图像信息,并使用定义有在所获取的图像信息中应进行图像识别的区域的多个格式中所选择的格式,在所述图像信息中进行通过所选择的所述格式定义的区域内的图像识别处理,当所述图像识别处理的结果不良时,所述图像处理装置进行确认继续进行所述图像识别处理这一意思的输出。

本发明的第三方面涉及的非暂时性记录介质记录用于使计算机作为上述图像处理装置进行处理的计算机程序。

附图说明

图1是表示第一实施方式中的图像处理系统的结构的图。

图2A是表示第一实施方式中的账票的一例的图。

图2B是表示第一实施方式中的账票的一例的图。

图3是表示针对账票的账票格式的一例的图。

图4是表示针对账票的账票格式的一例的图。

图5是表示第一实施方式中的图像处理装置的硬件结构的框图。

图6是表示第一实施方式中的待机画面的一例的图。

图7是表示第一实施方式中的设定画面的一例的图。

图8是表示第一实施方式中的第一详细设定画面的一例的图。

图9是表示第一实施方式中的第二详细设定画面的一例的图。

图10是表示第一实施方式中的等待画面的一例的图。

图11是表示第一实施方式中的第一识别处理的流程的流程图。

图12是表示第一实施方式中的第一确认画面的一例的图。

图13是表示第一实施方式中的识别结果的一例的图。

图14是表示第一实施方式中的第二确认画面的一例的图。

图15是表示第一实施方式中的第三识别处理的流程的流程图。

图16是表示第一实施方式中的第三确认画面的一例的图。

图17是表示第一实施方式中的第四识别处理的流程的流程图。

图18是表示第一实施方式中的第四确认画面的一例的图。

图19是表示第一实施方式中的选择画面的一例的图。

图20是表示第二实施方式中的图像处理系统的结构的图。

图21是表示第二实施方式中的图像处理装置的硬件结构的框图。

图22是表示第二实施方式中的图像处理系统的处理流程的顺序图。

图23是表示第二实施方式中的图像处理系统的处理流程的顺序图。

具体实施方式

实施方式的图像处理装置具有控制部。控制部使用定义有在通过读取片材上形成的图像而获得的图像信息中应进行图像识别的区域的多个格式中所选择的格式,在所述图像信息中进行通过所述格式定义的区域内的图像识别处理,当所述图像识别处理的结果不良时,所述控制部进行确认继续进行所述图像识别处理这一意思的输出。

以下,参照附图说明实施方式的图像处理装置、图像处理系统及非暂时性记录介质。

(第一实施方式)

图1是表示第一实施方式中的图像处理系统10的结构的图。

图像处理系统10包括图像处理装置100和文件服务器400。图像处理装置100和文件服务器400经由网络500彼此可通信地连接。网络500也可以是以任何方式构成的网络。例如,网络500是无线LAN(Local Area Network:局域网)、因特网等网络。

图像处理装置100是能够进行片材的读取以及在片材上形成色调剂图像的复合机(MFP:Multi Function Peripheral:多功能***设备)。片材例如是原稿、记载有字符、图像等的纸张等。本实施方式中作为处理对象的片材是格式在某种程度上被模式化的片材。即,本实施方式中作为处理对象的片材是如账票(账本和票据)那样日期、品名、物品编号及价格等的印刷区域在某种程度上被固定的片材。在以下的说明中,以账票为例进行说明。

另外,图像处理装置100包括能够读取多页的成叠账票的图像读取装置。图像读取装置例如是自动输送原稿装置(ADF:Auto Document Feeder:自动输稿器)。需要指出,图像读取装置也可以读取在放置于原稿读取台的读取对象的账票上印刷的图像。图像读取装置逐张地取出所载置的账票,读取呈现在取出的账票上的图像而生成数字数据并生成图像信息。

另外,图像处理装置100具有OCR功能。图像处理装置100使用由图像读取装置生成的图像信息,通过OCR进行账票上的特定区域的字符识别。然后,图像处理装置100根据字符识别结果控制字符识别处理的动作。另外,图像处理装置100经由网络500将字符识别结果发送到文件服务器400。

文件服务器400是保存从图像处理装置100发送来的字符识别结果的服务器。文件服务器400通过使用个人计算机等信息处理装置而构成。

图2A和图2B是表示第一实施方式中的账票的一例的图。

账票有像账票600和账票700那样的多个种类。此外,在账票600和账票700上分别记载有日期11、品名12、价格13及物品编号14中至少任一方。如账票600和账票700那样,印刷日期11、品名12、价格13及物品编号14的区域是按照各账票格式而确定的。虽然在图2A和图2B中示出了两种账票,但账票无需限定于图2A和图2B所示的示例。即,账票也有三种以上的情况。

本实施方式中的图像处理装置100对账票中记载的日期11、品名12、价格13及物品编号14等字符串进行OCR处理并将其提取作为数据。为此,图像处理装置100将表示在各种账票的哪个位置记载有字符串的信息作为账票格式进行存储。

图3是表示针对账票600的账票格式601的一例的图,图4是针对账票700的账票格式701的一例的图。账票格式601和701均以XML(Extensible Markup Language:可扩展标记语言)形式记载。

在账票格式601和701中从<Zone>到</Zone>记载有多个指定片材上的一个区域的描述。即,在账票格式601和701中作出了指定片材上的多个区域的描述。例如,在账票格式601中,存在描述602、603及604作为指定多个区域的描述。另外,在账票格式701中,存在描述702、703、704及705作为指定多个区域的描述。

描述602是指定记载有与日期11对应的字符串的区域的描述。即,描述602是指定账票600的区域605的描述。描述603是指定记载有与品名12对应的字符串的区域的描述。即,描述603是指定账票600的区域606的描述。描述604是指定记载有与价格13对应的字符串的区域的描述。即,描述604是指定账票600的区域607的描述。

描述702是指定记载有与物品编号14对应的字符串的区域的描述。即,描述702是指定账票700的区域706的描述。描述703是指定记载有与品名12对应的字符串的区域的描述。即,描述703是指定账票700的区域707的描述。描述704是指定记载有与价格13对应的字符串的区域的描述。即,描述704是指定账票700的区域708的描述。描述705是指定记载有与日期11对应的字符串的区域的描述。即,描述705是指定账票700的区域709的描述。

本实施方式中的图像处理装置100存储多个如上所述的账票格式,并对通过所存储的账票格式指定的区域进行OCR。需要注意的是,在以下的说明中,将账票格式中描述的区域从上面开始依次记载为第Z区(Z是1以上的整数)。例如,以账票格式601为例,将通过描述602指定的区域记载为第一区,将通过描述604指定的区域记载为第三区。

图5是表示第一实施方式中的图像处理装置100的硬件结构的框图。

图像形成装置100包括显示器110、控制面板120、打印部130、片材容纳部140、图像读取装置200、网络接口310、辅助存储装置320、存储器330以及CPU340。需要指出,各功能部经由系统总线15以可数据通信的方式连接。

显示器110是液晶显示器、有机EL(Electro Luminescence:电致发光)显示器等图像显示装置。显示器110显示与图像处理装置100有关的各种信息。另外,显示器110将与用户进行的操作相应的信号输出到图像处理装置100的CPU(Central Processing Unit:中央处理单元)。另外,显示器110接收用户的操作。

控制面板120具有多个按钮。控制面板120接收用户的操作。控制面板120将与用户进行的操作相应的信号输出到图像处理装置100的CPU。需要指出,显示器110和控制面板120也可以构成为一体式触摸面板。

打印部130执行图像形成处理。在图像形成处理中,打印部130基于由图像读取装置200生成的图像信息或经由通信路径接收到的图像信息在片材上形成图像。

片材容纳部140容纳用于打印部130中的图像形成的片材。

图像读取装置200将读取对象的图像作为光的明暗进行读取。图像读取装置200记录读取到的图像信息。记录的图像信息用于OCR的处理。需要指出,记录的图像信息也可以经由网络发送到其它信息处理装置。记录的图像信息也可以通过打印部130在片材上形成图像。

网络接口310在与其它装置之间进行数据的收发。在此,其它装置例如是文件服务器400、其它图像处理装置100。网络接口310作为输入接口进行动作,接收从其它装置发送来的数据或指示。从其它装置发送来的指示是印刷的执行指示、图像信息的保存指示等。另外,网络接口310作为输出接口进行动作,向其它装置发送数据。

辅助存储装置320例如是硬盘或SSD(solid state drive:固态硬盘),存储各种数据。各种数据例如是软件程序、数字数据、作业、作业日志、画面数据以及账票格式。

存储器330暂时存储图像处理装置100包括的各功能部使用的数据。存储器330例如是RAM(Random Access Memory:随机存取存储器)。需要指出,存储器330也可以存储图像读取装置200生成的数字数据。存储器330还可以暂时存储作业、作业日志及账票格式中任一方。

CPU340控制图像处理装置100的各功能部的动作。CPU340将存储在辅助存储装置320中的软件程序加载到存储器330上,通过执行软件程序来执行处理。在此,举出一例说明CPU340的具体处理。CPU340使用账票格式,通过OCR对由图像读取装置200生成的图像信息的特定区域进行字符识别。然后,CPU340根据字符识别结果控制字符识别处理的动作。

图像处理装置100在进行账票的读取时,在显示器110上显示图6所示的待机画面,并待机到用户输入指示为止。

图6是表示第一实施方式中的待机画面的一例的图。

待机画面81是在用户使账票的读取被执行时显示在显示器110上的画面。在待机画面81中显示有选择区域811、保存目的地指定区域812、账票格式设定按钮813以及开始按钮814。

选择区域811是供用户选择在OCR中利用的账票格式的区域。在选择区域811中显示已注册的账票格式。在图6中,显示账票600及700这两种账票格式。

保存目的地指定区域812是指定在完成账票的字符识别之后保存字符识别结果的地方的区域。用户通过将想要保存字符识别结果的地方输入到保存目的地指定区域812,从而能够使字符识别结果保存在期望的地方。需要指出,对于保存目的地指定区域812的输入既可以是直接输入,也可以是利用下拉等的直接指定输入。

账票格式设定按钮813是用于进行账票格式的注册或编辑的按钮。

开始按钮814是用于使利用OCR的字符识别执行的按钮。需要指出,CPU340也可以以诸如不能选择开始按钮814的显示方式进行显示,直至用户选择了账票格式。诸如不能选择的显示方式例如既可以是显示为灰色,也可以不显示开始按钮814本身。

当用户选择了账票格式设定按钮813时,待机画面81切换到图7所示的设定画面82。具体而言,CPU340将显示器110上显示的待机画面81切换为设定画面82进行显示。

图7是表示第一实施方式中的设定画面82的一例的图。

设定画面82是在进行账票格式的注册或编辑时显示在显示器110上的画面。通过选择账票格式设定按钮813而在显示器110上显示设定画面82。在设定画面82中显示有格式设定区域821、返回按钮822以及编辑按钮823。

格式设定区域821是供用户选择作为注册或编辑对象的账票格式的区域。图7中示出了在格式设定区域821中已经设定两种账票格式并且最多能够设定五种账票格式。当用户进行账票格式的注册时,选择空白的格式设定区域821并选择编辑按钮823即可。另外,当用户进行账票格式的编辑时,选择已设定的账票格式并选择编辑按钮823即可。

返回按钮822是将显示器110上显示的画面返回到前一画面的按钮。即,设定画面82中的返回按钮822是将显示器110上显示的设定画面82返回到待机画面81的按钮。当选择返回按钮822时,CPU340使显示器110上显示的设定画面82切换为待机画面81进行显示。

编辑按钮823是进行账票格式的详细设定的按钮。

图7中示出用户选择第一个账票格式“账票600”的状态。当在该状态下用户选择编辑按钮823时,设定画面82切换到图8所示的第一详细设定画面83。具体而言,CPU340使显示器110上显示的设定画面82切换为第一详细设定画面83进行显示。

图8是表示第一实施方式中的第一详细设定画面83的一例的图。

第一详细设定画面83是当选择在账票格式中设定的区时显示在显示器110上的画面。通过选择设定画面82中的编辑按钮823而在显示器110上显示第一详细设定画面83。在第一详细设定画面83中显示有名称输入区域831、编辑区(zone)选择区域832、返回按钮833以及编辑按钮834。

名称输入区域831是供用户输入账票格式的名称的区域。

编辑区选择区域832是供用户选择作为注册或编辑对象的区(zone)的区域。图8中示出了在编辑区选择区域832中已经设定三个区并且最多能够设定五个区。当用户进行区的注册时,选择空白的编辑区选择区域832并选择编辑按钮834即可。另外,当用户进行区的编辑时,选择已设定的区并选择编辑按钮834即可。

返回按钮833是使显示器110上显示的画面返回到前一画面的按钮。即,第一详细设定画面83中的返回按钮833是将显示器110上显示的第一详细设定画面83返回到设定画面82的按钮。当选择返回按钮833时,CPU340使显示器110上显示的第一详细设定画面83切换为设定画面82进行显示。

编辑按钮834是进行区的详细设定的按钮。

在图8中示出用户选择第三个区“Price(价格)”的状态。当在该状态下用户选择编辑按钮834时,第一详细设定画面83切换到图9所示的第二详细设定画面84。具体而言,CPU340使显示器110上显示的第一详细设定画面83切换为第二详细设定画面84进行显示。

图9是表示第一实施方式中的第二详细设定画面84的一例的图。

第二详细设定画面84是在设定区时显示在显示器110上的画面。通过选择第一详细设定画面83中的编辑按钮834而在显示器110上显示第二详细设定画面84。在第二详细设定画面84中显示有区名称输入区域841、区详细设定区域842、正则表达式输入区域843、返回按钮844以及保存按钮835。

区名称输入区域841是供用户输入区的名称的区域。

区详细设定区域842是供用户对区的区域进行设定的区域。在区详细设定区域842中设有X坐标、Y坐标、W(宽度)、H(高度)这四项。通过输入这四项,从而设定一个区。在区详细设定区域842设定的区是成为OCR的读取对象的区域。

正则表达式输入区域843是用正则表达式描述区的数据结构的区域。例如,如果预先指定已设定的区内的字符串的结构(例如,由数字〇位、文字〇位构成),则能够通过识别结果判定是否符合正则表达式。需要指出,正则表达式输入区域843也可以不被输入。

返回按钮844是使显示器110上显示的画面返回到前一画面的按钮。即,第二详细设定画面84中的返回按钮844是使显示器110上显示的第二详细设定画面84返回到第一详细设定画面83的按钮。当选择返回按钮844时,CPU340使显示器110上显示的第二详细设定画面84切换为第一详细设定画面83进行显示。

保存按钮845是以当前输入的内容保存账票格式的按钮。通过选择保存按钮845,从而用当前输入的内容更新或新注册账票格式。

用户若在第二详细设定画面84中完成区的设定,则选择保存按钮845并保存设定内容。之后,用户选择返回按钮844而返回到第一详细设定画面83。用户在其它区中也同样地进行设定,若完成所有区的设定,则在第一详细设定画面83中选择返回按钮833而返回到设定画面82。用户在设定画面82中若完成所有的账票格式的设定,则选择返回按钮822而返回到待机画面81。通过以上处理,在辅助存储装置320中保存账票格式。

接着,说明当用户选择待机画面81上显示的开始按钮814时的处理。当选择开始按钮814时,待机画面81切换到图10所示的等待画面85。具体而言,CPU340使显示器110上显示的待机画面81切换为等待画面85进行显示。

图10是表示第一实施方式中的等待画面85的一例的图。

等待画面85是在执行OCR的识别处理期间显示在显示器110上的画面。通过选择开始按钮814而在显示器110上显示等待画面85。在等待画面85中显示有表示“正在执行”OCR的识别处理的字符串“正在执行”。

图11是表示第一实施方式中的第一识别处理的流程的流程图。在待机画面81中选择了开始按钮814时执行图11的处理。

CPU340从辅助存储装置320读出在待机画面81中所选择的账票格式(ACT101)。例如,当在待机画面81中选择了账票600时,CPU340从辅助存储装置320读出账票600的账票格式。

CPU340从读出的账票格式获取区数量Z(ACT102)。例如,当读出了账票600的账票格式时,CPU340计算账票600的账票格式的区数量,并获取3作为区数量。接着,CPU340使图像读取装置200输送读取对象片材的账票。图像读取装置200根据来自CPU340的指示,控制辊来输送一张所设置的账票(ACT103)。

图像读取装置200通过以光学方式读取输送的账票,从而生成图像信息(ACT104)。图像读取装置200将生成的图像信息输出到CPU340。CPU340将作为提取对象的区(以下,称为“提取区”)z初始化为1(ACT105)。接着,CPU340从读出的账票格式获取第一区的区域信息(X坐标、Y坐标、W(宽度)、H(高度))。CPU340从由图像读取装置200输出的图像信息中提取位于通过所获取的区域信息指定的区域内的信息(ACT106)。

CPU340通过OCR对位于提取出的区域内的信息进行字符识别(ACT107)。CPU340获取位于区域内的字符信息作为字符识别的结果。CPU340将获取的识别结果暂时保存在存储器330中。需要注意的是,当提取出的区域内没有信息、即为空白时,CPU340不获取任何信息。CPU340判定是否无需评估识别结果(ACT108)。

具体而言,当设置有表示无需评估识别结果的标志(以下,称为“无需评估标志”)时,CPU340判定为无需评估识别结果。另一方面,当未设置无需评估标志时,CPU340判定为需要评估识别结果。在识别处理开始时,重置无需评估标志。另外,当用户想要确认识别结果时,设置无需评估标志。

当无需评估识别结果时(ACT108:是),即设置有无需评估标志时,CPU340执行ACT109的处理。CPU340判定是否Z=z(ACT109)。即,CPU340判定是否针对一个账票在账票格式的所有区中进行了识别处理。当不是Z=z时,CPU340未在账票格式的所有区中进行识别处理。另一方面,当Z=z时,CPU340在账票格式的所有区中进行了识别处理。

当Z=z时(ACT109:是),CPU340判定是否有读取对象片材(ACT110)。当没有读取对象片材时(ACT110:否),图像处理装置100结束图11的处理。

另一方面,当有读取对象片材时(ACT110:是),CPU340指示图像读取装置200输送下一账票。图像读取装置200根据来自CPU340的指示,控制辊来输送一张所设置的账票(ACT103)。之后,图像处理装置100执行ACT104及其之后的处理。

当在ACT109的处理中不是Z=z时(ACT109:否),CPU340将z的值加1(ACT111)。如果z为1,则CPU340将z的值加1而使得z=2。由此,CPU340在ACT106的处理中,从读出的账票格式获取第二区的区域信息。需要指出,如果z=3,则CPU340在ACT106的处理中,从读出的账票格式获取第三区的区域信息。

当在ACT108的处理中需要评估识别结果时(ACT108:否),CPU340执行ACT112的处理。具体而言,CPU340评估识别结果(ACT112)。

在此,说明识别结果的评估方法。作为识别结果的评估方法,CPU340执行第一种方法~第三种方法中任一种方法或全部方法来评估识别结果。

作为第一种方法,有评估提取出的区域内是否为空白的方法。当区域内为空白时,未通过OCR获取任何字符信息。因此,作为识别结果,CPU340判定为不良。即,当提取出的区域内没有应识别的图像而不能获取字符信息时(NULL),CPU340判定为识别结果不良。

作为第二种方法,有根据OCR处理时的准确度(精确度)进行评估的方法。具体而言,如果作为识别的结果,有一个不正常的字符,CPU340也判定为识别结果不良。作为不正常的字符,例如存在能够识别为数字“1”和英文字母“l”中任一方的情况等。另外,当识别结果的整体比例小于预定阈值时,CPU340判定为识别结果不良。

作为第三种方法,有在账票格式的区信息中规定有正则表达式,评估识别结果是否与正则表达式一致的方法。当在账票格式的区信息中规定有正则表达式且识别结果与正则表达式不一致时,CPU340判定为识别结果不良。

另外,当通过上述第一种方法~第三种方法中的任一种方法或全部方法未判定为不良时,CPU340判定为识别结果良好。需要指出,预先设定用第一种方法~第三种方法中的哪种方法来评估识别结果。

当识别结果良好时(ACT113:是),CPU340执行ACT109的处理。CPU340判定是否Z=z(ACT109)。之后,图像处理装置100执行与ACT109的判定结果相应的处理。

另一方面,当识别结果不良时(ACT113:否),用户选择的账票格式有可能是错误的。为此,有可能无法进行准确的字符识别。因此,CPU340使显示器110显示图12所示的第一确认画面(ACT114)。具体而言,CPU340将显示器110上显示的等待画面85切换为第一确认画面进行显示。

图12是表示第一实施方式中的第一确认画面86的一例的图。

第一确认画面86是用于确认识别结果不良而是否继续进行识别处理的画面。在第一确认画面86中显示有对用户的通知、“是”按钮861以及“否”按钮862。作为第一确认画面86中的对用户的通知,通知确认识别结果不良而是否继续进行识别处理的内容。

“是”按钮861是当用户允许对用户的通知内容时使用的按钮。即,当选择“是”按钮861时,CPU340判定为用户允许对用户的通知内容。

“否”按钮862是当用户不允许对用户的通知内容时使用的按钮。即,当选择了“否”按钮862时,CPU340判定为用户不允许对用户的通知内容。

返回到图11继续进行说明。

用户在显示器110上显示的第一确认画面86中选择“是”按钮861和“否”按钮862中任一按钮。当用户选择了“是”按钮861和“否”按钮862中任一按钮时,CPU340判定是否结束识别处理(ACT115)。具体而言,当在第一确认画面中不继续进行识别处理、即选择了“否”按钮862时,CPU340判定为结束识别处理。另一方面,当在第一确认画面中继续进行识别处理、即选择了“是”按钮861时,CPU340判定为不结束识别处理。

当结束识别处理时(ACT115:是),图像处理装置100结束图11的处理。在这种情况下,CPU340丢弃识别结果。

另一方面,当不结束识别处理时(ACT115:否),CPU340将显示器110上显示的第一确认画面86切换为等待画面85进行显示。之后,图像处理装置100执行ACT109及其之后的处理。

图13是表示第一实施方式中的识别结果的一例的图。

如图13所示,在从各<Zone>到</Zone>之间记载有表示识别结果的<Result>标签21~23。另外,进行了识别处理的日期和时间记载在<ScanTime>标签24中。CPU340在对应的区的区域中描述识别结果。图13所示的识别结果被发送到文件服务器400。

如上构成的图像形成装置100在OCR的识别结果不良的情况下,确认是否继续识别处理并进行与确认结果相应的处理。通过进行这样的确认,能够通知用户误用误选择的账票格式。因此,用户能够切换到正确的账票格式。为此,能够减轻对于不必要的处理的处理负荷。

以下,说明第一实施方式中的图像处理装置100的变形例。

在本实施方式中,虽然以OCR处理为字符识别处理进行了说明,但本实施方式中的技术也可以应用于诸如条形码、QR码(商标注册)之类的标记的识别处理。

CPU340也可以使显示器110显示图14所示的第二确认画面来代替第一确认画面。图14是表示第一实施方式中的第二确认画面87的一例的图。

第二确认画面87是用于确认识别结果不良而是否继续进行识别处理的画面。在第二确认画面87中显示有对用户的通知以及确认按钮871。作为第二确认画面87中的对用户的通知,通知由于识别结果不良而中止识别处理的内容。

确认按钮871是当用户允许对用户的通知内容时使用的按钮。即,当选择了确认按钮871时,CPU340判定为用户允许作为对用户的通知内容的中止识别处理。在这种情况下,作为第一实施方式中的第二识别处理,CPU340判定为在ACT115的处理中结束识别处理。

另外,图像处理装置100也可以构成为进行图15所示的识别处理。

图15是表示第一实施方式中的第三识别处理的流程的流程图。当在待机画面81中选择了开始按钮814时,执行图15的处理。另外,在图15中,对于与图11相同的处理,标注与图11相同的附图标记并省略其说明。

当在ACT113的处理中识别结果不良时(ACT113:否),用户选择的账票格式有可能是错误的。为此,有可能无法进行准确的字符识别。因此,CPU340使显示器110显示图16所示的第三确认画面(ACT201)。具体而言,CPU340使显示器110上显示的等待画面85切换为第三确认画面进行显示。

图16是表示第一实施方式中的第三确认画面88的一例的图。

第三确认画面88是用于确认识别结果不良而是否继续进行识别处理的画面。在第三确认画面88中显示有对用户的通知以及多个选择按钮881~883。作为第三确认画面88中的对用户的通知,通知确认识别结果不良而是否继续进行识别处理的内容。

选择按钮881是在继续进行识别处理但在该识别处理中不显示确认画面时所选择的按钮。

选择按钮882是在继续进行识别处理且显示确认画面时所选择的按钮。

选择按钮883是在结束识别处理时所选择的按钮。

返回到图15继续进行说明。

用户在显示器110上显示的第三确认画面88中选择选择按钮881~883中任一按钮。当用户选择了选择按钮881~883中任一按钮时,CPU340判定与选择的按钮相应的处理(ACT202)。当选择了选择按钮883时,CPU340判定为结束识别处理(ACT202:结束)。在这种情况下,图像处理装置100结束图15的处理。然后,CPU340丢弃识别结果。

另外,当用户选择了选择按钮882时,CPU340判定为继续进行识别处理且显示确认画面(ACT202:继续且有显示)。CPU340使显示器110上显示的第三确认画面88切换为等待画面85进行显示。之后,图像处理装置100执行ACT109及其之后的处理。

另外,当用户选择了选择按钮881时,CPU340判定为继续进行识别处理但在该识别处理中不显示确认画面(ACT202:继续且无显示)。在这种情况下,CPU340设置无需评估标志(ACT203)。CPU340使显示器110上显示的第三确认画面88切换为等待画面85进行显示。之后,图像处理装置100执行ACT109及其之后的处理。

根据如上构成的图像处理装置100,在OCR的识别结果不良的情况下,确认是否继续识别处理并进行与确认结果相应的处理。此时,图像处理装置100在继续进行识别处理的情况下,也使得能够选择是否显示确认画面。因此,用户无需每次都对确认画面进行确认。为此,也能够减轻用户的负担。另外,图像处理装置100通过进行这样的确认,能够通知用户误用误选择的账票格式。因此,用户能够切换到正确的账票格式。为此,能够减轻对于不必要的处理的处理负荷。

另外,图像处理装置100也可以构成为进行图17所示的识别处理。

图17是表示第一实施方式中的第四识别处理的流程的流程图。当在待机画面81中选择了开始按钮814时,执行图17的处理。另外,在图17中,对于与图11相同的处理,标注与图11相同的附图标记并省略其说明。

当在ACT113的处理中识别结果不良时(ACT113:否),用户选择的账票格式有可能是错误的。为此,有可能无法进行准确的字符识别。因此,CPU340使显示器110显示图18所示的第四确认画面(ACT301)。具体而言,CPU340使显示器110上显示的等待画面85切换为第四确认画面进行显示。

图18是表示第一实施方式中的第四确认画面89的一例的图。

第四确认画面89是用于确认识别结果不良而是否继续进行识别处理的画面。在第四确认画面89中显示有对用户的通知以及多个选择按钮891~893。作为第四确认画面89中的对用户的通知,通知确认识别结果不良而是否尝试其它账票格式的内容。

选择按钮891是当尝试其它账票格式时所选择的按钮。

选择按钮892是当不尝试其它账票格式而保持当前的账票格式继续进行识别处理时所选择的按钮。

选择按钮893是当结束识别处理时所选择的按钮。

返回到图17继续进行说明。

用户在显示器110上显示的第四确认画面89中选择选择按钮891~893中任一按钮。当用户选择了选择按钮891~893中任一按钮时,CPU340判定与所选择的按钮相应的处理(ACT302)。当选择了选择按钮893时,CPU340判定为结束识别处理(ACT302:结束)。在这种情况下,图像处理装置100结束图17的处理。然后,CPU340丢弃识别结果。

另外,当用户选择了选择按钮892时,CPU340判定为不尝试其它账票格式而保持当前的账票格式继续进行识别处理(ACT302:继续)。CPU340使显示器110上显示的第四确认画面89切换为等待画面85进行显示。之后,图像处理装置100执行ACT109及其之后的处理。

另外,当用户选择了选择按钮891时,CPU340判定为尝试其它账票格式(ACT302:切换)。在这种情况下,CPU340使用辅助存储装置320中存储的所有账票格式进行识别处理。例如,CPU340利用OCR对图像信息的区域中通过各账票格式指定的第一区的区域进行识别处理。CPU340生成包含利用各账票格式获得的识别结果作为一览表的选择画面的画面数据。然后,CPU340使显示器110显示所生成的选择画面(ACT303)。

图19是表示第一实施方式中的选择画面90的一例的图。

选择画面90是选择账票格式的画面。在选择画面90中显示有对用户的通知、利用各账票格式获得的识别结果的一览表901以及确认按钮902。作为选择画面90中的对用户的通知,通知选择账票格式的内容。

识别结果的一览表901显示利用各账票格式获得的识别结果。识别结果的一览表901中的“失败”表示未获得识别结果。

确认按钮902是当用户完成了账票格式的选择时所使用的按钮。即,当选择了确认按钮902时,CPU340判定为用户选择了账票格式。

返回到图17继续进行说明。

用户查看在识别结果的一览表901中显示的识别结果,并选择使用的账票格式。CPU340切换到所选择的账票格式(ACT304)。具体而言,CPU340从辅助存储装置320读出由用户选择的账票格式。然后,CPU340通过使用读出的账票格式来切换账票格式。在完成账票格式的切换之后,CPU340设置无需评估标志(ACT305)。CPU340使显示器110上显示的选择画面90切换为等待画面85进行显示。之后,图像处理装置100执行ACT109及其之后的处理。

根据如上构成的图像处理装置100,在OCR的识别结果不良的情况下,确认是否继续识别处理并进行与确认结果相应的处理。此时,图像处理装置100在继续进行识别处理的情况下使得选择是否尝试其它账票格式。由此,用户能够在利用所有账票格式查看识别结果之后选择更好的账票格式。因此,用户能够切换到正确的账票格式。为此,能够减轻对于不必要的处理的处理负荷。

图像处理装置100也可以根据时段、日期时间以及每个用户中任一方,改变在显示器110上显示的确认画面。改变的确认画面是第一确认画面86至第一确认画面89中任一方。

(第二实施方式)

在第一实施方式中,示出了在一个壳体中进行图像读取和图像识别的结构。在第二实施方式中,说明由不同的装置进行图像读取和图像识别的结构。

图20是表示第二实施方式中的图像处理系统10a的结构的图。

图像处理系统10a包括图像处理装置100a、文件服务器400以及图像读取装置900。图像处理装置100a和文件服务器400经由网络500彼此可通信地连接。另外,图像处理装置100a和图像读取装置900通过有线通信而连接。

与第一实施方式相比,图像处理系统10a的不同之处在于,图像处理装置100a不具备读取图像的功能而新具备图像读取装置900。除此以外的结构与第一实施方式的相同。以下,对不同之处进行说明。

图像处理装置100a使用从图像读取装置900获得的图像信息,通过OCR进行账票上的特定区域的字符识别。然后,图像处理装置100a根据字符识别结果控制字符识别处理的动作。另外,图像处理装置100a经由网络500将字符识别结果发送到文件服务器400。

图像读取装置900将读取对象的图像作为光的明暗进行读取。图像读取装置900将读取的图像信息发送到图像处理装置100a。图像读取装置900例如是自动输送原稿装置。需要指出,图像读取装置900也可以读取在放置于原稿读取台的读取对象的账票上印刷的图像。图像读取装置900逐张地取出所载置的账票,读取在取出的账票上显现的图像而生成数字数据并生成图像信息。

图21是表示第二实施方式中的图像处理装置100a的硬件结构的框图。

图像形成装置100a包括显示器110、控制面板120、打印部130、片材容纳部140、图像读取装置200、网络接口310、辅助存储装置320、存储器330以及CPU340a。

图像形成装置100a与图像形成装置100在结构上的不同之处在于包括CPU340a来代替CPU340。图像形成装置100a的其它结构与图像形成装置100相同。为此,省略图像形成装置100a整体的说明,而对CPU340a进行说明。

CPU340a控制图像处理装置100a的各功能部的动作。CPU340a将存储在辅助存储装置320中的软件程序加载到存储器330上,通过执行软件程序来执行处理。在此,列举一例说明CPU340a的具体处理。CPU340a使用账票格式,通过OCR对从图像读取装置900获得的图像信息的特定区域进行字符识别。然后,CPU340a根据字符识别结果控制字符识别处理的动作。

图22和图23是表示第二实施方式中的图像处理系统10a的处理流程的顺序图。当在待机画面81中选择了开始按钮814时,执行图22和图23的处理。

当选择开始按钮814时,CPU340a生成指示读取账票的读取指示。CPU340a经由网络接口310将生成的读取指示发送到图像读取装置900(ACT401)。

图像读取装置900接收从图像处理装置100a发送来的读取指示。图像读取装置900根据读取指示的接收,控制辊来输送一张所设置的账票(ACT402)。图像读取装置900通过以光学方式读取输送的账票,从而生成图像信息(ACT403)。图像读取装置900将生成的图像信息发送到图像处理装置100a(ACT404)。

网络接口310接收从图像读取装置900发送来的图像信息。网络接口310将接收到的图像信息输出到CPU340a。CPU340a从辅助存储装置320读出在待机画面81中选择的账票格式(ACT405)。CPU340a从读出的账票格式获取区数量Z。另外,CPU340a将提取区z初始化为1。

CPU340a从读出的账票格式获取第z区的区域信息。例如,CPU340a从读出的账票格式获取第一区的区域信息。CPU340a从由图像读取装置900输出的图像信息中,提取位于通过所获取的区域信息指定的区域内的信息(ACT406)。

CPU340a通过OCR对位于所提取的区域内的信息进行字符识别(ACT407)。作为字符识别的结果,CPU340a获取位于区域内的字符信息。CPU340a将获取的识别结果暂时保存在存储器330中。需要注意的是,当提取出的区域内没有信息、即空白时,CPU340a不获取任何信息。CPU340a判定是否需要评估识别结果(ACT408)。在此,假设判定为需要。是否需要评估识别结果的判定与第一实施方式的相同。

在这种情况下,CPU340a评估识别结果(ACT409)。假设判定为识别结果不良。在这种情况下,CPU340a使显示器110显示确认画面(ACT410)。需要指出,预先设定使显示器110显示第一确认画面至第四确认画面中哪一画面。在此,假设显示第一确认画面。在这种情况下,CPU340a使显示器110上显示的等待画面85切换为第一确认画面86进行显示。

用户在显示器110上显示的第一确认画面中选择“是”按钮861和“否”按钮862中任一按钮。在此,假设继续进行识别处理、即选择了“是”按钮861。之后,CPU340a使显示器110上显示的第一确认画面86切换为等待画面85进行显示。

CPU340a在从账票格式获得的所有区中执行识别处理(ACT411)。由此,对一张账票的识别处理结束。之后,CPU340a生成表示对一张账票的识别处理结束的识别完成通知。CPU340a经由网络接口310将生成的识别完成通知发送到图像读取装置900(ACT412)。

图像读取装置900接收从图像处理装置100a发送来的识别完成通知。图像读取装置900根据识别完成通知的接收,再次控制辊来输送一张所设置的账票(ACT413)。需要指出,在没有设置的账票的情况下,图像读取装置900将表示该意思的通知发送到图像处理装置100a。图像读取装置900通过以光学方式读取输送的账票,从而生成图像信息(ACT414)。图像读取装置900将生成的图像信息发送到图像处理装置100a(ACT415)。

网络接口310接收从图像读取装置900发送来的图像信息。网络接口310将接收到的图像信息输出到CPU340a。CPU340a将提取区z初始化为1。

CPU340a从在ACT405的处理中读出的账票格式获取第z区的区域信息。CPU340a从由图像读取装置900输出的图像信息中,提取位于通过所获取的区域信息指定的区域内的信息(ACT416)。

CPU340a通过OCR对位于所提取的区域内的信息进行字符识别(ACT417)。作为字符识别的结果,CPU340a获取位于区域内的字符信息。CPU340a将获取的识别结果暂时保存在存储器330中。需要注意的是,当提取出的区域内没有信息、即空白时,CPU340a不获取任何信息。CPU340a判定是否需要评估识别结果(ACT418)。在此,假设判定为需要。

在这种情况下,CPU340a评估识别结果(ACT419)。假设判定为识别结果不良。在这种情况下,CPU340a使显示器110显示确认画面(ACT420)。在此,假设显示第一确认画面86。在这种情况下,CPU340a使显示器110上显示的等待画面85切换为第一确认画面86进行显示。

用户在显示器110上显示的第一确认画面86中选择“是”按钮861和“否”按钮862中任一按钮。在此,假设结束识别处理、即选择了“否”按钮862。在这种情况下,CPU340a生成表示结束识别处理的结束通知。CPU340a经由网络接口310将生成的结束通知发送到图像读取装置900(ACT421)。

图像读取装置900根据结束通知的接收,结束账票的输送。

根据如上构成的图像处理系统10a,图像处理装置100a无需进行图像的读取处理。特别地,即使是不包括诸如图像读取装置900之类的装置的图像处理装置,也能够确认是否继续识别处理并进行与确认结果相应的处理。通过进行这样的确认,能够通知用户误用误选择的账票格式。因此,用户能够切换到正确的账票格式。为此,能够减轻对于不必要的处理的处理负荷。另外,还能够降低图像处理装置100a的装置成本。

以下,说明第二实施方式中的图像处理装置100a的变形例。

图像处理装置100a也可以与第一实施方式相同地进行变形。

根据上面描述的至少一种实施方式的图像处理装置100,通过具有以下控制部,从而能够减轻对于不必要的处理的处理负荷:该控制部使用定义有在通过读取片材上形成的图像而获得的图像信息中应进行图像识别的区域的多个格式中所选择的格式,在图像信息中进行通过上述格式定义的区域内的图像识别处理,当图像识别处理的结果不良时,进行确认继续进行图像识别处理这一意思的输出。

也可以通过计算机来实现上述实施方式中的图像处理装置100、100a的部分功能。在该情况下,将用于实现该功能的程序记录在计算机可读记录介质中,然后,通过使计算机系统读入、执行记录在记录有上述程序的记录介质中的程序来实现。需要注意的是,这里所说的“计算机系统”包括操作系统、***设备等硬件。另外,“计算机可读记录介质”是指可移动介质、存储装置等。可移动介质是软盘、光磁盘、ROM、CD-ROM等。另外,存储装置是内置于计算机系统中的硬盘等。进而,“计算机可读记录介质”也可以是像经由通信线路发送程序时的通信线那样在短时间的期间内动态地保持程序的介质。通信线路是互联网等网络、电话线路等。此外,“计算机可读记录介质”也可以是作为服务器、客户端的计算机系统内部的易失性存储器。易失性存储器将程序保持一定时间。此外,上述程序也可以是用于实现上述部分功能的程序。此外,上述程序还可以是能与已记录于计算机系统中的程序组合来进一步实现上述功能的程序。

虽然说明了几个实施方式,但这些实施方式只是作为示例而提出,并非旨在限定发明的范围。事实上,本文描述的新实施方式能够以其他各种方式实施,能够在不脱离本发明的精神的情况下,对本文描述的实施方式进行各种省略、替换、变更。所附权利要求及其等同物旨在涵盖落入本发明的范围和精神内的这些形式或修改。

35页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:图像形成装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类