一种电子***信息的提取方法及电子设备

文档序号:1490763 发布日期:2020-02-04 浏览:3次 >En<

阅读说明:本技术 一种电子***信息的提取方法及电子设备 (Electronic invoice information extraction method and electronic equipment ) 是由 王志鹏 朱西华 张胜娜 于 2019-09-26 设计创作,主要内容包括:本发明实施例公开了一种电子发票信息的提取方法及电子设备,用于实现了对增值税发票指定区域的文本识别,进而提高了票据信息的识别效率。本发明实施例方法包括:选定目标类型的增值税电子发票,以及选定标准图片作为基准图片,制作自定义识别模板;导入增值税电子发票文件;将目标增值税电子发票文件进行预处理和几何校正处理,以及通过放缩和裁剪处理成统一的标准尺寸,得到处理后的增值税电子发票文件;将处理后的增值税电子发票文件与基准图片进行对齐操作;将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域;对ROI截取区域进行识别操作,得到识别结果;再校对并进行结构化处理,以指定格式进行输出存储。(The embodiment of the invention discloses an electronic invoice information extraction method and electronic equipment, which are used for realizing text recognition of a value-added tax invoice designated area and further improving the recognition efficiency of bill information. The method provided by the embodiment of the invention comprises the following steps: selecting a value-added tax electronic invoice of a target type and selecting a standard picture as a reference picture, and making a custom identification template; importing a value-added tax electronic invoice file; preprocessing and geometrically correcting the target value-added tax electronic invoice file, and scaling and cutting the target value-added tax electronic invoice file into a uniform standard size to obtain a processed value-added tax electronic invoice file; aligning the processed value-added tax electronic invoice file with a reference picture; cutting the region to be identified in the aligned picture corresponding to the template picture into the region of interest ROI to obtain the ROI intercepted region; identifying the ROI intercepted area to obtain an identification result; and then proofreading and structuring processing are carried out, and output and storage are carried out in a specified format.)

一种电子***信息的提取方法及电子设备

技术领域

本发明涉及图像识别技术领域,具体涉及电子***信息的提取方法及电子设备。

背景技术

在日常工作中,公司的财务人员每天都要处理很多的***,包括电子***,以及纸质的增值税专用***、普通***、运输***等等。人工手动录入***,不仅费时,且容易出错;纸质***原件和扫描电子版的双重存储,无形中给财务人员增加了很多的工作量。因此,票据自动化处理的问题仍亟待解决。

传统的光学字符识别(Optical Character Recognition,)技术处理流程包括以下五部分:输入图像,预处理,版面分析,行列切割,字符识别,后处理识别校正。该流程中的每一部分对识别结果的影响都很大,若有一个环节处理不当,直接影响下一环节的处理结果,进而间接导致最终识别结果的不理想。

目前,票据识别技术主要借助于传统的OCR技术,将非结构化的票据图像转换为结构化数据,实现票据信息的提取。实现方法主要为:对票据上的每一项信息的信息行都进行定位,然后从所有信息框中定位需要识别的信息框位置,再利用字符分割和OCR识别技术识别出信息框中的所有文字信息。该方法适用于票面工整且信息内容较少的票据,对于票面复杂且内容较多时,预处理和识别操作耗费的时间较长,而且非常容易导致定位失误,进而识别失败的情况。

另外,虽然电子***在近几年得到了广泛的推广,但是下载格式基本上都是便携式文档格式(Portable Document Format,PDF)格式。然而企业财务报销只要求纸质版和图片电子版,几乎大多数的票据识别技术都是基于图片格式的,故针对电子***来说,财务人员还需手工截取电子***票面信息,转为图片格式。此操作不仅麻烦,还容易产生遗漏现象。

发明内容

本发明实施例提供了一种电子***信息的提取方法及电子设备,用于设置自定义识别模板,通过PDF格式电子***转图片格式技术,以及基于深度学习的端到端OCR技术实现了对增值税***指定区域的文本识别,进而提高了票据信息的识别效率,提升了财务人员的办公效率。

有鉴于此,本发明第一方面提供了一种电子***信息的提取方法,可以包括:

选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板;

导入增值税电子***文件,所述增值税电子***文件包括PDF格式的增值税电子***文件和图片格式的第一增值税电子***文件,其中,每个增值电子***文件的命名为统一格式;

将PDF类的增值税电子***文件进行结构解析,转换为图片格式的第二增值税电子***文件;

将目标增值税电子***文件进行预处理和几何校正处理,以及通过放缩和裁剪处理成统一的标准尺寸,得到处理后的增值税电子***文件,其中,所述目标增值税电子***文件包括所述图片格式的第一增值税电子***文件和所述图片格式的第二增值税电子***文件;

将所述处理后的增值税电子***文件与所述基准图片进行对齐操作;

将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域;

利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识别操作,得到识别结果;

将所述识别结果进行校对,并进行结构化处理,以指定格式进行输出存储。

可选的,在本发明的一些实施例中,所述导入增值税电子***文件,所述的导入增值税电子***文件,支持单个和多个文件上传;待识别完成后,根据文件属性对所述导入的增值税电子***文件的识别结果分别进行存储。

可选的,在本发明的一些实施例中,所述选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板,包括:

选定一张标准的增值税电子***的图片,所述标准的增值税电子***的图片为完整、清晰、端正、无污染,作为制作自定义识别模板的基准图片;

选定所述标准的增值税电子***的图片上表格的外接框上4个角点作为图片对齐变换的基准点,保存所述4个角点的坐标点;

根据需求选定电子***中的待识别区域,保存待识别区域的坐标位置,以及该区域代表的内容,作为结构化结果的标签信息,得到自定义识别模板。

可选的,在本发明的一些实施例中,所述将目标增值税电子***文件进行预处理和几何校正处理,包括:

对将目标增值税电子***文件进行灰度化处理,转为单通道灰度图像;

采用高斯滤波处理对所述单通道灰度图像进行平滑降噪处理,得到平滑降噪图像;

通过Hough变换提取所述平滑降噪图像中的4条外边框直线,进而计算得到外边框的4个角点的坐标位置;将4个角点的坐标位置与自定义识别模板中的4个角点比对,通过多级透视变换,进行几何校正,得到本校正图片;

对比所述基准图片,裁剪掉本校正图片中多余的边界区域以及ROI区域,使得与所述自定义识别模板尺寸保持一致,得到待识别区域图片。

可选的,在本发明的一些实施例中,所述的基于深度学习的端到端文字识别OCR技术依靠两种深度学习模型,分别为:文字检测模型CTPN和文字识别模型CRNN。

可选的,在本发明的一些实施例中,所述文字检测模型为:收集多种场景且包含不同文字的图片,通过人工标定文字区域,按9:1的比例划分为训练集和测试集;通过深度学习中CTPN算法进行模型训练;此检测模型可以检测所述待识别区域图片中的文字区域,以行模式进行检测,以矩形框定位和可视化展示。

可选的,在本发明的一些实施例中,所述文字识别模型为:收集中英文语料库,生成包含固定字数长度的文字识别样本集,通过深度学习中CRNN算法进行模型训练;此识别模型可以识别出所述待识别区域图片中的文字信息,不再需要进行文本行分割和字符分割,以字符串格式输出。

本发明第二方面提供一种电子设备,可以包括:

获取模块,用于选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板;导入增值税电子***文件,所述增值税电子***文件包括PDF格式的增值税电子***文件和图片格式的第一增值税电子***文件,其中,每个增值电子***文件的命名为统一格式;

处理模块,用于将PDF类的增值税电子***文件进行结构解析,转换为图片格式的第二增值税电子***文件;将目标增值税电子***文件进行预处理和几何校正处理,以及通过放缩和裁剪处理成统一的标准尺寸,得到处理后的增值税电子***文件,其中,所述目标增值税电子***文件包括所述图片格式的第一增值税电子***文件和所述图片格式的第二增值税电子***文件;

将所述处理后的增值税电子***文件与所述基准图片进行对齐操作;将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域;利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识别操作,得到识别结果;将所述识别结果进行校对,并进行结构化处理,以指定格式进行输出存储。

可选的,在本发明的一些实施例中,所述导入增值税电子***文件,所述的导入增值税电子***文件,支持单个和多个文件上传;待识别完成后,根据文件属性对所述导入的增值税电子***文件的识别结果分别进行存储。

可选的,在本发明的一些实施例中,

所述获取模块,具体用于选定一张标准的增值税电子***的图片,所述标准的增值税电子***的图片为完整、清晰、端正、无污染,作为制作自定义识别模板的基准图片;选定所述标准的增值税电子***的图片上表格的外接框上4个角点作为图片对齐变换的基准点,保存所述4个角点的坐标点;根据需求选定电子***中的待识别区域,保存待识别区域的坐标位置,以及该区域代表的内容,作为结构化结果的标签信息,得到自定义识别模板。

可选的,在本发明的一些实施例中,

所述处理模块,具体用于对将目标增值税电子***文件进行灰度化处理,转为单通道灰度图像;采用高斯滤波处理对所述单通道灰度图像进行平滑降噪处理,得到平滑降噪图像;通过Hough变换提取所述平滑降噪图像中的4条外边框直线,进而计算得到外边框的4个角点的坐标位置;将4个角点的坐标位置与自定义识别模板中的4个角点比对,通过多级透视变换,进行几何校正,得到本校正图片;对比所述基准图片,裁剪掉本校正图片中多余的边界区域以及ROI区域,使得与所述自定义识别模板尺寸保持一致,得到待识别区域图片。

可选的,在本发明的一些实施例中,所述的基于深度学习的端到端文字识别OCR技术依靠两种深度学习模型,分别为:文字检测模型CTPN和文字识别模型CRNN。

可选的,在本发明的一些实施例中,

所述文字检测模型为:收集多种场景且包含不同文字的图片,通过人工标定文字区域,按9:1的比例划分为训练集和测试集;通过深度学习中CTPN算法进行模型训练;此检测模型可以检测所述待识别区域图片中的文字区域,以行模式进行检测,以矩形框定位和可视化展示。

可选的,在本发明的一些实施例中,

所述文字识别模型为:收集中英文语料库,生成包含固定字数长度的文字识别样本集,通过深度学习中CRNN算法进行模型训练;此识别模型可以识别出所述待识别区域图片中的文字信息,不再需要进行文本行分割和字符分割,以字符串格式输出。

本发明第三方面提供一种电子设备,可以包括:

收发器,处理器,存储器,其中,所述收发器,所述处理器和所述存储器通过总线连接;

所述存储器,用于存储操作指令;

所述收发器,用于选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板;导入增值税电子***文件,所述增值税电子***文件包括PDF格式的增值税电子***文件和图片格式的第一增值税电子***文件,其中,每个增值电子***文件的命名为统一格式;

所述处理器,用于调用所述操作指令,执行如本发明实施例中第一方面及第一方面中任一可选实现方式中所述的电子***信息的提取方法的步骤。

本发明第四方面提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明实施例中第一方面及第一方面中任一可选实现方式中所述的电子***信息的提取方法的步骤。

从以上技术方案可以看出,本发明实施例具有以下优点:

在本发明实施例中,选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板;导入增值税电子***文件,所述增值税电子***文件包括PDF格式的增值税电子***文件和图片格式的第一增值税电子***文件,其中,每个增值电子***文件的命名为统一格式;将PDF类的增值税电子***文件进行结构解析,转换为图片格式的第二增值税电子***文件;将目标增值税电子***文件进行预处理和几何校正处理,以及通过放缩和裁剪处理成统一的标准尺寸,得到处理后的增值税电子***文件,其中,所述目标增值税电子***文件包括所述图片格式的第一增值税电子***文件和所述图片格式的第二增值税电子***文件;将所述处理后的增值税电子***文件与所述基准图片进行对齐操作;将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域;利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识别操作,得到识别结果;将所述识别结果进行校对,并进行结构化处理,以指定格式进行输出存储。通过PDF格式电子***转图片格式技术,以及基于深度学习的端到端OCR技术实现了对增值税***指定区域的文本识别,进而提高了票据信息的识别效率,提升了财务人员的办公效率。

附图说明

为了更清楚地说明本发明实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,还可以根据这些附图获得其它的附图。

图1为本发明实施例中电子***信息的提取方法的一个实施例示意图;

图2为本发明实施例中电子***信息的提取方法的设计流程图;

图3为本发明实施例中增值税电子***自定义模板的示意图;

图4为本发明实施例中电子设备的一个实施例示意图;

图5为本发明实施例中电子设备的另一个实施例示意图。

具体实施方式

本发明实施例提供了一种电子***信息的提取方法及电子设备,用于设置自定义识别模板,通过PDF格式电子***转图片格式技术,以及基于深度学习的端到端OCR技术实现了对增值税***指定区域的文本识别,进而提高了票据信息的识别效率,提升了财务人员的办公效率。

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,都应当属于本发明保护的范围。

如图1所示,为本发明实施例中电子***信息的提取方法的一个实施例示意图,可以包括:

101、选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板。

所述选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板,可以包括:选定一张标准的增值税电子***的图片,所述标准的增值税电子***的图片为完整、清晰、端正、无污染,作为制作自定义识别模板的基准图片;选定所述标准的增值税电子***的图片上表格的外接框上4个角点作为图片对齐变换的基准点,保存所述4个角点的坐标点;根据需求选定电子***中的待识别区域,保存待识别区域的坐标位置,以及该区域代表的内容,作为结构化结果的标签信息,得到自定义识别模板。

示例性的,制定自定义模板。选取一张完整的、清晰的、端正的、无污染的该类增值税***的标准图片作为制作模板的基准图片,手动标定基准图片的对齐基准点,即表格的外接框的4个角点,保存其坐标位置;手动选取待识别的文字区域,标注该区域代表的属性内容,即标签信息,保存其矩形区域的坐标位置,最后命名并保存该自定义识别模板。

如图2所示,为本发明实施例中电子***信息的提取方法的设计流程图。如图3所示,为本发明实施例中增值税电子***自定义模板的示意图。

102、导入增值税电子***文件,所述增值税电子***文件包括PDF格式的增值税电子***文件和图片格式的第一增值税电子***文件,其中,每个增值电子***文件的命名为统一格式。

可以理解的是,所述导入增值税电子***文件,所述的导入增值税电子***文件,支持单个和多个文件上传;待识别完成后,根据文件属性对所述导入的增值税电子***文件的识别结果分别进行存储。

示例性的,导入增值税电子***文件的导入类型分别支持单个导入和批量导入,导入格式分别支持图片格式(JPG和PNG)和PDF格式(文字版和扫描版),其中,每个文件的命名应固定为统一格式。例如分别为“所属人员_所属部门_所属项目_报销类别_索引值”,系统根据名称自动进行分类汇总。

103、将PDF类的增值税电子***文件进行结构解析,转换为图片格式的增值税电子***文件。

示例性的,对上传的PDF格式电子***进行结构解析,将每一页单独转换成一张图片格式,即一张图片只包含一张***的内容;命名同PDF文件,只是在索引值后面加一个子索引值,方便后期进行项目金额统计汇总。

104、将目标增值税电子***文件进行预处理和几何校正处理,以及通过放缩和裁剪处理成统一的标准尺寸,得到处理后的增值税电子***文件,将所述处理后的增值税电子***文件与所述基准图片进行对齐操作;将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域。

其中,所述目标增值税电子***文件包括所述图片格式的第一增值税电子***文件和所述图片格式的第二增值税电子***文件。

所述将目标增值税电子***文件进行预处理和几何校正处理,可以包括:

对将目标增值税电子***文件进行灰度化处理,转为单通道灰度图像;采用高斯滤波处理对所述单通道灰度图像进行平滑降噪处理,得到平滑降噪图像;通过Hough变换提取所述平滑降噪图像中的4条外边框直线,进而计算得到外边框的4个角点的坐标位置;将4个角点的坐标位置与自定义识别模板中的4个角点比对,通过多级透视变换,进行几何校正,得到本校正图片;对比所述基准图片,裁剪掉本校正图片中多余的边界区域,使其与所述自定义识别模板尺寸保持一致。

示例性的,对待识别图片进行预处理和几何校正处理,所述的预处理为:对***图片进行灰度化处理,转为单通道图像;采用高斯滤波处理对灰度图像进行平滑降噪处理;通过Hough变换提取***图像中的4条外边框直线,进而计算得到外边框的4个角点的坐标位置;将4个角点与模板中的4个角点比对,通过多级透视变换,进行几何校正;对比所述基准图片,裁剪掉本校正图片中多余的边界区域以及ROI区域,使得与所述自定义识别模板尺寸保持一致,得到待识别区域图片。

105、利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识别操作,得到识别结果。

其中,所述的基于深度学习的端到端文字识别OCR技术依靠两种深度学习模型,分别为:文字检测模型和文字识别模型。

所述文字检测模型为:收集多种场景且包含不同文字的图片,通过人工标定文字区域,按9:1的比例划分为训练集和测试集;通过深度学习中CTPN算法进行模型训练;此检测模型可以检测所述待识别区域图片中的文字区域,以行模式进行检测,以矩形框定位和可视化展示。

所述文字识别模型为:收集中英文语料库,生成包含固定字数长度的文字识别样本集,通过深度学习中CRNN算法进行模型训练;此识别模型可以识别出所述待识别区域图片中的文字信息,不再需要进行文本行分割和字符分割,以字符串格式输出。

示例性的,根据文本检测--CTPN模型,将预处理和几何校正后的图片作为输入,进行文本检测,得到文本行的定位信息,可以包括:

收集相关票据图片以及多种场景下包含文字的自然图片;通过标注工具LabelImg软件对图片中的文字区域进行标定;构造CTPN模型,将标定好的样本集按9:1的比例划分为训练集和验证集,训练网络模型,若达到收敛,则保存模型;若不收敛,则停止训练,调整参数,重新训练,直至算法收敛。

根据文本识别--CRNN模型,将预处理和几何校正后的图片作为输入,进行文本检测,得到文本行的定位信息,可以包括:将上述检测到的文本行区域截图,作为文本识别模型的输入,进行文本识别,得到文本信息字符串;针对该类票据,提取票据背景图片,添加票据包含的相关字体,通过人工合成的方式生成拥有固定字数的训练样本;该训练样本通过添加噪声,使之更贴近真实化数据;构造CRNN模型,将标定好的样本集按9:1的比例划分为训练集和验证集,训练网络模型,若达到收敛,则保存模型;若不收敛,则停止训练,调整参数,重新训练,直至算法收敛。

106、将所述识别结果进行校对,并进行结构化处理,以指定格式进行输出存储。

示例性的,根据得到的文本信息,结合该区域的标签信息,构造成结构化文本信息,以指定格式输出保存。

可以理解的是,所述结构化处理为,对比模板中矩形区域的标签,将待识别图片中对应的矩形区域中识别的文字信息定义为标签区域的信息,构成结构化数据。例如:在CRNN文字识别出来的字符串结果转换成用户指定的格式输出,比如***中金额部分,如果识别出大写和小写的金额,分别将大写金额输出到大写栏,将小写金额输出到小写栏。

在本发明实施例中,选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板;导入增值税电子***文件,所述增值税电子***文件包括PDF格式的增值税电子***文件和图片格式的第一增值税电子***文件,其中,每个增值电子***文件的命名为统一格式;将PDF类的增值税电子***文件进行结构解析,转换为图片格式的第二增值税电子***文件;将目标增值税电子***文件进行预处理和几何校正处理,以及通过放缩和裁剪处理成统一的标准尺寸,得到处理后的增值税电子***文件,其中,所述目标增值税电子***文件包括所述图片格式的第一增值税电子***文件和所述图片格式的第二增值税电子***文件;将所述处理后的增值税电子***文件与所述基准图片进行对齐操作;将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域;利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识别操作,得到识别结果;将所述识别结果进行校对,并进行结构化处理,以指定格式进行输出存储。本发明能够根据自身需要设置识别区域模板,直接导入PDF格式和图片格式的电子***,基于深度学习的端到端文本识别模型,自定义格式的结构化结果输出,这样大大地提升了财务人员的办公效率,缩短报销周期,并保证了识别准确率,对实现自动化办公起到了一定的推动作用。

可以理解的是,加入PDF格式电子***文件的结构解析,省略了针对电子***仍需人工截图的繁琐工作;添加了自定义模板的功能,不仅能够快速、准确地将图片定位到最佳的识别效果,还可以根据自身需要进行感兴趣区域提取;使用深度学习算法进行文本内容的端到端识别,避免了传统OCR方法的繁琐、复杂的设计和低效率的处理流程,极大地提高了识别准确率。

如图4所示,为本发明实施例中提供的电子设备的一个实施例示意图,可以包括:

获取模块401,用于选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板;导入增值税电子***文件,所述增值税电子***文件包括PDF格式的增值税电子***文件和图片格式的第一增值税电子***文件,其中,每个增值电子***文件的命名为统一格式;

处理模块402,用于将PDF类的增值税电子***文件进行结构解析,转换为图片格式的第二增值税电子***文件;将目标增值税电子***文件进行预处理和几何校正处理,以及通过放缩和裁剪处理成统一的标准尺寸,得到处理后的增值税电子***文件,其中,所述目标增值税电子***文件包括所述图片格式的第一增值税电子***文件和所述图片格式的第二增值税电子***文件;将所述处理后的增值税电子***文件与所述基准图片进行对齐操作;将对齐后的图片中对应于模板图片中的待识别区域作感兴趣ROI区域裁剪操作,得到ROI截取区域;利用基于深度学习的端到端文字识别算法对所述ROI截取区域进行文字检测和文字识别操作,得到识别结果;将所述识别结果进行校对,并进行结构化处理,以指定格式进行输出存储。

可选的,在本发明的一些实施例中,所述导入增值税电子***文件,所述的导入增值税电子***文件,支持单个和多个文件上传;待识别完成后,根据文件属性对所述导入的增值税电子***文件的识别结果分别进行存储。可选的,在本发明的一些实施例中,

获取模块401,具体用于选定一张标准的增值税电子***的图片,所述标准的增值税电子***的图片为完整、清晰、端正、无污染,作为制作自定义识别模板的基准图片;选定所述标准的增值税电子***的图片上表格的外接框上4个角点作为图片对齐变换的基准点,保存所述4个角点的坐标点;根据需求选定电子***中的待识别区域,保存待识别区域的坐标位置,以及该区域代表的内容,作为结构化结果的标签信息,得到自定义识别模板。

可选的,在本发明的一些实施例中,

处理模块402,具体用于对将目标增值税电子***文件进行灰度化处理,转为单通道灰度图像;采用高斯滤波处理对所述单通道灰度图像进行平滑降噪处理,得到平滑降噪图像;通过Hough变换提取所述平滑降噪图像中的4条外边框直线,进而计算得到外边框的4个角点的坐标位置;将4个角点的坐标位置与自定义识别模板中的4个角点比对,通过多级透视变换,进行几何校正,得到本校正图片;对比所述基准图片,裁剪掉本校正图片中多余的边界区域以及ROI区域,使得与所述自定义识别模板尺寸保持一致,得到待识别区域图片。

可选的,在本发明的一些实施例中,所述的基于深度学习的端到端文字识别OCR技术依靠两种深度学习模型,分别为:文字检测模型和文字识别模型。

可选的,在本发明的一些实施例中,

所述文字检测模型为:收集多种场景且包含不同文字的图片,通过人工标定文字区域,按9:1的比例划分为训练集和测试集;通过深度学习中CTPN算法进行模型训练;此检测模型可以检测所述待识别区域图片中的文字区域,以行模式进行检测,以矩形框定位和可视化展示。

可选的,在本发明的一些实施例中,

所述文字识别模型为:收集中英文语料库,生成包含固定字数长度的文字识别样本集,通过深度学习中CRNN算法进行模型训练;此识别模型可以识别出所述待识别区域图片中的文字信息,不再需要进行文本行分割和字符分割,以字符串格式输出。

如图5所示,为本发明实施例中电子设备的一个实施例示意图,可以包括:

收发器501,处理器502,存储器503,其中,收发器501,处理器502和存储器503通过总线连接;

存储器503,用于存储操作指令;

收发器501,用于选定目标类型的增值税电子***,以及选定所述目标类型的增值税电子***的标准图片作为基准图片,制作自定义识别模板;导入增值税电子***文件,所述增值税电子***文件支持的格式包含PDF和图片类型,其中,每个增值电子***文件的命名为统一格式;

处理器502,用于调用所述操作指令,执行如本发明实施例中图1所示的电子***信息的提取方法的步骤。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于稀疏表示的冠层植物高光谱图像分类方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!