******识别的方法、装置、计算机设备和存储介质

文档序号:1490759 发布日期:2020-02-04 浏览:5次 >En<

阅读说明:本技术 ******识别的方法、装置、计算机设备和存储介质 (Invoice seal identification method and device, computer equipment and storage medium ) 是由 张凡 魏华 卢国庆 于 2019-09-16 设计创作,主要内容包括:本申请涉及一种发票印章识别的方法,该方法包括:提取发票上的待识别印章图像;获取发票上的开票方信息,根据所述开票方信息生成标准印章图像;计算所述发票上的待识别印章图像与所述标准印章图像的匹配度;根据所述匹配度确定所述待识别印章图像对应的识别结果。本发明根据票面的销方信息,生成标准发票印章图像,与发票内的待识别印章影像进行匹配,将独立识别转变为图像匹配检查,能够有效改善实际场景下的发票印章识别效果。(The application relates to an invoice seal identification method, which comprises the following steps: extracting a seal image to be identified on the invoice; acquiring information of a invoicing party on an invoice, and generating a standard seal image according to the information of the invoicing party; calculating the matching degree of the image of the seal to be identified on the invoice and the image of the standard seal; and determining the identification result corresponding to the stamp image to be identified according to the matching degree. According to the receipt seal identification method and device, the standard receipt seal image is generated according to the receipt sales information, the standard receipt seal image is matched with the seal image to be identified in the receipt, independent identification is converted into image matching inspection, and the receipt seal identification effect in an actual scene can be effectively improved.)

******识别的方法、装置、计算机设备和存储介质

技术领域

本发明涉及图像识别领域,尤其涉及一种******识别的方法、装置、计算机设备和存储介质。

背景技术

为了确保***所盖***与开具方信息相同,目前财务部门收票后,需进行人工核对。人工核对虽然能保证合规性,但效率偏低,因此对于***的合规性判断是企业的一项迫切需求。

现有技术常见的做法为通过图像算法,检测到***在图像内的位置后进行***内容识别,将提取后的信息与票面信息再进行比对。对于***的识别比较依赖于***的效果,一般来说对于***内容比较完整的场景识别可以取得较好的效果。但是对于一些***较为模糊的场景,却不能取得较好的效果。

发明内容

基于此,有必要针对上述问题,提供一种对于***较为模糊的场景,也能得到较好识别效果的******识别的方法、装置、计算机设备及存储介质。

第一方面,本发明实施例提供一种******识别的方法,所述方法包括:

提取***上的待识别***图像;

获取***上的开票方信息,根据所述开票方信息生成标准***图像;

计算所述***上的待识别***图像与所述标准***图像的匹配度;

根据所述匹配度确定所述待识别***图像对应的识别结果。

在其中一个实施例中,计算所述***上的待识别***图像与所述标准***图像的匹配度,包括:对所述待识别***图像和所述标准***图像进行归一化处理,得到归一化的待识别***图像和标准***图像;分别获取所述归一化的待识别***图像和标准***图像对应的特征向量;根据所述特征向量计算所述待识别***图像和所述标准***图像的匹配度。

在其中一个实施例中,特征向量包括:基于线数量特征值,***位置特征值,数据分布特征值,颜色比例特征值。

在其中一个实施例中,根据所述特征值计算所述***图像和所述标准***图像的匹配度,包括:根据所述待识别***图像对应的特征向量与所述标准***图像对应的特征向量计算得到第一协方差值;获取第一预设阈值,根据所述第一协方差值和第一预设阈值得到第一识别结果;当所述第一识别结果符合要求时,则提取所述待识别***图像和所述标准***图像中的税号区域;提取所述待识别***图像中税号区域对应的第一税号特征向量,提取所述标准***图像中税号区域对应的第二税号特征向量;根据所述第一税号特征向量和所述第二税号特征向量计算得到第二协方差值;所述根据所述匹配度确定所述待识别***图像对应的识别结果,包括:获取第二预设阈值,根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果。

在其中一个实施例中,所述根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果,包括:当所述所述第二协方差值小于第二预设阈值时,确定所述待识别***图像与所述标准***图像不一致。当所述第二协方差值大于第二预设阈值时,确定所述待识别***图像与所述标准***图像一致;

在其中一个实施例中,***上的开票方信息,包括:销方名称、销方税号;所述根据所述开票方信息生成标准***图像,包括:获取******的模板;根据所述******的模板和所述开票方信息生成标准***图像。

在其中一个实施例中,提取***上的待识别***图像,还包括:在预设***区域根据***颜色提取***区域;采用霍夫变换对所述***区域中的***图像进行识别,提取得到所述待识别***图像。

第二方面,本发明实施例提供一种******识别的装置,所述装置包括:提取模块,用于提取***上的待识别***图像;

获取模块,用于获取***上的开票方信息,根据所述开票方信息生成标准***图像;

计算模块,用于计算所述***上的待识别***图像与所述标准***图像的匹配度;

确定模块,用于根据所述匹配度确定所述待识别***图像对应的识别结果根据所述匹配度确确定***章是否与销方一致。

第三方面,本发明实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:

提取***上的待识别***图像;

获取***上的开票方信息,根据所述开票方信息生成标准***图像;

计算所述***上的待识别***图像与所述标准***图像的匹配度;

根据所述匹配度确定所述待识别***图像对应的识别结果。

第四方面,本发明实施例提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:

提取***上的待识别***图像;

获取***上的开票方信息,根据所述开票方信息生成标准***图像;

计算所述***上的待识别***图像与所述标准***图像的匹配度;

根据所述匹配度确定所述待识别***图像对应的识别结果。

上述******识别的方法、装置、计算机设备及储存介质,通过提取***上的待识别***图像,根据获取***上的开票方信息生成标准***图像,然后计算待识别***图像与所述标准***图像的匹配度,最后,根据匹配度确定所述待识别***图像对应的识别结果。相对于传统识别方法,将独立识别转变为图像匹配检查,能够有效改善实际场景下的******识别效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。

图1为一个实施例中******识别的方法的流程图;

图2为一个实施例中标准***图像的示意图;

图3为一个实施例中待识别***图像与标准***图像的匹配度计算的流程图;

图4为一个实施例中根据特征向量计算***图像和标准***图像的匹配度的流程图;

图5为一个实施例中确定所述待识别***图像对应的识别结果的流程图;

图6为一个实施例中根据所述开票方信息生成标准***图像的流程图;

图7为一个实施例中提取***上的待识别***图像的流程图;

图8为一个实施例中******识别装置的结构框图;

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,提出了一种******识别的方法,该******识别的方法可以应用于终端,本实施例以应用于终端举例说明。该******识别的方法具体包括以下步骤:

步骤102,提取***上的待识别***图像。

其中,待识别***图像是指***上所盖的***图像,***图像是指包含有***的图像。一般***是盖在***中设定的***区域中的,所以可以直接在***上设定的***区域中检测所盖***的位置,然后提取出***图像,将该提取出的***图像作为待识别***图像。

步骤104,获取***上的开票方信息,根据所述开票方信息生成标准***图像。

其中,开票方信息是指开***时需要提供的销售方的信息。***上的开票方信息包含有:销方名称、销方税号。图2示出了一个标准***图像的示意图,如图所示,ABC公司是销方名称,12345678ABC9DEFG00是销方税号。根据开票方的信息,结合******的模板,生成标准***图像。由于传统方法对***的识别比较依赖于***的效果,一般来说对于***内容比较完整的场景识别可以取得较好的识别效果;但是对于一些***较为模糊的场景,却不能取得较好的识别效果。所以,生成一个标准的***图像作为待识别***的样板,可以得到更准确的待识别***图像的识别结果。通过识别技术(比如,OCR技术)得到的***上的开票方信息,以国家对于增值税***专用章的要求为标准***的模板,可以生成标准***图像,将生成的标准***图像作为对照图像与待识别***图像进行比对。

步骤106,计算所述***上的待识别***图像与所述标准***图像的匹配度。

其中,匹配度是指待识别***图像与标准***图像的匹配程度,用来判断待识别***图像和标准***图像是否一致。匹配度可以通过计算两幅图像相关的协方差值来反映,也可以通过其他算法得到的结果值来反映,例如:(1)灰度匹配,包括:MAD算法、SAD算法、SSD算法、MSD算法、NCC算法、SSDA算法;(2)特征匹配。特征匹配是特征向量之间的距离计算,常用的距离有欧氏距离、汉明距离、余弦距离等。通过判断计算得到的结果值来判断两幅图像是否匹配,从而确定待识别***图像与标准***图像是否一致,得到待识别***的识别结果。

步骤108,根据所述匹配度确定所述待识别***图像对应的识别结果。

其中,匹配度是指待识别***图像与标准***图像的匹配程度,可以根据图像匹配算法计算得到的结果值,判断结果值是否符合匹配条件,得到两幅***图像的匹配度,从而确定待识别***图像的识别结果。匹配条件可以是设定该结果值的阈值条件,通过阈值条件来判断两幅***图像是否匹配:当结果值符合阈值条件时,判断待识别***图像与标准***图像匹配;当结果值不符合阈值条件时,判断待识别***图像与标准***图像不匹配。根据匹配度得到待识别***的识别结果:两幅***图像匹配时,确定待识别***图像与标准***图像一致;两幅***图像不匹配时,确定待识别***图像与标准***图像不一致。

假设通过计算待识别***图像与标准***图像相关的协方差来判断两幅图像的匹配度,从而得到识别结果:对计算得到的协方差值设定不同的阈值,根据协方差值和协方差值的阈值确定待识别***图像对应的识别结果。

因只通过协方差值的正相关原则来判断待识别***图像与标准***图像的匹配程度,无法得到准确的待识别***图像对应的识别结果。所以可以通过设定协方差值的阈值,对计算得到的协方差值进行判断,判断协方差值是否满足阈值条件,从而得到待识别***图像对应的识别结果。例如,对待识别***图像的判断可以是:提取归一化处理后的待识别***图像的特征向量与标准***图像的特征向量,对提取的特征向量进行协方差计算,得到第一协方差值;并用同样方式对近1000个样本图像进行生成和提取并比对计算,得到协方差值序列并将其归一化,最终得到有效相似阈值为0.61。当第一协方差值小于0.61时,确定待识别***图像与标准***图像不一致;当第一协方差值大于0.61时,进一步确定两幅***图像的匹配度:分别提取归一化处理后的待识别***图像和标准***图像中的税号区域对应的税号特征向量,对税号特征向量进行协方差计算,得到第二协方差值;同样对大量样本的销方税号区域进行比对得出协方差值序列,将该序列归一化最终得到两幅图像的税号区域协方差值的相似阈值为0.81。当第二协方差值小于0.81时,确定待识别***图像与标准***图像不一致;当第二协方差值大于0.81时,确定待识别***图像与标准***图像一致。

上述******识别的方法、装置、计算机设备及储存介质,通过提取***上的待识别***图像,根据获取***上的开票方信息生成标准***图像,然后计算待识别***图像与所述标准***图像的匹配度,最后,根据匹配度确定所述待识别***图像对应的识别结果。相对于传统识别方法,将独立识别转变为图像匹配检查,能够有效改善实际场景下的******识别效果。

如图3所示,在一个实施例中,计算所述***上的待识别***图像与所述标准***图像的匹配度,包括:

步骤302,对所述待识别***图像和所述标准***图像进行归一化处理,得到归一化的待识别***图像和标准***图像。

其中,归一化处理是指将待识别***图像和标准***图像处理成为大小和数据格式相同的图像。归一化处理可以是:首先,对生成的标准***影像与提取的待识别***影像进行规格化,确保两幅图像的高度、宽度一致;其次,将两图像统一归一化缩放到64*48像素,得到归一化的待识别***图像和标准***图像。

步骤304,分别获取所述归一化的待识别***图像和标准***图像对应的特征向量。

其中,特征向量是指对图像进行特征提取得到的用来表示图像信息的向量。特征向量是将图像的信息用数据的形式表现出来。提取特征向量的方法还可以是:基于aHash算法提取特征向量,基于pHash算法提取特征向量,基于dHash算法提取特征向量,基于分块均值算法提取特征向量。特征向量包含有很多特征值,每个特征值可以反映待识别***图像和标准***图像的位置、颜色等图像信息,例如:基于线数量特征值、***位置特征值、颜色比例特征值等。

步骤306,根据所述特征向量计算所述待识别***图像和所述标准***图像的匹配度。

其中,特征向量可以是用来反映待识别***图像的图像信息和标准***图像的图像信息,匹配度可以用来判断待识别***图像与标准***图像是否一致。对两幅图像对应的特征向量进行协方差计算,得到对应的协方差值。协方差可以衡量两幅图像的总体误差,根据正相关原则,协方差值越大,两幅图像的匹配度越高。所以,可以用协方差值的大小反映待识别***图像和标准***图像的匹配程度,从而判断待识别***图像与标准***图像是否一致,得到待识别***图像对应的识别结果。

在一个实施例中,特征向量包括:基于线数量特征值,***位置特征值,数据分布特征值,颜色比例特征值。

其中,特征向量中包含有多个特征值,每个特征值分别代表待识别***图像的图像信息特征和标准***图像的图像信息特征。特征值是特征向量的变换规则,通过获取特征向量包含的特征值,将图像信息转化为数据信息体现出来。

如图4所示,在一个实施例中,根据所述特征向量计算所述***图像和所述标准***图像的匹配度,包括:

步骤402,根据所述待识别***图像对应的特征向量与所述标准***图像对应的特征向量计算得到第一协方差值。

其中,第一协方差值是根据待识别***图像对应的特征向量和标准***图像对应的特征向量,通过协方差计算得到的结果值。协方差用来度量各个维度偏离其均值的程度,可以通过计算公式得到协方差值:定义期望值分别为E(X)=μ与E(Y)=ν的两个实数随机变量X与Y之间的协方差定义为:COV(X,Y)=E[(X-E(X))(Y-E(Y))],等价计算式为COV(X,Y)=E(XY)-E(X)E(Y)。协方差的值如果为正值,则说明两者是正相关;结果为负值就说明负相关;如果为0,也是就是统计上说的“相互独立”。根据第一协方差值对待识别***图像和标准***图像的匹配度进行初步判断,得到待识别***图像与标准***图像的初步匹配结果。

步骤404,获取第一预设阈值,根据所述第一协方差值和第一预设阈值得到第一识别结果。

其中,第一预设阈值是第一协方差的阈值,作为用来判断两幅***图像是否初步匹配的临界值。第一预设阈值的获取方式可以是:对近1000个样本图像进行生成和提取并比对计算,得到协方差值序列并将其归一化,最终得到有效相似阈值为0.61,将0.61设置为第一预设阈值。根据正相关原则,协方差值越大则匹配度越高,但仅凭协方差值的大小,无法准确判断待识别***图像对应的识别结果。所以,设置第一预设阈值,通过第一预设阈值判断两幅***图像是否初步匹配,从而得到第一识别结果:当第一协方差值小于第一预设阈值0.61时,判断两幅***图像不匹配,确定待识别***图像与标准***图像不一致;当第一协方差值大于第一预设阈值0.61时,进行下一步的匹配度的计算。

步骤406,提取所述待识别***图像中税号区域对应的第一税号特征向量,提取所述标准***图像中税号区域对应的第二税号特征向量。

其中,税号区域是指待识别***图像和标准***图像中的税号部分图像,第一税号特征向量是待识别***图像中税号区域的特征向量,第二税号特征向量是标准***图像中税号区域的特征向量。当第一协方差值大于第一预设阈值时,判断两幅图像初步一致。由于实际应用中,存在一些较模糊的待识别***图像,所以在得到初步一致的识别结果后,要进一步计算待识别***图像与标准***图像的匹配度。销方税号是******中重要的***信息,通过对销方税号部分图像区域的匹配度计算,可以更准确地得到待识别***图像对应的识别结果。

步骤408,根据所述第一税号特征向量和所述第二税号特征向量计算得到第二协方差值。

其中,第二协方差值是根据待识别***图像的税号区域的特征向量和标准***图像的税号区域的特征向量,计算协方差得到的结果值。协方差是用来度量各个维度偏离其均值的程度,可以通过计算公式得到协方差值:定义期望值分别为E(X)=μ与E(Y)=ν的两个实数随机变量X与Y之间的协方差定义为:COV(X,Y)=E[(X-E(X))(Y-E(Y))],等价计算式为COV(X,Y)=E(XY)-E(X)E(Y)。协方差的值如果为正值,则说明两者是正相关;结果为负值就说明负相关;如果为0,也是就是统计上说的“相互独立”。通过第二协方差值对待识别***图像和标准***图像的匹配度进行进一步的判断,得到待识别***图像与标准***图像的最终匹配结果。

根据所述匹配度确定所述待识别***图像对应的识别结果,包括:获取第二协方差值的第二预设阈值,根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果。

其中,第二预设阈值是指第二协方差值的阈值,作为用来判断两幅***图像是否匹配的临界值。第二预设阈值的获取方式可以是:对大量样本的销方税号识别号区域进行比对计算得出协方差值序列,得到协方差值序列并将其归一化,,将该序列归一化最终得到销方税号识别号的相似阈值为0.81,将0.81设置为第二预设阈值。根据正相关原则,协方差值越大则匹配度越高,但仅凭协方差值的大小,无法准确判断待识别***图像对应的识别结果;前述得到的第一识别结果是对待识别***图像和标准***图像的匹配度的初步判断;所以,设置第二预设阈值,进一步判断两幅***图像的匹配度:当第二协方差值小于第二预设阈值0.81时,判断两幅***图像不匹配,从而确定待识别***图像与标准***图像不一致;当第二协方差值大于第二预设阈值0.81时,判断两幅***图像匹配,确定待识别***图像与标准***图像一致,得到待识别***图像对应的识别结果。

如图5所示,在一个实施例中,根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果,包括:

步骤502,比对第二协方差值和第二预设阈值;当第二协方差小于第二预设阈值时,进入步骤504,;当第二协方差值大于第二预设阈值时,进入步骤506。

步骤504,当所述所述第二协方差值小于第二预设阈值时,确定所述待识别***图像与所述标准***图像不一致。

其中,第二协方差值是进过初步识别结果判断后,通过计算待识别***图像的税号区域的特征向量和标准***图像的税号区域的特征向量的协方差得到的结果值。通过设置第二预设阈值,可以对待识别***图像对应的识别结果进行判断:例如,第二预设阈值是0.81时,若第二协方差值是0.7,由于第二协方差值0.7<第二预设阈值0.81,所以第二预设阈值不符合第二预设阈值的范围,确定待识别***图像与标准***图像不一致。

步骤506,当所述第二协方差值大于第二预设阈值时,确定所述待识别***图像与所述标准***图像一致。

其中,第二协方差值是通过计算待识别***图像的税号区域的特征向量和标准***图像的税号区域的特征向量的协方差得到的结果值。通过设置第二预设阈值,可以对待识别***图像对应的识别结果进行判断:例如,第二预设阈值是0.81时,若第二协方差值是0.85,由于第二协方差值0.85>第二预设阈值0.81,所以第二预设阈值符合第二预设阈值的范围,确定待识别***图像与标准***图像一致。

在一个实施例中,***上的开票方信息,包括:销方名称、销方税号;如图6所示,所述根据所述开票方信息生成标准***图像,包括:

步骤602,获取******的模板。

其中,******的模板是根据国家对于增值税***专用章的要求得到的。******的模板要求具体为:(1)形状为椭圆形,尺寸为40×30(mm);(2)边宽1mm;(3)中间为税号,18位***数字字高3.7mm,字宽1.3mm,18位***数字总宽度26mm(字体为Arial);(4)税号上方环排中文文字高为4.2mm,环排角度(夹角)210-260度,字与边线内侧的距离0.5mm(字体为仿宋体);(5)税号下横排“***专用章”文字字高4.6mm,字宽3mm,延章中心线到下横排字顶端距离4.2mm(字体为仿宋体);(6)***专用章下横排号码字高2.2mm,字宽1.7mm,延章中心线到下横排号码顶端距离10mm(字体为Arial),不需编号时可省去此横排号码。根据上述要求可以生成******的模板,用于生成标准******。

步骤604,根据所述******的模板和所述开票方信息生成标准***图像。

其中,开票方信息包括:销方名称、销方税号。根据******的模板,结合开票方信息,可以生成标准***图像。由于对待识别***图像进行识别时,需要判断待识别***图像的真伪。所以,根据国家对于增值税***专用章的要求,结合提取到的开票方信息,生成标准***图像,作为对照图像与待识别***图像进行匹配。

如图7所示,在一个实施例中,提取***上的待识别***图像,还包括:

步骤702,在预设***区域根据***颜色提取***区域。

其中,预设***区域是指******在***图像上的图像位置区域;根据***颜色提取***区域是指:在预设***区域中根据***的颜色来判断***的位置所在,从而提取出***区域。由于***上所盖***的区域位置是固定的,所以,可以设置预设***区域,保证提取到的图像是待识别的******图像。根据***颜色提取***区域,可以是根据***红色来提取***区域。由于***上的***图像是红色的,所以,可以通过在预设***区域内对***红色的提取,得到***区域。

步骤704,采用霍夫变换对所述***区域中的***图像进行识别,提取得到所述待识别***图像。

其中,采用霍夫变换是指从提取的***区域中分离出待识别***图像。因***图像是由几何图形、文字和数字组成的,所以,对***区域可以采用霍夫变换对***区域中的***图像进行识别,从而提取到待识别***图像。

如图8所示,本发明实施例中提供一种******识别的装置,所述装置包括:

提取模块802,用于提取***上的待识别***图像;

获取模块804,用于获取***上的开票方信息,根据所述开票方信息生成标准***图像;

计算模块806,用于计算所述***上的待识别***图像与所述标准***图像的匹配度;

确定模块808,用于根据所述匹配度确定所述待识别***图像对应的识别结果。

在一个实施例中,计算所述***上的待识别***图像与所述标准***图像的匹配度,包括:对所述待识别***图像和所述标准***图像进行归一化处理,得到归一化的待识别***图像和标准***图像;获取模块804模块还用于分别获取所述归一化的待识别***图像和标准***图像对应的特征向量;计算模块806还用于根据所述特征向量计算所述待识别***图像和所述标准***图像的匹配度。

在一个实施例中,所述特征向量包括:基于线数量特征值,***位置特征值,数据分布特征值,颜色比例特征值。

在一个实施例中,所述根据所述特征值计算所述***图像和所述标准***图像的匹配度,包括:计算模块806还用于根据所述待识别***图像对应的特征向量与所述标准***图像对应的特征向量计算得到第一协方差值;获取模块804还用于获取第一预设阈值,根据所述第一协方差值和第一预设阈值得到第一识别结果;提取模块802还用于当所述第一识别结果符合要求时,则提取所述待识别***图像和所述标准***图像中的税号区域;提取模块802还用于提取所述待识别***图像中税号区域对应的第一税号特征向量,提取所述标准***图像中税号区域对应的第二税号特征向量;计算模块806还用于根据所述第一税号特征向量和所述第二税号特征向量计算得到第二协方差值;所述根据所述匹配度确定所述待识别***图像对应的识别结果,包括:获取模块804还用于获取第二预设阈值,根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果。

在一个实施例中,所述根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果,包括:确定模块808还用于当所述所述第二协方差值小于第二预设阈值时,确定所述待识别***图像与所述标准***图像不一致;确定模块808还用于当所述第二协方差值大于第二预设阈值时,确定所述待识别***图像与所述标准***图像一致。

在一个实施例中,所述***上的开票方信息,包括:销方名称、销方税号;

所述根据所述开票方信息生成标准***图像,包括:获取模块804还用于获取******的模板;获取模块804还用于根据所述******的模板和所述开票方信息生成标准***图像。

在一个实施例中,所述提取***上的待识别***图像,还包括:提取模块802还用于在预设***区域根据***颜色提取***区域;提取模块802还用于采用霍夫变换对所述***区域中的***图像进行识别,提取得到所述待识别***图像。

图9示出了一个实施例中计算机设备的内部结构图。该计算机设备可以是终端。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现******识别的方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行******识别的方法。网络接口用于与外界进行通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的******识别的方法可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成该******识别的装置的各个程序模板。比如,提取模块802,获取模块804,计算模块806,确定模块808。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:提取***上的待识别***图像;获取***上的开票方信息,根据所述开票方信息生成标准***图像;计算所述***上的待识别***图像与所述标准***图像的匹配度;根据所述匹配度确定所述待识别***图像对应的识别结果。

在一个实施例中,所述计算所述***上的待识别***图像与所述标准***图像的匹配度,包括:对所述待识别***图像和所述标准***图像进行归一化处理,得到归一化的待识别***图像和标准***图像;分别获取所述归一化的待识别***图像和标准***图像对应的特征向量;根据所述特征向量计算所述待识别***图像和所述标准***图像的匹配度。

在一个实施例中,所述特征向量包括:基于线数量特征值,***位置特征值,数据分布特征值,颜色比例特征值。

在一个实施例中,所述根据所述特征值计算所述***图像和所述标准***图像的匹配度,包括:根据所述待识别***图像对应的特征向量与所述标准***图像对应的特征向量计算得到第一协方差值;获取第一预设阈值,根据所述第一协方差值和第一预设阈值得到第一识别结果;当所述第一识别结果符合要求时,则提取所述待识别***图像和所述标准***图像中的税号区域;提取所述待识别***图像中税号区域对应的第一税号特征向量,提取所述标准***图像中税号区域对应的第二税号特征向量;根据所述第一税号特征向量和所述第二税号特征向量计算得到第二协方差值;所述根据所述匹配度确定所述待识别***图像对应的识别结果,包括:获取第二预设阈值,根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果。

在一个实施例中,所述根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果,包括:当所述所述第二协方差值小于第二预设阈值时,确定所述待识别***图像与所述标准***图像不一致;当所述第二协方差值大于第二预设阈值时,确定所述待识别***图像与所述标准***图像一致。

在一个实施例中,所述***上的开票方信息,包括:销方名称、销方税号;所述根据所述开票方信息生成标准***图像,包括:获取******的模板;根据所述******的模板和所述开票方信息生成标准***图像。

在一个实施例中,所述提取***上的待识别***图像,还包括:在预设***区域根据***颜色提取***区域;采用霍夫变换对所述***区域中的***图像进行识别,提取得到所述待识别***图像。

一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:提取***上的待识别***图像;获取***上的开票方信息,根据所述开票方信息生成标准***图像;计算所述***上的待识别***图像与所述标准***图像的匹配度;根据所述匹配度确定所述待识别***图像对应的识别结果。

在一个实施例中,所述计算所述***上的待识别***图像与所述标准***图像的匹配度,包括:对所述待识别***图像和所述标准***图像进行归一化处理,得到归一化的待识别***图像和标准***图像;分别获取所述归一化的待识别***图像和标准***图像对应的特征向量;根据所述特征向量计算所述待识别***图像和所述标准***图像的匹配度。

在一个实施例中,所述特征向量包括:基于线数量特征值,***位置特征值,数据分布特征值,颜色比例特征值。

在一个实施例中,所述根据所述特征值计算所述***图像和所述标准***图像的匹配度,包括:根据所述待识别***图像对应的特征向量与所述标准***图像对应的特征向量计算得到第一协方差值;获取第一预设阈值,根据所述第一协方差值和第一预设阈值得到第一识别结果;当所述第一识别结果符合要求时,则提取所述待识别***图像和所述标准***图像中的税号区域;提取所述待识别***图像中税号区域对应的第一税号特征向量,提取所述标准***图像中税号区域对应的第二税号特征向量;根据所述第一税号特征向量和所述第二税号特征向量计算得到第二协方差值;所述根据所述匹配度确定所述待识别***图像对应的识别结果,包括:获取第二预设阈值,根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果。

在一个实施例中,所述根据所述第二协方差值和所述第二预设阈值确定所述待识别***图像对应的识别结果,包括:当所述所述第二协方差值小于第二预设阈值时,确定所述待识别***图像与所述标准***图像不一致;当所述第二协方差值大于第二预设阈值时,确定所述待识别***图像与所述标准***图像一致。

在一个实施例中,所述***上的开票方信息,包括:销方名称、销方税号;所述根据所述开票方信息生成标准***图像,包括:获取******的模板;根据所述******的模板和所述开票方信息生成标准***图像。

在一个实施例中,所述提取***上的待识别***图像,还包括:在预设***区域根据***颜色提取***区域;采用霍夫变换对所述***区域中的***图像进行识别,提取得到所述待识别***图像。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

19页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:字符批量识别方法、装置和计算机设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!