图像识别方法、装置、计算机设备及可读存储介质

文档序号:1738188 发布日期:2019-12-20 浏览:8次 >En<

阅读说明:本技术 图像识别方法、装置、计算机设备及可读存储介质 (Image recognition method and device, computer equipment and readable storage medium ) 是由 高立钊 孙冲 许海华 賈佳亞 戴宇榮 沈小勇 于 2019-09-04 设计创作,主要内容包括:本申请实施例公开了一种图像识别方法、装置、计算机设备及可读存储介质,涉及人工智能的计算机视觉技术;具体地可以获取待识别图像;对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。该方案可以提升图像识别的准确性。(The embodiment of the application discloses an image identification method, an image identification device, computer equipment and a readable storage medium, and relates to the computer vision technology of artificial intelligence; specifically, an image to be recognized can be acquired; detecting attribute areas of the objects in the image to be identified to obtain a plurality of original attribute areas; carrying out scale transformation on the original attribute region to obtain candidate attribute regions with multiple scales; extracting the features of the candidate attribute region to obtain a multi-scale feature group, wherein the multi-scale feature group comprises the region features of the candidate attribute region of each scale; selecting attribute areas of corresponding scales from the candidate attribute areas of multiple scales based on the multi-scale feature group to obtain a target attribute area combination corresponding to the original attribute area; and identifying the object in the image to be identified according to the area characteristics of the attribute areas in the target attribute area combination to obtain an identification result. The scheme can improve the accuracy of image recognition.)

图像识别方法、装置、计算机设备及可读存储介质

技术领域

本发明涉及人工智能技术领域,具体涉及一种图像识别方法、装置、计算机设备及可读存储介质。

背景技术

细粒度图像识别主要任务是对属于同一大类图像的不同子类进行识别或划分,例如对鸟类图片进行进一步分类。

目前常用的细粒度图像识别方案是采用人工智能(AI,ArtificialIntelligence)来实现图像识别细粒度图像识别等,具体地利用AI捕捉图像中对象的局部细节信息,并基于局部细节信息识别图像中的对象。例如,可以利用标注了属性区域的样本图像训练一个具有图像识别功能的卷积神经网络,将待识别图像输入至训练后的卷积神经网络,卷积神经网络将会检测出待识别图像中目标对象的属性区域,然后,卷积神经网络根据属性区域的特征信息对待识别图像中的目标对象进行分类,从而实现图像识别。

由于目前图像的拍摄距离、角度等不相同,会导致图像间存在尺度等多种形式差异,然而,目前基于AI的图像识别方案无法适应这种图像间的差异,因此,检测出的属性区域常常具有尺度和位置等定位不准确的问题,从而导致图像识别(或分类)的准确性较低。

发明内容

本申请实施例提供一种图像识别方法、装置、计算机设备及可读存储介质,可以提高图像识别的准确性。

本申请实施例提供一种图像识别方法,包括:

获取待识别图像;

对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;

对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;

对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;

基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;

根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。

相应的,本申请实施例还提供一种图像识别装置,包括:

获取单元,用于获取待识别图像;

检测单元,用于对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;

变换单元,用于对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;

特征提取单元,用于对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;

区域选择单元,用于基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;

识别单元,用于根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,所述区域选择单元,包括:

矩阵构建子单元,用于基于所述多尺度特征组构建相应的特征循环矩阵;

响应值计算子单元,用于基于特征循环矩阵计算候选属性区域组合对应的尺度响应值,所述尺度响应值为所述候选属性区域组合的尺度组合为最佳尺度组合的响应值;

选择子单元,用于基于所述尺度响应值从候选属性区域组合中选择原始属性区域对应的目标属性区域组合。

在一实施例中,所述响应值计算子单元,用于:获取尺度选择权重参数;根据所述尺度选择权重参数和所述特征循环矩阵,计算候选属性区域组合的尺度响应值。

在一实施例中,所述响应值计算子单元,用于:根据所述尺度选择权重参数和所述特征循环矩阵进行傅里叶变换处理,得到候选属性区域组合的尺度响应值。

在一实施例中,所述识别单元,包括:

融合子单元,用于将目标属性区域组合中属性区域的区域特征进行融合,得到原始属性区域对应的目标区域特征;

识别子单元,用于根据所述原始属性区域对应的目标区域特征,对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,融合子单元,用于针对原始属性区域对应的每个目标属性区域组合,将目标属性区域组合中属性区域的区域特征进行融合,得到每个目标属性区域组合对应的组合区域特征;根据每个目标属性区域组合对应的组合区域特征,获取原始属性区域对应的目标区域特征。

在一实施例中,所述识别子单元,用于:对所述原始属性区域对应的目标区域特征进行多个空间方向性的池化处理,得多个池化处理后特征;从多个池化处理后特征中选择相应的特征,得到所述原始属性区域对应的目标池化特征;根据所述原始属性区域对应的目标池化特征,对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,所述识别子单元,用于:将各个原始属性区域对应的目标区域特征进行融合,得到融合后目标区域特征;根据所述融合后目标区域特征对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,所述识别子单元,用于:

将所述原始属性区域对应的目标区域特征图划成多个有交叠的特征子块;

将每个特征子块扩展成特征向量,得到所述特征图对应的特征向量集合;

对所述特征向量集合进行多个空间方向性的池化处理,得多个池化处理后特征。

在一实施例中,所述识别子单元,用于:

基于共享全连接层分别对每个池化处理后特征信息进行全连接运算,得到多个维度相同的特征信息;

从多个维度相同的特征信息中选择相应的特征,得到属性区域组合对应的目标池化特征。

在一实施例中,所述检测单元,用于采用训练后区域检测网络,对所述待识别图像中对象进行属性区域检测。

在一实施例中,图像识别装置还可以包括:训练单元;

所述训练单元,用于:

获取多张已标注属性区域的样本图像;

采用预设区域检测网络分别对所述样本图像中样本对象进行属性区域检测,得到所述样本图像的n个样本属性区域,其中,n为大于1的正整数;

获取各样本图像中第s个样本属性区域的交叉熵损失,其中,s为正整数,且小于或等于n;

获取各样本图像中第s个样本属性区域之间的相似度信息;

根据所述交叉熵损失和所述相似度信息对所述预设区域检测网络进行训练,得到训练后区域检测网络。

在一实施例中,所述变换单元,用于:确定所述原始属性区域的中心点、多个顶点;从多个顶点中确定远离中心点的第一顶点、靠近中心点的第二顶点;根据所述第一顶点对所述原始属性区域的尺度进行放大,根据所述第二顶点对所述原始属性区域的尺度进行缩小,得到多个尺度的候选属性区域。

相应的,本申请还提供一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现本申请实施例提供的任一种图像识别方法中的步骤。

此外,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本申请实施例提供的任一种图像识别方法中的步骤。

本申请实施例可以获取待识别图像;对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。该方案可以针对单一原始属性区域生成多尺度的候选属性区域,并自适应选择最佳尺度的属性区域,因此,可以自适应不同尺度的图像,实现精准定位或检测属性区域,从而提升图像识别的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的图像识别方法的场景示意图;

图2a是本申请实施例提供图像识别方法的流程图;

图2b是本申请实施例提供的图像识别的框架示意图;

图2c是本申请实施例提供的DSM模块的结构示意图;

图3a是本申请实施例提供的鸟类样本图像;

图3b是本申请实施例提供的图像识别方法的另一流程示意图;

图4a是本申请实施例提供的图像识别装置的结构示意图;

图4b是本申请实施例提供的图像识别装置的另一结构示意图;

图4c是本申请实施例提供的图像识别装置的另一结构示意图;

图4d是本申请实施例提供的图像识别装置的另一结构示意图;

图5是本申请实施例提供的计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请实施例提供一种图像识别方法、装置、计算机设备和计算机可读存储介质。其中,该图像识别装置可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备。

本申请实施例提供的图像识别方案涉及人工智能的计算机视觉技术(ComputerVision,CV)。可以通过人工智能的计算机视觉技术实现图像识别如细粒度图像识别或分类,得到识别结果。

其中,计算机视觉技术(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像分割、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。

本申请实施例中,所谓图像识别,指的是从图像中识别出具有独特性质的区域,并找出感兴趣目标的技术和过程。而在本申请实施例中,主要指的是识别图像中目标对象,例如,识别出动物图像中动物的动物类型等。

例如,参见图1,以该图像识别装置集成在计算设备中为例,该计算机设备可以获取待识别图像,比如,计算机设备可以通过摄像头等设备自己采集带识别图像;对待识别图像中对象进行属性区域检测,得到多个原始属性区域;对原始属性区域进行尺度变换,得到多个尺度的候选属性区域;对候选属性区域进行特征提取,得到多尺度特征组,多尺度特征组包括每个尺度的候选属性区域的区域特征;基于多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;根据目标属性区域组合中属性区域的区域特征,对待识别图像中的对象进行识别,得到识别结果。比如,可以识别出图像中对象所属的类型等。

以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从图像识别装置的角度进行描述,该图像识别装置具体可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备;其中,该终端可以包括平板电脑、笔记本电脑、个人计算(PC,Personal Computer)、微型处理盒子、或者其他设备等。

如图2a所示,该图像识别方法的具体流程可以如下:

201、获取待识别图像。

其中,待识别图像为包含待识别对象的图像,该识别对象可以为动物、人、建筑物等对象,例如,待识别图像可以为一张鸟类图像、电路板图像(包括缺陷线路、或器件)。

本申请实施例中,待识别图像可以由图像采集设备采集后,提供给图像识别装置。其中,图像采集设备可以包括具有图像拍摄功能的终端等,例如手机。

此外,在一实施例中,待识别图像还可以由图像识别装置如图像识别装置所在的计算机设备采集得到。

202、对待识别图像中对象进行属性区域检测,得到多个原始属性区域。

其中,属性区域可以为图像中能够表征目标对象某种属性(例如:头部)的局部区域,如局部矩形区域。譬如,可以为鸟类图像中表征鸟的头部、脚部、或者腹部的局部区域。又譬如,可以为电路板图像中表征缺陷的局部区域等。

本申请实施例中,可以采用深度学习网络来实现属性区域检测,比如,可以训练一个区域检测网络,采用训练后的区域检测网络来检测属性区域。也即步骤“对待识别图像中对象进行属性区域检测”,可以包括:采用训练后区域检测网络,对待识别图像中对象进行属性区域检测。

其中,区域检测网络的训练方式有多种,比如,采用反向传播方式来训练,比如,可以采用标注了属性区域的样本图像来对区域检测网络进行训练,如计算区域检测网络的预测属性区域与标注属性区域的损失,基于该损失对网络训练。

在一实施例中,为了提升属性区域的检测精度、进而提升图像识别的准确性,可以在网络训练的过程中,引入形态约束,让不同样本的第i个属性区域具有相同的语义信息,例如第一个属性区域都是鸟头,从而实现属性区域的语义对齐。

具体的训练流程如下:

获取多张已标注属性区域的样本图像;

采用预设区域检测网络分别对样本图像中样本对象进行属性区域检测,得到样本图像的n个样本属性区域,其中,n为大于1的正整数;

获取各样本图像中第s个样本属性区域的交叉熵损失,其中,s为正整数,且小于或等于n;

获取各样本图像中第s个样本属性区域之间的相似度信息;

根据交叉熵损失和相似度信息对预设区域检测网络进行训练,得到训练后区域检测网络。

其中,交叉熵可以为预测的第s个样本属性区域、与标注的第s个属性区域的交叉熵,可以根据标注区域和预测区域计算得到。

其中,相似度信息可以包括欧式距离等,可以基于各样本图像中第s各样本属性区域的区域特征计算得到。

例如,本申请实施例可以在区域检测网络训练时引入形态约束项,实现属性区域的语义对齐(例如,让不同样本的第s个属性区域都对应头部)。包含约束项的损失函数表达为:其中损失函数的前两项表示i,j两个样本第s个属性区域的交叉熵损失,最末项表示i,j两个样本第s个属性区域特征的欧式距离。本申请实施例可以通过约束不同样本第s个属性区域距离的方式实现属性区域的语义对齐,提升属性区域检测、定位的精准度,从而提升图像分类(图像识别)的准确性。

通过上述步骤可以从待识别图像如鸟类图像中检测出原始属性区域,如鸟的头部区域、鸟的腹部区域、鸟的脚部区域等等。

203、对原始属性区域进行尺度变换,得到多个尺度的候选属性区域。

比如,可以针对每个原始属性区域进行尺度变换,得到每个原始属性区域对应的多个尺度的候选属性区域(多尺度候选属性区域)。

由于不同图像的尺度不相同,为了能够自适应各种图像的尺度,精准定位属性区域,提升图像识别的准确性,本申请实施例可以针对单一属性区域生成多尺度的候选属性区域,然后,从多尺度的候选属性区域自适应选择最佳尺度,实现多尺度属性区域的对齐,精准定位属性区域。

其中,尺度变换的方式有多种,比如,缩小、放大、拉长等等。具体可以根据实际需求选择。其中,生成候选属性区域的数量可以根据实际需求设定,如奇数个区域等。

在一实施例中,对原始属性区域进行缩小和放大处理,得到原始属性区域的多尺度候选属性区域。具体第,原始属性区域的缩放处理过程如下:

确定原始属性区域的中心点、多个顶点;

从多个顶点中确定远离中心点的第一顶点、靠近中心点的第二顶点;

根据第一顶点对原始属性区域的尺度进行放大,根据第二顶点对原始属性区域的尺度进行缩小,得到多个尺度的候选属性区域。

例如,确定原始属性区域的中心点、和两个顶点,然后,根据预设规则如随机将其中一个顶点定义为远离中心点的第一顶点、另一个顶点定义为靠近中心点的第二顶点。

在一实施例中,可以固定第一顶点,基于尺度缩放因子对原始属性区域的尺度进行放大;固定第二顶点,基于尺度缩放因子对原始属性区域的尺度进行缩小。

例如,在一实施例中,参考图2b,为本申请实施例的图像识别的框架图像,如图2b所示,可以获取多张待识别的鸟类图像,然后,通过区域检测网络检测出每张鸟类图像中的原始属性区域,接着可以采用尺度挖掘判别模块(DSM,Discriminative Scale Mining)实现尺度变换、最佳区域选择等操作,从而实现多尺度属性区域的对齐,对属性区域的精准定位。

其中,DSM模块能够生成多尺度属性区域,并实现多尺度属性区域的对齐和响应值输出。假设DSM模块用Ai=[φiiii]表示第i个属性区域,其中φi表示属性区域特征,ψi和ηi分别表示属性区域的两个顶点坐标,γi=(wi,hi)表示属性区域的宽和高。

首先,计算选中的K个属性区域的中心坐标,并把ψi定义为远离中心的顶点,把ηi定义为靠近中心的顶点。算法通过对原始属性区域进行放大和缩小来生成S(奇数)个多尺度的候选属性区域。‘

如若对属性区域进行缩小,应固定ηi,缩小原始属性区域的宽和高得到个候选属性区域,表示为

如若对属性区域进行放大,应固定ψi,放大原始属性区域的宽和高得到个候选属性区域,表示为其中α表示尺度缩放因子。

通过上述步骤,可以对每个原始属性区域的多尺度候选属性区域,例如,鸟的头部区域对应的多尺度候选属性区域。

204、对候选属性区域进行特征提取,得到多尺度特征组,多尺度特征组包括每个尺度的候选属性区域的区域特征。

比如,可以对原始属性的每个尺度的候选属性区域进行特征提取,得到多尺度特征组。

在一实施例中,为了提升特征提取的效率和准确性,可以采用卷积神经网络来提取候选属性区域的特征,如采用图像特征提取网络来提取,该图像特征提取网络可以为残差等网络。

例如,参考图2b,可以采用DSM模块中卷积神经网络提取原始属性区域的各个候选属性区域的区域特征,得到一组多尺度特征

205、基于多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合。

比如,可以针对每个原始属性区域,从每个原始属性区域对应的多尺度候选属性区域选择相应数量的属性区域,得到每个原始属性区域对应的属性区域组合。

其中,目标属性区域组合包括从多尺度候选属性区域中选择的一个或者多个属性区域。例如,可以从鸟类头部区域的5个候选属性区域中选择出3个尺度的候选属性区域,组成属性区域组合。

在一实施例中,目标属性区域组合可以为对于当前待识别图像尺度较为最佳的属性区域组合。也就说,对于当前识别图像的尺度,该目标属性区域组合中区域的尺度是最为匹配或最佳尺度。

在一实施例中,为了提升属性区域的选择效率和精准度,可以通基于多尺度特征的循环矩阵表达(Toeplitz矩阵)实现多尺度对齐并得到多尺度响应值,并基于尺度响应值选择属性区域组合。比如,步骤“基于多尺度特征组从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合”,可以包括:

基于多尺度特征组构建相应的特征循环矩阵;

基于特征循环矩阵计算候选属性区域组合对应的尺度响应值,尺度响应值为用于表征候选属性区域组合的尺度组合为最佳尺度组合的响应值;

基于尺度响应值从候选属性区域组合中选择原始属性区域对应的目标属性区域组合。

其中,候选属性区域组合可以包括多尺度候选属性区域中预定数量候选属性区域组成的区域组合。

其中,预定数量即为需要从多尺度候选属性区域中选取的区域数量,可以根据实际需求设定,比如,1个、3个、4个等等。例如,候选属性区域组合可以为多尺度候选属性区域中任意3个候选属性区域组成的区域组合。

其中,候选属性区域组合对应的尺度响应值为候选属性区域组合的尺度组合为最佳尺度组合的响应值;该尺度响应值表征候选属性区域组合与最佳尺度组合的距离等;响应值越大,表明与最佳尺度组合的距离越小(即越接近最佳尺度组合);反之,响应值越小,表明与最佳尺度组合的距离越大(即越不接近最佳尺度组合)。

本申请实施例中,候选属性区域组合的数量有多个,数量可以等于多尺度候选属性区域中选择预定数量区域的组合数。本申请实施例可以基于特征循环矩阵计算出每种或每个候选属性区域组合的尺度响应值,然后,根据尺度响应值从多个候选属性区域组合中确定原始属性区域对应的属性区域组合(即最佳属性区域组合)。

在一实施例中,可以通过设置尺度选择权重参数来选择属性区域组合;具体地,步骤“基于特征循环矩阵计算候选属性区域组合对应的尺度响应值”,可以包括:

获取尺度选择权重参数;

根据尺度选择权重参数和特征循环矩阵,计算候选属性区域组合的尺度响应值。

比如,在一实施例中,可以采用矩阵乘积的方式,将尺度选择权重参数和特征循环矩阵进行矩阵相乘,得到候选属性区域组合的尺度响应值。

例如,参考图2b,采用DSM模块中卷积神经网络提取原始属性区域的各个候选属性区域的区域特征,得到一组多尺度特征之后,可以构建一组多尺度特征的循环矩阵,具体如下:

其中,表示特征向量的第k个元素。

其中,候选属性区域组合的响应值,可以通过如下公式计算得到:

其中即为尺度选择权重参数。

可见,本申请实施例可以通过循环矩阵的循环移位来实现区域组合的选取,可以提升区域组合选取的效率和准确性,进而提升属性区域的定位精准性。

在一实施例中,为了提升响应值的计算速度、提升图像识别效率,可以采用过快速傅里叶变换(FFT,fast Fourier transform))方式计算得到响应值。也即,步骤“根据尺度选择权重参数和特征循环矩阵,计算候选属性区域组合的尺度响应值”可以包括:根据尺度选择权重参数和特征循环矩阵进行傅里叶变换处理,得到候选属性区域组合的尺度响应值。

譬如,根据循环矩阵的特性,响应值也可通过FFT方式计算得到:

其中 表示傅里叶矩阵,(·)C表示复数共轭,相应的算法时间复杂度是O(KSlog2 S)。

在DSM模块的反向传播阶段,若用δi表示yi的误差,那么的梯度可以表示为其中对应移位后的表达。的梯度可以表示为因此,基于多尺度特征循环移位表达的响应值预测方式,能够实现最佳尺度的自适应选择。

通过上述步骤可以从原始属性区域的多尺度候选属性区域中选择最佳的目标属性区域组合。例如,参考图2c,为DSM模块的结构图,通过区域检测网络检测出输入的鸟类图像中的原始属性区域(即矩形框),接着可以采用DSM针对每个原始属性区域进行尺度变换,得到每个原始属性区域的5个尺度候选属性区域;然后,基于卷积神经网络提取每个尺度候选属性区域的区域特征,通过循环矩阵模块从5个尺度候选属性区域中选择3个最佳属性区域,得到最佳区域组合。

在一实施例中,最佳属性区域组合的数量可以有多个,因此,还可以基于尺度响应值从候选属性区域组合中选择多个属性区域组合,然后,从多个属性区域组合中选择目标属性区域组合,即最终的最佳区域组合。其中,多个属性区域组合选择目标属性区域组合的方式有多种,比如,可以根据属性区域组合对应的特征值来选择,例如,选择特征值最大的组合作为目标属性区域组合等等。

在实际应用中,在选择原始属性区域的目标属性区域组合后,可以采用目标属性区域组合内的任一区域表示该组合,也可以直接采用组合本身来表示。

例如,参考图2b,在检测出两张鸟类图像的原始属性区域之后,可以通过DSM模块来选择与鸟类图像尺度匹配的最佳属性区域(如最佳属性区域组合)。

206、根据目标属性区域组合中属性区域的区域特征,对待识别图像中的对象进行识别,得到识别结果。

具体地,可以根据每个原始属性区域对应的目标属性区域组合中属性区域的区域特征,对待识别图像中的对象进行识别。

比如,如图2b所示,可以鸟的各个部位区域(头部、腹部、脚部等)对应的目标属性区域组合中区域特征,对待识别图像中的鸟进行识别。

在一实施例中,为了提升识别的效率和准确性,可以对各个目标属性区域组合中区域特征进行融合,具体地,步骤“根据目标属性区域组合中属性区域的区域特征,对待识别图像中的对象进行识别,得到识别结果”,可以包括:

将目标属性区域组合中属性区域的区域特征进行融合,得到原始属性区域对应的目标区域特征;

根据原始属性区域对应的目标区域特征,对待识别图像中的对象进行识别,得到识别结果。

比如,针对原始属性区域对应的每个目标属性区域组合,将目标属性区域组合中属性区域的区域特征进行融合,得到每个目标属性区域组合对应的组合区域特征;根据每个目标属性区域组合对应的组合区域特征获取原始属性区域对应的目标区域特征;根据目标区域特征对待识别图像中的对象进行识别,得到识别结果。

比如,可以基于各个目标属性区域的组合区域特征的特征值大小来选择,如选择特征值最大的组合区域特征作为原始属性区域的目标区域特征。

譬如,参考图2c,在DSM模块选择原始属性区域的多个最佳属性区域组合(包含3个最佳属性区域)之后,可以将区域组合中3个属性区域的区域特征进行融合,得到每个最佳属性区域组合对应的组合区域特征。然后,从对各最佳属性区域组合的组合区域特征中选择特征值最大的组合区域特征,作为原始属性区域的目标区域特征,以用作后续的图像分类或识别。

在一实施例中,考虑到由于目标图像识别方案,在卷积神经网络中使用全局池化提取属性区域的特征,损失了属性区域的空间方向性信息,无法对属性区域进行空间方向性对齐,导致图像分类或识别的准确性较低。

为克服前述问题,本申请实施例中个,可以使用方向性池化处理实现属性区域的空间方向性对齐,例如对于同类别向左和向右的两个鸟头区域,提取到相近的特征,从而提升图像分类或识别的准确性。

具体地,步骤“根据原始属性区域对应的目标区域特征,对待识别图像中的对象进行识别,得到识别结果”,可以包括:

对原始属性区域对应的目标区域特征进行多个空间方向性的池化处理,得多个池化处理后特征;

从多个池化处理后特征中选择相应的特征,得到原始属性区域对应的目标池化特征;

根据原始属性区域对应的目标池化特征,对待识别图像中的对象进行识别,得到识别结果。

其中,空间方向性有多种,比如,水平、竖直、旋转的水平、旋转的竖直等等。

在一实施例中,为了为便于实现空间方向性池化操作,提升效率,可以对原始属性区域对应的区域特征图进行划分组合,具体地,步骤“对原始属性区域对应的目标区域特征进行多个空间方向性的池化处理,得多个池化处理后特征”,可以包括:

将原始属性区域对应的目标区域特征图划成多个有交叠的特征子块;

将每个特征子块扩展成特征向量,得到特征图对应的特征向量集合;

对特征向量集合进行多个空间方向性的池化处理,得多个池化处理后特征。

例如,参考图2b,在图像识别领域常用的全局均值池化操作(globalaveragepooling)会损失大量空间信息,本技术提出方向性池化(OP,orientedpoooling)模块,用于实现图像特征的空间方向性对齐,这有助于提取具有对称性、旋转性、平移性等方向性差异图片的共性特征。

在得到原始属性区域的特征图后,OP模块首先把特征图分成NH×NW个有交叠的子块,每个子块的高和宽分别是h×w。

然后把每个子块的特征展成向量,那么特征图可以重新表达为接下来,OP模块分别对重新表达的特征图使用水平池化、竖直池化以及旋转后的水平池化和竖直池化,四种池化操作可以用公式表达如下:

在得到多个池化处理后特征,可以从中选择最佳的池化特征,比如,步骤“从多个池化处理后特征中选择相应的特征,得到原始属性区域对应的目标池化特征”,可以包括:

基于共享全连接层分别对每个池化处理后特征信息进行全连接运算,得到多个维度相同的特征信息;

从多个维度相同的特征信息中选择相应的特征,得到属性区域组合对应的目标池化特征。

例如,OP模块在经过上述四种方向性池化后,OP模块通过取最大值的方式从四种池化方式中选择最佳的一种,得到最终的响应值输出,即y=max(ωTΓhTΓvTΓ′h’,ωTΓ′v),其中ω表示共享全连接层的参数。对于具有不同视角的图片,这种方向性池化模块能够更好地实现特征对齐,并且保留了更多的空间信息,进一步能够提升分类或识别的准确率。

本申请实施例在得到各原始属性区域对于的目标区域特征之后,便可以基于各原始属性区域对应的目标区域特征来识别图像中对象,为了提升识别准确性,在一实施例中,可以对各区域的特征进行融合,采用融合后特征识别对象。具体的,步骤“根据原始属性区域对应的目标区域特征,对待识别图像中的对象进行识别,得到识别结果,得到识别结果”,可以包括:

将各个原始属性区域对应的目标区域特征进行融合,得到融合后目标区域特征;

根据融合后目标区域特征对待识别图像中的对象进行识别,得到识别结果。

其中,目标区域特征的融合方式可以有多种,比如,可以采用加权求和的方式来融合;比如,根据目标区域对应的特征权重,对各个原始属性区域对应的目标区域特征进行加权求和。

例如,参考图2b,首先用DSM模块对鸟类图像的属性区域进行精准定位,然后使用OP模块对获得的属性区域实现空间特征对齐,最后通过不同属性区域特征的加权求和实现分类结果的预测。具体的,在通过DSM和OP模块在得到鸟类图像中各个部位区域的区域特征之后,可以采用特征权重w1、w2、w3等权重参数,对鸟类图像中各个部位区域的区域特征继续加权求和,然后,基于求和后特征识别鸟类图像中鸟的类型,如麻雀等。

本申请实施例提供的图像识别方法可以应用任何图像识别场景,比如,在目前芯片、电路板工业发展中,故障检测的需求非常大。传统的缺陷检测需要大量经验丰富的专家人员进行分类,对人员要求高、成本大且效率低。这些缺陷在外观上大多表现为大体相似的黑色区域,只是在细节上有所区别,例如有的缺陷带有光晕,有的缺陷近似水渍。因此,可以使用本申请实施例提供的图像细粒度分类算法来识别。同时,图像中的缺陷呈现出大小不一,空间形态不对称的特性,适合用空间和尺度对齐算法来识别。

例如,待识别图像可以为包含缺陷区域的电路板图像,传统的电路缺陷在图像上大多可以表现为黑色区域,因此,电路图像中缺陷区域可以为黑色区域。根据上述描述采用本申请实施,首先用DSM模块对电路图像的属性区域(该属性区域可以为表征缺陷区域性的区域)进行精准定位,然后使用OP模块对获得的属性区域实现空间特征对齐,最后通过不同属性区域特征的加权求和实现分类结果的预测。

具体地,可以参考图2b,DSM模块通过区域检测网络检测出输入的电路图像中的原始属性区域(即矩形框),接着可以采用DSM针对每个原始属性区域进行尺度变换,得到每个原始属性区域的多个尺度候选属性区域;然后,基于卷积神经网络提取每个尺度候选属性区域的区域特征,通过循环矩阵模块从多个尺度候选属性区域中选择预定数量的最佳属性区域,得到最佳区域组合。

可以参考图2c,在DSM模块选择原始属性区域的多个最佳属性区域组合(包含3个最佳属性区域)之后,可以将区域组合中属性区域的区域特征进行融合,得到每个最佳属性区域组合对应的组合区域特征。然后,从对各最佳属性区域组合的组合区域特征中选择特征值最大的组合区域特征,作为原始属性区域的目标区域特征,以用作后续的图像分类或识别。

OP模块对目标区域特征进行多种如上述四种空间方向性池化处理,得到各个原始属性区域的池化后区域特征,采用权重参数对各个原始属性区域的池化后区域特征进行加权求和,然后,基于求和后特征识别电路图像中缺陷区域的类型,如烧坏、损坏等。

此外,本申请实施例方法还可应用于电子商务领域的手机型号识别等诸多方向,应用前景广泛,具体地应用实现可以参考上述实施例的介绍。

由上可知,本申请实施例获取待识别图像;对待识别图像中对象进行属性区域检测,得到多个原始属性区域;对原始属性区域进行尺度变换,得到多个尺度的候选属性区域;对候选属性区域进行特征提取,得到多尺度特征组,多尺度特征组包括每个尺度的候选属性区域的区域特征;基于多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;根据目标属性区域组合中属性区域的区域特征,对待识别图像中的对象进行识别,得到识别结果。该方案可以针对单一原始属性区域生成多尺度的候选属性区域,并自适应选择最佳尺度的属性区域,因此,可以自适应不同尺度的图像,实现精准定位或检测属性区域,从而提升图像识别的准确性。

此外,该方案还可以引入形态约束,让不同样本的第i个属性区域具有相同的语义信息头。在实现属性区域的语义对齐后,使用方向性池化算法实现属性区域的空间方向性对齐,例如对于同类别向左和向右的两个鸟头区域,提取到相近的特征,进一步提升分类或图像识别的准确性。

根据前面实施例所描述的方法,以下将举例作进一步详细说明。

在本实施例中,将以该图像识别装置具体集成在计算机设备为例进行说明。

目前,对图像细粒度分类公开数据集样本(参考图3a)进行分析可知,图像因为拍摄距离和拍摄角度的不同,存在多种形式的差异。例如图中每列图片的上下两张图片都属于同一个类别,但左侧第一列图片存在尺度差异、左侧第二列图片存在对称性差异、右侧第三列图片存在旋转性差异,右侧第一列图片存在平移性差异。因此需要设计算法,精准定位图片的属性区域并实现属性特征的空间对齐,进一步提升分类或图像识别的准确性。

为了提升图像识别或分类的准确性,本申请实施例可以采用如下方案:

(一)网络的训练。

首先,计算机设备可以获取样本图像集,根据样本图像集对图像识别网络进行训练。其中,参考图2b,图像识别网络可以包括:区域检测网络、DSM(尺度挖掘判别)模块以及OP模块。具体地DSM模块的结构可以参考上述实施例的描述。

本申请实施例中,可以基于标注了对象类型的样本图像对图像识别网络训练,如可以采用反向传播的方式训练。其中,对于区域检测网络的训练方式可以参考上述的介绍。

(二)通过训练后图像识别网络便可以实现对待识别图像中目标对象识别。

如图3b所示,一种图像识别方法,具体流程如下:

301、计算机设备获取待识别图像。

比如,计算机设备可以接收用户上传的鸟类图像。

302、计算机设备采用区域检测网络对待识别图像中对象进行属性区域检测,得到多个原始属性区域。

比如,计算机设备可以将待识别的鸟类图像输入至图像识别网络中区域检测网络,通过区域检测网络检测出鸟类图像的原始属性区域,如鸟头部区域、脚部区域、腹部区域等。

又比如,计算机设备可以将待识别的缺陷电路板图像输入至图像识别网络中区域检测网络,通过区域检测网络检测出缺陷电路板图像的原始属性区域。

303、计算机设备通过尺度挖掘判别模块对每个原始属性区域进行尺度变换,得到每个原始属性区域的多尺度候选属性区域。

例如,DSM模块可以通过尺度缩放来生成多尺度属性区域,具体的缩放方式可以参考上述实施例的描述。

304、计算机设备通过尺度挖掘判别模块对候选属性区域进行特征提取,得到每个原始属性区域的多尺度特征组。

其中,多尺度特征组包括每个尺度的候选属性区域的区域特征

例如,DSM模块可以通过卷积网络来提取区域特征。

305、计算机设备通过尺度挖掘判别模块构建多尺度特征组对应的特征循环矩阵。

例如,采用DSM模块中卷积神经网络提取原始属性区域的各个候选属性区域的区域特征,得到一组多尺度特征之后,可以构建一组多尺度特征的循环矩阵。具体的循环矩阵参考上述描述。

306、计算机设备通过尺度挖掘判别模块基于尺度选择权重参数和特征循环矩阵,计算候选属性区域组合的尺度响应值。

其中,候选属性区域组合对应的尺度响应值为候选属性区域组合的尺度组合为最佳尺度组合的响应值;该尺度响应值表征候选属性区域组合与最佳尺度组合的距离等;响应值越大,表明与最佳尺度组合的距离越小(即越接近最佳尺度组合);反之,响应值越小,表明与最佳尺度组合的距离越大(即越不接近最佳尺度组合)。具体的尺度响应值计算参考上述介绍。

307、计算机设备通过尺度挖掘判别模块基于尺度响应值从候选属性区域组合中选择原始属性区域对应的目标属性区域组合。

具体地,可以选择响应值排在前N位的属性区域组合,N为大于1的正整数。

308、计算机设备通过尺度挖掘判别模块将目标属性区域组合中属性区域的区域特征进行融合,得到原始属性区域对应的目标区域特征。

比如,计算机设备可以针对原始属性区域对应的每个目标属性区域组合,将目标属性区域组合中属性区域的区域特征进行融合,得到每个目标属性区域组合对应的组合区域特征;根据每个目标属性区域组合对应的组合区域特征获取原始属性区域对应的目标区域特征。

309、计算机设备通过方向性池化模块对原始属性区域对应的目标区域特征进行多个空间方向性的池化处理,得多个池化处理后特征。

具体的池化方式可以参考上述实施例的描述。

310、计算机设备通过方向性池化模块从多个池化处理后特征中选择相应的特征,得到原始属性区域对应的目标池化特征。

比如,可以对池化后特征进行全连接运算,得到多个维度相同的特征信息;从多个维度相同的特征信息中选择相应的特征,得到属性区域组合对应的目标池化特征。

311、计算机设备将目标池化特征输入分类网络,通过分类网络对待识别图像中对象进行分类,得到识别结果。

例如,分类网络基于输入的目标池化特征对图像中目标对象进行分类,得到分类结果,将分类结果作为识别结果。

例如,当待识别图像为鸟类图像时,通过上述方式可以识别出鸟类图像中的鸟为黄雀。

又例如,当待识别图像为缺陷电路板图像时,通过上述方式可以识别出电路板缺陷的类型为损坏等。

由上可知,本申请实施例可以通过尺度挖掘判别模块针对单一原始属性区域生成多尺度的候选属性区域,并自适应选择最佳尺度的属性区域,因此,可以自适应不同尺度的图像,实现精准定位或检测属性区域,从而提升图像识别的准确性。

此外,该方案还可以引入形态约束,让不同样本的第i个属性区域具有相同的语义信息头。在实现属性区域的语义对齐后,通过方向性池化模块使用多种方向性池化算法实现属性区域的空间方向性对齐,例如对于同类别向左和向右的两个鸟头区域,提取到相近的特征,进一步提升分类或图像识别的准确性。

为了更好地实施以上方法,本申请实施例还提供一种图像识别装置,该图像识别装置可以集成在计算机设备,比如服务器或终端等设备中。

例如,如图4a所示,该图像识别装置可以包括获取单元401、检测单元402、变换单元403、特征提取单元404、区域选择单元405和识别单元406等,如下:

获取单元401,用于获取待识别图像;

检测单元402,用于对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;

变换单元403,用于对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;

特征提取单元404,用于对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;

区域选择单元405,用于基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;

识别单元406,用于根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,参考图4b,所述区域选择单元405,包括:

矩阵构建子单元4051,用于基于所述多尺度特征组构建相应的特征循环矩阵;

响应值计算子单元4052,用于基于特征循环矩阵计算候选属性区域组合对应的尺度响应值,所述尺度响应值为所述候选属性区域组合的尺度组合为最佳尺度组合的响应值;

选择子单元4053,用于基于所述尺度响应值从候选属性区域组合中选择原始属性区域对应的目标属性区域组合。

在一实施例中,所述响应值计算子单元4053,用于:获取尺度选择权重参数;根据所述尺度选择权重参数和所述特征循环矩阵,计算候选属性区域组合的尺度响应值。

在一实施例中,所述响应值计算子单元4053,用于:根据所述尺度选择权重参数和所述特征循环矩阵进行傅里叶变换处理,得到候选属性区域组合的尺度响应值。

在一实施例中,参考图4c,所述识别单元406,可以包括:

融合子单元4061,用于将目标属性区域组合中属性区域的区域特征进行融合,得到原始属性区域对应的目标区域特征;

识别子单元4062,用于根据所述原始属性区域对应的目标区域特征,对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,融合子单元4061,用于针对原始属性区域对应的每个目标属性区域组合,将目标属性区域组合中属性区域的区域特征进行融合,得到每个目标属性区域组合对应的组合区域特征;根据每个目标属性区域组合对应的组合区域特征,获取原始属性区域对应的目标区域特征。

在一实施例中,所述识别子单元4062,用于:对所述原始属性区域对应的目标区域特征进行多个空间方向性的池化处理,得多个池化处理后特征;从多个池化处理后特征中选择相应的特征,得到所述原始属性区域对应的目标池化特征;根据所述原始属性区域对应的目标池化特征,对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,所述识别子单元4062,用于:将各个原始属性区域对应的目标区域特征进行融合,得到融合后目标区域特征;根据所述融合后目标区域特征对所述待识别图像中的对象进行识别,得到识别结果。

在一实施例中,所述识别子单元4062,用于:

将所述原始属性区域对应的目标区域特征图划成多个有交叠的特征子块;

将每个特征子块扩展成特征向量,得到所述特征图对应的特征向量集合;

对所述特征向量集合进行多个空间方向性的池化处理,得多个池化处理后特征。

在一实施例中,所述识别子单元4062,用于:

基于共享全连接层分别对每个池化处理后特征信息进行全连接运算,得到多个维度相同的特征信息;

从多个维度相同的特征信息中选择相应的特征,得到属性区域组合对应的目标池化特征。

在一实施例中,所述检测单元402,用于采用训练后区域检测网络,对所述待识别图像中对象进行属性区域检测。

在一实施例中,参考图4d,图像识别装置还可以包括:训练单元407;

所述训练单元,用于:

获取多张已标注属性区域的样本图像;

采用预设区域检测网络分别对所述样本图像中样本对象进行属性区域检测,得到所述样本图像的n个样本属性区域,其中,n为大于1的正整数;

获取各样本图像中第s个样本属性区域的交叉熵损失,其中,s为正整数,且小于或等于n;

获取各样本图像中第s个样本属性区域之间的相似度信息;

根据所述交叉熵损失和所述相似度信息对所述预设区域检测网络进行训练,得到训练后区域检测网络。

在一实施例中,所述变换单元403,用于:确定所述原始属性区域的中心点、多个顶点;从多个顶点中确定远离中心点的第一顶点、靠近中心点的第二顶点;根据所述第一顶点对所述原始属性区域的尺度进行放大,根据所述第二顶点对所述原始属性区域的尺度进行缩小,得到多个尺度的候选属性区域。

具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。

由上可知,本申请实施例可以图像识别装置通过获取单元401,用于获取待识别图像;由检测单元402对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;由变换单元403对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;由特征提取单元404对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;由区域选择单元405基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;由识别单元406根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。该方案可以针对单一原始属性区域生成多尺度的候选属性区域,并自适应选择最佳尺度的属性区域,因此,可以自适应不同尺度的图像,实现精准定位或检测属性区域,从而提升图像识别的准确性。

本申请实施例还提供一种计算机设备,如图5所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:

该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图5中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:

处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。

存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、影像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。

计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能,如下:

获取待识别图像;对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。

以上各个操作具体可参见前面的实施例,在此不作赘述。

由上可知,本实施例的计算机设备在获取待识别图像之后;对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。该方案可以针对单一原始属性区域生成多尺度的候选属性区域,并自适应选择最佳尺度的属性区域,因此,可以自适应不同尺度的图像,实现精准定位或检测属性区域,从而提升图像识别的准确性。

本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。

为此,本申请实施例提供一种计算机可读存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种医学影像分割方法中的步骤。例如,该计算机程序可以执行如下步骤:

获取待识别图像;对所述待识别图像中对象进行属性区域检测,得到多个原始属性区域;对所述原始属性区域进行尺度变换,得到多个尺度的候选属性区域;对所述候选属性区域进行特征提取,得到多尺度特征组,所述多尺度特征组包括每个尺度的所述候选属性区域的区域特征;基于所述多尺度特征组,从多个尺度的候选属性区域中选择相应尺度的属性区域,得到原始属性区域对应的目标属性区域组合;根据所述目标属性区域组合中属性区域的区域特征,对所述待识别图像中的对象进行识别,得到识别结果。

以上各个操作的具体实施可参见前面的实施例,在此不再赘述。

其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。

由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种图像识别方法中的步骤,因此,可以实现本申请实施例所提供的任一种图像识别方法所能实现的有益效果,详见前面的实施例,在此不再赘述。

以上对本申请实施例所提供的一种图像识别方法、装置、计算机设备和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

28页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种人员属性识别方法、装置及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!