相似度确定方法、装置及计算机可读存储介质

文档序号:1937592 发布日期:2021-12-07 浏览:14次 >En<

阅读说明:本技术 相似度确定方法、装置及计算机可读存储介质 (Similarity determination method and device and computer readable storage medium ) 是由 邓潇 李林森 莫致良 于 2021-09-08 设计创作,主要内容包括:本申请实施例公开了一种相似度确定方法、装置及计算机可读存储介质,属于图像处理技术领域。在本申请实施例中,对于均存在目标对象的两张图像来说,确定这两张图像之间的图像相似度,以及确定转移概率,转移概率为一个目标对象在参考时长内从第二相机的拍摄视野转移到第一相机的拍摄视野的概率,从而基于图像相似度和转移概率,确定这两张图像中存在的目标对象之间的相似度。其中,转移概率是一种时空特征,而非图像中的特征。也即是,本方案不仅依据图像中的特征,还依据时空特征来确定相似度,因而即使在图像质量较低的情况下所确定的相似度的准确性较高。(The embodiment of the application discloses a similarity determining method and device and a computer readable storage medium, and belongs to the technical field of image processing. In the embodiment of the application, for two images in which a target object exists, the image similarity between the two images is determined, and the transition probability that one target object is transferred from the shooting view of the second camera to the shooting view of the first camera within the reference time length is determined, so that the similarity between the target objects existing in the two images is determined based on the image similarity and the transition probability. Wherein the transition probability is a spatio-temporal feature, not a feature in an image. That is, the present scheme determines the similarity not only from the features in the image but also from the spatio-temporal features, and thus the accuracy of the determined similarity is high even in the case where the image quality is low.)

相似度确定方法、装置及计算机可读存储介质

技术领域

本申请实施例涉及图像处理技术领域,特别涉及一种相似度确定方法、装置及计算机可读存储介质。

背景技术

在图像处理

技术领域

中,通常需要确定任意两张图像中目标对象之间的相似度,进而依据目标对象之间的相似度对图像进行处理。例如,确定任意两张图像中目标对象之间的相似度,基于目标对象之间的相似度对多张图像进行目标聚类。

在相关技术中,假设依据目标对象之间的相似度进行目标聚类,以目标对象为人物为例,根据多张图像中的人像特征,确定该多张图像中人物之间的第一相似度,基于第一相似度对该多张图像进行初始聚类,得到至少一个初始图像集合。通过信息提取模型获取每张图像中人物的年龄和性别,基于每张图像中人物的年龄和性别,确定每个初始图像集合包括的图像中人物之间的第二相似度,基于第二相似度确定最终的图像聚类结果。

然而,人像特征、人物的年龄和性别都是依据图像中的特征来确定的,一旦因遮挡、光照变化、曝光过渡等情况导致图像质量较低,那么依据图像中的特征确定目标对象之间的相似度的准确性较低。

发明内容

本申请实施例提供了一种相似度确定方法、装置及计算机可读存储介质,能够提高所确定的相似度的准确性。所述技术方案如下:

一方面,提供了一种相似度确定方法,所述方法包括:

确定第一图像与第二图像之间的图像相似度,所述第一图像中存在第一目标对象,所述第二图像中存在第二目标对象,所述第一图像通过第一相机拍摄得到,所述第二图像通过第二相机拍摄得到;

确定转移概率,所述转移概率为所述第一目标对象在参考时长内从所述第二相机的拍摄视野转移到所述第一相机的拍摄视野的概率;

基于所述图像相似度和所述转移概率,确定所述第一目标对象与所述第二目标对象之间的相似度。

可选地,所述确定转移概率,包括:

确定第一拍摄时间与第二拍摄时间之间的时间差,所述第一拍摄时间为所述第一图像的拍摄时间,所述第二拍摄时间为所述第二图像的拍摄时间;

从多个时长范围中确定所述时间差所处的时长范围;

将所述时间差所处的时长范围的标记值输入指定概率分布模型中,得到所述指定概率分布模型输出的所述转移概率,所述标记值用于指示相应的时长范围。

可选地,所述确定转移概率之前,还包括:

根据所述第一相机的标识和所述第二相机的标识,从多个概率分布模型中确定所述指定概率分布模型;

其中,所述指定概率分布模型对应参考相机对,所述参考相机对包括所述第一相机和所述第二相机,所述概率分布模型表征同一目标对象在对应的一个相机对所包括的两个相机之间转移的时间概率分布,不同的概率分布模型对应不同的相机对。

可选地,所述根据所述第一相机的标识和所述第二相机的标识,从多个概率分布模型中确定所述指定概率分布模型之前,还包括:

获取多个相机对中各个相机对分别对应的多个观测样本对,每个观测样本对包括由相应相机对拍摄且存在同一目标对象的两个观测图像的拍摄时间;

基于各个相机对分别对应的多个观测样本对所包括的拍摄时间,确定相应相机对对应的多个时间差;

统计各个相机对分别对应的多个时间差中位于多个时长范围中每个时长范围内的时间差的个数,得到相应相机对对应的多个统计频数;

基于各个相机对分别对应的多个统计频数,以及所述多个时间范围的标记值,确定相应相机对对应的概率分布模型。

可选地,所述基于所述图像相似度和所述转移概率,确定所述第一目标对象与所述第二目标对象之间的相似度,包括:

基于所述图像相似度和所述转移概率,确定综合特征向量;

将所述综合特征向量输入图像分类模型中,得到所述图像分类模型输出的所述第一目标对象与所述第二目标对象之间的相似度。

可选地,所述基于所述图像相似度和所述转移概率,确定综合特征向量之前,还包括:

获取第一属性信息和第二属性信息,所述第一属性信息表征所述第一目标对象的属性,所述第二属性信息表征所述第二目标对象的属性;

基于所述第一属性信息和所述第二属性信息,确定属性特征向量,所述属性特征向量表征所述第一目标对象与所述第二目标对象之间的属性相似度;

所述基于所述图像相似度和所述转移概率,确定综合特征向量,包括:

基于所述图像相似度、所述属性特征向量和所述转移概率,确定所述综合特征向量。

可选地,所述基于所述图像相似度、所述属性特征向量和所述转移概率,确定所述综合特征向量之前,还包括:

获取所述第一相机与所述第二相机之间的距离,以及所述第一拍摄时间与所述第二拍摄时间之间的时间差;

基于所述距离和所述时间差,确定所述第一目标对象的移动速度;

所述基于所述图像相似度、所述属性特征向量和所述转移概率,确定所述综合特征向量,包括:

将所述图像相似度、所述属性特征向量、所述转移概率、所述距离、所述时间差和所述移动速度进行组合,得到所述综合特征向量。

可选地,所述将所述综合特征向量输入图像分类模型之前,还包括:

获取训练样本集,所述训练样本集包括多个正样本和多个负样本,每个正样本包括存在同一目标对象的两个样本图像,每个负样本包括存在不同目标对象的两个样本图像,所述训练样本集还包括拍摄所述样本图像的相机的标识和拍摄时间;

基于所述多个正样本和所述多个负样本中所包括的样本图像,确定多个样本图像相似度;

基于所述多个正样本和所述多个负样本中所包括的相机的标识和拍摄时间,以及多个概率分布模型,确定多个样本转移概率;

基于所述多个样本图像相似度和所述多个样本转移概率,确定多个样本综合特征向量;

通过所述多个样本综合特征向量训练初始分类模型,得到所述图像分类模型。

可选地,所述确定转移概率之前,还包括:

如果所述图像相似度大于第一阈值且小于第二阈值,则执行所述确定转移概率的步骤。

另一方面,提供了一种相似度确定装置,所述装置包括:

第一确定模块,用于确定第一图像与第二图像之间的图像相似度,所述第一图像中存在第一目标对象,所述第二图像中存在第二目标对象,所述第一图像通过第一相机拍摄得到,所述第二图像通过第二相机拍摄得到;

第二确定模块,用于确定转移概率,所述转移概率为所述第一目标对象在参考时长内从所述第二相机的拍摄视野转移到所述第一相机的拍摄视野的概率;

第三确定模块,用于基于所述图像相似度和所述转移概率,确定所述第一目标对象与所述第二目标对象之间的相似度。

可选地,所述第二确定模块包括:

第一确定子模块,用于确定第一拍摄时间与第二拍摄时间之间的时间差,所述第一拍摄时间为所述第一图像的拍摄时间,所述第二拍摄时间为所述第二图像的拍摄时间;

第二确定子模块,用于从多个时长范围中确定所述时间差所处的时长范围;

第一处理子模块,用于将所述时间差所处的时长范围的标记值输入指定概率分布模型中,得到所述指定概率分布模型输出的所述转移概率,所述标记值用于指示相应的时长范围。

可选地,所述装置还包括:

第四确定模块,用于根据所述第一相机的标识和所述第二相机的标识,从多个概率分布模型中确定所述指定概率分布模型;

其中,所述指定概率分布模型对应参考相机对,所述参考相机对包括所述第一相机和所述第二相机,所述概率分布模型表征同一目标对象在对应的一个相机对所包括的两个相机之间转移的时间概率分布,不同的概率分布模型对应不同的相机对。

可选地,所述装置还包括:

第一获取模块,用于获取多个相机对中各个相机对分别对应的多个观测样本对,每个观测样本对包括由相应相机对拍摄且存在同一目标对象的两个观测图像的拍摄时间;

第五确定模块,用于基于各个相机对分别对应的多个观测样本对所包括的拍摄时间,确定相应相机对对应的多个时间差;

统计模块,用于统计各个相机对分别对应的多个时间差中位于多个时长范围中每个时长范围内的时间差的个数,得到相应相机对对应的多个统计频数;

第六确定模块,用于基于各个相机对分别对应的多个统计频数,以及所述多个时间范围的标记值,确定相应相机对对应的概率分布模型。

可选地,所述第三确定模块包括:

第三确定子模块,用于基于所述图像相似度和所述转移概率,确定综合特征向量;

第二处理子模块,用于将所述综合特征向量输入图像分类模型中,得到所述图像分类模型输出的所述第一目标对象与所述第二目标对象之间的相似度。

可选地,所述第三确定模块还包括:

第一获取子模块,用于获取第一属性信息和第二属性信息,所述第一属性信息表征所述第一目标对象的属性,所述第二属性信息表征所述第二目标对象的属性;

第四确定子模块,用于基于所述第一属性信息和所述第二属性信息,确定属性特征向量,所述属性特征向量表征所述第一目标对象与所述第二目标对象之间的属性相似度;

所述第三确定子模块具体用于:

基于所述图像相似度、所述属性特征向量和所述转移概率,确定所述综合特征向量。

可选地,所述第三确定模块还包括:

第二获取子模块,用于获取所述第一相机与所述第二相机之间的距离,以及所述第一拍摄时间与所述第二拍摄时间之间的时间差;

第五确定子模块,用于基于所述距离和所述时间差,确定所述第一目标对象的移动速度;

所述第三确定子模块具体用于:

将所述图像相似度、所述属性特征向量、所述转移概率、所述距离、所述时间差和所述移动速度进行组合,得到所述综合特征向量。

可选地,所述装置还包括:

第二获取模块,用于获取训练样本集,所述训练样本集包括多个正样本和多个负样本,每个正样本包括存在同一目标对象的两个样本图像,每个负样本包括存在不同目标对象的两个样本图像,所述训练样本集还包括拍摄所述样本图像的相机的标识和拍摄时间;

第七确定模块,用于基于所述多个正样本和所述多个负样本中所包括的样本图像,确定多个样本图像相似度;

第八确定模块,用于基于所述多个正样本和所述多个负样本中所包括的相机的标识和拍摄时间,以及多个概率分布模型,确定多个样本转移概率;

第九确定模块,用于基于所述多个样本图像相似度和所述多个样本转移概率,确定多个样本综合特征向量;

处理模块,用于通过所述多个样本综合特征向量训练初始分类模型,得到所述图像分类模型。

可选地,所述装置还包括:

触发模块,用于如果所述图像相似度大于第一阈值且小于第二阈值,则触发所述第二确定模块执行所述确定转移概率的步骤。

另一方面,提供了一种计算机设备,所述计算机设备包括处理器、通信接口、存储器和通信总线,所述处理器、所述通信接口和所述存储器通过所述通信总线完成相互间的通信,所述存储器用于存放计算机程序,所述处理器用于执行所述存储器上所存放的程序,以实现上述所述相似度确定方法的步骤。

另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述所述相似度确定方法的步骤。

另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的相似度确定方法的步骤。

本申请实施例提供的技术方案至少可以带来以下有益效果:

在本申请实施例中,对于均存在目标对象的两张图像来说,确定这两张图像之间的图像相似度,以及确定转移概率,转移概率为一个目标对象在参考时长内从第二相机的拍摄视野转移到第一相机的拍摄视野的概率,从而基于图像相似度和转移概率,确定这两张图像中存在的目标对象之间的相似度。其中,转移概率是一种时空特征,而非图像中的特征。也即是,本方案不仅依据图像中的特征,还依据时空特征来确定相似度,因而即使在图像质量较低的情况下所确定的相似度的准确性较高。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种相似度确定方法的流程图;

图2是本申请实施例提供的一种相机对之间转移时间的统计直方图;

图3是本申请实施例提供的一种相机对之间转移时间的概率观测值的示意图;

图4是本申请实施例提供的一种相似度确定装置的结构示意图;

图5是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

需要说明的是,本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。

为了便于理解,首先对本申请实施例所涉及的部分术语或名词进行解释。

图像归档:对相机所采集的图像按照图像中目标对象进行归类后得到的图像集合,同一个图像集合中包括存在同一目标对象的图像。

目标聚类:通过聚类算法,根据图像中目标对象的相似度,将存在相同的目标对象的图像聚在一个组内。

概率密度估计:由部分观测样本,估计总体的概率密度,得到观测值与其概率之间的关系。所得到的关系由概率分布模型表征。

转移概率:本文所指的转移概率即时空转移概率,即目标对象在任意两个相机之间花费一定时间进行转移的概率。

机器学习:用数据或以往的经验来优化计算机程序的性能标准。本文将机器学习技术应用到对同一目标对象的关联任务中。

视觉时空融合模型:即本申请实施例中的图像分类模型,该图像分类模型为结合视觉特征(即图像特征)和时空信息(即时空特征)的机器学习模型。

综合相似度:表征两张图像中目标对象之间的相近程度。首先,通过提取两个图像的视觉特征,得到两个图像之间的图像相似度。然后将图像相似度再结合时空特征,通过视觉时空融合模型,得到两个图像中存在的目标对象之间的相似度,也即得到综合相似度。综合相似度越大,则这两个图像中存在的目标对象为同一个目标对象的概率越大。

本申请实施例提供的相似度确定方法能够应用于多种场景。且基于本申请实施例所确定的相似度还能够对图像进行各种处理,例如基于相似度进行目标聚类,基于相似度进行图像分类等等。

示例性地,在图像归档场景中,环境中的多路相机分别采集各自拍摄视野内的图像,得到图像流,该多路相机将各自得到的图像流发送给计算机设备。计算机设备接收该多路相机分别得到的图像流。计算机可以每接收到一张图像,通过本申请实施例提供的相似度确定方法来确定该图像与已归档的图像集合中图像之间存在的目标的相似度,基于相似度将该图像进行归档,使得每个已归档的图像集合所包括的图像存在同一目标对象。计算机设备也可以在接收到多张图像之后,通过本申请实施例提供的相似度确定方法来确定该多张图像进行目标聚类,从而将该多张图像进行归档。在图像归档场景中,通过本申请实施例提供的相似度确定方法对图像进行归档,可以认为是一种目标对象的轨迹关联。

在本申请实施例中,目标对象可以是人物、车辆或机器人等,本申请实施例对此不作限定。采集图像的数据采集设备可以是任一类型的相机、监控摄像头等,本申请实施例以数据采集设备为相机为例进行介绍。

另外,本申请实施例提供的相似度确定方法的执行主体可以为计算机设备,该计算机设备可以是终端或服务器。其中,终端可以是手机、台式电脑、笔记本电脑、平板电脑等。服务器可以是一台独立的服务器,或者,是由多台服务器构成的服务器集群,或者,是一个云计算中心。

接下来对本申请实施例提供的相似度确定方法进行详细的解释说明。

图1是本申请实施例提供的一种相似度确定方法的流程图。以该方法应用于计算机设备为例,请参考图1,该方法包括如下步骤。

步骤101:确定第一图像与第二图像之间的图像相似度,第一图像中存在第一目标对象,第二图像中存在第二目标对象,第一图像通过第一相机拍摄得到,第二图像通过第二相机拍摄得到。

在本申请实施例中,计算机设备首先确定第一图像与第二图像之间的相似度。其中,第一图像中存在第一目标对象,第二图像中存在第二目标对象,第一图像通过第一相机拍摄得到,第二图像通过第二相机拍摄得到。

计算机设备确定第一图像与第二图像的一种实现方式为:计算机设备获取第一图像特征和第二图像特征,基于第一图像特征和第二图像特征确定第一图像与第二图像之间的相似度。其中,第一图像特征为第一图像的特征,第二图像特征为第二图像的特征。

可选地,计算机设备可以将第一图像和第二图像分别输入特征提取模型中,得到特征提取模型分别输出的第一图像特征和第二图像特征。其中,特征提取模型可以是一种机器学习模型,也可以是其他的能够提取图像特征的模型,本申请实施例对此不作限定。示例性地,特征提取模型为一个深度学习模型,如卷积神经网络模型。需要说明的是,特征提取模型为预先训练得到的模型,本申请实施例不限定特征提取模型的结构和训练方式。

可选地,第一图像特征和第二图像特征均以向量形式表示,计算机设备基于第一图像特征和第二图像特征确定第一图像与第二图像之间的相似度的一种实现方式为:计算机设备计算第一图像特征与第二图像特征之间的距离,例如欧式距离、余弦距离等,基于计算得到的距离确定图像相似度。

步骤102:确定转移概率,该转移概率为第一目标对象在参考时长内从第二相机的拍摄视野转移到第一相机的拍摄视野的概率。

在本申请实施例中,计算机设备在确定图像相似度之后,还可以确定转移概率,转移概率为第一目标对象在参考时长内从第二相机的拍摄视野转移到第一相机的拍摄视野的概率。其中,转移概率能够表征时空特征,该时空特征是图像特征之外的特征。

可选地,计算机设备确定转移概率的一种实现方式为:计算机设备确定第一拍摄时间与第二拍摄时间之间的时间差,其中,第一拍摄时间为第一图像的拍摄时间,第二拍摄时间为第二图像的拍摄时间。计算机设备从多个时长范围中确定该时间差所处的时长范围。计算机设备将该时间差所处的时长范围的标记值输入指定概率分布模型中,得到指定概率分布模型输出的转移概率。其中,标记值用于指示相应的时长范围,不同的时长范围对应不同的标记值。需要说明的是,指定概率分布模型能够表征同一目标对象在第一相机与第二相机之间转移的时间概率分布。

本申请实施例中的多个时间范围也可称为多个时间分箱。本申请实施例不限定该多个时间分箱的划分方法。示例性地,将一天时间或者两天时间划分为多个时长分箱(即多个时长范围),各个时间分箱的时长相等。例如,将一天时间划分为多个时长分箱,每个时间分箱的时长为5分钟,这样即将24小时划分为288个时间分箱,这288个时间分箱的标记值可以依次为1、2、3、……、288。假设第一拍摄时间与第二拍摄时间之间的时间差为17分钟,则计算机设备确定该时间差所处的时间分箱为第3个时间分箱,第三个时间分箱的标记值为3,计算机设备将3输入指定概率分布模型中,得到指定概率分布模型输出的转移概率。

其中,指定概率分布模型可以认为是一个函数,时间范围的标记值可以认为是函数的自变量,得到的转移概率可以认为是函数的因变量。

可选地,在本申请实施例中,一个相机对对应一个概率分布模型,不同的相机对可能对应不同的概率分布模型,计算机设备中可以存储多个相机对分别对应的多个概率分布模型,计算机设备在基于指定概率分布模型确定转移概率之前,根据第一相机的标识和第二相机的标识,从多个概率分布模型中确定指定概率分布模型。其中,指定概率分布模型对应参考相机对,参考相机对包括第一相机和第二相机,概率分布模型表征同一目标对象在对应的一个相机对所包括的两个相机之间转移的时间概率分布,不同的概率分布模型对应不同的相机对。也即是,计算机设备先从多个概率分布模型中选择与参考相机对对应的概率分布模型,从而基于所选择的概率分布模型确定转移概率。

需要说明的是,本申请实施例中采集图像的相机可以为一个或多个。若采集图像的相机为一个,那么第一相机和第二相机为同一个相机。若采集图像的相机为多个,那么第一相机和第二相机可以为同一个相机,也可以为不同的相机。若第一相机与第二相机为不同的相机,则任一个概率分布模型对应的相机对所包括的两个相机无先后顺序,例如,{第一相机,第二相机}和{第二相机,第一相机}表示同一个相机对,该相机对对应一个概率分布模型。或者,若第一相机与第二相机为不同的相机,则任一个概率分布模型对应的相机对所包括的两个相机有先后顺序,例如,{第一相机,第二相机}和{第二相机,第一相机}表示不同的两个相机对,这两个相机对对应两个概率分布模型。其中,在任一个概率分布模型对应的相机对所包括的两个相机有先后顺序的情况下,该多个概率分布模型能够更加准确地表征同一目标对象在相机间转移的时间概率分布。另外,在本申请实施例中,不同的相机对对应的概率分布模型一般是不同的,当然也可能存在不同的相机对对应的概率分布模型相同的情况。

在本申请实施例中,该多个概率分布模型为预先确定的模型,可以由任一计算机设备来确定该多个概率分布模型,本申请实施例对此不作限定。接下来介绍由计算机设备确定该多个概率分布模型的实现过程,该实现过程包括如下步骤。

步骤1021:获取多个相机对中各个相机对分别对应的多个观测样本对,每个观测样本对包括由相应相机对拍摄且存在同一目标对象的两个观测图像的拍摄时间。

为了得到同一目标对象在一个相机对之间转移花费一定时间的概率,从而得到概率分布模型,本申请实施例中通过观测样本来估计总体概率密度,也即是通过概率密度估计来确定该多个概率分布模型。

在申请实施例中,首先需要获取观测样本。可选地,通过相机拍摄得到存在目标对象的多张图像,将这些图像中由同一相机对拍摄且存在同一目标对象的任意两张图像作为一组,得到相应相机对对应的多组观测图像,也即,每组观测图像包括由同一相机对拍摄且存在同一目标对象的两个观测图像。将各个相机对对应的各组观测图像所包括的两个观测图像的拍摄时间作为一个观测样本对,从而得到相应相机对对应的多个观测样本对。需要说明的是,获取充足的观测样本对,可以提高后续得到的概率分布模型的精确性。

需要说明的是,每个观测样本对所包括的两个观测图像的拍摄时间的时间差不能超过上述多个时长范围中最大的时长范围。示例性地,将24小时分为288个时长范围,最大的时长范围即[1336,1440]分钟,那么每个观测样本对所包括的两个观测图像的拍摄时间的时间差不能超过1440分钟(即24小时)。简单来说,每组观测图像的拍摄时间间隔不能超过最大的时间分箱。

步骤1022:基于各个相机对分别对应的多个观测样本对所包括的拍摄时间,确定相应相机对对应的多个时间差。

在本申请实施例中,计算机设备获取多个相机对中各个相机对分别对应的多个观测样本对之后,基于各个相机对分别对应的多个观测样本对所包括的拍摄时间,确定相应相机对对应的多个时间差。需要说明的是,本申请实施例中的时间差为非负值。

示例性地,以一个相机对对应的一个观测样本对为例,计算机设备计算该观测样本对包括的两个拍摄时间之间差值的绝对值,得到一个时间差。假设该观测样本对包括的两个拍摄时间分别为上午9时20分、上午9时36分,那么基于这两个拍摄时间得到的一个时间差为16分钟。

需要说明的是,本申请实施例中拍摄时间的时间精度可以是分钟,也可以是秒,也可以是小时等,本申请实施例对此不作限定。本申请实施例中时间分箱的划分精度也可以是分钟、秒、小时等,在本申请实施例中,时间差的时间精度与时间分箱的划分精度需要保持一致。一般情况下,相机拍摄图像的拍摄时间的时间精度为秒,若时间分箱的划分精度为分钟,则计算机设备通过去掉拍摄时间中的秒数,从而计算得到时间精度为妙的时间差,使得时间差的精度与时间分箱的划分精度一致。或者,计算机设备先基于拍摄时间得到初始时间差,将初始时间差的秒数去掉,或者,若秒数大于30则将初始时间差的分钟加1,原理类似于四舍五入。

步骤1023:统计各个相机对分别对应的多个时间差中位于多个时长范围中每个时长范围内的时间差的个数,得到相应相机对对应的多个统计频数。

在本申请实施例中,计算机设备在得到各个相机对分别对应的多个时间差之后,统计各个相机对分别对应的多个时间差中位于多个时长范围中每个时长范围内的时间差的个数,得到相应相机对对应的多个统计频数(也可以称为分箱频数)。

示例性地,对于一个相机对来说,计算机设备统计该相机对对应的多个时间差中位于该多个时长范围中每个时长范围内的时间差的个数,得到该相机对对应的多个统计频数。该多个统计频数对应该多个时长范围。

假设每个时间范围的时长为dt,也即将时间离散化的间隔为dt,时间范围的标记值tag=time_max/dt,其中,time_max表示一个时间范围的截止值。例如时间范围[1,5]的截止值为5。假设一个相机对对应的一个时间差为time_diff,计算机设备对该时间差进行离散化得到对应的分箱数其中,表示向上取整。计算机设备确定该时间差是位于标记值tag与分箱数hist_num相等的一个时间范围内。计算机设备按照这样的方式来判断各个时间差是位于哪个时间范围内,从而统计得到各个相机对对应的多个统计频数。

或者,计算机设备通过比较时间差与各个时间范围的起始值的大小,以及时间差与各个时间范围的截止值的大小,来判断时间差位于哪个时间范围,从而统计得到各个相机对对应的多个统计频数。

示例性地,图2是本申请实施例提供的一个相机对之间转移时间的统计直方图。在图2中,以将24小时划分为288个时间分箱为例,这288个时间分箱的标记值依次为1、2、3、……、288,每个时间分箱的时长为5分钟。图2中的每条曲线对应一个相机对,曲线的横轴为时间离散化得到的标记值,纵轴为统计频数。横向观看图2的话,每条曲线示出了同一目标对象在不同时长内在同一相机对之间转移的频数是有所不同的。纵向观看图2的话,图2还示出了同一目标对象在一定时间内在不同相机对之间转移的频数是有所不同的。需要说明的是,图2中仅示出了部分相机对,例如cam_1->cam_2、cam_1->cam_3等10个相机对。其中,图2中位于最上方的曲线对应cam_1->cam_2,其余曲线重叠部分较多(由于统计频数比较接近),这些重叠较多的9个曲线分别对应其余的9个相机对,虽然有重叠部分,但是还能看出不同相机对对应的统计频数有所不同。

步骤1024:基于各个相机对分别对应的多个统计频数,以及多个时间范围的标记值,确定相应相机对对应的概率分布模型。

在本申请实施例中,计算机设备在得到各个相机对分别对应的多个统计频数之后,基于各个相机对分别对应的多个统计频数来估计总体概率密度,也即是通过概率密度估计来确定该多个概率分布模型。

可选地,本申请实施例中的概率密度估计的方法为parzen窗估计、k邻近估计等方法,也可以是其他的概率估计方法,本申请实施例对此不作限定。

可选地,为了缓解由于大规模场景下观测样本的分布稀疏性,计算机设备可以对统计得到的各个相机对对应的多个统计频数进行平滑处理,得到各个相机对对应的多个概率观测值。计算机设备基于各个相机对对应的多个概率观测值,以及该多个时间范围的标记值,确定相应相机对对应的概率分布模型。

其中,平滑处理可以是高斯平滑,也可以是其他的平滑处理,本申请实施例对此不作限定。

以高斯平滑为例,假设基于观测样本对得到的一个统计频数为mk,一个相机对对应的多个观测样本对的总数量为M,多个时间分箱的总数量为D,每个时间分箱的标签值为dk,λ为平滑参数。Y=dk表示一个相机对对应的多个时间差中位于标签值为dk的时间范围内的时间差,pλ表示概率观测值。计算机设备可以根据下述公式(1)对各个相机对对应的多个统计频数进行平滑处理,得到各个相机对对应的多个概率观测值。

示例性地,图3是本申请实施例提供的一个相机对之间转移时间的概率观测值的示意图。图3是对图2所示的统计频数进行平滑处理后得到的概率观测值的示意图。在图3中,一条曲线对应一个相机对,曲线的横轴为时间离散化得到的标记值,曲线的纵轴为概率观测值(即概率密度)。横向观看图3的话,每条曲线示出了同一目标对象在不同时长内在同一相机对之间转移的概率观测值是有所不同的。纵向观看图3的话,图3还示出了同一目标对象在一定时间内在不同相机对之间转移的概率观测值是有所不同的。需要说明的是,图3与图2类似,图3中仅示出了部分相机对,例如cam_1->cam_2、cam_1->cam_3等10个相机对。其中,图3中概率观测值的分布最广的曲线对应cam_1->cam_2,其余曲线的概率观测值的分布范围较小,这些概率观测值分布范围较小的9个曲线分别对应其余的9个相机对,可以看出这不同对相机对对应的概率观测值有所不同。

步骤103:基于该图像相似度和转移概率,确定第一目标对象与第二目标对象之间的相似度。

在本申请实施例中,计算机设备在通过步骤101和步骤102得到第一图像与第二图像之间的图像相似度和转移概率之后,基于该图像相似度和转移概率,确定第一目标对象与第二目标对象之间的相似度。

示例性地,计算机设备通过加权平均的方法来计算该图像相似度和转移概率的加权平均值,将该加权平均值作为第一目标对象与第二目标对象之间的相似度。

或者,计算机设备通过图像分类模型对该图像相似度和转移概率进行处理,从而得到第一目标对象与第二目标对象之间的相似度。在本申请实施例中,计算机设备基于该图像相似度和转移概率,确定综合特征向量。计算机设备将该综合特征向量输入图像分类模型中,得到图像分类模型输出的第一目标对象与第二目标对象之间的相似度。

例如,计算机设备将该图像相似度和转移概率进行组合,得到综合特征向量,将该综合特征向量输入一个图像分类模型中,得到该图像分类模型输出的第一目标对象与第二目标对象之间的相似度。

需要说明的是,图像分类模型为预先训练得到的机器学习模型或深度学习模型。例如,图像分类模型可以是逻辑回归模型、决策树模型或者基于支持向量机的分类模型等。本申请实施例不限定图像分类模型的种类、结构等。另外,本申请实施例中的综合特征向量包含两部分特征,第一部分特征为图像特征,第二部分特征为时空特征,其中,图像特征包括图像相似度,时空特征包括转移概率。

若计算机设备通过图像分类模型来得到第一目标对象与第二目标对象之间的相似度,可选地,输入图像分类模型的特征向量除了包含图像相似度和转移概率之外,还可以包含更多的特征,以增加特征向量所表征的特征的丰富性,从而提高通过图像分类模型得到的相似度的准确性。

可选地,计算机设备获取第一属性信息和第二属性信息,其中,第一属性信息表征第一目标对象的属性,第二属性信息表征第二目标对象的属性。计算机设备基于第一属性信息和第二属性信息,确定属性特征向量,该属性特征向量表征第一目标对象与第二目标对象之间的属性相似度。计算机设备基于图像相似度、属性特征向量和转移概率,确定综合特征向量。也即是,在本申请实施例中,还可以结合目标对象的属性特征来确定目标对象之间的相似度(即综合相似度)。

其中,属性信息也可以称为属性特征、结构化属性特征等。以目标对象为人物为例,一个目标对象的属性信息可以包括人脸属性和/或人体属性。其中,人脸属性可以包括眼间距、灰阶数、清晰度分值、正面程度分值、可见性分值和人脸质量分值中的一个或多个。人体属性可以包括上衣颜色、下衣颜色、年龄、性别、是否骑车、是否拎包、是否戴帽等中的一个或多个。

需要说明的是,在本申请实施例中,属性信息所包含的各种属性均用数值来表示,便于计算机设备进行计算。

可选地,计算机设备基于第一属性信息和第二属性信息,确定属性特征向量的一种实现方式为:计算机设备对第一属性信息与第二属性信息中相对应的属性进行指定运算的处理,得到相应属性的特征值。计算机设备将第一属性信息和第二属性信息包括的各个属性的特征值进行组合,得到属性特征向量。其中,指定运算可以包括相加、相减或相除等中的一种或多种运算。不同的属性对应的指定运算可以相同,也可以不同。

示例性地,以第一属性信息和第二属性信息中的灰阶数这个属性为例,灰阶数对应的指定运算包括相加、相减和相除,假设第一属性信息和第二属性信息中对应的两个灰阶数分别为h1和h2,那么计算机设备对这两个灰阶数分别进行相加、相减和相除,得到灰阶数的三个特征值为hf1、hf2和hf3。再以第一属性信息和第二属性信息中的年龄这个属性为例,年龄对应的指定运算包括相减,假设第一属性信息和第二属性信息中对应的两个年龄分别为o1和o2,那么计算机设备对这两个年龄进行相减,得到年龄的一个特征值为of1

可选地,计算机设备可以按照属性顺序将第一属性信息和第二属性信息包括的各个属性的特征值进行组合,得到属性特征向量。属性顺序为属性依次为眼间距、灰阶数和年龄的顺序,那么计算机设备可以将眼间距的特征值、灰阶数的特征值和年龄的特征值拼接起来,得到属性特征向量。

在本申请实施例中,第一属性信息和第二属性信息分别基于第一图像和第二图像确定,属性信息可以认为是一种图像特征,也即本方案中的图像特征还包含属性信息。示例性地,计算机设备分别将第一图像和第二图像输入图像分析模型中,得到图像分析模型分别输出的第一属性信息和第二属性信息。需要说明的是,图像分析模型为能够分析得到图像中目标对象的属性信息的机器学习模型或深度学习模型,图像分析模型预先训练得到。本申请实施例不限定图像分析模型的种类、结构和训练方法等。另外,可以在任一台计算机设备中部署图像分析模型,以对图像进行分析得到目标对象的属性信息。也可以在采集图像的相机中部署图像分析模型,由相机通过图像分析模型对所采集的图像进行属性信息的提取。相机不仅将所采集的图像发送给计算机设备,还将图像的属性信息发送给计算机设备。可选地,属性信息为结构化属性特征,相机将所采集的图像和分析得到的结构化属性特征同时发送给计算机设备。

可选地,在本申请实施例中,除了结合目标对象的属性特征来确定目标对象之间的相似度之外,还可以结合更多的其他特征来确定目标对象之间的相似度。示例性地,计算机设备获取第一相机与第二相机之间的距离,以及第一拍摄时间与第二拍摄时间之间的时间差。计算机设备基于该距离和该时间差,确定第一目标对象的移动速度。计算机设备将图像相似度、属性特征向量、转移概率、距离、时间差和移动速度进行组合,得到综合特征向量。也即是,计算机设备还可以结合相机间的距离和目标对象的移动速度来确定目标对象之间的相似度。需要说明的是,距离、时间差和移动速度均可以认为是一种时空特征,也即本方案中的时空特征还包含相机之间的距离、拍摄时间之间的时间差和目标对象的移动速度。

可选地,计算机设备可以基于相机的标识,从相机标识与相机位置坐标的映射关系中确定相机的位置坐标,基于相机的位置坐标,确定相机之间的距离。计算机设备也可以通过其他方法来确定相机之间的距离,本申请实施例对此不作限定。

示例性地,假设第一图像与第二图像之间的图像相似度为pic_sim,属性特征向量为[f1,f2,f3,…,fn],转移概率为prob,距离为dist,时间差为time_diff,移动速度为speed,那么,计算机设备通过组合得到的综合特征向量为[pic_sim,f1,f2,f3,…,fn,prob,dist,time_diff]。

需要说明的是,上述实施例中所用的属性信息、相机之间的距离、拍摄时间之间的时间差和目标对象的移动速度均是可选地。也即是,计算机设备可以结合属性信息、相机之间的距离、拍摄时间之间的时间差和目标对象的移动速度中的一种或多种属性来确定目标对象之间的相似度。示例性地,计算机设备结合属性信息、距离和时间差来确定目标对象之间的相似度。另外,本申请实施例不限定于以上介绍的几种特征,即,除了以上介绍的几种特征,计算机设备也可以结合其他的特征来确定目标对象之间的相似度。

在本申请实施例中,计算机设备得到综合特征向量之后,将综合特征向量输入图像分类模型中,得到图像分类模型输出的第一目标对象与第二目标对象之间的相似度。

由前述可知,图像分类模型为预先训练得到的模型,接下来对训练得到该图像分类模型所需的多个训练数据进行介绍。需要说明的是,每个训练数据与上述实施例中的综合特征向量是类似的,也即是,训练数据的确定方式与综合特征向量的确定方式类似。在本申请实施例中将训练数据称为样本综合特征向量。另外,本申请实施例不限定用于训练得到图像分类模型的设备为哪一个设备,接下来以计算机设备训练得到图像分类模型为例进行介绍。

在本申请实施例中,计算机设备训练得到图像分类模型的实现过程包括如下步骤:

步骤1031:获取训练样本集,训练样本集包括多个正样本和多个负样本,每个正样本包括存在同一目标对象的两个样本图像,每个负样本包括存在不同目标对象的两个样本图像,训练样本集还包括拍摄样本图像的相机的标识和拍摄时间。

在本申请实施例中,计算机设备首先获取训练样本集,包括获取多个正样本和多个负样本。示例性地,计算机设备获取多个图像集合,每个图像集合中包括存在同一目标对象的多张图像,计算机设备将每个图像集合中的多张图像进行两两组合,以得到多个正样本。计算机设备从任意两个图像集合中分别任意选择一张图像进行组合,以得到多个负样本。

例如,存在目标对象a的图像集合Pa为{Pa1,Pa2,Pa3},存在目标对象b的图像集合Pb为{Pb1,Pb2,Pb3}。Pa中的任意两张图像可以组合成为一个正样本。同理,Pb中的任意两张图像组合构成一个正样本。Pa中的任意一张图像和Pb中的任意一张图像组合构成一个负样本。则对于这两个图像集合来说,通过组合可以得到3+3=6个正样本,得到3*3=9个负样本。

在本申请实施例中,由于还需基于转移概率确定综合特征向量,转移概率与相机和拍摄时间均相关,因此,训练样本集还包括拍摄样本图像的相机的标识和拍摄时间。也即是,每个正样本还包括拍摄相应样本图像的相机的标识和拍摄时间,每个负样本也还包括拍摄相应样本图像的相机的标识和拍摄时间。

步骤1032:基于该多个正样本和多个负样本中所包括的样本图像,确定多个样本图像相似度。

在本申请实施例中,计算机设备基于该多个正样本和多个负样本中所包括的样本图像,确定多个样本图像相似度。示例性地,对于每个正样本所包括的两个样本图像,计算机设备提取这两个样本图像的图像特征,得到第一样本图像特征和第二样本图像特征。计算机设备基于第一样本图像特征和第二样本图像特征,确定这两个样本图像之间的样本图像相似度,也即计算机设备基于每个正样本得到对应的一个图像相似度。同理,对于每个负样本所包括的两个样本图像,计算机设备提取这两个样本图像的图像特征,得到第三样本图像特征和第四样本图像特征。计算机设备基于第三样本图像特征和第四样本图像特征,确定这两个图像样本之间的样本图像相似度,也即计算机设备基于每个负样本也得到对应的一个图像相似度。计算机基于该多个正样本和多个负样本得到多个样本图像相似度,一个样本图像相似度对应一个正样本或一个负样本。

其中,计算机设备可以通过特征提取模型来提取样本图像的图像特征。示例性地,计算机设备将每个样本图像输入特征提取模型,得到特征提取模型输出的图像特征。需要说明的是,步骤1032中的特征提取模型与前述步骤101中的特征提取模型为同一个,关于特征提取模型的介绍可以参照前述实施例。

步骤1033:基于该多个正样本和多个负样本中所包括的相机的标识和拍摄时间,以及多个概率分布模型,确定多个样本转移概率。

在本申请实施例中,计算机设备还需要基于该多个正样本和多个负样本中所包括的相机的标识和拍摄时间,以及多个概率分布模型,确定多个样本转移概率。示例性地,对于每个正样本或每个负样本所包括的两个相机的标识和两个拍摄时间,计算机设备确定这两个拍摄时间之间的时间差,从多个时长范围内确定该时间差所处于的时长范围。计算机设备基于这两个相机的标识,从多个概率分布模型中确定与这两个相机对应的概率分布模型。计算机设备将该时间差所处于的时长范围的标记值输入所确定的概率分布模型中,得到该正样本或负样本对应的样本转移概率。也即计算机设备基于每个正样本还得到对应的一个样本转移概率,基于每个负样本还得到对应的一个样本转移概率。

其中,对于该多个时长范围和多个概率分布模型的介绍可以参照步骤102中的相关介绍。计算机确定样本转移概率的原理与前述确定转移概率的原理相同,确定样本转移概率的具体实现过程也可以参照前述步骤102中的相关介绍。

步骤1034:基于该多个样本图像相似度和多个样本转移概率,确定多个样本综合特征向量。

在本申请实施例中,计算机设备在确定多个样本图像相似度和多个样本转移概率之后,基于该多个样本图像相似度和多个样本转移概率,确定多个样本综合特征向量。其中,一个样本图像相似度对应一个正样本或一个负样本,一个样本转移概率对应一个正样本或一个负样本。

示例性地,计算机设备基于每个正样本对应的样本图像相似度和样本转移概率,得到对应的一个样本综合特征向量。计算机设备基于每个负样本对应的样本图像相似度和样本转移概率,得到对应的一个样本综合特征向量。这样,计算机设备基于该多个正样本对应的样本图像相似度和样本转移概率,以及该多个负样本对应的样本图像相似度和样本转移概率,得到多个样本综合特征向量。一个样本综合特征向量对应一个正样本或一个负样本。

需要说明的是,计算机设备确定样本综合特征向量的原理与步骤102中确定综合特征向量的原理相同,且步骤1034中确定样本综合特征向量的实现过程与步骤102中确定综合特征向量的实现过程一致。也即是,确定综合特征向量用到了哪些特征,那么确定样本综合特征向量也需要用到同样的特征。

例如,在基于图像相似度和转移概率确定综合特征向量的情况下,计算机设备将每个正样本对应的样本图像相似度和样本转移概率进行组合,得到对应的一个样本综合特征向量。计算机设备将每个负样本对应的样本图像相似度和样本转移概率进行组合,得到对应的一个样本综合特征向量。

又如,在基于图像相似度、属性信息和转移概率确定综合特征向量的情况下,计算机设备也需要结合样本属性信息来确定样本综合特征向量。示例性地,计算机设备获取的每个正样本还包括相应两个样本图像分别对应的样本属性信息,计算机设备获取的每个负样本还包括相应两个样本图像分别对应的样本属性信息。计算机设备基于该多个正样本和多个负样本包括的样本属性信息,确定多个样本属性特征向量。计算机设备基于该多个样本图像相似度、多个样本属性特征向量和多个样本转移概率,确定多个样本综合特征向量。示例性地,计算机设备将每个正样本对应的样本图像相似度、样本属性特征向量和样本转移概率进行组合,得到对应的一个样本综合特征向量。计算机设备将每个负样本对应的样本图像相似度、样本属性特征向量和样本转移概率进行组合,得到对应的一个样本综合特征向量。其中,一个样本综合特征向量对应一个正样本或一个负样本。其中,计算机设备基于该多个正样本和多个负样本包括的样本属性信息,确定多个样本属性特征向量的实现方式与步骤102中确定属性特征向量的实现方式原理相同,请参照前述介绍,这里不再赘述。

再如,在基于图像相似度、属性信息、转移概率、相机之间的距离、拍摄时间之间的时间差和目标对象的移动速度确定综合特征向量的情况下,计算机设备也需要结合样本属性信息、相机之间的距离、拍摄时间之间的时间差和目标对象的移动速度来确定样本综合特征向量。示例性地,计算机设备获取每个正样本所对应的两个相机之间的距离,以及每个负样本所对应的两个相机之间的距离,以得到多个样本距离,每个样本距离对应一个正样本或一个负样本。计算机设备计算每个正样本所包括的两个拍摄时间之间的时间差,以及每个负样本所包括的两个拍摄时间之间的时间差,以得到多个样本时间差,每个样本时间差对应一个正样本或一个负样本。计算机设备基于该多个样本距离和多个样本时间差,确定多个样本移动速度。每个样本移动速度对应一个正样本或一个负样本。计算机设备基于该多个样本图像相似度、多个样本属性特征向量、多个样本转移概率、多个样本距离、多个样本时间差和多个样本移动速度,确定多个样本综合特征向量。例如,计算机设备将每个正样本对应的样本图像相似度、样本属性特征向量、样本转移概率、样本距离、样本时间差和样本移动速度进行组合,得到对应的一个样本综合特征向量。计算机设备将每个负样本对应的样本图像相似度、样本属性特征向量、样本转移概率、样本距离、样本时间差和样本移动速度进行组合,得到对应的一个样本综合特征向量。需要说明的是,这个实现过程的原理与前述步骤102中相关内容的原理相同,请参考前述介绍,这里不再详细介绍。

步骤1035:通过该多个样本综合特征向量训练初始分类模型,得到图像分类模型。

在本申请实施例中,计算机设备在得到多个样本综合特征向量之后,通过该多个样本综合特征向量训练初始分类模型,得到图像分类模型。需要说明的是,由前述可知,一个样本综合特征向量对应一个正样本或一个负样本,正样本和负样本均可以具有对应的标签信息,那么该多个样本综合特征向量也具有对应的标签信息,计算机设备可以通过该多个样本综合特征向量和该多个样本综合特征向量对应的标签信息来训练初始分类模型,得到图像分类模型。也即是,计算机设备以有监督的方式训练得到图像分类模型。在其他一些实施例中,计算机设备也可以以无监督或半监督的方式训练得到图像分类模型,也即标签信息是可选地。可选地,在本申请实施例中,正样本的标签信息为“1”,负样本的标签信息为“0”。

其中,初始分类模型与最终得到的图像分类模型的结构相同,或者图像分类模型为初始分类模型的一部分,本申请实施例对此不作限定。另外,本申请实施例也不限定训练初始分类模型的方式。还可以通过测试集或验证集对训练得到的图像分类模型进行测试或验证,以对图像分类模型进行调优,最终得到性能较优的图像分类模型。

可选地,在本申请实施例中,计算机设备在确定转移概率之前,或者说在确定第一图像与第二图像之间的图像相似度之后,如果该图像相似度大于第一阈值且小于第二阈值,则计算机设备执行确定转移概率的步骤。如果该图像相似度小于或等于第一阈值,或者该图像相似度大于或等于第二阈值,则计算机设备不执行确定转移概率的步骤,将该图像相似度确定为第一目标对象与第二目标对象之间的相似度。也即是,计算机设备可以通过设置阈值来判断是否要进一步结合时空特征来确定目标对象之间的相似度。

其中,第一阈值和第二阈值可以为预设的数值,且第一阈值小于第二阈值,本申请实施例不限定第一阈值和第二阈值的具体数值,第一阈值和第二阈值均在图像相似度的取值范围内即可。示例性地,假设图像相似度的取值范围为[0,1],第一阈值为0.7,第二阈值为0.8,如果第一图像与第二图像之间的图像相似度大于0.7且小于0.8,那么计算机设备进一步确定转移概率。

也即是,在图像相似度较低或较高的情况下,可以认为图像相似度是比较准确的,在图像相似度较低的情况下,可以直接认为第一图像与第二图像中存在的目标对象不是同一个,在图像相似度较高的情况下,可以直接认为第一图像与第二图像中存在的目标对象为同一个。而在其他情况下,可以认为图像相似度是不够准确的,还需要进一步结合转移概率来确定目标对象之间的相似度。

可选地,计算机设备在确定第一图像与第二图像之间的图像相似度之后,如果该图像相似度大于第三阈值,则计算机设备执行确定转移概率的步骤。如果该图像相似度小于或等于第三阈值,则计算机设备不执行确定转移概率的步骤,将该图像相似度确定为第一目标对象与第二目标对象之间的相似度。其中,第三阈值为预设的一个数值,本申请实施例不限定第三阈值的具体数值,第三阈值在图像相似度的取值范围内即可。示例性地,假设图像相似度的取值范围为[0,1],第三阈值为0.75,如果第一图像与第二图像之间的图像相似度大于0.75,那么计算机设备进一步确定转移概率。

由上述可知,计算机设备可以基于图像相似度和转移概率来确定目标对象之间的相似度。计算机设备也可以在图像相似度满足预设阈值条件的情况下再确定转移概率,基于图像相似度和转移概率来确定目标对象之间的相似度。本申请实施例不限定预设阈值条件的设置方法。可以看出,本方案中计算机设备可以通过多阈值策略使得在图像相似度满足预设阈值条件的情况下再执行确定转移概率以及之后的步骤,在图像相似度不满足预设阈值条件的情况下不执行这些步骤,从而能够在保证准确性的同时提高运行效率。

另外,本方案基于概率密度估计方法对目标对象的移动模式进行建模,得到多个概率分布模型,概率分布模型表征同一目标对象在对应的一个相机对所包括的两个相机之间转移的时间概率分布。本方案还可以结合相机之间的距离、拍摄时间之间的时间差,目标对象的移动速度等时空特征,在由于遮挡、光照变化、曝光过度等导致图像质量较低使得图像相似度的准确性较低的情况下,也能够结合这些时空特征以弥补图像特征的不足,使得最终确定的目标对象之间的相似度(即综合相似度)的准确性较高。

可选地,在本申请实施例中,计算机设备在确定第一目标对象与第二目标对象之后的相似度之后,可以基于该相似度对图像进行聚类,从而提高聚类准确性。

示例性地,如果第一目标对象与第二目标对象之间的相似度大于第四阈值,表示第一目标对象与第二目标对象为同一目标对象,则计算机设备确定第一图像和第二图像属于同一类,如果第一目标对象与第二目标对象之间的相似度大于第四阈值,表示第一目标对象与第二目标对象为不同的目标对象,则计算机设备确定第一图像和第二图像不属于同一类。

在图像归档的一种场景中,计算机设备每接收到一个图像,需要对该图像进行归档,也即基于相似度将该图像归入某个图像集合中。可选地,计算机设备可以将该图像与各个图像集合中的全部图像或部分图像进行相似度计算,从而进行聚类。

若该计算机设备将该图像与各个图像集合中全部图像进行相似度计算,则计算机设备可以计算该图像中存在的目标对象与任一个图像集合中各个图像中存在的目标对象的相似度,得到多个相似度。计算机设备将该多个相似度的平均值作为该图像与该图像集合之间的相似度。计算机设备在得到该图像与各个图像集合之间的相似度之后,将该图像归入相似度最高的图像集合中。

若算机设备将该图像与各个图像集合中部分图像进行相似度计算,如部分图像为图像集合中的至少一张代表图像,则计算机设备可以计算该图像中存在的目标对象与任一个图像集合中至少一个代表图像中存在的目标对象的相似度,得到至少一个相似度。计算机设备将该至少一个相似度的平均值作为该图像与该图像集合之间的相似度。计算机设备在得到该图像与各个图像集合之间的相似度之后,将该图像归入相似度最高的图像集合中。其中,各个图像集合中代表图像的个数可以相同,也可以不同。并且,各个图像集合中的代表图像可以更新。例如,计算机设备基于图像的质量评分来选定代表图像,如果新归入的图像的质量评分更高,则计算机设备将新归入的图像作为一张代表图像。其中,图像的质量评分可以基于前述实施例中图像的结构化属性中的清晰度评分、正面程度评分、可见性评分和人脸质量评分中的一个或多个确定。

需要说明的是,以上以确定目标对象之间的相似度之后基于相似度对图像进行聚类为例对相似度的后续应用作了一个示例性地介绍,上述示例并不用于限定本申请实施例。

综上所述,在本申请实施例中,对于均存在目标对象的两张图像来说,确定这两张图像之间的图像相似度,以及确定转移概率,转移概率为一个目标对象在参考时长内从第二相机的拍摄视野转移到第一相机的拍摄视野的概率,从而基于图像相似度和转移概率,确定这两张图像中存在的目标对象之间的相似度。其中,转移概率是一种时空特征,而非图像中的特征。也即是,本方案不仅依据图像中的特征,还依据时空特征来确定相似度,因而即使在图像质量较低的情况下所确定的相似度的准确性较高。

上述所有可选技术方案,均可按照任意结合形成本申请的可选实施例,本申请实施例对此不再一一赘述。

图4是本申请实施例提供的一种相似度确定装置400的结构示意图,该相似度确定装置400可以由软件、硬件或者两者的结合实现成为计算机设备的部分或者全部。请参考图4,该装置400包括:第一确定模块401、第二确定模块402和第三确定模块403。

第一确定模块401,用于确定第一图像与第二图像之间的图像相似度,第一图像中存在第一目标对象,第二图像中存在第二目标对象,第一图像通过第一相机拍摄得到,第二图像通过第二相机拍摄得到;

第二确定模块402,用于确定转移概率,转移概率为第一目标对象在参考时长内从第二相机的拍摄视野转移到第一相机的拍摄视野的概率;

第三确定模块403,用于基于图像相似度和转移概率,确定第一目标对象与第二目标对象之间的相似度。

可选地,第二确定模块402包括:

第一确定子模块,用于确定第一拍摄时间与第二拍摄时间之间的时间差,第一拍摄时间为第一图像的拍摄时间,第二拍摄时间为第二图像的拍摄时间;

第二确定子模块,用于从多个时长范围中确定时间差所处的时长范围;

第一处理子模块,用于将时间差所处的时长范围的标记值输入指定概率分布模型中,得到指定概率分布模型输出的转移概率,标记值用于指示相应的时长范围。

可选地,该装置400还包括:

第四确定模块,用于根据第一相机的标识和第二相机的标识,从多个概率分布模型中确定指定概率分布模型;

其中,指定概率分布模型对应参考相机对,参考相机对包括第一相机和第二相机,概率分布模型表征同一目标对象在对应的一个相机对所包括的两个相机之间转移的时间概率分布,不同的概率分布模型对应不同的相机对。

可选地,该装置400还包括:

第一获取模块,用于获取多个相机对中各个相机对分别对应的多个观测样本对,每个观测样本对包括由相应相机对拍摄且存在同一目标对象的两个观测图像的拍摄时间;

第五确定模块,用于基于各个相机对分别对应的多个观测样本对所包括的拍摄时间,确定相应相机对对应的多个时间差;

统计模块,用于统计各个相机对分别对应的多个时间差中位于多个时长范围中每个时长范围内的时间差的个数,得到相应相机对对应的多个统计频数;

第六确定模块,用于基于各个相机对分别对应的多个统计频数,以及多个时间范围的标记值,确定相应相机对对应的概率分布模型。

可选地,第三确定模块403包括:

第三确定子模块,用于基于图像相似度和转移概率,确定综合特征向量;

第二处理子模块,用于将综合特征向量输入图像分类模型中,得到图像分类模型输出的第一目标对象与第二目标对象之间的相似度。

可选地,第三确定模块403还包括:

第一获取子模块,用于获取第一属性信息和第二属性信息,第一属性信息表征第一目标对象的属性,第二属性信息表征第二目标对象的属性;

第四确定子模块,用于基于第一属性信息和第二属性信息,确定属性特征向量,属性特征向量表征第一目标对象与第二目标对象之间的属性相似度;

第三确定子模块具体用于:

基于图像相似度、属性特征向量和转移概率,确定综合特征向量。

可选地,第三确定模块403还包括:

第二获取子模块,用于获取第一相机与第二相机之间的距离,以及第一拍摄时间与第二拍摄时间之间的时间差;

第五确定子模块,用于基于距离和时间差,确定第一目标对象的移动速度;

第三确定子模块具体用于:

将图像相似度、属性特征向量、转移概率、距离、时间差和移动速度进行组合,得到综合特征向量。

可选地,该装置400还包括:

第二获取模块,用于获取训练样本集,训练样本集包括多个正样本和多个负样本,每个正样本包括存在同一目标对象的两个样本图像,每个负样本包括存在不同目标对象的两个样本图像,训练样本集还包括拍摄样本图像的相机的标识和拍摄时间;

第七确定模块,用于基于多个正样本和多个负样本中所包括的样本图像,确定多个样本图像相似度;

第八确定模块,用于基于多个正样本和多个负样本中所包括的相机的标识和拍摄时间,以及多个概率分布模型,确定多个样本转移概率;

第九确定模块,用于基于多个样本图像相似度和多个样本转移概率,确定多个样本综合特征向量;

处理模块,用于通过多个样本综合特征向量训练初始分类模型,得到图像分类模型。

可选地,该装置400还包括:

触发模块,用于如果图像相似度大于第一阈值且小于第二阈值,则触发第二确定模块执行确定转移概率的步骤。

在本申请实施例中,对于均存在目标对象的两张图像来说,确定这两张图像之间的图像相似度,以及确定转移概率,转移概率为一个目标对象在参考时长内从第二相机的拍摄视野转移到第一相机的拍摄视野的概率,从而基于图像相似度和转移概率,确定这两张图像中存在的目标对象之间的相似度。其中,转移概率是一种时空特征,而非图像中的特征。也即是,本方案不仅依据图像中的特征,还依据时空特征来确定相似度,因而即使在图像质量较低的情况下所确定的相似度的准确性较高。

需要说明的是:上述实施例提供的相似度确定装置在确定相似度时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的相似度确定装置与相似度确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图5是本申请实施例提供的一种服务器的结构示意图。该服务器可以是上述实施例中的计算机设备,以用于执行本申请实施例提供的相似度确定方法。服务器500包括中央处理单元(CPU)501、包括随机存取存储器(RAM)502和只读存储器(ROM)503的系统存储器504,以及连接系统存储器504和中央处理单元501的系统总线505。服务器500还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)506,和用于存储操作系统513、应用程序514和其他程序模块515的大容量存储设备507。

基本输入/输出系统506包括有用于显示信息的显示器508和用于用户输入信息的诸如鼠标、键盘之类的输入设备509。其中显示器508和输入设备509都通过连接到系统总线505的输入输出控制器510连接到中央处理单元501。基本输入/输出系统506还可以包括输入输出控制器510以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器510还提供输出到显示屏、打印机或其他类型的输出设备。

大容量存储设备507通过连接到系统总线505的大容量存储控制器(未示出)连接到中央处理单元501。大容量存储设备507及其相关联的计算机可读介质为服务器500提供非易失性存储。也就是说,大容量存储设备507可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。

不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器504和大容量存储设备507可以统称为存储器。

根据本申请的各种实施例,服务器500还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器500可以通过连接在系统总线505上的网络接口单元511连接到网络512,或者说,也可以使用网络接口单元511来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。

在一些实施例中,还提供了一种计算机可读存储介质,该存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中相似度确定方法的步骤。例如,所述计算机可读存储介质可以是ROM、RAM、CD-ROM、磁带、软盘和光数据存储设备等。

值得注意的是,本申请实施例提到的计算机可读存储介质可以为非易失性存储介质,换句话说,可以是非瞬时性存储介质。

应当理解的是,实现上述实施例的全部或部分步骤可以通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。所述计算机指令可以存储在上述计算机可读存储介质中。

也即是,在一些实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述所述的相似度确定方法的步骤。

应当理解的是,本文提及的“至少一个”是指一个或多个,“多个”是指两个或两个以上。在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。

以上所述为本申请提供的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

26页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基础设施建设移动式智能巡查装备及智能管理方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!