一种数据聚合方法、装置、设备及计算机可读存储介质

文档序号:1952030 发布日期:2021-12-10 浏览:2次 >En<

阅读说明:本技术 一种数据聚合方法、装置、设备及计算机可读存储介质 (Data aggregation method, device, equipment and computer readable storage medium ) 是由 任磊 武模仁 何文龙 于 2021-06-30 设计创作,主要内容包括:本发明公开了一种数据聚合方法、装置、设备及计算机可读存储介质,在多版本功能开启的情况下,本申请中的数据聚合方法对于接收到的存储容量小于预设阈值的目标数据,可以在将其本体数据聚合至对应的聚合数据的基础上,将该目标数据的版本号以及该目标数据的本体数据在聚合数据中的位置打包放在聚合数据的位图信息中,并且在目标数据的元数据中添加了聚合数据的身份信息,即使存在重名的目标数据,由于每个目标数据的版本号的唯一性,用户也可以根据目标数据的版本号快捷准确地找到目标数据中本体数据的具体位置,也即本申请可以识别不同版本号的重名目标数据,从而不再对重名数据进行覆盖存储,降低了数据丢失的风险,提升了用户体验。(The invention discloses a data aggregation method, a device, equipment and a computer readable storage medium, under the condition that a multi-version function is started, the data aggregation method in the application can pack the version number of target data and the position of the body data of the target data in aggregated data into bitmap information of the aggregated data on the basis of aggregating the body data of the received target data with the storage capacity smaller than a preset threshold value to the corresponding aggregated data, and adds the identity information of the aggregated data in the metadata of the target data, even if the renamed target data exists, a user can quickly and accurately find the specific position of the body data in the target data according to the version number of the target data due to the uniqueness of the version number of each target data, namely the application can identify the renamed target data with different version numbers, therefore, the duplicate name data is not stored in a covering mode, the risk of data loss is reduced, and the user experience is improved.)

一种数据聚合方法、装置、设备及计算机可读存储介质

技术领域

本发明涉及分布式存储系统领域,特别是涉及一种数据聚合方法,本发明还涉及一种数据聚合方法、装置、设备及计算机可读存储介质。

背景技术

在分布式存储系统中,为了提高存储空间利用率,可以利用聚合功能将存储容量较小的多个目标数据聚合到一个存储容量较大的聚合数据中,然后对聚合数据进行存储,但是在分布式存储系统中的多版本功能开启的情况下,用户可以创建多个相同名称的数据,这种情况下,若多个相同名称的目标数据在聚合过程中被聚合至一个聚合数据中,那么在聚合过程中,聚合顺序靠后的目标数据会覆盖聚合数据中已存在的且与自身名称相同的目标数据,从而导致数据的丢失,降低了用户体验。

因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。

发明内容

本发明的目的是提供一种数据聚合方法,在聚合过程中不再对重名数据进行覆盖存储,降低了数据丢失的风险,提升了用户体验;本发明的另一目的是提供一种数据聚合方法、装置、设备及计算机可读存储介质,在聚合过程中不再对重名数据进行覆盖存储,降低了数据丢失的风险,提升了用户体验。

为解决上述技术问题,本发明提供了一种数据聚合方法,包括:

在接收到存储容量小于预设阈值的目标数据时,将所述目标数据的本体数据聚合至所述目标数据对应的聚合数据;

判断分布式存储系统的多版本功能是否开启;

若是,则将所述目标数据的本体数据在所述聚合数据中的位置以及所述目标数据的版本号整合为结构体形式并添加至所述聚合数据的位图信息,以便通过所述版本号在所述位图信息寻找所述本体数据在所述聚合数据中的具体位置;

在所述目标数据的元数据中添加所述聚合数据的身份信息,以便通过所述身份信息确定所述目标数据的本体数据所在的聚合数据;

其中,所述聚合数据的存储容量大于所述预设阈值。

优选地,所述判断分布式存储系统的多版本功能是否开启之后,该数据聚合方法还包括:

若否,则将所述目标数据的本体数据在所述聚合数据中的位置添加至所述位图信息并执行所述在所述目标数据的元数据中添加所述聚合数据的身份信息的步骤。

优选地,所述判断分布式存储系统的多版本功能是否开启具体为:

判断所述目标数据的元数据中是否存在版本号;

若是,则判定分布式存储系统的多版本功能已开启。

优选地,该数据聚合方法还包括:

响应于参数修改指令,根据所述参数修改指令对所述预设阈值进行修改。

优选地,所述聚合数据的身份信息具体为名称、创建日期以及存储位置中的至少一者。

优选地,所述分布式存储系统为分布式对象存储系统。

优选地,该数据聚合方法还包括:

响应于删除指令,根据所述删除指令中指定的所述目标数据的身份信息确定出所述目标数据的元数据;

根据确定出的所述元数据中的所述聚合数据的身份信息,确定所述删除指令中指定的所述目标数据的本体数据所在的所述聚合数据;

根据确定出的所述元数据中的版本号,在确定出的所述聚合数据的位图信息中寻找所述删除指令中指定的所述目标数据的本体数据在所述聚合数据中的位置;

根据寻找到的位置在确定出的所述聚合数据中定位所述删除指令中指定的所述目标数据的本体数据并将其删除;

将确定出的所述目标数据的元数据删除;

将确定出的所述聚合数据的位图信息中,寻找到的位置所对应的结构体形式的数据删除。

为解决上述技术问题,本发明还提供了一种数据聚合装置,包括:

聚合模块,用于在接收到存储容量小于预设阈值的目标数据时,将所述目标数据的本体数据聚合至所述目标数据对应的聚合数据;

判断模块,用于判断分布式存储系统的多版本功能是否开启,若是,则触发更新模块;

所述更新模块,用于将所述目标数据的本体数据在所述聚合数据中的位置以及所述目标数据的版本号整合为结构体形式并添加至所述聚合数据的位图信息,以便通过所述版本号在所述位图信息寻找所述本体数据在所述聚合数据中的具体位置;

添加模块,用于在所述目标数据的元数据中添加所述聚合数据的身份信息,以便通过所述身份信息确定所述目标数据的本体数据所在的聚合数据;

其中,所述聚合数据的存储容量大于所述预设阈值。

为解决上述技术问题,本发明还提供了一种数据聚合设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如上所述数据聚合方法的步骤。

为解决上述技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述数据聚合方法的步骤。

本发明提供了一种数据聚合方法,在多版本功能开启的情况下,本申请中的数据聚合方法对于接收到的存储容量小于预设阈值的目标数据,可以在将其本体数据聚合至对应的聚合数据的基础上,将该目标数据的版本号以及该目标数据的本体数据在聚合数据中的位置打包放在聚合数据的位图信息中,并且在目标数据的元数据中添加了聚合数据的身份信息,即使存在重名的目标数据,由于每个目标数据的版本号的唯一性,用户也可以根据目标数据的版本号快捷准确地找到目标数据中本体数据的具体位置,也即本申请可以识别不同版本号的重名目标数据,从而不再对重名数据进行覆盖存储,降低了数据丢失的风险,提升了用户体验。

本发明还提供了一种数据聚合装置、设备及计算机可读存储介质,具有如上数据聚合方法相同的有益效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明提供的一种数据聚合方法的流程示意图;

图2为本发明提供的一种数据聚合装置的结构示意图;

图3为本发明提供的一种数据聚合设备的结构示意图。

具体实施方式

本发明的核心是提供一种数据聚合方法,在聚合过程中不再对重名数据进行覆盖存储,降低了数据丢失的风险,提升了用户体验;本发明的另一核心是提供一种数据聚合方法、装置、设备及计算机可读存储介质,在聚合过程中不再对重名数据进行覆盖存储,降低了数据丢失的风险,提升了用户体验。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参考图1,图1为本发明提供的一种数据聚合方法的流程示意图,该数据聚合方法包括:

S101:在接收到存储容量小于预设阈值的目标数据时,将目标数据的本体数据聚合至目标数据对应的聚合数据;

具体的,考虑到如上背景技术中的技术问题,本发明欲对开启多版本功能下的分布式存储系统中的各个小数据(存储容量小于预设阈值的数据)聚合至聚合数据中,并且在此过程中对于同名数据不进行覆盖操作,防止数据丢失,因此步骤中首先要在接收到存储容量小于预设阈值的目标数据时,将目标数据的本体数据聚合至目标数据对应的聚合数据,也即不管之前是否有名称重复的数据,均将目标数据的本体数据聚合,从而实现了所有小数据的聚合,具体的区分措施在后续步骤中体现。

S102:判断分布式存储系统的多版本功能是否开启;

具体的,考虑到在多版本功能开启的情况下可能存在多个名称相同的数据,相应的处理方式是存在区别的,因此本步骤中需要判断分布式存储系统的多版本功能是否开启,以便通过判断结果触发后续的动作。

S103:若是,则将目标数据的本体数据在聚合数据中的位置以及目标数据的版本号整合为结构体形式并添加至聚合数据的位图信息,以便通过版本号在位图信息寻找本体数据在聚合数据中的具体位置;

具体的,在多版本功能开启的情况下,本申请中欲通过每个目标数据各自唯一的版本号(也即ID)对各个目标数据进行区分,理论上来说从位图信息中找到目标数据的位置便可以根据位置找到目标数据的本体数据在聚合数据中的位置,但是假设该位图信息中存在多个名称相同的小数据,此时便无法通过名称来寻找位图信息“位置”中的位置数据,因此本步骤中将目标数据的“位置”数据与其唯一的版本号整合为结构体形式并添加至聚合数据的位图信息中,如此一来,只需要通过目标数据的版本号便可以在位图信息中找到与版本号绑定在一起的目标数据的本体数据的“位置”数据,从而最终能够利用“位置”数据在聚合数据中找到本体数据。

S104:在目标数据的元数据中添加聚合数据的身份信息,以便通过身份信息确定目标数据的本体数据所在的聚合数据;

其中,聚合数据的存储容量大于预设阈值。

具体的,在用户查找目标数据的过程中,需要首先通过目标数据的身份信息查找到元数据,当发现元数据中的聚合数据的身份信息后,便可以通过聚合数据的身份信息找到对应的聚合数据的位图信息,最后再通过目标数据的元数据中的版本号从位图信息中确定出“位置”数据,即可最终在聚合数据中找到目标数据的本体数据。

本发明提供了一种数据聚合方法,在多版本功能开启的情况下,本申请中的数据聚合方法对于接收到的存储容量小于预设阈值的目标数据,可以在将其本体数据聚合至对应的聚合数据的基础上,将该目标数据的版本号以及该目标数据的本体数据在聚合数据中的位置打包放在聚合数据的位图信息中,并且在目标数据的元数据中添加了聚合数据的身份信息,即使存在重名的目标数据,由于每个目标数据的版本号的唯一性,用户也可以根据目标数据的版本号快捷准确地找到目标数据中本体数据的具体位置,也即本申请可以识别不同版本号的重名目标数据,从而不再对重名数据进行覆盖存储,降低了数据丢失的风险,提升了用户体验。

在上述实施例的基础上:

作为一种优选的实施例,判断分布式存储系统的多版本功能是否开启之后,该数据聚合方法还包括:

若否,则将目标数据的本体数据在聚合数据中的位置添加至位图信息并执行在目标数据的元数据中添加聚合数据的身份信息的步骤。

具体的,在多版本功能未开启的情况下,证明分布式系统中不存在新上传的同名称的目标数据,因此无需考虑可能覆盖之前名称相同的目标数据的情况,此时可以直接将目标数据的本体数据在聚合数据中的位置添加至位图信息并执行在目标数据的元数据中添加聚合数据的身份信息的步骤,后续在查找过程中通过目标数据的元数据中的名称便可以从位图信息中找到唯一的目标数据的“位置”数据,无需通过版本号在此进行区分。

作为一种优选的实施例,判断分布式存储系统的多版本功能是否开启具体为:

判断目标数据的元数据中是否存在版本号;

若是,则判定分布式存储系统的多版本功能已开启。

具体的,此种判断方式较为简单快捷且准确。

当然,除了该种判断方式外,还可以以“判断目标数据对应的存储桶内的配置参数是否将多版本功能配置为开启”的方式来判断,本发明实施例在此不做限定。

作为一种优选的实施例,该数据聚合方法还包括:

响应于参数修改指令,根据参数修改指令对预设阈值进行修改。

具体的,为了方便用户自主对预设阈值进行修改,本发明实施例中开放了修改接口,用户可以通过参数修改指令来对预设阈值进行修改,提高了工作效率以及用户体验。

其中,预设阈值可以为多种数据,例如可以为512kb等,本发明实施例在此不做限定。

具体的,聚合数据的大小也可以进行自主设定,例如可以为设置为4MB等,本发明实施例在此不做限定。

其中,参数修改指令可以为用户通过人机交互装置发送的,人机交互装置具体可以为多种类型,例如可以为移动终端等,本发明实施例在此不做限定。

作为一种优选的实施例,聚合数据的身份信息具体为名称、创建日期以及存储位置中的至少一者。

具体的,名称、创建日期以及存储位置中的至少一者可以准确地查找到聚合数据,并且数据量小。

当然,除了名称、创建日期以及存储位置中的至少一者外,聚合数据的身份信息还可以为其他多种类型,本发明实施例在此不做限定。

作为一种优选的实施例,分布式存储系统为分布式对象存储系统。

具体的,分布式对象存储系统具有使用广泛的特点。

当然,除了分布式对象存储系统外,分布式存储系统还可以为其他类型,例如分布式文件存储系统等,本发明实施例在此不做限定。

作为一种优选的实施例,该数据聚合方法还包括:

响应于删除指令,根据删除指令中指定的目标数据的身份信息确定出目标数据的元数据;

根据确定出的元数据中的聚合数据的身份信息,确定删除指令中指定的目标数据的本体数据所在的聚合数据;

根据确定出的元数据中的版本号,在确定出的聚合数据的位图信息中寻找删除指令中指定的目标数据的本体数据在聚合数据中的位置;

根据寻找到的位置在确定出的聚合数据中定位删除指令中指定的目标数据的本体数据并将其删除;

将确定出的目标数据的元数据删除;

将确定出的聚合数据的位图信息中,寻找到的位置所对应的结构体形式的数据删除。

具体的,在进行目标数据删除的时候,同样需要先查找到目标数据,这个过程在之前已经介绍过,本发明实施例在此不再赘述,在查找到目标数据的本体数据之后可以直接将本体数据删除,同时可以将其残留的元数据以及位图信息中的结构体形式的数据删除,从而实现彻底的删除,降低了空间占用,提升了用户体验。

请参考图2,图2为本发明提供的一种数据聚合装置的结构示意图,该数据聚合装置包括:

聚合模块21,用于在接收到存储容量小于预设阈值的目标数据时,将目标数据的本体数据聚合至目标数据对应的聚合数据;

判断模块22,用于判断分布式存储系统的多版本功能是否开启,若是,则触发更新模块23;

更新模块23,用于将目标数据的本体数据在聚合数据中的位置以及目标数据的版本号整合为结构体形式并添加至聚合数据的位图信息,以便通过版本号在位图信息寻找本体数据在聚合数据中的具体位置;

添加模块24,用于在目标数据的元数据中添加聚合数据的身份信息,以便通过身份信息确定目标数据的本体数据所在的聚合数据;

其中,聚合数据的存储容量大于预设阈值。

对于本发明实施例提供的数据聚合装置的介绍请参照前述的数据聚合方法的实施例,本发明实施例在此不再赘述。

请参考图3,图3为本发明提供的一种数据聚合设备的结构示意图,该数据聚合设备包括:

存储器31,用于存储计算机程序;

处理器32,用于执行计算机程序时实现如前述实施例中数据聚合方法的步骤。

对于本发明实施例提供的数据聚合设备的介绍请参照前述的数据聚合方法的实施例,本发明实施例在此不再赘述。

本发明还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如前述实施例中数据聚合方法的步骤。

对于本发明实施例提供的计算机可读存储介质的介绍请参照前述的数据聚合方法的实施例,本发明实施例在此不再赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。还需要说明的是,在本说明书中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种信息确定方法、第一存储服务器及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类