时序数据库集群及其故障处理、操作方法、及装置

文档序号:1952393 发布日期:2021-12-10 浏览:7次 >En<

阅读说明:本技术 时序数据库集群及其故障处理、操作方法、及装置 (Time sequence database cluster and fault processing and operating method and device thereof ) 是由 杨冠飞 于 2021-08-17 设计创作,主要内容包括:本申请涉及一种时序数据库集群及其故障处理方法、操作方法、及装置,时序数据库集群包括:至少一个元数据节点、多个数据节点;多个数据节点互为副本;元数据节点用于存储元数据,元数据至少包括数据节点的主机名;方法包括:当检测到任一数据节点发生故障时,新建虚拟节点;将发生故障的数据节点的配置文件拷贝至虚拟节点,并将发生故障的数据节点的数据盘挂载至虚拟节点;在时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为虚拟节点的IP地址,使得虚拟节点替代发生故障的数据节点提供数据服务。由此可以实现当时序数据库集群中任一数据节点发生故障,进行故障转移,且无需修改元数据,使得时序数据库集群高可用。(The application relates to a time sequence database cluster and a fault processing method, an operation method and a device thereof, wherein the time sequence database cluster comprises: at least one metadata node, a plurality of data nodes; the data nodes are copies of each other; the metadata node is used for storing metadata, and the metadata at least comprises a host name of the data node; the method comprises the following steps: when any data node is detected to be out of order, a virtual node is newly established; copying a configuration file of the failed data node to the virtual node, and mounting a data disk of the failed data node to the virtual node; and updating the IP address in the target mapping relation into the IP address of the virtual node in the host name mapping file of the time sequence database cluster, so that the virtual node replaces the failed data node to provide data service. Therefore, when any data node in the time sequence database cluster fails, the fault transfer can be carried out, and the metadata does not need to be modified, so that the time sequence database cluster is highly available.)

时序数据库集群及其故障处理、操作方法、及装置

技术领域

本申请涉及时序数据库领域,尤其涉及一种时序数据库集群及其故障处理方法、操作方法、及装置。

背景技术

时序数据指时间序列数据(Time Series Data,简称时序数据),是将同一指标的数据按时间顺序记录的数据列,普遍存在于IT基础设施、运维监控系统和物联网中。相应的,时序数据库是一种特定类型的数据库,主要用来存储时序数据。

在实践中,实现一个时序数据库集群方案是一项非常复杂的工作,至少需要实现高可用的目标,也即,当集群中的数据节点发生故障时,集群具备自愈能力。

发明内容

本申请提供了一种时序数据库集群及其故障处理方法、操作方法、及装置,以提高时序数据库集群的可靠性、稳定性。

第一方面,本申请提供了一种时序数据库集群的故障处理方法,所述时序数据库集群包括:至少一个元数据节点、多个数据节点;所述数据节点用于存储时序数据,且多个所述数据节点互为副本;所述元数据节点用于存储所述时序数据库集群的元数据,所述元数据至少包括每一个所述数据节点的主机名;所述方法包括:

当检测到任一所述数据节点发生故障时,新建虚拟节点;

将发生故障的所述数据节点的配置文件拷贝至所述虚拟节点,并将发生故障的所述数据节点的数据盘挂载至所述虚拟节点;

在所述时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为所述虚拟节点的IP地址,所述目标映射关系指发生故障的所述数据节点对应的映射关系;

重启所述时序数据库集群,以使所述虚拟节点替代发生故障的所述数据节点提供数据服务。

在一可能的实现方式中,所述时序数据库集群还包括探活组件,所述探活组件用于周期性地向各所述数据节点发送探活报文;

所述检测到任一所述数据节点发生故障,包括:

针对每一所述数据节点,若在当前的超时时间内,未接收到所述数据节点基于所述探活报文返回的应答报文,则确定所述数据节点故障,所述当前的超时时间指:以所述探活组件最近一次发送所述探活报文的时间为起始时刻,以设定时长为时长的时间段;或者,

针对每一所述数据节点,若在设定周期到达时,未接收到所述数据节点发送的心跳报文,则确定所述数据节点故障。

第二方面,本申请提供了一种时序数据库集群的操作方法,应用于第一方面任一项所述的时序数据库集群,所述方法包括:

当接收到数据操作请求时,从所述时序数据库集群中确定待操作的目标数据节点;

从所述元数据中获取所述目标数据节点的主机名;

从所述主机名映射文件中确定与获取到的所述主机名对应的目标IP地址;

基于所述目标IP地址,在所述目标数据节点上对待操作的目标时序数据执行与所述数据操作请求对应的数据操作。

在一可能的实现方式中,所述从所述时序数据库集群中确定待操作的目标数据节点,包括:

基于所述目标时序数据的时间戳,确定所述目标时序数据所属的目标shardgroup,其中,所述时间戳位于所述目标shardgroup的起始时间和结束时间组成的时间范围内;

确定所述目标shardgroup包含的所有shard;

将与所述shard绑定的所述数据节点确定为待操作的数据节点。

第三方面,本申请提供了一种时序数据库集群,所述时序数据库集群至少包括:至少一个元数据节点、多个数据节点、探活组件以及虚拟节点创建组件;

所述数据节点,用于存储时序数据,且多个所述数据节点互为副本;

所述元数据节点,用于存储所述时序数据库集群的元数据,所述元数据至少包括每一个所述数据节点的主机名;

所述探活组件,用于检测所述数据节点的状态,所述状态包括正常和故障;

所述虚拟节点创建组件,用于当所述探活组件检测到任一所述数据节点发生故障时,新建虚拟节点;将发生故障的所述数据节点的配置文件拷贝至所述虚拟节点,并将发生故障的所述数据节点的数据盘挂载至所述虚拟节点;在所述时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为所述虚拟节点的IP地址,所述目标映射关系指发生故障的所述数据节点对应的映射关系;以及重启所述时序数据库集群,以使所述虚拟节点替代发生故障的所述数据节点提供数据服务。

在一可能的实现方式中,所述数据盘为云盘。

第四方面,本申请提供了一种时序数据库集群的故障处理装置,所述时序数据库集群包括:至少一个元数据节点、多个数据节点;所述数据节点用于存储时序数据,且多个所述数据节点互为副本;所述元数据节点用于存储所述时序数据库集群的元数据,所述元数据至少包括每一个所述数据节点的主机名;所述装置包括:

节点新建模块,用于当检测到任一所述数据节点发生故障时,新建虚拟节点;

节点配置模块,用于将发生故障的所述数据节点的配置文件拷贝至所述虚拟节点,并将发生故障的所述数据节点的数据盘挂载至所述虚拟节点;

映射模块,用于在所述时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为所述虚拟节点的IP地址,所述目标映射关系指发生故障的所述数据节点对应的映射关系;

重启模块,用于重启所述时序数据库集群,以使所述虚拟节点替代发生故障的所述数据节点提供数据服务。

第五方面,本申请提供了一种时序数据库集群的操作装置,应用于第三方面任一项所述的时序数据库集群,所述装置包括:

目标确定模块,用于当接收到数据操作请求时,从所述时序数据库集群中确定待操作的目标数据节点;

第一获取模块,用于从所述元数据中获取所述目标数据节点的主机名;

第二获取模块,用于从所述主机名映射文件中确定与获取到的所述主机名对应的目标IP地址;

数据操作模块,用于基于所述目标IP地址,在所述目标数据节点上对待操作的目标时序数据执行与所述数据操作请求对应的数据操作。

第六方面,本申请提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现第一方面任一项所述的方法的步骤。

第七方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一项所述的方法的步骤。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点:

本发明实施例提供的技术方案,通过在时序数据库集群中设置多个数据节点,在检测到任一数据节点发生故障,新建虚拟节点,将发生故障的数据节点的配置文件拷贝至虚拟节点,并将发生故障的数据节点的数据盘挂载至虚拟节点,使得新建的虚拟节点能够替代发生故障的原数据节点提供数据服务,从而实现故障迁移,使得时序数据库集群高可用;进一步的,由于在建立时序数据库集群时,使用主机名来配置参与创建集群的节点,以及故障迁移后,新建虚拟节点的主机名沿用原数据节点的主机名,因此可以实现在上述故障迁移时,无需对时序数据库集群的元数据做出更改,从而能够提高时序数据库集群故障迁移的效率,且由于时序数据库集群的元数据保持稳定,因此,能够提高时序数据库集群的可靠性、稳定性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种时序数据库集群的架构示意图;

图2为本申请实施例提供的一种时序数据库集群的故障处理方法的流程示意图;

图3为本申请实施例提供的一种时序数据库集群的操作方法的流程示意图;

图4为本申请实施例提供的一种时序数据库集群的故障处理装置的示意图;

图5为本申请实施例提供的一种时序数据库集群的操作装置的示意图;

图6为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请实施例提供的一种时序数据库集群的架构示意图。如图1所示的时序数据库集群10中包括元数据节点101、数据节点102~104、探活组件105,以及虚拟节点创建组件106。

其中,元数据节点101用于存储时序数据库集群的元数据,这里,元数据可包括但不限于:元数据节点信息、数据节点信息、时序数据库信息等。本申请实施例中,节点信息至少包括节点的主机名,可选的,还可包括节点的IP地址、别名等。这也就意味着,本申请实施例中,在建立图1所示例的时序数据库集群10时,参与创建集群的节点,至少是通过主机名来配置的。例如,如下所示,为数据节点配置文件的示例:

hostname="cluster.influxdb.238"

[clusterx]

#cluster node

#joins="10.69.58.54:8091,10.69.32.214:8091,10.69.32.51:8091"

joins="cluster.influxdb.54:8091,cluster.influxdb.214:8091,cluster.influxdb.51:8091"

上述配置文件中,hostname为数据节点的主机名,joins为时序数据库集群10中,除主机名为“cluster.influxdb.238”的数据节点以外,其他三个节点的节点信息,可包括主机名和IP地址。

进一步的,时序数据库集群还具有主机名映射文件。主机名映射文件也称/etc/host文件,是一个负责IP地址与主机名(或者域名)快速解析的文件,以ASCII格式保存在/etc/目录下。主机名映射文件包含了IP地址与主机名之间的映射,还可包括主机的别名,对时序数据库集群的访问,都通过查询主机名映射文件来解析得到对应与某个主机名的IP地址,从而实现快速方便的访问。例如,如下所示,为主机名映射文件的示例:

10.69.58.54cluster.influxdb.54

10.69.32.214cluster.influxdb.214

10.69.32.51cluster.influxdb.51

10.69.32.238cluster.influxdb.238

数据节点102~104互为副本,都用于存储时序数据。可以理解的是,图1所示例的时序数据库集群通过采用多副本的形式存储时序数据,可以提高数据可靠性,进一步提高时序数据库集群的稳定性、可靠性。

进一步的,数据节点通过挂载数据盘提供时序数据存储服务。可选的,该数据盘为云盘。可以理解的是,通过设置数据盘为云盘,可以大大降低数据节点本地的存储空间。

需要说明的是,在实践中,时序数据库集群可包括至少一个元数据节点,多个数据节点,图1中仅以包括一个元数据节点,三个数据节点为例。以及,元数据节点和数据节点可为同一节点,也即,节点既用于存储时序数据,也用于存储时序数据库集群的元数据,图1中仅以元数据节点和数据节点相独立为例。此外,在时序数据库集群包括两个或两个以上的元数据节点时,两个或两个以上的元数据节点互为备份,通过该种设置,可以提高元数据可靠性,进一步提高时序数据库集群的稳定性、可靠性。

探活组件105,用于检测时序数据库集群中节点的状态,本申请实施例中主要检测数据节点的状态,这里,节点的状态包括正常和故障。至于探活组件105是如何检测节点状态的,在下文图2所示实施例中具有详细说明,这里先不详述。

虚拟节点创建组件106,用于在探活组件105检测到任一数据节点发生故障时,新建虚拟节点,并使得新建的虚拟节点能够替代发生故障的原数据节点提供数据服务。这里,数据服务包括但不限于:数据存储服务、数据查询服务等。

作为一个可选的实现方式,虚拟节点创建组件106具体可为Trove组件,至于虚拟节点创建组件106是如何使得新建的虚拟节点能够替代发生故障的原数据节点提供数据服务的,在下文图2所示实施例中具有详细说明,这里先不详述。

图2为本申请实施例提供的一种时序数据库集群的故障处理方法的流程示意图,这里所说的时序数据库集群可以是图1所示例的时序数据库集群10。如图2所示,包括以下步骤:

步骤201、当检测到任一数据节点发生故障时,新建虚拟节点。

作为一个实施例,在图1所示例的集群架构中,探活组件105可周期性地向每一个数据节点发送探活报文,正常情况下,数据节点接收到探活报文后,可向探活组件105返回应答报文。基于此,若探活组件105在当前的超时时间内,接收到数据节点基于探活报文返回的应答报文,则可确定该数据节点正常;反之,若探活组件105在当前的超时时间内,未接收到数据节点基于探活报文返回的应答报文,则可确定该数据节点故障。这里,当前的超时时间是指:以探活组件最近一次发送探活报文的时间为起始时刻,以设定时长(例如1秒)为时长的时间段。

作为另一个实施例,每一数据节点可按照设定周期,向探活组件105发送心跳报文,也即,在正常情况下,数据节点可周期性地向探活组件105发送心跳报文,相应的,正常情况下,探活组件105可每隔该设定周期,则接收到各数据节点发送的心跳报文。基于此,若探活组件105在设定周期到达时,接收到数据节点发送的心跳报文,则可确定该数据节点正常;反之,若探活组件105在设定周期到达时,未接收到数据节点发送的心跳报文,则可确定该数据节点故障。

此外,需要说明的是,探活组件105上维护有时序数据库集群中每一数据节点的节点信息,例如主机名、IP地址等,基于此,探活组件105能够向每一数据节点发送探活报文,进而根据接收到的应答报文确定每一数据节点的状态,或者,能够根据接收到心跳报文确定每一数据节点的状态。

本申请实施例中,当检测到任一数据节点发生故障时,可针对发生故障的数据节点新建虚拟节点,以使得新建的虚拟节点能够替代发生故障的数据节点来提供数据服务。此处需要注意的是,新建的虚拟节点的数量大于等于发生故障的数据节点的数量,也就是说,针对每一发生故障的数据节点,至少新建一个虚拟节点。

步骤202、将发生故障的数据节点的配置文件拷贝至虚拟节点,并将发生故障的数据节点的数据盘挂载至虚拟节点。

本申请实施例中,在针对发生故障的数据节点新建虚拟节点之后,将发生故障的数据节点的配置文件拷贝至虚拟节点,以使新建的虚拟节点沿用原数据节点的配置文件,以及,将发生故障的数据节点的数据盘挂载至虚拟节点。此处需要注意的是,新建的虚拟节点沿用原数据节点的配置文件,也就意味着,新建的虚拟节点沿用原数据节点的主机名。

例如,在图1所示集群架构中,假设数据节点102发生故障,新建虚拟节点102’,将数据节点102的配置文件拷贝至虚拟节点102’,并将数据节点102挂载的云盘挂载至虚拟节点102’。通过该种处理,则相当于将原数据节点102上的时序数据迁移至新建的虚拟节点102’。

步骤203、在时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为虚拟节点的IP地址,目标映射关系指发生故障的数据节点对应的映射关系。

可以理解的是,新建虚拟节点的IP地址与发生故障的原数据节点的IP地址是不同的,因此,为使新建的虚拟节点能够替代发生故障的原数据节点,在时序数据库集群的主机名映射文件中,将发生故障的数据节点对应的映射关系(以下称目标对应关系)中的IP地址更新为新建的虚拟节点的IP地址。例如,假设主机名为“cluster.influxdb.238”的数据节点发生故障,且针对该数据节点新建的虚拟节点的IP地址为10.69.32.235,则将上述举例的主机名映射文件中的10.69.32.238cluster.influxdb.238更新为10.69.32.235cluster.influxdb.238。

步骤204、重启时序数据库集群,以使虚拟节点替代发生故障的数据节点提供数据服务。

本申请实施例中,在执行完上述步骤201~203之后,重启时序数据库集群,可以使虚拟节点生效,从而使虚拟节点替代发生故障的数据节点提供数据服务。

本发明实施例提供的技术方案,通过在时序数据库集群中设置多个数据节点,在检测到任一数据节点发生故障,新建虚拟节点,将发生故障的数据节点的配置文件拷贝至虚拟节点,并将发生故障的数据节点的数据盘挂载至虚拟节点,使得新建的虚拟节点能够替代发生故障的原数据节点提供数据服务,从而实现故障迁移,使得时序数据库集群高可用;进一步的,由于在建立时序数据库集群时,使用主机名来配置参与创建集群的节点,以及故障迁移后,新建虚拟节点的主机名沿用原数据节点的主机名,因此可以实现在上述故障迁移时,无需对时序数据库集群的元数据做出更改,从而能够提高时序数据库集群故障迁移的效率,且由于时序数据库集群的元数据保持稳定,因此,能够提高时序数据库集群的可靠性、稳定性。

图3为本申请实施例提供的一种时序数据库集群的操作方法的流程示意图,这里所说的时序数据库集群可以是图1所示例的时序数据库集群10。如图3所示,包括以下步骤:

步骤301、当接收到数据操作请求时,从时序数据库集群中确定待操作的目标数据节点。

步骤302、从元数据中获取目标数据节点的主机名。

步骤303、从主机名映射文件中确定与获取到的主机名对应的目标IP地址。

步骤304、基于目标IP地址,在目标数据节点上对待操作的目标时序数据执行与数据操作请求对应的数据操作。

本申请实施例中,数据操作请求对应的数据操作可以为数据查询操作或者数据写入操作,待操作的目标时序数据则可以为待查询的时序数据或待写入的时序数据。据此,分别从数据操作请求对应的数据操作为数据查询操作和数据写入操作对上述步骤301~304的详细实现进行说明。

首先,在数据操作请求对应的数据操作为数据查询操作时,对上述步骤301~304的详细实现进行说明:

时序数据库集群可具有一个负载均衡器,客户端或者其他设备发送至时序数据库集群的数据操作请求首先到达该负载均衡器。负载均衡器在接收到数据操作请求后,将数据操作请求发送至其中一个数据节点。数据节点在启动时,可从元数据节点上拉取时序数据库集群的元数据。

如上所述,元数据中可包括时序数据库信息,据此,数据节点在接收到数据操作请求时,先判断待查询的数据库是否存在,如果存在,则根据待查询数据的时间戳,确定待查询数据所属的shardgroup。如下所示,为shardgroup的结构体:

Type ShardGroupInfo struct{

ID unit64 //自增id,唯一标识shardgroup

StartTime time.Time //起始时间

EndTime time.Time //结束时间

DeletedAt time.Time //删除的时间

Shards[]ShardInfo //shardgroup中shard的信息,例如shard ID

}

基于上述所示的shardgroup的结构体,在确定待查询数据所属的shardgroup后,可以确定待查询数据对应的所有shard ID,进而确定shard ID所绑定的数据节点ID,该数据节点ID对应的数据节点则为待操作的数据节点(以下称为目标数据节点)。

若目标数据节点为本数据节点(也即上述接收到数据操作请求的数据节点),则本数据节点可在本地执行数据查询操作;若目标数据节点不为本数据节点,则本数据节点可进一步从元数据中获取到目标数据节点的节点信息。本申请实施例中,节点信息至少包括节点的主机名,因此,本数据节点能够从元数据中获取到目标数据节点的主机名。

进一步的,主机名映射文件中存储有主机名和IP地址的映射关系,因此,本数据节点在从元数据的节点信息中获取到主机名之后,可从主机名映射文件中确定与获取到的主机名对应的目标IP地址,也即目标数据节点的IP地址。之后,将数据操作请求发送给该目标IP地址对应的目标数据节点,以在目标数据节点上执行数据查询操作。

此外,数据节点在执行数据查询操作后,将查询到的数据发送至负载均衡器,由负载均衡器将数据转发至客户端。需要说明的是,在上述目标数据节点的数目多于1个时,负载均衡器在接收到各个目标数据节点查询到的数据后,先进行合并,然后再将合并后的数据转发至客户端。

其次,在数据操作请求对应的数据操作为数据写入操作时,对上述步骤301~304的详细实现进行说明:

与上述数据查询操作类似,负载均衡器在接收到数据操作请求后,将数据操作请求发送至其中一个数据节点,数据节点在接收到数据操作请求时,先判断待写入的数据库是否存在,如果存在,则根据待写入数据的时间戳计算出待写入数据所属的shardgroup。这里,分两种情况:

情况一、当待写入数据所属的shardgroup存在时,则可根据该shardgroup的结构体确定其包含的所有shard,进而根据shard ID与数据节点ID之间的绑定关系,确定每个shard对应的数据节点,也即待操作的目标数据节点。

若目标数据节点不为本数据节点,则本数据节点可进一步从元数据中获取到目标数据节点的节点信息。本申请实施例中,节点信息至少包括节点的主机名,因此,本数据节点能够从元数据中获取到目标数据节点的主机名。

进一步的,主机名映射文件中存储有主机名和IP地址的映射关系,因此,本数据节点在从元数据的节点信息中获取到主机名之后,可从主机名映射文件中确定与获取到的主机名对应的目标IP地址,也即目标数据节点的IP地址。之后,将数据操作请求发送给该目标IP地址对应的目标数据节点,以在目标数据节点上执行数据查询操作。

当然,若目标数据节点ID为本数据节点,则可直接在本数据节点上执行数据写入操作。

需要说明的是,数据节点在执行数据写入操作成功后,可向客户端返回数据写入成功的指示消息。客户端在接收到N个数据节点发送的指示消息后,则可确定数据写入成功,反之,在接收到低于N个数据节点发送的指示消息后,可确定数据写入失败。在确定数据写入失败时,客户端可在间隔设定时间后,再次向时序数据库集群发送数据操作请求,以再次请求向时序数据库集群写入数据。这里,N大于等于待写入数据对应的副本数目-1。

情况二、当待写入数据所属的shardgroup不存在时,则新建一个shardgroup,该shardgroup的起始时间为待写入数据的时间戳,结束时间为起始时间加上设定的时间跨度,同时新建shard ID以及确定需要绑定的数据节点。至于后续操作,可参见上述描述,这里不再赘述。

需要说明的是,上述shard ID所需要绑定的数据节点的数目由待写入数据对应的副本数目决定。例如,待写入数据的副本数目为3,则shard ID需要绑定3个数据节点。

本申请实施例提供的技术方案,通过当接收到数据操作请求时,从元数据中获取待操作的目标数据节点的主机名,从主机名映射文件中确定与获取到的主机名对应的目标IP地址,基于目标IP地址,在目标数据节点上,对待操作的目标时序数据执行与数据操作请求对应的数据操作,实现了在建立时序数据库集群时,使用主机名来配置参与创建集群的节点的情况下,对时序数据库集群进行数据操作,并且,由于在故障迁移时,也无需对时序数据库集群的元数据做出更改,因此,时序数据库集群的元数据能够保持稳定,使得时序数据库集群高可用。

图4为本申请实施例提供的一种时序数据库集群的故障处理装置的示意图,这里所说的时序数据库集群可以是图1所示例的时序数据库集群10。如图4所示,该装置包括:

节点新建模块41,用于当检测到任一所述数据节点发生故障时,新建虚拟节点;

节点配置模块42,用于将发生故障的所述数据节点的配置文件拷贝至所述虚拟节点,并将发生故障的所述数据节点的数据盘挂载至所述虚拟节点;

映射模块43,用于在所述时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为所述虚拟节点的IP地址,所述目标映射关系指发生故障的所述数据节点对应的映射关系;

重启模块44,用于重启所述时序数据库集群,以使所述虚拟节点替代发生故障的所述数据节点提供数据服务。

在一可能的实现方式中,所述时序数据库集群还包括探活组件,所述探活组件用于周期性地向各所述数据节点发送探活报文;所述装置还包括(图中未示出):故障检测模块;

所述故障检测模块具体用于:

针对每一所述数据节点,若在当前的超时时间内,未接收到所述数据节点基于所述探活报文返回的应答报文,则确定所述数据节点故障,所述当前的超时时间指:以所述探活组件最近一次发送所述探活报文的时间为起始时刻,以设定时长为时长的时间段;或者,

针对每一所述数据节点,若在设定周期到达时,未接收到所述数据节点发送的心跳报文,则确定所述数据节点故障。

图5为本申请实施例提供的一种时序数据库集群的操作装置的示意图,这里所说的时序数据库集群可以是图1所示例的时序数据库集群10。如图5所示,该装置包括:

目标确定模块51,用于当接收到数据操作请求时,从所述时序数据库集群中确定待操作的目标数据节点;

第一获取模块52,用于从所述元数据中获取所述目标数据节点的主机名;

第二获取模块53,用于从所述主机名映射文件中确定与获取到的所述主机名对应的目标IP地址;

数据操作模块54,用于基于所述目标IP地址,在所述目标数据节点上对待操作的目标时序数据执行与所述数据操作请求对应的数据操作。

在一可能的实现方式中,所述目标确定模块51从所述时序数据库集群中确定待操作的目标数据节点,包括:

基于所述目标时序数据的时间戳,确定所述目标时序数据所属的目标shardgroup,其中,所述时间戳位于所述目标shardgroup的起始时间和结束时间组成的时间范围内;

确定所述目标shardgroup包含的所有shard;

将与所述shard绑定的所述数据节点确定为待操作的数据节点。

如图6所示,本申请实施例提供提供了一种电子设备,包括处理器611、通信接口612、存储器613和通信总线614,其中,处理器611,通信接口612,存储器613通过通信总线614完成相互间的通信,

存储器613,用于存放计算机程序;

在本申请一个实施例中,处理器611,用于执行存储器613上所存放的程序时,实现前述方法实施例提供的时序数据库集群的故障处理方法,包括:

当检测到任一所述数据节点发生故障时,新建虚拟节点;

将发生故障的所述数据节点的配置文件拷贝至所述虚拟节点,并将发生故障的所述数据节点的数据盘挂载至所述虚拟节点;

在所述时序数据库集群的主机名映射文件中,将目标映射关系中的IP地址更新为所述虚拟节点的IP地址,所述目标映射关系指发生故障的所述数据节点对应的映射关系;

重启所述时序数据库集群,以使所述虚拟节点替代发生故障的所述数据节点提供数据服务。

或者,实现前述方法实施例提供的时序数据库集群的操作方法,包括:

当接收到数据操作请求时,从所述时序数据库集群中确定待操作的目标数据节点;

从所述元数据中获取所述目标数据节点的主机名;

从所述主机名映射文件中确定与获取到的所述主机名对应的目标IP地址;

基于所述目标IP地址,在所述目标数据节点上对待操作的目标时序数据执行与所述数据操作请求对应的数据操作。

本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述任意一个方法实施例提供的时序数据库集群的故障处理方法或者时序数据库集群的操作方法的步骤。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种三方接口服务故障智能切换方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!