一种bmc固件的故障恢复方法、装置、设备及介质

文档序号:1952388 发布日期:2021-12-10 浏览:14次 >En<

阅读说明:本技术 一种bmc固件的故障恢复方法、装置、设备及介质 (Fault recovery method, device, equipment and medium for BMC (baseboard management controller) firmware ) 是由 林涛 于 2021-09-16 设计创作,主要内容包括:本申请公开了一种BMC固件的故障恢复方法、装置、设备及介质,该方法包括:当目标BMC固件出现故障时,则与目标BMC固件建立通信连接,判断目标BMC固件中的目标U-boot是否能够正常启动;若是,利用目标U-boot对移动存储设备中所存储的备用BMC固件进行启动;若否,将移动存储设备中所存储的备用U-boot烧录至目标BMC固件,利用备用U-boot对备用BMC固件进行启动;当备用BMC固件启动完毕时,利用备用BMC固件对目标BMC固件进行刷新。由于该方法可以免去使用芯片烧录器对BMC固件进行故障恢复时的繁琐烧录过程,所以,通过该方法就可以显著提高维修人员在对BMC固件进行故障恢复时的工作效率。(The application discloses a fault recovery method, a fault recovery device, equipment and a medium for BMC firmware, wherein the method comprises the following steps: when the target BMC firmware fails, establishing communication connection with the target BMC firmware, and judging whether a target U-boot in the target BMC firmware can be started normally; if so, starting the standby BMC firmware stored in the mobile storage equipment by using the target U-boot; if not, burning the standby U-boot stored in the mobile storage device to the target BMC firmware, and starting the standby BMC firmware by using the standby U-boot; and when the standby BMC firmware is started, refreshing the target BMC firmware by using the standby BMC firmware. Due to the fact that the method can avoid a complicated burning process when the BMC firmware is subjected to fault recovery by using a chip burner, the working efficiency of maintenance personnel can be remarkably improved when the BMC firmware is subjected to fault recovery by using the method.)

一种BMC固件的故障恢复方法、装置、设备及介质

技术领域

本发明涉及服务器技术领域,特别涉及一种BMC固件的故障恢复方法、装置、设备及介质。

背景技术

随着互联网技术的不断发展,也带来了服务器市场的繁荣。在此技术背景下,大量的数据存储、计算与交互都需要服务器作支撑。在服务器的使用过程中,其内部的BMC(Baseboard Management Controller,基板管理控制器)固件可能会发生故障,在此情况下,由于BMC固件出现问题,服务器也无法正常使用网络进行固件更新,这样便会导致BMC固件无法正常运行,俗称BMC变砖。

在现有技术中,为了BMC进行故障恢复,通常是使用芯片烧录器将相关程序重新烧录到BMC固件中,但是,BMC固件的此种故障恢复方法不仅需要对服务器进行拆机处理,而且,还需要人工手动焊接芯片,工作量庞大且繁杂,极大的降低了维修人员的工作效率。目前,针对这一技术问题,还没有较为有效的解决办法。

发明内容

有鉴于此,本发明的目的在于提供一种BMC固件的故障恢复方法、装置、设备及介质,以提高维修人员在对BMC固件进行故障恢复时的工作效率。其具体方案如下:

一种BMC固件的故障恢复方法,应用于移动存储设备,包括:

当目标BMC固件出现故障时,则与所述目标BMC固件建立通信连接,并判断所述目标BMC固件中的目标U-boot是否能够正常启动;

若所述目标U-boot能够正常启动,则利用所述目标U-boot对所述移动存储设备中所存储的备用BMC固件进行启动;

若所述目标U-boot不能正常启动,则将所述移动存储设备中所存储的备用U-boot烧录至所述目标BMC固件,并利用所述备用U-boot对所述移动存储设备中所存储的备用BMC固件进行启动;

当所述备用BMC固件启动完毕时,则利用所述备用BMC固件对所述目标BMC固件进行刷新,以对所述目标BMC固件进行故障恢复。

优选的,还包括:

当所述目标BMC固件对目标控制指令和复位指令均无响应时,则判定所述目标BMC固件出现故障。

优选的,所述当目标BMC固件出现故障时,则与所述目标BMC固件建立通信连接的过程,包括:

当Power服务器中的所述目标BMC固件出现故障时,则与所述目标BMC固件建立通信连接。

优选的,所述当目标BMC固件出现故障时,则与所述目标BMC固件建立通信连接的过程,包括:

当X86服务器中的所述目标BMC固件出现故障时,则与所述目标BMC固件建立通信连接。

优选的,还包括:

当所述目标BMC固件的故障恢复后,则断开与所述目标BMC固件的通信连接。

优选的,所述移动存储设备具体为U盘或存储卡。

相应的,本发明还公开了一种BMC固件的故障恢复装置,应用于移动存储设备,包括:

启动判断模块,用于当目标BMC固件出现故障时,则与所述目标BMC固件建立通信连接,并判断所述目标BMC固件中的目标U-boot是否能够正常启动;

第一判定模块,用于若所述目标U-boot能够正常启动,则利用所述目标U-boot对所述移动存储设备中所存储的备用BMC固件进行启动;

第二判定模块,用于若所述目标U-boot不能正常启动,则将所述移动存储设备中所存储的备用U-boot烧录至所述目标BMC固件,并利用所述备用U-boot对所述移动存储设备中所存储的备用BMC固件进行启动;

故障恢复模块,用于当所述备用BMC固件启动完毕时,则利用所述备用BMC固件对所述目标BMC固件进行刷新,以对所述目标BMC固件进行故障恢复。

相应的,本发明还公开了一种BMC固件的故障恢复设备,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序时实现如前述所公开的一种BMC固件的故障恢复方法的步骤。

相应的,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述所公开的一种BMC固件的故障恢复方法的步骤。

在本发明中,当目标BMC固件出现故障时,则移动存储设备首先是与目标BMC固件建立通信连接,并判断目标BMC固件中的目标U-boot是否能够正常启动,如果目标U-boot能够正常启动,则利用目标U-boot对移动存储设备中所存储的备用BMC固件进行启动;如果目标U-boot不能正常启动,则将移动存储设备中所存储的备用U-boot烧录至目标BMC固件中,并利用备用U-boot对移动存储设备中所存储的备用BMC固件进行启动;当备用BMC固件启动完毕时,则利用备用BMC固件对目标BMC进行刷新,并对目标BMC固件进行故障恢复。相较于现有技术而言,由于该方法可以免去使用芯片烧录器对BMC固件进行故障恢复时的繁琐烧录过程,所以,通过该方法就可以显著提高维修人员在对BMC固件进行故障恢复时的工作效率。相应的,本发明所提供的一种BMC固件的故障恢复装置、设备及介质,同样具有上述有益效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例所提供的一种BMC固件的故障恢复方法的流程图;

图2为本发明实施例所提供的一种BMC固件与移动存储设备进行信息交互时的示意图;

图3为本发明实施例所提供的一种BMC固件的故障恢复装置的结构图;

图4为本发明实施例所提供的一种BMC固件的故障恢复设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参见图1,图1为本发明实施例所提供的一种BMC固件的故障恢复方法的流程图,该故障恢复方法包括:

步骤S11:当目标BMC固件出现故障时,则与目标BMC固件建立通信连接,并判断目标BMC固件中的目标U-boot是否能够正常启动;

步骤S12:若目标U-boot能够正常启动,则利用目标U-boot对移动存储设备中所存储的备用BMC固件进行启动;

步骤S13:若目标U-boot不能正常启动,则将移动存储设备中所存储的备用U-boot烧录至目标BMC固件,并利用备用U-boot对移动存储设备中所存储的备用BMC固件进行启动;

步骤S14:当备用BMC固件启动完毕时,则利用备用BMC固件对目标BMC固件进行刷新,以对目标BMC固件进行故障恢复。

在本实施例中,是提供了一种BMC的故障恢复方法,通过该方法来对BMC固件进行故障恢复时,可以极大的提高维修人员在对BMC固件进行故障恢复时的工作效率。在该故障恢复方法中是以移动存储设备为执行主体进行具体说明。需要说明的是,在本实施例所提供的故障恢复方法中,需要预先在移动存储设备中存储与目标BMC固件中所存储目标U-boot相一致的备用U-boot以及与目标BMC固件相一致的备用BMC固件。

请参见图2,图2为本发明实施例所提供的一种BMC固件与移动存储设备进行信息交互时的示意图。当目标BMC固件出现故障时,说明此时的目标BMC固件已经无法利用正常的网络对其自身进行刷新,在此情况下,首先是利用移动存储设备与目标BMC固件建立通信连接。

当移动存储设备与目标BMC固件建立通信连接之后,则利用移动存储设备判断目标BMC固件中所存储的目标U-boot是否能够正常启动;因为目标BMC固件中所存储的目标U-boot是一个引导加载程序,如果目标U-boot能够正常启动,此时则可以利用目标U-boot引导移动存储设备中所存储的备用BMC固件进行启动;如果目标U-boot不能正常启动,则说明目标BMC固件中所存储的目标U-boot已经无法引导移动存储设备中所存储的备用BMC固件进行启动,此时则需要将移动存储设备中所存储的备用U-boot烧录到目标BMC固件中,并利用备用U-boot对移动存储设备中所存储的备用BMC固件进行启动。

当备用BMC固件启动完毕时,则说明目标BMC固件已经恢复了网络通讯,此时就利用备用BMC固件对目标BMC固件进行刷新。能够想到的是,当目标BMC固件对其自身刷新完毕时,目标BMC固件就能够正常运行,完成了故障的恢复过程。

相较于现有技术中,需要利用烧录器芯片将相关的程序重新烧录到BMC固件中才能对BMC固件进行故障恢复而言,因为通过本实施例所提供的故障恢复方法可以免去维修人员对服务器进行拆机以及人工手动对芯片进行焊接的繁琐过程,所以,通过本实施例所提供的方法就可以显著提高维修人员在对BMC固件进行故障恢复时的工作效率。

在本实施例中,当目标BMC固件出现故障时,则移动存储设备首先是与目标BMC固件建立通信连接,并判断目标BMC固件中的目标U-boot是否能够正常启动,如果目标U-boot能够正常启动,则利用目标U-boot对移动存储设备中所存储的备用BMC固件进行启动;如果目标U-boot不能正常启动,则将移动存储设备中所存储的备用U-boot烧录至目标BMC固件中,并利用备用U-boot对移动存储设备中所存储的备用BMC固件进行启动;当备用BMC固件启动完毕时,则利用备用BMC固件对目标BMC进行刷新,并对目标BMC固件进行故障恢复。相较于现有技术而言,由于该方法可以免去使用芯片烧录器对BMC固件进行故障恢复时的繁琐烧录过程,所以,通过该方法就可以显著提高维修人员在对BMC固件进行故障恢复时的工作效率。

基于上述实施例,本实施例对技术方案作进一步的说明与优化,作为一种优选的实施方式,上述故障恢复方法还包括:

当目标BMC固件对目标控制指令和复位指令均无响应时,则判定目标BMC固件出现故障。

在本实施例中,是提供了一种对目标BMC固件的故障判定方法,也即,如果目标BMC固件对服务器所发送的目标控制指令以及复位指令均无响应时,则说明目标BMC固件出现了故障。其中,目标控制指令是指服务器向目标BMC固件发送的所有控制指令,比如:程序调控指令、中断指令、启动指令以及运行终止指令等等。

显然,通过本实施例所提供的技术方案,就可以保证目标BMC故障判定结果的准确性与可靠性。

基于上述实施例,本实施例对技术方案作进一步的说明与优化,作为一种优选的实施方式,上述步骤:当目标BMC固件出现故障时,则与目标BMC固件建立通信连接的过程,包括:

当Power服务器中的目标BMC固件出现故障时,则与目标BMC固件建立通信连接。

可以理解的是,因为Power(Performance Optimization With Enhanced RISC,基于RISC架构的指令集体系架构)服务器不仅具有良好的数据处理性能,而且,还具有较强的可扩展性,所以,Power服务器被广泛应用于很多网络工作站以及超级计算机中,而BMC固件又是Power服务器进行数据处理的核心器件,所以,本实施例所提供BMC固件的故障恢复方法就可以应用于含有Power服务器的应用场景中。

显然,通过本实施例所提供的技术方案,就可以进一步提升本申请所提供BMC固件的故障恢复方法在实际应用中的普适性。

基于上述实施例,本实施例对技术方案作进一步的说明与优化,作为一种优选的实施方式,上述步骤:当目标BMC固件出现故障时,则与目标BMC固件建立通信连接的过程,包括:

当X86服务器中的目标BMC固件出现故障时,则与目标BMC固件建立通信连接。

在实际应用中,除了可以将本申请所提供BMC固件的故障恢复方法应用于Power服务器之外,还可以将本申请所提供BMC固件的故障恢复方法应用于X86服务器中。因为在X86服务器中,BMC固件不仅可以对X86服务器中的温度、电压、风扇、电源等器件的运行状况进行实时监测,而且,也可以对X86服务器中的各种电子器件进行调控,并使得X86服务器处于健康运行状态下,所以,BMC固件在X86服务器中起着极其重要的作用。在此背景支撑下,本申请所提供BMC固件的故障恢复方法恰好可以应用于含有BMC固件的X86服务器中来进一步提高X86服务器的运行性能。

显然,通过本实施例所提供的技术方案,就可以进一步增加本申请所提供BMC固件故障恢复方法在实际使用过程中的灵活性。

基于上述实施例,本实施例对技术方案作进一步的说明与优化,作为一种优选的实施方式,上述故障恢复方法还包括:

当目标BMC固件的故障恢复后,则断开与目标BMC固件的通信连接。

能够想到的是,当目标BMC固件的故障恢复后,目标BMC固件就可以在服务器中执行正常的操作流程,在此情况下,与目标BMC固件建立通信连接的移动存储设备就失去了作用。此时如果移动存储设备继续与目标BMC固件进行通信连接,就会对通信资源造成不必要的浪费。因此,在本实施例中,为了避免上述情况的发生,是在目标BMC固件的故障恢复之后,断开了移动存储设备与目标BMC固件之间的通信连接。

显然,通过本实施例所提供的技术方案,就可以减少对目标BMC固件通信资源的浪费,提高通信资源的利用率。

基于上述实施例,本实施例对技术方案作进一步的说明与优化,作为一种优选的实施方式,移动存储设备具体为U盘或存储卡。

在实际应用中,可以将移动存储设备设置为U盘,因为U盘的体积小巧、便于携带,而且,U盘还具有存储容量大、价格便宜以及性能可靠等优点,所以,当将移动存储设备设置为U盘时,就可以进一步提高维修人员在对目标BMC固件进行故障恢复时的便捷度。

或者,还可以将移动存储设备设置为存储卡,因为存储卡不仅具有体积小巧、占用功率小的优点,而且,存储卡相较于其它类型的移动存储设备而言造价成本低廉,所以,当将移动存储设备设置为存储卡时,就可以相对降低在对目标BMC固件进行故障恢复时所需要投入的资金成本。

请参见图3,图3为本发明实施例所提供的一种BMC固件的故障恢复装置的结构图,该故障恢复装置包括:

启动判断模块21,用于当目标BMC固件出现故障时,则与目标BMC固件建立通信连接,并判断目标BMC固件中的目标U-boot是否能够正常启动;

第一判定模块22,用于若目标U-boot能够正常启动,则利用目标U-boot对移动存储设备中所存储的备用BMC固件进行启动;

第二判定模块23,用于若目标U-boot不能正常启动,则将移动存储设备中所存储的备用U-boot烧录至目标BMC固件,并利用备用U-boot对移动存储设备中所存储的备用BMC固件进行启动;

故障恢复模块24,用于当备用BMC固件启动完毕时,则利用备用BMC固件对目标BMC固件进行刷新,以对目标BMC固件进行故障恢复。

本发明实施例所提供的一种BMC固件的故障恢复装置,具有前述所公开的一种BMC固件的故障恢复方法所具有的有益效果。

请参见图4,图4为本发明实施例所提供的一种BMC固件的故障恢复设备的结构图,该故障恢复设备包括:

存储器31,用于存储计算机程序;

处理器32,用于执行计算机程序时实现如前述所公开的一种BMC固件的故障恢复方法的步骤。

本发明实施例所提供的一种BMC固件的故障恢复设备,具有前述所公开的一种BMC固件的故障恢复方法所具有的有益效果。

相应的,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如前述所公开的一种BMC固件的故障恢复方法的步骤。

本发明实施例所提供的一种计算机可读存储介质,具有前述所公开的一种BMC固件的故障恢复方法所具有的有益效果。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明所提供的一种BMC固件的故障恢复方法、装置、设备及介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于PKI体系的财务人员操作记录黑匣子保存方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!