一种电源故障上报方法

文档序号:1936579 发布日期:2021-12-07 浏览:14次 >En<

阅读说明:本技术 一种电源故障上报方法 (Power failure reporting method ) 是由 刘琦 于 2021-08-31 设计创作,主要内容包括:本发明提供一种电源故障上报方法,基板管理控制器通常不访问电源供应单元的故障寄存器,只有当电源供应单元自身发送出故障报警信号之后,由现场可编程逻辑门阵列芯片通知基板管理控制器电源供应单元发生了故障,此时BMC才会通过基板管理控制器访问故障电源供应单元,收集故障信息上报日志。本发明的电源故障上报方法,大大减小了基板管理控制器与电源供应单元连接的I2C总线的繁忙,减少了基板管理控制器与英特尔管理引擎之间的I2C总线竞争,同时降低了基板管理控制器的CPU使用率。(The invention provides a power failure reporting method.A baseboard management controller does not usually access a failure register of a power supply unit, only after the power supply unit sends a failure alarm signal, a field programmable gate array chip informs the baseboard management controller that the power supply unit has a failure, and at the moment, a BMC (baseboard management controller) accesses the failure power supply unit through the baseboard management controller and collects failure information and reports logs. The power failure reporting method greatly reduces the busyness of the I2C bus connected between the baseboard management controller and the power supply unit, reduces I2C bus competition between the baseboard management controller and the Intel management engine, and reduces the CPU utilization rate of the baseboard management controller.)

一种电源故障上报方法

技术领域

本发明属于电源供应器技术领域,尤其是涉及一种电源故障上报方法。

背景技术

基板管理控制器即BMC是服务器主板上一块独立的板卡,有自己独立的处理器,和控制系统,通过IPMB、LPC(low-pin-count-interface)、SMBus等接口与主机硬件或者主机系统进行通信,并通过网络、串行/Moderm、PCI等接口传向本地主机/远程服务器提供查询和控制等功能。

伴随着服务器各个部件组合的多样性,越来越多的服务器需要较大功耗来满足客户的业务负载。电源供应单元简称PSU或电源,是电脑的一种电能转换类的电源(有别于电池供电类的电源),负责将标准交流电转成低压稳定的直流电,给电脑内其它的组件所使用。目前一般的电源供应器都是交换式电源供应器,输入电压自动适应用家所在地点市电参数。一方面需要提高单个PSU的供电能力,一方面需要增加PSU的个数,来支持高负载业务的需求。

当通过增加PSU个数来满足业务负载时,I2C总线上会挂载过多的PSU设备。同时如果服务器基于Intel平台进行研发,那么会存在PCH(Platform Controller Hub),即英特尔集成南桥。此时,PCH内部存在一个ME(Mangement Engine),即英特尔管理引擎,而ME同样会使用I2C与PSU相连接,此时I2C总线上会存在BMC与ME 2个主设备,多个从设备PSU。而PSU本身寄存器种类繁多(状态、电压、电流、功耗等),BMC往往通过轮训轮询的方式采集PSU的相关寄存器数据(PSU厂商、PSU型号、PSU状态、EEPROM等),而PSU数量或者采集PSU相关寄存器较多时,BMC与ME在I2C总线上,存在双主竞争,增加了I2C访问失败的几率;另一方面,BMC访问PSU通常使用轮训的方式,会占用较多BMC的资源。

发明内容

本发明旨在解决上述技术问题,提供一种电源故障上报方法。

为了达到上述目的,本发明采用如下技术方案:

一种电源故障上报方法,应用于主机系统/远程服务器系统,所述主机系统/远程服务器系统包括若干电源供应单元以及现场可编程逻辑门阵列芯片、基板管理控制器,所述电源供应单元内部监测到故障时,发送信号给现场可编程逻辑门阵列芯片,当现场可编程逻辑门阵列芯片收到由电源供应单元发送的故障报警信号时,发送中断信号通知基板管理控制器,基板管理控制器接收到来自现场可编程逻辑门阵列芯片的中断信号后,收集对应电源供应单元的故障信息,基板管理控制器根据收集的故障信息,解析后记录到日志文件。

作为优选,各个电源供应单元的Present引脚与现场可编程逻辑门阵列芯片相连接,用于及时反馈电源供应单元的在位变化。

作为优选,各个电源供应单元的故障报警引脚与现场可编程逻辑门阵列芯片相连接,现场可编程逻辑门阵列芯片的一根GPIO引脚作为中断信号引脚,现场可编程逻辑门阵列芯片的该GPIO引脚与基板管理控制器相连接,用于发送中断信号通知基板管理控制器,现场可编程逻辑门阵列芯片与基板管理控制器通过Local Bus总线相连接,电源供应单元与基板管理控制器通过I2C总线相连接。

采用上述技术方案后,本发明具有如下优点:

现有技术的基板管理控制器一直处于轮询各个电源供应单元的故障寄存器来感知是否有故障发送,会不断消耗基板管理控制器的资源,同时在I2C总线与英特尔管理引擎不断竞争。而本发明的电源故障上报方法,基板管理控制器通常不访问电源供应单元的故障寄存器,只有当电源供应单元自身发送出故障报警信号之后,由现场可编程逻辑门阵列芯片通知基板管理控制器电源供应单元发生了故障,此时BMC才会通过基板管理控制器访问故障电源供应单元,收集故障信息上报日志。

本发明的电源故障上报方法,大大减小了基板管理控制器与电源供应单元连接的I2C总线的繁忙,减少了基板管理控制器与英特尔管理引擎之间的I2C总线竞争,同时降低了基板管理控制器的CPU使用率。

附图说明

图1为采用本发明的电源故障上报方法的主机系统/远程服务器系统的结构示意图。

具体实施方式

以下结合附图及具体实施例,对本发明作进一步的详细说明。

一种电源故障上报方法,应用于主机系统/远程服务器系统,如图1所示,所述主机系统/远程服务器系统包括若干电源供应单元以及现场可编程逻辑门阵列芯片、基板管理控制器、英特尔管理引擎。电源供应单元即PSU,现场可编程逻辑门阵列芯片即FPGA,基板管理控制器即BMC,英特尔管理引擎即ME。

各个电源供应单元的故障报警引脚Alert与现场可编程逻辑门阵列芯片相连接,所述电源供应单元内部监测到故障时,发送信号给现场可编程逻辑门阵列芯片。各个电源供应单元的Present引脚与现场可编程逻辑门阵列芯片相连接,用于及时反馈电源供应单元的在位变化。

当现场可编程逻辑门阵列芯片收到由电源供应单元发送的故障报警信号时,发送中断信号通知基板管理控制器,基板管理控制器接收到来自现场可编程逻辑门阵列芯片的中断信号后,收集对应电源供应单元的故障信息,基板管理控制器根据收集的故障信息,解析后记录到日志文件。

现场可编程逻辑门阵列芯片的一根GPIO引脚作为中断信号引脚,现场可编程逻辑门阵列芯片的该GPIO引脚与基板管理控制器相连接,用于发送中断信号通知基板管理控制器,现场可编程逻辑门阵列芯片与基板管理控制器通过Local Bus总线相连接,电源供应单元与基板管理控制器通过I2C总线相连接。

当任意电源供应单元发生故障时,均可以通过故障报警Alert信号上报给现场可编程逻辑门阵列芯片FPGA,而现场可编程逻辑门阵列芯片FPGA区分各类中断信号源后,汇总后再通过某根GPIO引脚模拟中断信号发送给基板管理控制器BMC(如某根IO的下降沿作为模拟中断信号)。基板管理控制器BMC接收到中断信号,会先通过Local Bus主线访问现场可编程逻辑门阵列芯片FPGA以查询中断类型,当识别为电源供应单元PSU类型中断后,立刻通过I2C总线访问故障电源供应单元PSU,采集故障寄存器信息,解析后上报日志。

现有技术的基板管理控制器一直处于轮询各个电源供应单元的故障寄存器来感知是否有故障发送,会不断消耗基板管理控制器的资源,同时在I2C总线与英特尔管理引擎不断竞争。而本发明的电源故障上报方法,基板管理控制器通常不访问电源供应单元的故障寄存器,只有当电源供应单元自身发送出故障报警信号之后,由现场可编程逻辑门阵列芯片通知基板管理控制器电源供应单元发生了故障,此时BMC才会通过基板管理控制器访问故障电源供应单元,收集故障信息上报日志。

本发明的电源故障上报方法,大大减小了基板管理控制器与电源供应单元连接的I2C总线的繁忙,减少了基板管理控制器与英特尔管理引擎之间的I2C总线竞争,同时降低了基板管理控制器的CPU使用率。

本实施例中,所述PSU型号为PSR800-12A,BMC型号为AST2500。

除上述优选实施例外,本发明还有其他的实施方式,本领域技术人员可以根据本发明作出各种改变和变形,只要不脱离本发明的精神,均应属于本发明所附权利要求所定义的范围。

6页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:备电系统和固态硬盘

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!