一种服务器中pcie设备管理系统和服务器

文档序号:19979 发布日期:2021-09-21 浏览:27次 >En<

阅读说明:本技术 一种服务器中pcie设备管理系统和服务器 (PCIE equipment management system in server and server ) 是由 郭艳杰 于 2021-05-28 设计创作,主要内容包括:本发明提供了一种服务器中PCIE设备管理系统和服务器,PCIE设备管理系统包括:管理设备,管理设备通过第一总线连接到PCIE设备中独立供电的状态缓存单元,配置用于从所述状态缓存单元获取PCIE设备的状态信息;处理器,处理器通过第二总线连接到PCIE设备,配置用于获取PCIE设备的状态信息,并通过KCS板载接口将获取到的状态信息发送到管理设备中,其中,管理设备配置为响应于无法通过处理器获取PCIE设备的状态信息,则转为从状态缓存单元获取PCIE设备的状态信息。通过使用本发明的方案,能够快速定位服务器的PCIE设备故障,能够建立独立于处理器外的PCIE监控系统,提供了设备的稳定性,提高了设备的可服务性和可靠性。(The invention provides a PCIE equipment management system in a server and the server, wherein the PCIE equipment management system comprises: the management device is connected to a state cache unit independently powered in the PCIE device through a first bus and is configured to acquire state information of the PCIE device from the state cache unit; and the processor is connected to the PCIE device through the second bus, configured to acquire state information of the PCIE device, and send the acquired state information to the management device through the KCS onboard interface, where the management device is configured to respond that the state information of the PCIE device cannot be acquired through the processor, and then acquire the state information of the PCIE device from the state cache unit instead. By using the scheme of the invention, the failure of the PCIE equipment of the server can be quickly positioned, a PCIE monitoring system independent of the processor can be established, the stability of the equipment is provided, and the serviceability and the reliability of the equipment are improved.)

一种服务器中PCIE设备管理系统和服务器

技术领域

本领域涉及计算机领域,并且更具体地涉及一种服务器中PCIE设备管理系统和服务器。

背景技术

服务器是一种对可靠性要求极高的产品,PCIE设备是标准配置设备扩展接口。对PCIE设备的管理对服务器的稳定性非常重要。

传统服务器的PCIE设备管理方法是服务器的处理器直接读取PCIE设备信息进行设备的管理。服务器的板载管理系统通过处理器与bmc的接口接收PCIE设备的信息,但是在处理器故障或没有启动的时候板载管理系统无法对PCIE设备的状况进行管理。

发明内容

有鉴于此,本发明实施例的目的在于提出一种服务器中PCIE设备管理系统和服务器,通过使用本发明的技术方案,能够快速定位服务器的PCIE设备故障,能够建立独立于处理器外的PCIE监控系统,提供了设备的稳定性,提高了设备的可服务性和可靠性。

基于上述目的,本发明的实施例的一个方面提供了一种服务器中PCIE设备管理系统,包括:

管理设备,管理设备通过第一总线连接到PCIE设备中独立供电的状态缓存单元,配置用于从所述状态缓存单元获取PCIE设备的状态信息;

处理器,处理器通过第二总线连接到PCIE设备,配置用于获取PCIE设备的状态信息,并通过KCS板载接口将获取到的状态信息发送到管理设备中,

其中,所述管理设备配置为响应于无法通过所述处理器获取PCIE设备的状态信息,则转为从所述状态缓存单元获取PCIE设备的状态信息。

根据本发明的一个实施例,PCIE设备中的状态缓存单元为ram存储器,PCIE设备中的状态缓存单元连接到独立的供电电源。

根据本发明的一个实施例,第一总线为smbus总线,第二总线为PCIE总线。

根据本发明的一个实施例,管理设备为服务器中的基板管理控制器。

根据本发明的一个实施例,还包括:

供电电源,供电电源连接到处理器、管理设备和PCIE设备。

本发明的实施例的另一个方面,还提供了一种服务器,该服务器包括PCIE设备管理系统,PCIE设备管理系统包括:

管理设备,管理设备通过第一总线连接到PCIE设备中独立供电的状态缓存单元,配置用于从所述状态缓存单元获取PCIE设备的状态信息;

处理器,处理器通过第二总线连接到PCIE设备,配置用于获取PCIE设备的状态信息,并通过KCS板载接口将获取到的状态信息发送到管理设备中,

其中,所述管理设备配置为响应于无法通过所述处理器获取PCIE设备的状态信息,则转为从所述状态缓存单元获取PCIE设备的状态信息。

根据本发明的一个实施例,PCIE设备中的状态缓存单元为ram存储器,PCIE设备中的状态缓存单元连接到独立的供电电源。

根据本发明的一个实施例,第一总线为smbus总线,第二总线为PCIE总线。

根据本发明的一个实施例,管理设备为服务器中的基板管理控制器。

根据本发明的一个实施例,还包括:

供电电源,供电电源连接到处理器、管理设备和PCIE设备。

本发明具有以下有益技术效果:本发明实施例提供的服务器中PCIE设备管理系统,通过设置管理设备,管理设备通过第一总线连接到PCIE设备中独立供电的状态缓存单元,配置用于从所述状态缓存单元获取PCIE设备的状态信息;处理器,处理器通过第二总线连接到PCIE设备,配置用于获取PCIE设备的状态信息,并通过KCS板载接口将获取到的状态信息发送到管理设备中,其中,所述管理设备配置为响应于无法通过所述处理器获取PCIE设备的状态信息,则转为从所述状态缓存单元获取PCIE设备的状态信息的技术方案,能够快速定位服务器的PCIE设备故障,能够建立独立于处理器外的PCIE监控系统,提供了设备的稳定性,提高了设备的可服务性和可靠性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为根据本发明一个实施例的PCIE设备管理系统的示意图;

图2为根据本发明一个实施例的服务器的示意图。

具体实施方式

以下描述了本公开的实施例。然而,应该理解,所公开的实施例仅仅是示例,并且其他实施例可以采取各种替代形式。附图不一定按比例绘制;某些功能可能被夸大或最小化以显示特定部件的细节。因此,本文公开的具体结构和功能细节不应被解释为限制性的,而仅仅是作为用于教导本领域技术人员以各种方式使用本发明的代表性基础。如本领域普通技术人员将理解的,参考任何一个附图所示出和描述的各种特征可以与一个或多个其他附图中所示的特征组合以产生没有明确示出或描述的实施例。所示特征的组合为典型应用提供了代表性实施例。然而,与本公开的教导相一致的特征的各种组合和修改对于某些特定应用或实施方式可能是期望的。

基于上述目的,本发明的实施例的第一个方面,提出了一种服务器中PCIE设备管理系统的一个实施例。图1示出的是该PCIE设备管理系统的示意图。

如图1中所示,该PCIE设备管理系统可以包括:

管理设备,管理设备通过第一总线连接到PCIE设备中独立供电的状态缓存单元,配置用于从状态缓存单元获取PCIE设备的状态信息。

该管理设备可以是服务器中的BMC(基板管理控制器),第一总线为smbus总线,Smbus为低速低成本总线,适合bmc这种低速平台使用,还需要在PCIE设备中设置独立的状态缓存单元,该状态缓存单元为ram存储器,该状态缓存单元需要设置独立的供电电源,例如该独立的供电电源可以为蓄电池,不能使用系统电源作为该独立的供电电源,以防止系统断电时导致状态缓存单元同时断电而不能够读取状态缓存单元中的数据,PCIE设备在运行时,实时将PCIE设备的运行信息和状态信息发送到该状态缓存单元中进行存储,同时该状态缓存单元需要将接收到的PCIE设备的运行信息和状态信息发送到管理设备中进行存储,在服务器正常运行的状态下,可以在管理设备(基板管理控制器)中直接获取到PCIE设备的运行信息和状态信息,在服务器异常或关闭,或者基板管理控制器异常时,可以通过读取PCIE设备中设置的状态缓存单元中的数据获得PCIE设备的运行信息和状态信息,能够保证在服务器异常时可以快速定位服务器的PCIE设备故障。

在另一个实施例中,可以设置独立供电的状态缓存单元的模块,该状态缓存单元的模块由ram存储器组成,该状态缓存单元模块需要设置独立的供电电源,例如该独立的供电电源可以为蓄电池,不能使用系统电源作为该独立的供电电源,以防止系统断电时导致状态缓存单元同时断电而不能够读取状态缓存单元中的数据,PCIE设备在运行时,实时将每个PCIE设备的运行信息和状态信息发送到该独立的状态缓存单元的模块中进行存储,同时该状态缓存单元的模块需要将接收到的PCIE设备的运行信息和状态信息发送到管理设备中进行存储,在服务器正常运行的状态下,可以在管理设备(基板管理控制器)中直接获取到PCIE设备的运行信息和状态信息,在服务器异常或关闭,或者基板管理控制器异常时,可以通过读取该独立设置的状态缓存单元的模块中的数据获得PCIE设备的运行信息和状态信息,能够保证在服务器异常时可以快速定位服务器的PCIE设备故障。

在另一个实施例中,可以在BMC中设置独立的状态缓存单元,该状态缓存单元由ram存储器组成,该状态缓存单元需要设置独立的供电电源,例如该独立的供电电源可以为蓄电池,不能使用系统电源作为该独立的供电电源,以防止系统断电时导致状态缓存单元同时断电而不能够读取状态缓存单元中的数据,PCIE设备在运行时,实时将每个PCIE设备的运行信息和状态信息发送到BMC中的状态缓存单元中进行存储,同时该状态缓存单元需要将接收到的PCIE设备的运行信息和状态信息发送到管理设备中进行存储,在服务器正常运行的状态下,可以在管理设备(基板管理控制器)中直接获取到PCIE设备的运行信息和状态信息,在服务器异常或关闭,或者基板管理控制器异常时,可以通过读取BMC中的状态缓存单元的模块中的数据获得PCIE设备的运行信息和状态信息,能够保证在服务器异常时可以快速定位服务器的PCIE设备故障。

该PCIE设备管理系统还包括处理器,处理器通过第二总线连接到PCIE设备,配置用于获取PCIE设备的状态信息,并通过KCS板载接口将获取到的状态信息发送到管理设备中,其中,管理设备配置为响应于无法通过处理器获取PCIE设备的状态信息,则转为从状态缓存单元获取PCIE设备的状态信息。

该处理器为系统的CPU,第二总线为PCIE总线,CPU通过PCIE总线读取PCIE设备的运行信息和状态信息,然后通过KCS板载接口(Keyboard Controller Style,键盘控制器方式,一种传输协议)发送到基板管理控制器中,即基板管理控制器可以同时接收到来自CPU发送的PCIE设备的运行信息和状态信息和来自状态缓存单元发送的PCIE设备的运行信息和状态信息,同时接收到的这两个信息应该是相同,因为都是PCIE设备发出的,因此,基板管理控制器未在同一时间接收到两个相同的信息时,则表示其中一条线路发生了故障,基板管理控制器会产生一个相应的告警通知管理员进行检查。另外,基板管理控制器接收到两个相同的信息并不是都要保存,而是对比这两个信息,如果是相同PCIE设备且时间相同,则删除一个信息,保存一个信息,以防止基板管理控制器存储了较多的重复数据。

状态缓存单元中的PCIE设备的运行信息和状态信息可以以日志的形式进行循环保存,在经过一定的时间后删除最先保存的日志,以保证状态缓存单元中有足够的存储空间存储数据。

通过本发明的技术方案,能够快速定位服务器的PCIE设备故障,能够建立独立于处理器外的PCIE监控系统,提供了设备的稳定性,提高了设备的可服务性和可靠性。

在本发明的一个优选实施例中,PCIE设备中的状态缓存单元为ram存储器,PCIE设备中的状态缓存单元连接到独立的供电电源。该存储器需要有足够的存储空间以能够存储足够数量的PCIE设备的运行信息和状态信息,该独立的供电电源可以为蓄电池。

在本发明的一个优选实施例中,第一总线为smbus总线,第二总线为PCIE总线。

在本发明的一个优选实施例中,管理设备为服务器中的基板管理控制器。

在本发明的一个优选实施例中,还包括:

供电电源,供电电源连接到处理器、管理设备和PCIE设备。

通过本发明的技术方案,能够快速定位服务器的PCIE设备故障,能够建立独立于处理器外的PCIE监控系统,提供了设备的稳定性,提高了设备的可服务性和可靠性。

基于上述目的,本发明的实施例的第二个方面,提出了一种服务器1,如图2所示,服务器1包括PCIE设备管理系统,PCIE设备管理系统包括:

管理设备,管理设备通过第一总线连接到PCIE设备中独立供电的状态缓存单元,配置用于从所述状态缓存单元获取PCIE设备的状态信息。

该管理设备可以是服务器中的BMC(基板管理控制器),第一总线为smbus总线,Smbus为低速低成本总线,适合bmc这种低速平台使用,还需要在PCIE设备中设置独立的状态缓存单元,该状态缓存单元为ram存储器,该状态缓存单元需要设置独立的供电电源,例如该独立的供电电源可以为蓄电池,不能使用系统电源作为该独立的供电电源,以防止系统断电时导致状态缓存单元同时断电而不能够读取状态缓存单元中的数据,PCIE设备在运行时,实时将PCIE设备的运行信息和状态信息发送到该状态缓存单元中进行存储,同时该状态缓存单元需要将接收到的PCIE设备的运行信息和状态信息发送到管理设备中进行存储,在服务器正常运行的状态下,可以在管理设备(基板管理控制器)中直接获取到PCIE设备的运行信息和状态信息,在服务器异常或关闭,或者基板管理控制器异常时,可以通过读取PCIE设备中设置的状态缓存单元中的数据获得PCIE设备的运行信息和状态信息,能够保证在服务器异常时可以快速定位服务器的PCIE设备故障。

在另一个实施例中,可以设置独立的状态缓存单元的模块,该状态缓存单元的模块由ram存储器组成,该状态缓存单元模块需要设置独立的供电电源,例如该独立的供电电源可以为蓄电池,不能使用系统电源作为该独立的供电电源,以防止系统断电时导致状态缓存单元同时断电而不能够读取状态缓存单元中的数据,PCIE设备在运行时,实时将每个PCIE设备的运行信息和状态信息发送到该独立的状态缓存单元的模块中进行存储,同时该状态缓存单元的模块需要将接收到的PCIE设备的运行信息和状态信息发送到管理设备中进行存储,在服务器正常运行的状态下,可以在管理设备(基板管理控制器)中直接获取到PCIE设备的运行信息和状态信息,在服务器异常或关闭,或者基板管理控制器异常时,可以通过读取该独立设置的状态缓存单元的模块中的数据获得PCIE设备的运行信息和状态信息,能够保证在服务器异常时可以快速定位服务器的PCIE设备故障。

在另一个实施例中,可以在BMC中设置独立的状态缓存单元,该状态缓存单元由ram存储器组成,该状态缓存单元需要设置独立的供电电源,例如该独立的供电电源可以为蓄电池,不能使用系统电源作为该独立的供电电源,以防止系统断电时导致状态缓存单元同时断电而不能够读取状态缓存单元中的数据,PCIE设备在运行时,实时将每个PCIE设备的运行信息和状态信息发送到BMC中的状态缓存单元中进行存储,同时该状态缓存单元需要将接收到的PCIE设备的运行信息和状态信息发送到管理设备中进行存储,在服务器正常运行的状态下,可以在管理设备(基板管理控制器)中直接获取到PCIE设备的运行信息和状态信息,在服务器异常或关闭,或者基板管理控制器异常时,可以通过读取BMC中的状态缓存单元的模块中的数据获得PCIE设备的运行信息和状态信息,能够保证在服务器异常时可以快速定位服务器的PCIE设备故障。

该PCIE设备管理系统还包括处理器,处理器通过第二总线连接到PCIE设备,配置用于获取PCIE设备的状态信息,并通过KCS板载接口将获取到的状态信息发送到管理设备中,其中,所述管理设备配置为响应于无法通过所述处理器获取PCIE设备的状态信息,则转为从所述状态缓存单元获取PCIE设备的状态信息。

该处理器为系统的CPU,第二总线为PCIE总线,CPU通过PCIE总线读取PCIE设备的运行信息和状态信息,然后通过KCS板载接口(Keyboard Controller Style,键盘控制器方式,一种传输协议)发送到基板管理控制器中,即基板管理控制器可以同时接收到来自CPU发送的PCIE设备的运行信息和状态信息和来自状态缓存单元发送的PCIE设备的运行信息和状态信息,同时接收到的这两个信息应该是相同,因为都是PCIE设备发出的,因此,基板管理控制器未在同一时间接收到两个相同的信息时,则表示其中一条线路发生了故障,基板管理控制器会产生一个相应的告警通知管理员进行检查。另外,基板管理控制器接收到两个相同的信息并不是都要保存,而是对比这两个信息,如果是相同PCIE设备且时间相同,则删除一个信息,保存一个信息,以防止基板管理控制器存储了较多的重复数据。

状态缓存单元中的PCIE设备的运行信息和状态信息可以以日志的形式进行循环保存,在经过一定的时间后删除最先保存的日志,以保证状态缓存单元中有足够的存储空间存储数据。

在本发明的一个优选实施例中,PCIE设备中的状态缓存单元为ram存储器,PCIE设备中的状态缓存单元连接到独立的供电电源。

在本发明的一个优选实施例中,第一总线为smbus总线,第二总线为PCIE总线。

在本发明的一个优选实施例中,管理设备为服务器中的基板管理控制器。

在本发明的一个优选实施例中,还包括:

供电电源,供电电源连接到处理器、管理设备和PCIE设备。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

上述实施例,特别是任何“优选”实施例是实现的可能示例,并且仅为了清楚地理解本发明的原理而提出。可以在不脱离本文所描述的技术的精神和原理的情况下对上述实施例进行许多变化和修改。所有修改旨在被包括在本公开的范围内并且由所附权利要求保护。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种通信设备、表项更新方法及存储介质

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!