光模块监控方法、电子设备及存储介质

文档序号:911957 发布日期:2021-02-26 浏览:4次 >En<

阅读说明:本技术 光模块监控方法、电子设备及存储介质 (Optical module monitoring method, electronic device and storage medium ) 是由 陈海瑞 于 2020-10-20 设计创作,主要内容包括:本发明涉及光模块监控方法、电子设备及存储介质,方法包括:通过定时器确定每个端口的光模块状态,以确定故障的光模块;隔离所述故障的光模块,以及将所述故障的光模块信息发送至网络管理系统显示,以提醒管理员;调用检查程序确定与所述故障的光模块连接的I2C总线的数据线的低电平状态,从而确定所述I2C总线是否处于抱死状态;若是,则控制I2C主机通过时钟线发送时钟信号,以解除I2C总线的挂死状态。本发明示例能够在检测到故障的光模块后主动上报,通知网络管理员排除故障,对于单点故障的光模块可以进行隔离,防止影响扩大,影响整机的I2C通信;当出现I2C总线挂死的情况时,通过软件即可恢复I2C通信,将故障影响到最低。(The invention relates to an optical module monitoring method, electronic equipment and a storage medium, wherein the method comprises the following steps: determining the optical module state of each port through a timer so as to determine a failed optical module; isolating the optical module with the fault, and sending the information of the optical module with the fault to a network management system for displaying so as to remind an administrator; calling a checking program to determine a low level state of a data line of an I2C bus connected with the failed optical module, so as to determine whether the I2C bus is in a locking state; if yes, the I2C host is controlled to send a clock signal through a clock line so as to release the hang-up state of the I2C bus. The example of the invention can actively report after detecting the optical module with the fault, inform a network administrator of removing the fault, isolate the optical module with the single-point fault, and prevent the expansion of the influence and the influence on the I2C communication of the whole machine; when the I2C bus is hung up, the I2C communication can be recovered through software, and the fault is influenced to the minimum.)

光模块监控方法、电子设备及存储介质

技术领域

本发明涉及通信器件技术领域,特别涉及光模块的监控方法、设备及介质。

背景技术

I2C几乎是嵌入式系统中常用的串行总线,CPU(Central Processing Unit)周边的各种器件,只要对速度要求不高都可以使用。其优点是兼容性好(几乎所有的CPU都有I2C主机控制器,没有也可以用IO模拟),管脚占用少,芯片实现简单。I2C协议虽然简单,但是可靠性不算很高,日常中最为常见的问题是I2C从机挂死。

发明内容

本发明旨在至少在一定程度上解决以下技术问题:

现有技术中仅仅记录出问题的I2C设备的波形图,用于后续故障定位和排查,发现有I2C设备故障时,没有隔离故障设备,故障设备可能会导致I2C总线挂死;

当I2C总线挂死时,没有恢复I2C总线的措施,可能会影响系统其它I2C器件的正常访问。

第一方面,本发明实施例提供了一种光模块监控方法,包括:

通过定时器确定每个端口的光模块状态,以确定故障的光模块;

隔离所述故障的光模块,以及将所述故障的光模块信息发送至网络管理系统显示,以提醒管理员;

调用检查程序确定与所述故障的光模块连接的I2C总线的数据线的低电平状态,从而确定所述I2C总线是否处于抱死状态;

若是,则控制I2C主机通过时钟线发送时钟信号,以解除I2C总线的挂死状态。

在一些示例中,所述通过所述定时器确定每个端口的光模块状态,以确定故障的光模块,包括:

所述定时器间隔一定时间遍历一次每个端口的光模块,通过是否能够读取光模块信息确定故障的光模块。

在一些示例中,所述定时器间隔一定时间遍历一次所述每个端口的光模块,通过是否能够读取光模块信息确定故障的光模块,包括:

所述定时器间隔一定时间遍历一次每个端口,读取每个端口的光模块在位信息;

若检测到光模块在位,则读取光模块信息;

若连续多次读取光模块信息失败,则标记该光模块故障。

在一些示例中,所述定时器间隔一定时间遍历一次每个端口,读取每个端口的光模块在位信息,包括:

所述定时器间隔一定时间遍历一次每个端口;

若读取端口的光模块在位信息失败,则多次读取光模块信息。

在一些示例中,所述光模块信息至少包括下列之一:厂商信息、序列号、光模块类型、传输距离、是否支持DDM和DDM信息。

在一些示例中,所述隔离所述故障的光模块,以及将所述故障的光模块信息发送至网络管理系统显示,以提醒管理员,包括:

记录所述故障的光模块所在端口的编号,以使定时器轮询该端口的情况下跳过该端口。

在一些示例中,所述调用检查程序确定与所述故障的光模块连接的I2C总线的数据线的低电平状态,从而确定I2C总线是否处于抱死状态,包括:

通过所述检查程序确定所述数据线是否在一定时间内持续处于低电平;

若持续处于低电平,则确定所述I2C总线处于抱死状态。

在一些示例中,所述控制I2C主机通过时钟线发送时钟信号,以解除I2C总线的挂死状态,包括:

控制I2C主机通过时钟线发送多次时钟信号,直至挂死的I2C从机释放数据线,以解除I2C总线的挂死状态。

本发明实施例的第二方面提供了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器,所述存储器上存储有能被所述处理器执行的计算机指令,所述指令被所述处理器执行,以使所述处理器能够实现如第一方面所述的方法。

本发明实施例的第三方面提供了一种非易失性计算机存储介质,存储有计算机指令,其特征在于,所述指令被设置为能够实现如第一方面所述的方法。

通过本发明实施例提供的光模块监控方法及相应方案,能够在检测到故障的光模块后主动上报,通知网络管理员排除故障,对于单点故障的光模块可以进行隔离,防止影响扩大,影响整机的I2C通信;当出现I2C总线挂死的情况时,通过软件即可恢复I2C通信,将故障影响到最低。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1示出了本发明实施例提供的光模块监控方法流程示意图;

图2示出了本发明实施例提供的光模块监控方法逻辑示意图;

图3示出了本发明实施例提供的设备框架示意图。

具体实施方式

为了更清楚的阐释本申请的整体构思,下面结合说明书附图以示例的方式进行详细说明。

网络设备交换机中光纤通信的使用越来越普及,光模块的使用越来越多,在实际的使用过程中,为了检测光纤链路信息质量,处理器(CPU,Central Processing Unit)会频繁通过I2C总线访问光模块DDM(Digital Diagnostic Monitoring)信息,而基于I2C总线的以下特性,会造成I2C总线挂死的情况。

I2C总线的特性包括:

1、I2C是由两根信号线(时钟线SCL和数据线SDA)组成的多主多从串行同步通信总线。

2、规范要求接入I2C的器件,SCL线和SDA线必须是双向开漏结构,通过总线上的上拉电阻拉到逻辑高电平,这样的结构可实现线与(&)功能。

线与(&)功能是指只要总线上任何一个器件拉低了SDA线或者SCL线,其他器件都无法拉高它们,看到的都是低电平。如果有器件不释放总线,则整个总线上的通讯都会被暂停,这种情况称为I2C总线挂死(I2C bus hangs)。

3、一般情况I2C的SDA只有在SCL为低电平的时候才能改变,为高电平的时候需要保持。对应到芯片则是上升沿采样,下降沿变化;

4、上述一般情况的两个例外情况是由主机发出的总线起始条件START(SCL为高时SDA由高变低)和停止条件STOP(SCL为高时SDA由低变高)。

CPU的I2C总线可通过软件控制,如果是I2C主机挂死,可以通过软件控制总线复位来解决I2C挂死问题,但如果是I2C从机(比如光模块)挂死,则整个系统复位都无法解除,仅整机重新上下电可以恢复,这在网络设备上很多时候都是不可接受的。

基于交换机都会不停轮询访问光模块的DDM信息来监控光纤链路的信号质量,DDM信息的获取通过I2C总线来实现,由于所有的I2C设备(光模块,电源,风扇,EEPROM)共用I2C总线,因此当出现某一个光模块故障导致I2C总线挂死时,会导致所有的I2C设备都无法访问。本发明实施例主要对网络设备的光模块进行监控,检测到光模块的I2C访问出现故障时,将故障光模块器件信息上报给控制器,提醒网络管理人员排除故障,并隔离故障光模块和恢复I2C总线,防止造成更大范围的故障。

下面结合附图,对本发明的具体实施例进行详细的介绍。

一方面,本发明实施例提供了一种光模块监控方法,图1示出了本发明实施例提供的光模块监控方法流程示意图,如图1所示,方法包括:

S101通过定时器确定每个端口的光模块状态,以确定故障的光模块;

具体而言,光模块状态主要包括光模块在位信息,光模块基本信息和DDM信息。

在一些示例中,光模块基本信息至少包括厂商信息、序列号、光模块类型、传输距离、是否支持DDM中的一种或多种。

在一些示例中,DDM信息至少包括电压、电流、温度、接收功率、发送功率等信息中的一种或多种。

S102隔离所述故障的光模块,以及将所述故障的光模块信息发送至网络管理系统显示,以提醒管理员;

具体而言,网络管理系统设置于与网络设备(比如交换机)通信连接的电子设备上,包括但不限于笔记本电脑、台式计算机、智能手机或者平板电脑等电子设备。

在一些示例中,通过SNMP(Simple Network Management Protocol,简单网络管理协议)协议将故障的光模块的设备信息和端口信息发送给网络管理系统,以提醒管理员排除故障。

S103调用检查程序确定与所述故障的光模块连接的I2C总线的数据线的低电平状态,从而确定所述I2C总线是否处于抱死状态;

S104若是,则控制I2C主机通过时钟线发送时钟信号,以解除I2C总线的挂死状态。

综上所述,基于I2C总线的特性,通过SDA线的低电平状态,确定I2C总线是否处于抱死状态,并及时通过时钟线对总线抱死的情况进行处理,将故障的影响降到最低。

图2示出了本发明实施例提供的光模块监控方法逻辑示意图,如图2所示,通过定时器确定每个端口的光模块状态,以确定故障的光模块,可以包括:所述定时器间隔一定时间遍历一次每个端口的光模块,通过是否能够读取光模块信息确定故障的光模块。

在一些示例中,需要首先通过每个端口的在位信息,确定该端口是否存在光模块,然后确定故障的光模块,具体包括:

定时器间隔一定时间遍历一次每个端口,读取每个端口的光模块在位信息;

若检测到光模块在位,则读取光模块信息;

若连续多次读取光模块信息失败,则标记该光模块故障。

在一些示例中,遍历的过程通过定时器轮询实现。

在一些优选的实施例中,为了防止因偶然除错的情况导致漏掉光模块的情况,定时器间隔一定时间遍历一次每个端口,读取每个端口的光模块在位信息,包括:

定时器间隔一定时间遍历一次每个端口;

若读取端口的光模块在位信息失败,则多次读取光模块信息,例如两次以上。

如上所述,I2C协议虽然简单,但是可靠性不算很高,因I2C总线具有或与结构的特点,在实际使用过程中,为了监测光链路信息质量,CPU会频繁通过I2C总线访问光模块DDM信息,若光模块出现故障则会出现I2C从机挂死的问题。为了防止定时器频繁访问光模块而导致I2C从机抱死的情况,本发明实施例还设置的隔离机制,在一些实施例中,隔离机制可以是:

记录所述故障的光模块所在端口的编号,以使定时器轮询该端口的情况下跳过该端口。

可以理解的是,可以将故障的光模块添加到地址黑名单中,或者其他的方式实现。

在确定故障的光模块之后,此时网络设备并不能完全确定I2C总线抱死,因此,通过I2C总线的SDA线的低电平状态进行进一步的确认。确认的过程包括:

通过检查程序确定所述数据线是否在一定时间内持续处于低电平;

若持续处于低电平,则确定I2C总线处于抱死状态。

在一些实施例中,低电平的持续时间可以是5秒左右或以上。

若为持续处于低电平,则继续其他端口的光模块访问。

相应的,在确定I2C总线处于抱死状态之后,可以通过软件的方式解除I2C总线的挂死状态,具体包括:

控制I2C主机通过时钟线发送多次时钟信号,直至挂死的I2C从机释放数据线,以解除I2C总线的挂死状态。

综上所述,本发明实施例能够在检测到故障的光模块后主动上报,通知网络管理员排除故障,对于单点故障的光模块可以进行隔离,防止影响扩大,影响整机的I2C通信;当出现I2C总线挂死的情况时,通过软件即可恢复I2C通信,将故障影响到最低。

基于同样的思路,本发明实施例还提供了上述方法对应的设备和非易失性计算机存储介质。

图3示出了本发明实施例提供的设备框架示意图,如图3所示,电子设备包括:处理器,以及与处理器通信连接的存储器,存储器上存储有能被处理器执行的计算机指令,该指令被处理器执行,以使处理器能够实现本发明实施例所述的光模块监控方法。

本发明实施例还提供了一种非易失性计算机存储介质,其上存储有计算机指令,该指令被设置为能够实现本发明实施例所述的光模块监控方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在申请中。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种基于梳齿切换的可重构光信道灵活提取系统和方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!