一种高速接口瞬断快速恢复的方法及系统

文档序号:1849507 发布日期:2021-11-16 浏览:3次 >En<

阅读说明:本技术 一种高速接口瞬断快速恢复的方法及系统 (Method and system for rapidly recovering instantaneous interruption of high-speed interface ) 是由 周慧 黄士超 于 2021-08-31 设计创作,主要内容包括:一种高速接口瞬断快速恢复的方法及系统,涉及光通信领域,方法包括:链路出现震荡且恢复稳定后,如果高速接口的lane通道个数大于1且出现通道故障,则强制出现故障的lane组的lane通道初始化,重新定帧并开始计时;如果出现故障的lane组内的lane通道在预设时间内没有全部恢复正常,则对出现故障的lane组的lane通道重新定帧,直至全部lane组无故障。本发明使多位宽的高速接口在链路瞬断情况下能够正常恢复,避免光线路保护倒换超时或者线路中断故障。(A method and a system for quickly recovering a high-speed interface transient interruption relate to the field of optical communication, and the method comprises the following steps: after the link vibrates and recovers to be stable, if the number of lane channels of the high-speed interface is more than 1 and a channel fault occurs, forcibly initializing the lane channels of the failed lane group, re-framing and starting timing; and if the lane channels in the lane group with the fault are not all recovered to be normal within the preset time, re-framing the lane channels of the lane group with the fault until all the lane groups have no fault. The invention enables the high-speed interface with multiple bit widths to be normally recovered under the condition of link instantaneous interruption, and avoids the overtime of optical line protection switching or line interruption faults.)

一种高速接口瞬断快速恢复的方法及系统

技术领域

本发明涉及光通信领域,具体来讲涉及一种高速接口瞬断快速恢复的方法及系统。

背景技术

IP网最重要的发展趋势是以太网化,数据业务的以太网化已经成为全球主导趋势;以太网技术的加速创新和演进,为面向未来全IP网络承载奠定了基石;灵活以太网成为未来网络发展的关键方向。在以太网诞生后的前30年中,产生了从10M—100GE的6种以太网速度:10M、100M、GE、10GE、40GE、100GE,基本是每10年速率10倍增长的发展趋势。但在最近3到5年时间里,以太网新速率开始呈现多维度演进,业界开始对另外新出现的6种速率的以太网感兴趣:其中包括25GE、50GE、200GE、400GE。目前标准在进展中的还有3种以太网速率(50GE、200GE、400GE)。从2015年起步,面向5G网络中的云服务、网络切片、AR(AugmentedReality,增强现实)/VR(Virtual Reality,虚拟现实技术)/超高清视频等时延敏感业务需求;通过接口技术创新,实现高速大端口400GE、1TE等演进以及通道化实现子速率承载、硬管道及隔离以及时延敏感网络技术;进一步构建智能端到端链路,实现可保障的IP低时延、高QoS服务的数据网络。高速以太网的快速发展,带来的并不仅仅是十倍速率的提升,在提升单一通道速率的同时,还会带来以太网综合性能的进一步提升。而高速以太网接口的创新,将使能更加广泛的应用。

传统的网络拓扑中,光线路保护往往配合OTN(Optical Transport Network,光传送网)设备使用,因此数据业务往往通过OTN设备承载后,包封成OTN信号配合链路瞬断恢复,且线路侧为彩光模块。当链路瞬断时,成帧芯片会发出空闲帧,从而和OTN对接的PTN(Packet Transport Network,分组传送网)/IPRAN(IP Radio Access Network,IP无线接入网)设备的数据业务不感知链路的瞬断。

随着城市建设道路施工较为频繁,经常出现光缆被损坏从而电层多次倒换的情况,为了提升用户体验,因此需要通过光线路保护来防止电层频繁倒换。由此出现了以太网直接配合光线路保护使用的场景。从而带来高速以太网接口需要在出现瞬断恢复后快速恢复的应用需求。且在城域短距离场景使用白光/灰光模块,模块内部的光电器件单元会导致skew值的差异,而包处理芯片无法主动感知链路的瞬断从而无法针对skew异常带来的问题进行处理,因此引入瞬断之后需要快速恢复的问题。

以往接口速率相对较低时,单个通道即可独立承载相应的流量,随着接口速率越来越高,高速率接口需要多条lane(通道)来承载。一条40/100G链路通过复用多条lane来实现,通常分为若干个25G通道或者10G通道。发送端通常把40/100G的流分成4个或者10个并行通道,在接收端把并行通道的码流再重组成40/100G流。在以太网接口协议中规定:使用PCS(Physical Coding Sublayer,物理编码子层)lanes之间的AM(Alignment marker)来进行多个PCS Lanes之间的对齐,只有当所有PCS lanes的AM对齐之后,PCS才能完成deskew的过程,进而开始Symbol码块恢复成以太网帧的过程。

在多Serderslane的接口协议中(如:100GE CAUI-4使用4对25.78125Gbps的serders),在光层保护切换并恢复光信号的过程中,如果光模块内部多个激光器打开收光的时间间隔大于PCS lane之间能容忍的deskew范围,则会导致多个PCS lane之间的AM码块无法对齐,进而造成端口无法link从而无法恢复数据流。

发明内容

针对现有技术中存在的缺陷,本发明的目的在于提供一种高速接口瞬断快速恢复的方法及系统,使多位宽的高速接口在链路瞬断情况下能够正常恢复,避免光线路保护倒换超时或者线路中断故障。

为达到以上目的,一方面,采取一种高速接口瞬断快速恢复的方法,包括:

链路出现震荡且恢复稳定后,如果高速接口的lane通道个数大于1且出现通道故障,则强制出现故障的lane组的lane通道初始化,重新定帧并开始计时;

如果出现故障的lane组内的lane通道在预设时间内没有全部恢复正常,则对出现故障的lane组的lane通道重新定帧,直至全部lane组无故障。

优选的,所述方法的触发条件为:根据前级光模块的硬件LOS管脚判断链路是否出现过中断,若出现过中断,则触发所述方法。

优选的,判断所述链路出现震荡且恢复稳定的方式包括:

链路出现过中断后,多次连续检测链路状态,若出现多次中断且恢复的情况,则在链路稳定且持续可检测到信号帧头后,再通过所述硬件LOS管脚读取信号持续正常,确定链路出现震荡且恢复稳定。

优选的,所述高速接口的lane通道故障通过读取PCS层lane状态判断,并且根据PCS层lane状态,查询读取高速接口信息,获取lane通道个数。

优选的,每个所述lane通道对应的定帧方式由芯片类型确定;所述预设时间小于20ms。

另一方面,提供一种高速接口瞬断快速恢复的系统,包括:

检测去抖模块,用于检测链路是否出现震荡;

PCS状态查询模块,用于在链路恢复稳定后,获取高速接口的lane通道个数,以及判断lane通道是否故障;

lane定帧模块,用于在高速接口的lane通道个数大于1且出现通道故障时,强制出现故障的lane组的lane通道初始化,重新定帧;

定时器,用于对lane定帧模块重新定帧进行计时;

控制模块,用于判断链路是否恢复稳定,并通过检测去抖模块通知PCS状态查询模块;还用于根据PCS状态查询模块的lane通道个数和故障消息,控制lane定帧模块强制重新定帧;还用于控制定时器在重新定帧开始时计时。

优选的,还包括lane状态记录和判定模块,用于定时记录lane组和lane通道状态,分析判断故障lane组的lane通道在定时器计时周期内是否完成定帧过程,并将结果返回给控制模块。

优选的,所述控制模块还用于根据前级光模块的硬件LOS管脚判断链路是否现过中断,并在链路出现过中断后,触发检测去抖模块检测去抖。

优选的,所述检测去抖模块用于在链路现过中断后,多次连续检测链路状态,若出现多次中断且恢复的情况,则在链路稳定且持续可检测到信号帧头后;再由控制模块读取硬件LOS管脚信号持续正常,确定链路出现震荡且恢复稳定。

优选的,所述PCS状态查询模块,用于通过读取PCS层lane状态判断lane通道是否故障;还用于根据PCS层lane状态,查询读取高速接口信息,获取lane通道个数。

上述技术方案中的一个具有如下有益效果:

当链路因中断出现震荡且恢复稳定后,以PCS状态异常来触发整个高速接口恢复机制,促使lane通道重新同时进行定帧,使得接收数据可以对齐从而恢复数据流。定帧完成后定时检测记录所有lane通道状态,最终实现高速接口lane通道正常接收数据,链路恢复;使多位宽的高速接口在链路瞬断情况下能够正常恢复,避免光线路保护倒换超时或者线路中断故障。

附图说明

图1为本发明实施例高速接口瞬断快速恢复的系统示意图;

图2为本发明实施例高速接口瞬断快速恢复的方法流程图。

附图说明

10、检测去抖模块;20、PCS状态查询模块;30、lane定帧模块;40、定时器;50、lane状态记录和判定模块;60、控制模块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明提供一种高速接口瞬断快速恢复的方法,包括步骤:

当链路出现震荡且恢复稳定后,如果高速接口的lane通道个数大于1且出现通道故障,则强制出现故障的lane组的lane通道初始化,重新定帧并开始计时;

如果出现故障的lane组内的lane通道在预设时间内没有全部恢复正常,则对出现故障的lane组的lane通道重新定帧,直至全部lane组无故障。

上述方法能够实现多位宽的高速接口在链路瞬断情况下能够正常恢复,避免光线路保护倒换超时或者线路中断故障。

触发上述高速接口瞬断快速恢复方法的条件是,根据前级光模块的硬件LOS管脚判断链路是否出现过中断,若出现中断,则触发上述方法。

进一步的,在上述方法触发之后,提供一个判断链路出现震荡且恢复稳定的实施例,即,通过多次连续检测链路状态,根据链路在连续检测周期内的状态变化(链路通断),来判断链路是否出现震荡,若出现多次中断且恢复的情况,则在链路稳定且持续可检测到信号帧头后,从而达到去抖效果,防止误判或链路震荡时多次进行lane定序影响链路恢复时间。再通过硬件LOS管脚读取信号持续正常,确定链路出现震荡且恢复稳定。具体的,读取硬件LOS管脚信号时,如果读取到0,则为链路正常,如果读取到1,则为链路故障。读取硬件LOS管脚信号的方式,可以更加直接段判断链路是否恢复稳定。

进一步的,上述高速接口的lane通道故障通过读取PCS层lane状态判断,lane状态为up时,说明通道正常,此时不做任何处理;lane状态为down时,说明通道故障,需要强制出现故障的lane组的lane通道初始化,重新定帧。另外,上述lane通道个数,也是根据PCS层lane状态,查询读取高速接口信息来获取。

针对每个lane通道都有对应的定帧方式,虽然芯片的接口都是采用多个lane通道来传递数据,但是由于不同芯片的成帧类型的不同,定帧的方式也各不相同,例如包处理芯片采用AM帧头定帧。

在一些实施例中,通过设置定时器的方式,对lane通道的重新定帧进行计时,定帧周期可以自行设置,由于整个处理时间要求在50ms以内,如果设置过大可能导致一个周期内不成功,第二个周期处理会失败,因此定帧周期建议小于20ms。在定帧周期后,如果读取lane通道状态依然异常,则认为该次重新定帧失败,需要再次进行重新定帧;如果读取lane通道状态正常,说明重新定帧成功。

如图1所示,提供一种高速接口瞬断快速恢复的系统的实施例。本实施例中,系统包括检测去抖模块10、PCS状态查询模块20、lane定帧模块30、定时器40和控制模块60。

其中,检测去抖模块10,用于检测链路是否出现震荡。具体的,检测去抖模块10会多次连续检测链路状态,并根据链路在连续检测周期内状态变化(链路通断)分析判断链路是否出现震荡,如出现多次中断恢复的情况,则在链路稳定且持续可检测到信号帧头后再进行下一步操作,从而达到去抖效果,防止误判或链路震荡时多次进行lane定序影响链路恢复时间。

PCS状态查询模块20,用于在检测去抖模块10进行处理后,链路恢复稳定的情况下,获取高速接口的lane通道个数,以及判断lane通道是否故障。具体的,PCS状态查询模块20读取高速接口信息,获取lane通道个数;同时,还通过读取PCS层lane状态是up还是down来进行判断,并将读取到的lane状态返回给控制模块60,如果lane状态是up,则不做任何处理;如果lane状态是down,且高速接口的lane通道个数大于1,控制模块60启动lane定帧模块30。

lane定帧模块30,用于在高速接口的lane通道个数大于1且出现lane通道故障时,强制出现故障的lane组的lane通道初始化,重新定帧。

定时器40,用于对lane定帧模块重新定帧进行计时。优选的,定帧周期设置在20ms内,如果在20ms内读取lane组状态恢复正常,则认为重新定帧成功;如果在20ms或大于20ms读取lane状态依然异常,则认为该次重新定帧失败,需要再次进行定帧。

控制模块60,用于判断链路是否恢复稳定,并通过检测去抖模块10通知PCS状态查询模块20;还用于根据PCS状态查询模块20的lane通道个数和故障消息,控制lane定帧模块30强制重新定帧;还用于控制定时器40在重新定帧开始时计时。进一步的,控制模块60会根据前级光模块的硬件LOS管脚判断链路是否出现过中断,如出现过中断,则会触发检测去抖模块10进入检测去抖流程。

在一些实施例中,上述系统还包括lane状态记录和判定模块50,用于定时记录lane组和lane通道状态,分析判断故障lane组的lane通道在定时器40的计时周期内是否完成定帧过程,并将结果返回给控制模块60。具体的,lane通道状态需要在定时器40的定帧周期内判断,lane通道的状态信息可以通过lane状态记录和判定模块50获取并记录,正常状态下即表示完成定帧,lane状态记录和判定模块50可以设置为5ms轮询机制。

如图2所示,结合上述系统,提供一个高速接口瞬断快速恢复方法的具体实施例,包括如下步骤:

S101.控制模块60根据前级光模块的硬件LOS管脚,判断出现过中断,触发检测去抖模块10。

S102.检测去抖模块10判断链路是否出现震荡并且恢复稳定,如果是,进入S103;如果否,继续进行检测。

S103.PCS状态查询模块20判断高速接口的lane通道个数是否大于1并且lane通道故障,若是(即lane通道个数大于1且lane通道故障),进入S104;否则,进入S102。

S104.启动定时器40,用于记录lane通道初始化定帧时间,防止lane通道出现初始化定帧超时情况。同时强制出现故障的lane组的所有lane通道进入初始化状态,重新定帧。

S105.lane状态记录和判定模块50获取lane组的状态,记录各个lane组的状态,判断lane组状态是否正常,如果是,则不做任何处理,结束本次流程;如果否,进入S106。

S106.lane状态记录和判定模块50,判断故障lane组内的各个lane通道状态并记录。

S107.根据记录的lane通道状态,判断所有lane组内的lane通道是否都回复正常,如果是,转入S102;如果否,进入S108。

S108.判断lane通道恢复时间是否超过定时器40设定时间,如果是,转入S104;如果否,转入S105,继续记录lane通道状态并判断。

当链路出现过中断后,即使链路曾经断开后又回复正常,也马上进行上述处理流程,最终实现高速接口lane通道正常接收数据,可以使多位宽的高速接口在链路瞬断情况下能够正常恢复,避免光线路保护倒换超时或者线路中断故障。

本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种手持式PON模拟系统的分析方法和装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!