一种基于wqe反压的qp的流控方法

文档序号:48898 发布日期:2021-09-28 浏览:18次 >En<

阅读说明:本技术 一种基于wqe反压的qp的流控方法 (QP flow control method based on WQE back pressure ) 是由 陈昌明 陈绪金 李志宏 于 2021-06-25 设计创作,主要内容包括:本发明涉及流量控制方法相关领域,具体为一种基于WQE反压的QP的流控方法,包括计时器、QP仲裁模块、QP管理模块、WQE-FIFO储存器、包发送模块、QP寄存器模块、QP2受控寄存器、QP3正常寄存器、SQ2基地址寄存器和SQ3基地址寄存器,本发明通过计时器和QP仲裁模块的配合来精确控制调度时间,从而控制WQE中数据包的发送间隔,实现基于QP流量的精确控制;通过WEQ-FIFO储存器的自查,将QP2受控寄存器的所有WQE从FIFO中清除,保留QP3正常寄存器中非受控QP的WQE,使非受控QP的操作不受影响;将QP2受控寄存器当前执行WQE的指针回写对应的QP寄存器的WQE当前指针寄存器中,进行反压操作,从而使得该WQE可以被不断的重复调用,直到按照流控的要求完成数据发送为止,实现基于WQE反压的流控。(The invention relates to the related field of flow control methods, in particular to a flow control method of QP based on WQE back pressure, which comprises a timer, a QP arbitration module, a QP management module, a WQE _ FIFO storage, a packet sending module, a QP register module, a QP2 controlled register, a QP3 normal register, an SQ2 base address register and an SQ3 base address register, wherein the invention accurately controls the scheduling time by matching the timer and the QP arbitration module, thereby controlling the sending interval of data packets in WQE and realizing accurate control based on QP flow; through self-checking of WEQ _ FIFO storage, all WQEs of the QP2 controlled register are cleared from the FIFO, and WQEs of uncontrolled QP in a QP3 normal register are reserved, so that the operation of the uncontrolled QP is not influenced; and writing the pointer of the currently executed WQE of the QP2 controlled register into the WQE current pointer register of the corresponding QP register, and performing backpressure operation, so that the WQE can be continuously and repeatedly called until data transmission is completed according to the requirement of flow control, and flow control based on the WQE backpressure is realized.)

一种基于WQE反压的QP的流控方法

技术领域

本发明涉及流量控制方法相关领域,具体为一种基于WQE反压的QP的流控方法。

背景技术

随着RoCEv2(RDMA over Converged Ethernet v2)技术的成熟,RDMA可以部署在数据中心已有的网络设施上,在大规模数据中心中部署RoCEv2,首先面临的问题是如何保证RDMA的可靠传输。一旦发生丢包,通常会惩罚性地乘性减慢发送速率,并重传丢弃的数据包,用户会感受到突发的性能降级。流量控制可以有效的降低丢包概率,保证可靠性传输。

所以要想发挥出RDMA真正的性能,突破数据中心大规模分布式系统的网络性能瓶颈,势必要为RDMA搭建一套不丢包的无损网络环境,而实现不丢包的关键就是解决网络拥塞。流量控制用于防止端口阻塞的情况下丢帧。

现有的流控方法是在每个受控QP的发送端放置一个缓存区,将需要发送的数据包先缓存在缓存区中,然后按照每个QP流量配置进行数据发送,从而实现基于QP的流控。但是这种方法存在着一些缺点,比如:在每个受控QP发送端增加了一个数据包缓存区,增加了额外的发送延时,增加了额外的缓存区管理及调度逻辑,增加了系统的负复杂度,增加内存的消耗也增加了成本;该方法由于缓存区大小的限制,导致受控QP的个数有限,无法在受控QP数量大的应用中使用;RDMA数据传输时,理论上支持的QP个数为2的24次方个,实际使用中,QP的个数通常在兆级甚至更多,导致该方法无法在RDMA通信的应用中成为基于QP流控的通用解决方案。针对上述一些问题,设计了一种基于WQE反压的QP的流控方法。

发明内容

本发明的目的在于提供一种基于WQE反压的QP的流控方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种基于WQE反压的QP的流控方法,包括计时器、QP仲裁模块、QP管理模块、WQE_FIFO储存器、包发送模块、QP寄存器模块、QP2受控寄存器、QP3正常寄存器、SQ2基地址寄存器和SQ3基地址寄存器,其流控方法如下:

步骤1、根据QP仲裁模块选定QP,QP管理模块由选定的结果从QP寄存器中读取该QP信息,再从对应的SQ2基地址寄存器中读取待执行的WQE,然后将WQE写入WQE_FIFO储存器中;

步骤2、包发送模块从WQE_FIFO储存器读取SQ2基地址寄存器中的WQE2_1,并根据WQE2_1中指定的数据长度,计算出需要分开发送数据包的总个数n;

步骤3包发送模块再根据QP2受控寄存器预先设置的流量,计算出本次发送数据包的个数m,并将m个数据包发送出去,并且包发送模块触发流控标志;

步骤4、将步骤3中的流控标志发送给WQE_FIFO储存器,接收到的流控标志的WQE_FIFO储存器通过自查将QP2受控寄存器的所有WQE2_1和WQE2_2清除,同时将QP3正常寄存器的WQE按原来的顺序置顶;

步骤5、将步骤3中的流控标志发送给QP管理模块后,QP管理模块将包计数值m回写到QP2受控寄存器的WQE当前指针寄存器中进行反压;

步骤6、将步骤3中的流控标志发送给计时器后,计时器根据QP2受控寄存器预先设定的流量,计算出间隔发送m个数据包的时间间隔,并进行计时;

步骤7、在步骤6中计时器开始计时后,包发送模块继续读取WQE3_1和WQE3_2执行QP3正常寄存器的操作;

步骤8、在步骤6中计时器计时完毕后,QP仲裁模块重新选中QP2受控寄存器,然后QP管理模块重新将WQE2_1读取出来并写入WQE_FIFO储存器;

步骤9、包发送模块读取步骤8中WQE_FIFO储存器内的WQE2_1,并发送m个数据包,同时再一次触发流控标志;

步骤10、重复步骤3到步骤9的操作,每次等间隔的调度WQE2_1并发送m个数据包,直到所有的n个数据包发送完毕为止,并且将QP2受控寄存器的WQE包计数寄存器清零。

优选的,所述步骤2中数据包的最大数据长度为4096Byte。

优选的,所述QP2受控寄存器需要执行的发送任务WQE2_1、WQE2_2及WQE2_3,所述QP3正常寄存器需要执行的发送任务WQE2_1和WQE2_2。

优选的,所述步骤3中发出的m个数据包,其中第一个包标记为First,后续的m-1个包标记为Middle,所述步骤9发出的m个数据包都标记为Middle,所述步骤10中发送的最后一个数据包标记为Last。

与现有技术相比,本发明的有益效果是:本发明通过计时器和QP仲裁模块的配合来精确控制调度时间,从而控制WQE中数据包的发送间隔,实现基于QP流量的精确控制;通过WEQ_FIFO储存器的自查,将QP2受控寄存器的所有WQE从FIFO中清除,保留QP3正常寄存器中非受控QP的WQE,使非受控QP的操作不受影响;将QP2受控寄存器当前执行WQE的指针回写对应的QP寄存器的WQE当前指针寄存器中,进行反压操作,从而使得该WQE可以被不断的重复调用,直到按照流控的要求完成数据发送为止,实现基于WQE反压的流控。

附图说明

图1为本发明的工作流程示意图;

图2为本发明的步骤2中各个模块工作流程图;

图3为本发明的步骤7中各个模块工作流程图;

图4为本发明的流控制效果图。

图中:1、计时器;2、QP仲裁模块;3、QP管理模块;4、WQE_FIFO储存器;5、包发送模块;6、QP寄存器;7、QP2受控寄存器;8、QP3正常寄存器;9、SQ2基地址寄存器;10、SQ3基地址寄存器。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-4,本发明提供一种技术方案:一种基于WQE反压的QP的流控方法,包括计时器1、QP仲裁模块2、QP管理模块3、WQE_FIFO储存器4、包发送模块5、QP寄存器模块6、QP2受控寄存器7、QP3正常寄存器8、SQ2基地址寄存器9和SQ3基地址寄存器10,其流控方法如下:

步骤1、根据QP仲裁模块2选定QP,QP管理模块3由选定的结果从QP寄存器6中读取该QP信息,再从对应的SQ2基地址寄存器9中读取待执行的WQE,然后将WQE写入WQE_FIFO储存器4中;

步骤2、包发送模块5从WQE_FIFO储存器4读取SQ2基地址寄存器9中的WQE2_1,并根据WQE2_1中指定的数据长度,计算出需要分开发送数据包的总个数n,此时各个模块的状态如图2所示;

步骤3包发送模块5再根据QP2受控寄存器7预先设置的流量,计算出本次发送数据包的个数m,并将m个数据包发送出去,并且包发送模块5触发流控标志;

步骤4、将步骤3中的流控标志发送给WQE_FIFO储存器4,接收到的流控标志的WQE_FIFO储存器4通过自查将QP2受控寄存器7的所有WQE2_1和WQE2_2清除,同时将QP3正常寄存器8的WQE按原来的顺序置顶;

步骤5、将步骤3中的流控标志发送给QP管理模块3后,QP管理模块3将包计数值m回写到QP2受控寄存器7的WQE当前指针寄存器中进行反压;

步骤6、将步骤3中的流控标志发送给计时器1后,计时器1根据QP2受控寄存器7预先设定的流量,计算出间隔发送m个数据包的时间间隔,并进行计时;

步骤7、在步骤6中计时器1开始计时后,包发送模块5继续读取WQE3_1和WQE3_2执行QP3正常寄存器8的操作,此时各个模块的状态如图3所示;

步骤8、在步骤6中计时器1计时完毕后,QP仲裁模块重新选中QP2受控寄存器7,然后QP管理模块3重新将WQE2_1读取出来并写入WQE_FIFO储存器4;

步骤9、包发送模块5读取步骤8中WQE_FIFO储存器4内的WQE2_1,并发送m个数据包,同时再一次触发流控标志;

步骤10、重复步骤3到步骤9的操作,每次等间隔的调度WQE2_1并发送m个数据包,直到所有的n个数据包发送完毕为止,并且将QP2受控寄存器7的WQE包计数寄存器清零。

进一步的,步骤2中数据包的最大数据长度为4096Byte。

进一步的,QP2受控寄存器7需要执行的发送任务WQE2_1、WQE2_2及WQE2_3,QP3正常寄存器8需要执行的发送任务WQE2_1和WQE2_2。

进一步的,所述步骤3中发出的m个数据包,其中第一个包标记为First,后续的m-1个包标记为Middle,所述步骤9发出的m个数据包都标记为Middle,所述步骤10中发送的最后一个数据包标记为Last。

其中将RDMA设定最大传输长度PMTU(Path Maximum Transfer Unit)为1024Bytes;QP2受控寄存器7的流量设置为10Mb/S,WQE2_1发送的数据包长度为10Mbit。则通过上述的前提假设和流控逻辑,可以得出每秒发送包的总个数n=10240个(10Mb/1024Byte),设定每秒发送1024次(计时器控制每976562.5ns触发一次发送操作),每次发送包的个数m=10,通过精确的控制间隔时间,可以精确的控制QP的流量,控制效果如图5所示。

本发明通过计时器1和QP仲裁模块2的配合来精确控制调度时间,从而控制WQE中数据包的发送间隔,实现基于QP流量的精确控制;通过WEQ_FIFO储存器4的自查,将QP2受控寄存器7的所有WQE从FIFO中清除,保留QP3正常寄存器8中非受控QP的WQE,使非受控QP的操作不受影响;将QP2受控寄存器7当前执行WQE的指针回写对应的QP寄存器6的WQE当前指针寄存器中,进行反压操作,从而使得该WQE可以被不断的重复调用,直到按照流控的要求完成数据发送为止,实现基于WQE反压的流控。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

8页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:适用于纯用户态远端直接内存访问的数组结构及优化方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!