组合式螺母驱动型液体静压丝杠副、伺服进给系统及方法

文档序号:494373 发布日期:2022-01-07 浏览:7次 >En<

阅读说明:本技术 组合式螺母驱动型液体静压丝杠副、伺服进给系统及方法 (Combined nut-driven hydrostatic lead screw pair, servo feeding system and method ) 是由 冯显英 刘延栋 苏哲 李慧 于 2021-12-08 设计创作,主要内容包括:本发明属于超精密加工领域,公开了一种组合式螺母驱动型液体静压丝杠副、伺服进给系统及方法,其中组合式螺母驱动型液体静压丝杠副包括丝杠和组合式液体静压螺母组件;组合式液体静压螺母组件中除连接支架、第一衬套和第二衬套外均可选用标准件,通过调整连接支架、第一衬套和第二衬套的结构尺寸可以最大限度的适配现有液体静压轴承、液体静压丝杠副和空心电机等实际产品。本发明解决了现有螺母主驱动型液体静压丝杠副技术存在的结构复杂、加工成本高等问题。(The invention belongs to the field of ultra-precision machining and discloses a combined nut-driven hydrostatic lead screw pair, a servo feeding system and a method, wherein the combined nut-driven hydrostatic lead screw pair comprises a lead screw and a combined hydrostatic nut component; except the connecting support, the first lining and the second lining, the combined type hydrostatic nut component can adopt standard parts, and the structure size of the connecting support, the first lining and the second lining can be adjusted to adapt to actual products such as the existing hydrostatic bearing, the hydrostatic lead screw pair and the hollow motor to the maximum extent. The invention solves the problems of complex structure, high processing cost and the like of the existing nut main drive type hydrostatic pressure screw pair technology.)

组合式螺母驱动型液体静压丝杠副、伺服进给系统及方法

技术领域

本发明属于超精密加工领域,具体公开了一种组合式螺母驱动型液体静压丝杠副、伺服进给系统及方法。

背景技术

超精密加工技术已经成为国防与高新技术发展的关键技术,随着高科技产品对零部件的加工精度要求不断提高,超精密机床需要满足更为严苛的性能指标。实现超精密加工技术的瓶颈之一是如何在加工过程中使刀具或工件实现精确、均匀的微量进给控制。常规的机电传动系统由于受到低速爬行现象的影响很难适用于微纳级分辨率的微量进给,当前微纳尺度位移多是基于智能材料的电、磁、热、光、声致效应等驱动实现的。

现有技术文献中,发明专利CN104714485B:《一种微型高精度微量进给伺服系统及控制方法》中提出了双驱动丝杠副高精度微量进给伺服系统,可实现超精密、高精度加工中的精确微小位移控制,但受限于滚珠丝杠副自身滚珠不均匀性、滚道螺旋几何误差以及滚道表面粗糙度等缺陷因素,精度较难达到纳米级精度。

再有,发明专利CN108788878A:《一种螺母驱动型静压丝杠副》与发明专利CN112077638B:《一种集成液体静压螺母主驱动型丝杠副直线进给单元》中均提出了螺母主驱动型的液体静压丝杠副方案,液体静压丝杠副由于丝杠与静压丝杠螺母之间通过液体油膜支撑,具有低摩擦、高刚度、高精度以及阻尼好等优越特性,虽然可解决发明专利CN104714485B所存在的不足,但发明专利CN108788878A与发明专利CN112077638B所提出的技术实现方案无法利用现有的静压轴承与静压丝杠螺母产品进行实现,均需要对其使用的静压轴承与静压丝杠螺母重新设计加工,加工工艺较为复杂,制造成本及后期使用维护成本较高。

在发明专利CN104714485B中公开了一种滚珠丝杠副的双驱动高精度微量进给控制方法。然而,液体静压丝杠副与滚珠丝杠副传动机理有明显区别,双驱液体静压丝杠副组成的大行程超精度微量进给系统是一个多变量、强耦合性、强非线性的受控对象,在进行超精密加工进给时,液体静压丝杠副自身存在的螺距误差、同轴度误差以及在不同转速下各液体支撑油膜中不断变化的阻尼等干扰因素都给大行程、超精密的微纳级分辨率的微量进给控制进给带来巨大挑战。常规的基于模型的运动控制方法对模型的依赖性较强,设计过程较为复杂且无法充分发挥出双驱液体静压丝杠副超精密进给时的优势,特别是对未知加工任务以及模型不确定性的适应性非常有限,难以应对复杂多变的超精密加工场景。

发明内容

本发明要解决的技术问题在于克服现有技术不足,提供一种组合式螺母驱动型液体静压丝杠副、伺服进给系统及方法;一方面解决了现有螺母主驱动型液体静压丝杠副技术存在的结构复杂、加工成本高等问题;另一方面解决现有双驱丝杠副差速微进给技术控制方法简化的数学模型无法精确描述大行程、高精度进给系统运动特性以及多种干扰因素造成的控制效果恶化等问题,实现微纳运动伺服进给系统的超精密控制。

本发明具体采用以下技术方案解决上述问题:

第一方面,本发明提出了一种组合式螺母驱动型液体静压丝杠副,包括丝杠和组合式液体静压螺母组件;所述的组合式液体静压螺母组件包括双锥液体静压轴承、第一衬套、第二衬套、空心电机、连接支架、密封圈、液体静压丝杠螺母;

液体静压丝杠螺母与丝杠配合,在液体静压丝杠螺母的外圈中部设有法兰盘;法兰盘一侧与第一衬套相连,另一侧与第二衬套相连;双锥液体静压轴承安装在第一衬套的外圈与第一衬套配合,两者之间具有缝隙;且双锥液体静压轴承的外圈固定在连接支架上,连接支架、双锥液体静压轴承外圈以及第一衬套形成密闭空间,在第一衬套的外圈设有排油槽,其与双锥液体静压轴承内圈形成排油通道;所述第二衬套与空心电机转子固连;空心电机定子与连接支架固连。

作为进一步的技术方案,所述的第一衬套、第二衬套的内圆周面均加工有圆弧凹槽。

作为进一步的技术方案,所述的第二衬套与编码器码盘轴套固连;编码器码盘与编码器码盘轴套固连。

作为进一步的技术方案,读数头支架通过螺栓长孔与空心电机定子固连,读数头支架通过安装孔与编码器读数头固连。

第二方面,本发明还提供了一种大行程高精度伺服进给系统,包括前面所述的组合式螺母驱动型液体静压丝杠副;还包括伺服电机、第一控制模块、第二控制模块、智能决策模块、位移检测装置、测距装置和工作台;丝杠的两端与液体静压轴承相连,液体静压轴承通过轴承支座支撑;伺服电机驱动所述丝杠;伺服电机通过第一控制模块控制;空心电机通过第二控制模块控制;测距装置安装在液体静压丝杠螺母中实时测得丝杠与螺母之间的油膜厚度;位移检测装置实时检测工作台移动的位置信息;测距装置、位移检测装置与智能决策模块相连,智能决策模块与第一控制模块、第二控制模块相连。

第三方面,本发明还提供了一种大行程高精度伺服进给系统的控制方法,包括以下步骤:

测距装置将实时测得的丝杠与螺母之间的油膜厚度发送给智能决策模块;位移检测装置将实时检测的工作台移动的位置信息发送给智能决策模块;智能决策系统根据实时采集的信号,将动作指令发送至第一控制模块和第二控制模块;第一控制模块和第二控制模块控制相应的电机动作;同时测距装置和位移检测装置再次将实时测得的油膜厚度和工作台移动的位置信息发送给智能决策模块;智能决策模块判断油膜厚度和工作台的位置信息是否已达设定要求,若是,则将停止指令发送至第一控制模块和第二控制模块,相应电机不再动作;若否,则继续将动作指令发送至第一控制模块和第二控制模块;第一控制模块和第二控制模块控制相应的电机动作,直到达到设定要求。

作为进一步的技术方案,所述的智能决策系统的构建过程如下:

步骤1初始化进给平台进给状态,设定的微进给速度V Aim、丝杠初始速度为V s、螺母电机初始速度V n=V s-V Aim、且V n大于进给系统不可回避、非线性的回转爬行速度V c

步骤2进给平台运动至第一状态量S(t);

步骤3将当前状态S(t)输入到Actor网络,Actor网络使用策略梯度进行策略选择获得期望动作A(t);根据动作指令调整ΔV s(t)与ΔV sn(t);

其中,ΔV s(t)∈[-V smallV small];其中V small为在双驱液体静压丝杠副双驱差动超精密进给时对丝杠电机V s微调整的最大值;ΔV sn(t) ∈[0,V max-V s],V max为丝杠电机或螺母电机可达到的最大速度;

步骤4:进给平台执行动作A(t),获得奖励值R(S(t)A(t)),到达位置反馈模块与油膜厚度反馈输出的第二状态量S(t+1);

步骤5:将数据组【S(t),A(t),R(S(t),A(t) ),S(t+1)】存入样本容量为N的经验数据池;

步骤6:在经验数据池中随机抽取多个样本数据用于Actor网络与Critic网络训练;

步骤7:最小化损失函数L(θQ)更新Critic网络参数θQ

步骤8:通过梯度下降法更新Actor网络参数θ μ ;判断是否达到最大步数或网络收敛,若否,回到步骤(3)继续循环;若是,结束。

本发明的有益效果如下:

1.本发明提出的组合式螺母驱动型液体静压丝杠副,通过对现有的液体

静压丝杠副和液体静压轴承实际产品进行组合即可实现液体静压丝杠副螺母主驱动。除连接支架、第一衬套和第二衬套外均可选用标准件,通过调整连接支架、第一衬套和第二衬套的结构尺寸可以最大限度的适配现有液体静压轴承、液体静压丝杠副和空心电机等实际产品。由于液体静压螺母节流方式的不同使其外形存在差异,而第一衬套、第二衬套的内圆周面均加工有圆弧凹槽,该特殊的结构设计可保证其可以适配不同外形的主流液体静压丝杠螺母。除连接支架中进油孔以及环形内槽外,无需增加额外的供油油路。本发明克服了原有技术需对液体静压轴承和液体静压丝杠副本体重新设计的不足,最大限度的利用现有成熟的液体静压轴承与液体静压丝杠副技术,可有效保证正常运行过程中的可靠性、大幅降低技术难度并且加工及使用维护成本更低。

2.本发明提出的一种基于深度强化学习的大行程高精度微纳运动伺服进给系统及控制方法,将工作台的超精密微量进给建模为马尔可夫决策过程,引入深度强化学习算法控制双驱液体静压丝杠副,实现动态环境下超精密微量进给。与常规基于模型的运动控制方法相比,基于深度强化学习的双驱液体静压丝杠副控制方法不依赖外部环境,适用于多变量、强耦合性、强非线性的大行程高精度微纳运动场景,具有较好的鲁棒性。

在保证微量高精度进给的同时,通过同时增加或减少丝杠转速与螺母转速可实时调整液体静压丝杠副中液体油膜的动压效应,以应对液体静压丝杠副各种复杂的外部负载,保证工作台的进给精度不受丝杠螺母位移波动的影响。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1是基于深度强化学习的微纳运动伺服进给系统控制原理图;

图2是基于策略与评价的深度强化学习方法框架结构图;

图3是组合式螺母驱动型液体静压丝杠副的整体结构示意图;

图4是轴承内圈衬套三维结构示意图;

图5是轴承内圈衬套二维结构示意图;

图6是空心电机转子衬套结构示意图;

图7是读数头支架结构示意图;

图8是连接支架结构示意图;

图9是编码器码盘轴套结构示意图;

图中:1底座、2伺服电机、3联轴器、4液体静压轴承支座、5丝杠、6组合式液体静压螺母组件、7液体静压轴承支座、8可承受径向负载的液体静压轴承、9液体静压导轨、10位移检测装置、11工作台、12可承受轴径向负载的液体静压轴承、13电机支座、14非接触式测距装置;

601双锥液体静压轴承内圈、602双锥液体静压轴承外圈、603轴承内圈衬套、604空心电机转子衬套、605空心电机转子、606空心电机定子、607编码器码盘轴套、608编码器码盘、609编码器读数头、610读数头支架、611连接支架、612密封圈、613液体静压丝杠螺母;

6031轴承内圈衬套外圆周面,6032安装孔,6033安装孔,6034排油槽,6035圆弧凹槽;

6041安装孔,6042安装孔,6043安装孔,6044圆弧凹槽;

6101螺栓长孔,6102长孔,6103安装孔,6111连接孔,6112安装孔,6113环形凹槽,6114环形油槽, 6115进油孔,6071锥型内表面。

具体实施方式

应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本发明使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非本发明另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合;

为了方便叙述,本发明中如果出现“上”、“下”、“左”、“右”字样,仅表示与附图本身的上、下、左、右方向一致,并不对结构起限定作用,仅仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本发明的限制。

术语解释部分:本发明中的术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或为一体;可以是机械连接,也可以是电连接,可以是直接连接,也可以是通过中间媒介间接相连,可以是两个元件内部连接,或者两个元件的相互作用关系,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明的具体含义。

名词解释:本发明中的“大行程”是指丝杠整体行程大于100mm,可以扩展到1.5m-2m以上。“高精度”是指位移分辨率在0.01μm-1nm左右。

正如背景技术所介绍的,现有技术中存在的不足,为了解决如上的技术问题,本发明提出了一种组合式螺母驱动型液体静压丝杠副、伺服进给系统及方法;基于设计的组合式螺母驱动型液体静压丝杠副,让微纳运动伺服进给系统在加工过程中主动进行探索,并根据进给系统最终输出的微进给精度以及液体静压丝杠副中油膜厚度对自身行为进行评估,根据评估结果不断优化自身进给控制策略,最终在大量训练过程中累积经验,逐步学习直至获得适用于超精密微纳运动伺服进给系统的最优控制策略,实现在不同超精密加工场景中的微纳级分辨率微量进给运动。

利用深度神经网络将超精密进给过程中微进给量以及油膜厚度与丝杠旋转速度、螺母旋转速度建立映射关系,基于深度强化学习算法实时调整丝杠转速或螺母转速以使得工作台获得稳定、超高精度的进给速度。控制器的训练过程包含仿真环境训练与实体训练两部分:在仿真训练阶段,基于液体静压传动原理建立进给单元的简化模型,并使用深度强化学习算法对其进行训练直至获得在仿真环境中具有良好微进给精度的控制器。在实体训练阶段,基于真实的进给环境进一步使用深度强化学习算法对仿真环境中训练好的控制器再次训练,直至控制器在更为复杂的实际进给过程中达到要求的进给控制效果。

本发明的一种典型的实施方式中,本实施例先提出了一种组合式液体静压螺母组件6,如图3所示,包括:双锥液体静压轴承内圈601、双锥液体静压轴承外圈602、轴承内圈衬套603、空心电机转子衬套604、空心电机转子605、空心电机定子606、编码器码盘轴套607、编码器码盘608、编码器读数头609、读数头支架610、连接支架611、密封圈612、液体静压丝杠螺母613,具体的连接结构如下:

上述的双锥液体静压轴承外圈602通过螺栓与连接支架611固定;

如图4、图5所示,双锥液体静压轴承内圈601侧面通过安装孔6032与轴承内圈衬套603固连,双锥液体静压轴承内圈601内圆周面与轴承内圈衬套外圆周面6031配合,双锥液体静压轴承中的液压油通过双锥液体静压轴承内圈601与双锥液体静压轴承外圈602之间的缝隙流出,远离连接支架611的双锥液体静压轴承端面直接排出液压油,连接支架611近端的双锥液体静压轴承端面首先排出液压油至由连接支架611、双锥液体静压轴承外圈602以及轴承内圈衬套603所封闭的密闭空间中,后经双锥液体静压轴承内圈601与轴承内圈衬套603中的排油槽6034配合形成的排油通道将液压油排出,此设计在便于排油的同时也可更好的排散热量。轴承内圈衬套603通过安装孔6033与液体静压丝杠螺母613的法兰盘一侧固连,如图6所示,液体静压丝杠螺母613的法兰盘另一侧通过安装孔6041与空心电机转子衬套604固连,轴承内圈衬套603与空心电机转子衬套604中的内圆周面均加工有圆弧凹槽6035与圆弧凹槽6044以便于适用套入不同外形的液体静压丝杠螺母;空心电机转子衬套604通过安装孔6042与空心电机转子605固连,空心电机转子衬套604通过安装孔6043与编码器码盘轴套607固连;编码器码盘608与编码器码盘轴套607固连;空心电机定子606通过安装孔6112与连接支架611固连。

如图7所示,读数头支架610通过螺栓长孔6101与空心电机定子606固连,读数头支架610通过安装孔6103与编码器读数头609固连,且可通过分别调整连接螺栓与螺栓长孔6101以及长孔6102的配合位置获得编码器读数头609与编码器码盘608的相对位置;

如图8所示,连接支架611通过连接孔6111与工作台11固连;

连接支架611中加工有环形油槽6114与进油孔6115,进油孔6115与环形油槽6114相通,环形油槽6114两侧加工有环形凹槽6113,密封圈612安装于环形凹槽6113中;

轴承内圈衬套603、空心电机转子衬套604与液体静压丝杠螺母613固连后所形成的外圆周面与连接支架611内圈留有间隙并发生相对转动;

密封圈612内圆周面与轴承内圈衬套603、空心电机转子衬套604与液体静压丝杠螺母613固连后所形成的圆周面配合,密封圈612外圆周面与环形凹槽6113配合,当液压油经由进油孔6115进入环形油槽6114后通过位于环形油槽6114两侧的密封圈612实现油路密封;

环形油槽6114中的液压油通过液体静压丝杠螺母613的法兰圆周面的进油口供油,并最终通过液体静压丝杠螺母613两端与丝杠的啮合间隙流出;

特别的,在装有编码器码盘608的液体静压丝杠螺母侧,经由丝杠5与液体静压丝杠螺母613啮合间隙流出的液压油(如图9所示),在编码器码盘轴套607锥型内表面6071的约束下流出组合式液体静压螺母组件,有效避免流出的液压油污染编码器码盘608。

进一步的,基于上述组合式液体静压螺母组件6,本实施例还提供了一种

基于深度强化学习的大行程高精度微纳运动伺服进给系统,其包括DRL智能决策模块、丝杠电机控制模块、螺母电机控制模块和进给平台本体模块。

其中,进给平台本体包括:底座1、伺服电机2、联轴器3、液体静压轴承支座4、液体静压轴承支座7、丝杠5、前面所述的组合式液体静压螺母组件6、可承受径向负载的液体静压轴承8、液体静压导轨9、位移检测装置10、工作台11、可承受轴径向负载的液体静压轴承12、电机支座13以及非接触式测距装置14;

底座1的两端设有液体静压轴承支座4和液体静压轴承支座7,在液体静压轴承支座4上安装可承受轴径向负载的液体静压轴承12;在液体静压轴承支座7上安装可承受径向负载的液体静压轴承8;丝杠5的一端通过可承受轴径向负载的液体静压轴承12支撑,另一端通过可承受径向负载的液体静压轴承8支撑;所述的丝杠5与组合式液体静压螺母组件6配合,且组合式液体静压螺母组件6顶部与液体静压导轨9的滑块相连;在液体静压导轨9上安装有位移检测装置10,在组合式液体静压螺母组件6上安装有非接触式测距装置14;丝杠5的一端通过伺服电机2驱动。

整体控制流程如下:DRL智能决策系统训练完毕后根据当前丝杠副油膜厚度以及工作台进给位置获得当前所需执行动作,DRL智能决策系统将动作指令发送至丝杠电机控制器与螺母电机控制器,两伺服电机均包含一个三相交流异步电机,并基于电机自身具有的位置/速度/电流检测器反馈的信号采用三环PID控制算法(电流环、速度环和位置环)驱动伺服电机。通过控制、协调丝杠电机与螺母电机的运动使得液体静压丝杠副运动合成实现工作台双驱动“差速”微进给。

安装在液体静压丝杠螺母613中的非接触式测距装置14可实时测得丝杠与螺母之间的油膜厚度,位移检测装置10可实时检测工作台移动的位置信息,液体静压丝杠螺母613与丝杠5之间的油膜厚度与工作台的位置信息均反馈至DRL智能决策模块。

如图2所示,DRL智能决策模块决策方法及控制流程如下:

1.建立大行程高精度进给模型

用户设定需求进给速度为V Aim,算法初始化丝杠电机速度为V s,螺母电机初始速度V n=V s-V Aim,且V n大于进给系统不可回避、非线性的回转爬行速度V c

丝杠电机速度增减量ΔV s(t)∈[-V smallV small],V small为在双驱液体静压丝杠副双驱差动超精密进给时对丝杠电机V s微调整的最大值,丝杠电机与螺母电机速度的同步增减量ΔV sn(t)∈[0,V max-V s],V max为丝杠电机或螺母电机可达到的最大速度。

通过动态、实时调整ΔV s(t)可补偿由于丝杠电机和螺母电机速度波动、液体静压功能部件阻尼以及系统振动等干扰因素造成的工作台进给误差,使工作台最终实现超精密进给;由于液体静压丝杠副中的螺距误差、运行时丝杠与螺母不可避免的位姿误差使得液体静压丝杠副运行过程中产生动压效应,智能决策算法通过实时改变ΔV sn的大小可动态调整液体静压丝杠副中油膜承载力以应对液体静压丝杠副各种复杂的外部负载,保证工作台的进给精度不受丝杠螺母位移波动的影响。智能决策算法调整后的丝杠电机速度与螺母电机速度为:

V S (t+1)=V S (t)+ ΔV s (t)+ ΔV sn (t)

V Sn (t+1)=V Sn (t)+ ΔV sn (t)。

2.建模为马尔可夫决策过程

(1)系统进给状态空间描述为S(t)= [h(t), p(t)],通过将液体静压丝杠副运行中实时油膜厚度h(t)与进给台实时进给位移p(t)作为环境状态,对伺服进给系统进给状态进行表达。h(t)需满足0.2 h 0h(t) ≤0.8h 0h 0为设定的无负载时轴向油膜厚度,且实时油膜厚度h(t)与进给台实时进给位移p(t)均需要取连续值。

(2)动作空间描述为A(t)=[ΔV s(t), ΔV sn(t)]。

(3)大行程高精度伺服进给系统作为一个智能体,在环境状态为S(t)时,通过决策函数μ(S(t))在动作空间中选择动作。智能体执行动作A(t)后根据奖赏函数R(S,A)获得奖赏值R(t)。

奖励函数设置包含两个部分,油膜厚度恒定规则和高精度进给规则,具体如下:

.基于深度强化学习算法进行训练

智能体采用Actor-Critic架构的DDPG算法框架进行训练,Actor网络与Critic网络分别对策略函数μ与值函数Q进行函数逼近,其参数分别为θ μ θ Q 。Actor在当前给定环境下使用策略梯度(policygradient)进行策略学习选择机器人动作,Critic使用策略评估(policy evaluation)对价值函数进行评估产生信号评价Actor所做动作。为策略网络和评价网络分别建立深层神经网络模型,该网络由一维卷积层、全连接层和输出层组成。

DDPG算法流程:

(1)初始化经验回放池,初始化神经网络参数及设定训练次数;

(2)Actor网络基于当前状态S(t)根据策略μ生成动作μ(S(t)),引用Uhlenbeck-Ornstein随机过程作为随机噪声N t 后最终执行动作A(t)=μ(S(t))+N t

(3)智能体执行动作A(t),实现对ΔV s(t)和ΔV sn(t)的调整,并返回奖赏值R(t)和新的状态S(t+1);

(4)Actor网络将状态转换过程[S(t),A(t),R(t),S(t+1)]以数组形式存入经验回放池作为训练网络的数据集;

(5)从经验回放池中随机取样N组数据作为训练Actor网络和Critic网络的最小批次训练数据;

(6)对从经验回放池中随机抽取的数据求目标值,第k组数据目标值可以表述为:,式中Q'表示Critic网络的目标网络,μ'表示Actor网络的目标网络。R k 为第k组样本所获即时奖励,γ为折扣因子且。通过Adam算法或SGD算法优化损失函数L(θ Q )更新Critic网络参数θ Q

(7)使用梯度下降法向着Q值增加的方向更新Actor网络参数θ μ

(8)使用running average算法将Actor网络参数θ μ 与Critic网络参数θ Q 更新为Actor目标网络参数θ μ' 与Critc目标网络参数θ Q'

基于所述的伺服系统具体结构及固有属性,合理构建双驱动液体静压丝杠副进给数学模型用于前期算法仿真训练,控制器在仿真训练获得较好的控制效果后转入伺服进给系统实体训练。深度神经网络经过多次训练直至达到使用要求后,即便工作台受到外部静载荷、阶跃载荷和正弦载荷等多种复杂外载荷时,双驱液体静压丝杠副油膜厚度h(t)可始终与h 0保持一致,大幅降低液体静压丝杠副低速超精密进给时轴向负载引起的螺母波动位移;同时,多次训练完成后,实时进给位移p(t)可与目标进给位移 p 0保持一致。

本发明提出的基于深度强化学习的大行程高精度微纳运动伺服进给系统及控制方法,将工作台的超精密微量进给建模为马尔可夫决策过程,引入深度强化学习算法控制双驱液体静压丝杠副,实现动态环境下超精密微量进给。与常规基于模型的运动控制方法相比,基于深度强化学习的双驱液体静压丝杠副控制方法不依赖外部环境,适用于多变量、强耦合性、强非线性的大行程高精度微纳运动场景,具有较好的鲁棒性。

在保证微量高精度进给的同时,通过同时增加或减少丝杠转速与螺母转速可实时调整液体静压丝杠副中液体油膜的动压效应,以应对液体静压丝杠副各种复杂的外部负载,保证工作台的进给精度不受丝杠螺母位移波动的影响。

此外,基于现有液体静压丝杠副、液体静压轴承结合本发明提出的方案即可实现液体静压丝杠螺母主驱动,克服了现有技术需对液体静压轴承和液体静压丝杠副本体加以改进或重新设计才可实现液体静压丝杠副螺母主驱动的不足,可大幅降低技术难度、并节省成本。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

17页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种多节伸缩式挡板工作台多零件码放装置

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!