一种适应气动强非线性的飞行器控制器增益调度方法

文档序号:808243 发布日期:2021-03-26 浏览:36次 >En<

阅读说明:本技术 一种适应气动强非线性的飞行器控制器增益调度方法 (Aircraft controller gain scheduling method adaptive to strong pneumatic nonlinearity ) 是由 奚勇 何飞毅 廖幻年 陈光山 徐桂甲 于 2020-09-21 设计创作,主要内容包括:本发明公开了一种适应气动强非线性的飞行器控制器增益调度方法,其特征在于,包含以下步骤:S1.依据飞行器的飞行状态参数,选择特征点,并设计PD控制器的PD控制参数作为样本;S2.根据步骤1中的样本,对控制器的增益调度网络进行训练,得到控制器增益调度网络模型;S3.将飞行器的实时飞行状态参数,输入至控制器的增益调度网络,并输出实时飞行控制参数,通过PD控制器实时向舵系统输出舵指令。本发明根据飞行器飞行状态参数及对应的控制参数设计基于深度神经网络的飞行控制网络,通过控制网络实时计算飞行控制参数,有效提高控制系统在强非线性、高动态和非对称气动下的控制品质,为飞行器全空域高机动飞行提供支撑。(The invention discloses an aircraft controller gain scheduling method adaptive to strong pneumatic nonlinearity, which is characterized by comprising the following steps: s1, selecting characteristic points according to flight state parameters of an aircraft, and designing PD control parameters of a PD controller as samples; s2, training a gain scheduling network of the controller according to the samples in the step 1 to obtain a gain scheduling network model of the controller; and S3, inputting the real-time flight state parameters of the aircraft into a gain scheduling network of the controller, outputting the real-time flight control parameters, and outputting rudder instructions to the rudder system in real time through the PD controller. According to the invention, a flight control network based on a deep neural network is designed according to flight state parameters of the aircraft and corresponding control parameters, and the flight control parameters are calculated in real time through the control network, so that the control quality of the control system under strong nonlinearity, high dynamic and asymmetric pneumatics is effectively improved, and support is provided for full airspace high maneuvering flight of the aircraft.)

一种适应气动强非线性的飞行器控制器增益调度方法

技术领域

本发明涉及战术武器飞行控制领域,具体涉及一种适应气动强非线性的飞行器控制器增益调度方法。其特征是解决传统参数调整方法难以适应战术武器非轴对称外形、大空域、高机动飞行下气动特性强非线性和高动态变化的问题,能够提高稳定控制系统非飞行控制品质。

背景技术

传统上战术武器飞行控制系统主要基于PD控制方法进行设计,主要设计思路是根据对象在飞行包络内的速度、高度、动压、攻角等飞行状态信息和对应的动力系数变化特点,选取一定数量的典型特征点设计控制参数,然后采用线性拟合、多项式拟合等方法得到相应的调参规律满足实时飞行环境下的控制性能要求。由于线性拟合方法无法实现对非线性状态的准确逼近,难以兼顾非线性变化下的控制需求,而多项式拟合方法随着非线性特征复杂程度的提高,多项式形式和参数的确定变得困难。因此上述方法在气动非线性剧烈变化条件下的控制品质难以保证,需要采用更加精确的增益调度方法适应非线性控制需求,有效提高战术武器非轴对称外形、大空域、高机动飞行下的控制性能。

发明内容

本发明的目的在于提供一种适应气动强非线性的飞行器控制器增益调度方法,根据飞行器飞行状态参数及对应的控制参数设计基于深度神经网络的飞行控制网络,通过控制网络实时计算飞行控制参数,有效提高控制系统在强非线性、高动态和非对称气动下的控制品质,为对象的全空域高机动飞行提供支撑。

为了达到上述目的,本发明通过以下技术方案实现:一种适应气动强非线性的飞行器控制器增益调度方法,其特点是,包含以下步骤:

S1.依据飞行器飞行状态参数选择特征点并设计PD控制器的PD控制参数作为样本;

S2.根据步骤1中的样本,对控制器的增益调度网络进行训练,得到控制器增益调度网络模型;

S3.将飞行器的实时飞行状态参数,输入至控制器的增益调度网络,并输出实时飞行控制参数,通过PD控制器实时向舵系统输出舵指令。

优选地,所述的步骤S1中飞行状态参数包括以下参数:

飞行时间、飞行阶段、质量、质心、弹体绕X轴转动惯量、弹体绕Y轴转动惯量、弹体绕Z轴转动惯量、飞行马赫数、动压、飞行速度、推力、飞行高度、攻角、侧滑角、弹体绕X轴角速度、弹体绕Y轴角速度、弹体绕Z 轴角速度、滚动舵偏、偏航舵偏、俯仰舵偏。

优选地,所述的步骤S2中的控制器增益调度网络如下:

采用5层级联前馈神经网络模型:

式中,l为网络层数,x为网络输入,即飞行状态参数,y为网络输出,即PD控制参数;[h(0),h(1),h(2),…,h(4)]为每一层的输入,[η(0)(1)(2),…,η(4)]为每一层输出;[n1,n2,n3,…,n5]为每一层上输入数据的维数;且n1=20,n2=40, n3=60,n4=76,n5=88;为每一层的激活函数,且激活函数为tansig函数;为第l层网络对应的权值;b(l)为第l层网络对应的偏置。

优选地,所述的步骤S2中网络训练方法为:

S2.1.对样本中20种飞行状态参数进行去冗余和归一化处理;

S2.2.将处理后的数据输入5层级联前馈神经网络模型并计算得到PD控制参数输出;

S2.3:计算网络模型输出控制参数与样本中的控制参数之间的均方误差,建立并优化损失函数,并通过误差反向传播更新模型权值。

更新模型权值的具体方法包括:

建立损失函数J(w),并基于Levenberg-Marquardt算法求解误差传播项并更新每一层上的权值w;

式中,yn为根据特征点设计好的PD控制参数,为神经网络输出PD 控制参数;L(w)为经验风险,R(w)为正则项,为Frobenius范数,λ为惩罚系数,N为训练数据集个数。

S2.4:重复步骤22和步骤23,直到均方误差满足设置的精度要求。

优选地,所述的步骤S3中舵指令输出方法为:

式中,KP、KD为已训练好的深度神经网络输出控制参数,Δn为期望过载与反馈过载偏差,为姿态角速度,δc为舵指令。

本发明一种适应气动强非线性的飞行器控制器增益调度方法具有以下优点:采用深度神经网络设计控制系统增益调度网络,能够避免传统调参规律在强非线性特性下的复杂计算过程;利用神经网络对非线性特性的精确逼近能力,能够避免传统参数设计下兼顾非线性特性导致控制品质下降的问题,充分挖掘控制系统的控制性能。本方法通过建立基于深度神经网络的控制增益调度网络,解决了战术武器非轴对称外形、大空域、高机动飞行下的控制问题,能够为飞行器全空域高机动飞行提供支撑。

附图说明

图1为本发明一种适应气动强非线性的飞行器控制器增益调度方法的流程图;

图2为神经网络训练结果;

图3为分段线性拟合调参与深度神经网络调参对比结果。

具体实施方式

以下结合附图,通过详细说明一个较佳的具体实施例,对本发明做进一步阐述。

如图1所示,一种适应气动强非线性的飞行器控制器增益调度方法,包含以下步骤:

S1.依据飞行器飞行状态参数选择特征点并设计PD控制器的PD控制参数作为样本;

根据已知对象飞行包络,按照飞行时间、飞行阶段、飞行马赫数、动压、飞行速度、推力、飞行高度、攻角、侧滑角选取飞行空域中的特征点,结合质量、质心、弹体绕X轴转动惯量、弹体绕Y轴转动惯量、弹体绕Z轴转动惯量、弹体绕X轴角速度、弹体绕Y轴角速度、弹体绕Z轴角速度、滚动舵偏、偏航舵偏、俯仰舵偏状态信息计算对应的动力系数,并依据极点配置方法设计满足稳定性和快速性需求的PD控制参数。

S2.根据步骤1中的样本,对控制器的增益调度网络进行训练,得到控制器增益调度网络模型;

采用5层级联前馈神经网络模型:

式中,l为网络层数,x为网络输入,即飞行状态参数,y为网络输出,即PD控制参数;[h(0),h(1),h(2),…,h(4)]为每一层的输入,[η(0)(1)(2),…,η(4)]为每一层输出;[n1,n2,n3,…,n5]为每一层上输入数据的维数;且n1=20,n2=40, n3=60,n4=76,n5=88;为每一层的激活函数,且激活函数为tansig函数;为第l层网络对应的权值;b(l)为第l层网络对应的偏置。

按照下述方法对神经网络进行训练:

S2.1.对样本中20种飞行状态参数进行去冗余和归一化处理;

S2.2.将处理后的数据输入神经网络模型并计算得到PD控制参数输出;

S2.3:计算网络模型输出控制参数与样本中的控制参数之间的均方误差,建立并优化损失函数,并通过误差反向传播更新模型权值。

更新模型权值的具体方法包括:

建立损失函数J(w),并基于Levenberg-Marquardt算法求解误差传播项并更新每一层上的权值w;

式中,yn为根据特征点设计好的PD控制参数,为神经网络输出PD 控制参数;L(w)为经验风险,R(w)为正则项,为Frobenius范数,λ为惩罚系数,N为训练数据集个数。

S2.4:重复步骤22和步骤23,直到均方误差满足设置的精度要求。

S3.将飞行器的实时飞行状态参数,输入至控制器的增益调度网络,并输出实时飞行控制参数,通过PD控制器实时向舵系统输出舵指令。

将训练好的增益调度网络写入弹上计算机,通过将实时感知到的飞行状态参数输入到增益调度网络,计算出飞行控制参数KP,KD,并应用到稳定控制系统中,实时向舵系统输出舵指令。

舵指令输出方法为:

式中,KP、KD为已训练好的深度神经网络输出控制参数,Δn为期望过载与反馈过载偏差,为姿态角速度,δc为舵指令。

基于上述详细步骤,即可完成控制增益调度网络设计和在线控制增益调度,并适应飞行器强非线性特性。

具体应用:选择对象飞行包络上非线性变化剧烈的区域,依据20个飞行状态选择特征点并设计控制参数,使其达到稳定性和快速性要求,并得到 2000组训练样本,将其按3:1:1的比例分为训练集、验证集和测试集。将上述特征点和控制参数输入5层级联前馈神经网络中进行训练,训练结果(见图2)表明训练集、验证集和测试集结果均收敛到0.0001附近,表明达到了较好的训练效果。

将训练好的网络加入控制系统中,使网络能够根据弹道上飞行状态输出控制参数。通过设置典型弹道,使其在370s~390s的静稳定度从0.5变为-1.0,采用S3中方法计算舵指令,并对弹道上特征点的定点仿真,可以看到图3 所示的仿真结果,结果表明深度神经网络拟合能够在非线性变化剧烈时实现更高的稳定裕度和更快的控制系统响应速度。

可以看出,本方法在非线性剧烈变化区域准确调整控制参数,并提升控制品质。

尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

本发明未详细说明部分属于本领域技术人员公知常识。

10页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种带有输入限制的未知无人船有限时间强化学习控制方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!