一种针对飞机纵向最优路径规划的初值智能选取多阶段伪谱法

文档序号:1951853 发布日期:2021-12-10 浏览:19次 >En<

阅读说明:本技术 一种针对飞机纵向最优路径规划的初值智能选取多阶段伪谱法 (Multi-stage pseudo-spectrum method for intelligently selecting initial values for planning longitudinal optimal paths of airplanes ) 是由 薛文超 何昕怡 陶呈纲 李导 于 2021-09-06 设计创作,主要内容包括:本发明提出一种针对飞机纵向最优路径规划的初值智能选取多阶段伪谱法,提出了基于多阶段伪谱转换的法向过载、纵向过载等控制量设计方法,在每个阶段令法向过载与纵向过载满足相应的实际约束条件,从而保证控制量在整个阶段内平稳变化及实际可实现;并采用神经网络及最优轨迹与边界条件组成的数据集,学习得到给定初末状态下的最优轨迹作为伪谱法的初始值。具体为:第一步:建立包含非线性动力学的飞机纵向轨迹规划问题模型;第二步:基于过载参考指令实际可操作的多阶段伪谱法;第三步:通过神经网络学习数据集智能选取初值;第四步:通过求解非线性规划问题获得最优解;本发明提高了最优解计算的收敛速度,实现计算的高效性。(The invention provides an intelligent multi-stage pseudo-spectrum method for selecting initial values of the planning of the longitudinal optimal path of an airplane, and provides a control quantity design method based on multi-stage pseudo-spectrum conversion, such as normal overload, longitudinal overload and the like, wherein the normal overload and the longitudinal overload meet corresponding actual constraint conditions in each stage, so that the control quantity is guaranteed to be stably changed and actually realized in the whole stage; and learning to obtain the optimal track in a given initial and final state as an initial value of a pseudo-spectrum method by adopting a data set consisting of a neural network, the optimal track and boundary conditions. The method specifically comprises the following steps: firstly, establishing an airplane longitudinal track planning problem model containing nonlinear dynamics; the second step is that: a multi-stage pseudo-spectrometry that is actually operational based on the overload reference instruction; the third step: intelligently selecting an initial value through a neural network learning data set; the fourth step: obtaining an optimal solution by solving a nonlinear programming problem; the invention improves the convergence rate of the optimal solution calculation and realizes the high efficiency of the calculation.)

一种针对飞机纵向最优路径规划的初值智能选取多阶段伪 谱法

技术领域

本发明属于飞行器的机动路径规划方法领域,涉及最优路径计算的初值选取方法、控制变量多阶段约束下的最优控制求解方法。该技术采用多阶段伪谱法实现了连续最优控制问题到非线性规划问题的等价转化,并利用BP神经网络方法实现了迭代求解的初值智能选取。该技术是实现飞机纵向最优轨迹计算兼具高效性与稳定性的一个解决方案。

背景技术

在线轨迹规划是实现仿真模拟飞行器轨迹的必要条件,而在线轨迹规划对应的最优控制问题常常存在奇异弧,其数值解可能快速频繁跳变,使其难以作为实际操作的参考指令。另外,将连续最优控制问题离散成非线性规划问题后,迭代求解过程对初值敏感,不恰当的初值会导致计算陷入不可行点。因此,如何获得符合实际操作的最优控制量,且选取合适的初值轨迹使得迭代过程避开不可行区域,具有很大挑战性。目前,已有的飞行器轨迹规划方法主要为自适应伪谱法[1-3]、以及基于极大值原理转化的间接法[4-5]等,存在如下局限性:

1.自适应伪谱法需同时考虑曲率条件,未考虑网格时间对控制的影响,导致算法误差;基于极大值原理转化的间接法将原问题转化为两点边值问题,增加了问题的复杂度等;

2.对于存在奇异弧的问题,自适应伪谱求得的最优控制量在奇异弧上表现为高频地在上界与下界来回切换,并且使得奇异弧上离散点个数增加,求解速度变慢。

3.求取非线性规划的数值方法对初值敏感,初值的选取不当会导致问题陷入非最优点甚至不可行点。

因此,已有方法求取存在奇异弧的飞机轨迹规划问题时难以保证计算的高效性和稳定性。

为了解决上述问题,本发明针对飞机纵向通道在线轨迹规划问题,采用了多阶段伪谱法避免因飞机动力学模型为仿射非线性而使相应最优控制问题产生奇异弧,并提出了神经网络智能选取初值的方法,实现了对初值轨迹范围的缩小,保证在线轨迹规划计算的高效稳定。

发明内容

本发明解决的技术问题:提出了基于多阶段伪谱转换的法向过载、纵向过载等控制量设计方法,在每个阶段令法向过载与纵向过载满足相应的实际约束条件,从而保证控制量在整个阶段内平稳变化及实际可实现;并采用神经网络及最优轨迹与边界条件组成的数据集,学习得到给定初末状态下的最优轨迹作为伪谱法的初始值,提高最优解计算的收敛速度,实现计算的高效性。

本发明的技术解决方案包括如下4个步骤:

第一步:建立包含非线性动力学的飞机纵向轨迹规划问题模型

轨迹规划目标为:在纵向平面内使得高度Z、速度V、航迹倾斜角γ在初始和末端时达到给定状态取值,且使得过程时间最短。本发明考虑的飞机纵向动力学模型如下:

其中t为时刻,Z(t)∈R为飞机在纵向平面内高度,X(t)∈R为飞机位置,V(t)为飞机速率,γ(t)∈R是飞机航迹倾斜角,g是重力加速度,nz(t)∈R与nx(t)∈R分别为飞机法向过载与纵向过载,是与之对应的飞机控制指令;第5、6两式表示一阶惯性环节,参数knz∈R,knx∈R分别为法向过载指令和纵向过载指令一阶惯性环节参数,可根据不同的飞机特性进行选取。α=G(nz,m,g)为飞机迎角,是法向过载nz、飞机质量m和重力加速度g的非线性函数,具体的函数形式依赖不同的飞机特性。

在模型(1)中,(X(t),Z(t),V(t),γ(t),nz(t),nx(t))为状态量,为控制量,优化指标为tf-t0.tf为终止时间,t0为起始时间。各个状态控制参数还需满足如下边界、过程约束:

边界约束:

过程约束:

第二步:基于过载参考指令实际可操作的多阶段伪谱法

法向过载控制指令与纵向过载控制指令需要具有实际可操作性,因此将其设计为间断常值,并且间断/切换次数不超过T。下面给出基于过载参考指令实际可操作的多阶段伪谱法:

首先引入下面的记号:

f(·)为状态方程向量函数。

则将模型(1)-(3)可等价转换为:

其中ti(i=1,2,...,T+1)表示第i个阶段的时长,分别为第i个阶段的起始时间和终止时间。

利用如下的多阶段伪谱法对连续模型(4)进行进一步转化:

记N(i)第i阶段规定的配点数,其取值范围为正整数集,进行如下计算:

第i阶段配点

N(i)×N(i)微分矩阵D(i)第i行第j列元素的计算公式如下:

N(i)×(N(i)+1)微分矩阵通过如下转化关系计算求得:

为第i阶段状态的近似函数X(i)(τ)在点处的取值,U(i)为第i阶段控制量取值,为第T+1阶段航迹倾角的近似函数在点的取值,Vi (T+1)为第T+1阶段飞行器速率的近似函数在点的取值,为第R+1阶段微分矩阵的第N(T+1)行的第i个元素。

前T个阶段的状态导数方程离散为:

第T+1阶段的状态导数方程离散为:

不含导数的边界条件离散为:

离散为:

φ′2=0 (10)

cmin≤c(x,u)≤cmax离散为:

通过公式(5)-(11),将连续最优轨迹规划等价转为如下离散形式:

min(t1+…+tT+1)

第三步:通过神经网络学习数据集智能选取初值

利用多阶段伪谱法对连续问题进行离散后,设计前馈神经网络根据学习数据集调整参数选取合适初值:

记学习数据集为:A,其含有m个不含状态导数约束的边界条件取值

(Z0,Zf,V0,Vf0)k和m个满足相对应边界取值的最优轨迹样本

设计如下结构的神经网络:

神经网络结构共s层,输入为不含状态导数约束的边界条件

(Z0,Zf,V0,Vf0)k,输出为相应的最优轨迹其迭代公式为:

其中表示第i-1层到第i层的输入,M(i)为第i层神经元的个数,为第i层的激活函数,是第i层的输出,是第i-1层的权重参数,是第i-1层的偏置项。

记θ={wi,bi|i=1,...,s},通过最小化如下损失函数计算得到[6]

利用BP神经元网络学习方法,计算得到给定初末状态条件下的轨迹x0.记伪谱法计算的初值轨迹为x0

第四步:通过求解非线性规划问题获得最优解

由第三步计算得到的初值轨迹x0作为多阶段离散轨迹规划模型(12)的初始解,利用非线性规划规划的迭代算法求解,计算最优轨迹x*.最优轨迹x*与相应的边界条件(Z0,Zf,V0,Vf0)k加入学习数据集A,作为下一个优化问题的学习数据集。

本发明的优点在于:

1.针对存在奇异弧的最优控制问题,在控制输入受物理约束情况下,设计基于过载指令实际可操作的多阶段伪谱,使之能作为飞行员现实生活中操作飞行器的重要参考。

2.本发明采用神经网络优化初值的方法,设计多层结构的神经元网络,利用学习数据集训练神经网络,通过神经网络智能选取初值使得迭代避开不可行区域,避免了传统问题对初值敏感的问题。

3.本发明针对含状态导数约束的最优控制问题,利用多阶段伪谱转换为离散问题,对多弧轨迹进行划分,增加离散近似精度,通过线性化状态导数条件简化约束条件,降低计算所耗时间。

附图说明

图1为本发明提出的基于神经网络选取初值与多阶段伪谱算法流程图。

图2为飞机高度的变化曲线。

图3为飞机速率的变化曲线。

图4为飞机法向过载控制指令和纵向过载控制指令变化曲线。

图5为飞机法向过载和纵向过载变化曲线。

符号说明如下:

t:时间;

α∈R:迎角;β∈R:侧滑角;V∈R:飞行器相对于空气的速度;

Z∈R:飞行器所在高度;

X∈R:飞行器位置;

γ∈R:飞行器航迹倾斜角;

g:重力加速度;

nz∈R:法向过载;

nx∈R:纵向过载;

法向过载控制指令;

纵向过载控制指令;

knz∈R:法向过载指令一阶惯性环节参数;

knx∈R:纵向过载指令一阶惯性环节参数;

t0:起始时间;

tf:终止时间;

ti:第i个阶段的时长;

第i个阶段的起始时间;

第i个阶段的终止时间;

第i个阶段第k个配点

N(i)∈R:第i个阶段配点数;

PN(x):N阶legendre多项式;

第i个阶段状态在点处的取值;

第i个阶段控制在点处的取值;

第i个阶段的微分矩阵;

第T+1个阶段的微分矩阵;

第T+1阶段微分矩阵的第N(T+1)行的第i个元素;

为第T+1个阶段航迹倾角第i个取值;

Vi (T+1)∈R:第T+1个阶段飞行器速率第i个取值;

Y∈Rm×n:学习数据集;

第i-1层到第i层的输入;

M(i)∈R:第i层神经元的个数;

第i层的激活函数;

第i层的输出;

第i-1层的权重参数;

第i-1层的偏置项;

具体实施方式

为了检验本发明方法的实用性,以一个典型降速爬升场景下轨迹规划为例进行仿真实验并与GPOPS对比相同条件下问题的计算时间。

仿真条件:

设控制指令的切换次数R为3,每个阶段点数为10,10,20,10。初始与终端条件为:

惯性环节一阶参数knz,knx分别选取0.5和6;

法向过载与纵向过载和与之对应的控制指令的上下限为:

具体实施步骤:

1.将最短时间轨迹优化问题(4),利用(5)-(11)离散成(12)。

J=t1+t2+t3+t4

2.设计6层神经网络,各个层的点数分别4,50,50,20,330。中间层对应的激活函数分别为sigmoid函数,purelin函数,sigmoid函数和双曲正切S型传输函数。将已知最优轨迹样本集和对应边界条件输入神经网络结构中,训练得到神经网络参数。

3.通过将初始和终端条件输入神经元网络得到初始轨迹x0,采用非线性规划迭代算法计算得到相应的最优解。

4.将得到的最优解和边界条件作为新的学习样本加入学习数据集。

图2-图5为仿真结果。从图2和图3中可看出,本发明提出的算法可以有效使最优轨迹达到边界条件.图4的控制指令曲线显示本发明所提出算法能够有效规避奇异弧,易于实现,具有实际参考价值。

GPOPs算法输入为模型(1)-(3),网格精度为1e-7,网格最大迭代次数为15,其余设置与本发明算法相同,程序运行时间与最优到达时间如下表所示:

本发明算法 GPOPs算法
程序计算时间 6.938124秒 198.178704秒
最优到达时间 35.92104秒 34.00809秒

上表说明本发明算法在损失极小轨迹最优性的前提下,简化了问题形式,有效地缩短了程序计算时间。

参考文献:

[1]黄斌.基于hp自适应伪谱法的六自由度运动轨迹优化研究[D].南京航空航天大学,2020.

[2]钱立军,吴冰,仇多洋,胡伟龙.基于hp自适应伪谱法的自主泊车路径规划[J].机械工程学报,2020,56(04):125-134.

[3]王荔豪,杨凯,王妮芝,马菲,刘叙含.基于hp-自适应伪谱法的高超声速飞行器上升段闭环制导研究[J].计算机测量与控制,2019,27(01):136-140+145.

[4]Shen H X,Casalino L,Luo Y Z.Global search capabilities of indirectmethods for impulsive transfers[J].Journal of the Astronautical Sciences,2015,62(3):212-232

[5]傅瑜,王鹏,崔乃刚.基于序列梯度-修复算法的再入飞行器轨迹优化[J].弹道学报,2012,24(03):36-42.

[6]郭海丁,路志峰.基于BP神经网络和遗传算法的结构优化设计[D].南京航空航天大学,2003.

19页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种适用火星着陆任务的系统抗冲击方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类