控制装置

文档序号：348164 发布日期：2021-12-03 浏览：8次 >En<

阅读说明：本技术 控制装置 (Control device ) 是由井崎胜敏桥本诚司于 2019-04-26 设计创作，主要内容包括：本发明提供一种即便对于死区时间系统,神经网络也能不受死区时间的影响而学习,并且具有改善对于指令输入的过渡特性的能力的控制装置。控制装置(1)具备：对包含死区时间单元的控制对象进行控制的反馈控制器(10)；包含死区时间单元并输出针对输入的期望的响应波形的规范模型部(20)；以及输出与反馈控制器的输出相加并输入控制对象的学习型控制器(30),以使控制对象的输出与规范模型部的输出的误差由于来自学习型控制器的输出的变化而成为最小或预定的阈值以下的方式进行学习。(The invention provides a control device which can learn a neural network without being affected by a dead time even in a dead time system and has the capability of improving transient characteristics for command input. A control device (1) is provided with: a feedback controller (10) for controlling a control target including a dead time unit; a normative model unit (20) that includes a dead time unit and outputs a desired response waveform for an input; and a learning controller (30) for adding the output of the feedback controller to the output of the control object and inputting the sum to the control object, wherein the learning controller learns that the error between the output of the control object and the output of the normative model part is minimum or less than a predetermined threshold value due to the change of the output from the learning controller.)

控制装置

技术领域

本发明涉及控制装置，特别是涉及对包含死区时间的控制对象进行控制的控制装置。

背景技术

作为将神经网络用于反馈控制的方法，已知有利用控制对象的逆系统的反馈误差学习方法及系统。图2示出了该反馈误差学习系统的框图。在该方法中，神经网络控制器110以反馈控制器的输出xc为示教信号进行学习，使得随着学习的进行xc变为0。由此，进行学习及控制使得误差e为0并且输出y为目标值yd。因而，在学习之后，所使用的控制器从反馈控制器120转移到神经网络控制器110。其结果，控制系统100从反馈构造被置换为前馈构造。

另外，作为向使用神经网络的控制系统引入规范模型的方法，例如公开了以下方法。在专利文献1中，公开了向神经网络部输入反馈控制部的输出和基于转向量信号输出理想预期响应的时间序列数据信号的规范模型的该输出的控制装置。在专利文献2中，公开了将反馈控制器本身作为神经网络学习型控制器的构造。另外，在专利文献3中，公开了通过具有非线性函数近似能力的神经网络来构成估计装置，并作为补偿器构成单元并入的控制装置。

现有技术文献

专利文献

专利文献1：日本特开平07－277286号公报

专利文献2：日本特开平06－035510号公报

专利文献3：日本特开平04－264602号公报。

发明内容

发明要解决的课题

在如上述图2所示的系统中，对于重复的阶跃指令的输出响应波形上，有响应性不会按每个阶跃，即随着时间的经过而改善的情况。认为这是因为即便有对控制对象的输入信号，由于控制对象的死区时间，神经网络在没有响应(来自控制对象的输出)的状态下也有可能无法学习。

在此，为了防止起因于死区时间的输出响应延迟导致神经网络的学习延迟，可以考虑使用能获得期望响应的规范模型，并使该规范模型具有死区时间，以使实际输出跟随规范模型的输出的方式使神经网络学习的方法。然而，例如在如专利文献1～3的使用规范模型的方法中，存在如下的课题。

首先，专利文献1中公开的方法基本上与现有的反馈误差学习方式相同，在该方法中即便向规范模型加入死区时间，也进一步延迟对控制对象的延迟。因而，在专利文献1公开的方法中，不能改善学习延迟。

在专利文献2公开的方法中，如果在规范模型中包括死区时间就可以避免学习延迟。然而，在神经网络控制器的初始设计阶段需要控制对象的模型。因而，控制器的设计较复杂，也可能会出现模型误差。另外，需要用神经网络控制器来补偿目标值响应、扰动及波动等所有的补偿对象。因此，很难针对每个补偿对象设计/调整控制器，并且通过学习来修正补偿器变得复杂。在专利文献3公开的方法中，也存在与专利文献2同样的课题。

上述各种方法都是在没有死区时间或可可以忽略死区时间的影响的系统中关注对规范模型的跟随性的控制方法，不专注于性能改善，如考虑到死区时间的过渡特性改善。其结果，在上述各种方法中，难以同时实现针对死区时间系统的过渡响应特性和借助神经网络的学习效果的更进一步地特性改善。

鉴于以上几点，本发明的一个目的是构建一种解决上述课题的控制系统。另外，本发明的目的在于提供一种控制装置，即便对于死区时间系统，神经网络也能不受死区时间的影响而学习，并具有改善对于指令输入的过渡特性的能力。

用于解决课题的方案

依据本发明的第1方式，提供一种控制装置，其具备：

反馈控制器，控制包含死区时间单元的控制对象；

规范模型部，包含死区时间单元，输出针对输入的期望的响应波形；以及

学习型控制器，其输出与所述反馈控制器的输出相加并输入到所述控制对象，以使所述控制对象的输出与所述规范模型部的输出的误差由于来自所述学习型控制器的输出的变化而成为最小或预定的阈值以下的方式进行学习。

依据本发明的第2方式，提供一种控制装置，适用于利用预先设计的反馈控制器来控制控制对象的控制系统，所述控制装置具备：

规范模型部，包含死区时间单元，输出针对输入的期望的响应波形；以及

发明效果

依据本发明，能够提供即便对于死区时间系统，神经网络也能不受死区时间的影响而学习，并且具有改善对于指令输入的过渡特性的能力的控制装置。

附图说明

图1是本实施方式所涉及的控制系统的框图。

图2是比较例的控制系统的框图。

图3是比较例的控制系统中的重复阶跃响应波形。

图4是比较例的控制系统中的重复阶跃响应波形的叠加比较图。

图5是本实施方式的控制系统中的重复阶跃响应波形。

图6是本实施方式的控制系统中的重复阶跃响应波形的叠加比较图。

具体实施方式

以下，参照附图，对本发明的实施方式进行说明。

＜本实施方式的概要＞

首先，说明本实施方式的概要。本实施方式的控制系统(control system)采用通过学习使过程控制系统等的具有死区时间的控制对象的输出跟随同样包含死区时间的规范模型的输出的控制方法。

反馈(FB)控制器能够使用现有的反馈(FB)控制器。使控制对象的响应跟随具有死区时间的规范模型的输出。因此，在神经网络控制器中，将控制对象的输出(实际输出)与规范模型的输出的误差作为神经网络的示教信号，例如以使该误差成为最小的方式使神经网络学习。另外，将神经网络控制器的输出与反馈控制器的输出相加并作为对控制对象的输入，从而对控制对象进行控制。

＜本实施方式的说明＞

图1是本实施方式所涉及的控制系统的框图。本实施方式所涉及的控制系统包含对控制对象2进行控制的控制装置1。控制装置1具有反馈控制器10、规范模型部20、和神经网络控制器30。

反馈控制器10根据与控制对象2的输出相关的预定的目标值yd控制控制对象2。例如，反馈控制器10输入预定的目标值(也称为SV)yd与控制对象2的输出(也称为测定值、PV)之差e，并进行既定控制运算，输出对控制对象2的操作量(第1操作量)。反馈控制器10例如作为主控制器进行动作。例如，反馈控制器10是用于在假定为没有模型化误差且没有扰动的情况下，使控制对象2的输出按照期望的设计动作的控制器。作为反馈控制器10，例如，能够使用可以通过自动调谐等自动设计的PID控制器等。另外，反馈控制器10也可以使用抑制过调量的I－PD控制器，从而由神经网络控制器30改善相对于目标值的上升。

规范模型部20包含死区时间(死区时间单元)，输出针对输入的期望的响应波形。规范模型部20被输入目标值yd。规范模型部20的输入/输出关系例如可以用包含死区时间单元的一阶滞后系统等来表示，但该关系并不限于此，也可以是包含死区时间单元的适当关系。规范模型部20的死区时间例如可以设定为与控制对象2的死区时间相同的时间。另外，规范模型部20的死区时间也可以为与控制对象2的死区时间相同程度的时间。在此相同程度可以是例如通过神经网络控制器30能改善控制对象2的输出的响应性的程度。另外，也可以是将控制对象2的死区时间按预定的位数取整的值，换言之，预定的容许误差范围内的值。作为一个例子，规范模型部20的死区时间相对于控制对象2的死区时间既可以在约±10％的范围内，也可以在约±30％的范围内。将包含死区时间的规范模型部20的输出与控制对象2的输出之间的误差ey作为示教信号提供给神经网络控制器30。

神经网络控制器30的输出(第2操作量)与反馈控制器10的输出(第1操作量)相加，并向控制对象2输入。神经网络控制器30利用神经网络以通过神经网络控制器30的输出的变化(调整)使控制对象2的输出与规范模型部20的输出的误差ey成为最小或预定的阈值以下的方式进行学习。例如，神经网络控制器30通过最速下降法和反射传播法来学习，以使平方误差ey²最小。作为输入信号，对神经网络控制器30输入目标值yd和控制对象的输出y。神经网络控制器30供给输入信号和与学习结果相应的输出。另外，来自神经网络控制器30的输出xN如上所述加到反馈控制器10的输出以求出操作量x，并向控制对象2输入。这样将神经网络控制器30的输出xN与反馈控制器10的输出相加并输入到控制对象2，从而能够使反馈控制器10和神经网络控制器30的作用分开。此外，作为输入信号，神经网络控制器30还可以被输入误差ey。

此外，神经网络具有输入及输出和一个或多个中间层。中间层由多个节点构成。神经网络的结构能够采用适当的结构，并且关于神经网络的学习方法可以采用公知的学习方法。

另外，控制装置1也可以具有：求出控制对象2的输出y与规范模型部20的输出之间的差ey的差分器11；相加反馈控制器10的输出和神经网络控制器30的输出的加法器12；以及求出目标值yd与控制对象2的输出y之间的差e的差分器13。

规范模型部20和神经网络控制器30例如也可以通过具有CPU(CentralProcessing Unit)及DSP(Digital Signal Processor)等的处理部和存储器等的存储部的数字装置来安装。规范模型部20和神经网络控制器30的处理部及存储部既可以使用共同的处理部及存储部，也可以使用单独的处理部及存储部。另外，神经网络控制器30也可以具有多个处理部，并且并行执行至少一部分的处理。

(效果)

依据本实施方式的控制装置，例如得到如下效果。但是，本实施方式的控制装置不必限于发挥以下所有效果的装置。

作为反馈控制器10，能够使用能够利用自动调谐进行设计的控制器等。因此，在设计反馈控制器10时，不需要控制对象2的模型。另外，在神经网络控制器30的设计中也不需要控制对象2的模型，因此对于控制装置1的各控制器的设计而言，模型是不必要的。

在本实施方式的控制系统中，以使控制对象2的输出跟随规范模型部20的输出的方式进行学习。通过使规范模型部20具有死区时间，能够避免神经网络控制器30在没有控制对象2的输出的状态下开始利用神经网络进行学习(即，建立因果关系)。另外，在神经网络的学习中，能够避免在死区时间先行学习的问题。因而，无需使神经网络的学习仅延迟死区时间，也无需有意增大学习周期。由此能够避免当增大控制对象2的输出时神经网络控制器30提供过量的控制输入这一现象。

反馈控制器10的作用主要是以满足设计时的标称规格的方式进行动作。例如，反馈控制器10以满足控制系统中的作为控制装置(控制器)的规格、PID的动作规格等的方式进行动作。另一方面，神经网络控制器30的作用是以在学习后使控制对象2的输出跟随规范模型部20的输出的方式动作。进而，在出现模型化误差或扰动的情况下，神经网络控制器30补偿模型化误差或扰动。在出现这样的误差或扰动的情况下，会在控制对象2的输出与规范模型部20的输出产生误差，神经网络控制器30基于该误差进行动作，从而补偿模型化误差或扰动。

除了以上效果之外，本实施方式的控制装置还具有以下效果。

·由于是跟随规范模型部20的输出的结构，即便通过规范模型部20的设定及调整进行了神经网络的学习，控制输入也不太可能变得过大。换言之，能够间接调整控制对象2的输入。

·神经网络控制器30的设计不需要控制对象的模型。另外，能够利用通过自动调谐来设计的反馈控制器10，因此可以在没有模型的情况下设计控制系统。

·即便神经网络的学习进展，也可以维持反馈控制系统而不会转移到前馈构造。例如，在规范模型部20的输出与控制对象2的输出之间的误差为零的情况下，相当于只有反馈控制器10进行动作。

·通过在反馈控制器10中使用I－PD构造，随着神经网络学习的进行，能够无过调量地只改善响应性。例如，控制对象2的输出可以被控制成为在刚开始控制后缓慢上升，但抑制过调量，同时随着学习的进行而改善上升。另外，在神经网络控制器30的学习并不良好或者控制性能没有改善等情况下，即便神经网络控制器30的输出被限制或为零，也由反馈控制器10保证初始的基本性能。

·由于配合规范模型部20的输出进行学习，所以容易适用于多输入多输出系统(MIMO(multiple－input and multiple－output)化)。例如，在控制多点温度的控制系统中，包括过渡状态在内可以进行多点(多输出)温度的均匀控制。此外，在适用于多输入多输出系统的情况下，上述误差、操作量等包含与输入/输出对应的多个单元，例如可以用向量来表示。

本实施方式的控制装置能够适用于具有死区时间的控制系统，例如过程控制系统或温度调整系统。作为具体例子，可举出温调/空调系统、射出成型机及热板等。在这样的领域中，通常通过使用控制输入的导通/截止(ON/OFF)的自动调谐来进行反馈控制器的设计，而无需推导出控制对象的模型。本实施方式通过对这样的现有的控制系统追加引入利用了神经网络的控制器，具有继承不使用模型的现有的设计法，进而能够与动作一起借助学习谋求控制性能改善的优点。

(模拟结果)

通过与比较例的对比来说明使用本实施方式中的控制装置1的控制系统的模拟结果及效果。

首先，对比较例中的响应波形进行说明。图2是比较例的控制系统的框图。比较例中，作为相关技术采用上述的反馈误差学习系统。在该例子中，神经网络控制器110采用反馈控制器120的输出xc作为示教信号，以随着学习的进行而使xc成为0的方式进行学习。由此，比较例的控制系统以使目标值yd与控制对象130的误差e成为0(换言之，以输出y为目标值yd)的方式进行学习及控制。因而，在学习后，所使用的控制器从反馈控制器120转移到神经网络控制器110。在此，反馈控制器120使用PI控制器。神经网络控制器110的神经网络中，中间层为两层，各层的节点数设为10。

图3示出比较例的控制系统中的重复阶跃响应波形。图3的横轴为时间。图3在上排示出控制对象130相对于目标值(重复阶跃指令)31的输出响应波形32、在下排示出反馈控制器120的输出(FBA)33和神经网络控制器110的输出(NNout)34。如图3所示，没有观察到响应性随时间经过的改善。

图4是比较例的控制系统中的重复阶跃响应波形的叠加比较图。图4的横轴是时间。图4在上排示出将相对于多个正方向的阶跃指令的响应(阶跃响应)叠加显示的波形41、在下排示出将相对于多个负方向的阶跃指令的响应(阶跃响应)叠加显示的波形43。更详细而言，图4的上排及下排一起，对于如图3所示的重复的阶跃指令31，以各阶跃指令的上升或下降为时间0，叠加示出针对第1个、第5个及第10个阶跃指令的阶跃响应波形(分别以细线、虚线及粗线示出)。另外，作为参考例，以虚线示出理想的响应波形42、44。即便观察图4，响应波形也大致叠加，没有看到响应性按每个阶跃改善的情况。

另一方面，作为一个例子，在图5及图6示出本实施方式的控制系统中的模拟结果。图5是本实施方式的控制系统中的重复阶跃响应波形。图6是本实施方式的控制系统中的重复阶跃响应波形的叠加比较图。

控制对象2和反馈控制器10的结构设为分别与图2所示的比较例的控制对象130及反馈控制器120相同。另外，神经网络控制器30的神经网络中，设中间层为2层、节点数为10、且与神经网络控制器110的结构相同。

图5的横轴是时间。图5与图3同样，在上排示出控制对象2相对于目标值(重复阶跃指令)51的输出响应波形52，在下排示出反馈控制器10的输出(FBA)53与神经网络控制器30的输出(NNout)54。

图6的横轴是时间。图6与图4同样，在上排示出将针对多个正方向的阶跃指令的响应(阶跃响应)叠加显示的波形61～63，在下排示出将针对多个负方向的阶跃指令的响应(阶跃响应)叠加显示的波形65～67。更详细而言，图6的上排及下排一起，对于如图5所示的重复的阶跃指令51，以各阶跃指令的上升为时间0，叠加示出针对第1个阶跃指令的阶跃响应波形61及65、针对第5个阶跃指令的阶跃响应波形62及66、针对第10个阶跃指令的阶跃响应波形63及67。另外，作为参考例，以虚线示出理想的响应波形(例如，规范模型部20的输出)64、68。

通过阶跃响应的重复，能够确认与正方向及负方向的响应一起距离目标值的过调量减少，且稳定时间也变快，跟随规范模型的输出。另外，从图5的下排能够确认神经网络控制器30的输出(NNout)54因重复阶跃响应而增大。这表明神经网络控制器30的学习以使输出信号y跟随规范模型输出的方式进行。

(其他)

在上述实施方式中，神经网络控制器30利用神经网络进行了学习，但是也可以利用神经网络以外的功能进行学习。即，神经网络控制器30也可为学习型控制器。另外，还可以在控制装置1之中提供具有不包含反馈控制器10的结构的第2控制装置。例如，也可以在利用预先设计的现有的反馈控制器来对控制对象进行控制的控制系统，适用具有规范模型部20和神经网络控制器30的控制装置而构成上述控制系统。

上述各结构及处理还可以通过具有处理部和存储部的计算机来实现。处理部执行各结构的处理。存储部存储处理部所执行的程序。上述处理也可以作为处理部执行的控制方法来实现。另外，可以通过包含用于令处理部执行上述处理的命令的程序或程序介质、存储该程序的计算机可读记录介质及非临时性记录介质等来实现。

[产业上的可利用性]

本实施方式的控制装置及控制系统例如可以适用于对具有死区时间的控制对象进行控制的控制系统。作为一个例子，可以适用于过程控制系统或温度调整系统。作为更具体的例子，可举出温调/空调系统、射出成型机及热板等。

[标号说明]

1控制装置；2控制对象；10反馈控制器；20规范模型部；30神经网络控制器；51目标值(重复阶跃指令)；52输出响应波形；53反馈控制器的输出(FBA)；54神经网络控制器的输出(NNout)。

13页详细技术资料下载

控制装置

相关技术

网友询问留言