机器学习装置和磁轴承装置

文档序号:174072 发布日期:2021-10-29 浏览:36次 >En<

阅读说明:本技术 机器学习装置和磁轴承装置 (Machine learning device and magnetic bearing device ) 是由 藤本俊平 阪胁笃 平田和也 日比野宽 于 2020-03-13 设计创作,主要内容包括:提供具有机器学习装置且能够适当地进行被支承体的位置的控制的磁轴承装置。机器学习装置学习磁轴承装置(10)的控制条件。磁轴承装置具有磁轴承(21、22),该磁轴承具有对轴(115)赋予电磁力的多个电磁体(51~54)。机器学习装置具有学习部(45)、状态变量取得部(43)、评价数据取得部(44)和更新部(47)。状态变量取得部取得包含与轴的位置相关的至少1个参数的状态变量。评价数据取得部取得评价数据,该评价数据包含轴的位置的测定值、轴的位置的目标值以及与相对于目标值的偏差相关的参数中的至少1个参数。更新部使用评价数据对学习部的学习状态进行更新。学习部按照更新部的输出来学习控制条件。(Provided is a magnetic bearing device which is provided with a machine learning device and can appropriately control the position of a supported body. A machine learning device learns the control conditions of the magnetic bearing device (10). The magnetic bearing device is provided with magnetic bearings (21, 22) which are provided with a plurality of electromagnets (51-54) for applying electromagnetic force to a shaft (115). The machine learning device is provided with a learning unit (45), a state variable acquisition unit (43), an evaluation data acquisition unit (44), and an update unit (47). The state variable acquisition unit acquires a state variable including at least 1 parameter related to the position of the axis. The evaluation data acquisition unit acquires evaluation data including at least 1 parameter of a measured value of the position of the axis, a target value of the position of the axis, and a parameter related to a deviation from the target value. The updating unit updates the learning state of the learning unit using the evaluation data. The learning unit learns the control condition according to the output of the updating unit.)

机器学习装置和磁轴承装置

技术领域

机器学习装置和具有该机器学习装置的磁轴承装置。

背景技术

以往,公知有利用多个电磁体的合成电磁力以非接触的方式支承轴等被支承体的磁轴承装置。在专利文献1(日本实开平04-040308号公报)中公开了如下结构:利用传感器检测被支承体的位置,根据检测信号对电磁体的电磁力进行控制,将被支承体的位置保持于规定的位置。

发明内容

发明要解决的课题

存在由于磁轴承装置的每个产品的偏差和磁轴承装置的经时变化等而无法适当地进行被支承体的位置的控制这样的课题。

用于解决课题的手段

第1观点的机器学习装置学习磁轴承装置的控制条件。磁轴承装置具有磁轴承,该磁轴承具有对轴赋予电磁力的多个电磁体。机器学习装置具有学习部、状态变量取得部、评价数据取得部和更新部。状态变量取得部取得包含与轴的位置相关的至少1个参数的状态变量。评价数据取得部取得评价数据,该评价数据包含轴的位置的测定值、轴的位置的目标值和与相对于目标值的偏差相关的参数中的至少1个参数。更新部使用评价数据对学习部的学习状态进行更新。学习部按照更新部的输出来学习控制条件。

第2观点的机器学习装置在第1观点的机器学习装置中,状态变量至少包含输出与轴的位置对应的信号的位移传感器的输出值。学习部学习电磁体的电压值和电磁体的电流值中的至少一方作为控制条件。

第3观点的机器学习装置在第1观点的机器学习装置中,状态变量至少包含电磁体的电流值和电压值或电磁体的电流值和磁通。学习部学习电磁体的电压值和电磁体的电流值中的至少一方作为控制条件。

第4观点的机器学习装置在第1观点的机器学习装置中,状态变量至少包含输出与轴的位置对应的信号的位移传感器的输出值。评价数据至少包含轴的位置的真值。学习部学习轴的位置作为控制条件。

第5观点的机器学习装置在第1观点的机器学习装置中,状态变量至少包含电磁体的电流值和电压值或电磁体的电流值和磁通。评价数据至少包含轴的位置的真值。学习部学习轴的位置作为控制条件。

第6观点的机器学习装置在第1观点的机器学习装置中,状态变量至少包含轴的位置的检测值和轴的位置的指令值。学习部学习电磁体的电压值和电磁体的电流值中的至少一方作为控制条件。

第7观点的机器学习装置在第2或第3观点的机器学习装置中,更新部使学习部以使得用于驱动磁轴承的电流值成为规定的容许值以下的方式进一步进行学习。

第8观点的机器学习装置在第2或第3观点的机器学习装置中,评价数据还包含与驱动磁轴承的逆变器的温度相关的参数。更新部使学习部以使得逆变器的温度成为规定的容许值以下的方式进一步进行学习。

第9观点的机器学习装置在第2、第3和第6观点中的任意一个观点的机器学习装置中,在磁轴承由电压型逆变器驱动的情况下,状态变量还包含电磁体的电流检测值。在磁轴承由电流型逆变器驱动的情况下,状态变量还包含电磁体的电压检测值。

第10观点的机器学习装置在第9观点的机器学习装置中,更新部使学习部进一步进行学习,以减小与电流值的控制的响应性相关的值。

第11观点的机器学习装置在第2、第3和第6观点中的任意一个观点的机器学习装置中,状态变量还包含轴的转速。

第12观点的机器学习装置在第2、第3和第6观点中的任意一个观点的机器学习装置中,状态变量还包含与冷冻装置的运转条件相关的至少1个参数。冷冻装置具有连接由电动机驱动的压缩机、冷凝器、膨胀机构和蒸发器而成的制冷剂回路。运转条件包含冷冻装置的冷冻能力的范围以及与在制冷剂回路中循环的制冷剂进行热交换的介质的温度的范围,所述介质流入冷凝器。

第13观点的机器学习装置在第12观点的机器学习装置中,状态变量还包含与赋予给轴的电磁力相关的至少1个参数。与电磁力相关的参数包含与冷冻装置的制冷剂负荷相关的参数以及与冷冻装置的物理特性相关的参数中的至少一方。

第14观点的机器学习装置在第12观点的机器学习装置中,状态变量还包含与磁轴承的特性相关的至少1个参数。与磁轴承的特性相关的参数包含与电磁体的线圈的电感相关的参数以及与电磁体的线圈的电阻相关的参数中的至少一方。

第15观点的机器学习装置在第2或第3观点的机器学习装置中,评价数据还包含与磁轴承的消耗电力相关的参数。更新部使学习部进一步进行学习,以减小消耗电力。与消耗电力相关的参数包含用于驱动磁轴承的电流值、用于驱动磁轴承的电压值和电磁体的线圈的电阻中的至少两者。

第16观点的机器学习装置在第7、第8和第15观点中的任意一个观点的机器学习装置中,状态变量还包含与冷冻装置的运转条件相关的至少1个参数。冷冻装置具有连接由电动机驱动的压缩机、冷凝器、膨胀机构和蒸发器而成的制冷剂回路。运转条件包含冷冻装置的冷冻能力的范围以及与在制冷剂回路中循环的制冷剂进行热交换的介质的温度的范围,所述介质流入冷凝器。

第17观点的机器学习装置在第2、第3和第6观点中的任意一个观点的机器学习装置中,评价数据还包含与供给到由电动机驱动的压缩机的输入能量相关的至少1个参数。更新部使学习部进一步进行学习,以减小输入能量。

第18观点的机器学习装置在第17观点的机器学习装置中,状态变量还包含与冷冻装置的运转条件相关的至少1个参数以及与连结于轴的叶轮的隔热效率相关的至少1个参数中的至少一方。冷冻装置具有连接由电动机驱动的压缩机、冷凝器、膨胀机构和蒸发器而成的制冷剂回路。运转条件包含冷冻装置的冷冻能力的范围以及与在制冷剂回路中循环的制冷剂进行热交换的介质的温度的范围,所述介质流入冷凝器。与叶轮的隔热效率相关的参数包含与制冷剂的压力相关的参数以及与制冷剂的温度相关的参数中的至少一方。

第19观点的机器学习装置在第2或第4观点的机器学习装置中,状态变量还包含与位移传感器的温度相关的参数。

第20观点的机器学习装置在第1~第19观点中的任意一个观点的机器学习装置中,更新部根据评价数据计算报酬。学习部使用报酬进行学习。

第21观点的机器学习装置在第1~第19观点中的任意一个观点的机器学习装置中,学习部按照更新部的输出而多次进行函数的参数的变更,并按照参数被变更后的每个函数,根据状态变量输出控制条件。更新部具有蓄积部和判定部。判定部判定评价数据,输出判定结果。蓄积部根据判定结果,根据状态变量和评价数据生成教师数据并进行蓄积。学习部根据蓄积部中蓄积的教师数据进行学习。

第22观点的机器学习装置在第1~第21观点中的任意一个观点的机器学习装置中,根据由学习部学习的结果得到的已学习模型,输出控制条件。

第23观点的磁轴承装置具有第22观点的机器学习装置。

附图说明

图1是具有第1实施方式的磁轴承装置10的空调装置100的整体结构图。

图2是压缩机110的纵剖视图。

图3是径向磁轴承21的横剖视图。

图4是径向磁轴承21的纵剖视图。

图5是推力磁轴承22的俯视图。

图6是推力磁轴承22的纵剖视图。

图7是比较用的参考图,是轴115的位置控制系统的结构框图。

图8是第1实施方式中的轴115的位置控制系统的结构框图。

图9A是进行有教师学习的控制部40的结构框图。

图9B是进行有教师学习的控制部40的结构框图。

图10是神经网络的神经元的模型的示意图。

图11是组合图10所示的神经元而构成的三层的神经网络的示意图。

图12是用于说明支持向量机的图。示出2类的学习数据能够进行线性分离的特征空间。

图13示出2类的学习数据不能进行线性分离的特征空间。

图14是通过分治法构成的决策树的一例。

图15示出通过图14的决策树来分割的特征空间。

图16是进行基于Q学习的强化学习的控制部40的结构框图。

图17是第3实施方式中的轴115的位置控制系统的结构框图。

图18是第4实施方式中的轴115的位置控制系统的结构框图。

图19是第5实施方式中的轴115的位置控制系统的结构框图。

图20是变形例F中的空调装置100的运转条件的一例。

具体实施方式

―第1实施方式―

参照附图对具有第1实施方式的磁轴承装置10的空调装置100进行说明。

(1)空调装置100的整体结构

图1是空调装置100的整体结构图。空调装置100具有制冷剂回路190。制冷剂回路190是填充有制冷剂的闭合回路。在制冷剂回路190设置有压缩机110、冷凝器120、膨胀阀130、蒸发器140和电动机冷却控制装置150。压缩机110能够采用各种压缩机。在本实施方式中,压缩机110是涡轮压缩机。压缩机110由电动机114来驱动。从电动机控制装置160向电动机114供给电力。

冷凝器120和蒸发器140是水制冷剂热交换器。膨胀阀130例如是电子膨胀阀。在制冷剂回路190设置有检测制冷剂压力的传感器和检测制冷剂温度的传感器等。

图2是压缩机110的纵剖视图。压缩机110主要具有壳体112、压缩机构113、电动机114、轴115、径向接触轴承(radial touchdown bearing)116、推力接触轴承(thrusttouchdown bearing)117和磁轴承装置10。

壳体112具有两端被封闭的圆筒形状。壳体112被配置成其圆筒形状的圆筒轴与水平方向平行。壳体112内的空间由壁部112a来划分。在图2中,比壁部112a靠右侧的空间是收纳压缩机构113的压缩机构室S1。在图2中,比壁部112a靠左侧的空间是收纳电动机114的电动机室S2。在壳体112内的空间配置有沿水平方向延伸的轴115。轴115连结压缩机构113和电动机114。

压缩机构113对流体进行压缩。在本实施方式中,流体是制冷剂回路190中填充的制冷剂。压缩机构113主要具有叶轮113a和入口导流叶片113b。叶轮113a通过多个叶片构成为外形成为大致圆锥形状。叶轮113a固定于轴115的一个端部。入口导流叶片113b设置于压缩机构113的流体的吸入口。入口导流叶片113b是用于对流体的吸入量进行控制的阀。

电动机114对轴115进行旋转驱动。电动机114主要具有定子114a和转子114b。定子114a形成为圆筒形状,固定于壳体112内。转子114b形成为圆柱形状,以能够旋转的方式设置于定子114a的内侧。在转子114b的中心部形成有用于固定轴115的轴孔。在轴115的端部固定有圆盘部115a。圆盘部115a固定于未固定有叶轮113a一侧的端部。

电动机控制装置160对向电动机114供给的电力进行控制,进行电动机114的启动、停止和旋转速度的控制。电动机控制装置160主要具有转换器电路、逆变器电路和微计算机。它们安装于控制基板160a上。微计算机对逆变器电路具有的开关元件的开关动作进行控制。因此,对微计算机输入电动机114的旋转速度和电动机114的电流值的信息等。以保护开关元件等为目的在控制基板160a设置有温度传感器。微计算机在控制逆变器电路时利用该温度传感器的检测值。

压缩机110使冷凝器120内的制冷剂在电动机114的内部流动,由此对电动机114进行冷却。电动机冷却控制装置150具有电动的开闭阀150a和温度传感器150b。电动机冷却控制装置150根据温度传感器150b的检测值对开闭阀150a进行控制,对从冷凝器120流入电动机114的制冷剂的流量进行控制。由此,在制冷剂回路190中,能够将电动机114的温度维持在规定温度范围内。电动机114经由开闭阀150a而与冷凝器120配管连接。电动机114还与蒸发器140配管连接。在电动机114内流动并对电动机114进行冷却后的制冷剂返回到蒸发器140。温度传感器150b安装于连结电动机114和蒸发器140的配管。

压缩机110具有径向接触轴承116和推力接触轴承117这2种接触轴承。在磁轴承装置10非通电时,换言之在轴115未进行磁悬浮时,径向接触轴承116对轴115进行支承。

(2)磁轴承装置10的详细结构

磁轴承装置10使作为被支承体的轴115进行磁悬浮,由此以非接触的方式将轴115支承为能够旋转。磁轴承装置10主要具有1个或多个(在本实施方式中为3个)磁轴承21、22、1个或多个(在本实施方式中为5个)位移传感器31、32、以及控制部40。

(2-1)磁轴承21、22

磁轴承21、22具有隔着被支承体而彼此对置的电磁体对。磁轴承21、22构成为利用电磁体对的合成电磁力以非接触的方式对被支承体进行支承。在磁轴承21、22中,对流过电磁体对的电流进行控制,由此对该电磁体对的合成电磁力进行控制,能够对被支承体在该电磁体对的对置方向上的位置进行控制。在本实施方式中,磁轴承装置10具有2个径向磁轴承21和1个推力磁轴承22作为磁轴承21、22。

(2-1-1)径向磁轴承21

图3是径向磁轴承21的横剖视图。图4是径向磁轴承21的纵剖视图。如图3和图4所示,径向磁轴承21具有第1~第4电磁体51~54,构成异极型的径向磁轴承。第1和第2电磁体51、52隔着轴115而彼此对置,利用第1和第2电磁体51、52的电磁力F1、F2以非接触的方式对轴115进行支承。第3和第4电磁体53、54隔着轴115而彼此对置,利用第3和第4电磁体53、54的电磁力F3、F4以非接触的方式对轴115进行支承。在俯视观察时,第3和第4电磁体53、54的对置方向与第1和第2电磁体51、52的对置方向正交。

在图3中,径向磁轴承21具有磁轴承芯61和8个线圈65。磁轴承芯61例如是层叠多个电磁钢板而构成的,具有背轭62和8个齿63。背轭62形成为圆筒状。8个齿63沿着背轭62的内周面以规定间隔(在本实施方式中为45°间隔)在周向上排列。齿63从背轭62的内周面向径向内侧突出。齿63的内周面(突端面)与轴115的外周面隔开规定的间隙而对置。

8个线圈65分别卷绕于磁轴承芯61的8个齿63。由此,形成有8个电磁体部71~78。在图3中,第1电磁体部71、第2电磁体部72、第7电磁体部77、第8电磁体部78、第3电磁体部73、第4电磁体部74、第5电磁体部75和第6电磁体部76按照顺时针方向依次排列。第1电磁体51具有第1电磁体部71和第2电磁体部72。第2电磁体52具有第3电磁体部73和第4电磁体部74。第3电磁体53具有第5电磁体部75和第6电磁体部76。第4电磁体54具有第7电磁体部77和第8电磁体部78。对流过8个电磁体部71~78的电流进行控制,对第1~第4电磁体51~54的电磁力F1~F4的合力即合成电磁力进行控制,由此,能够对轴115在第1和第2电磁体51、52的对置方向以及第3和第4电磁体53、54的对置方向上的位置进行控制。

线圈65的卷绕方向和流过线圈65的电流的朝向被设定为,在第1~第4电磁体51~54分别产生吸引力。该情况下,吸引力是在拉近轴115的方向上作用的电磁力。具体而言,线圈65的卷绕方向和流过线圈65的电流的朝向被设定为,在图3所示的环状的箭头的方向上产生磁通。

(2-1-2)推力磁轴承22

图5是推力磁轴承22的俯视图。图6是推力磁轴承22的纵剖视图。如图5和图6所示,推力磁轴承22具有第1和第2电磁体51、52。第1和第2电磁体51、52在水平方向上隔着圆盘部115a而彼此对置,利用第1和第2电磁体51、52的电磁力F1、F2以非接触的方式对圆盘部115a进行支承。

具体而言,推力磁轴承22具有2个磁轴承芯61和2个线圈65。2个磁轴承芯61分别形成为圆环状,隔开规定的间隙配置于圆盘部115a的轴向两侧。在磁轴承芯61的对置面遍及整周地形成有圆周槽。2个线圈65分别收纳于2个磁轴承芯61的圆周槽。由此,构成第1和第2电磁体51、52。对流过第1和第2电磁体51、52的电流进行控制,对第1和第2电磁体51、52的电磁力F1、F2的合力即合成电磁力进行控制,由此,能够对圆盘部115a在第1和第2电磁体51、52的对置方向(水平方向)上的位置(轴115的位置)进行控制。

线圈65的卷绕方向和流过线圈65的电流的朝向被设定为,在第1和第2电磁体51、52分别产生吸引力。该情况下,吸引力是在拉近圆盘部115a的方向上作用的电磁力。具体而言,线圈65的卷绕方向和流过线圈65的电流的朝向被设定为,在图6所示的环状的箭头的方向上产生磁通。

(2-2)位移传感器31、32

位移传感器31、32均为涡电流式的位移传感器。位移传感器31、32与隔着被支承体而彼此对置的电磁体对(第1和第2电磁体51、52的组)对应地设置。位移传感器31、32对被支承体相对于位移传感器31、32的基准位置的位移量进行检测。位移传感器31、32的基准位置例如是位移传感器31、32的传感器头的位置、或电磁体对的对置方向上的中央位置。电磁体对的对置方向上的中央位置例如是第1电磁体51与第2电磁体52之间的中央位置。在本实施方式中,磁轴承装置10具有径向位移传感器31和推力位移传感器32作为位移传感器31、32。

(2-2-1)径向位移传感器31

径向位移传感器31在各径向磁轴承21各设置有2个。换言之,磁轴承装置10具有4个径向位移传感器31。径向位移传感器31检测相对于径向位移传感器31的基准位置的位移量。径向位移传感器31的基准位置例如是径向位移传感器31的传感器头的位置、或轴115的中央位置。在各径向磁轴承21中,一个径向位移传感器31对径向磁轴承21的第1电磁体51和第2电磁体52的对置方向(X轴方向)上的位移量进行检测。X轴方向是径向磁轴承21的径向。另一个径向位移传感器31对径向磁轴承21的第3电磁体53和第4电磁体54的对置方向(Y轴方向)上的位移量进行检测。Y轴方向是与X轴方向正交的径向磁轴承21的径向。

径向位移传感器31以规定的时间间隔检测相对于径向位移传感器31的基准位置的位移量。规定的时间间隔例如为40μ秒。

(2-2-2)推力位移传感器32

磁轴承装置10具有1个推力位移传感器32。推力位移传感器32对推力磁轴承22的第1电磁体51和第2电磁体52的对置方向(Z轴方向)上的位移量进行检测。Z轴方向是沿着轴115的旋转轴线的方向。推力位移传感器32检测相对于推力位移传感器32的基准位置的位移量。推力位移传感器32的基准位置例如是推力位移传感器32的传感器头的位置、或圆盘部115a的中央位置。

推力位移传感器32以规定的时间间隔检测相对于推力位移传感器32的基准位置的位移量。规定的时间间隔例如为40μ秒。

(2-3)控制部40

控制部40对1个或多个磁轴承21、22进行控制,以使得以非接触的方式支承被支承体(轴115和圆盘部115a)。控制部40对各磁轴承21、22的电磁力进行控制,由此进行被支承体的悬浮控制。具体而言,控制部40由微计算机和存储有用于使该微计算机进行动作的软件的存储设备等构成。控制部40具有径向控制部41和推力控制部42。

(2-3-1)径向控制部41

径向控制部41进行基于2个径向磁轴承21的轴115的悬浮控制。在该悬浮控制中,径向控制部41进行轴115在X轴方向和Y轴方向的各个方向上的位置控制。具体而言,径向控制部41针对X轴方向和Y轴方向的各方向,根据径向位移传感器31检测到的位移量,以使轴115的位置与预定的位置指令值的差分值收敛于零的方式,使电流(控制电流)流过构成径向磁轴承21的第1~第4电磁体51~54的各个线圈65。径向控制部41输出施加给各线圈65的电压(电压指令值),以使得控制电流流过各线圈65。

(2-3-2)推力控制部42

推力控制部42进行基于推力磁轴承22的圆盘部115a的悬浮控制。在该悬浮控制中,推力控制部42进行圆盘部115a在Z轴方向上的位置控制。具体而言,推力控制部42针对Z轴方向,根据推力位移传感器32检测到的位移量,以使圆盘部115a的位置与预定的位置指令值的差分值收敛于零的方式,使电流(控制电流)流过构成推力磁轴承22的第1和第2电磁体51、52的各个线圈65。推力控制部42输出施加给各线圈65的电压(电压指令值),以使得控制电流流过各线圈65。

(2-4)磁轴承装置10的位置控制系统

磁轴承装置10具有轴115的位置控制系统。在位置控制系统中,控制部40对各磁轴承21、22的电磁力进行控制,由此进行以非接触的方式被支承的轴115的位置控制。

接着,说明控制部40(径向控制部41和推力控制部42)对2个径向磁轴承21和1个推力磁轴承22的电磁力进行控制、由此进行轴115的位置控制的方法。在轴115的位置控制中,以如下方式对轴115的位置进行控制:使得在沿着Z轴观察轴115的情况下,轴115的旋转轴线位于包含X轴和Y轴的XY平面中的轴115的可动极限区域的中心。轴115的可动极限区域是比轴115与径向接触轴承116接触的位置靠内侧的区域。具体而言,例如,轴115的可动极限区域是半径250μm的圆形区域。在轴115旋转时,例如,轴115在从其旋转轴线起10μm以下的范围内摆动。轴115的可动容许区域例如是半径83μm的圆形区域。轴115的可动容许区域是在轴115旋转时容许轴115与其旋转轴线分离地摆动的范围。

在本实施方式中,控制部40使用机器学习的方法进行轴115的位置控制。这里,为了进行比较,对不使用机器学习的方法的、现有的控制部的动作进行说明。图7是比较用的参考图,是包含现有的控制部940的、轴115的位置控制系统的结构框图。控制部940主要具有位置检测部941、位置控制部942和电流控制部943。在图7中示出控制对象装置50和外部装置60。控制对象装置50和外部装置60在与控制部940之间发送接收信息。控制对象装置50是磁轴承装置10具有的装置,具体而言,是轴115、磁轴承21、22和位移传感器31、32。外部装置60是磁轴承装置10以外的装置,是空调装置100具有的装置。外部装置60例如是电动机冷却控制装置150。

位置检测部941检测轴115在XY平面中的位置。位置检测部941接收位移传感器31、32的输出值。位移传感器31、32的输出值包含轴115的X轴方向的位置和轴115的Y轴方向的位置。位置检测部941从外部装置60接收与空调装置100的运转有关的信息。位置检测部941根据从位移传感器31、32接收到的输出值和从外部装置60接收到的信息(外部信息),输出与轴115的位置有关的信息即位置检测值。

位置控制部942根据与位置检测部941检测到的轴115的位置有关的信息和外部信息,根据预定的控制规则输出电流指令值,以使轴115在可动容许区域内旋转。电流指令值是输入到磁轴承21、22的电磁体的线圈65的电流。

电流控制部943根据位置控制部942输出的电流指令值、流过磁轴承21、22的线圈65的电流的检测值和外部信息,输出施加给磁轴承21、22的线圈65的电压指令值。电压指令值是施加给磁轴承21、22的线圈65的电压。

控制部940根据控制对象装置50和外部装置60的输出值,根据预定的控制规则输出电压指令值,以使轴115在可动容许区域内旋转。

接着,对基于本实施方式的控制部40的轴115的位置控制进行说明。图8是包含本实施方式的控制部40的、轴115的位置控制系统的结构框图。控制部40具有作为学习磁轴承装置10的控制条件的机器学习装置的功能。具体而言,控制部40使用机器学习的方法进行轴115的位置控制。更具体而言,控制部40使用控制对象装置50的输出值,使用有教师学习或强化学习的方法学习用于适当地进行轴115的位置控制的条件(位置控制条件)。在本实施方式中,控制对象装置50是轴115、磁轴承21、22和位移传感器31、32中的至少一部分。控制部40使用位置控制条件的学习结果,针对新的输出值决定最佳的位置控制条件。控制部40主要具有状态变量取得部43、评价数据取得部44、学习部45、决定部46和更新部47。图9A和图9B是进行有教师学习的控制部40的结构框图。

(2-4-1)状态变量取得部43

状态变量取得部43在磁轴承装置10的动作中观测磁轴承装置10的状态,取得与观测到的状态有关的信息作为状态变量。换言之,状态变量取得部43被输入磁轴承装置10的状态,输出状态变量。状态变量包含与轴115的位置相关的至少1个参数。在本实施方式中,状态变量是位移传感器31、32的输出值。状态变量在有教师学习中用作教师数据。

这里,轴115的位置是限制轴115的除了绕旋转轴线(Z轴)的角度以外的5个自由度的坐标值中的至少一方。5个自由度的一例是轴115的重心位置的X轴方向、Y轴方向和Z轴方向各自的坐标值、轴115的绕X轴的角度和轴115的绕Y轴的角度。5个自由度的另一例是2个径向磁轴承21各自的X轴方向和Y轴方向的坐标值以及2个径向磁轴承21的重心的Z轴方向的坐标值。举出具体例时,作为轴115的位置,可以使用轴115在XY平面中的重心位置。

(2-4-2)评价数据取得部44

评价数据取得部44评价判定数据,取得评价数据。评价数据在有教师学习中用作教师数据。评价数据包含轴115的位置的测定值、轴115的位置的目标值以及与轴115的位置相对于目标值的偏差相关的参数中的至少1个参数。评价数据取得部44例如将判定数据输入到规定的评价函数,取得评价函数的输出值作为评价数据。换言之,评价数据取得部44被输入判定数据,输出评价数据。判定数据例如是能够用于评价轴115的位置控制的数据。在本实施方式中,判定数据是轴115的可动范围的中心位置(位置指令值)和轴115的位置的检测值(位置检测值)。位置指令值是轴115的位置的目标值。位置检测值例如是根据位移传感器31、32的输出值得到的轴115的位置的检测值。

该情况下,控制部40以使位置检测值尽可能地接近位置指令值的方式进行轴115的位置控制。因此,评价数据取得部44使用判定数据,取得以位置指令值为基准的情况下的位置检测值的偏差(轴位置偏差)作为评价数据。轴位置偏差越接近零越优选。该情况下,评价函数的输入值是位置指令值和位置检测值,评价函数的输出值是轴位置偏差。

评价函数也可以是只要轴位置偏差在规定范围内则视为固定值的函数。规定范围是零附近的范围,固定值是零。换言之,从轴115的位置控制的观点来看,轴位置偏差只需要接近于零即可,不需要收敛于零。

轴位置偏差例如是位置指令值与位置检测值之间的距离的绝对值。但是,轴位置偏差也可以是从当前到过去的规定时点为止的该距离的均方根(RMS)或均方(MS),还可以是强制地添加了外界干扰的情况下的该距离的超调量或整定时间。超调量是指,在位置检测值接近位置指令值的过程中,在位置检测值超过(超调)位置指令值的情况下超过位置指令值的量。整定时间是指,在位置检测值接近位置指令值的过程中,位置检测值进入位置指令值附近的规定的容许范围内、且此后未从该容许范围偏离的时点为止的时间。

(2-4-3)学习部45

学习部45使用有教师学习或强化学习的方法学习用于适当地进行轴115的位置控制的条件(位置控制条件)。学习部45按照更新部47的输出来学习位置控制条件。接着,对使用有教师学习的情况下的学习部45的动作进行说明。

学习部45使用状态变量取得部43预先取得的状态变量与评价数据取得部44预先取得的评价数据的对,作为学习数据。在本实施方式中,状态变量是位移传感器31、32的输出值,评价数据是轴位置偏差。学习部45在学习中使用的教师数据是状态变量与评价数据的对。

学习部45按照更新部47的输出,对作为从状态变量到评价数据的映射的识别函数的参数进行调整,由此学习位置控制条件。基于学习部45的学习的目的是,使用学习数据调整识别函数的参数,以使得能够根据新的状态变量得到正确或适当的评价数据。利用学习部45充分调整参数后的识别函数相当于已学习模型。

如图9A所示,学习部45也可以使用教师数据的一部分作为学习数据来调整识别函数的参数,使用教师数据的其余部分作为测试数据。测试数据是学习中未使用的数据,主要是已学习模型的性能评价所使用的数据。通过使用测试数据,能够以相对于测试数据的错误概率这样的形式来预测根据新的状态变量得到的评价数据的性能。作为将预先取得的数据分成学习数据和测试数据的方法,使用留出法、交叉验证法、留一法(刀切法)和自助法等。

此外,根据模型被更新的定时,基于学习部45的学习被分类为在线学习和批量学习。在线学习是如下的方法:每当取得模型更新所需要的数据时,仅使用新取得的数据随时更新现有的模型。批量学习是如下的方法:在收集模型更新所需要的全部数据后,在规定的定时对成为学习对象的全部数据集中统一进行处理,生成模型。

(2-4-4)更新部47

更新部47使用评价数据对学习部45的学习状态进行更新。学习部45按照更新部47的输出(教师数据),多次进行识别函数的参数的变更,按照参数被变更后的每个识别函数,根据状态变量输出控制条件(位置控制条件)。

更新部47具有蓄积部47a和判定部47b。判定部47b判定评价数据,输出判定结果。蓄积部47a根据评价数据的判定结果,根据状态变量和评价数据生成教师数据并进行蓄积。学习部45根据蓄积部47a中蓄积的教师数据来学习控制条件。

(2-4-5)决定部46

决定部46根据基于学习部45的学习的结果所得到的已学习模型,根据与轴115的位置相关的新的状态变量,决定用于适当地进行轴115的位置控制的条件(位置控制条件)并进行输出。与轴115的位置相关的状态变量是位移传感器31、32的输出值。位置控制条件是用于驱动磁轴承装置10的信息。在本实施方式中,位置控制条件是用于驱动磁轴承装置10的电流或电压,具体而言,是施加给磁轴承21、22的线圈65的电压(电压指令值)。

图9A和图9B示出根据已学习模型、根据新的状态变量决定位置控制条件时的数据流。

在图9A中,进行基于在线学习的有教师学习。该情况下,学习部45使用磁轴承装置10的出厂或设置前的试验运转时等取得的数据(状态变量),预先生成已学习模型。决定部46在磁轴承装置10的初次运转开始时,根据学习部45预先生成的已学习模型决定位置控制条件。然后,学习部45使用磁轴承装置10的运转时新取得的数据(状态变量)对已学习模型进行更新。决定部46根据学习部45更新后的已学习模型决定位置控制条件。这样,在在线学习中,定期地更新已学习模型,决定部46根据最新的已学习模型决定位置控制条件。

在图9B中,进行基于批量学习的有教师学习。该情况下,学习部45使用磁轴承装置10的出厂或设置前的试验运转时等取得的数据(状态变量),预先生成已学习模型。决定部46在磁轴承装置10的运转时,根据学习部45预先生成的已学习模型决定位置控制条件。该已学习模型在由学习部45预先生成后未被更新。换言之,决定部46使用相同的已学习模型决定位置控制条件。

在图9A和图9B所示的结构中,磁轴承装置10具有的控制部40生成已学习模型。但是,经由互联网等计算机网络而与控制部40连接的服务器也可以生成已学习模型,此外,也可以利用云计算的服务来生成已学习模型。

(2-4-6)有教师学习

对学习部45使用的机器学习的方法即有教师学习进行说明。有教师学习是使用教师数据生成与未知的输入数据对应的输出的方法。在有教师学习中,使用学习数据和识别函数。学习数据是输入数据和与其对应的教师数据的对的集合。输入数据例如是特征空间中的特征向量。教师数据例如是与输入数据的识别、分类和评价有关的参数。识别函数示出从输入数据到与其对应的输出的映射。有教师学习是如下的方法:使用事前给出的学习数据对识别函数的参数进行调整,以使识别函数的输出与教师数据的误差减小。作为有教师学习中使用的模型或算法,举出回归分析、时间序列分析、决策树、支持向量机、神经网络、集成学习等。

回归分析例如是线性回归分析、多元回归分析、逻辑回归分析。回归分析是使用最小二乘法等在输入数据(说明变量)与教师数据(目的变量)之间应用模型的方法。在线性回归分析中,说明变量的维度为1,在多元回归分析中,说明变量的维度为2以上。在逻辑回归分析中,使用逻辑函数(sigmoid函数)作为模型。

时间序列分析例如是AR模型(自回归模型)、MA模型(移动平均模型)、ARMA模型(自回归移动平均模型)、ARIMA模型(差分自回归移动平均模型)、SARIMA模型(季节差分自回归移动平均模型)、VAR模型(向量自回归模型)。AR、MA、ARMA、VAR模型示出稳定过程,ARIMA、SARIMA模型示出非稳定过程。AR模型是值相对于时间的经过规则地变化的模型。MA模型是某个期间内的变动恒定的模型。例如,在MA模型中,某个时点的值由该时点之前的移动平均来决定。ARMA模型是组合了AR模型和MA模型而得到的模型。ARIMA模型是考虑中长期的趋势(增加或减少倾向)来针对前后的值的差分应用ARMA模型而得到的模型。SARIMA模型是考虑中长期的季节变动来应用ARIMA模型而得到的模型。VAR模型是将AR模型扩展为多变量而得到的模型。

决策树是用于组合多个识别器来生成复杂的识别边界的模型。决策树的详细情况在后面叙述。

支持向量机是生成2类的线性识别函数的算法。支持向量机的详细情况在后面叙述。

神经网络是对利用突触结合人的脑神经系统的神经元而形成的网络进行模型化而得到的。狭义地讲,神经网络意味着使用误差反向传播法的多层感知器。作为代表性的神经网络,举出卷积神经网络(CNN)、循环神经网络(RNN)。CNN是一种非完全连接(粗连接)的正向传播型神经网络。RNN是一种具有定向循环的神经网络。CNN和RNN用于声音、图像、动画识别和自然语言处理。

集成学习是组合多个模型来提高识别性能的方法。集成学习使用的方法例如是装袋、提升、随机森林。装袋是如下的方法:使用学习数据的自助样本使多个模型进行学习,通过基于多个模型的多数表决来决定新的输入数据的评价。提升是如下的方法:根据装袋的学习结果对学习数据进行加权,与正确识别出的学习数据相比,集中地学习误识别出的学习数据。随机森林是如下的方法:在使用决策树作为模型的情况下,生成由相关性较低的多个决策树构成的决策树组(随机森林)。随机森林的详细情况在后面叙述。

在本实施方式中,作为学习部45使用的有教师学习的优选模型或算法,使用以下说明的神经网络、支持向量机、决策树和随机森林。

(2-4-6-1)神经网络

图10是神经网络的神经元的模型的示意图。图11是组合图10所示的神经元而构成的三层的神经网络的示意图。如图10所示,神经元针对多个输入x(在图10中为输入x1、x2、x3)输出输出y。对各输入x(在图10中为输入x1、x2、x3)乘以对应的权重w(在图10中为权重w1、w2、w3)。神经元使用下面的式(1)输出输出y。

【数学式1】

在式(1)中,输入x、输出y和权重w全部是向量,θ是偏置(bias),是激活函数。激活函数是非线性函数,例如是阶跃函数(形式神经元)、简单感知器、sigmoid函数或ReLU(斜坡函数)。

在图11所示的三层的神经网络中,从输入侧(图11的左侧)输入多个输入向量x(在图11中为输入向量x1、x2、x3),从输出侧(图11的右侧)输出多个输出向量y(在图11中为输出向量y1、y2、y3)。该神经网络由3个层L1、L2、L3构成。

在第1层L1,输入向量x1、x2、x3被乘以对应的权重而分别被输入到3个神经元N11、N12、N13。在图11中,这些权重统一表记为W1。神经元N11、N12、N13分别输出特征向量z11、z12、z13。

在第2层L2,特征向量z11、z12、z13被乘以对应的权重而分别被输入到2个神经元N21、N22。在图11中,这些权重统一表记为W2。神经元N21、N22分别输出特征向量z21、z22。

在第3层L3,特征向量z21、z22被乘以对应的权重而分别被输入到3个神经元N31、N32、N33。在图11中,这些权重统一表记为W3。神经元N31、N32、N33分别输出输出向量y1、y2、y3。

在神经网络的动作中,存在学习模式和预测模式。在学习模式中,使用学习数据集学习权重W1、W2、W3。在预测模式中,使用学习后的权重W1、W2、W3的参数进行识别等预测。

权重W1、W2、W3例如能够通过误差反向传播法(反向传播)进行学习。该情况下,与误差有关的信息从输出侧朝向输入侧传递,换言之,在图11中从右侧朝向左侧传递。误差反向传播法是如下的方法:在各神经元中,调整并学习权重W1、W2、W3,以减小被输入输入x时的输出y与真的输出y(教师数据)之差。

神经网络能够构成为具有比3层多的层。基于4层以上的神经网络的机器学习的方法是作为深度学习(深层学习)被公知的。

(2-4-6-2)支持向量机

支持向量机(SVM)是求出实现最大边距的2类线性识别函数的算法。图12是用于说明SVM的图。2类线性识别函数表示识别超平面P1、P2,该识别超平面P1、P2是用于在图12所示的特征空间中对2个类C1、C2的学习数据进行线性分离的超平面。在图12中,类C1的学习数据用圆形表示,类C2的学习数据用正方形表示。识别超平面的边距是指最接近识别超平面的学习数据与识别超平面之间的距离。在图12中,示出识别超平面P1的边距d1和识别超平面P2的边距d2。在SVM中,求出边距最大的识别超平面即最佳识别超平面P1。一个类C1的学习数据与最佳识别超平面P1之间的距离的最小值d1跟另一个类C2的学习数据与最佳识别超平面P2之间的距离的最小值d1相等。

在图12中,利用以下的式(2)表示2类问题的有教师学习中使用的学习数据集DL

【数学式2】

DL={(ti,xi)}(i=1,...,N) (2)

学习数据集DL是学习数据(特征向量)xi和教师数据ti={-1、+1}的对的集合。学习数据集DL的要素数为N。教师数据ti表示学习数据xi属于类C1、C2中的哪类。类C1是ti=-1的类,类C2是ti=+1的类。

在图12中,在全部学习数据xi中成立、且被归一化的线性识别函数利用以下的2个式(3-1)和(3-2)表示。w是系数向量,b是偏置。

【数学式3】

ti=+1的情况wTxi+b≥+1 (3-1)

ti=-1的情况wTxi+b≤-1 (3-2)

这2个式子利用以下的1个式(4)表示。

【数学式4】

ti(wTxi+b)≥1 (4)

在利用以下的式(5)表示识别超平面P1、P2的情况下,其边距d利用式(6)表示。

【数学式5】

wTx+b=0 (5)

在式(6)中,ρ(w)表示将类C1、C2各自的学习数据xi投影到识别超平面P1、P2的法线向量w上的长度之差的最小值。式(6)的“min”和“max”的项分别是图12中符号“min”和符号“max”所示的点。在图12中,最佳识别超平面是边距d为最大的识别超平面P1。

图12示出2类的学习数据能够进行线性分离的特征空间。图13是与图12相同的特征空间,示出2类的学习数据不能进行线性分离的特征空间。在2类的学习数据不能进行线性分离的情况下,能够使用对式(4)中导入松弛变量ξi而扩展后的下面的式(7)。

【数学式6】

ti(wTxi+b)-1+ξi≥0 (7)

松弛变量ξi仅在学习时使用,取0以上的值。在图13中,示出识别超平面P3、边距边界B1、B2和边距d3。识别超平面P3的式子与式(5)相同。边距边界B1、B2是从识别超平面P3起的距离为边距d3的超平面。

在松弛变量ξi为0的情况下,式(7)与式(4)等价。此时,如图13中空心的圆形或正方形所示,满足式(7)的学习数据xi在边距d3内被正确地识别。此时,学习数据xi与识别超平面P3之间的距离为边距d3以上。

在松弛变量ξi大于0且为1以下的情况下,如图13中施加了阴影的圆形或正方形所示,满足式(7)的学习数据xi超过边距边界B1、B2,但是未超过识别超平面P3,被正确地识别。此时,学习数据xi与识别超平面P3之间的距离小于边距d3。

在松弛变量ξi大于1的情况下,如图13中涂黑的圆形或正方形所示,满足式(7)的学习数据xi超过识别超平面P3,被误识别。

这样,通过使用导入了松弛变量ξi的式(7),在2类的学习数据不能进行线性分离的情况下,也能够识别学习数据xi

根据上述说明,全部学习数据xi的松弛变量ξi之和表示被误识别的学习数据xi的数量的上限。这里,利用下面的式(8)定义评价函数Lp

【数学式7】

学习部45求出使评价函数Lp的输出值最小化的解(w、ξ)。在式(8)中,第2项的参数C表示针对误识别的惩罚的强度。求出如下的解:参数C越大,则与w的范数(第1项)相比优先减小误识别数(第2项)。

(2-4-6-3)决策树

决策树是用于组合多个识别器而得到复杂的识别边界(非线性识别函数等)的模型。识别器例如是与某个特征轴的值和阈值的大小关系有关的规则。作为根据学习数据构成决策树的方法,例如存在反复求出将特征空间一分为二的规则(识别器)的分治法。图14是通过分治法构成的决策树的一例。图15示出通过图14的决策树来分割的特征空间。在图15中,学习数据用白色圆圈或黑色圆点表示,通过图14所示的决策树,各学习数据被分类为白色圆圈的类或黑色圆点的类。在图14中,示出被赋予了1~11的编号的节点和连接节点之间且被赋予了是或否的标签的链接。在图14中,终端节点(叶节点)用四边形表示,非终端节点(根节点和内部节点)用圆形表示。终端节点是被赋予了6~11的编号的节点,非终端节点是被赋予了1~5的编号的节点。在各终端节点示出表示学习数据的白色圆圈或黑色圆点。对各非终端节点赋予识别器。识别器是判断特征轴x1、x2的值与阈值a~e的大小关系的规则。赋予给链接的标签表示识别器的判断结果。在图15中,识别器用虚线表示,对通过识别器分割后的区域赋予对应的节点的编号。

在通过分治法构成适当的决策树的过程中,需要研究以下的(a)~(c)这3点。

(a)用于构成识别器的特征轴和阈值的选择。

(b)终端节点的决定。例如,1个终端节点中包含的学习数据所属的类的数量。或者,将决策树的修剪(得到根节点相同的部分树)进行到哪里的选择。

(c)针对终端节点的基于多数表决的类的分配。

关于决策树的学习方法,例如使用CART、ID3和C4.5。CART是如下的方法:如图14和图15所示,在终端节点以外的各节点,按照每个特征轴将特征空间一分为二,由此生成2叉树作为决策树。

在使用决策树的学习中,为了提高学习数据的识别性能,在非终端节点在最佳的分割候选点对特征空间进行分割是重要的。作为评价特征空间的分割候选点的参数,也可以使用被称为多样性指数的评价函数。作为表示节点t的多样性指数的函数I(t),例如使用利用以下的式(9-1)~(9-3)表示的参数。K是类的数量。

【数学式8】

(a)节点t中的错误率

(b)交叉熵(脱离度)

(c)基尼系数

在上式中,概率P(Ci|t)是节点t处的类Ci的后验概率,换言之,是在节点t处选择类Ci的数据的概率。在式(9-3)的第2式中,概率P(Cj|t)是类Ci的数据被弄错成第j(≠i)类的概率,因此,第2式表示节点t处的错误率。式(9-3)的第3式表示与全部类有关的概率P(Ci|t)的方差之和。

在将多样性指数作为评价函数来分割节点的情况下,例如使用将决策树修剪到由该节点处的错误率和决策树的复杂度决定的容许范围为止的方法。

(2-4-6-4)随机森林

随机森林是一种集成学习,是组合多个决策树来强化识别性能的方法。在使用随机森林的学习中,生成由相关性较低的多个决策树构成的组(随机森林)。随机森林的生成和识别使用以下的算法。

(1)以m=1~M反复进行以下步骤。

(a)根据N个d维学习数据生成m个自助样本Zm

(b)将Zm作为学习数据,按照以下的顺序分割各节点t,生成m个决策树。

(i)从d个特征中随机选择d′个特征。(d′<d)

(ii)从选择出的d′个特征中,求出赋予学习数据的最佳分割的特征和分割点(阈值)。

(iii)节点t在求出的分割点处一分为二。

(2)输出由m个决策树构成的随机森林。

(3)针对输入数据,得到随机森林的各决策树的识别结果。随机森林的识别结果由各决策树的识别结果的多数表决来决定。

在使用随机森林的学习中,以预定的数量随机选择决策树的各非终端节点处用于识别的特征,由此,能够降低决策树之间的相关性。

(2-4-7)强化学习

对学习部45使用的机器学习的方法即强化学习进行说明。强化学习是学习作为一连串行动的结果的报酬最大的这种对策的方法。关于强化学习所使用的模型或算法,存在Q学习(Q-learning)等。Q学习是学习表示在状态s下选择行动a的价值的Q值的方法。在Q学习中,选择Q值最高的行动a作为最佳行动。为了求出较高的Q值,在行动a的主体(智能体)中,对在状态s下选择出的行动a赋予报酬。在Q学习中,每当智能体进行行动时,使用以下的式(10)对Q值进行更新。

【数学式9】

在式(10)中,Q(st、at)是表示状态st的智能体选择行动at的价值的Q值。Q(st、at)是将状态s和行动a作为参数的函数(行动价值函数)。st是时刻t的智能体的状态。at是时刻t的智能体的行动。α是学习系数。α被设定为通过式(10)使Q值收敛于最佳值。rt+1是智能体转变为状态st+1时得到的报酬。γ是折扣率。γ是0以上且1以下的常数。包含max的项是对在环境st+1下选择了Q值最高的行动a的情况下的Q值乘以γ而得到的。通过行动价值函数求出的Q值是智能体得到的报酬的期待值。

图16是进行基于Q学习的强化学习的控制部40的结构框图。控制部40主要具有状态变量取得部143、学习部145和决定部146。状态变量取得部143和决定部146分别具有与图9A和图9B所示的状态变量取得部43和决定部46相同的功能。学习部145具有报酬条件设定部145a、报酬计算部145b和函数更新部145c。报酬条件设定部145a设定报酬条件。报酬计算部145b根据状态变量取得部143取得的状态变量和报酬条件设定部145a设定的报酬条件计算报酬。函数更新部145c根据报酬计算部145b计算出的报酬对行动价值函数进行更新。行动价值函数是求出在状态变量取得部143取得的状态变量下选择规定的行动的价值即Q值的函数。函数更新部145c例如使用式(10)对行动价值函数进行更新。函数更新部145c输出最佳化的行动价值函数作为已学习模型。这样,学习部145根据状态变量来调整行动价值函数的参数,对行动价值函数进行更新,由此学习报酬最大的对策,生成已学习模型。学习部145使用报酬进行基于在线学习的强化学习。

(2-4-8)机器学习的其他方法

学习部45能够使用各种机器学习的方法。关于学习部45能够使用的机器学习的方法,除了已经说明的有教师学习和强化学习以外,还存在无教师学习、半有教师学习、转导学习、多任务学习和转移学习等。学习部45也可以组合使用这些方法。

无教师学习是不使用教师数据而根据规定的统计性质对输入数据进行分组(聚类)的方法。作为无教师学习中使用的模型或算法,存在k均值聚类法(k-means法)、分层聚类凝聚法(Ward法)、主成分分析等。k均值聚类法是反复进行如下步骤的方法:随机地对各输入数据分配聚类,计算各聚类的中心,将各输入数据重新分配给最近的中心的聚类。分层聚类凝聚法是反复进行如下步骤的方法:将各输入数据重新分配给聚类,以使从聚类的各输入数据到聚类的质量中心的距离最小化。主成分分析是根据具有相关性的多个变量生成相关性最小的被称为主成分的变量的多变量解析的方法。

半有教师学习是如下的方法:使用未赋予对应的教师数据的输入数据(无标签数据)和赋予对应的教师数据的输入数据(有标签数据)双方进行学习。

转导学习是如下的方法:在半有教师学习中,生成与学习中使用的无标签数据对应的输出,不生成与未知的输入数据对应的输出。

多任务学习是如下的方法:共享多个关联的任务彼此的信息,同时学习这些任务,由此获得任务共同的要因,提高任务的预测精度。

转移学习是如下的方法:将在某个领域中预先学习的模型应用于其他领域,由此提高预测精度。

(2-4-9)学习中使用的数据

在本实施方式中,对控制部40为了使用机器学习的方法生成已学习模型而使用的数据进行说明。

在控制部40使用有教师学习的方法的情况下,控制部40使用状态变量、评价数据和控制条件的各数据。

状态变量包含与轴115的位置相关的至少1个参数。在本实施方式中,状态变量取得部43取得位移传感器31、32的输出值作为状态变量。

评价数据包含与轴115的位置相对于目标值的偏差相关的至少1个参数。在本实施方式中,评价数据取得部44取得轴115的位置的检测值与轴115的位置的目标值之差即轴位置偏差作为评价数据。检测值是根据位移传感器31、32的输出值换算出的值。目标值是轴115的可动范围的中心位置。

控制条件是由学习部45学习且用于适当地进行轴115的位置控制的条件。在本实施方式中,学习部45学习用于减小轴位置偏差的控制条件。决定部46决定施加给磁轴承21、22的电磁体的线圈65的电压(电压指令值)和流过线圈65的电流(电流指令值)中的至少一方作为控制条件。

此外,在控制部40使用强化学习的方法的情况下,控制部40使用状态变量和报酬条件。状态变量与控制部40使用有教师学习的方法的情况下使用的状态变量相同。控制部40根据规定的报酬条件,根据轴位置偏差计算报酬。在本实施方式中,报酬条件被设定为,使得在轴位置偏差较小的情况下,报酬增加,在轴位置偏差较大的情况下,报酬减少或没有变化。报酬条件例如是用于根据评价数据计算出报酬的条件。

(3)效果

本实施方式的空调装置100具有的磁轴承装置10具有对施加给磁轴承的线圈的电压(电压指令值)等进行调整而进行磁悬浮的轴115的位置控制系统。现有的位置控制系统根据预定的控制规则对电压指令值等进行调整。该情况下,可能由于装置的品质的偏差和系统的经时变化等而未得到适当的电压指令值,轴的悬浮控制的稳定性可能降低,或者在悬浮中产生较大干扰力的情况下,轴可能与接触轴承接触。

在本实施方式的磁轴承装置10中,具有学习功能的控制部40根据与轴115的位置相关的状态变量和与轴115的位置有关的评价数据,使用有教师学习的方法学习用于适当地进行轴115的位置控制的条件(位置控制条件)。位移传感器31、32以比较短的时间间隔(例如每40μ秒)检测轴115的位置,因此,控制部40能够以比较短的时间间隔进行轴115的位置控制。因此,控制部40能够长期维持轴115的位置控制的稳定性。由此,能够抑制由于磁轴承装置10的品质的偏差和系统的经时变化等而使轴115的悬浮控制的稳定性降低、以及由于干扰力而产生轴115与接触轴承116、117的接触。

―第2实施方式―

在第1实施方式中,状态变量取得部43取得位移传感器31、32的输出值作为状态变量。位移传感器31、32的输出值是与轴115的位置相关的参数。

在本实施方式中,状态变量取得部43取得位移传感器31、32的输出值以外的、与轴115的位置相关的参数作为状态变量。因此,本实施方式能够应用于不具有位移传感器31、32的无传感器类型的磁轴承装置。

具体而言,状态变量取得部43取得轴115的位置的估计所需要的各种信息作为状态变量。轴115的位置的估计所需要的信息包含磁轴承21、22的电磁体的电流检测值、电压检测值、磁通检测值、电流指令值和电压指令值中的至少两者。电流检测值是流过电磁体的线圈65的电流的检测值。电压检测值是施加给电磁体的线圈65的电压的检测值。磁通检测值是从电磁体的线圈65产生的磁场的检测值。磁通检测值例如是作为非接触型的磁传感器的霍尔传感器的输出值。电流指令值是由控制部40控制而输入到电磁体的线圈65的电流值。电压指令值是由控制部40控制而输入到电磁体的线圈65的电压值。

作为轴115的位置的估计所需要的信息,例如举出以下的(a)~(c)的信息。

(a)电压指令值和电流检测值

(b)电流指令值和电压检测值

(c)电流检测值和磁通检测值

在使用信息(a)的情况下,状态变量取得部43输入电压指令值,取得电流检测值,由此估计轴115的位置。

在使用信息(b)的情况下,状态变量取得部43输入电流指令值,取得电压检测值,由此估计轴115的位置。

在使用信息(a)和(b)的情况下,状态变量取得部43利用线圈65的电流(或电流微分值)和电压与轴115的位置相关的性质,由此估计轴115的位置。电流或电压可以呈正弦波状输入,也可以呈阶梯状输入。

在使用信息(c)的情况下,状态变量取得部43利用电流检测值和磁通检测值与轴115的位置相关的性质,由此估计轴115的位置。

评价数据取得部44取得根据状态变量换算出的轴115的位置的估计值与轴115的位置的目标值之差即轴位置偏差作为评价数据。

学习部45学习用于减小轴位置偏差的控制条件。

决定部46决定施加给磁轴承21、22的电磁体的线圈65的电压(电压指令值)和流过线圈65的电流(电流指令值)中的至少一方作为控制条件。

―第3实施方式―

在第1和第2实施方式中,代替图7所示的现有的控制部940而使用具有学习功能的控制部40。换言之,第1和第2实施方式涉及图7所示的位置检测部941、位置控制部942和电流控制部943全部的功能具有学习功能的结构。

但是,也可以仅图7所示的位置检测部941、位置控制部942和电流控制部943中的一部分的功能具有学习功能。以下说明的第3~第5实施方式涉及仅现有的控制部940的位置检测部941、位置控制部942和电流控制部943中的一方的功能具有学习功能的结构。

本实施方式涉及仅现有的控制部940的位置检测部941具有学习功能的结构。图17是本实施方式中的轴115的位置控制系统的结构框图。如图17所示,与图7的位置检测部941相当的块被置换为具有学习功能的学习控制部340。学习控制部340具有与第1和第2实施方式的控制部40相同的功能。换言之,如图9A和图9B所示,学习控制部340具有状态变量取得部43、评价数据取得部44、学习部45和决定部46。下面,以与第1和第2实施方式的控制部40的不同之处为中心进行说明。

在第1和第2实施方式中,评价数据取得部44使用轴115的位置的目标值(位置指令值)和轴115的位置的检测值(位置检测值)作为判定数据。

在本实施方式中,评价数据取得部44代替位置指令值和位置检测值而使用与轴115的位置相关的参数(相关参数)的目标值和相关参数的检测值作为判定数据。作为相关参数,使用第1和第2实施方式中由状态变量取得部43取得的状态变量。例如,评价数据取得部44可以使用第1实施方式中说明的位移传感器31、32的输出值作为相关参数,也可以使用第2实施方式中说明的轴115的位置的估计所需要的信息作为相关参数。

评价数据取得部44使用判定数据,例如取得以相关参数的目标值为基准的情况下的相关参数的检测值的偏差(相关参数偏差)作为评价数据。

学习部45学习用于减小相关参数偏差的控制条件。

决定部46决定位置检测值作为用于适当地进行轴115的位置控制的条件(位置控制条件)。

在本实施方式中,学习部45也可以在特定的时点学习位置控制条件。特定的时点是能够根据相关参数确定或估计轴115的位置的时点。具体而言,特定的时点是对轴115的位置具有一定制约的时点或施加给轴115的力已知的时点。对轴115的位置具有一定制约的时点例如是轴115与接触轴承116、117接触的时点。施加给轴115的力已知的时点例如是轴115自由下落的时点。

在本实施方式中,评价数据取得部44也可以代替相关参数偏差而取得轴115的位置的真值作为评价数据。作为轴115的位置的真值,也可以使用判定数据中包含的位置检测值。另外,在上述“特定的时点”确定或估计出的轴115的位置也可以用作轴115的位置的真值。

―第4实施方式―

本实施方式涉及仅现有的控制部940的位置控制部942具有学习功能的结构。图18是本实施方式中的轴115的位置控制系统的结构框图。如图18所示,与图7的位置控制部942相当的块被置换为具有学习功能的学习控制部440。学习控制部440具有与第1和第2实施方式的控制部40相同的功能。换言之,如图9A和图9B所示,学习控制部440具有状态变量取得部43、评价数据取得部44、学习部45和决定部46。下面,以与第1和第2实施方式的控制部40的不同之处为中心进行说明。

在本实施方式中,状态变量取得部43使用轴115的位置的目标值(位置指令值)和轴115的位置的检测值(位置检测值)作为状态变量。

评价数据取得部44使用位置指令值和位置检测值作为判定数据。评价数据取得部44取得位置指令值与位置检测值之差即轴位置偏差作为评价数据。

学习部45学习用于减小轴位置偏差的控制条件。

决定部46决定施加给磁轴承21、22的电磁体的线圈65的电压(电压指令值)和流过线圈65的电流(电流指令值)中的至少一方作为用于适当地进行轴115的位置控制的条件(位置控制条件)。

―第5实施方式―

本实施方式涉及仅现有的控制部940的电流控制部943具有学习功能的结构。图19是本实施方式中的轴115的位置控制系统的结构框图。如图19所示,与图7的电流控制部943相当的块被置换为具有学习功能的学习控制部540。学习控制部540具有与第1和第2实施方式的控制部40相同的功能。换言之,如图9A和图9B所示,学习控制部540具有状态变量取得部43、评价数据取得部44、学习部45和决定部46。下面,以与第1和第2实施方式的控制部40的不同之处为中心进行说明。

在本实施方式中,状态变量取得部43取得流过磁轴承21、22的电磁体的线圈65的电流(电流指令值)和轴115的位置的检测值(位置检测值)作为状态变量。

评价数据取得部44使用电流指令值和位置检测值作为判定数据。评价数据取得部44取得与电流控制的响应性有关的量(响应水平)作为评价数据。响应水平是越接近零越优选的参数。响应水平例如也可以是以电流指令值为基准的情况下的电流检测值的偏差的绝对值、均方根(RMS)或均方(MS),还可以是强制地施加了外界干扰的情况下的该偏差的超调量或整定时间。

学习部45学习用于减小响应水平的控制条件。

决定部46决定施加给磁轴承21、22的电磁体的线圈65的电压(电压指令值)作为用于适当地进行轴115的位置控制的条件(位置控制条件)。

―变形例―

下面,对第1~第5实施方式的至少一部分的变形例进行说明。

(1)变形例A

关于本变形例,在第1、第2和第5实施方式中,评价数据取得部44还使用与用于驱动磁轴承21、22的电流值相关的参数作为判定数据。评价数据取得部44还取得用于驱动磁轴承21、22的电流值作为评价数据。更新部47使学习部45以使得用于驱动磁轴承21、22的电流值成为规定值以下的方式进行学习。具体而言,规定值是用于驱动磁轴承21、22的逆变器的容许电流值。本变形例在决定了逆变器的规格的情况下,能够抑制逆变器产生故障。

(2)变形例B

关于本变形例,在第1、第2和第5实施方式中,评价数据取得部44还使用与用于驱动磁轴承21、22的逆变器的温度相关的参数作为判定数据。评价数据取得部44还取得用于驱动磁轴承21、22的逆变器的温度作为评价数据。更新部47使学习部45以使得逆变器的温度成为规定值以下的方式进行学习。具体而言,规定值是逆变器的容许温度。本变形例在决定了逆变器的规格的情况下,能够抑制逆变器产生故障。

(3)变形例C

关于本变形例,在第1、第2、第4和第5实施方式中,状态变量取得部43在磁轴承21、22由电压型逆变器驱动的情况下,还取得磁轴承21、22的电磁体的电流检测值作为状态变量,在磁轴承21、22由电流型逆变器驱动的情况下,还取得磁轴承21、22的电磁体的电压检测值作为状态变量。

(4)变形例D

关于本变形例,在变形例C中,评价数据取得部44还使用电流指令值和位置检测值作为判定数据。评价数据取得部44还取得与电流控制的响应性有关的量(响应水平)作为评价数据。响应水平是越接近零越优选的参数。响应水平例如可以是以电流指令值为基准的情况下的电流检测值的偏差的绝对值、均方根(RMS)或均方(MS),还可以是强制地施加了外界干扰的情况下的该偏差的超调量或整定时间。更新部47使学习部45以减小响应水平的方式进行学习。

(5)变形例E

关于本变形例,在第1、第2、第4和第5实施方式中,状态变量取得部43还取得轴115的转速作为状态变量。

(6)变形例F

关于本变形例,在第1、第2、第4和第5实施方式中,状态变量取得部43还取得与空调装置100的运转条件相关的至少1个参数作为状态变量。

空调装置100的运转条件是空调装置100的冷冻能力和冷凝器120的入口水温度的规定的范围。入口水温度是作为与在空调装置100的制冷剂回路190中循环的制冷剂进行热交换的介质的水的温度,且是流入冷凝器120时的水的温度。图20是空调装置100的运转条件的一例。空调装置100的冷冻能力的单位是冷冻吨。冷凝器120的入口水温度的单位是华氏度。图20中施加了阴影的区域是空调装置100的运转条件,是空调装置100能够实现空气调节的范围。

具体而言,与空调装置100的运转条件相关的参数是与以下列举的空调装置100的运转信息有关的数据。

(a)吸入到压缩机110的制冷剂的温度

(b)从压缩机110排出的制冷剂的温度

(c)吸入到压缩机110的制冷剂的压力

(d)从压缩机110排出的制冷剂的压力

(e)在制冷剂回路190中循环的制冷剂的流量

(f)流入冷凝器120的水的温度

(g)从冷凝器120流出的水的温度

(h)流入蒸发器140的水的温度

(i)从蒸发器140流出的水的温度

(j)入口导流叶片113b的开度

(k)电动机114的转速

(l)电动机114的旋转角度

(m)电动机114的转矩

(n)电动机114的电流值

参数(f)~(i)的“水”意味着作为在冷凝器120或蒸发器140中与制冷剂进行热交换的介质的水。与空调装置100的运转条件相关的参数包含上述参数(a)~(n)中的至少一方。与空调装置100的运转条件相关的参数进而也可以包含与制冷剂的种类有关的信息。

在本变形例中,控制部40能够按照空调装置100的每个运转条件学习最佳的控制条件。

(7)变形例G

关于本变形例,在变形例F中,状态变量取得部43还取得与赋予给轴115的电磁力相关的至少1个参数作为状态变量。

与赋予给轴115的电磁力相关的参数包含与空调装置100的制冷剂负荷相关的参数和与空调装置100的物理特性相关的参数中的至少一方。

与空调装置100的制冷剂负荷相关的参数包含变形例F中列举的参数(a)~(n)中的至少一方。与空调装置100的制冷剂负荷相关的参数还可以包含与制冷剂的种类有关的信息。

与空调装置100的物理特性相关的参数是轴115的重量和作用于轴115的力中的至少一方。作用于轴115的力是作用于轴115的科里奥利力和作用于轴115的离心力中的至少一方。也可以代替作用于轴115的力而使用与轴115的偏心的量相关的参数以及电动机114的转速中的至少一方。

在本变形例中,能够抑制空调装置100的运转中的轴115的旋转轴线的移动。

(8)变形例H

关于本变形例,在变形例F中,状态变量取得部43还取得与磁轴承21、22的特性相关的至少1个参数作为状态变量。

与磁轴承21、22的特性相关的参数包含与磁轴承21、22的电磁体的线圈65的电感相关的参数以及与线圈65的电阻相关的参数中的至少一方。与线圈65的电感相关的参数例如是流过线圈65的电流的检测值。与线圈65的电阻相关的参数是与线圈65的温度或线圈65周围的温度相关的参数,具体而言,是变形例F中列举的参数(a)~(i)中的至少一方。与线圈65的电阻相关的参数还可以包含与制冷剂的种类有关的信息。

在本变形例中,能够抑制空调装置100的运转中的轴115的旋转轴线的移动。

(9)变形例I

关于本变形例,在第1、第2和第5实施方式中,评价数据取得部44还使用与磁轴承21、22的消耗电力相关的参数作为判定数据。

与磁轴承21、22的消耗电力相关的参数包含与用于驱动磁轴承21、22的电流值相关的参数、与用于驱动磁轴承21、22的电压值相关的参数以及与磁轴承21、22的电磁体的线圈65的电阻相关的参数中的至少两者。与用于驱动磁轴承21、22的电流值相关的参数例如是流过线圈65的电流的检测值。与线圈65的电阻相关的参数是与线圈65的温度或线圈65周围的温度相关的参数,具体而言,包含变形例F中列举的参数(a)~(i)中的至少一方。与线圈65的电阻相关的参数还可以包含与制冷剂的种类有关的信息。

评价数据取得部44还取得磁轴承21、22的消耗电力作为评价数据。

更新部47使学习部45以减小磁轴承21、22的消耗电力的方式进行学习。

在本变形例中,控制部40能够学习能够抑制空调装置100的消耗电力的控制条件。

(10)变形例J

关于本变形例,在变形例A、B、I中,状态变量取得部43还取得与空调装置100的运转条件相关的至少1个参数作为状态变量。与空调装置100的运转条件相关的参数包含变形例F中列举的参数(a)~(n)中的至少一方。与空调装置100的运转条件相关的参数还可以包含与制冷剂的种类有关的信息。

(11)变形例K

关于本变形例,在第1、第2、第4和第5实施方式中,评价数据取得部44还使用与供给到由电动机114驱动的压缩机110的输入能量相关的至少1个参数作为判定数据。与输入能量相关的参数包含磁轴承21、22的输入电流、磁轴承21、22的输入电力、用于驱动磁轴承21、22的逆变器的输入电流、用于驱动磁轴承21、22的逆变器的输入电力、电动机114的输入电流、电动机114的输入电力、用于驱动电动机114的逆变器的输入电流以及用于驱动电动机114的逆变器的输入电力中的至少一方。评价数据取得部44还取得供给到压缩机110的输入能量作为评价数据。

更新部47使学习部45以减小供给到压缩机110的输入能量的方式进行学习。

在本变形例中,控制部40能够学习供给到压缩机110的输入能量最小的控制条件。

(12)变形例L

关于本变形例,在变形例J中,状态变量取得部43还取得与空调装置100的运转条件相关的至少1个参数以及与连结于轴115的叶轮113a的隔热效率相关的至少1个参数中的至少一方作为状态变量。

与空调装置100的运转条件相关的参数包含变形例F中列举的参数(a)~(n)中的至少一方。与空调装置100的运转条件相关的参数还可以包含与制冷剂的种类有关的信息。

与叶轮113a的隔热效率相关的参数包含与制冷剂的压力相关的参数以及与制冷剂的温度相关的参数中的至少一方。与制冷剂的压力相关的参数包含变形例F中列举的参数(a)~(e)中的至少一方。与制冷剂的压力相关的参数还可以包含与制冷剂的种类有关的信息。与制冷剂的温度相关的参数包含变形例F中列举的参数(a)~(i)中的至少一方。与制冷剂的温度相关的参数还可以包含与制冷剂的种类有关的信息。

在本变形例中,控制部40能够学习叶轮113a的隔热效率最大的控制条件。

(13)变形例M

在本变形例中,状态变量取得部43在取得位移传感器31、32的输出值的情况下,还取得与位移传感器31、32的温度相关的参数作为状态变量。与位移传感器31、32的温度相关的参数包含变形例F中列举的参数(a)~(i)中的至少一方。与制冷剂的温度相关的参数还可以包含与制冷剂的种类有关的信息。

在本变形例中,控制部40使用与具有温度特性的位移传感器31、32的温度有关的信息作为状态变量,由此,能够对温度引起的位移传感器31、32的检测值的偏移进行补偿。因此,控制部40能够高精度地取得接触轴承116、117的位置的估计值,进行轴115的位置对准,以使轴115的旋转轴接近接触轴承116、117的中心。

(14)变形例N

在本变形例中,在第1、第2、第4和第5实施方式中,在磁轴承装置10的运转开始时等进行位移传感器31、32的校准。通过校准,例如能够检测位移传感器31、32的异常。

例如,强制地使轴115的位置、磁轴承21、22的电磁体的线圈65的电流值和线圈65的电压值等参数变化,来进行位移传感器31、32的校准。该情况下,可以在这些参数中叠加周期波形,也可以使这些参数呈阶梯状变化,还可以使这些参数呈斜坡状变化。周期波形例如是正弦波、矩形波、三角波和锯齿波。周期波形的频率可以断续地变化,也可以连续地变化。

此外,也可以使轴115的位置指令值和基于规定的波形的扰动叠加,来进行位移传感器31、32的校准。规定的波形例如是周期波形、脉冲波形和阶跃波形。周期波形例如是正弦波、矩形波、三角波和锯齿波。

此外,也可以对轴115的位置设置一定的制约,由此进行位移传感器31、32的校准。例如,也可以进行使轴115与接触轴承116、117接触的动作和作用于轴115的力已知的动作。作用于轴115的力已知的动作例如是轴115自由下落时的动作。

(15)变形例O

在上述各实施方式和各变形例中,控制部40使用有教师学习或强化学习的方法,学习用于适当地进行轴115的位置控制的条件。但是,控制部40也可以使用组合了教师学习和强化学习而成的方法,学习用于适当地进行轴115的位置控制的条件。

(16)变形例P

在上述各实施方式和各变形例中,径向磁轴承21也可以使用无轴承马达(具有以非接触的方式支承轴的功能的电动机)的支承机构。

―结束语―

以上说明了本发明的实施方式,但是,能够理解到能够在不脱离权利要求书所记载的本发明的主旨和范围的情况下进行方式和详细情况的多种变更。

产业上的可利用性

磁轴承装置能够适当地进行被支承体的位置的控制。

标号说明

10 磁轴承装置

21 径向磁轴承(磁轴承)

22 推力磁轴承(磁轴承)

31 径向位移传感器(位移传感器)

32 推力位移传感器(位移传感器)

43 状态变量取得部

44 评价数据取得部

45 学习部

46 决定部

47 更新部

47a 蓄积部

47b 判定部

51 第1电磁体(电磁体)

52 第2电磁体(电磁体)

53 第3电磁体(电磁体)

54 第4电磁体(电磁体)

100 空调装置(冷冻装置)

110 压缩机

113a 叶轮(impeller)

115 轴

120 冷凝器

130 膨胀机构

140 蒸发器

190 制冷剂回路

现有技术文献

专利文献

专利文献1:日本实开平04-040308号公报

49页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:带传感器的轴承组件和轴承游隙监测系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!