车辆控制装置、车辆控制方法及车辆控制用计算机程序

文档序号:147859 发布日期:2021-10-26 浏览:44次 >En<

阅读说明:本技术 车辆控制装置、车辆控制方法及车辆控制用计算机程序 (Vehicle control device, vehicle control method, and computer program for vehicle control ) 是由 晴山阳平 横山大树 于 2021-04-21 设计创作,主要内容包括:本发明涉及车辆控制装置、车辆控制方法及车辆控制用计算机程序。车辆控制装置具有:控制参数算出部(31),通过将表示设备(10)的动作条件的动作条件参数向学习模型输入来算出控制参数,该控制参数表示用于使设备(10)执行与该动作条件参数对应的期望的动作的控制条件;修正部(32),以达成控制条件的方式,基于与动作评价值对应的反馈值来修正控制参数;及切换判定部(36),在关于按照了控制参数的设备(10)的控制精度满足规定的精度条件的情况下,使设备控制部(33)按照控制参数来控制设备(10),另一方面,在不满足规定的精度条件的情况下,使设备控制部(33)按照修正后的控制参数来控制设备(10)。(The invention relates to a vehicle control device, a vehicle control method, and a computer program for vehicle control. The vehicle control device includes: a control parameter calculation unit (31) that calculates a control parameter indicating a control condition for causing the plant (10) to execute a desired operation corresponding to an operation condition parameter by inputting the operation condition parameter indicating the operation condition of the plant (10) to a learning model; a correction unit (32) that corrects the control parameter based on the feedback value corresponding to the motion evaluation value so as to achieve the control condition; and a switching determination unit (36) that, when the control accuracy of the device (10) that has complied with the control parameter satisfies a predetermined accuracy condition, causes the device control unit (33) to control the device (10) in accordance with the control parameter, and, when the predetermined accuracy condition is not satisfied, causes the device control unit (33) to control the device (10) in accordance with the corrected control parameter.)

车辆控制装置、车辆控制方法及车辆控制用计算机程序

技术领域

本发明涉及用于控制车辆的车辆控制装置、车辆控制方法及车辆控制用计算机程序。

背景技术

为了控制车辆,提出了应用机器学习系统的技术(例如,参照日本特开2019-183698号公报)。

例如,日本特开2019-183698号公报所记载的车载电子控制单元取得表示内燃机转速、内燃机的负荷率、内燃机的空燃比、内燃机的点火正时、向排气净化催化剂流入的废气中的HC或CO浓度及排气净化催化剂的温度的关系的学习数据组。该车载电子控制单元将取得的内燃机转速、内燃机的负荷率、内燃机的空燃比、内燃机的点火正时、向排气净化催化剂流入的废气中的HC或CO浓度设为神经网络的输入参数,并且将取得的排气净化装置的温度设为训练数据来学习神经网络的权重。并且,该车载电子控制单元使用已学习的神经网络来推定排气净化催化剂的温度。

发明内容

通过利用合适地且充分地学习后的机器学习系统,车辆控制装置能够提高车辆的控制精度。但是,在利用的机器学习系统的学习不充分或不合适的情况下,有时车辆的控制精度未必提高。

于是,本发明的目的在于提供在车辆的设备的控制中利用的学习模型的学习不充分的情况下也能够达成充分的控制精度的车辆控制装置。

根据本发明的一个方式,提供控制车辆的规定的设备的车辆控制装置。该车辆控制装置具有:控制参数算出部,通过将表示规定的设备的动作条件的至少一个动作条件参数向学习模型输入来算出控制参数,该控制参数表示用于使该设备执行与至少一个动作条件参数对应的期望的动作的控制条件;修正部,以达成控制条件的方式,基于与表示规定的设备的实际的动作的动作评价值对应的反馈值来修正控制参数;设备控制部,按照控制参数或修正后的控制参数来控制规定的设备;反馈值算出部,根据动作评价值而算出反馈值;及切换判定部,判定按照了控制参数的规定的设备的控制精度是否满足规定的精度条件,在满足规定的精度条件的情况下,使设备控制部按照控制参数来控制该设备,另一方面,在不满足规定的精度条件的情况下,使设备控制部按照修正后的控制参数来控制该设备。

在该车辆控制装置中,优选的是,反馈值算出部基于动作评价值来判定规定的设备是否正在按照修正后的控制参数而执行期望的动作,在该设备正在执行期望的动作的情况下,将控制参数或修正后的控制参数和在控制参数的算出中利用的至少一个动作条件参数的组作为一个训练数据而向存储部存储。并且,优选的是,车辆控制装置还具有模型更新部,该模型更新部当存储于存储部的训练数据的数量达到了规定数量时,使用存储于存储部的规定数量的训练数据的各自来使学习模型学习从而更新学习模型,在学习模型被更新以后,使控制参数算出部使用更新后的学习模型来算出控制参数。

另外,在该车辆控制装置中,优选的是,设备是内燃机,控制参数是从内燃机输出的转矩的目标值,至少一个动作条件参数包括车辆周围的气温、车辆周围的湿度及车辆的位置的高度中的至少一个。

根据本发明的另一方式,提供控制车辆的规定的设备的车辆控制方法。该车辆设备控制方法包括以下步骤:通过将表示规定的设备的动作条件的至少一个动作条件参数向学习模型输入来算出控制参数,该控制参数表示用于使该设备执行与至少一个动作条件参数对应的期望的动作的控制条件,以达成控制条件的方式,基于与表示规定的设备的实际的动作的动作评价值对应的反馈值来修正控制参数,按照控制参数或修正后的控制参数来控制规定的设备,根据动作评价值而算出反馈值,判定按照了控制参数的规定的设备的控制精度是否满足规定的精度条件,在满足规定的精度条件的情况下,按照控制参数来控制该设备,另一方面,在不满足规定的精度条件的情况下,按照修正后的控制参数来控制该设备。

根据本发明的又一方式,提供控制车辆的规定的设备的车辆控制用计算机程序。该车辆控制用计算机程序包括使搭载于车辆的处理器执行以下步骤的命令:通过将表示规定的设备的动作条件的至少一个动作条件参数向学习模型输入来算出控制参数,该控制参数表示用于使该设备执行与至少一个动作条件参数对应的期望的动作的控制条件,以达成控制条件的方式,基于与表示规定的设备的实际的动作的动作评价值对应的反馈值来修正控制参数,按照控制参数或修正后的控制参数来控制规定的设备,根据动作评价值而算出反馈值,判定按照了控制参数的规定的设备的控制精度是否满足规定的精度条件,在满足规定的精度条件的情况下,按照控制参数来控制该设备,另一方面,在不满足规定的精度条件的情况下,按照修正后的控制参数来控制该设备。

本发明的车辆控制装置起到在车辆的设备的控制中利用的学习模型的学习不充分的情况下也能够达成充分的控制精度这一效果。

附图说明

图1是作为车辆控制装置的一个实施方式的电子控制装置的硬件结构图。

图2是与车辆控制处理相关的电子控制装置的处理器的功能框图。

图3是车辆控制处理中的学习模型的更新处理的动作流程图。

图4是表示应用反馈控制的情况和不应用反馈控制的情况的各自下的由学习模型算出的目标转矩的值与实际的转矩的输出值之间的转矩偏差的时间变化的示意图。

图5是反馈控制切换判定处理的动作流程图。

具体实施方式

以下,参照附图对控制车辆的车辆控制装置及在这样的车辆控制装置中利用的车辆控制方法及车辆控制用计算机程序进行说明。该车辆控制装置通过向基于机器学习系统的学习模型输入1个以上的动作条件参数来算出表示用于使搭载于车辆的发动机之类的控制对象设备进行期望的动作的控制条件的控制参数。动作条件参数表示驾驶员的操作、车辆的状态或车辆周围的状况之类的控制对象设备的动作条件。而且,该车辆控制装置在学习模型的学习不充分的情况下,按照表示实际的控制对象设备的动作的动作评价值,将使用学习模型算出的控制参数通过反馈控制来修正,利用修正后的控制参数来对控制对象设备进行控制。而且,该车辆控制装置将动作条件参数和应该相对于该动作条件参数算出的控制参数的组作为在学习模型的学习中利用的训练数据而存储。并且,若训练数据被蓄积了规定数量以上,则该车辆控制装置使用该训练数据来对学习模型进行学习,从而谋求提高由学习模型算出的控制参数的精度。并且,若由学习模型算出的控制参数的精度满足规定的精度条件,则该车辆控制装置不应用反馈控制,将该控制参数在控制设备的控制中直接利用,从而提高响应特性并且减轻运算负荷。

在以下所示的实施方式中,设为车辆控制装置的控制对象设备是发动机。但是,车辆控制装置的控制对象设备不限于发动机之类的内燃机。例如,车辆控制装置例如也可以将电动机或变速器设为控制对象设备。

图1是作为车辆控制装置的一个实施方式的电子控制装置的硬件结构图。在本实施方式中,控制搭载于车辆的作为内燃机的一例的发动机10的电子控制装置(ECU)1具有通信接口21、存储器22及处理器23。

通信接口21是通信部的一例,具有用于将ECU1连接于车内网络(未图示)的接口电路。并且,通信接口21将从搭载于车辆的1个以上的传感器11接收到的表示车辆的周围的环境或车辆的状况的传感器值向处理器23移交。需要说明的是,在传感器11中,例如包括测定车辆周围的气温的温度计、测定车辆周围的湿度的湿度计、求出车辆所处的地点的高度的测定值的GPS接收机、测定车辆的加速度的加速度传感器、测定车辆的速度的车速传感器等。另外,通信接口21将从车辆的操作设备12接收到的操作信号向处理器23移交。需要说明的是,车辆的操作设备例如是加速器,操作信号例如是加速器开度。

存储器22是存储部的一例,例如具有易失性的半导体存储器及非易失性的半导体存储器。并且,存储器22存储在由处理器23执行的各种处理中使用的各种数据。作为这样的数据,存储器22例如存储规定为了算出控制参数而利用的学习模型的参数组、在学习模型的学习中使用的训练数据及表示控制参数与指定发动机10的各部的动作的运转参数的对应关系的参照表。而且,存储器22也可以存储表示车道区划线、暂时停止线等地上物的位置的地图信息。

处理器23具有1个或多个CPU(Central Processing Unit:中央处理单元)及其周边电路。处理器23也可以还具有逻辑运算单元、数值运算单元或图形处理单元之类的其他的运算电路。并且,处理器23控制发动机10。

图2是与车辆控制处理相关联的处理器23的功能框图。处理器23具有控制参数算出部31、修正部32、发动机控制部33、反馈值算出部34、模型更新部35及切换判定部36。处理器23所具有的这些各部由在处理器23上动作的计算机程序实现。或者,处理器23所具有的这些各部也可以是设置于处理器23的专用的运算电路。

控制参数算出部31每隔规定的周期,向学习模型输入1个以上的动作条件参数,从而算出发动机10的控制参数。在本实施方式中,作为向学习模型输入的动作条件参数,控制参数算出部31使用加速器开度、加速器开度变动速度、气温、湿度及高度。根据变形例,作为向学习模型输入的动作条件参数,控制参数算出部31也可以与加速器开度及加速器开度变动速度一起使用气温、湿度及高度中的任一个或两个。而且,加速器开度变动速度也可以不包含于向学习模型输入的动作条件参数。另外,作为控制参数,控制参数算出部31算出发动机10的转矩输出的目标值(以下,称作目标转矩值)。需要说明的是,控制参数算出部31将气温、湿度及高度经由通信接口21而从传感器11取得,将加速器开度经由通信接口21而从操作设备取得即可。另外,控制参数算出部31通过将上次的加速器开度与本次的加速器开度之差除以规定的周期来算出加速器开度变动速度即可。这样,通过在控制参数的算出中利用的动作条件参数中包括气温、湿度及高度之类的表示车辆周围的环境的信息,控制参数算出部31能够以即使车辆周围的环境变化也能得到期望的转矩输出的方式算出目标转矩值。

在本实施方式中,作为学习模型,控制参数算出部31使用多层感知器型的神经网络。即,学习模型具有被输入各动作条件参数的输入层、输出控制参数的输出层及设置于输入层与输出层之间的1个以上的中间层(也被称作隐藏层)。各中间层具有多个节点,各节点执行相对于来自紧接的前一层所具有的各节点的输出值的全结合运算。另外,输出层例如通过执行相对于来自紧接的前一层的输出的Sigmoid运算来算出控制参数。

控制参数算出部31每当算出了控制参数(在本实施方式中是目标转矩值)时,将该控制参数向修正部32(反馈控制应用时)或发动机控制部33(反馈控制未应用时)输出。另外,控制参数算出部31将在控制参数的算出中利用的动作条件参数与算出的控制参数一起向反馈值算出部34输出。

修正部32在应用着反馈控制的期间,每当从控制参数算出部31接收到控制参数时,以达成由该控制参数表示的控制条件的方式,将该控制参数使用从反馈值算出部34接收到的反馈值来修正。在本实施方式中,详情后述,反馈值通过对推定的实际的转矩的输出值(TR)相对于目标转矩值(TP)的差(TP-TR)乘以规定的系数而算出。于是,修正部32通过对控制参数加上反馈值来修正控制参数。修正部32将修正后的控制参数向发动机控制部33输出。这样,从修正部32向发动机控制部33输出的修正后的控制参数成为根据反馈值而变更后的控制参数,但由控制参数算出部31算出的控制参数(在本实施方式中是目标转矩值)自身不会由修正部32变更。因此,发动机10以使发动机10的实际的转矩的输出值接近目标转矩值的方式受到控制。

发动机控制部33是设备控制部的一例,按照从修正部32接收到的修正后的控制参数或从控制参数算出部31接收到的控制参数来控制发动机10。在本实施方式中,发动机控制部33参照存储于存储器22的参照表。并且,在应用着反馈控制的情况下,发动机控制部33决定与从修正部32接收到的修正后的控制参数对应的发动机10的1个以上的运转参数(点火正时、燃料喷射量、空燃比、进气及排气阀的开闭度及开闭正时等)。另一方面,在未应用反馈控制的情况下,发动机控制部33决定与从控制参数算出部31接收到的控制参数自身对应的发动机10的1个以上的运转参数。发动机控制部33也可以与接收到的控制参数的值一起参照表示发动机10的状态等的参数(例如,发动机10的转速、发动机10所具有的各汽缸的缸内压等)来决定发动机10的运转参数。另外,发动机控制部33也可以按照根据控制参数的值来决定运转参数的其他手法来决定发动机10的运转参数。

发动机控制部33生成按照所决定的运转参数来控制发动机10的控制信号,通过将该控制信号向发动机10输出来控制发动机10。

反馈值算出部34在反馈控制的应用时,根据动作评价值来算出用于修正控制参数的反馈值。在本实施方式中,反馈值算出部34通过对实际的转矩的输出值相对于从控制参数算出部31接收到的上次的控制参数的值(目标转矩值)的差(以下,称作转矩偏差)乘以规定的系数(例如,具有小于1的正的值的系数)来算出反馈值。需要说明的是,实际的转矩的输出值是动作评价值的一例。反馈值算出部34将实际的转矩的输出值例如从安装于发动机10的转矩传感器经由通信接口21而取得。或者,反馈值算出部34也可以将实际的转矩的输出值基于从加速度传感器经由通信接口21而接收到的加速度及车辆的重量等来推定。

反馈值算出部34将算出的反馈值向修正部32输出。

而且,反馈值算出部34基于动作评价值来判定控制对象设备是否正在按照修正后的控制参数而执行期望的动作,在控制对象设备正在执行期望的动作的情况下,将修正后的控制参数和在修正前的控制参数的算出中利用的动作条件参数的组作为一个训练数据而向存储器22存储。

在本实施方式中,在转矩偏差的绝对值包含于规定的容许范围的情况下,判定为发动机10正在按照修正后的控制参数而输出设为目标的转矩。于是,反馈值算出部34将修正后的控制参数和在修正前的控制参数(目标转矩值)的算出中利用的动作条件参数的组作为在学习模型的学习中利用的训练数据之一而向存储器22存储。而且,反馈值算出部34将表示存储于存储器22的训练数据的数量的计数值增加1。而且,反馈值算出部34不管是否正在应用反馈控制,都将转矩偏差向切换判定部36通知。

模型更新部35参照计数值来判定存储于存储器22的训练数据的数量是否达到了规定数量。在存储于存储器22的训练数据的数量达到了规定数量的情况下,模型更新部35使用存储于存储器22的各训练数据,按照规定的学习手法使学习模型学习,从而更新学习模型。例如,如上所述,在学习模型是多层感知器型的神经网络的情况下,模型更新部35通过按照误差反向传播法更新神经网络的各中间层的各节点的权重系数等来更新学习模型。此时,模型更新部35可以更新全部中间层的各节点的权重系数,或者也可以更新全部或一部分中间层的各节点中的特定的节点的权重系数。需要说明的是,关于第2次以后的学习模型的更新,模型更新部35每当在上次的学习模型的更新以后存储于存储器22的训练数据的数量达到了规定数量时更新学习模型即可。此时,模型更新部35可以使用存储于存储器22的全部训练数据来使学习模型学习,或者也可以从新的一方起依次使用规定数量的训练数据来使学习模型学习。或者,模型更新部35也可以当学习模型一旦学习后,将在该学习时使用的训练数据的一部分或全部从存储器22擦除。而且,在未应用反馈控制的情况下,可认为由学习模型算出的控制参数的精度充分,因此,模型更新部35也可以即使存储于存储器22的训练数据的数量达到规定数量也不更新学习模型。

需要说明的是,模型更新部35也可以与发动机10的控制并列地执行学习模型的更新处理。但是,为了减轻处理器23的运算负荷,模型更新部35也可以在存储于存储器22的训练数据的数量达到了规定数量后,在点火开关首次被断开的定时下执行学习模型的更新处理。

当学习模型的更新结束后,模型更新部35将表示更新后的学习模型的参数组向存储器22存储。而且,模型更新部35将更新后的学习模型变为能够使用的意思向控制参数算出部31通知,在学习模型的更新以后,使控制参数算出部31使用该更新后的学习模型来算出控制参数。

图3是车辆控制处理中的学习模型的更新处理的动作流程图。

处理器23的模型更新部35判定存储于存储器22的训练数据的数量是否达到了规定数量(步骤S101)。在训练数据的数量未达到规定数量的情况下(步骤S101-否),模型更新部35结束学习模型的更新处理。

另一方面,在存储于存储器22的训练数据的数量达到了规定数量的情况下(步骤S101-是),模型更新部35利用存储于存储器22的训练数据,按照规定的学习手法使学习模型学习,从而更新该学习模型(步骤S102)。

然后,模型更新部35使处理器23的控制参数算出部31开始更新后的学习模型的使用(步骤S103)。然后,处理器23结束学习模型的更新处理。

切换判定部36判定按照了由控制参数算出部31利用的学习模型算出的控制参数(在本实施方式中是目标转矩值)的控制对象设备(在本实施方式中是发动机10)的控制精度是否满足规定的精度条件。并且,在满足规定的精度条件的情况下,切换判定部36停止反馈控制的应用。例如,切换判定部36确定加速器开度变动速度的绝对值成为了规定的阈值以上时(以下,为了便于说明,称作加速器开度变动时)。并且,切换判定部36关于最近的多次(例如,10~100次)的加速器开度变动时的各自,判定在该加速器开度变动时得到的转矩偏差的绝对值是否包含于规定的容许范围内。这样,通过将加速器开度变动时即对发动机10要求的转矩变化的过渡状态下的转矩偏差利用在由学习模型得到的控制参数的精度的判定中,切换判定部36能够合适地评价由学习模型得到的控制参数的精度。需要说明的是,在学习模型被更新的情况下,切换判定部36判定该更新后的最近多次的加速器开度变动时的各自的转矩偏差的绝对值是否包含于规定的容许范围内即可。在应用着反馈控制的情况下,若最近的多次的加速器开度变动时中的转矩偏差的绝对值包含于规定的容许范围内的次数的比例成为反馈停止阈值(例如,8成~9成)以上,则推定为基于由学习模型算出的控制参数的发动机10的控制精度充分到不需要反馈控制的程度。于是,切换判定部36判定为满足规定的精度条件。然后,切换判定部36使得从控制参数算出部31输出(即,使用学习模型算出)的控制参数向发动机控制部33直接输入。由此,不再应用反馈控制,因此发动机控制的响应速度提高,并且处理器23的运算负荷被减轻。而且,切换判定部36也可以通知模型更新部35停止学习模型的更新。

相反,在未应用反馈控制的情况下,在最近的多次的加速器开度变动时中的转矩偏差的绝对值包含于规定的容许范围内的次数的比例成为反馈再次开始阈值(例如,4成~6成)以下的情况下,推定为为了相对于发动机10得到充分的控制精度而需要反馈控制。于是,切换判定部36判定为不满足规定的精度条件。然后,切换判定部36使得从控制参数算出部31输出的控制参数由修正部32修正后向发动机控制部33输入。由此,应用反馈控制,因此,即使在学习模型的学习不充分的情况下,ECU1也能够充分保持发动机10的控制精度。而且,切换判定部36也可以通知模型更新部35再次开始学习模型的更新。需要说明的是,反馈再次开始阈值优选被设定为比反馈停止阈值小的值。由此,防止了是否应用反馈控制频繁地切换的情况。

图4是表示应用反馈控制的情况和不应用反馈控制的情况的各自下的转矩偏差的时间变化的示意图。在图4中,横轴表示时间,纵轴表示转矩偏差。在图4中,波形401表示学习模型的学习不充分而应用反馈控制的情况下的转矩偏差的时间变化。另一方面,波形402表示学习模型被充分地学习而不再应用反馈控制的情况下的转矩偏差的时间变化。

如波形401所示,在学习模型的学习不充分的情况下,在最初的时间点下转矩偏差的绝对值相对地变大,但由于应用反馈控制,所以随着时间经过而转矩偏差的绝对值逐渐变小。因而,可知:即使学习模型的学习不充分,ECU1也能够以得到与加速器开度等动作条件参数对应的期望的转矩输出的方式控制发动机10。

另一方面,如波形402所示,若学习模型被充分地学习,则即使不应用反馈控制,也从最初的时间点起转矩偏差的绝对值充分变小。因此,可知:ECU1在学习模型被充分地学习的情况下,能够以立即得到与加速器开度等动作条件参数对应的期望的转矩输出的方式控制发动机10。

图5是反馈控制切换判定处理的动作流程图。处理器23的切换判定部36每当在学习模型的更新后得到了规定数量的加速器开度变动时的转矩偏差时,按照下述的动作流程图来执行反馈控制切换判定处理即可。

处理器23的切换判定部36判定是否正应用反馈控制(步骤S201)。在正应用反馈控制的情况下(步骤S201-是),切换判定部36基于最近的多次的加速器开度变动时的转矩偏差来判定按照了由学习模型算出的控制参数的发动机10的控制精度是否满足规定的精度条件(步骤S202)。在不满足规定的精度条件的情况下(步骤S202-否),切换判定部36判定为直到学习模型下次被更新为止继续反馈控制的应用(步骤S203)。

另一方面,在满足规定的精度条件的情况下(步骤S202-是),切换判定部36停止反馈控制的应用,使得从控制参数算出部31输出的控制参数向发动机控制部33直接输入(步骤S204)。另外,切换判定部36通知模型更新部35停止学习模型的更新(步骤S205)。

在步骤S203之后或步骤S205之后,处理器23结束反馈控制切换判定处理。

另外,在步骤S201中未应用反馈控制的情况下(步骤S201-否),切换判定部36基于最近的多次的加速器开度变动时的转矩偏差来判定按照了由学习模型算出的控制参数的发动机10的控制精度是否满足规定的精度条件(步骤S206)。在满足规定的精度条件的情况下(步骤S206-是),切换判定部36判定为继续反馈控制的停止(步骤S207)。

另一方面,在不满足规定的精度条件的情况下(步骤S206-否),切换判定部36再次开始反馈控制的应用,使得从控制参数算出部31输出的控制参数由修正部32修正后向发动机控制部33输入(步骤S208)。另外,切换判定部36通知模型更新部35再次开始学习模型的更新(步骤S209)。

在步骤S207之后或步骤S209之后,处理器23结束反馈控制切换判定处理。

如以上说明的那样,该车辆控制装置使用基于机器学习系统的学习模型来算出搭载于车辆的控制对象设备的控制参数。该车辆控制装置在学习模型的学习不充分的期间,对由学习模型算出的控制参数应用反馈控制,由此,即使在学习模型的学习不充分的情况下,也能够不使控制对象设备的控制精度下降而维持该控制精度。另一方面,若学习模型被充分地学习,则该车辆控制装置停止反馈控制的应用,由此,能够提高控制对象设备的控制的响应速度,并且能够减轻运算负荷。这样,该车辆控制装置能够兼顾控制对象设备的控制精度和运算负荷及响应特性。而且,通过在向算出控制参数的学习模型输入的动作条件参数中包括表示车辆的环境或驾驶员的驾驶操作的特性等的参数,会算出考虑了车辆的环境或驾驶员的驾驶操作的特性的控制参数,因此,该车辆控制装置能够进一步提高控制对象设备的控制精度。

需要说明的是,为了使车辆以恒定速度行驶,加速器开度优选不怎么变动。但是,有的驾驶员会使加速器开度过度变化,有时车速不保持为恒定。于是,根据变形例,控制参数算出部31使用的学习模型也可以以输出在设想为驾驶员要将车速保持为恒定的情况下车速被保持为恒定的加速器开度(以下,称作平滑化加速器开度)的方式被学习。在该变形例中,平滑化加速器开度成为控制参数的一例。

在该情况下,控制参数算出部31基于信号灯信息、在车辆的前方行驶的其他车辆的车速的变化量及与在车辆的周围行驶的其他车辆实施的车道变更相关的信息(以下,称作车道变更信息)来判定是否是设想为驾驶员要将车速保持为恒定的情况。并且,在设想为驾驶员要将车速保持为恒定的情况下,控制参数算出部31使用学习模型来算出平滑化加速器开度。另一方面,在不是驾驶员将车速保持为恒定的状况的情况下,处理器23按照上述的实施方式来控制发动机10即可。

信号灯信息例如通过从由以拍摄车辆的周围(例如,车辆的前方区域)的方式设置于车辆的相机得到的图像(以下,称作车外图像)检测信号灯并识别检测到的信号灯的点亮状态(例如,绿灯信号或红灯信号等)而得到。例如,控制参数算出部31通过将经由通信接口21而取得的车外图像向以检测信号灯并识别该信号灯的点亮状态的方式预先学习的识别器输入,能够将车辆周围的信号灯(例如,车辆前方的信号灯)的点亮状态作为信号灯信息而求出。需要说明的是,作为这样的识别器,控制参数算出部31例如能够利用具有卷积神经网络(CNN)型的架构的所谓深度神经网络(DNN)。另外,在从车外图像未检测到信号灯的情况下,也可以将未检测到信号灯包含于信号灯信息。

而且,在车辆的前方行驶的其他车辆的车速的变化量例如通过追踪从在最近的规定期间得到的时间序列的一系列车外图像的各自检测到的其他车辆而求出。在该情况下,例如,控制参数算出部31每当经由通信接口21而从相机取得了车外图像时,通过将该车外图像向以检测其他车辆的方式预先学习的识别器输入来检测车辆周围的其他车辆。作为这样的识别器,控制参数算出部31例如能够利用具有CNN型的架构的DNN。需要说明的是,也可以是,一个识别器以检测信号灯和其他车辆双方的方式预先被学习,控制参数算出部31使用该一个识别器来从车外图像检测信号灯和其他车辆的各自。

控制参数算出部31例如参照存储于存储器22的相机的设置位置、焦点距离及拍摄方向之类的内部参数,通过对各车外图像执行视点变换处理来将各车外图像变换为鸟瞰图像,求出各车外图像生成时的其他车辆相对于车辆的相对位置。需要说明的是,在车辆具有LiDAR传感器或雷达之类的测距传感器的情况下,控制参数算出部31也可以将由该测距传感器测定出的距检测到的其他车辆为止的距离为了求出其他车辆的相对位置而利用。然后,控制参数算出部31参照表示各车外图像生成时的车辆的位置及姿势的信息,通过对各鸟瞰图像中的检测到的其他车辆的位置执行规定的追踪处理来推定其他车辆的轨迹。需要说明的是,各车外图像生成时的车辆的位置及姿势例如通过执行将由地图信息表示的车辆周围的地上物向图像上投影并以使该地上物与由图像表示的地上物一致的方式推定车辆的位置及姿势的自身位置推定处理而求出。然后,控制参数算出部31基于推定出的轨迹来推定规定时刻前的其他车辆的车速及当前时刻的其他车辆的车速,将规定时刻前的其他车辆的推定车速与当前时刻的其他车辆的推定车速之差作为车速的变化量而算出即可。需要说明的是,控制参数算出部31也可以将其他车辆的车速的变化量作为相对于本车辆的相对速度的变化量而算出。

为了求出车道变更信息,控制参数算出部31例如参照如上述那样推定出的其他车辆的轨迹和由地图信息表示的车道区划线的位置,在其他车辆的轨迹横穿了车道区划线时判定为其他车辆实施了车道变更。并且,控制参数算出部31将最近的规定期间中的其他车辆实施了车道变更的次数作为车道变更信息而求出即可。或者,控制参数算出部31也可以将在最近的规定期间中其他车辆从与本车辆行驶的车道(以下,称作本车道)相邻的车道(以下,简称作相邻车道)向本车道进行了车道变更或者其他车辆从本车道向相邻车道进行了车道变更作为车道变更信息而求出。

需要说明的是,控制参数算出部31也可以将信号灯信息、其他车辆的车速的变化量及车道变更信息的一部分或全部经由通信接口21而从搭载于车辆的其他设备(例如,驾驶支援用的ECU)取得。

控制参数算出部31例如在信号灯信息表示车辆前方的信号灯的点亮状态是绿灯信号状态或者表示在车辆的周围没有信号灯,其他车辆的车速的变化量为规定的阈值以下,且车道变更信息表示其他车辆未进行车道变更的情况下,判定为是设想为驾驶员要将车速保持为恒定的状况。并且,控制参数算出部31使用学习模型来算出平滑化加速器开度。另一方面,在信号灯信息表示车辆前方的信号灯的点亮状态是绿灯信号状态以外的状态、其他车辆的车速的变化量比规定的阈值大或者车道变更信息表示其他车辆正在进行车道变更的情况下,控制参数算出部31判定为不是设想为驾驶员要将车速保持为恒定的状况。

根据该变形例,作为向学习模型输入的动作条件参数,例如利用加速器开度、加速器开度变动速度、加速器操作频度、制动器操作频度中的一部分或全部。其中,加速器开度及加速器开度变动速度与上述的实施方式同样地求出即可。

加速器操作频度例如作为最近的规定期间中的加速器开度变动速度的绝对值成为了规定值以上的次数或在加速器开度的时间序列变化中加速器开度成为了从增加向减小变化的极值的次数而算出。同样,制动器操作频度例如作为最近的规定期间中的制动器踏板的踩踏量变化了规定量以上的次数或在制动器踏板的踩踏量的时间序列变化中踩踏量成为了从增加向减小变化的极值的次数而算出。

另外,控制参数算出部31与上述的实施方式同样,作为学习模型,能够使用多层感知机型的神经网络。或者,作为学习模型,控制参数算出部31也可以使用保持内部状态并将其递归地利用的循环神经网络。并且,控制参数算出部31将通过向学习模型输入动作条件参数而将学习模型算出的平滑化加速器开度向修正部32(反馈控制应用时)或发动机控制部33(反馈控制未应用时)输出。

在该变形例中,在应用反馈控制的情况下,修正部32通过将由反馈值算出部34算出的表示平滑化加速器开度的修正量的反馈值与平滑化加速器开度相加来修正平滑化加速器开度。并且,修正部32将修正后的平滑化加速器开度向发动机控制部33输出。

在该变形例中,发动机控制部33参照表示平滑化加速器开度与发动机10的1个以上的运转参数的关系的参照表来决定与从控制参数算出部31接收到的平滑化加速器开度(反馈控制未应用时)或从修正部32接收到的修正后的平滑化加速器开度(反馈控制应用时)对应的1个以上的运转参数。并且,发动机控制部33按照所决定的运转参数来控制发动机10。

在该变形例中,反馈值算出部34基于从搭载于车辆的车速传感器经由通信接口21而取得的车辆的车速的测定值和从控制参数算出部31接收到的平滑化加速器开度来算出反馈值。例如,反馈值算出部34算出从当前时刻的车速的测定值减去规定时间前的车速的测定值后的差即车速变化量。该车速变化量是动作评价值的一例。并且,反馈值算出部34参照表示车速变化量及平滑化加速器开度与平滑化加速器开度的修正量的关系的修正量表,决定与算出的车速变化量及从控制参数算出部31接收到的上次的平滑化加速器开度对应的平滑化加速器开度的修正量。并且,反馈值算出部34将所决定的平滑化加速器开度的修正量作为反馈值而向修正部32输出。

另外,反馈值算出部34在车速变化量的绝对值为规定值以下的情况下,判定为发动机10正在按照修正后的平滑化加速器开度而以将车速保持为恒定的方式进行动作。因此,在该情况下,反馈值算出部34将平滑化加速器开度和在该平滑化加速器开度的算出中利用的动作条件参数的组作为训练数据而向存储器22存储。另外,在作为学习模型而使用循环神经网络的情况下,反馈值算出部34也可以将车速变化量的绝对值成为了规定值以下时及其之前的一定期间内的平滑化加速器开度和在该平滑化加速器开度的算出中利用的动作条件参数的组的各自作为训练数据而向存储器22存储。

而且,根据该变形例,切换判定部36判定在最近的多次的加速器开度变动时得到的车速变化量的绝对值的各自是否包含于规定的容许范围内。在应用着反馈控制的情况下,若最近的多次的加速器开度变动时中的车速变化量的绝对值包含于规定的容许范围内的次数的比例成为反馈停止阈值以上,则推定为正在以不需要反馈控制的程度按照由学习模型算出的平滑化加速器开度而以将车速保持为恒定的方式控制发动机10。于是,切换判定部36判定为满足规定的精度条件。并且,切换判定部36使得从控制参数算出部31输出的平滑化加速器开度向发动机控制部33直接输入。而且,切换判定部36也可以通知模型更新部35停止学习模型的更新。

相反,在未应用反馈控制的情况下,在最近的多次的加速器开度变动时中的车速变化量的绝对值包含于规定的容许范围内的次数的比例成为反馈再次开始阈值以下的情况下,推定为为了以保持恒定的车速的方式控制发动机10而需要反馈控制。于是,切换判定部36判定为不满足规定的精度条件。并且,切换判定部36使得从控制参数算出部31输出的平滑化加速器开度由修正部32修正后向发动机控制部33输入。由此,应用反馈控制,因此,即使在学习模型的学习不充分的情况下,处理器23也能够以将车速保持为恒定的方式控制发动机10。而且,切换判定部36也可以通知模型更新部35再次开始学习模型的更新。

根据该变形例,处理器23能够不管驾驶员的运转特性,以在设想为驾驶员要将车速保持为恒定的情况下将车速保持为恒定的方式控制发动机10。

另外,实现上述的实施方式或变形例的车辆控制装置的处理器23的各部分的功能的计算机程序也可以以记录于半导体存储器、磁记录介质或光记录介质之类的计算机能够读取的可移动性的记录介质的形式提供。

如以上这样,本领域技术人员能够在本发明的范围内配合实施的方式而进行各种各样的变更。

18页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:汽车柔性中控显示板、智能方向盘及其控制方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!