缥缈技术 - 缥缈技术

目标优化参数的获取方法及模型训练方法、装置

文档序号：1397842 发布日期：2020-03-03 浏览：15次 >En<

阅读说明：本技术 目标优化参数的获取方法及模型训练方法、装置 (Target optimization parameter obtaining method and model training method and device ) 是由梁新乐吴云崇徐宇杨斌于 2018-08-22 设计创作，主要内容包括：本说明书一个或多个实施例提供一种目标优化参数的获取方法及模型训练方法、装置,该目标优化参数的获取方法可以包括：获取根据生产控制方案对目标优化参数的取值进行预估的预估模型,所述预估模型由具有时间递归特性的神经网络算法对生产过程的历史生产数据进行训练得到,所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值；向所述预估模型输入备选生产控制方案,得到所述预估模型输出的所述目标优化参数的预估取值。(One or more embodiments of the present disclosure provide a method for obtaining target optimization parameters, a method for training a model, and an apparatus for obtaining the target optimization parameters, where the method for obtaining the target optimization parameters may include: acquiring a pre-estimation model for pre-estimating the value of a target optimization parameter according to a production control scheme, wherein the pre-estimation model is obtained by training historical production data of a production process by a neural network algorithm with a time recursion characteristic, and the historical production data comprises historical production control schemes and historical values of corresponding target optimization parameters; and inputting an alternative production control scheme into the pre-estimation model to obtain the pre-estimation value of the target optimization parameter output by the pre-estimation model.)

目标优化参数的获取方法及模型训练方法、装置

技术领域

本说明书一个或多个实施例涉及工业控制技术领域，尤其涉及一种目标优化参数的获取方法及模型训练方法、装置。

背景技术

在生产过程中，随着各个阶段的工艺参数发生变化并组成一个整体而影响着整个生产过程。因此，在设计生产过程的生产控制方案时，需要确保该生产控制方案对整个生产过程的整体影响，以使得生产过程的各个阶段都能够满足生产要求。

发明内容

有鉴于此，本说明书一个或多个实施例提供一种目标优化参数的获取方法及模型训练方法、装置。

为实现上述目的，本说明书一个或多个实施例提供技术方案如下：

根据本说明书一个或多个实施例的第一方面，提出了一种目标优化参数的获取方法，包括：

获取根据生产控制方案对目标优化参数的取值进行预估的预估模型，所述预估模型由具有时间递归特性的神经网络算法对生产过程的历史生产数据进行训练得到，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值；

向所述预估模型输入备选生产控制方案，得到所述预估模型输出的所述目标优化参数的预估取值。

根据本说明书一个或多个实施例的第二方面，提出了一种目标优化参数的预估模型的训练方法，包括：

获取生产过程的历史生产数据，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值；

通过具有时间递归特性的神经网络算法对所述历史生产数据进行训练，得到根据生产控制方案对目标优化参数的取值进行预估的预估模型。

根据本说明书一个或多个实施例的第三方面，提出了一种目标优化参数的获取装置，包括：

模型获取单元，获取根据生产控制方案对目标优化参数的取值进行预估的预估模型，所述预估模型由具有时间递归特性的神经网络算法对生产过程的历史生产数据进行训练得到，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值；

取值预估单元，向所述预估模型输入备选生产控制方案，得到所述预估模型输出的所述目标优化参数的预估取值。

根据本说明书一个或多个实施例的第四方面，提出了一种目标优化参数的预估模型的训练装置，包括：

历史数据获取单元，获取生产过程的历史生产数据，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值；

模型训练单元，通过具有时间递归特性的神经网络算法对所述历史生产数据进行训练，得到根据生产控制方案对目标优化参数的取值进行预估的预估模型。

附图说明

图1是一示例性实施例提供的一种生产控制方案的评价系统的架构示意图。

图2A是一示例性实施例提供的一种目标优化参数的预估模型的训练方法的流程图。

图2B是一示例性实施例提供的一种目标优化参数的获取方法的流程图。

图3是一示例性实施例提供的一种自动推荐电流配方的流程示意图。

图4是一示例性实施例提供的一种评价电流配方的流程示意图。

图5是一示例性实施例提供的一种设备的结构示意图。

图6是一示例性实施例提供的一种生产控制方案的评价装置的框图。

图7是一示例性实施例提供的另一种设备的结构示意图。

图8是一示例性实施例提供的一种生产控制方案的评价装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。

需要说明的是：在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中，其方法所包括的步骤可以比本说明书所描述的更多或更少。此外，本说明书中所描述的单个步骤，在其他实施例中可能被分解为多个步骤进行描述；而本说明书中所描述的多个步骤，在其他实施例中也可能被合并为单个步骤进行描述。

在一实施例中，本说明书的生产控制方案的评价方案可以应用于电子设备中，例如该电子设备可以包括手机、平板设备、笔记本电脑、掌上电脑(PDAs，Personal DigitalAssistants)、可穿戴设备(如智能眼镜、智能手表等)、PC、工业控制计算机等任意类型，本说明书并不对此进行限制。在运行过程中，该电子设备可以针对用于连续生产过程的生产控制方案进行评价，以确定其是否满足连续生产过程的质量和/或效率要求。

图1是一示例性实施例提供的一种生产控制方案的评价系统的架构示意图。如图1所示，该系统可以包括服务器11、网络12、若干电子设备，比如PC13、PC14等。

服务器11可以为包含一独立主机的物理服务器，或者该服务器11可以为主机集群承载的虚拟服务器。在运行过程中，服务器11可以运行某一应用的服务器侧的程序而实现为该应用的服务端，以对备选的生产控制方案进行评价。

PC13-14只是可以使用的一种类型的电子设备。实际上，还可以使用诸如下述类型的电子设备：手机、平板设备、笔记本电脑、掌上电脑(PDAs，Personal DigitalAssistants)、可穿戴设备(如智能眼镜、智能手表等)、工业控制计算机等，本说明书一个或多个实施例并不对此进行限制。在运行过程中，该电子设备可以运行某一应用的客户端侧的程序而实现为该应用的客户端，以实现与使用者之间的人机交互，查看服务器11输出的评价信息，甚至可由使用者输入备选生产控制方案以供服务器11进行评价。

而对于PC13-14与服务器11之间进行交互的网络12，可以包括多种类型的有线或无线网络。在一实施例中，该网络12可以包括公共交换电话网络(Public SwitchedTelephone Network，PSTN)和因特网。

图2A是一示例性实施例提供的一种目标优化参数的预估模型的训练方法的流程图。如图2A所示，该方法可以包括以下步骤：

步骤202A，获取生产过程的历史生产数据，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值。

在一实施例中，目标优化参数用于评价所采用的生产控制方案的可用性高低；例如，目标优化参数的历史取值与相应的历史生产控制方案的可用性可以呈正相关，或者目标优化参数的历史取值与相应的历史生产控制方案的可用性可以呈负相关，这取决于生产过程实际应用的生产场景以及所选取的目标优化参数的类型。类似地，在图2B所示实施例中，通过本说明书训练的预估模型对备选生产控制方案进行处理、生成目标优化参数的预估取值，即可基于该预估取值确定该备选生产控制方案的可用性，以作为对该备选生产控制方案的优劣情况的评价。

在一实施例中，所述目标优化参数的取值可以为第一预设维度的数据在所述生产过程结束时的取值；换言之，整个生产过程在该第一预设维度上仅产生这一个取值，并作为上述的目标优化参数的取值，即该取值与整个生产过程相关，因而仅在生产过程终止时才能够确定。例如，当生产过程为通过多晶硅还原炉生产硅棒的过程时，上述的第一预设维度可以包括电单耗(连续生产过程中的总消耗电量与生产的硅棒总重量之比)，即目标优化参数的取值可以为该电单耗的取值。

在一实施例中，所述目标优化参数的取值可以为第二预设维度的数据在所述生产过程中的各个生产阶段对应的取值集合；换言之，生产过程的每一生产阶段在该第二预设维度上均会产生相应的取值，而各个生产阶段对应的取值共同构成上述的取值集合。例如，当生产过程为通过多晶硅还原炉生产硅棒的过程时，上述的第二预设维度可以包括硅棒电阻，即目标优化参数的取值可以为该硅棒电阻的取值。

步骤204A，通过具有时间递归特性的神经网络算法对所述历史生产数据进行训练，得到根据生产控制方案对目标优化参数的取值进行预估的预估模型。

在一实施例中，由于生产过程的各个生产阶段之间连续变化，具有强烈的关联性，因而历史生产数据中包含大量的具有时间关联性的信息序列，比如生产控制方案包含的生产控制参数在分别针对各个生产阶段时的取值序列，再比如目标优化参数在对应于各个生产阶段时的取值序列等，因而通过采用具有时间递归特性的神经网络算法，可以有效分析出上述信息序列的时间关联性，使得训练得到的预估模型能够准确预测出备选生产控制方案被应用于连续生产过程时对应的目标优化参数的预估取值，从而准确地获知该备选生产控制方案的可用性，以作为对该备选生产控制方***评价。

在一实施例中，本说明书中的生产过程可以为连续生产过程，该连续生产过程的工艺参数在若干生产阶段之间连续变化，并与该连续生产过程在整体上密切相关。当然，对于非连续生产过程而言，如果多个生产过程之间间隔时间较短、生产环境相同或相似等，使得多个生产过程之间存在一定的关联和影响，那么同样可以将这多个生产过程作为一个整体生产过程，以作为本说明书中的生产过程。

在一实施例中，所述具有时间递归特性的神经网络算法可以包括以下至少之一：RNN(Recurrent Neural Networks，循环神经网络)算法、LSTM(Long Short-Term Memory，长短期记忆网络)算法、Bi-LSTM(Bi-directional LSTM，双向长短期记忆网络算法)等，本说明书并不对此进行限制。

在一实施例中，生产过程可能存在多种生产环境；比如当生产过程为通过多晶硅还原炉生产硅棒的过程时，不同(如型号、使用年限等)还原炉之间存在巨大差异，可以视为不同的生产环境。因此，可以确定所述历史生产数据对应的生产环境；针对每一生产环境，分别通过具有时间递归特性的神经网络算法对相应的历史生产数据进行训练，得到相应生产环境对应的预估模型；然后，确定所述备选生产控制方案对应的目标生产环境，向所述目标生产环境对应的预估模型输入所述备选生产控制方案，使得对预估模型的训练过程、对备选生产控制方案的评估过程全部考虑到生产环境的影响，可以显著提升预估模型的准确度。

在一实施例中，当目标优化参数的取值可以为第二预设维度的数据在所述生产过程中的各个生产阶段对应的取值集合时，可以按照预设时间步长在时间维度对所述历史生产数据进行切分，其中所述时间步长小于所述连续生产过程的生产时长，譬如生产时长为100小时，而时间步长可以为50小时、10小时、6小时等；然后，根据各个切分时段对应的历史阶段生产数据，生成适用于所述具有时间递归特性的神经网络算法的训练数据，以训练生成所述预估模型。当生产过程的生产时长较长时，如果将整个生产时长对应的历史生产数据作为单个训练样本，可能导致模型训练的样本数量太少，因此通过设置较小的时间步长而对历史生产数据进行切分，可以极大地扩充模型训练的样本量。相应地，在如图2B所示的实施例中，训练得到的预估模型适用于按照上述的时间步长，对目标优化参数在整个生产过程中各个时间段(由时间步长划分得到)的取值进行分别、迭代式地预估，从而获得备选生产控制方案对应的目标优化参数的预估取值(此时为取值集合)。

图2B是一示例性实施例提供的一种目标优化参数的获取方法的流程图。如图2B所示，该方法可以包括以下步骤：

步骤202B，获取根据生产控制方案对目标优化参数的取值进行预估的预估模型，所述预估模型由具有时间递归特性的神经网络算法对生产过程的历史生产数据进行训练得到，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值。

在一实施例中，生产过程可能存在多种生产环境；比如当生产过程为通过多晶硅还原炉生产硅棒的过程时，不同(如型号、使用年限等)还原炉之间存在巨大差异，可以视为不同的生产环境。因此，当所述备选生产控制方案对应于特定目标生产环境时，获取的预估模型可由所述特定目标生产环境对应的历史生产数据进行训练得到。

步骤204B，向所述预估模型输入备选生产控制方案，得到所述预估模型输出的所述目标优化参数的预估取值。

在一实施例中，根据预估模型输出的目标优化参数的预估取值，可以表征相应的备选生产控制方案的生产控制效果，即该备选生产控制方案的可用性，从而确定是否选用或调整该备选生产控制方案。

在一实施例中，生产过程可以包括多个生产阶段；相应地，备选生产控制方案可以包括对应于至少一个生产阶段的生产控制参数的取值信息，以用于对该生产过程的至少一个生产阶段进行生产控制。换言之，备选生产控制方案可以针对生产过程的部分生产阶段进行生产控制，也可以对生产过程的所有生产阶段进行生产控制，本说明书并不对此进行控制。

在一实施例中，可以设定所述备选生产控制方案包含的生产控制参数和每一生产控制参数的取值约束条件，并获取根据所述生产控制参数和所述取值约束条件生成的所述备选生产控制方案，所述备选生产控制方案包括各个生产控制参数的取值信息，所述取值信息符合所述取值约束条件。换言之，通过设定生产控制参数和取值约束条件，可以通过预设算法自动生成符合该取值约束条件的生产控制参数、以构成上述的备选生产控制方案，因而能够通过对各个生产控制参数进行取值设定和参数组合而产生大量的备选生产控制方案，而不局限于已有的历史生产控制方案。

例如，可以将所述生产控制参数和所述取值约束条件输入粒子群优化算法(Particle Swarm Optimization，PSO)，使得粒子群优化算法能够自动产生大量生产控制方案(由符合该取值约束条件的生产控制参数的取值所构成)，因而可以获取该粒子群优化算法输出的生产控制方案，以作为上述的备选生产控制方案。

在一实施例中，所述备选生产控制方案来自预设用户。换言之，该预设用户可以通过任意途径获得一个或多个生产控制方案，并将其作为备选生产控制方案输入上述的预估模型，以根据预估模型输出的目标优化参数的预估取值，分别确定上述的一个或多个生产控制方案的可用性。

在一实施例中，对于输入预估模型的备选生产控制方案，可以包括由诸如粒子群优化算法等方式自动生成的第一部分的生产控制方案，以及由预设用户输入的第二部分的生产控制方案。

在一实施例中，当存在多个备选生产控制方案时，可以对所有的备选生产控制方案对应的预估取值进行比较，并将预估取值最佳的备选生产控制方案作为推荐方案进行输出。例如，当预估取值与方案可用性的高低呈正相关时，可以将对应的预估取值最大的备选生产控制方案作为推荐方案而输出。尤其是，当备选生产控制方案为自动生成时，只需要通过对生产控制参数和取值约束条件进行合理设定，即可自动获得最终的推荐方案，而无需具体关注各个备选生产控制方案，可以极大地简化方案设计流程。

为了便于理解，以通过多晶硅还原炉生产硅棒的过程为例，详细描述针对多晶硅还原炉的电流配方的优化方案。在通过多晶硅还原炉生产硅棒的过程中，电流配方包括在各个生产阶段向多晶硅还原炉中硅棒接入的电流大小；其中，当电流越大时，发热量越大，化学反应越快，生成硅棒的速度也越快；但是更大电流也带来了更大的电量消耗，并且电流值与化学反应的速度之间并非线性关系，因而需要合理控制电流大小，才能够实现最高效的生产过程。通常，可以通过电单耗这一参数来表征生产效率，其中电单耗为一次连续生产过程中消耗的总电量与生成硅棒的总重量之间的比值，且电单耗与生产效率之间呈负相关；换言之，电单耗越小时表明生产效率越高。

图3是一示例性实施例提供的一种自动推荐电流配方的流程示意图。如图3所示，基于模型训练过程和对最优配方的确定过程，该实施例可以包括以下步骤：

步骤301，根据多晶硅还原炉配方数据库中的历史电流配方和历史电单耗，训练出用于评价电流配方的电单耗预估模型。

在一实施例中，多晶硅还原炉配方数据库中存储有关于多晶硅还原炉的电流配方的所有历史生产数据，包括各个历史电流配方的详细内容和每一历史电流配方对应的历史电单耗等。

在一实施例中，可以通过Bi-LSTM算法训练电单耗预估模型，以充分利用Bi-LSTM算法的遗忘和记忆机制，从而学习出电流配方包含的电流参数的取值之间的时序关系，适用于连续生产过程中的准确预估。

在一实施例中，训练样本包括特征变量和目标变量，其中特征变量为历史电流配方包含的配方参数及其取值信息、目标变量为历史电单耗及其取值信息。由于Bi-LSTM算法需要接收三维的特征变量，当多晶硅还原炉配方数据库存储的历史电流配方为二维时序数据时，需要首先将历史电流配方包含的二维时序数据转换为三维时序数据，以作为上述的特征变量类型的训练样本。同时，由于Bi-LSTM算法需要接收二维的目标变量，当每个历史电流配方对应的历史电单耗为一维数据时，需要根据Bi-LSTM算法的需求转换为二维数据，以作为上述的目标变量类型的训练样本。

然后，基于上述的训练样本，即可通过Bi-LSTM算法训练得到相应的电单耗预估模型。当然，Bi-LSTM算法还涉及到超参的配置；其中，当超参的数量较多时，可以通过诸如网格搜索(Grid Search)、Hyperopt库等参数优化工具进行快捷的配置操作，此处不再赘述。

在一实施例中，当多晶硅还原炉配方数据库存储的历史电流配方涉及到多种不同的多晶硅还原炉，即涉及到多种不同的生产环境时，由于同一电流配方在不同生产环境下的表现差异较大，因而应当根据当前所需采用的生产环境，选取适用于该生产环境的历史电流配方及其历史电单耗，以用于训练得到适用于该生产环境的电单耗预估模型。换言之，对于差异较大的生产环境，可以分别训练得到适用于各个生产环境的电单耗预估模型，以用于对相应生产环境下的电流配方进行推荐。

在一实施例中，可以将训练得到的电单耗预估模型持久化至本地文件(例如扩展名为.h5的文件)中，以便于在后续步骤中对该电单耗预估模型进行调用。

步骤302，设定PSO算法的解和约束。

在一实施例中，可以通过PSO算法提供可能的电流配方，并从中搜索得到最优电流配方。基于PSO算法的特点，即便电流配方对应的解空间十分庞大，仍然可以在相对较短的时间内给出具有高质量的解，能够兼顾电流配方的优异特性与推荐效率。当然，除了PSO算法之外，也可以采用诸如枚举等其他算法，本说明书并不对此进行限制。

在一实施例中，需要对PSO算法的解进行设定，即搜索得到的电流配方包含的配方参数，比如当电流配方包含100个配方参数时，设定的解可以为x₁、x₂、……、x₁₀₀，以分别对应于这100个配方参数；由于PSO算法的解通常为一维向量，因而可以将x₁～x₁₀₀进一步表征为(x₁，x₂，……，x₁₀₀)。相应地，通过搜索得到x₁～x₁₀₀的取值，即可得到相应的电流配方。在一些场景中，电流配方可能包含多个硅棒的配方参数，因而可以将这些配方参数按照时序展开，并合并为上述的一维向量；例如，当电流配方对应于3个硅棒时，电流配方包含300个配方参数，设定的解可以为(x₁，x₂，……，x₃₀₀)。

在一实施例中，由于在连续生产过程中需要保持多晶硅还原炉内的状态缓慢变化、避免发生突变，因而不同阶段的配方参数的取值也不宜变化过大，可以据此对上述设定的解设定约束，比如a≤|x_i|≤b表示各个配方参数的取值处于预设数值a与b之间、|x_i+1-x_i|≤c表示相邻配方参数的取值变化小于预设数值c等，这需要根据实际情况进行设定，此处不再一一赘述。

步骤303，将电单耗预估模型配置为PSO算法的适应度函数。

在一实施例中，PSO算法可以通过迭代搜索优化的过程产生很多组解；其中，每组解包括上述一维向量中的各个x_i的取值，并构成相应的一个电流配方。而电单耗预估模型可以分别针对每一个电流配方，输出相应的电单耗的预估取值，以作为相应解的适应度取值。而PSO算法可以根据每一组解的适应度取值，对每次迭代中产生的解进行筛选和淘汰，例如保留适应度取值优于预设取值的解、淘汰其他的解。

在一实施例中，当存在多种生产环境时，可能存在分别对应于各个生产环境的多个电单耗预估模型，而PSO算法可以通过调用当前生产环境对应的电单耗预估模型的本地文件，以使其作为适应度函数。

步骤304，设定PSO算法的超参。

在一实施例中，通过不同的超参组合，可以在PSO算法的处理过程中产生不同的优化效果。其中，PSO算法的超参可以包括迭代次数和种群数量。在允许的时长范围内，可以对迭代次数和种群数量进行合理设定，以兼顾优化效果与优化效率；其中，当允许的时长越长时，可以将迭代次数和种群数量的取值设定得越大，反之则设定得越小。

步骤305，获得PSO算法输出的最优电流配方。

在一实施例中，PSO算法输出的最优电流配方应当理解为在相关条件下的最优，而并不一定在所有可能的电流配方中属于最优。实际上，正如上文所述，考虑到优化效果与优化效率的情况下，通过设定相对较大的迭代次数和种群数量，可以在一定程度上扩大PSO算法的搜索范围、以使得输出的电流配方为该范围内的最优电流配方；虽然还可能存在更优的电流配方，但考虑到搜索过程的时间成本，以及更优的电流配方所带来的效果提升的有限性，往往需要在优化效果与优化效率之间做出一定取舍或者兼顾。

在一实施例中，PSO算法输出的解为一维向量的形式，需要按照预设格式将其转换为电流配方，以作为最优电流配方输出并推荐至用户。同时，还可以将该最优电流配方对应的电单耗的预估取值进行一并输出，以供用户进行参考。

除了由PSO算法自动生成可能的电流配方，并基于训练得到的电单耗预估模型进行处理之外，该电单耗预估模型还可以用于对其他任意途径得到的电流配方进行处理、输出电单耗的预估取值，并基于该预估取值对输入的电流配方进行评价；其中，当电单耗相对更低时，表明相应的电流配方相对更优。例如，用户可以根据经验生成一个电流配方，通过将该电流配方输入电单耗预估模型中，并根据电单耗预估模型输出的电单耗的预估取值，可以评价该电流配方的优劣。

电单耗作为一种目标优化参数能够直接地反馈出电流配方的优劣，但目标优化参数还可以包括其他类型的参数，比如在通过多晶硅还原炉生产硅棒的过程中，目标优化参数还可以包括硅棒在生产过程中的电阻。相比于电单耗而言，硅棒电阻在整个生产过程中能够被不断检测到，从而形成一条基于时序不断变化的电阻曲线，便于用户对各个生产阶段的电阻值进行查看和评估，以针对相应的电流配方进行针对性的调节；例如，当用户已经通过诸如图3所示的方式获得了推荐的电流配方后，仍然可以通过查看该电流配方对应的电阻曲线，以便针对该电流配方做出进一步的优化。

类似于图3所示的实施例，可以通过对多晶硅还原炉配方数据库提供的历史生产数据进行训练，得到用于表征电流配方与硅棒电阻之间的关联关系的电阻预估模型，使得该电阻预估模型可以针对各个电流配方输出相应的硅棒电阻的预估取值，从而根据这些预估取值对相应的电流配方进行评价或优化。例如，图4是一示例性实施例提供的一种评价电流配方的流程示意图；如图4所示，基于模型训练过程和对电流配方的评价过程，该实施例可以包括以下步骤：

步骤401，确定特征变量、目标变量和时间步长。

在一实施例中，当采用Bi-LSTM算法对电阻预估模型进行训练时，根据Bi-LSTM算法的要求需要确定特征变量、目标变量和时间步长。

时间步长可以设定为不大于硅棒的连续生产时长的任意数值。在一实施例中，由于硅棒的连续生产时长通常较长，如果将时间步长设定为连续生产时长，可能会缺乏足够的训练样本，难以确保电阻预估模型得到充分训练。因此，时间步长的取值不宜过大，例如可以将时间步长设定为小于连续生产时长，并基于该时间步长对历史生产数据进行切分，从而获得更多数量的训练样本，有助于对电阻预估模型实施更为充分的训练。以及，时间步长的取值不宜过小，以确保切分得到的训练样本能够准确反映出历史电流配方与历史硅棒电阻之间的关系。

目标变量可以选取为历史硅棒电阻，即多晶硅还原炉中的硅棒在各个时间点对应的电阻值。特征变量可以为历史电流配方包含的配方参数，以便于在训练中引用配方参数在各个时间点对应的时序排列的取值信息。

当然，对于其他能够满足下述两个条件的变量：1)与目标变量之间存在关系、2)在连续生产过程中的取值已知或可预估，同样可以作为上述的特征变量，本说明书并不对此进行限制。在一实施例中，可以将目标变量本身添加为特征变量，有助于更精准地预测目标变量的时序变化。

步骤402，构造训练样本。

在一实施例中，按照设定的时间步长形成时间窗口，并按照时序对多晶硅还原炉配方数据库存储的历史电流配方进行依次切分，分别得到被时间窗口覆盖的数据片段。其中，由于Bi-LSTM算法需要接收三维的特征变量，当多晶硅还原炉配方数据库存储的历史电流配方为二维时序数据时，需要对每次切分得到的数据片段由二维时序数据转换为三维时序数据，以作为一个特征变量类型的训练样本。同时，由于Bi-LSTM算法需要接收二维的目标变量，当每个历史电流配方对应的硅棒电阻为一维数据时，需要根据Bi-LSTM算法的需求转换为二维数据，以作为一个目标变量类型的训练样本。

此外，Bi-LSTM算法还涉及到超参的配置；其中，当超参的数量较多时，可以通过诸如网格搜索(Grid Search)、Hyperopt库等参数优化工具进行快捷的配置操作，此处不再赘述。

步骤403，训练电阻预估模型。

在一实施例中，当多晶硅还原炉配方数据库存储的历史电流配方涉及到多种不同的多晶硅还原炉，即涉及到多种不同的生产环境时，由于同一电流配方在不同生产环境下的表现差异较大，因而应当根据当前所需采用的生产环境，选取适用于该生产环境的历史电流配方及其历史硅棒电阻，以用于训练得到适用于该生产环境的电阻预估模型。换言之，对于差异较大的生产环境，可以分别训练得到适用于各个生产环境的电阻预估模型，以用于对相应生产环境下的电流配方进行评价。

在一实施例中，可以将训练得到的电阻预估模型持久化至本地文件(例如扩展名为.h5的文件)中，以便于在后续步骤中对该电阻预估模型进行调用。

步骤404，迭代式生成目标变量的预估取值。

在一实施例中，当步骤401中采用的时间步长小于硅棒的连续生产时长时，电阻预估模型的预估能力将受限于该时间步长，使得电阻预估模型每次仅能够实施阶段性的预估操作。

在一实施例中，根据设定的时间步长，可以对备选电流配方进行切分，得到若干配方片段，每一配方片段包含相应时间段内采用的配方参数的取值信息。其中，此处采用的时间步长与步骤401中设定的时间步长一致，以便于电阻预估模型更为准确地实现预估操作。

假定备选电流配方被划分为T1、T2……Tn等n个时间段对应的配方片段，每一时间段内包含m个检测时间点。其中，由于硅棒生产过程为连续生产过程，使得各个检测时间点对应的硅棒电阻之间存在时序关联关系，比如电阻预估模型需要根据前一检测时间点对应的硅棒电阻，预估当前检测时间点对应的硅棒电阻，因而整个预估过程为迭代式实施。

其中，对于第一个时间段T1而言，由于先前并不存在已得到的硅棒电阻的取值信息，因而可以根据经验或者按照历史平均值等方式，对该T1时间段内的m个硅棒电阻值(对应于相应的m个检测时间点)进行设定；然后，由于T1时间段之后存在T2时间段，因此可以按照步骤402中对训练样本的构造方式，将T1时间段对应的m个硅棒电阻值由一维数据转换为二维数据、将T2时间段对应的配方片段由二维数据转换为三维数据，并输入电阻预估模型进行处理，得到电阻预估模型输出的针对T2时间段内m个检测时间点的m个预估的硅棒电阻值；然后，由于T2时间段之后存在T3时间段，因此可以按照步骤402中对训练样本的构造方式，将T2时间段对应的m个预估的硅棒电阻值由一维数据转换为二维数据、将T3时间段对应的配方片段由二维数据转换为三维数据，并输入电阻预估模型进行处理，得到电阻预估模型输出的针对T3时间段内m个检测时间点的m个预估的硅棒电阻值；类似地，可以继续对后续的T4等其他时间段分别进行迭代式预估，直至预估得到Tn时间段内m个检测时间点的m个预估的硅棒电阻值。

在一实施例中，按照时序对上述T1～Tn时间段对应的硅棒电阻值进行排列汇总，可以得到备选电流配方被应用于生产后的硅棒电阻值的变化情况；其中，可以通过将上述的硅棒电阻值绘制为诸如曲线等形式，便于通过可视化方式向相关人员进行呈现，并由该相关人员基于硅棒电阻值的变化而对上述的备选电流配方进行评价或改进。

在一实施例中，上述的电阻预估模型同样可以与PSO算法相结合。具体的，可以按照时间步长对整个生产过程进行划分为若干时间段；分别针对每一时间段设定该PSO算法的解和约束，并将电阻预估模型作为适应度函数，其中预估电阻的取值越小的适应度值越优；然后，通过PSO算法迭代式(每一时间段的电阻预测需要依赖于上一时间段的电阻取值)地搜索和推荐每一时间段内的最优配方片段，并将所有时间段分别对应的最优配方片段组合得到对应于整个生产过程的最优电流配方。

图5是一示例性实施例提供的一种设备的示意结构图。请参考图5，在硬件层面，该设备包括处理器502、内部总线504、网络接口506、内存508以及非易失性存储器510，当然还可能包括其他业务所需要的硬件。处理器502从非易失性存储器510中读取对应的计算机程序到内存508中然后运行，在逻辑层面上形成目标优化参数的获取装置。当然，除了软件实现方式之外，本说明书一个或多个实施例并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

请参考图6，在软件实施方式中，该目标优化参数的获取装置可以包括：

模型获取单元61，获取根据生产控制方案对目标优化参数的取值进行预估的预估模型，所述预估模型由具有时间递归特性的神经网络算法对生产过程的历史生产数据进行训练得到，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值；

取值预估单元62，向所述预估模型输入备选生产控制方案，得到所述预估模型输出的所述目标优化参数的预估取值。

可选的，还包括：

可用性确定单元63，根据所述预估模型输出的所述目标优化参数的预估取值，确定所述备选生产控制方案的可用性。

可选的，还包括：

条件设定单元64，设定所述备选生产控制方案包含的生产控制参数和每一生产控制参数的取值约束条件；

方案获取单元65，获取根据所述生产控制参数和所述取值约束条件生成的所述备选生产控制方案，所述备选生产控制方案包括各个生产控制参数的取值信息，所述取值信息符合所述取值约束条件。

可选的，所述方案获取单元65具体用于：

将所述生产控制参数和所述取值约束条件输入粒子群优化算法；

获取所述粒子群优化算法输出的所述备选生产控制方案。

可选的，所述备选生产控制方案来自预设用户。

可选的，所述连续生产过程包括多个生产阶段，所述备选生产控制方案包括对应于至少一个生产阶段的生产控制参数的取值信息。

可选的，还包括：

方案比较单元66，对所有的备选生产控制方案对应的预估取值进行比较；

方案推荐单元67，将预估取值最佳的备选生产控制方案作为推荐方案进行输出。

可选的，所述备选生产控制方案对应于特定目标生产环境；其中，所述预估模型由所述特定目标生产环境对应的历史生产数据进行训练得到。

可选的，

所述目标优化参数的取值为第一预设维度的数据在所述生产过程结束时的取值；

或者，所述目标优化参数的取值为第二预设维度的数据在所述生产过程中的各个生产阶段对应的取值集合。

可选的，当所述连续生产过程为通过多晶硅还原炉生产硅棒的过程时，所述第一预设维度包括电单耗、所述第二预设维度包括硅棒电阻。

可选的，所述具有时间递归特性的神经网络算法包括以下至少之一：RNN循环神经网络算法、LSTM长短期记忆网络算法、Bi-LSTM双向长短期记忆网络算法。

图7是一示例性实施例提供的另一种设备的示意结构图。请参考图7，在硬件层面，该设备包括处理器702、内部总线704、网络接口706、内存708以及非易失性存储器710，当然还可能包括其他业务所需要的硬件。处理器702从非易失性存储器710中读取对应的计算机程序到内存708中然后运行，在逻辑层面上形成目标优化参数的预估模型的训练装置。当然，除了软件实现方式之外，本说明书一个或多个实施例并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

请参考图8，在软件实施方式中，该目标优化参数的预估模型的训练装置可以包括：

历史数据获取单元81，获取生产过程的历史生产数据，所述历史生产数据包括历史生产控制方案与对应的目标优化参数的历史取值；

模型训练单元82，通过具有时间递归特性的神经网络算法对所述历史生产数据进行训练，得到根据生产控制方案对目标优化参数的取值进行预估的预估模型。

可选的，所述模型训练单元82具体用于：

按照预设时间步长在时间维度对所述历史生产数据进行切分，其中所述时间步长小于所述生产过程的生产时长；

根据各个切分时段对应的历史阶段生产数据，生成适用于所述具有时间递归特性的神经网络算法的训练数据，以训练生成所述预估模型。

可选的，所述模型训练单元82具体用于：

确定所述历史生产数据对应的生产环境；

针对每一生产环境，分别通过具有时间递归特性的神经网络算法对相应的历史生产数据进行训练，得到相应生产环境对应的预估模型。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

在一个典型的配置中，计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

以上所述仅为本说明书一个或多个实施例的较佳实施例而已，并不用以限制本说明书一个或多个实施例，凡在本说明书一个或多个实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例保护的范围之内。

21页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：监测机器人机械状况的装置和方法

目标优化参数的获取方法及模型训练方法、装置

相关技术

网友询问留言