一种基于启发式算法的拉丁超立方采样方法、介质及设备

文档序号:169247 发布日期:2021-10-29 浏览:12次 >En<

阅读说明:本技术 一种基于启发式算法的拉丁超立方采样方法、介质及设备 (Latin hypercube sampling method, medium and equipment based on heuristic algorithm ) 是由 吴彦锐 杨南 陈蓓 陈景文 于 2021-07-23 设计创作,主要内容包括:本发明公开了一种基于启发式算法的拉丁超立方采样方法、介质及设备,包括以下步骤:输入维数n和采样点个数m确定采样规模;选定采样规模中第一个采样点;枚举下一采样点所有可能,形成枚举区域,将枚举区域分成单个连续的块区,利用Maximin准则,选出Maximin值最大的块区为枚举区,在枚举区内运用混沌粒子群算法选定下一采样点;重复前一步骤,直到采样次数等于m,生成采样方案,完成采样。本发明提出的改进算法能够在保证采样质量不变的情况下,大大降低采样所需时间,提高采样效率。(The invention discloses a Latin hypercube sampling method, medium and equipment based on heuristic algorithm, comprising the following steps: inputting the dimension n and the number m of sampling points to determine the sampling scale; selecting a first sampling point in the sampling scale; enumerating all the possible next sampling points to form an enumeration area, dividing the enumeration area into single continuous block areas, selecting the block area with the maximum Maximin value as the enumeration area by utilizing Maximin criterion, and selecting the next sampling point in the enumeration area by using a chaotic particle swarm algorithm; and repeating the previous step until the sampling times are equal to m, generating a sampling scheme and finishing sampling. The improved algorithm provided by the invention can greatly reduce the time required by sampling and improve the sampling efficiency under the condition of ensuring that the sampling quality is not changed.)

一种基于启发式算法的拉丁超立方采样方法、介质及设备

技术领域

本发明属于计算机仿真计算领域,具体属于一种基于启发式算法的拉丁超立方采样方法、介质及设备。

背景技术

对于物理系统或者复杂耗时的电脑仿真系统,想要彻底了解外部变量对其系统内部的影响以及影响程度以便对其加以改进,经常需要用到灵敏度分析和全局寻优的技术手段。而上述技术手段都需要对系统进行大量的运行以便得到足够的数据,数据越充足越有效越有助于对问题的后续分析,获得精确的结果。但是对系统进行大量的运行需要耗费很多资源以及大量的时间,如何既能够得到精确的结果,而又不必造成很多资源以及时间的浪费是亟待解决的问题。

该问题的本质就是如何在有限的运行次数下提高获取数据的质量,因此就需要对采样方案进行设计,使得在有限的采样点数量下,获取更具代表性的采样数据。最常用的采样方法莫过于蒙特卡洛采样法(MCS),以及均匀采样法,但由于前者过于随机,后者采样数据重复利用率不高,便出现了拉丁超立方采样(LHS)。拉丁超立方采样相较于前者,在采样质量上有很大的提高,但是即便如此,其质量也不稳定,容易出现不理想的采样结果(见图3)。如何对其进行一定的约束,使其每次采样都能够给出一个高质量的采样方案成为后来学者研究的热点。为此出现了一些衡量采样质量的评判准则以及优化方法,准则包括极大极小(Maximin)距离、Φp准则、CL2准则、最低势能(Eλ)准则等等,优化方法有快速平移复制算法(TPLHD)、基于遗传算法优化局部搜索的拉丁超立方采样法(LSGA)、连续枚举法(SLE)等等。其中SLE方法最为简单实用且采样质量高填充性能好,但是其在高维度采样时采样速度会大大降低,因此本文根据其采样机理,对其进行改进。

在近代工业设计以及超复杂仿真系统中受限于实际情况以及时间限制,经常需要构建一个简化且高还原性的代理模型以代替实际复杂系统,通过对代理模型的分析来解决实际问题。而代理模型的还原性高低与采样方案有着密切联系,通常高质量的采样方案更有助于构建高还原的代理模型。如何提高采样方案的质量是需要解决的关键问题,因此本发明针对连续枚举采样方法用时长效率低的问题,提出了一种基于启发式算法的拉丁超立方采样方法。

发明内容

为了解决现有技术中存在的问题,本发明提供一种基于启发式算法的拉丁超立方采样方法、介质及设备,解决目前连续枚举采样方法用时长效率低的问题。

为实现上述目的,本发明提供如下技术方案:一种基于启发式算法的拉丁超立方采样方法,包括以下步骤:

输入维数n和采样点个数m确定采样规模;

选定采样规模中第一个采样点;

枚举下一采样点所有可能,形成枚举区域,将枚举区域分成单个连续的块区,利用Maximin准则,选出Maximin值最大的块区为枚举区,在枚举区内运用混沌粒子群算法选定下一采样点;

重复前一步骤,直到采样次数等于m,生成采样方案,完成采样。

进一步的,还包括对采样方案进行归一化处理,采样方案归一化处理的公式如下:

式中:xij是采样方案的变量,xij的取值范围为[1,m],i为采样点数,j为采样维度,xij为第i个采样点在j维度上的位置。

进一步的,在应用场合中,若采样方案中含有离散量,则归一化的采样方案需进行离散化;

若采样方案为连续变量,则归一化的采样方案还需缩放到采样区间。

进一步的,归一化方案的离散化步骤如下:

将应用场合中所有离散值的变量,固定顺序,默认所有离散值的变量的取值区间为[0,1];将应用场合离散维度对应的所有变量xij,根据变量xij的取值范围返还所有变量xij的真实采样值yij,返还真实采样值公式如下:

yij=xij·(bj-aj)+aj 0≤i≤m,0≤j≤n

式中:j为对应应用场合离散变量的维度,bj为对应应用场合j维度的最大值,aj为对应应用场合j维度的最小值;

若应用场合中离散维度j的取值总个数为m个,那么yij取第l种情况,满足关系式(l-1)/m≤yij<l/m,其中1≤l≤m;

得到离散化的采样方案:

进一步的,选定采样规模中第一个采样点的具体如下:

采样规模为Xmn,将Xmn中第一列单独取出记为xi1(1≤i≤m),令xi1=i,随机选取Xmn中第一行X1的其他剩余值得到第一个采样点X1

进一步的,选定下一采样点的过程如下:

枚举下一采样点所有可能,形成枚举区域,将枚举区域进行划分,分成单个连续的块区,每个块区中含有的所有枚举点的位置均值作为每个块区在枚举区域的位置;

对所有块区中运用Maximin准则,选出Maximin值最大的块区为枚举区;

在枚举区内运用混沌粒子群算法选择出下一个采样点的最佳位置,选定下一采样点;重复上述步骤,直到采样次数等于m,生成采样方案,完成采样。

进一步的,在枚举区内运用混沌粒子群算法选择下一个采样点位置,还需参考如下参数:粒子维数为n,种群规模为40,迭代次数为100,粒子最大飞行速度为1最小飞行速度为-1,混沌系数为3.9。

进一步的,Maximin准则中,m为采样点数;dij为采样点xi和xj两个采样点之间的距离,Maximin准则的表达式如下:

式中:dij为xi和xj两个试验样本之间的距离,其表达式如下:

式中:k=1或2,当k=1时dij为曼哈顿距离;当k=2时dij为欧几里得距离。

本发明还提供一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据上述的方法中的任一方法。

本发明还提供一种计算设备,包括:

一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据上述的方法中的任一方法的指令。

与现有技术相比,本发明至少具有以下有益效果:

本发明提供了一种基于启发式算法的拉丁超立方采样方法,在采样过程中加入枚举区块划分结合混沌粒子群优化算法对其优化,通过区块划分能够将枚举区域范围大大减少,结合混沌粒子群算法能够在选定枚举区内快速找到优值采样点,结果证明在高维度,多采样点采样方案设计中,本发明提出的改进算法能够在保证采样质量不变的情况下,大大降低采样所需时间,提高采样效率。

进一步的,通过将采样方案归一化,使其能够直接适用于各种连续采样问题。

进一步的,本发明在采样方案中加入了包含离散数据的采样,使得采样结果不仅能够用于连续变量,对于一些设计方法选择、品种选择的连续离散混合采样优化问题也做出了适配,测试结果表明基于启发式算法的拉丁超立方采样方法在提高采样效率的同时还能够保证采样质量,优于典型的采样方法。

附图说明

图1是本发明的工作原理流程图;

图2是本发明的示例采样过程图;

图3是采样方案的两种极端情况;

图4是本发明的改进后第二、三、四个采样点采取示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步的说明。

本发明提供了一种启发式算法的拉丁超立方采样方法,如图1所示:输入采样规模:输入预期采样方案的维数n和采样点个数m。

确定第一个采样点的位置:按照一定规则选定第一个采样点,确定第一个采样点在采样规模中的位置。

确定下一个采样点的位置:在上述所有已确定采样点位置的基础上确定下一个优质采样点的位置。

判断是否达到采样规模:判断是否达到采样规模,并满足采样需求来确定是否停止采样;

采样方案归一化:由于上述采样点位置为整数(1,2,3,4,5,…)坐标,故需要将其按照每个坐标维度进行归一化,生成归一化的采样方案。

采样方案区间缩放或离散化:如果预期采样方案含有离散变量,那么将上述归一化的采样方案离散化已满足实际采样需求;如果预期采样方案为连续变量,那么将上述归一化的采样方案缩放到采样区间,满足实际采样需求。

具体的:

输入采样规模:输入维数n和采样点个数m,确定采样规模Xmn。以m=4,n=2为例即采样规模为4×2矩阵X42

确定采样规模的第一个采样点的位置:

将Xmn中第一列单独取出记为xi1(1≤i≤m),令xi1=i。图2中x11=1,x21=2,x31=3,x41=4。随机选取Xmn中第一行X1的其他剩余值(x12,……,x1n)得到第一个采样点X1。图2中第一个采样点其他剩余值随机选择为x12=3,得到第一个采样点X1=[x11,x12]=[1,3]。

确定下一个采样点的位置:在上述所有已确定采样点位置的基础上确定下一个优质采样点的位置。在得到X1和x21=2的情况下,枚举所有可能,运用Maximin距离准则选出最优的第二行X2的其他剩余值,得到第二个采样点X2中x22的值。图2中通过枚举得到d11=1.414,d12=1.414,d13=2.236,Max(Min(d11),Min(d12),Min(d13))=d13,故第二个采样点为X2=[x21,x22]=[2,1]。重复该步骤,得到剩余采样点X3,X4,…,Xn。例中通过枚举得到d11=2.236,d12=2.236,d21=3.162,d22=1.414,Max(Min(d11,d12),Min(d21,d22))=d11,故第三个采样点为X3=[x31,x32]=[3,4],最后得X4=[x41,x42]=[4,2]。

常见的评估LHS均匀性的准则有极大极小(Maximin)距离、Φp准则、CL2准则、最低势能(Eλ)准则等等。Maximin准则中,m为采样点数;dij为采样点xi和xj两个采样点之间的距离,其表达式如下:

式中:dij为xi和xj两个试验样本之间的距离,其表达式如下:

式中k=1或2,当k=1时dij为曼哈顿距离;当k=2时dij为欧几里得距离,本发明采样方案中采用欧几里得距离进行计算。采样过程如图2所示。

该部分的改进:上述采样方法虽然能够取得质量较高的采样方案,且能够降低采样组合数,提高优化速度,但是即便如此,对n≥4时的中高维采样,依旧需要很长的寻优时间。该时间主要用于采样前期枚举规模很大(如m=100,n=10时,确认X2时,需要枚举9910≈9.04E19;确认X3时,需要枚举9810≈8.17E19),为了在保证采样质量不变的情况下提高效率,本文在枚举过程中嵌入混沌优化的粒子群算法,因此如何确定下一个采样点的位置参考过程如下:

①首先将枚举区域进行划分,分成单个连续的块区,取其中所有被包含枚举点的位置均值作为该块区的位置;

②对上述所有块区中运用Maximin距离准则,选出较优块区,将被选块区作为枚举区;

③在枚举区内运用混沌粒子群算法并参考参数(参数:粒子维数为n,种群规模为40,迭代次数为100,粒子最大飞行速度为1最小飞行速度为-1,混沌系数为3.9,)选择出下一个采样点的最佳位置;

④重复上述步骤①②③,判断是否达到采样规模:判断是否达到采样规模,并满足采样需求来确定是否停止采样;直到取样个数达到输入的m得到最终完整采样方案。

以m=10,n=2,依次确定第二、三、四个采样点X2,X3,X4为例,其过程如图4所示。

图4中,三角形为已确定的采样点,其内部数字代表该采样点的排序;矩形框代表候选采样点中单个连续的块区,框内四角星代表该矩形框内所有采样点的均值;实线框表示该块区较其它块区位置较优,选择其为枚举区,通过混沌粒子群在其内部所有候选点(圆圈)内选择最优候选点;矩形框内部虚线圆为候选块区中次优采样点,实线圆圈(同理)为最佳候选位置,其为第二个采样点X2。重复上述过程依次得到所有剩余采样点,生成采样方案,完成采样。

上述优化过程,无需对每一个采样点进行准则计算,通过结合划分块区以及混沌粒子群算法就能够找到优质采样点,当维度较高,采样次数较多时,能够大大降低枚举次数,提高枚举效率。

采样方案归一化:由于所有采样点位置为整数(1,2,3,4,5,…)坐标,故需要将其按照每个坐标维度进行归一化,生成归一化的采样方案。将采样结果中变量xij(取值区间为[1,m]),进行归一化,公式如下:

式中:xij是采样方案的变量,xij的取值范围为[1,m],i为采样点数,j为采样维度,xij为第i个采样点在j维度上的位置。

采样方案区间缩放或离散化:将本采样方法应用至应用场合中时,如果预期采样方案含有离散变量,那么将上述归一化的采样方案离散化已满足实际采样需求;如果预期采样方案为连续变量,那么将上述归一化的采样方案缩放到采样区间,满足实际采样需求。具体的,将应用场合中所有取离散值的变量,固定顺序,默认所有离散值的变量的取值区间为[0,1];将应用场合离散维度对应的所有变量xij,根据变量xij的取值范围返还变量xij的真实采样值yij,公式如下:

yij=xij·(bj-aj)+aj 0≤i≤m,0≤j≤n (3)

式中:j为对应应用场合离散变量的维度,bj为对应应用场合j维度的最大值,aj为对应应用场合j维度的最小值;

若应用场合中离散维度j的取值总个数为m个,那么yij取第l种情况,满足关系式(l-1)/m≤yij<l/m,其中1≤l≤m;

得到离散化的采样方案其中离散化的采样方案,能够直接应用于应用场合中。

本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于拉丁超立方采样方法的操作,包括:

输入维数n和采样点个数m确定采样规模;

选定采样规模中第一个采样点;

枚举下一采样点所有可能,形成枚举区域,将枚举区域分成单个连续的块区,利用Maximin准则,选出Maximin值最大的块区为枚举区,在枚举区内运用混沌粒子群算法选定下一采样点;

重复前一步骤,直到采样次数等于m,生成采样方案,完成采样。

本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。

可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关超立方采样方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:

输入维数n和采样点个数m确定采样规模;

选定采样规模中第一个采样点;

枚举下一采样点所有可能,形成枚举区域,将枚举区域分成单个连续的块区,利用Maximin准则,选出Maximin值最大的块区为枚举区,在枚举区内运用混沌粒子群算法选定下一采样点;

重复前一步骤,直到采样次数等于m,生成采样方案,完成采样。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求所述的保护范围为准。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:基于群体智能的液压支架性能退化定量评估方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!

技术分类