一种基于概率并行规划实时可加性启发式的电梯调度方法

文档序号：561052 发布日期：2021-05-18 浏览：16次 >En<

阅读说明：本技术 一种基于概率并行规划实时可加性启发式的电梯调度方法 (Probability parallel planning based elevator scheduling method based on real-time additivity heuristic method ) 是由饶东宁曾进于 2021-01-27 设计创作，主要内容包括：本发明公开了一种基于概率并行规划实时可加性启发式的电梯调度方法,将电梯调度问题抽象为并行概率规划领域,通过基于概率并行规划实时可加性启发式算法得到调度结果。本发明能高效地实现电梯调度。(The invention discloses a probability parallel programming-based real-time additivity heuristic elevator scheduling method, which abstracts elevator scheduling problems into the field of parallel probability programming and obtains scheduling results through a probability parallel programming-based real-time additivity heuristic algorithm. The invention can efficiently realize elevator dispatching.)

技术领域

本发明涉及智能规划的技术领域，尤其涉及到一种基于概率并行规划实时可加性启发式的电梯调度方法。

背景技术

每一架电梯都有一个编号，以方便监控与维修。每一架电梯都有一实时监控器，负责监控电梯上下，向电梯升降盒发送启动、制动、加速、减速、开关电梯门的信号。若电梯发生故障，还应向相应的电梯负责人发送求救信号。

在电梯数量多、乘客需求复杂的高层建筑中，现时的调度算法并不高效，经常会出现空载、乘客长时间等待的问题。

为此，急需一种高效的电梯调度方法显得很有必要。

发明内容

本发明的目的在于克服现有技术的不足，提供一种高效的基于概率并行规划实时可加性启发式的电梯调度方法。

为实现上述目的，本发明所提供的技术方案为：

一种基于概率并行规划实时可加性启发式的电梯调度方法，将电梯调度问题抽象为并行概率规划领域，通过基于概率并行规划实时可加性启发式算法得到调度结果。

进一步地，所述将电梯调度问题抽象为并行概率规划领域具体包括：

对象包括：电梯和楼层；

参数包括：乘客期望到达某层的概率参数，通过统计频率得出；

状态流包括：乘客的分布，电梯所处的状态；

动作包括：电梯的上下移动、开门、关门；

奖励为：正确把乘客运抵目的地，正确运抵越多乘客，奖励越高。

进一步地，所述通过基于概率并行规划实时可加性启发式算法得到调度结果的具体过程如下：

S1、输入初始状态x₀，总单位时间h；

S2、初始化可加性启发式列表；

S3、设h₁＝h/phase_ratio，phase_ratio为分阶段超参数；动作集大小估计向量s_i＝0,i∈[0,h₁]，轨迹tr为空，状态计数nr＝0；

S4、判断nr是否小于等于h₁，若是，获取状态x_nr中所有可用动作的集合，称为动作集A_nr，否则，进入步骤S7；

S5、通过动作集大小估计算法计算关于x_nr的最佳动作集A_best，S_nr为动作集大小估计算法计算出的最佳动作集A_best的大小，接着使用A_best将x_nr演进至下一个状态x_nr+1以及奖励r，将其加入历史数据库和轨迹tr；

S6、通过可加性数值回归分析方法更新启发式列表，并返回步骤S4；

S7、预测最佳动作集大小size＝Avg(∑S_i),i∈[0,h₁]；

S8、判断nr是否小于等于h，若是，则获取状态x_nr中所有可用动作的集合A_nr；否则输出轨迹tr；

S9、通过最佳动作集算法计算最佳动作集A_best；

S10、使用A_best将x_nr演进至下一个状态x_nr+1以及奖励r，将其加入历史数据库和轨迹tr；

S11、通过可加性数值回归分析方法更新启发式列表，并返回步骤S8。

进一步地，所述步骤S2初始化可加性启发式列表具体为：以初始状态x₀为参考值，提取出领域中的全部状态流命题，然后统计其为真的初始奖励值作为初始可加性启发式列表中该项的值。

进一步地，动作集大小估计算法将包含有电梯上行、开门、关门在内的动作编成集合，并使用其中不同数目的动作进行尝试，得到奖励值最大的动作集作为状态的结果，并通过多个状态的算法结果估算出最佳动作集大小；具体过程如下：

A1、输入状态x_nr和动作集Anr，A_i∈A_nr,i∈[0,n]，n为动作集Anr的大小；

A2、判断i是否小于n，若是，使用动作A_i进化状态x_nr至x_nr'；否则，将动作A_i根据对应的x_i进行降序排序，得到动作组A_sorted；然后跳至步骤A4；

A3、使用可加性启发式计算算法计算x_nr′的奖励r_i，i＝i+1，返回步骤A2；

A4、初始increase＝true，奖励r＝0，n_try＝0；

A5、判断increase是否为true，若是，则进入步骤A6，否则，通过最佳动作集算法计算最佳动作集；

A6、判断A_j∈A_sorted,j∈[0,n_try]，若是，则动作集A_try＝U(A_j),j∈[0,n_try]，使用A_try进化状态x_nr至x_nr'；否则，n_try＝n_try+1，返回步骤A5；

A7、通过可加性启发式计算算法计算x_nr′的奖励

A8、判断奖励是否有增加，若有增加，则最佳动作集A_best＝A_try，最佳状态x_best＝x_nr′，奖励否则，increase＝false；

A9、j＝j+1，返回步骤A6。

进一步地，所述通过最佳动作集算法计算最佳动作集的具体过程如下：

B1、输入状态x_nr，动作集A_nr，目标动作集大小size；

B2、枚举所有大小为size的动作集A_nr的子集A_i；

B3、判断枚举是否完成，若是，则输出A_best为最佳动作集；否则，使用A_i将x_nr进化至x_nr′；

B4、通过可加性启发式计算算法计算x_nr′的奖励

B5、判断最佳奖励r_best是否小于等于若是，则A_best＝A_i，x_best＝x_nr'，返回步骤B2；否则，直接返回步骤B2。

进一步地，所述可加性启发式计算算法的具体过程如下：

C1、输入状态x_nr，奖励r＝0；

C2、枚举状态x中所有的状态流x_i；

C3、判断是否枚举完成，若是，则输出r作为启发值；否则，r增加启发式列表中x_i对应的值，并返回步骤C2。

进一步地，所述可加性数值回归分析方法通过数据分析法更新启发式列表。

进一步地，所述数据分析法包括多元回归或深度学习。

与现有技术相比，本方案原理及优点如下：

本方案将电梯调度问题抽象为并行概率规划领域，通过基于概率并行规划实时可加性启发式算法得到调度结果。本方案能高效地实现电梯调度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中基于概率并行规划实时可加性启发式算法(算法1)的原理流程图；

图2为本发明实施例中初始化算法(算法2)的原理流程图；

图3为本发明实施例中动作集大小估计算法(算法3)的原理流程图；

图4为本发明实施例中最佳动作集算法(算法4)的原理流程图；

图5为本发明实施例中可加性启发式计算算法(算法5)的原理流程图；

图6为本发明实施例中可加性数值回归分析方法(算法6)的原理流程图。

具体实施方式

下面结合具体实施例对本发明作进一步说明：

本发明实施例所述的一种基于概率并行规划实时可加性启发式的电梯调度方法，将电梯调度问题抽象为并行概率规划领域，通过基于概率并行规划实时可加性启发式算法得到调度结果。

其中，将电梯调度问题抽象为并行概率规划领域具体包括：

对象包括：电梯和楼层；

参数包括：乘客期望到达某层的概率参数，通过统计频率得出；

状态流包括：乘客的分布，电梯所处的状态；

动作包括：电梯的上下移动、开门、关门；

奖励为：正确把乘客运抵目的地，正确运抵越多乘客，奖励越高。

如图1所示，通过基于概率并行规划实时可加性启发式算法得到调度结果的具体过程如下：

S1、输入初始状态x₀，总单位时间h；

S2、通过初始化算法初始化可加性启发式列表ahl，具体为：以初始状态x₀为参考值，提取出领域中的全部状态流命题，然后统计其为真的初始奖励值作为初始可加性启发式列表中该项的值，如图2所示；

S3、设h₁＝h/phase_ratio，phase_ratio为分阶段超参数；动作集大小估计向量s_i＝0,i∈[0,h₁]，轨迹tr为空，状态计数nr＝0；

S4、判断nr是否小于等于h₁，若是，获取状态x_nr中所有可用动作的集合，称为动作集A_nr，否则，进入步骤S7；

S5、通过动作集大小估计算法计算关于x_nr的最佳动作集A_best，

本步骤中，动作集大小估计算法将包含有电梯上行、开门、关门在内的动作编成集合，并使用其中不同数目的动作进行尝试，得到奖励值最大的动作集作为状态的结果，并通过多个状态的算法结果估算出最佳动作集大小；如图3所示，具体过程如下：

A1、输入状态x_nr和动作集Anr，A_i∈A_nr,i∈[0,n]，n为动作集Anr的大小；

A2、判断i是否小于n，若是，使用动作A_i进化状态x_nr至x_nr'；否则，将动作A_i根据对应的x_i进行降序排序，得到动作组A_sorted；然后跳至步骤A4；

A3、使用可加性启发式计算算法计算x_nr′的奖励r_i，i＝i+1，返回步骤A2；

A4、初始increase＝true，奖励r＝0，n_try＝0；

A5、判断increase是否为true，若是，则进入步骤A6，否则，通过最佳动作集算法计算最佳动作集；

A6、判断A_j∈A_sorted,j∈[0,n_try]，若是，则动作集A_try＝U(A_j),j∈[0,n_try](U表示并集)，使用A_try进化状态x_nr至x_nr'；否则，n_try＝n_try+1，返回步骤A5；

A7、通过可加性启发式计算算法计算x_nr′的奖励

A8、判断奖励是否有增加，若有增加，则最佳动作集A_best＝A_try，最佳状态x_best＝x_nr′，奖励否则，increase＝false；

A9、j＝j+1，返回步骤A6。

S_nr为动作集大小估计算法计算出的最佳动作集A_best的大小，接着使用A_best将x_nr演进至下一个状态x_nr+1以及奖励r，将其加入历史数据库和轨迹tr；

S6、通过可加性数值回归分析方法更新启发式列表(如图6所示)，并返回步骤S4；

S7、预测最佳动作集大小size＝Avg(∑S_i),i∈[0,h₁]；

S8、判断nr是否小于等于h，若是，则获取状态x_nr中所有可用动作的集合A_nr；否则输出轨迹tr；

S9、通过最佳动作集算法计算最佳动作集A_best，如图4所示，具体过程包括：

B1、输入状态x_nr，动作集A_nr，目标动作集大小size；

B2、枚举所有大小为size的动作集A_nr的子集A_i；

B3、判断枚举是否完成，若是，则输出A_best为最佳动作集；否则，使用A_i将x_nr进化至x_nr′；

B4、通过可加性启发式计算算法计算x_nr′的奖励如图5所示，过程包括：

C1、输入状态x_nr，奖励r＝0；

C2、枚举状态x中所有的状态流x_i；

C3、判断是否枚举完成，若是，则输出r作为启发值；否则，r增加启发式列表中x_i对应的值，并返回步骤C2。

B5、判断最佳奖励r_best是否小于等于若是，则A_best＝A_i，x_best＝x_nr'，返回步骤B2；否则，直接返回步骤B2。

S10、使用A_best将x_nr演进至下一个状态x_nr+1以及奖励r，将其加入历史数据库和轨迹tr；

S11、通过可加性数值回归分析方法更新启发式列表(如图6所示)，并返回步骤S8。

本实施例中，可加性数值回归分析方法通过数据分析法更新启发式列表，数据分析法包括但不限于深度学习、多元回归分析等。

以上所述之实施例子只为本发明之较佳实施例，并非以此限制本发明的实施范围，故凡依本发明之形状、原理所作的变化，均应涵盖在本发明的保护范围内。

13页详细技术资料下载

一种基于概率并行规划实时可加性启发式的电梯调度方法

相关技术

网友询问留言