基于区域影响关系的节假日供需预测方法与装置

文档序号:191952 发布日期:2021-11-02 浏览:18次 >En<

阅读说明:本技术 基于区域影响关系的节假日供需预测方法与装置 (Festival, holiday supply and demand prediction method and device based on region influence relationship ) 是由 胡文政 孙翊文 王建强 张长水 鲁睿 于 2021-07-26 设计创作,主要内容包括:本申请提出一种基于区域影响关系的节假日供需预测方法和装置,其中,方法包括:获取多个城市在预设时间段内产生的运营数据构成的时间序列数据,根据时间序列数据进行聚类,得到多个数据矩阵,将多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵,从预测矩阵中得到多个城市在预测时间段里的运营数据序列。本发明利用了其他城市(区域)的数据和城市(区域)之间的相似和抑制关系进行预测,实现了更高的预估准确性;保持了城市(区域)数据之间的关系,使得预估结果更稳定合理,利用深度模型对复杂信息的特征提取和处理,采用了可学习的时序分解对城市之间的关系进行了更深层次的挖掘,拓展了方法的计算空间,提高了计算效率。(The application provides a holiday supply and demand prediction method and device based on a region influence relationship, wherein the method comprises the following steps: the method comprises the steps of obtaining time sequence data formed by operation data generated by a plurality of cities in a preset time period, clustering according to the time sequence data to obtain a plurality of data matrixes, inputting the plurality of data matrixes to a pre-trained depth sequence model to obtain a prediction matrix of a prediction stage, and obtaining operation data sequences of the plurality of cities in the prediction time period from the prediction matrix. The method utilizes the similarity and inhibition relation between the data of other cities (regions) and the cities (regions) to predict, thereby realizing higher prediction accuracy; the method has the advantages that the relation between city (region) data is kept, the estimation result is more stable and reasonable, the characteristic extraction and processing of complex information are carried out by utilizing a depth model, the learnable time sequence decomposition is adopted to carry out deeper excavation on the relation between cities, the calculation space of the method is expanded, and the calculation efficiency is improved.)

基于区域影响关系的节假日供需预测方法与装置

技术领域

本发明涉及供需预测技术领域,特别涉及一种基于区域影响关系的节假日供需预测方法与装置。

背景技术

节假日(包括各个法定节假日和法定周末)作为一个跨区域人口流动较大的时间窗口,以及节假日具有较强的文化和区域特性(比如:广东地区在传统节假日上聚会习俗明显),不同城市之间的供需关系表现出相对较强的相似性(供需关系相似)或制约性(供需关系相反)。类似的,对于同一个城市也存在办公聚集区和住宅聚集区的区分,以及常住人口居民住宅和出租性住宅等实际使用的差异化区别。节假日的人口流动直接带来供需关系上的差异变化,比如:节假日期间人口跨城市流动带来的出行服务供需关系变化,周末带来城市不同区域的出行服务供需关系变动、配送服务供需关系(比如社区购物订单与派送、外卖订单与配送)变动等。准确的预估供需关系,有助于更合理的资源与运营调配,更好的客户体验以及促成更多的供需匹配成交,比如:减少出行供需服务中乘客打车难和司机空跑的现象,减少社区购物服务中配送员不足和配送时间过长现象,减少外卖服务中超时等候现象等。

现有技术方案一,基于深度学习的多视图空间-时间出租车需求预测方法。

为了同时挖掘复杂交通中的,空间与时间依赖关系,设计了一个深度神经网络预测出租车的需求量。作者在海量的出租车需求数据集验证了方法的有效性,测试阶段,MAPE值为0.1616,RMSE值是9.642。

为了全面的分析复杂的模式该方法包含三个视图,

时间视图:用以LSTM建模未来的需求量与相近时间点需求量之间关系。

空间视图:基于局部卷积神经网络的局部空间相关性建模。

现有技术方案二,结合时间序列数据和文本数据的深度学习出租车需求预测模型,

Rodrigues等人强调在出租车需求预测这个任务中,除了时序信息,一些与地点相关的语境解释的文本信息同样有助于更加精准的预测。作者们提出的模型,利用了词嵌入技术,卷积层和注意力机制,对文本信息与时间序列数据进行了有效的融合。作者们在来自纽约的出租车公开数据集上验证了提出方法的有效性,MAE值、RMSE值、MAPE值分别是93.2、132.3和12.3。

步骤1.时间序列的去趋势化,由于日常通勤和其他经常性行为出现的明显的时间数据的周期性趋势,作者们采用了简单但有效的去趋势化方法:构建历史平均模型;

步骤2.文本数据的预处理操作。主要包含,HTML标记删除、小写转换、单词化等;

步骤3.深度神经网络结构设计,文本数据主要通过词嵌入层、1维卷积层与注意力机制层处理。时序的信号值以及天气和额外的信息主要通过全连接层来挖掘模式。两路信息最后通过预测层进行融合。

现有技术方案三,一种基于深度学习的网约车供需预测方法,专利号CN110458336A。

该方法对网约车出行数据进行了预处理操作转换为输入特征,采用单门结构的长短期记忆网络(Minimal Coupled Long Short Term Memory,简称MC-LSTM)挖掘时间相关性,使用Nadam作为优化算法,完成了对一个城市中各个区域未来10分钟的供需值的预测过程。其主要有以下的步骤:

步骤1.对于数据集中的天气、拥堵情况等信息进行数据预处理操作;

步骤2.选择关键属性进行特征的构建;

步骤3.构建深度神经网络,具体而言是MC-LSTM;

步骤4.完成供需的差额值预测。

已有的技术方案存在如下缺陷:

技术方案一设计的用于预测出租车的需求量深度神经网络,同时考虑了时间与空间上的模式相关性。该方法虽然也考虑了不同区域位置的需求量的依赖关系,但其缺点是,作者只考虑了同一城市中不同区域之间的关联,没有考虑不同城市之间的相似性与制约性。节假日期间不同城市之间也具有相对较强的相似性或制约性,因而如何利用好这部分信息,对于更加精准的预测必不可少。因此,本发明提出需要主要利用聚类和矩阵分解技术,学习多个目标城市模式之间相互依赖关系。

技术方案二的主要创新聚焦于将文本信息有效地融合进较为成型的时间序列预测的深度学习模型中。该技术方案的主要缺点是,文本信息与时空信息的结合不够细粒度,也就是说,文本信息对于时空信息的辅助并不是目的性很强的,比如针对节假日进行文本的筛选等等。此外,在实际应用中,与时空数据相匹配的文本数据并非都能有效的获取,这也是该方法的主要局限性。

技术方案三的主要致力于探索更适合于供需预测的具体的深度学习模型,作者们推荐使用MC-LSTM来进行时间方面的模式分析。本技术方案的主要缺点是,对于区域的空间建模缺乏合适的、有目的的设计,尤其对于不同城市间的供需值的关联没有加入到方法框架中。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的一个目的在于提出一种基于区域影响关系的节假日供需预测方法,要解决的问题一是节假日期间供需的预测,二是不同区域之间供需变动的相互影响。本发明实现了一利用区域之间相互关系和相互影响实现更准确的供需预测方案。主要通过序列聚类和参数可学习的时序矩阵分解方案来实施序列的消冗和关系的提取,并通过深度时序预测模型进行消冗时序数据的预测,最后通过矩阵分解逆变换恢复数据。

本发明的另一个目的在于提出一种基于区域影响关系的节假日供需预测装置。

为达到上述目的,本发明一方面实施例提出了一种基于区域影响关系的节假日供需预测方法,包括以下步骤:

获取多个城市在预设时间段内产生的运营数据构成的时间序列数据;

根据所述时间序列数据进行聚类,得到多个数据矩阵;

将所述多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵;

从所述预测矩阵中得到所述多个城市在预测时间段里的运营数据序列。

本发明实施例的基于区域影响关系的节假日供需预测方法,通过获取多个城市在预设时间段内产生的运营数据构成的时间序列数据,根据时间序列数据进行聚类,得到多个数据矩阵,将多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵,从预测矩阵中得到多个城市在预测时间段里的运营数据序列。本发明利用了其他城市(区域)的数据和城市(区域)之间的相似和抑制关系进行预测,实现了更高的预估准确性;保持了城市(区域)数据之间的关系,使得预估结果更稳定合理,利用深度模型对复杂信息的特征提取和处理,采用了可学习的时序分解对城市之间的关系进行了更深层次的挖掘,拓展了方法的计算空间,提高了计算效率。

另外,根据本发明上述实施例的基于区域影响关系的节假日供需预测方法还可以具有以下附加的技术特征:

进一步地,在本发明的一个实施例中,所述获取多个城市在预设时间段内产生的运营数据构成的时间序列数据,包括:

获取所述多个城市在预设时间段内产生的运营数据构成的时间序列p,以及在预设时间段内对应的待预测日期的运营数据q。

进一步地,在本发明的一个实施例中,每个矩阵的每一列表征不同城市在同一时间单位内产生的运营数据,每一行表征同一城市在不同时间单位内产生的序列化运营数据。

进一步地,在本发明的一个实施例中,所述将所述数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵之前,还包括:

训练所述深度序列模型。

进一步地,在本发明的一个实施例中,所述训练所述深度序列模型,包括:

基于时序正则化矩阵分解方式,分别将所述多个数据矩阵进行拆解,得到两个矩阵,拼接得到新的运营矩阵以初始化所述深度序列模型;

将训练数据输入所述初始化后的深度序列模型,根据模型训练损失函数,以得到所述预先训练的深度序列模型,并输出训练监督标签数据。

进一步地,在本发明的一个实施例中,所述聚类方式为:皮尔逊相关系数、密度聚类、k-means中的一种或多种。

进一步地,在本发明的一个实施例中,所述模型训练损失函数为预测值与真实值的均方误差。

进一步地,在本发明的一个实施例中,所述深度序列模型,包括LSTM、GRU和Transformer中的一种。

进一步地,在本发明的一个实施例中,所述训练数据为训练时段所述多个城市在预设时间段内产生的运营数据构成的时间序列p根据聚类组合而成的数据矩阵X1,...,Xa;所述训练监督标签数据为所述多个城市在预设时间段内对应的待预测日期的运营数据q根据聚类组合而成的数据矩阵

本发明的有益效果为:

1)利用了其他城市(区域)的数据和城市(区域)之间的相似和抑制关系进行预测,实现了更高的预估准确性;

2)保持了城市(区域)数据之间的关系,使得预估结果更稳定合理。

3)利用深度模型对复杂信息的特征提取和处理,不局限于单一公式,采用了可学习的时序分解对城市之间的关系进行了更深层次的挖掘,拓展了方法的计算空间,提高了计算效率。

为达到上述目的,本发明另一方面实施例提出了一种基于区域影响关系的节假日供需预测装置,包括:

获取模块,用于获取多个城市在预设时间段内产生的运营数据构成的时间序列数据;

聚类模块,用于根据所述时间序列数据进行聚类,得到多个数据矩阵;

训练模块,用于将所述多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵;

预测模块,用于从所述预测矩阵中得到所述多个城市在预测时间段里的运营数据序列。

本发明实施例的一种基于区域影响关系的节假日供需预测装置,通过获取模块,用于获取多个城市在预设时间段内产生的运营数据构成的时间序列数据;聚类模块,用于根据时间序列数据进行聚类,得到多个数据矩阵;训练模块,用于将多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵;预测模块,用于从预测矩阵中得到多个城市在预测时间段里的运营数据序列。本发明利用了其他城市(区域)的数据和城市(区域)之间的相似和抑制关系进行预测,实现了更高的预估准确性;保持了城市(区域)数据之间的关系,使得预估结果更稳定合理,利用深度模型对复杂信息的特征提取和处理,采用了可学习的时序分解对城市之间的关系进行了更深层次的挖掘,拓展了方法的计算空间,提高了计算效率。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本发明一个实施例的基于区域影响关系的节假日供需预测方法的流程图;

图2为根据本发明一个实施例的基于时序正则化矩阵分解得到的矩阵结构示意图;

图3为根据本发明一个实施例的深度预测模型训练结构示意图。

图4为根据本发明一个实施例的基于区域影响关系的节假日供需预测装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参照附图描述根据本发明实施例提出的基于区域影响关系的节假日供需预测方法与装置,首先将参照附图描述根据本发明实施例提出的基于区域影响关系的节假日供需预测方法。

图1是本发明一个实施例的基于区域影响关系的节假日供需预测方法的流程图。

如图1所示,该方法包括以下步骤:

步骤S1,获取多个城市在预设时间段内产生的运营数据构成的时间序列数据。

具体的,获取各城市(或区域)在各历史时间段内产生的运营数据构成的时间序列,记为序列p,以及各历史时间段对应的待预测日期的运营数据,记为标签q。其中,运营数据可以是出行服务数据(比如乘客呼叫网约车次数,司机接单数)、社区配送服务数据(比如配送员接单数)等产生于某一种供需关系的数据。

步骤S2,根据时间序列数据进行聚类,得到多个数据矩阵。

具体的,根据各城市(或区域)的时间序列进行聚类,确定a个城市(或区域)族群以及运营数据的矩阵(X1,...,Xa)。矩阵的每一列用于表征不同城市(或区域)在同一时间单位内(比如同一天,同一小时等)产生的运营数据,每一行用于表征同一城市(或区域)在不同时间单位内产生的序列化运营数据。

其中,聚类方式可以为任一聚类方法,如皮尔逊相关系数、密度聚类、k-means等。

步骤S3,将多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵。

可以理解的是,序列预测模型可以为LSTM,GRU,Transformer等常用时间序列预测模型

进一步的,如图2所示,基于时序正则化矩阵分解(Temporal regularized matrixfactorization,简称TRMF)方式,分别将各运营数据的矩阵进行拆解,得到两个矩阵表示,分别为矩阵M和矩阵N。

其中,m为城市的数量,n为时间序列的长度,k为给定的消冗后维度(通常k<n)。M为各个对应城市之间的关系矩阵,每一列表示一种城市组合方式,N表示去消除冗余后的时间序列数据,每一行表征某一组合方式在不同时间单位(如天、小时等)内产生的运营数据。对a个运营矩阵,可以得到(M1,N1),...,(Ma,Na).

对于N1,...,Na拼接成一个新的运营矩阵N0∈Rak×n,重复上述分解方式,得到矩阵和矩阵 为给定的维度。

图3为根据本发明一个实施例的深度预测模型训练结构示意图。如图3所示,用分别初始化参数P1,...,Pa;用初始化参数P。

具体的,训练输入数据为训练时段各个区域运营数据序列p根据聚类组合而成的数据矩阵X1,...,Xa

训练监督标签数据为预测时段各个区域运营数据序列q根据聚类组合而成的数据矩阵

模型采用端到端方式训练;

模型训练损失函数为预测值与真实值的均方误差。

步骤S4,从预测矩阵中得到多个城市在预测时间段里的运营数据序列。

本发明可实用的场景:

1)节假日车辆供需及策略调整。如网约车平台根据历史数据预测接下来节假日期间各个城市(或区域)车辆供需的关系,并依据供需预测调整在不同城市(或区域)的补贴力度等调控手段用以调控至最佳供需。

2)社区配送供需及策略调整。如社区购物平台根据历史数据预测接下来某个节假日期间城市不同区域订单数量,根据预测的订单数量通过配送价格及补贴等调控手段调度和调整最佳的供需。

3)不同区域车流量的预测。

综上,本发明采用时序正则化矩阵分解初始化模型,提高模型收敛;利用聚类和矩阵分解技术,端到端学习多个目标之间相互影响关系;利用深度时序预测方法结合聚类、矩阵分解、矩阵复原技术作出多个目标的时序预测。

根据本发明提出的基于区域影响关系的节假日供需预测方法,通过获取多个城市在预设时间段内产生的运营数据构成的时间序列数据,根据时间序列数据进行聚类,得到多个数据矩阵,将多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵,从预测矩阵中得到多个城市在预测时间段里的运营数据序列。本发明利用了其他城市(区域)的数据和城市(区域)之间的相似和抑制关系进行预测,实现了更高的预估准确性;保持了城市(区域)数据之间的关系,使得预估结果更稳定合理,利用深度模型对复杂信息的特征提取和处理,采用了可学习的时序分解对城市之间的关系进行了更深层次的挖掘,拓展了方法的计算空间,提高了计算效率。

其次参照附图描述根据本发明实施例提出的基于区域影响关系的节假日供需预测装置。

图4是本发明一个实施例的基于区域影响关系的节假日供需预测装置的结构示意图。

如图4所示,该预测装置包括:获取模块100、聚类模块200、训练模块300和预测模块400。

获取模块100,用于获取多个城市在预设时间段内产生的运营数据构成的时间序列数据;

聚类模块200,用于根据时间序列数据进行聚类,得到多个数据矩阵;

训练模块300,用于将多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵。

预测模块400,用于从预测矩阵中得到多个城市在预测时间段里的运营数据序列。

需要说明的是,前述对基于区域影响关系的节假日供需预测方法实施例的解释说明也适用于该实施例的基于区域影响关系的节假日供需预测装置,此处不再赘述。

根据本发明实施例提出的本发明实施例的一种基于区域影响关系的节假日供需预测装置,通过获取模块,用于获取多个城市在预设时间段内产生的运营数据构成的时间序列数据;聚类模块,用于根据时间序列数据进行聚类,得到多个数据矩阵;训练模块,用于将多个数据矩阵输入到预先训练的深度序列模型,得到预测阶段的预测矩阵;预测模块,用于从预测矩阵中得到多个城市在预测时间段里的运营数据序列。本发明利用了其他城市(区域)的数据和城市(区域)之间的相似和抑制关系进行预测,实现了更高的预估准确性;保持了城市(区域)数据之间的关系,使得预估结果更稳定合理,利用深度模型对复杂信息的特征提取和处理,采用了可学习的时序分解对城市之间的关系进行了更深层次的挖掘,拓展了方法的计算空间,提高了计算效率。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

11页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:面向项目型ERP系统的APS规划方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!