一种面向covid-19的经验模态分解模糊预测方法

文档序号:1940011 发布日期:2021-12-07 浏览:19次 >En<

阅读说明:本技术 一种面向covid-19的经验模态分解模糊预测方法 (COVID-19-oriented empirical mode decomposition fuzzy prediction method ) 是由 陈伯伦 沈怡芸 姜文心 纪敏 于永涛 朱国畅 戚梓凡 于 2021-08-16 设计创作,主要内容包括:发明公开了一种面向COVID-19的经验模态分解模糊预测方法,适于疫情预测领域,步骤包括:新冠疫情原始数据使用经验模态分解算法,得到不同时间尺度下数据的变化趋势;将得到的数据用大小为1*(c+1)的窗口,以步长为1,使用极限学习机进行滑动训练,得到不同时间尺度下的预测值;使用自适应模糊推理系统对训练结果进行拟合,得到最终预测值。该方法在保证学习精度的前提下,简化了训练过程,提升了算法运行速度和泛化能力,同时解决了过拟合和局部最小等问题,能够很好地满足了用户对预测系统中的高准确率的要求,具有切实可行的应用前景和实用价值。(The invention discloses a COVID-19-oriented empirical mode decomposition fuzzy prediction method, which is suitable for the field of epidemic situation prediction and comprises the following steps: obtaining the change trend of the new crown epidemic situation original data under different time scales by using an empirical mode decomposition algorithm; using a window with the size of 1 x (c &#43;1) to perform sliding training by using an extreme learning machine with the step length of 1 to obtain predicted values under different time scales; and fitting the training result by using an adaptive fuzzy reasoning system to obtain a final predicted value. On the premise of ensuring the learning precision, the method simplifies the training process, improves the algorithm running speed and generalization capability, solves the problems of overfitting, local minimum and the like, can well meet the requirement of a user on high accuracy in a prediction system, and has practical and feasible application prospect and practical value.)

一种面向COVID-19的经验模态分解模糊预测方法

技术领域

本发明属于应用于预测系统中的针对新冠疫情确诊人数的预测,特别涉及一种面向COVID-19的经验模态分解模糊预测方法。

背景技术

预测系统的应用十分广泛,意义也十分深远。例如,预测企业财务状况,对于保护投资者和债权人的利益、对于经营者防范财务危机、对于政府管理部门监控上市公司质量和证券市场风险,都具有重要的现实意义。例如,利用历史气象数据对未来土壤水分等因素预测,提前做出防御准备,以提高农产品产量。例如,分析和研究实时交通客流数据对其进行预测,进行协调调度,来选择最佳路线缓解交通流量。因此,利用合理的预测方法,对疫情的有效控制有着极其重要的意义。

近一年来已经有很多学者着手对新冠肺炎疫情进行预测。ohnsen等人提出的COVID-19弹性网预测器(简称EN-CoF)旨在提供一种直观、通用、易于应用的预测器。EN-CoF是一个根据时间序列数据训练的多线性回归器,用于预测每日新冠肺炎病例数量。与ARIMA和Bi-LSTM等更复杂的模型相比,EN-CoF保持了较高的精度,同时又有透明性、泛化性和可访问性的优势。Mousavi等人提出了一种基于传播率、温度、湿度等因素的新型COVID-19确诊病例预测系统平台。该预测平台可系统地导出了一组适合训练递归神经网络(RNN)的特征,并用特征的平稳性和非平稳性分别改进了对确诊病例数的平稳性和非平稳性趋势的预测。Shahid等人采用自回归综合移动平均(ARIMA)、支持向量回归(SVR)、长期记忆(LSTM)、双向长期记忆(Bi-LSTM)等预测模型,对10个主要受2019冠状病毒病影响的国家的确诊病例、死亡和恢复情况进行了时间序列的预测。模型的性能用平均绝对误差、均方根误差和r2_score指标来衡量。在整个场景中,从性能良好到性能最低的模型依次是Bi-LSTM、LSTM、GRU、SVR和ARIMA。Masum等人在基于ARIMA模型和基于LSTM的递归神经网络对日累计确诊病例进行预测时,针对神经网络优化和权值随机初始化的随机性,基于LSTM的模型产生的结果重复性较差,Masum M提出了一个可重复的LSTM框架(r-LSTM),并利用z分数离群点检测该框架的可重复性和鲁棒性。Assimakis等人在采用ARIMA模型和基于lstm的递归神经网络的基础上,研究了卡尔曼滤波在COVID-19等传染病预警和应急响应系统中作为决策支持的适用性,并对日累计确诊病例进行了预测。Friji等人提出了一个包含八种状态的广义机制模型,来描述COVID-19在经过隔离和住院状态时从易感状态演变为出院状态。模型的参数是通过求解一个拟合优化问题来确定的,拟合问题用Levenberg-Marquardt算法解决的。该问题有三个观测输入:感染人数、死亡人数和报告病例数。该模型的目标函数在训练天数内进行加权,以便指导拟合算法逼近最新的大流行时期,使趋势预测更加准确,预报能力更强。Gaglione等人将应用于导弹和船舶等跟踪和预测目标的算法,即贝叶斯序列和自适应动态估计,应用于流行病学COVID-19,可靠地估计和预测感染的演变。Beche等人试图通过利用循环自动编码器在时间序列上的能力和暗示半监督训练过程来解决预测新型冠状病毒的传播,并且任何国家的累计确诊病例数时,引入了邻国的概念来更进行估计。结果表明该方法能够对30天的周期作出可靠的预测。Kumar等人总结了一个时间序列预测模型,对新冠肺炎疫情的发生情况进行了分析,以检验近期内这些数字是会增加还是会减少。统计模式分析和数据可视化采用广泛接受的时间序列方法,如自回归综合移动平均(ARIMA)及其成分移动平均(MA)和自回归(AR)。最后,具有时间依赖性的参数可以对印度COVID-19暴发的趋势提供启示。Iqbal等人在循环神经网络(RNN)的基础上,提出了长短时记忆(LSTM)模型。并对巴基斯坦COVID-19患者数量分别进行RNN和LSTM训练预测,计算了平均绝对百分比误差(MAPE)以确定该模型在不同LSTM单元、批量大小和时点上的预测效果。

因此,在海量数据中完成预测需要耗费很多的时间,如何设计出一种准确率高、计算量少的预测方法是目前存在的主要问题。

发明内容

发明目的:针对现有技术中存在的问题,本发明提出一种适用于各国且长短期预测均有较好精确度的经验模态分解模糊预测方法。

技术方案:一种面向COVID-19的经验模态分解模糊预测方法,包括如下步骤:

步骤1:新冠疫情原始数据使用经验模态分解算法,得到不同时间尺度下数据的变化趋势;

步骤2:将得到的数据用大小为1*(c+1)的窗口,以步长为1,使用极限学习机进行滑动训练,得到不同时间尺度下的预测值;

步骤3:使用自适应模糊推理系统对训练结果进行拟合,得到最终预测值。

进一步地,步骤1中经验模态分解算法的具体步骤如下:

步骤1.1:找出原始信号的所有极大值点、极小值点,将其拟合出上包络线、下包络线,再取两者的均值得到均值包络线;

步骤1.2:从原始信号中去除均值,得到一个新的信号;

步骤1.3:判断新信号是否满足IMF的条件:

若不满足,新信号代替原始信号,重复上述步骤,直至满足IMF条件;

若满足,则将该信号记为第一个IMF;

步骤1.4:对该IMF重复上述步骤,得到更多IMF;

步骤1.5:当n阶IMF分量满足经验模态分解结束条件,分解完成。

进一步地,步骤2中极限学习机算法的具体步骤如下:

假设有N个样本、L个隐藏层节点;对于一个单隐藏层神经网络,输入xi,相应的期望输出为ti,激活函数是g(x),输入层到隐藏层输入权重wi和偏置bi,隐藏层输出权重βi,则可得:

用矩阵可以表示为:

Hβ=T

其中,H为隐藏层输出矩阵,β为输出权重,T为期望输出:

在极限学习机中输入权重wi和偏置bi是随机确定的且不再改变的,隐藏层输出矩阵H被唯一确定,将极限学习机的训练过程转化为求解输出权重β,即:

β=H-T。

进一步地,步骤3中,假设自适应模糊推理系统有两个输入x1、x2,一个输出y,规则库有以下规则:

若输入x1、x2更满足A1、B1,则输出y=p1x1+q1x2+r1

若输入x1、x2更满足A2、B2,则输出y=p2x1+q2x2+r2

其中,A1、A2、B1、B2为语言变量值,p1、p2、q1、q2、r1、r2为可调参数;网络共分为5层,前3层为规则前件,后2层为规则后件。

进一步地,5层网络包括:

第一层:模糊化层,将输入变量转化成每一个模糊集的隶属度,输出为:

其中,xi为输入;为第j条规则下第i个节点的隶属度函数,称为前件参数。

第二层:规则适用度层,计算输入信号的积,结果是这一条规则的适用度,输出为:

其中,ωj为第j条规则的适用度;为第i个节点的隶属度函数。

第三层:归一化适用度层,对第i个节点计算第j条规则的适用度与所有规则适用度之和的比值,输出为:

其中,为第j条规则的归一化适用度。

第四层:模糊规则输出层,计算每条规则的输出,输出为:

其中,pi、qi、ri为该节点的参数集,称为后件参数;是第三层经过标准化的适用度;fj为第j条规则的输出。

第五层:求和层,对每条输出求和得到总的输出,输出:

得到最终预测结果。

与现有技术相比,本发明的优点和效果在于训练时间短、泛化能力强、预测准确度高,具体表现为:

(1)利用经验模态分解算法对原始数据进行平稳化处理,挖掘数据在不同时间尺度下变化趋势,可以更好的进行结果预测;

(2)极限学习机中隐藏层和输出层之间的连接权值可以通过解方程组的方式,一次性得到最优解,从而减少运算量,提高运行速度;

(3)自适应模糊推理系统能够根据先验知识改变系统参数,使最终的输出精确度更高;

本发明针对预测问题提出基于经验模态分解的模糊预测方法。将原始新冠疫情数据使用经验模态算法分解成不同时间尺度下的数据;用极限学习机对不同时间尺度下的数据使用1*(c+1)大小的滑块,分别进行滑动训练,得到不同时间尺度下的预测值;最后使用自适应模糊推理系统对不同时间尺度下的预测值进行有机融合,得到最终预测值。该方法在保证学习精度的前提下,简化了训练过程,提升了算法运行速度和泛化能力,同时解决了过拟合和局部最小等问题,能够很好地满足了用户对预测系统中的高准确率的要求。

附图说明

图1为本发明的总体流程图。

具体实施方式

下面结合附图和具体实施方式,进一步阐明本发明。

本发明基于经验模态分解来实现预测,克服了其他预测方法无法很好分析处理非线性非平稳信号的问题。在训练数据时输入层和隐藏层的连接权值、隐藏层的阈值为随机设定并且不需要调整,连接权值通过解方程组的方式,可以一次性得到最优解,从而减少运算量,提高运行速度,克服了其他训练方法耗时长、计算开销大等问题。本发明在减少的计算开销的基础上,可以得到更高质量的预测结果。

本发明的步骤如下:

以美国每日新增的确诊人数为例:

一、使用经验模态分解分析数据

(1)对美国新增的确诊人数进行归一化处理,得到NEW(t),其中t为天数

(2)用经验模态分解对数据NEW(t)进行分解,步骤如下:

首先,找出NEW(t)中的所有的极大值点,通过函数拟合,得到上包络线max(t);找出所有极小值点,使用同样方法拟合,得到下包络线min(t);上下包络线的均值记为m1(t):

然后,从原始信号中减去m1(t),得到一个去掉低频的新信号

由于原始数据NEW(t)杂乱无章,毫无规律,因此第一次计算得到的一般无法满足IMF的条件,需要重复上述步骤k次,直至符合IMF的条件,即为NEW(t)的一阶IMF分量,记为imf1(t):

从NEW(t)中减去imf11(t),得到一个去掉高频成分的新信号r1(t):

r1(t)=NEW(t)-imf11(t)(4)

对r1(t)重复上述过程,得到二阶IMF分量imf2(t)。以此类推,直到n阶IMF分量imfn(t)残余分量小于预设值或是单调函数或是常量,停止分解。得到NEW(t)进过n次分解之后的IMF,IMF=(imf1,imf2,···,imfn)。

二、使用极限学习机结合1*(c+1)滑动窗口训练数据

(1)对imfi用大小为1*(c+1)的窗口,以步长为1进行滑动,每一个滑动窗口的前c个值为极限学习机的输入,第c+1个值为极限学习机的输出;

(2)将得到的输入、输出使用极限学习机进行训练,得到elmi,则该新增的确诊人数的IMF对应的ELM=(elm1,elm2,···,elmn)。

三、使用自适应模糊推理系统对数据进行有机拟合

用自适应模糊推理系统对步骤二得到的elmi进行拟合,则第一层输出为:

其中,为第j条规则下第i个节点的隶属度函数,由一些参数确定,称为前件参数;输出为模糊集的隶属度。

第二层的输出:

其中,ωj为第j条规则的适用度,为第i个节点的隶属度函数。

第三层的输出:

其中,为第j条规则的归一化适用度。

第四层的输出:

其中,pi、qi为该节点的参数集,称为后件参数;fj为第j条规则的输出。

第五层输出:

得到最终预测结果。

本发明未作详细阐述的内容属于本专业领域技术人员公知的已有技术。

9页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:传染病传播规模预测方法、装置、介质及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!