一种磁盘设备寿命预测方法及装置

文档序号:1755226 发布日期:2019-11-29 浏览:38次 >En<

阅读说明:本技术 一种磁盘设备寿命预测方法及装置 (A kind of disk unit life-span prediction method and device ) 是由 张振广 苏楠 李辉 于 2019-08-23 设计创作,主要内容包括:本发明提供一种磁盘设备寿命预测方法及装置,该方法包括:基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值;分别计算待测特征值分别与M个预设的训练样本值的权重,并构建权重矩阵;基于权重矩阵进行线性回归计算,得到回归系数;基于回归系数,确定待测特征值对应的待测磁盘设备的寿命状态。在本发明中,通过确定待测特征值对应的回归系数,能够确定待测磁盘设备的寿命状态,从而提高存储系统的安全性及可靠性较低。(The present invention is provided a kind of disk unit life-span prediction method and device and obtains characteristic value to be measured this method comprises: being calculated based on the coefficient of variation of N number of SMART characteristic value in preset time threshold in disk unit to be measured;Weight of the characteristic value to be measured respectively with M preset training sample values is calculated separately, and constructs weight matrix;Linear regression calculating is carried out based on weight matrix, obtains regression coefficient;Based on regression coefficient, the service life state of the corresponding disk unit to be measured of characteristic value to be measured is determined.In the present invention, by the corresponding regression coefficient of determination characteristic value to be measured, can determine the service life state of disk unit to be measured, thus improve storage system safety and reliability it is lower.)

一种磁盘设备寿命预测方法及装置

技术领域

本发明涉数据处理技术领域,尤其涉及一种磁盘设备寿命预测方法及装置。

背景技术

随着计算机技术的不断发展,需要存储的数据不断增多,对存储系统存储性能的需求也越来越大,存储系统能否提供稳定可靠的数据访问能力,直接影响整个存储系统的可靠性。基于数据中心统计,存储系统中的磁盘设备是故障率最高的部件。

现有技术中,只能够通过自我检测分析与报告技术(Self-Monitoring AnalysisAnd Reporting Technology,SMART)自动监控磁盘设备驱动器完好状况和报告潜在问题,***磁盘设备的故障。但是,一旦有连续多块设备故障,用户数据还是会丢失,且会导致其磁盘设备的性能呈现衰退状态。

因此,由于无法对磁盘设备的寿命进行预测,当磁盘设备的性能呈现的衰退状态达到一定程度时,磁盘设备无法提供可靠的数据访问能力,且磁盘设备的寿命状态为损坏,从而导致存储系统的安全性及可靠性较低。

发明内容

有鉴于此,本发明实施例提供一种磁盘设备寿命预测方法及装置,以解决现有技术中存储系统的安全性及可靠性较低的问题。

为实现上述目的,本发明实施例提供如下技术方案:

本发明实施例一方面公开了一种磁盘设备寿命预测方法,所述方法包括:

基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值,其中,N为大于等于1的整数;

分别计算所述待测特征值与M个预设的训练样本值的权重,并构建权重矩阵,所述训练样本值包括预设数量的磁盘设备的特征值,M为大于等于1的整数;

基于所述权重矩阵进行线性回归计算,得到回归系数;

基于所述回归系数,确定所述待测特征值对应的待测磁盘设备的寿命状态。

可选的,所述训练样本值的预设过程包括:

获取训练磁盘设备记录的SMART特征值;

选择n个与预设寿命特征数据相关性高的SMART特征值,所述N用于指示预先设定的要选取的SMART特征值的个数,n为大于等于1的整数;

基于N个SMART特征值在预设时间阈值内的变异系数进行计算,得到训练样本值,其中,N为大于等于1的整数。

可选的,所述在基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值之前,还包括:

获取待预测磁盘设备记录的SMART特征值;

选择N个与预设寿命特征数据相关性高的SMART特征值,所述N用于指示预先设定的要选取的SMART特征值的个数。

可选的,所述基于所述回归系数,确定所述待测特征值对应的待测磁盘设备的寿命状态,包括:

基于所述回归系数进行计算,得到所述待测特征值对应的预测数据;

判断所述待测特征值对应的预测数据是否大于预设的阈值;

当所述预测数据大于等于预设的阈值时,确定所述待测特征值对应的待测磁盘设备的寿命状态为可用,所述可用的寿命状态用于指示磁盘设备的寿命大于等于预先标记的天数;

当所述预测数据小于预设的阈值时,确定所述待测特征值对应的待测磁盘设备的寿命状态为损坏,所述损坏的寿命状态用于指示磁盘设备的寿命小于预先标记的天数。

可选的,所述方法还包括:

在确定所述待测特征值对应的待测磁盘设备的寿命状态后,输出提示信息。

本发明实施例另一方面公开了一种磁盘设备寿命预测装置,所述装置包括:

第一计算单元,用于基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值,其中,N为大于等于1的整数;

第二计算单元,用于分别计算所述待测特征值与M个预设的训练样本值的权重,并构建权重矩阵,所述训练样本包括预设数量的磁盘设备的特征值,M为大于等于1的整数;

第三计算单元,用于基于所述权重矩阵进行线性回归计算,得到回归系数;

确定单元,用于基于所述回归系数,确定所述待测特征值对应的待测磁盘设备的寿命状态。

可选的,还包括:

获取单元,用于获取待预测磁盘设备记录的SMART特征值;

选择单元,用于选择N个与预设寿命特征数据相关性高的SMART特征值,所述N用于指示预先设定的要选取的SMART特征值的个数。

可选的,所述确定单元包括:

计算子单元,用于基于所述回归系数进行计算,得到所述待测特征值对应的预测数据;

判断单元,用于判断所述待测特征值对应的预测数据是否大于预设的阈值;

第一确定子单元,用于当所述预测数据大于等于预设的阈值时,确定所述待测特征值对应的待测磁盘设备的寿命状态为可用,所述可用的寿命状态用于指示磁盘设备的寿命大于等于预先标记的天数;

第二确定子单元,用于当所述预测数据小于预设的阈值时,确定所述待测特征值对应的待测磁盘设备的寿命状态为损坏,所述损坏的寿命状态用于指示磁盘设备的寿命小于预先标记的天数。

可选的,还包括:

提示单元,用于在确定所述待测特征值对应的待测磁盘设备的寿命状态后,输出提示信息。

基于上述本发明实施例提供的一种磁盘设备寿命预测方法及装置,该方法包括:基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值;分别计算待测特征值与M个预设的训练样本值的权重,并构建权重矩阵;基于权重矩阵进行线性回归计算,得到回归系数;基于回归系数,确定待测特征值对应的待测磁盘设备的寿命状态。在本发明实施例中,通过确定待测特征值对应的回归系数,能够确定待测磁盘设备的寿命状态,从而提高存储系统的安全性及可靠性较低。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种磁盘设备寿命预测方法的流程示意图;

图2为本发明实施例提供的不同超参数下的平衡精准率和召回率的流程示意图;

图3为本发明实施例提供的一种磁盘设备寿命预测方法的流程示意图;

图4为本发明实施例提供的确定待测磁盘设备的寿命状态的的流程示意图;

图5为本发明实施例提供的一种磁盘设备寿命预测装置的框图;

图6为本发明实施例提供的另一种磁盘设备寿命预测装置的框图;

图7为本发明实施例提供的再一种磁盘设备寿命预测装置的框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

由背景技术可知,目前只能够通过自我检测分析与报告技术(Self-MonitoringAnalysis And Reporting Technology,SMART)自动监控磁盘设备驱动器完好状况和报告潜在问题,***磁盘设备的故障。但是,一旦有连续多块设备故障,用户数据还是会丢失,且会导致其磁盘设备的性能呈现衰退状态。

因此,本发明实施例提供了一种磁盘设备寿命预测方法及装置,通过确定待测特征值与训练样本值的差最小的训练样本值,基于训练样本值对应的权重确定待测特征值对应的回归系数,能够确定待测磁盘设备的寿命状态,从而提高存储系统的安全性及可靠性较低。

参考图1,为本发明实施例提供的一种磁盘设备寿命预测方法的流程示意图,该方法包括以下步骤:

步骤S101:基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值。

在步骤S101中,N为大于等于1的整数。

需要说明的是,所述SMART特征值包括SMART1、SMART2、SMART3、SMART4、SMART5、SMART7、SMART8、SMART183、SMART184等,所述SMART特征值用于指示所述设备的进程状态、空间存储、数据处理性能等设备数据,对此本申请不加以限制。

在具体实现步骤S101的过程中,基于所述选取的N个SMART特征值,计算每一SMART特征值与该特征值在预设时间阈值内的变异系数的标准差,并除以所述N个SMART特征值的均值,得到待测特征值,其中,所述预设时间阈值可设置为7天,对此可根据实际情况而定,本申请不加以限制。

为了更好的解释说明上述涉及到的待测特征值,下面通过表1中的内容进行举例说明。

在所述表1中,示出了所述选择的14个通过待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算得到的待测特征值的字段。

表1:

序号 SMART特征值的字段 序号 SMART特征值的字段
1 SMART_5_RAW_CV 8 SMART_5_NORM_CV
2 SMART_183_RAW_CV 9 SMART_183_NORM_CV
3 SMART_184_RAW_CV 10 SMART_184_NORM_CV
4 SMART_187_RAW_CV 11 SMART_187_NORM_CV
5 SMART_188_RAW_CV 12 SMART_188_NORM_CV
6 SMART_197_RAW_CV 13 SMART_197_NORM_CV
7 SMART_198_RAW_CV 14 SMART_188_NORM_CV

步骤S102:分别计算所述待测特征值与M个预设的训练样本值的权重,并构建权重矩阵。

在步骤S102中,所述训练样本值包括预设数量的磁盘设备的特征值,M为大于等于1的整数。

在具体实现步骤S102的过程中,基于待测特征值与M个预设的训练样本值通过核函数公式(1)计算得到M个训练样本值对应的权重ω(i,i),并基于所述权重构建矩阵。

需要说明的是,所述核函数可为高斯核函数。

公式(1):

其中,x(i)为第i个训练样本值,所述i小于等于M,x为待测特征值,k为需要调节的参数。

需要说明的是,通过调节参数k,即超参数,对M个训练样本值权重赋值,给所述目标训练样本赋予更高的权值。

需要说明的是,k可基于所述训练样本值与待测样本值之间的差值,平衡待测特征值对应的预测数据的平衡精准率和召回率,如图2所示,其中,图2的横坐标用于表示k的取值,纵坐标用于表示测特征值对应的预测数据的平衡精准率和召回率。

需要说明的是,所述训练样本值的预设过程包括:

获取训练磁盘设备记录的SMART特征值。

其中,通过在训练磁盘设备搭载内置的SMART系统对每一训练磁盘的进程状态、存储空间和数据处理性能等检测,得到每一训练磁盘设备记录的SMART特征值。

选择n个与预设寿命特征数据相关性高的SMART特征值,所述N用于指示预先设定的要选取的SMART特征值的个数。

其中,n为大于等于1的整数。在所述每一训练磁盘设备记录的SMART特征值中,进行筛选,选取N个与预设寿命特征数据相关性高的SMART特征值。

基于N个SMART特征值在预设时间阈值内的变异系数进行计算,得到训练样本值。

其中,所述N为大于等于1的整数。所述N与n的取值可以相同,也可以不同,对此本申请不加以限制。

步骤S103:基于所述权重矩阵进行线性回归计算,得到回归系数。

在具体实现步骤S103的过程中,基于所述权重矩阵,在所述M个训练样本中确定目标训练样本。并解出回归系数对应的矩阵表达式(2),并通过回归系数对应的矩阵表达式(2)对所述目标训练样本值对应的权重进行线性回归计算,其中,矩阵中的XTWX的行列式为0,得到回归系数

公式(2):

其中,W为训练样本值对应的权重,y为权重矩阵的积,X为矩阵对应的参数。

需要说明的是,所述目标训练样本用于指示与所述待测特征值大小最近的训练样本。

步骤S104:基于所述回归系数,确定所述待测特征值对应的待测磁盘设备的寿命状态。

在本发明实施例中,基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值;分别计算待测特征值与M个预设的训练样本值的权重,并构建权重矩阵;基于权重矩阵进行线性回归计算,得到回归系数;基于回归系数,确定待测特征值对应的待测磁盘设备的寿命状态,可以看到,本发明实施例公开的磁盘设备的寿命预测方法,通过确定确定待测特征值对应的回归系数,能够确定待测磁盘设备的寿命状态,从而提高存储系统的安全性及可靠性。

基于上述本发明实施例图1示出的磁盘设备寿命预测方法,在执行步骤S101基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值之前,如图3所示,还包括:

步骤S301:获取待预测磁盘设备记录的SMART特征值。

在具体实现步骤S301的过程中,通过在待测磁盘设备搭载内置的SMART系统对所述待预测磁盘的进程状态、存储空间和数据处理性能等检测,得到待预测磁盘设备记录的SMART特征值。

步骤S302:选择N个与预设寿命特征数据相关性高的SMART特征值。

在步骤S302中,所述N用于指示预先设定的要选取的SMART特征值的个数。

在具体实现步骤S302的过程中,在所述待预测磁盘设备记录的SMART特征值中,进行筛选,选取N个与预设寿命特征数据相关性高的SMART特征值。

需要说明的是,所述预设寿命特征数据至少包括磁盘的工作时间,磁盘的次头的寻址失败的次数及磁盘处理数据的吞吐性能,在本发明实施例中,对于所述寿命特征数据并不仅限于此,还可以包括其他影响磁盘设备寿命的寿命特征数据,N可设置为14个。

为了更好的解释说明上述涉及到的与预设寿命特征数据相关性高SMART特征值,下面通过表2中的内容进行举例说明。

在所述表2中,示出了所述选择的14个与预设寿命特征数据相关性高SMART特征值的初始字段。

表2:

序号 SMART特征值的字段 序号 SMART特征值的字段
1 SMART_5_RAW 8 SMART_5_NORM
2 SMART_183_RAW 9 SMART_183_NORM
3 SMART_184_RAW 10 SMART_184_NORM
4 SMART_187_RAW 11 SMART_187_NORM
5 SMART_188_RAW 12 SMART_188_NORM
6 SMART_197_RAW 13 SMART_197_NORM
7 SMART_198_RAW 14 SMART_188_NORM

在本发明实施例中,选择N个与预设寿命特征数据相关性高的SMART特征值,得到待测特征值,能够避免SMART特征值数据过多,而造成的数据的处理速率慢。

基于上述本发明实施例图1示出的磁盘寿命预测方法,在执行步骤S104基于所述回归系数,确定所述待测特征值对应的待测磁盘设备的寿命状态的过程中,如图4所示,包括以下步骤:

步骤S401:基于所述回归系数进行计算,得到所述待测特征值对应的预测数据。

在具体实现步骤S401的过程中,基于所述回归系数通过公式(3)进行计算,得到所述待测特征值对应的预测数据

公式(3):

其中,x为待测特征值,所述预测数据的取值范围为0至1。

步骤S402:判断所述待测特征值对应的预测数据是否大于预设的阈值,当所述预测数据大于等于预设的阈值时,执行步骤S403:当所述预测数据小于预设的阈值时,执行步骤S404。

需要说明的是,所述预设的阈值可设置为0.5,对此本申请不加以限制。

步骤S403:确定所述待测特征值对应的待测磁盘设备的寿命状态为可用。

在步骤S403中,所述可用的寿命状态用于指示磁盘设备的寿命大于等于预先标记的天数。

步骤S404:确定所述待测特征值对应的待测磁盘设备的寿命状态为损坏。

在步骤S404中,所述损坏的寿命状态用于指示磁盘设备的寿命小于预先标记的天数。

基于实现上述步骤S403和步骤S404的过程之前,需要对训练样本对应的磁盘设备的输出提示信息进行重新标记。

具体的,将磁盘设备寿命小于预先标记的天数的磁盘设备的输出提示信息标记为0,即磁盘设备已经损坏,将磁盘设备寿命大于预先标记的天数的磁盘设备的输出提示信息标记为1,即磁盘设备还可以使用。

需要说明的是,根据多次实验可将预先标记的天数设置为14天,本申请不加以限制。

在本发明实施例中,通过确定待测磁盘设备的寿命状态,以便于向用户输出提示信息,能够避免发生磁盘设备损坏而导致的各种数据失效,从而提高存储系统的安全性及可靠性。

可选的,在本发明上述公开的磁盘设备寿命预测方法的基础上,还包括:

在确定所述待测特征值对应的待测磁盘设备的寿命状态后,输出提示信息。

需要说明的是,若所述输出提示信息为1,则说明所述待测特征值对应的磁盘设备还可以使用,若所述输出提示信息为0,则说明所述待测特征值对应的磁盘设备已损坏。

与本发明上述公开的磁盘设备寿命预测方法相比,在确定待测特征值对应的待测磁盘设备的寿命状态后,输出提示信息,从而提醒用户该磁盘设备是否存在高危风险,以便于用户更换磁盘设备或启动其他的保护措施,从而避免发生磁盘设备损坏而导致的各种数据失效。

与上述本发明实施例公开的磁盘设备寿命预测方法相对应,本发明实施例还对应公开了一种磁盘设备寿命预测装置,如图5所示,所述磁盘设备寿命预测装置包括:

第一计算单元501,用于基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值。

需要说明的是,N为大于等于1的整数。

第二计算单元502,用于分别计算所述待测特征值与M个预设的训练样本值的权重,并构建权重矩阵。

需要说明的是,所述训练样本包括预设数量的磁盘设备的特征值,M为大于等于1的整数。

第三计算单元503,用于基于所述权重矩阵进行线性回归计算,得到回归系数。

确定单元504,用于基于所述回归系数,确定所述待测特征值对应的待测磁盘设备的寿命状态。

需要说明的是,上述本发明实施例公开的磁盘设备寿命预测装置中的各个单元具体的原理和执行过程,与上述本发明实施示出的磁盘设备寿命预测方法相同,可参见上述本发明实施例公开的磁盘设备寿命预测方法中相应的部分,这里不再进行赘述。

在本发明实施例中,第一计算单元基于待测磁盘设备中的N个SMART特征值在预设时间阈值内的变异系数进行计算,得到待测特征值;第二计算单元分别计算待测特征值与M个预设的训练样本值的权重,并构建权重矩阵;第三计算单元基于权重矩阵进行线性回归计算,得到回归系数;确定单元基于回归系数,确定待测特征值对应的待测磁盘设备的寿命状态,可以看到,本发明实施例公开的磁盘设备的寿命预测方法,通过确定待测特征值对应的回归系数,能够确定待测磁盘设备的寿命状态,从而提高存储系统的安全性及可靠性较低。

基于上述图5示出的磁盘设备寿命预测装置,结合图5,参考图6,示出了本发明实施例提供的一种磁盘设备寿命预测装置的结构框图,所述装置还包括:

获取单元601,用于获取待预测磁盘设备记录的SMART特征值。

选择单元602,用于选择N个与预设寿命特征数据相关性高的SMART特征值,所述N用于指示预先设定的要选取的SMART特征值的个数。

在本发明实施例中,选择N个与预设寿命特征数据相关性高的SMART特征值,得到待测特征值,能够避免SMART特征值数据过多,而造成的数据处理的速率慢。

基于上述图5示出的磁盘设备寿命预测装置,所述确定单元504包括:

计算子单元,用于基于所述回归系数进行计算,得到所述待测特征值对应的预测数据。

判断单元,用于判断所述待测特征值对应的预测数据是否大于预设的阈值。

第一确定子单元,用于当所述预测数据大于等于预设的阈值时,确定所述待测特征值对应的待测磁盘设备的寿命状态为可用。

需要说明的是,所述可用的寿命状态用于指示磁盘设备的寿命大于等于预先标记的天数。

第二确定子单元,用于当所述预测数据小于预设的阈值时,确定所述待测特征值对应的待测磁盘设备的寿命状态为损坏。

需要说明的是,所述损坏的寿命状态用于指示磁盘设备的寿命小于预先标记的天数。

在本发明实施例中,通过确定待测磁盘设备的寿命状态,以便于向用户输出提示信息,能够避免发生磁盘设备损坏而导致的各种数据失效,从而提高存储系统的安全性及可靠性。

基于上述图5示出的磁盘设备寿命预测装置,结合图5,参考图7,示出了本发明实施例提供的一种磁盘设备寿命预测装置的结构框图,所述装置还包括:提示单元505。

提示单元505,在确定所述待测特征值对应的待测磁盘设备的寿命状态后,输出提示信息。

在本发明实施例中,在确定待测特征值对应的待测磁盘设备的寿命状态后,输出提示信息,从而提醒用户该磁盘设备是否存在高危风险,以便于用户更换磁盘设备或启动其他的保护措施,从而避免发生磁盘设备损坏而导致的各种数据失效。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

15页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种功能缺陷类型检测方法及系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!