一种针对温度感知数据的时间相关性去冗余方法

文档序号:1613976 发布日期:2020-01-10 浏览:29次 >En<

阅读说明:本技术 一种针对温度感知数据的时间相关性去冗余方法 (Time correlation redundancy removing method for temperature sensing data ) 是由 朱容波 李媛丽 王俊 王德军 于 2019-09-30 设计创作,主要内容包括:本发明公开了一种针对温度感知数据的时间相关性去冗余方法,该方法包括:步骤一、获取多个温度传感器采集到的温度感知数据,并对其进行初步处理;步骤二、计算当前采集到的温度感知数据与临时数据集中数据的相似距离;步骤三、计算每个周期内连续冗余温度感知数据的最远时间差,设置相似距离的阈值和最大时间控制的数值,将相似距离与其阈值比较,同时将最远时间差与最大时间控制的数值比较,作为判断冗余的冗余条件;并在计算时加入动态步长控制比较数量;步骤四、输出时间相关性去冗余后的温度感知数据。本发明能保留特殊数据,解决了因过度去冗余而造成的数据过度缺失的问题,使得温度感知数据在去冗余的过程中更合理、更符合用户的接受形式。(The invention discloses a time correlation redundancy removing method for temperature sensing data, which comprises the following steps: acquiring temperature sensing data acquired by a plurality of temperature sensors, and performing primary processing on the temperature sensing data; step two, calculating the similar distance between the currently acquired temperature sensing data and the data in the temporary data set; step three, calculating the farthest time difference of continuous redundant temperature sensing data in each period, setting a threshold value of a similar distance and a numerical value of the maximum time control, comparing the similar distance with the threshold value, and simultaneously comparing the farthest time difference with the numerical value of the maximum time control to serve as a redundant condition for judging redundancy; adding dynamic step length to control the comparison quantity during calculation; and step four, outputting the temperature sensing data after the redundancy removal of the time correlation. The invention can reserve special data, solves the problem of data excessive loss caused by excessive redundancy removal, and ensures that the temperature sensing data is more reasonable and more in line with the acceptance form of a user in the redundancy removal process.)

一种针对温度感知数据的时间相关性去冗余方法

技术领域

本发明涉及无线传感器网络技术领域,尤其涉及一种针对温度感知数据的时间相关性去冗余方法。

背景技术

随着社会科技的进步,无线传感器网络被用于生活的各个方面(如:医疗、轨迹、地震、军事、物联网、农业和工业污染监控等),无时无刻地为人们提供着大量的监测数据。由于,传感器网络自身条件的限制,有限的电池能量、内存、容量和通信范围等,限制了网络寿命。网络寿命主要取决于电池能量,能量消耗表现在节点通信、数据处理和数据传输三方面。随着感知数据的剧增,将产生大量的数据传输,会消耗巨大电池能量,导致网络寿命缩短。因此,如何对感知数据进行去冗余处理成为一个关键问题。

针对WSN中感知数据的去冗余问题,当前的研究主要集中在时间相关性、空间相关性和时空相关性三方面。由于传感器拓扑结构的浓密性,使得一个感知区域多个传感器节点共同记录单一事件源的信息,空间上相近的传感器获得的观测值具有很高的相关性。另外由于传感器节点周期性地观察和传输感知事件,物理环境的本质使得单节点在采样时间上相近的采样数据存在高相关性。

本申请主要针对温度传感器节点在时间相关性上的分析,以及进行温度感知数据去冗余处理,以及改进算法的性能。针对前人去冗余的方法存在以下问题,在去除数据冗余的时候,只是将数据相似距离小于阈值th的数据进行去除,却未研究去除冗余数据后,能否通过有限的非冗余数据把原始数据所表现的重要信息给呈现出来。同时,针对去冗余的过程中,还存在以下问题,当存在数据变动浮动大的时候,局部最大值与最小值的考虑。针对数据变动幅度特别小的情况,数据平稳型,数据将面临大量小于阈值th的情况,会引起阈值失效问题,造成很长一段时间内的数据均被视为冗余数据。最后,在进行数据相似性比较的时候,将会增加传感器的计算能耗。

因此,针对以上三个问题,进行了以下改进:

(1)通过将数据绘成折线图的方式,分析比较去冗余后的数据与原始数据,寻找去冗余的不科学与不合理的地方,比如,在去除冗余数据的时候,因为未考虑数据的最大值与最小值这些特殊点的存在,造成最值缺失,因此,在基础算法上增加了最大时间阈值的控制。

(2)针对数据波动不明显平稳型的情况,增加最大时间阈值T_max去解决阈值失效的问题,同时,也提高了最大值与最小值的精确性。

(3)面对算法中存在相似数据计算的比较数量巨大,使得计算能耗急剧增加,从而增加传感器能耗问题,通过动态步长模型去改进数据相似距离计算的复杂性,该模型主要根据冗余相似距离计算规则特点,提出使用分段函数来进行步长的变化,减少数据间的比较计算,从而提高方法性能,减少计算能耗的损失。

发明内容

本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种针对温度感知数据的时间相关性去冗余方法。

本发明解决其技术问题所采用的技术方案是:

本发明提供一种针对温度感知数据的时间相关性去冗余方法,该方法包括以下步骤:

步骤一、获取多个温度传感器采集到的温度感知数据,并对其进行初步处理,构建基于动态变化步长的时间序列相关性的温度感知数据去冗余模型,对数据中存在大量冗余信息进行处理;

步骤二、判断温度传感器当前采集到的温度感知数据是否为首次感知数据,若是,则将首次感知数据标记为非冗余数据;若不是,则将之前采集到的温度感知数据作为临时数据集,计算当前采集到的温度感知数据与临时数据集中数据的相似距离;

步骤三、计算每个周期内连续冗余温度感知数据的最远时间差,设置相似距离的阈值和最大时间控制的数值,将相似距离与其阈值比较,同时将最远时间差与最大时间控制的数值比较,作为判断冗余的冗余条件;并在计算时加入动态步长控制比较数量;

若符合冗余条件,则将当前采集到的温度感知数据标记为冗余数据,并存入临时数据集,继续采集温度感知数据;若不符合冗余条件,将前一段临时数据集清空,将当前采集到的温度感知数据标记为非冗余数据进行传输;

步骤四、输出时间相关性去冗余后的温度感知数据。

进一步地,本发明的步骤一的具体方法为:

获取多个温度传感器采集到的温度感知数据,数据中存在大量冗余信息,对其进行初步处理;将时间集合T={t0、t1、t2、t3、…、tn}中不同的时间节点对应的温度感知数据表示为X集合:X={x0、x1、x2、x3、…、xn};其中,T表示时间集合,t0-tn分别表示不同时刻的时间节点,X表示t0-tn时间节点所感知的温度数据的集合,x0-xn表示t0-tn时刻分别感知的数据。将初次感知的温度数据作为非冗余数据进行输出result={x0}。

进一步地,本发明的步骤二的具体方法为:

将温度感知数据之间的相似距离矩阵表示为:

Figure BDA0002222816590000031

其中,相似距离矩阵为对称矩阵,且对角线的元素为0;

数据相似距离的计算公式为:

δij=|xi-xj|,0<i<j<n≤N_max

其中,δij表示ti与tj时刻所感知的数据xi与xj的相似数据距离,n为连续冗余数据的数量范围,N_max表示最大连续冗余数据的数量(用于限制连续冗余数据的范围)。

进一步地,本发明的步骤三的具体方法为:

随着比较次数的增加,连续冗余温度传感数据量递增,比较过程中针对不同的连续冗余数据量的大小而动态的变化比较步长;

比较次数从第1趟到第n-1趟的过程中,比较次数依次为:

1、2、3、4、…、n-2;

调整的比较步长m为:

Figure BDA0002222816590000041

其中,len(Temp_Data)为临时存放冗余数据的集合的长度,即同连续冗余数据的数量相等,冗余数组随着冗余数据量的变化而变化。

Figure BDA0002222816590000042

表示为对len(Temp_Data)/2进行向下取整。在每个冗余周期内实现动态步长的更新,在进行数据比较的时候,动态的改变δij=|xi-xj|中xi与xj两个数据的j=i,i=i+step索引位置,从而减少计算复杂度。

进一步地,本发明的步骤三的具体方法为:

计算每个周期内连续冗余温度感知数据的最远时间差的公式为:

t=ti-t0

其中,t表示感知时间差,ti表示第i次感知时间,t0表示首次感知数据的时间。

进一步地,本发明的步骤三的具体方法为:

进行数据冗余的冗余判断方法为:

相似距离为δij,最远时间差为t,相似距离的阈值为th,最大时间控制的数值T_max;

如果δij≤th and t≤T_max,标记作为冗余温度感知数据,进行去冗余操作;

如果δij>th and t>T_max,那么将ti时刻感知的数据,提升为非冗余温度感知数据,作为保留进行传输result={xn}。

进一步地,本发明的步骤四的具体方法为:

保留首次产生的温度感知数据以及非冗余温度感知数据,作为最终结果数据集进行输出。

本发明产生的有益效果是:本发明的针对温度感知数据的时间相关性去冗余方法,(1)对温度感知数据进行初始分析

分析实验数据中存在的特殊值(最大值、最小值等),根据这些特殊的值,对比去冗余后的数据中,特殊存在的节点是否受到影响,从而失去数据的可分析性。

(2)解决因阈值失效问题,导致连续去除了大量数据,造成很长一段时间内,用户无法接收到任何信息,造成信息缺失问题

针对已存在的去冗余算法,未考虑在数据极度平缓的情况下,引起过度去冗余,造成用户长时间接收不到温度感知数据变化问题,因此,引入连续冗余数据间的时间控制变量,找到一个最优的感知时间的最大时间阈值T_max,这样不仅可以保证将特殊数据进行保留,又可以将冗余数据在可接受的最大时间间隔中进行去除,还不影响用户对数据的分析,达到在将冗余数据最大化去除的情况下,不影响对数据的分析,还能减少数据的传输能耗的效果。

(3)解决因对数据去冗余相似距离计算量大而造成的计算能耗问题

针对现有的一些去冗余算法,还存在一个计算能耗的问题。由于要对数据进行相似性计算,则会造成计算能耗增加,由于数据量大,累计所有的计算能耗是很大一消耗,因此,对基于对已有算法的缺点与不足,提出了一种基于最大时间阈值及动态步长模型的时间相关性数据去冗余方法(TDS),有效的降低了能耗的损失。同DAWF(数据采集窗口功能)方法相比,能耗提升率增加了5%。

通过实验结果表明,在温度感知数据去冗余的过程中,维持在用户可接受的误差的范围内,不仅保证了特殊数据的保留,而且解决了因过度去冗余而造成的数据过去缺少的后果,使得温度感知数据在去冗余的过程中更合理、更符合用户可接受的形式。但是,由于在去除冗余得同时,增加了数据相似距离的计算,因此,造成了大量的计算能耗的增加。

进而,对算法进行效率的改进,提出了动态步长的时间序列相关性的数据去冗余模型。通过去冗余以及减少计算能耗,同不做任何处理的数据传输方法相比,总能耗减少了93.41%。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明实施例的基于时间序列数据冗余分析模型;

图2是本发明实施例的基于时间序列相关性数据去冗余判别过程分析;

图3是本发明实施例的时间相关性去冗余算法流程图;

图4是本发明实施例的节点的原始数据展示;

图5是本发明实施例的SDT算法在不同阈值下冗余结果分析图;

图6是本发明实施例的DAWF方法去冗余的数据展示情况;

图7是本发明实施例的TDS方法的能耗分析;

图8是本发明实施例的DAWF算法的能耗分析。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

本发明实施例的针对温度感知数据的时间相关性去冗余方法,该方法包括以下步骤:

步骤一、获取多个温度传感器采集到的温度感知数据,并对其进行初步处理,构建基于动态变化步长的时间序列相关性的温度感知数据去冗余模型,对数据中存在大量冗余信息进行处理;

步骤二、判断温度传感器当前采集到的温度感知数据是否为首次感知数据,若是,则将首次感知数据标记为非冗余数据;若不是,则将之前采集到的温度感知数据作为临时数据集,计算当前采集到的温度感知数据与临时数据集中数据的相似距离;

步骤三、计算每个周期内连续冗余温度感知数据的最远时间差,设置相似距离的阈值和最大时间控制的数值,将相似距离与其阈值比较,同时将最远时间差与最大时间控制的数值比较,作为判断冗余的冗余条件;并在计算时加入动态步长控制比较数量;

若符合冗余条件,则将当前采集到的温度感知数据标记为冗余数据,并存入临时数据集,继续采集温度感知数据;若不符合冗余条件,将前一段临时数据集清空,将当前采集到的温度感知数据标记为非冗余数据进行传输;

步骤四、输出时间相关性去冗余后的温度感知数据。

为了更合理的去除传感器中产生的大量的冗余数据,本发明对温度感知数据进行了合理的分析,综合考虑了以下情景,对算法进行改进,使得数据表现更合理,且有效的降低能耗。我们发现:

(1)在感知事件不变的情况下,温度感知数据在短时间内变化浮动范围特别小;

(2)温度感知数据变化浮动特别小的情况下,在用户可接受的误差范围内,可以进行数据去冗余,来降低数据传输能耗。

为了验证这一本发明的可行性,使用因特尔伯克利实验室的温度感知数据进行分析。该数据,针对温度进行的感知采集,每个传感器节点采集了大约四万条数据,共有54个传感器节点,大约两百万的数据量。我们将围绕该实验室的温度感知数据开展相关工作,算法的整体流程图,如图3所示。冗余问题可形象的表示,如图1所示。

步骤一:获取多个温度传感器采集到的数据,数据中存在大量冗余信息,然后对其进行初步处理,进行如下分析:

将T={t0、t1、t2、t3、…、tn}对应的温度感知数据分别为:X={x0、x1、x2、x3、…、xn},通过数据相似距离公式(1)的计算与分析{x0、…、xn-1}间的相似距离,首先,将初次感知的温度数据作为非冗余数据进行传输result={x0}。

数据间的相似距离矩阵的表示:

Figure BDA0002222816590000081

其中,相似距离矩阵是对称矩阵,且对角线为0。

数据相似距离的计算公式:

δij=|xi-xj|,0<i<j<n≤N_max (2)

其中,δij表示ti与tj时刻所感知的数据xi与xj的相似数据距离,n为连续冗余数据的数量范围,N_max表示最大连续冗余数据的数量(用于限制连续冗余数据的范围)。

步骤二:构建基于动态步长比较计算温度感知数据的相似距离

针对数据相似距离计算引起的性能以及能耗问题,我们提出动态变化步长的比较方式,进行优化算法。在连续冗余温度数据递增的情况下,依旧采取原始模型中的一一比对求解数据相似距离,会增加大量的不必要的计算量。由于数据的时间相关性关系,温度数据间的感知时间差越小,会使得数据间的相似性的可能性会越高;同时,为了避免产生数据在特殊情况下,数据相似距离很小或很大而无法识别的情况,会针对不同的连续冗余数据量的大小而动态的变化比较步长,如图2所示。

从第1趟到第n-1趟的比较次数依次为:1、2、3、4、…、n-2。因此,不加改进的情况下,总次数为:(n-1)(n-2)/2。

因此,本发明提出动态步长随着连续冗余数据的增多而变大,来降低比较的步长。步长的表示:

Figure BDA0002222816590000082

其中,len(Temp_Data)为临时冗余数组的长度,即同连续冗余数据的数量的相等。。

Figure BDA0002222816590000083

表示为对len(Temp_Data)/2进行向下取整。由于冗余数组会随着冗余数据量的变化而变化,因此,通过(4)中的公式,可以在每个冗余周期内实现动态步长的更新,这样在进行数据比较的时候,会动态的改变两个数据的索引位置,从而减少比较的数量,使得相似距离(1)(2)计算的复杂性大大降低,动态的改变δij=|xi-xj|中xi与xj两个数据的j=i,i=i+step索引位置,从而提升相似距离的计算效率与降低计算能耗。

步骤三:改进判断冗余的冗余条件,将步骤一中的条件(2)同步骤三中的条件(4),同时作为冗余判断的因素。

对每个周期内连续冗余温度感知数据进行最远时间差的计算:

t=ti-t0 (4)

引入了另一个变量,最大时间控制T_max:

如果δij≤th and t≤T_max,标记作为冗余温度感知数据,进行去冗余操作;

如果δij>th and t>T_max,那么将ti时刻感知的数据,提升为非冗余温度感知数据,作为保留进行传输result={xn}。

步骤四:输出非冗余结果。

彼此小于阈值th,因此属于冗余数据,进行冗余去除,保留首次产生的感知数据以及非冗余温度感知数据,则最终结果集:result={x0、xn}。

本发明通过对模型进行改进的技术方案主要为:

1)构建基于时间序列相关性的温度感知数据去冗余模型;

通过对温度感知数据的连续采集以及彼此间的相似度计算,将T={t0、t1、t2、t3、…、tn}对应的温度感知数据分别为:X={x0、x1、x2、x3、…、xn};通过数据相似距离的分析,{x0、…、xn-1}间的相似距离彼此小于阈值th,因此属于冗余数据,进行冗余去除,保留首次产生的感知数据以及非冗余数据,则最终结果集:result={x0、xn};分析冗余数据的时间范围:t=ti-t0,t存在两种情况,一种在用户可接受范围,一种大于用户可接受范围。因此,为解决该问题,引入了另一个变量,最大时间控制T_max。通过计算冗余数据的最大时间范围,即可在面临最大时间大于T_max时,该冗余数据进而降为非冗余数据,以此来弥补感知数据的过度去除冗余数据所造成很长时间接收不到数据的问题。

2)构建基于动态变化步长的时间序列相关性的数据去冗余模型;

由于在基于时间序列相关性的数据去冗余模型中,引入了数据的相似距离的计算,造成了大量的计算能耗的增加,因此,引入了动态步长的概念,来减少数据相似距离的计算量。动态步长m的变化,主要根据造成计算能耗的增加的根本原因而改进。由于连续冗余数据越多,便会造成计算量的大幅度增加,因此根据连续冗余数据的数量,动态改变比较步长。

通过实验数据去冗余与能耗分析:

该实验部分,主要使用英特尔伯克利研究室的数据进行研究分析。该实验室,一共布置了54个传感器节点,分别监测整个实验室的不同位置的温度变化情况,传感器节点每0.5分钟采集一次数据,收集了大约一个月的数据,每个节点的数据量大约有四万条,总共54个节点,因此,数据总量达到了两百万多条,数据量巨大。初步试验,主要使用其中一个节点的四万条数据进行分析与改进。

(1)节点的原始数据展示,如图4所示:

图4所示,x轴表示时间,y轴表示温度。随着时间的增长,温度的变化幅度剧烈,尤其在接近时间430分钟的时候,温度达到最低,然后随着时间的增加,在750分钟左右达到了最高峰,随后,又随着时间的增加,温度开始降低,在1800分钟时候,到达了最低,继而再次升高,在2250分钟时候达到最高,又开始降低。由于,数据的变化性极大,很直观的看出,在430、750、1800、2250分钟左右的时候,是该数据中比较特殊的最值节点。因此,在数据去冗余的过程中,尤其需要重点关注该四个位置的数据去冗余情况。

(2)该节点去冗余后的效果图如图4所示:

图5,横坐标为时间,单位为分钟,纵坐标为温度,单位为摄氏度。在SDT(基于最大时间阈值以及动态步长模型)方法下的阈值th分别为0、1、0.5、0.4、0.25的情况下,分别绘制出来的折线图,可以直观的反映出数据中特殊值得存在,波峰处的最大值与波谷处的最小值。从图5可以看出,不同阈值情况下,数据量得到了减少,但是用最少的数据反映出了最贴近原始数据的特点。波峰处的最值与波谷处的最值,均无限接近原始数据。不同阈值下,数据量与准确率的分析,如表1所示:

表1 SDT方法阈值下的非冗余数据情况

图6,横坐标为时间,单位为分钟,纵坐标为温度,单位为摄氏度。在DAWF方法下的阈值th分别为0、0.01、0.02、0.03、0.04、0.05的情况下,分别绘制出来的折线图,可以直观的看出去冗余后的数据分布在原始数据的上下,这是因为DAWF方法将冗余数据进行了均值求解造成的必然现象。在数据直线下降的过程中,求平均值便会比原始数据小,在数据直线上升的过程中,求平均值便会比原始数据大。因此,去冗余后的数据会表现为浮动在原始数据的上或下。只会接近原始数据,却无法做到与原始数据相等,所以,原始数据同去冗余数据间存在着误差。

不同阈值下,数据量与准确率的分析,如表2所示:

表2 DAWF方法不同阈值下的非冗余数据情况

Figure BDA0002222816590000112

(3)针对该节点去冗余的能耗分析情况如图7所示;

图7所示,横坐标表示阈值,纵坐标表示能耗提升率。图7中,蓝色的曲线为TDS方法性能改进前的走势,因此,可以很明显的看出来,随着阈值的增加,能耗提升率先增加又急剧下降的情况,这是因为随着数据间的相似距离比较的次数增多造成的计算能耗增大引起的结果。因此,对算法性能的分析,显得尤其重要。在加入性能改进后,如图所示,红色的曲线(为TDS方法性能改进后)的变化趋势为,随着阈值的增大,能耗提升率明显得到了提升。并且,在阈值为0.4的时候,能耗提升率达到了93.41%。

图7所示,横坐标表示阈值,纵坐标表示能耗提升率。图中,曲线为DAWF方法性能提升率情况,可以很明显的看出,随着阈值的增加,能耗提升率在阈值内0.01迅速增加,随后便处于平稳。在阈值为0.05时,能耗提升率为88.09%。

从图7与图8结果显示来看,SDT方法比DAWF方法的能量节省了5%左右。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

16页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:智能试验数据管理系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!