一种基于时空相关性和异常检测的改进WSN节能策略*

2017-09-08 00:32万叶晶叶继华江爱文
传感技术学报 2017年8期
关键词:传感重构阈值

万叶晶,叶继华,江爱文

(江西师范大学计算机信息工程学院,南昌 330022)

一种基于时空相关性和异常检测的改进WSN节能策略*

万叶晶,叶继华*,江爱文

(江西师范大学计算机信息工程学院,南昌 330022)

针对降低无线传感网能耗和保证数据精度之间的矛盾,提出了自适应采样数据并利用压缩感知进行压缩的方法。传统的基于压缩感知的无线传感器数据压缩,只采样部分节点的数据,对于未被采样节点感知到的突发事件很有可能发生漏检情况。本文方法检测所有节点上传的数据再进行压缩,可以有效避免漏检情况的发生。根据信号具有时间相关性的特点,本文采用基于方差分析ANOVA(Analysis of Variance)原理改进的传感器自适应采样频率方法,并考虑节点剩余能量,减少平稳信号的采集次数,均衡网络节点能耗。在LEACH协议基础上,对簇内数据进行压缩感知的方法对数据进行压缩从而减少数据的空间相关性并传输到汇聚节点,以减少网络整体的能量消耗。针对可能的漏报情况,提出一种改进的局部事件监测算法—滑动窗口局部事件监测SW-LED(Sliding Window-Local Event Detection)算法,实现了实时准确的异常检测和预警。实验结果表明本文方法既可以有效的均衡网络节点能耗以提高网络生存周期,同时保证了数据的精度,对于异常情况的识别率也有很大的提高。

无线传感网;时空相关性;SW-LED;ANOVA;压缩感知;异常检测

无线传感网中,节点通常是由能量有限的电池供电,且部署完成后很难再次充电,网络的节点生存时间存在着能量约束,因此,降低网络能耗是非常重要的问题。许多学者从多个方面提出降低网络能耗的算法,文献[1-2]是通过对网络协议的改进和优化达到降低能耗的效果但是并没有考虑异常事件和数据的处理。文献[3]中提出的Modified LED算法,将测量数据离散化为一些有限的等级区间,再根据等级编号变化来决定是否传输数据,虽然可以在一定程度上减少数据传输量,但极大的削弱了数据的精度,因此不适宜用在数据精度要求高的场景和应用中。为了减少网络的通信量以降低能耗,在文献[4-5]中提出各种网内数据融合方法,如使用BP神经网络、多区域能量感知等能在某一特定应用场合起到很好的效果,但是算法复杂且不具有通用性。文献[6-8]提出使用压缩感知的方法对数据进行压缩,簇首收集簇成员发送的数据并根据数据的空间相关性对数据进行压缩。传统的基于压缩感知的无线传感器数据压缩,只采样部分节点的数据,对于未被采样节点感知到的突发事件很有可能发生漏检情况。本文在考虑避免漏检情况发生的情况下,检测所有节点上传的数据再进行压缩,可以有效避免漏检情况的发生。

针对上述不足,本文综合考虑了实际采集过程所获取数据的时间相关性,采用减少采样频率以达到延长数据采集和发送周期的目的。传感器基于LEACH路由协议采集数据,采用压缩感知的方法,将数据投影至低维空间,减少簇首节点与Sink节点间的通信量。在数据采集过程中,为避免因减少数据采集次数而对异常信号漏检的情况,本文增加对异常信号的判断和处理,对于节点产生的异常数据进行滑动窗口校验[9]结合邻居节点数据判断是节点故障或网络传输错误还是发生异常事件。

1 网络模型

针对网络模型作以下常见假设[2]:所有节点在区域范围内随机均匀分布,不随时间移动,可以感知自身剩余能量;节点具有一定的储存和处理数据的能力;汇聚节点位于区域中心。

无线传感网络中,采用与文献[10]所用相同网络能耗模型,节点数据传输模型如下所示:

ETx(l,d)=ETx-elec(l)+ETx-amp(l,d)=

(1)

ERx(l)=ERx-elec(l)=lEelec

(2)

2 自适应采样WSN压缩感知数据融合

2.1 自适应采样和改进算法

对于物理信号的采集,固定采样周期的节点对于变化缓慢的信号常常会过采样,这样不仅增加了能量的消耗,也增加了许多不必要的数据传输,本文采用自适应采样方法可以根据信号的变化快慢调节采样频率,充分利用信号的时间相关性,减少冗余信号的感知和传输。

自适应采样周期算法的原理是:节点数据传输周期为P,m个周期为一轮,节点每经过一轮就调整采样频率。本文采样频率调整策略为比较这一轮的m个周期间所测得数据均值(一个周期内进行多次采样)变化是否在可接受区域内,周期间的方差可以被认为是测量差异的一个度量值。因此本文对其进行方差一致性检验,使用F分布中的统计检验量F的大小来检验判断m个周期内测量数据均值是否有显著变化。经过计算得到检验统计量F,把F与给定的显著性水平a所对应的阈值Ft进行比较,在F小于阈值的情况下,即在F分布接受域中,下一轮的采样频率即调整为F值所对应的函数值。检验统计量F越大,说明物理信号的变化速度越快,相应地,我们应该加快采样频率。可以得出,F与采样频率成正比关系,为了刻画不同情况下的正比关系,故本文使用二次贝塞尔曲线来刻画采样频率和F值的关系。

2.1.1 方差分析

首先假设每个周期内采集的数据服从独立正态分布,且方差相等,方差分析的目标是比较节点在不同周期内测量数据均值的差异。假设采集了J个周期的共N个数据。定义ST为测的数据总方差,SR为周期内测量数据方差,SF为周期间测量数据均方差。

由假设条件可知,SR,SF均服从正态总体分布,并进一步可以推导出:

(3)

所以,我们可以使用F检验的方法来比较各周期测量均值的差异,规定阈值Ft=F1-a(J-1,N-J),a为显著性水平。根据测得的数据计算出J个周期中N个数据计算出F的值,将其和阈值Ft比较,当:①F>Ft时,可知周期间均值不同,节点采样频率调节到最大采样频率Smax;②F

2.1.2 贝塞尔曲线和参数k的选取

为了刻画采样频率和F之间的变化关系,引入二次贝塞尔曲线,由(0,0),(Ft,Smax)和参数k确定一条平滑贝塞尔曲线B(F,Ft,k,Smax),其中0

2.1.3 自适应采样改进算法

本文在[11]的基础上,自适应调整采样周期的同时,将节点剩余能量考虑进去,进一步提升节点能量使用效率,均衡网络中的节点能量消耗,延长网络的生命周期。在文献[11]中,参数k为根据场景应用人为指定,本文提出根据节点剩余能量Eres来动态调节参数k,即:

(4)

式中:Etotal是节点初始能量,k0为节点初始预设参数。

采用动态调整参数k的方法,可以在节点剩余能量不多的情况下自适应的减少数据的采集和传输,避免某些节点过早死亡,增加节点寿命,从而延长整个网络生存时间。自适应采样算法如下所示。

1ASAlgorithm(自适应采样算法)

输入:一轮周期数m,最大采样频率Smax

1:初始化:实时采样频率St←Smax;轮数r←0;周期数i←0

2:WhileEres>0do

3:forr←r+1

4:fori=1→mdo

5:takesmeasuresatStspeed

6:endfor

7:computeSR,SF,F

8:ifN

9:St←Smax

10:else

11:findFt

12:ifF

13:ifEres>1/2*Etotalthen

14:St←BV(F,Ft,k0,Smax)

15:else

16: k←Eres/Etotal

17:St←BV(F,Ft,k,Smax)

18:endif

19:endif

20:endif

21:endwhile

2.2 压缩感知

在大规模无线传感监测网络的应用中,为了保证监测数据的准确性和网络整体的连通性,节点通常是高密度分布的,因此网络传输数据量中有许多冗余数据。邻近的传感器采样值在空间上具有很大的相关性,在经过异常检测后无异常情况后,本文采用压缩感知的方法来去除这些数据在空间上的相关性,减少数据的传输以达到节能的效果。由先验知识可知传感器信号分布在小波空间具有稀疏性[12],生成的随机矩阵与小波基组成的矩阵不相干程度非常大,且随机矩阵的生成并不复杂。将原始数据投影到随机矩阵后实现了数据压缩,并在汇聚节点使用一些非线性方法可以解原始数据组成的欠定方程,进而重构出原始数据。本文采用压缩感知对簇内节点发送过来的数据进行压缩,减少网络中冗余数据的传输,降低传输能量,提高网络的生存时间。

2.2.1 随机投影

在LEACH协议中,网络随机分簇并根据阈值选出簇头,所有簇成员节点将自己在每一周期内采集的数据发送给簇头,簇头将簇内节点发送的数据整合转发给汇聚节点。本文使用压缩感知,在簇头将数据进行随机投影压缩后,将压缩后小的多的数据发送给汇聚节点。所有簇首同步产生随机观测矩阵G,设第I个簇内节点数为ni,簇内节点数据向量为s(I)=[x1,x2,…,xni]T,将数据向量投影到观测矩阵G上,则有

(5)

上式[7]中ym(I)是第I个簇首对簇内节点进行线性压缩投影的信息,是一个m维的列向量,且m≪n;定义m/n为数据的压缩比,是实际观测数据个数与原始数据个数比例。原始数据经过投影到随机矩阵G后达到数据压缩的效果,m的大小由ni和簇内节点信号的稀疏度决定。假设总节点数为N,在某一轮中形成C个簇,簇I经过随机投影压缩后的数据传输量为ni+m-1,整个网络的通信负载为N+C*(m-1)。由于m≪n,可以得出,压缩后的数据传输量远小于未经压缩的数据传输量。

2.2.2 数据重构

(6)

汇聚节点利用非线性数值方法如BP算法(基追踪)、贪婪算法[13]和阈值迭代算法[14-15]等对压缩数据进行重构。贪婪算法的实现形式有很多,应用较广,如正交匹配算法(OMP)、最优正交匹配算法(OOMP)、规范化正交贪婪算法(ROMP)、梯度贪婪算法等。数据重构的理论依据是:当信号存在稀疏或在变换域上具有稀疏性,观测矩阵G在满足RIP的条件下只需要采集m=O(klogN)维的数据就可以在理论上计算出原始信号。汇聚节点重构每个簇的数据就是求如式(6)条件约束下稀疏的0范数的最小值。本文中采用OMP算法作为重构算法,解出式(6),最终可以得到对原始数据的重构信息。

定义重构信号与原始信号的均方误差NMSE(Normalizedmeansquareerror):

(7)

2.3 异常检测算法SW-LED

2.3.1 异常检测策略

对于监测系统而言,异常或者突发事件往往具有突发性和暂时性。由于本文采用自适应采样算法来实现降低网络能耗的目的,根据上一阶段的信号变化情况来决定当前时段的采样频率,因此当有突发事件发生时,很可能由于采样周期过长而发生漏检情况。因此为了防止由于减少数据量的采集和发送而造成异常事件的漏检,本文提出一种实时的异常检测方法。WSN在事件监测中所面临的主要问题是检测精度受环境噪声和设备不稳定性的影响,节点的监测数据存在错误。显然,故障和事件都可能会使节点采样值超出正常范围,当使用简单的阈值比较方法来对事件进行判断时,很容易造成WSN误判事件的发生。为了提高WSN检测事件的可靠性,消除瞬时性故障对节点监测结果的影响,本文基于Ding M等人[16]的方法,提出SW-LED(Move-Local Event Detection)算法来对节点监测到的异常情况进行可靠性校验。

(8)

式中:W表示滑动窗口大小。

簇首接收到来自节点的异常数据Si后,向簇内其他节点发送传输数据请求。簇内其他节点将当前测量值发送给簇首,簇首接收簇内所有节点发送的测量数据进行排序,得到中间数值(若为偶数个,则取中间两数的均值)med,计算各个节点与中值med的差值。假设共有n个节点的数据,则各节点与中值差值集合为{d1,d2,…,di,…,dn},得到差值集合的均值μ和方差σ2。计算Si的标准化值Zi=(Si-μ)/σ,当Zi大于预设门限θ时,认为节点发送数据为故障数据,否则,认为节点所监测区域发生异常情况,向汇聚节点发送预警信号。

2.4 数据发送策略

本文在LEACH网络协议上提出自适应采样算法和数据压缩感知,相应的网络分簇和数据传输过程如下:

(1)标记仿真轮数r,根据阈值选择簇头节点,然后形成簇。

(2)每经过一个传输周期P,簇内节点在周期P开始将第1次采样数据发送给簇首节点。在周期P内其他的采样值,采样值小于监测阈值T时,并不向簇首发送数据。当采样值大于监测阈值时,按照2.3.1节异常检测策略来对异常信号进行判断,若检测为异常情况,则向汇聚节点发送预警信号。

(3)簇首对簇内节点在传输周期的初始测量值数据进行投影压缩并向汇聚节点传输,计算簇内节点和簇头节点的能量E。

①簇头能量消耗

Ifd

E=E-Eagg-l*((k+1)Eelec+Efs*d2)*node(c)

Ifd≥d0

E=E-Eagg-l*((k+1)Eelec+Emp*d4)*node(c)

d是簇头节点距离汇聚节点的距离,l是每次传输的数据包长度,node(c)是当前簇内节点总数,Eagg是簇头对数据进行一次投影压缩的所消耗的能量。k是数据压缩比。

② 簇内节点能量消耗

E=E-l*Eelec

4 记录网络节点死亡的情况

IfE=0 node_dead=node_dead+1

If node_dead=1 firstdead_round=r

If node_dead=N*10% teenthdead_round=r

If node_dead=Nalldead_round=r

3 实验分析

本文主要针对大规模传感网的森林温度监测和实时火险探测,实验采用模拟火灾场景。

3.1 采样频率的变化情况

使用MATLAB 2014作为仿真工具,验证本文采用的自适应采样频率算法在实际温度数据下的有效性。实验数据采用美国加州大学伯克利分校在Intel Berkeley Research Lab[17]部署54个无线传感网节点釆集的真实数据中所测得的真实环境数据集。在该传感器网中,每31 s收集一次数据,共有温度,湿度,光照强度和节点电压4种数据类型。实验中只使用数据集中的温度这一项数据。图1为实验所选取其中一节点在2004-02-28日0:00—10:00的温度数据,其变化情况如图1所示。

图1 温度变化曲线

周期P时间长度为5min,最大采样频率Smax为每周期内10次,最小采样频率为每周期内采样2次,贝塞尔曲线的初始参数值k0取0.8,显著性水平a为0.05。每经过一轮时间,节点重新计算新的的采样频率。分别选取m=2,m=3作为一轮的周期数,观察本文自适应算法中采样频率的变化情况,将每周期的采样次数的图表展示如图2、图3所示。

图2 m=2,F值和节点采样次数变化曲线

图3 m=3,F值和节点采样次数变化曲线

从实际的温度曲线变化图中,我们可以直观的观察到本文算法根据信号变化的快慢对采样频率所做的调整。对比于固定的最大采样频率每周期采样十次的情况,本文算法有效地减少了节点采样的次数,节省节点采样能量的同时减少了冗余数据的产生。本文算法还将节点剩余能量考虑进去,在节点剩余能量不多的情况下可以进一步减少采样次数。上面两个图中可以看出本文自适应采样频率的有效性,可以根据信号的变化情况相应的调整数据采样次数,当m=2时,采样频率的改变相比m=3时更加频繁,适用于实时性更高的场合。

3.2 对压缩信号进行重构

使用MATLAB2014作为仿真工具,验证WSN数据相关性的数据源采用二维高斯分布来进行场景模拟。假设事件区域范围大小为200 m×200 m,考虑在该区域内每次随机均匀部署50个、100个、150个传感器节点,研究不同压缩比对重构误差的影响。考虑汇聚节点收集的压缩投影信息具有同构特征,因此这里只考虑所有节点成一个簇的情况。由先验知识可知传感网测得数据在小波空间具有稀疏性,据此本文选取DB1小波基和sym4小波基,使用OMP算法对信号进行重构。图4为不同压缩比下的NMSE对比图,重构采用DB1小波稀疏基。图5为相同条件下用sym4小波基进行重构的NMSE。

图4、图5所示是在WSN节点个数不相同的情况下,分别使用DB1和sym4信号重构原始信号的NMSE随压缩比变化的关系曲线,从图中可以看出,当观测数目增大时,即压缩比增大时,NMSE呈现出逐渐减小的趋势,当观测值接近原数据时,NMSE趋于0,可以精确重构出原始数据。从两图对比中可看出,使用DB1小波基对信号有更好的重构效果。

图4 不同节点数信号重构DB1

图5 不同节点数信号sym4重构

3.3 网络生命周期实验分析

为验证本文方法的对提高网络生存时间的效果,在MATLAB2014平台下进行仿真实验并与未经压缩的数据传输网络进行对比。设置簇首压缩比为0.4。仿真实验设置节点分布区域大小是200m×200m的矩形区域,节点随机分布,汇聚节点位于区域中心,坐标为(100m,100m)。仿真参数设置如表1所示。

表1 网络仿真实验参数设置

本文网络结构是基于LEACH协议上,提出的节点自适应采样频率和数据压缩的节能算法。网络生命周期仿真结果如图6所示。将本文算法与传统LEACH算法和参考文献[2]中提出的ACPSEB-LEACH算法进行对比。

图6 网络生命周期仿真结果

图7 节点剩余能量仿真结果

本文提出的算法根据信号变化的快慢和节点自身剩余能量来调节采样频率从而减少了能量的消耗和冗余数据的产生,均衡网络节点能量。在保证数据精度的条件下对数据进行压缩传输,减少了数据量的传输。从图中可以看出,相比只是单纯通过优化分簇路由协议来降低网络能耗的传统LEACH算法和ACPSEB-LEACH算法,本文算法在降低网络能耗,提升网络生存时间方面的效果更好,显著提高了网络生存周期。

3.4 异常检测有效性

查阅火灾资料,规定火灾报警温度的阈值T为57 ℃,标准差的阈值θ取0.5,选用Intel Berkeley Research Lab中的从2004-02-28日到2004-03-28日期间的真实测量的温度数据。模拟故障方法为节点以不同概率加入大随机噪声。设置网络中节点发生故障的概率分别从0.05到0.5之间变化,比较本文方法和滑动窗口MV和文献[16]中提出的基于LEBD的3种算法的错误警报率。

图8 不同故障概率下错误报警率

从仿真实验结果可以看出,本文提出的SW-LED算法对比于SW(滑动窗口)和LEBD算法,有效的降低了由于节点故障而产生的异常情况误报率。本文方法在节点故障小范围内可以保证很好的精确性,但是节点故障概率大于0.25后,误报率迅速增加。

4 结论

本文提出将节点自适应采样与WSN数据压缩感知结合的方法来减少采集数据的相关性,仿真结果表明本文方法相比于经典路由协议可以有效的减少数据量的采集,在保证数据精度的同时减少数据量的传输。本文提出SW-LED算法来检测异常事件,可以实现较为可靠的网络异常事件检测,减少异常误报率。

[1]张文梅,廖福保. 改进的无线传感网络非均匀分簇路由算法[J]. 传感技术学报,2016,28(5):739-743.

[2]叶继华,王文,江爱文. 一种基于LEACH的异构WSN能量均衡成簇协议[J]. 传感技术学报,2015,28(12):1853-1860.

[3]Carol Habib,Abdallah Makhoul,Rony Darazi. Self-Adaptive Data Collection and Fusion for Health Monitoring Based on Body Sensor Networks[J]. IEEE Transactions on Industrial Informatics,2016,12(6):2342-2352.

[4]Li Shi,Liu Mengyao,Xia Li. WSN Data Fusion Approach Based on Improved BP Algorithm and Clustering Protocol[C]//27th Chinese Control and Decision Conference pages 1450-1454,May 2015.

[5]Shivaprasad Yadav S G. An Energy Aware Framework for Multiple-Zone Data Fusion Technique in WSN[J]. International Journal of Applied Engineering Research,2016,11(4):2263-2270.

[6]吉书强. 基于压缩感知的气象传感网络融合计算研究[D]. 南京:南京信息工程大学,2015.

[7]朱路,刘媛媛,慈白山,等. 多稀疏基分簇压缩感知的WSN数据融合方法[J]. 传感技术学报,2016,29(3):417-42.

[8]王 全,张纳温,张金成,等. 压缩感知在无线传感器网络数据采集中的应用[J]. 传感技术学报,2014,27(11):1562-1567.

[9]陈分雄. 无线传感网中事件检测的压缩感知与异常检测算法研究[D]. 武汉:中国地质大学,2013.

[10]Younis O,Fahmy S,Hee D. A Hybrid,Energy-Efficient Distributed Clustering Approach for Ad-Hoc Sensor Networks[J]. IEEE Trans on Mobile Computing,2004,3(4):660-669.

[11]Laiymani D,Makhoul A. Adaptive Data Collection Approach for Periodic Sensor Networks[C]//9th International Wireless Communications and Mobile Computing Conference,2013:1448-1453.

[12]戴琼海,付长军,季向阳. 压缩感知研究[J]. 计算机学报,2011,34(3):425-434.

[13]Mallat S G,Zhang Zhifeng. Matching Pursuits with Time-Frequency Dictionaries[C]//IEEE Transactions on Signal Processing,1993,41(12):3397-3415.

[14]Khoramian S. An Iterative Thresholding Algorithm for Linear Inverse Problems with Multi-Constraints and Its Applications[J]. Applied and Computational Harmonic Analysis,2012,32(1):109-130.

[15]Fornasier M,Rauhut H. Iterative Thresholding Algorithms[J]. Applied and Computational Harmonic Analysis,2008,25(2):187-208.

[16]Ding M,Chen D,xing K,et al. Localized Fault-Tolerant Event Boundary Detection in Sensor Networks[C]//INFOCOM 2005. 24th Annual Joint Conference of the IEEE Computer and Communications Societies. Proceedings IEEE. IEEE,2005,2:902-913.

[17]Samuel Madden. http://db.csail.mit.edu/labdata/labdata.html.

An Improved WSN Energy Saving Strategy Based on Spatio-TemporalCorrelation and Anomaly Detection*

WANYejing,YEJihua*,JIANGAiwen

(College of Computer Information Engineering,Jiangxi Normal University,Nanchang 330022,China)

In order to reduce the contradiction between the network energy consumption and the accuracy of the data,we consider the spatial and temporal correlation of the data collected by the network and propose an method of adaptive sampling and using compressed sensing. Wireless sensor data compression based on the traditional compressed sensing only sampling data of a few nodes and the incidents detected by those not sampled nodes maybe be ignored. This paper detect all nodes’ data and compress,so it can effectively avoid failure report. According to the characteristics of time correlation,this paper adopts adaptive sampling frequency method based on variance analysis ANOVA(Analysis of Variance)and take nodes’ residual energy into consideration to reduce the smooth signal acquisition and equilibrium the energy consumption of network. On the basis of LEACH protocol,the data of cluster is compressed and transmitted to the Sink node to reduce the overall energy consumption of the network. In order to reduce the failure report caused by the adaptive sampling and traditional compressed sensing method,an improved local event monitoring algorithm sliding window local event monitoring SW-LED(Sliding Window-Local Event Detection)algorithm is proposed,which realizes real-time and accurate anomaly detection and early warning. The experimental results show that this method can effectively balance the nodes’ energy consumption to improve the network lifetime,ensuring the accuracy of the data and the recognition rate of abnormal situation is also greatly improved.

wireless sensor network;spatio-temporal correlation;SW-LED;ANOVA;anomaly identification

万叶晶(1993-),女,江西丰城人,硕士研究生,研究方向为物联网技术;叶继华(1966-),男,江西广丰人,教授,中国计算机学会虚拟现实与可视化专委会委员、中国系统仿真学会数字娱乐仿真专业委员会委员、中国图象图形学学会虚拟现实专委会委员、江西省自动化学会常务理事。研究方向为物联网技术、数据融合、图像处理等,在研国家课程三项,发表学术论文八十余篇,yjhwcL@163.com; 江爱文(1984-),男,江西景德镇人,博士/副教授,研究方向为智能信息处理、图像处理等。

项目来源:国家自然科学基金项目(61462042,61365002);江西师范大学研究生创新基金项目(YJS2016086)

2016-10-20 修改日期:2017-03-30

TP212

A

1004-1699(2017)08-1267-07

C:6150P

10.3969/j.issn.1004-1699.2017.08.023

猜你喜欢
传感重构阈值
《传感技术学报》期刊征订
新型无酶便携式传感平台 两秒内测出果蔬农药残留
视频压缩感知采样率自适应的帧间片匹配重构
长城叙事的重构
小波阈值去噪在深小孔钻削声发射信号处理中的应用
北方大陆 重构未来
IPv6与ZigBee无线传感网互联网关的研究
基于自适应阈值和连通域的隧道裂缝提取
北京的重构与再造
比值遥感蚀变信息提取及阈值确定(插图)