故障诊断就是对网络设备发出告警进行处理,从众多告警中找到故障发生原因和故障节点。在网络故障诊断中,理想告警应包含有关故障五W信息(Who、What、Where、Whe
和why)。由于网络设备对自身以外网络情况了解有限,所以网络设备产生的大部分网络告警只回答了who、what和whe
,而故障诊断要进行where和why推理。另外,告警噪声存在进一步增加故障诊断难度,告警噪声包含告警丢失、延迟、重复和虚假告警等。
(3)故障恢复。故障恢复主要目的是根据识别的故障原因,自动或手动对网络进行控制操作,恢复网络正常运行。2.无线传感器网络故障检测常见方法。(1)集中式方法。集中式方法是无线传感器网络中较常见方法,一般来说是物理或逻辑上处中心位置节点,负责对网络进行监控,追踪失败或可疑节点。由于中心节点负责事务较多,通常都让该节点不受能量限制,能执行大范围故障管理事务。中心节点通常采用周期性主动探测方式发布一些探测包,来获取节点状态信息,对所获信息进行分析,从而确定节点是否失效。采用集中式网络管理,所有网络设备都由一个管理者进行管理。当信息流量不大时,集中式网络管理简单且有效,在失效节点定位方面具高效和准确优点,所以非常适用小型局域网络。在集中式网络管
f理结构下,管理者作为“客户”要完成复杂网络管理任务,同时还须与多个作为“服务器”的代理交换信息。这种结构存在较大缺陷,主要表现为:
一是所有分析和计算任务都集中在中心节点站,造成网络管理瓶颈,中心节点负载过重。由于其余节点信息收集后都发往中心节点,中心节点很可能变成专门用于数据传输节点以满足故障检测和管理需要。随之而来的问题是中心节点所在区域会有大量流量往来,导致区域节点能量消耗急剧增加,越靠近中心节点越如此。二是中心节点站一旦失效,整个网管系统就崩溃了,导致整个系统可靠性偏低。三是集中式结构导致大量原始数据在网络上传输,带来大量额外通信量,占用大量通信带宽,导致网管系统工作效率降低。四是用于监测网络并收集数据代理是预先定义好且功能固定,一旦扩展新功能十分不便,造成系统可扩展性较差。五是远端节点与管理中心间距离较远,且传感器网络中采用多跳通信,两者间信息交互时延过长。
(2)分布式方法。一是节点自检测。节点自检测依赖于节点自身所包含功能进行故障检测,并将检测结果发至管理节点。硬件接口包含几个灵活电路用于检测节点方位和碰撞。软件接口包含几个软件部件,用于采r