实战案例:链路不稳定导致 OSPF 邻居振荡,路由反复收敛该如何解决?

本期分享的案例是弱电安防的相关问题。

背景介绍

某网络环境中,DeviceA与DeviceB两台某W设备通过100GE接口直连,建立了OSPF邻居关系。近期网络中出现OSPF邻居频繁振荡的情况,导致路由反复收敛,业务流量转发受到严重影响。

组网结构如下:

经基础检查发现:

网络中无相关告警信息业务故障时段与OSPF邻居状态变化时间高度吻合处理思路

针对OSPF邻居振荡问题,通常需从链路状态、协议配置、设备硬件三个维度排查,处理思路如下:

检查设备日志中OSPF邻居状态变化记录及原因分析物理链路的UP/DOWN情况排查光模块、光纤等硬件是否存在异常排查分析

第一步:查看DeviceA的OSPF日志

执行display logbuffer命令后,发现故障时段存在大量OSPF邻居DOWN的记录:

所有记录显示邻居DOWN的原因均为收到1-way hello报文。

第二步:同步核查DeviceB的日志

在相同时间点,DeviceB同样有OSPF邻居DOWN的记录:

其中明确提到主要原因为“Physical Interface State Change”(物理接口状态变化)。

第三步:验证物理接口状态

进一步查看DeviceB的物理接口日志,发现存在频繁的UP/DOWN记录:

由此确认,接口状态的不稳定导致了OSPF邻居的反复振荡:接口DOWN时邻居关系中断,接口UP后重新协商建立,进而引发对端设备的邻居状态也随之变化。

原理及解决方案

故障原因:光纤或光模块异常导致链路频繁UP/DOWN,使得OSPF邻居状态反复变化。当接口DOWN时,OSPF邻居关系中断;接口恢复UP后,设备重新发送HELLO报文进行协商,对端收到报文后会重置邻居状态,从而形成振荡。

解决方案:更换异常的光纤或光模块,恢复链路稳定性。

THE END