实战案例:某楼宇网络改造后,高峰期很多终端DHCP拿不到IP?原因竟是它!太常见了
本期分享的案例是有线网络的相关问题。
客户是一家专做弱电项目的集成商,近期承接了某园区网的改造项目,主要目的在于提升网络可靠性,保证业务不间断,路由交换设备为某W。改进具体措施是:
原来单台出口路由改成双机热备并部署BFD;核心采用堆叠交换机替代原有的汇聚交换机,作为VLAN网关和DHCP服务器;核心和汇聚交换机之间做端口聚合eth-trunk接口。基本拓扑如下:
但某楼宇改造变更后,上班高峰期总有用户不到自动获取IP地址或者很艰难才拿到IP,在某获取失败的电脑上抓包和查看网卡信息如下:
下面我们一起看下该问题如何排查~
排查分析第一步:确认核心交换机DHCP收发包是否正常
首先查看核心交换机对应的接口是否正常收到了客户端的DHCP请求并做offer响应,通过报文分析来看:每个上来交给核心交换机的DHCP请求(DHCP discovery)核心都会回,但是诊断发现获取不到IP的电脑的请求并没有交给核心交换机,也就是说,可能在下联设备上丢包了。
第二步:确认总吞吐量无法跑满2Gbps问题
检查汇聚交换机的端口,发现有大量丢弃报文,报文头分析发现丢弃的都是discovery、offer这种广播报文。
第三步:配置检查
检查该端口配置,发现有广播抑制的配置:
复制
broadcast-suppression packets 1001.
表示每秒可转发的广播包最大100个,删除此配置或者将值改大,问题解决。
解决方案(1) 根本原因
由于DHCP协议工作流程,如下图所示:
第一阶段DHCP DISCOVER报文是客户机通过广播来发现可用的DHCP服务器,因此客户机较多情况下,端口配置的广播抑制可能会影响用户自动获取IP地址。
(2) 建议与总结
获取DHCP地址困难的故障可能与端口配置的广播抑制相关。部署业务时,应合理设置端口广播抑制值,具体取值应根据业务实际情况观察并调整,以不影响业务的下限为好。
THE END