实战案例:某楼宇网络改造后,高峰期很多终端DHCP拿不到IP?原因竟是它!太常见了

本期分享的案例是有线网络的相关问题。

问题背景

客户是一家专做弱电项目的集成商,近期承接了某园区网的改造项目,主要目的在于提升网络可靠性,保证业务不间断,路由交换设备为某W。改进具体措施是:

原来单台出口路由改成双机热备并部署BFD;核心采用堆叠交换机替代原有的汇聚交换机,作为VLAN网关和DHCP服务器;核心和汇聚交换机之间做端口聚合eth-trunk接口。

基本拓扑如下:

问题描述

但某楼宇改造变更后,上班高峰期总有用户不到自动获取IP地址或者很艰难才拿到IP,在某获取失败的电脑上抓包和查看网卡信息如下:

下面我们一起看下该问题如何排查~

排查分析

第一步:确认核心交换机DHCP收发包是否正常

首先查看核心交换机对应的接口是否正常收到了客户端的DHCP请求并做offer响应,通过报文分析来看:每个上来交给核心交换机的DHCP请求(DHCP discovery)核心都会回,但是诊断发现获取不到IP的电脑的请求并没有交给核心交换机,也就是说,可能在下联设备上丢包了。

第二步:确认总吞吐量无法跑满2Gbps问题

检查汇聚交换机的端口,发现有大量丢弃报文,报文头分析发现丢弃的都是discovery、offer这种广播报文。

第三步:配置检查

检查该端口配置,发现有广播抑制的配置:

复制
broadcast-suppression packets 1001.

表示每秒可转发的广播包最大100个,删除此配置或者将值改大,问题解决。

解决方案

(1) 根本原因

由于DHCP协议工作流程,如下图所示:

第一阶段DHCP DISCOVER报文是客户机通过广播来发现可用的DHCP服务器,因此客户机较多情况下,端口配置的广播抑制可能会影响用户自动获取IP地址。

(2) 建议与总结

获取DHCP地址困难的故障可能与端口配置的广播抑制相关。部署业务时,应合理设置端口广播抑制值,具体取值应根据业务实际情况观察并调整,以不影响业务的下限为好。

THE END
本站服务器由亿华云赞助提供-企业级高防云服务器