广播风暴解决办法

日期:2013-09-04点击次数:18288

         在以太网技术中,广播一直是一把双刃剑,当我们利用得当,广播会给我们网络带来益处,但广播如果得不到很好的控制,将会给我们网络造成灾难性的损失。

        结构描述:客户单位网络被设计成一个典型的三层星型结构,核心层由两台Cisco路由器做了HSRP热备份,每一个分公司对应一台汇聚交换机并配置相应VLAN 进行区分,所有应用服务器由服务器汇聚交换机连接到核心设备中。

       故障描述:下午下班后,接到下属分公司故障电话,在电话中,分公司人员描述,该分公司网络无法连接所有应用服务器,在连续ping状态下,延迟超过1000ms,甚至出现严重掉包情况,在接到故障电话后,技术人员在自己电脑上检查各应用服务器状态,发现服务器并没有出现任何问题,因此判断问题出现在分公司内部,技术人员通过telnet 连接到分公司所在的汇聚交换上,查看当前交换机利用情况发现交换机CPU 1分钟负载达到95% 5分钟负载达到98%,因此判断是由于交换机负载过重,造成数据转发能力下降,但以前从未有过这种情况的出现,通过对连接到交换机上的所有端口进行仔细查看后发现,其中有一个端口利用率达到97%,在详细描述中,广播包每秒达到10000个以上,因此可以判断是由于该端口广播包数量异常增加造成交换机CPU负载过重,转发能力下降的主要原因。

        解决办法:首先技术人员对端口进行广播抑制,每秒钟通过广播包数量为10,通过控制后,再次查看交换CPU利用率,发现CPU 下降至5%,受影响的其它网络也恢复正常,再次致电到分公司联系人员,告知故障出现的原因,同时让他检查接入交换机网线连接情况,发现其中一根网线两端同时接入到交换机
中,在拔掉后网线后技术人员将配置在端口的广播抑制取消后,交换机CPU再没有出现负载过重现像,同时所有网络恢复正常。

        心得体会:当我们接到故障电话后,一定要认真听取对方的故障描述,冷静思考,分析出现可能出现问题的原因,当我们解决故障后,一定要认真总结,避免下次出现相同问题。






                                                                                                                                                                              总公司   系统集成部