S9700核心交换机替换思科交换机,业务中断

发布时间:  2014-08-07 浏览次数:  878 下载次数:  0
问题描述
该CISCO 6000交换机作为网络中的核心交换机,下带12台接入交换机,其中11台接入交换机是连接PC用户电脑,1台接入交换机连接多台服务器。 CISCO 6000交换机上连1台出口路由器。业务并不复杂,CISCO 6000划分为多个VLAN,每个VLANif虚接口中起IP地址作为网关地址。各个网段的PC和服务器通过CISCO 6000交换机交互报文。所有路由为直连路由,有一条到路由器的默认路由,华为S9700替换CISCO 6000后,测试业务发现PC机无法访问服务器,查询IP地址,发现分别属于不同的IP地址段,不同的VLAN区域,这都是正常的,但业务中断。
告警信息
处理过程
1、 检查S9700交换机stp状态,发现所有端口都处于FORWDING转发状态,排除STP问题。
2、 检查路由表,直连路由都存在,用两台电脑连接S9700交换机,连接在不同的VLAN接口和不同的网段,网关都指向交换机,能互相PING通,排除交换机报文转发问题。
3、 查询MAC地址,各个接入交换机的MAC地址也能学习到,排除MAC地址问题。
到此,故障分析陷入僵局。
后经过详细测试,发现PC机访问外网环境正常,也就是,通过路由器的报文正常,只是服务器和PC之间的报文无法互相访问。至此怀疑服务器和部分PC机器掩码设置存在问题,PC机访问服务器的报文根本就没送到网关(S9700)上。
4、查询SEVER和pc的IP地址设置,发现掩码为 255.255.0.0   而S9700交换机上各个网关IP地址设置为: 10.1.X.0   255.255.255.0   到此问题找到原因。
  由于IP地址设置为16位掩码,PC访问SERVER的报文直接ARP寻址,而不是送到交换机网关来处理。
上网登陆思科官网,查询CISCO 6000交换机默认配置,发现CISCO 6000交换机默认开启ARP代理功能,这就是为什么思科交换机可以业务正常,而S9700交换机割接后业务中断,而无告警。
5、修改s9700交换机配置,在各个VLANIF虚接口下起:arp-proxy enable,再测试业务正常。
根因
1、可能是交换机端口处于中断状态,stp协议造成的环路问题。
2、可能是交换机路由没有学到,检查路由表。
3、可能是MAC地址没有学到,二层转发就不通。
建议与总结
华为设备割接思科设备,不单单要注意命令脚本的翻译,本案例在命令翻译无误的前提下,出现了业务中断,对思科设备隐形命令的了解,也往往决定了割接的顺利和成败。而作为华为工程师,往往对思科设备缺乏了解,在意外发生时候缺乏准备和应对措施。
割接替换其他厂商设备时候,能求助其他厂商工程师沟通一下注意点。

END