8011 IPC通道异常问题处理

发布时间:  2012-07-27 浏览次数:  187 下载次数:  5
问题描述
NE40 NE80 IPC通道异常以下几种情况:
1.所有单板注册不上;
2.个别单板注册不上;
3.单板全部注册正常,业务正常,但是使用命令:dis communication-channel时,IPC_A异常/IPC_B异常,或者IPC_A和IPC_B同时异常;
比如:
<Quidway>disp comm
System channel information:
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
  Slot#     Curr-Chan/Status    Slave-Chan/Status   Switch number
  2         IPC_B/Normal        IPC_A/Normal            3
  3         IPC_B/Normal        IPC_A/Abnormal          5
  4         IPC_B/Normal        IPC_A/Normal            5
  18        IPC_A/Normal        IPC_B/Normal            0
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
上面环境中显示3号lpu板的IPC_A通道不通。
告警信息

处理过程
1.通过HUB复位解决(具体请参考附件,解决办法分为NE40/NE80 双主控/单主控 单通道故障/两个通道同时故障。参考指导处理时,一定要选对产品类型/单主控还是双主控/单通道故障还是两个通道都故障)
2.彻底解决这个问题的版本是VRP3.10-232702
根因
  ne80/ne40采用分布式操作系统。主控板(指mpu和sru,下同)通过IPC通道和各单板(指lpu,nat,spu等,下同)进行通信完成协议处理和系统管理的功能。该通道在物理上是以以太HUB的形式实现的:主控板和单板内部各有两个以太端口,分别接在两块主控的hub模块上面。两个以太通道互为备份,确保系统的可靠性。
由于hub模块采用的intel芯片存在bug,使得hub的端口有可能与单板的端口link不上。如果系统是单主控板,主控板和单板之间IPC通道无法建立,主控板和单板之间无法通信;如果系统是双主控,若是hub与单板的两个端口都没有link上,单板将无法和主控板通信,若是hub与单板的一个端口link成功,与另外一个 link不成功,单板和主控之间通信正常,业务也不受影响,但是存在潜在的问题:如果link成功的端口突然因某种原因不通的话,单板将无法与主控通信,会被复位,业务中断。
建议与总结
1.如果发生IPC通道异常问题,请先复位解决;
2.建议后续通过升级版本彻底解决。

END