FAQ-FC链路闪断如何处理

发布时间:  2014-10-15 浏览次数:  278 下载次数:  0
问题描述
FC链路闪断如何处理?
解决方案
FC链路连接状态变化时,从日志中能看到大量的存储系统与主机(或存储系统与交换机)连接相关的打印信息,可以通过信息发现是否存在闪断等异常情况,并进一步确认闪断是由主机端还是存储系统端引起。如果是主机端引起,需要重点排查主机到交换机的链路,如果是存储端引起的,需要重点排查存储到交换机的链路,以下是存储系统与主机和交换机建立连接的过程:

1. 存储系统与主机建立连接的过程



说明:

PLOGI是建立FC2层连接的命令,PRLI是建立FC4层连接的命令。与主机0x00010b00建立好FC4层连接后,驱动会上报端口的Linkup事件,通知上层。

2. 存储系统与交换机建立连接的过程



说明:

FLOGI 、PLOGI 、RFT_ID 、RFT_ID 、RFF_ID 、SCR一系列的命令是存储系统向交换机注册的过程,其中0x000000d4为存储系统的PortID,0x22fffffe为交换机的PortID。完成与交换机的注册过程之后,存储系统才能与主机建立连接。

3. 存储系统上报Linkup事件



说明:

存储系统和主机/交换机建立连接后,会上报Linkup事件。

4. 存储系统上报Linkdown事件



说明:

存储系统于主机/交换机连接断开,存储系统中会有TGT_LinkDown的打印,需要进一步断开的原因

5. FC网络节点变化

在交换机组网中,当网络中有节点的连接状态发生变化时,交换机会发送RSCN帧通知同一个域中的其它节点。存储系统侧收到RSCN,表明有与交换机相连接的主机或存储系统的连接断开,或有新的节点接入交换机。



说明:

节点0x000101d4的连接状态发生变化,交换机向存储系统发送RSCN,存储系统发送GPN_ID向交换机查询0x000101d4节点是否还存在。存储系统收到CT_RJT表明0x000101d4节点已经不存在,再删除与它的连接资源。

END