本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>
发布时间: 2020-09-19 | 浏览次数: 994 | 下载次数: 0 | 作者: mWX465820 | 文档编号: EKB1100055881
硬件配置:TaiShan200 2280服务器配置1张1822网卡接在IO模组3上面
问题现象:单板重启后系统侧无法找到1822网卡
关键过程:
1、系统侧可以查询到1822网卡芯片但是无法找到1822的网口:
2、收集1822网卡日志发现单板重启时,网卡未收到复位信号导致系统启动后无法正常工作;
3、查看网卡在复位前就已经产生报错;
4、lspci -tv查看1822网卡对应的PCIe bus号为80:08,FDM记录到PCIe设备报错非1822网卡异常;
5、在单板重启时,反复查询CPLD寄存器,发现CPLD有产生对应的复位信号,Riser1和Riser2的复位信号做到一起;Riser3的复位信号独立,但是复位条件
和Riser1、Riser2一致,因此检测到Riser1、Riser2复位,Riser3的1822网卡也产生了复位信号;
6、重启服务器过程中,CPLD先发送复位信号到主机,主机侧关闭PCIE链路,芯片检测到PCIE linkdown信号后开始走初始化流程,初始化过程中up会屏蔽CPLD发到1822的复位信号,初始化流程大约需要500~800ms。
7、微码在处理网络侧报文的时候,需要访问主机侧资源。由于PCIE链路已关闭导致访问主机资源失败,芯片出现严重异常(需要复位1822芯片才能解决)。
8、由于1描述的原因,芯片没有复位,芯片严重异常无法恢复,主机重启后驱动加载时检测到芯片处于异常状态,驱动加载失败。
1822网卡状态异常
结论:1822网卡FW 问题
解决方案:
1、1822固件修改流程,在PCIE linkdown处理中不屏蔽复位信号
2、CPLD对riser3进行识别,如果是PCIE卡则增加一次复位动作
3、ARM上复位信号延时时间做精准化处理