所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

ES3000 V3 NVMe PCIe SSD 用户指南 20

本指南针对华为ES3000 V3 NVMe PCIe SSD(以下简称ES3000 V3)进行说明,介绍ES3000 V3产品信息及如何使用ES3000 V3(包括安装配置、操作与维护等)。
评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
SMART属性

SMART属性

ES3000 V3支持的SMART属性与NVMe 1.2协议一致,如表A-1所示。

表A-1  SMART属性(Log Identifier 02h)
Bytes Description
0 Critical Warning: 该域表示控制器状态的重要的告警,bit位设置为1表示有效,可以设置多个bit位有效。重要的告警信息通过异步事件返回给主机端。
Bit 具体描述
0 设置为1时表示冗余空间小于设定的阈值
1 设置为1时表示温度超过或低于一个重要的阈值
2 设置为1时表示由于重要的media错误,器件的可靠性已经降低。
3 设置为1时,该介质已经被置为只读模式。
4 设置为1时,表示控制器的易失性器件fail,该域仅在控制器内部存在易失性器件时有效。
7:5 保留
2:1 Temperature: 表示整个器件的温度,单位为Kelvin ,如果温度超过设定的阈值异步事件会被上报主机。
3 Available Spare: 表示可用冗余空间的百分比(0 到100%)。
4 Available Spare Threshold: 可用冗余空间的阈值,低于该阈值时上报异步事件。
5 Percentage Used: 该值表示用户实际使用和厂家设定的器件寿命的百分比,100表示已经达到厂家预期的寿命,但可能不会失效,可以继续使用。该值允许大于100,高于254的值都会被置为255。
31:6 保留
47:32 Data Units Read: 该值表示主机端从控制器中读走的512字节数目,其中1表示读走1000个512字节,该值不包括metadata。当LBA大小不为512B时,控制器将其转换成512B进行计算。16进制表示。
63:48 Data Units Written: 该值表示主机端写入控制器中的512字节数目,其中1表示读走1000个512字节,该值不包括metadata。当LBA大小不为512B时,控制器将其转换成512B进行计算。16进制表示。
79:64 Host Read Commands: 表示下发到控制器的读命令的个数。
95:80 Host Write Commands: 表示下发到控制器的写命令的个数。
111:96 Controller Busy Time: 表示控制器处理I/O命令的busy时间。从命令下发到SQ到完成命令返回到CQ的整个过程都为busy。该值以分钟为单位。
127:112 Power Cycles: 上下电次数
143:128 Power On Hours: power-on时间小时数,不包括休眠状态时间。
159:144 Unsafe Shutdowns: 异常关机次数,掉电时仍未接收到CC.SHN时该值加1。
175:160 Media Errors: 表示控制器检测到不可恢复的数据完整性错误的次数,其中包括不可纠的ECC错误,CRC错误,LBA tag不匹配。
191:176 Number of Error Information Log Entries: 该域表示控制器生命周期内的错误信息日志的entry数目。
195:192 Warning Composite Temperature Time(不支持)
199:196 Critical Composite Temperature Time(不支持)
201:200 Temperature Sensor 1(控制器):温度传感器1的温度值,单位Kelvin。
203:202 Temperature Sensor 2(不支持):温度传感器2的温度值,单位Kelvin。
205:204 Temperature Sensor 3(不支持):温度传感器3的温度值,单位Kelvin。
207:206 Temperature Sensor 4(不支持):温度传感器4的温度值,单位Kelvin。
209:208 Temperature Sensor 5(不支持):温度传感器5的温度值,单位Kelvin。
211:210 Temperature Sensor 6(不支持):温度传感器6的温度值,单位Kelvin。
213:212 Temperature Sensor 7(不支持):温度传感器7的温度值,单位Kelvin。
215:214 Temperature Sensor 8(不支持):温度传感器8的温度值,单位Kelvin。
511:216 保留
表A-2  自定义SMART属性(Log Identifier C0h)
Bytes Description
1:0 BUCK电压(单位V)
3:2 当前功耗(单位W)
5:4 历史最高功耗(单位W)
7:6 整盘的历史最高温度(单位Kelvin)
9:8 整盘的过温计数
13:10 整盘的过温时间(单位min)
15:14 控制器的历史最高温度(单位Kelvin)
17:16 控制器的过温计数
21:18 控制器的过温时间(单位min)
23:22 电容容量(单位F)
25:24 电容电压(单位V)
27:26 电容充放电次数
28 电容健康状态
value 具体描述
0h 电容正常
1h 电容失效
FFh~2h 保留
29 保留
33:30 PCIe Refclock PLL Lock 丢失计数
37:34 PCIE端口 0的 CRC错误统计计数
41:38 保留
45:42 控制器内E2E校验检错的计数
47:46 失效CE个数
51:48 总块数
55:52 总坏块数
59:56 新增坏块个数
63:60 总页数
71:64 损失容量大小
75:72 FTL表异常下电重构次数
79:76 FTL表深度重构次数
95:80 读失败计数
111:96 读操作计数
127:112 保留
143:128 写失败计数
159:144 写操作计数
175:160 保留
191:176 擦失败计数
207:192 擦操作计数
215:208 保留
223:216 GC读计数
231:224 BS读计数
235:232 盘片电压(单位mV)
239:236 保留
255:240 保留
271:256 保留
287:272 FLASH RR执行失败计数
303:288 FLASH RR执行计数
319:304 保留
335:320 后台巡检发现数据UNC的计数
351:336 保留
367:352 后台巡检数据量(单位GB)
383:368 当前Pending List中记录的UNC数目
399:384 保留
415:400 保留
419:416 深度重建标志
423:420 保留
427:424 出厂坏块计数1
431:428 出厂坏块计数2
435:432 编程坏块计数
439:436 擦除坏块计数
443:440 UNC坏块计数
447:444 DIE失效坏块计数
451:448 DDR单比特ECC错误计数
459:452 IO写计数
463:460 IO写失败计数
471:464 GC写计数
475:472 GC写失败计数
483:476 读纠错计数1
491:484 读纠错计数2
499:492 读纠错计数3
507:500 读纠错计数4
515:508 读纠错计数5
519:516 读纠错计数6
527:520 GC读数据量(单位GB)
531:528 强制数据搬移计数
535:532 内存出错计数
539:536 Free Block Num 1
543:540 Free Block Num 2
547:544 Free Block Num 3
551:548 Free Block Num 4
555:552 Free Block Num 5
559:556 Free Block Num 6
563:560 Free Block Num 7
567:564 Free Block Num 8
571:568 平均磨损次数
575:572 最大磨损次数
583:576 读纠错计数7
587:584 当前系统时间,单位秒(1970-1-1到现在的秒数)
595:588 固件版本信息1
603:596 固件版本信息2
635:604 固件编译时间
643:636 详细告警1
Bit 具体描述
0 固件bootloader出错
1 存储的固件失效
2 备电模块检测异常
3 备电模块检测异常
4 可用空间不足
5 寿命告警
6 温度告警
7 存储单元失效
63:8 保留
651:644 详细告警2
Bit 具体描述
0 快速格式化失败(Secure Erase Settings=0)
1 安全格式化失败(Secure Erase Settings=1)
2 重建失败1
3 重建失败2
4 重建失败3
5 重建失败4
6 重建失败5
7 上电自检失败1
8 上电自检失败2
9 上电自检失败3
10 上电自检失败4
11 内部错误1
12 内部错误2
13 内部错误3
14 内部错误4
15 备电模块检测异常
16 保留
17 内部错误5
18 内部错误6
19 内部错误7
20 内部错误8
21 内部错误9
22 内部错误10
23 内部错误11
24 内部错误12
25 重建失败6
26 内部错误13
27 内部错误14
28 备电模块巡检异常
29 IO读失败
30 IO写失败
31 固件bootloader出错
32 存储的固件失效
33 深度重建完成进入只读模式
63:34 保留
659:652 告警历史值:BIT位定义同643:636
667:660 异常历史值:BIT位定义同651:644
671:668 Port0 Cold Reset计数
675:672 保留
679:676 Port0 Warm Reset计数
683:680 保留
687:684 Port0 Hot Reset计数
691:688 保留
695:692 Port0 Function Reset计数
699:696 保留
703:700 Port0 SubSystem Reset计数
707:704 保留
711:708 Port0 Controller Reset计数
715:712 保留
719:716 Port0 Symbol Unlock计数
723:720 保留
727:724 当前的功耗级别
731:728 显示各个Slot固件健康状态
Bit 具体描述
0 保留
1 Slot1的固件健康状态
2 Slot2的固件健康状态
3 Slot3的固件健康状态
31:4 保留
表A-3  自定义SMART属性(Log Identifier CAh)
Bytes Description
0 Program Fail Count
2:1 保留
3 Normalized Value (Program Fail)
4 保留
10:5 Current Raw Value (Program Fail)
11 保留
12 Erase_Fail_Count
14:13 保留
15 Normalized Value (Erase_Fail_Count)
16 保留
22:17 Current Raw Value (Erase_Fail_Count)
23 保留
24 Wear Leveling Count
26:25 保留
27 Normalized Value (Wear Leveling)
28 保留
34:29 Current Raw Value (Wear Leveling)
35 保留
36 End To End Error Detection Count
38:37 保留
39 Normalized Value (End To End Error Detection)
40 保留
46:41 Current Raw Value (End To End Error Detection)
47 保留
48 CRC Error Count
50:49 保留
51 Normalized Value (CRC Error)
52 保留
58:53 Current Raw Value (CRC Error)
59 保留
60 Timed Workload Media Wear Count
62:61 保留
63 Normalized Value (Timed Workload Media Wear)
64 保留
70:65 Current Raw Value (Timed Workload Media Wear)
71 保留
72 Timed Workload Host Reads Count
74:73 保留
75 Normalized Value (Timed Workload Host Reads)
76 保留
82:77 Current Raw Value (Timed Workload Host Reads)
83 保留
84 Timed Workload Timer Count
86:85 保留
87 Normalized Value (Timed Workload Timer)
88 保留
94:89 Current Raw Value (Timed Workload Timer)
95 保留
96 Thermal Throttle Status Count
98:97 保留
99 Normalized Value (Thermal Throttle Status)
100 保留
106:101 Current Raw Value (Thermal Throttle Status)
107 保留
108 Retry Buffer Overflow Count
110:109 保留
111 Normalized Value (Retry Buffer Overflow)
112 保留
118:113 Current Raw Value (Retry Buffer Overflow)
119 保留
120 Pll Lock Loss Count
122:121 保留
123 Normalized Value (Pll Lock Loss)
124 保留
130:125 Current Raw Value (Pll Lock Loss)
131 保留
132 Nand Bytes Written Count
134:133 保留
135 Normalized Value (Nand Bytes Written)
136 保留
142:137 Current Raw Value (Nand Bytes Written)
143 保留
144 Host Bytes Written Count
146:145 保留
147 Normalized Value(Host Bytes Written)
148 保留
154:149 Current Raw Value (Host Bytes Written)
155 保留
翻译
下载文档
更新时间:2019-03-12

文档编号:EDOC1000101090

浏览量:55469

下载量:2762

平均得分:
本文档适用于这些产品
相关文档
相关版本
分享
上一页 下一页