所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

ES3000 V3 NVMe PCIe SSD 用户指南 21

本指南针对华为ES3000 V3 NVMe PCIe SSD(以下简称ES3000 V3)进行说明,介绍ES3000 V3产品信息及如何使用ES3000 V3(包括安装配置、操作与维护等)。

评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
SMART 属性

SMART 属性

ES3000 V3支持的SMART属性与NVMe 1.2协议一致,如表A-1所示。

表A-1 SMART属性(Log Identifier 02h)

Bytes

Description

0

Critical Warning: 该域表示控制器状态的重要的告警,bit位设置为1表示有效,可以设置多个bit位有效。重要的告警信息通过异步事件返回给主机端。

Bit

具体描述

0

设置为1时表示冗余空间小于设定的阈值

1

设置为1时表示温度超过或低于一个重要的阈值

2

设置为1时表示由于重要的media错误,器件的可靠性已经降低。

3

设置为1时,该介质已经被置为只读模式。

4

设置为1时,表示控制器的易失性器件fail,该域仅在控制器内部存在易失性器件时有效。

7:5

保留

2:1

Temperature: 表示整个器件的温度,单位为Kelvin ,如果温度超过设定的阈值异步事件会被上报主机。

3

Available Spare: 表示可用冗余空间的百分比(0 到100%)。

4

Available Spare Threshold: 可用冗余空间的阈值,低于该阈值时上报异步事件。

5

Percentage Used: 该值表示用户实际使用和厂家设定的器件寿命的百分比,100表示已经达到厂家预期的寿命,但可能不会失效,可以继续使用。该值允许大于100,高于254的值都会被置为255。

31:6

保留

47:32

Data Units Read: 该值表示主机端从控制器中读走的512字节数目,其中1表示读走1000个512字节,该值不包括metadata。当LBA大小不为512B时,控制器将其转换成512B进行计算。16进制表示。

63:48

Data Units Written: 该值表示主机端写入控制器中的512字节数目,其中1表示读走1000个512字节,该值不包括metadata。当LBA大小不为512B时,控制器将其转换成512B进行计算。16进制表示。

79:64

Host Read Commands: 表示下发到控制器的读命令的个数。

95:80

Host Write Commands: 表示下发到控制器的写命令的个数。

111:96

Controller Busy Time: 表示控制器处理I/O命令的busy时间。从命令下发到SQ到完成命令返回到CQ的整个过程都为busy。该值以分钟为单位。

127:112

Power Cycles: 上下电次数

143:128

Power On Hours: power-on时间小时数,不包括休眠状态时间。

159:144

Unsafe Shutdowns: 异常关机次数,掉电时仍未接收到CC.SHN时该值加1。

175:160

Media Errors: 表示控制器检测到不可恢复的数据完整性错误的次数,其中包括不可纠的ECC错误,CRC错误,LBA tag不匹配。

191:176

Number of Error Information Log Entries: 该域表示控制器生命周期内的错误信息日志的entry数目。

195:192

Warning Composite Temperature Time(不支持)

199:196

Critical Composite Temperature Time(不支持)

201:200

Temperature Sensor 1(控制器):温度传感器1的温度值,单位Kelvin。

203:202

Temperature Sensor 2(不支持):温度传感器2的温度值,单位Kelvin。

205:204

Temperature Sensor 3(不支持):温度传感器3的温度值,单位Kelvin。

207:206

Temperature Sensor 4(不支持):温度传感器4的温度值,单位Kelvin。

209:208

Temperature Sensor 5(不支持):温度传感器5的温度值,单位Kelvin。

211:210

Temperature Sensor 6(不支持):温度传感器6的温度值,单位Kelvin。

213:212

Temperature Sensor 7(不支持):温度传感器7的温度值,单位Kelvin。

215:214

Temperature Sensor 8(不支持):温度传感器8的温度值,单位Kelvin。

511:216

保留

表A-2 自定义SMART属性(Log Identifier C0h)

Bytes

Description

1:0

BUCK电压(单位V)

3:2

当前功耗(单位W)

5:4

历史最高功耗(单位W)

7:6

整盘的历史最高温度(单位Kelvin)

9:8

整盘的过温计数

13:10

整盘的过温时间(单位min)

15:14

控制器的历史最高温度(单位Kelvin)

17:16

控制器的过温计数

21:18

控制器的过温时间(单位min)

23:22

电容容量(单位F)

25:24

电容电压(单位V)

27:26

电容充放电次数

28

电容健康状态

value

具体描述

0h

电容正常

1h

电容失效

FFh~2h

保留

29

保留

33:30

PCIe Refclock PLL Lock 丢失计数

37:34

PCIE端口 0的 CRC错误统计计数

41:38

保留

45:42

控制器内E2E校验检错的计数

47:46

失效CE个数

51:48

总块数

55:52

总坏块数

59:56

新增坏块个数

63:60

总页数

71:64

损失容量大小

75:72

FTL表异常下电重构次数

79:76

FTL表深度重构次数

95:80

读失败计数

111:96

读操作计数

127:112

保留

143:128

写失败计数

159:144

写操作计数

175:160

保留

191:176

擦失败计数

207:192

擦操作计数

215:208

保留

223:216

GC读计数

231:224

BS读计数

235:232

盘片电压(单位mV)

239:236

保留

255:240

保留

271:256

保留

287:272

FLASH RR执行失败计数

303:288

FLASH RR执行计数

319:304

保留

335:320

后台巡检发现数据UNC的计数

351:336

保留

367:352

后台巡检数据量(单位GB)

383:368

当前Pending List中记录的UNC数目

399:384

保留

415:400

保留

419:416

深度重建标志

423:420

保留

427:424

出厂坏块计数1

431:428

出厂坏块计数2

435:432

编程坏块计数

439:436

擦除坏块计数

443:440

UNC坏块计数

447:444

DIE失效坏块计数

451:448

DDR单比特ECC错误计数

459:452

IO写计数

463:460

IO写失败计数

471:464

GC写计数

475:472

GC写失败计数

483:476

读纠错计数1

491:484

读纠错计数2

499:492

读纠错计数3

507:500

读纠错计数4

515:508

读纠错计数5

519:516

读纠错计数6

527:520

GC读数据量(单位GB)

531:528

强制数据搬移计数

535:532

内存出错计数

539:536

Free Block Num 1

543:540

Free Block Num 2

547:544

Free Block Num 3

551:548

Free Block Num 4

555:552

Free Block Num 5

559:556

Free Block Num 6

563:560

Free Block Num 7

567:564

Free Block Num 8

571:568

平均磨损次数

575:572

最大磨损次数

583:576

读纠错计数7

587:584

当前系统时间,单位秒(1970-1-1到现在的秒数)

595:588

固件版本信息1

603:596

固件版本信息2

635:604

固件编译时间

643:636

详细告警1

Bit

具体描述

0

固件bootloader出错

1

存储的固件失效

2

备电模块检测异常

3

备电模块检测异常

4

可用空间不足

5

寿命告警

6

温度告警

7

存储单元失效

63:8

保留

651:644

详细告警2

Bit

具体描述

0

快速格式化失败(Secure Erase Settings=0)

1

安全格式化失败(Secure Erase Settings=1)

2

重建失败1

3

重建失败2

4

重建失败3

5

重建失败4

6

重建失败5

7

上电自检失败1

8

上电自检失败2

9

上电自检失败3

10

上电自检失败4

11

内部错误1

12

内部错误2

13

内部错误3

14

内部错误4

15

备电模块检测异常

16

保留

17

内部错误5

18

内部错误6

19

内部错误7

20

内部错误8

21

内部错误9

22

内部错误10

23

内部错误11

24

内部错误12

25

重建失败6

26

内部错误13

27

内部错误14

28

备电模块巡检异常

29

IO读失败

30

IO写失败

31

固件bootloader出错

32

存储的固件失效

33

深度重建完成进入只读模式

63:34

保留

659:652

告警历史值:BIT位定义同643:636

667:660

异常历史值:BIT位定义同651:644

671:668

Port0 Cold Reset计数

675:672

保留

679:676

Port0 Warm Reset计数

683:680

保留

687:684

Port0 Hot Reset计数

691:688

保留

695:692

Port0 Function Reset计数

699:696

保留

703:700

Port0 SubSystem Reset计数

707:704

保留

711:708

Port0 Controller Reset计数

715:712

保留

719:716

Port0 Symbol Unlock计数

723:720

保留

727:724

当前的功耗级别

731:728

显示各个Slot固件健康状态

Bit

具体描述

0

保留

1

Slot1的固件健康状态

2

Slot2的固件健康状态

3

Slot3的固件健康状态

31:4

保留

表A-3 自定义SMART属性(Log Identifier CAh)

Bytes

Description

0

Program Fail Count

2:1

保留

3

Normalized Value (Program Fail)

4

保留

10:5

Current Raw Value (Program Fail)

11

保留

12

Erase_Fail_Count

14:13

保留

15

Normalized Value (Erase_Fail_Count)

16

保留

22:17

Current Raw Value (Erase_Fail_Count)

23

保留

24

Wear Leveling Count

26:25

保留

27

Normalized Value (Wear Leveling)

28

保留

34:29

Current Raw Value (Wear Leveling)

35

保留

36

End To End Error Detection Count

38:37

保留

39

Normalized Value (End To End Error Detection)

40

保留

46:41

Current Raw Value (End To End Error Detection)

47

保留

48

CRC Error Count

50:49

保留

51

Normalized Value (CRC Error)

52

保留

58:53

Current Raw Value (CRC Error)

59

保留

60

Timed Workload Media Wear Count

62:61

保留

63

Normalized Value (Timed Workload Media Wear)

64

保留

70:65

Current Raw Value (Timed Workload Media Wear)

71

保留

72

Timed Workload Host Reads Count

74:73

保留

75

Normalized Value (Timed Workload Host Reads)

76

保留

82:77

Current Raw Value (Timed Workload Host Reads)

83

保留

84

Timed Workload Timer Count

86:85

保留

87

Normalized Value (Timed Workload Timer)

88

保留

94:89

Current Raw Value (Timed Workload Timer)

95

保留

96

Thermal Throttle Status Count

98:97

保留

99

Normalized Value (Thermal Throttle Status)

100

保留

106:101

Current Raw Value (Thermal Throttle Status)

107

保留

108

Retry Buffer Overflow Count

110:109

保留

111

Normalized Value (Retry Buffer Overflow)

112

保留

118:113

Current Raw Value (Retry Buffer Overflow)

119

保留

120

Pll Lock Loss Count

122:121

保留

123

Normalized Value (Pll Lock Loss)

124

保留

130:125

Current Raw Value (Pll Lock Loss)

131

保留

132

Nand Bytes Written Count

134:133

保留

135

Normalized Value (Nand Bytes Written)

136

保留

142:137

Current Raw Value (Nand Bytes Written)

143

保留

144

Host Bytes Written Count

146:145

保留

147

Normalized Value(Host Bytes Written)

148

保留

154:149

Current Raw Value (Host Bytes Written)

155

保留

翻译
下载文档
更新时间:2019-11-22

文档编号:EDOC1000101090

浏览量:86110

下载量:3046

平均得分:
本文档适用于这些产品

相关版本

相关文档

Share
上一页 下一页