所选语种没有对应资源,请选择:

本站点使用Cookies,继续浏览表示您同意我们使用Cookies。Cookies和隐私政策>

提示

尊敬的用户,您的IE浏览器版本过低,为获取更好的浏览体验,请升级您的IE浏览器。

升级

OceanStor 18500 V3&18800 V3 高端存储系统 V300R003 基础存储业务指南(文件业务) 16

本文档从基本概念、配置和管理等方面分别介绍了基础存储业务的具体配置过程。
评分并提供意见反馈 :
华为采用机器翻译与人工审校相结合的方式将此文档翻译成不同语言,希望能帮助您更容易理解此文档的内容。 请注意:即使是最好的机器翻译,其准确度也不及专业翻译人员的水平。 华为对于翻译的准确性不承担任何责任,并建议您参考英文文档(已提供链接)。
基础存储原理

基础存储原理

存储系统为应用服务器提供存储空间。18500 V3/18800 V3存储系统采用了块虚拟化技术,实现了存储池中资源的动态分配和扩展,提升了存储池中数据的读写响应速度,缩短了硬盘故障后的重构时间。

基本概念

在了解基础存储原理前,您需要先了解一些基本概念。

  • 硬盘域:硬盘域是由多块相同或不同类型的硬盘组合而成,不同的硬盘域间相互隔离。将不同的业务承载到不同硬盘域中,隔离了业务之间的性能影响和故障影响。
  • 存储池:存储池是存放存储空间资源的容器,所有应用服务器使用的存储空间都来自于存储池。存储池根据存储介质的不同,可以划分为3个存储层,分别是高性能层、性能层和容量层。
  • 存储层:存储池中相同性能的存储介质集合,用于管理不同性能的存储介质,以便为不同性能要求的应用提供不同存储空间。
  • CHUNK:硬盘上划分的连续的固定大小的物理空间,简写为CK。
  • CHUNK Group:由不同硬盘的CK组成的逻辑集合。CHUNK Group具有RAID属性,简写为CKG。
  • 块虚拟化:一种新型RAID技术。该技术将硬盘划分成若干固定大小的块(CHUNK),然后将其组合成若干个RAID组。当某一硬盘失效时,系统中所有与失效硬盘中CHUNK在同一CKG下的CHUNK所在的硬盘都参与重构,大大增加了参与重构的硬盘的数量,从而消除传统RAID组的重构性能瓶颈,提高了数据重构的速度。块虚拟化技术将数据分布到系统所有硬盘,充分发挥系统的读写处理能力。
  • Extent:Extent是在CKG基础上划分的固定大小的逻辑存储空间,大小可调,范围为512KB~64MB,默认为4MB,是热点数据统计和迁移的最小单元(数据迁移粒度),也是存储池中申请空间、释放空间的最小单位。
  • Grain:在文件系统模式下,Extent按照4KB到64KB的变长大小被进一步划分为更细粒度的Grain,默认为64KB,Grain是组成文件系统的基本单元。
  • 热备空间:块虚拟化技术中用于重构故障块数据的空间。在某一CK故障时,系统将使用热备空间顶替故障的CK,并通知CKG中其他CK向该热备空间进行数据重构,以保证数据的安全性和读写性能不受影响。
  • 重构:重构是当某块硬盘发生故障时,将故障硬盘的数据恢复到热备空间的CK中,并将该热备空间的CK代替故障硬盘中的CK的过程。数据重构时,需要通过读取非故障数据和校验数据,并对读取的数据进行相应处理,将数据恢复到热备空间中,从而数据的安全性和可靠性。采用传统技术重构时,仅仅是故障硬盘所在的RAID中的所有硬盘参与重构。采用RAID2.0+技术重构时,故障硬盘所在的硬盘域中的所有同类型硬盘都参与重构,可以极大提升数据重构速度,缩短数据恢复时间。

    由于重构需要读取其他硬盘数据,为防止重构失败、业务中断以及数据丢失,所以禁止在重构过程中拔出故障硬盘所在硬盘域的其他同类型成员盘。

  • 配额:配额是指管理员可以为不同的目录设置不同的文件个数和空间大小。华为技术有限公司开发的配额管理特性叫做SmartQuota特性。
  • quota tree:quota tree是文件系统下的一级目录。用户可以对quota tree下文件个数和存储空间进行管理。
  • thin文件系统:thin文件系统是主机可访问的一块逻辑空间,thin文件系统采用在创建时只被分配初始容量,当初始分配容量不足时,系统按照用户实际使用容量从存储池中动态分配存储资源。
  • thick文件系统:thick文件系统是主机可访问的一块逻辑空间。根据创建时指定的容量大小,系统通过自动资源配置技术从存储池中一次性为其分配存储资源。

存储池组成

存储池的组成如图1-1所示。

图1-1  存储池的组成

存储池最多由三个存储层组成,每一个存储层由若干个相同类型的存储介质组成。

  • 高性能层是由SSD(Solid-State Drive)盘组成。高性能层的性能最高,由于其存储介质成本较高,适合存放访问频率很高的数据。
  • 性能层是由SAS(Serial Attached SCSI)盘组成。性能层的性能较高,由于其存储介质价格适中,适合存放访问频率中等的数据。
  • 容量层是由NL-SAS(Near Line SAS)盘组成。容量层的性能最低,由于其存储介质价格最低且单盘容量大,适合存放大容量的数据以及访问频率较低的数据。

块虚拟化过程

块虚拟化过程如图1-2所示。

图1-2  块虚拟化过程

  1. 存储系统将各存储层的存储介质划分为固定大小的CHUNK。
  2. 每一个存储层的CHUNK按照用户在DeviceManager上设置的“RAID策略”和“热备策略”组成CHUNK group和热备空间。
  3. 存储系统将CHUNK group划分为更小的Extent。
  4. 存储系统按照用户在DeviceManager管理界面上设置的“文件系统块大小”将Extent划分为更细粒度的Grain,若干Grain组成了用户需要使用的文件系统。

配额设置

用户可以为不同的目录设置不同的文件个数和空间大小,便于存储资源的有效利用。配额设置如图1-3所示。

图1-3  配额设置

配额工作原理:存储系统使用硬配额(包括容量硬配额和文件数硬配额)来限制每个使用者最多可以使用的资源。关键流程如下:在每次写I/O操作时,将配额的已用容量和文件数,累加本次操作增加的容量和文件数,检查总使用量是否超出硬配额。若总使用未超出硬配额,则允许操作向下执行,否则写I/O操作失败。在检查到写I/O操作被允许之后,需将增量的容量和文件数,累加到之前的容量和文件数上。然后,将配额更新(即容量和文件数的最新和值)和I/O数据一起写入文件系统。整个I/O操作及配额更新,要么全部成功,要么完全失败。这样保证了已用容量在每次写I/O检查时,都是准确无误的。

若用户所操作的共享目录上,同时配置了目录配额、用户配额和组配额,那么每个写I/O会同时受三种配额的限制。检查硬配额时,每一种配额都需要进行检查,只要有一种配额的硬配额检查不通过,该I/O就会被拒绝。

用户权限控制

不同的用户对同一个目录可以有不同的权限,同样,不同的用户可以访问的目录也不同。用户权限控制如图1-4所示。

图1-4  用户权限控制

具有完全控制权限的用户除了具备读写权限之外,还拥有对目录的更改权限和取得所有权的权限;而禁止权限下的用户只可以看到共享的目录,但是不能对目录进行任何操作。

数据写入时空间占用情况

用户在进行文件业务的写入时采用写时重定向技术,简称ROW(Redirect on write),主要有两种情况:
  • 如果待写入的数据等于被设置的文件系统块大小的整数倍,则直接将数据写入到新的位置,并释放旧数据的空间(如果旧数据是有创建快照,则不释放旧数据的空间)。
  • 如果待写入的数据不等于被设置的文件系统块大小的整数倍,则将旧的数据读取上来和新的数据一起写入到新的位置,并释放旧的数据空间(如果有对旧数据创建过快照,则不释放旧数据的空间)。
采取ROW技术将数据保存到新的位置,可以实现数据快速写入。数据写入示意图如图1-5所示。
图1-5  数据写入流程图

转透写情况

正常情况下,存储系统默认文件系统的写模式为“回写”,但发生如下故障时文件系统会转透写:
表1-1  文件系统转透写场景及处理策略

故障现象

转透写场景

影响及处理策略

控制器温度过高

  • 产生框温度过高告警,文件系统转透写。
  • 机房环境温度异常,或者存储内部器件异常导致。

影响

对整个控制器的业务对象全部转透写。

处理策略

排查高温原因(包括外部制冷系统、风扇模块、风道等)。

引擎BBU故障

两个或两个以上BBU都出现异常,出现告警,文件系统转透写。

影响

对整个引擎的业务对象全部转透写。

处理策略

  • 排查BBU是否正确接入。
  • 排查BBU是否故障,如果是,更换BBU备件。
  • 排查BBU是否电量不足,等待BBU充电完成。

引擎保险箱盘故障

AB控制器保险箱盘全部故障或者CD控制器保险盘全部故障(引擎上面两个控制器为AB控,下面的为CD控),文件系统转透写。

影响

对整个引擎的业务对象全部转透写。

处理策略

排查保险箱盘是否故障,更换控制器备件。

控制器故障

默认控制器单控故障一定时间内(192小时)文件系统继续保持回写,如果设定时间段内故障未排除,则文件系统变为透写。

影响

默认时间到达后对整个引擎的业务对象全部转透写。

处理策略

  • 在回写保护时间内选择业务压力小的时间点更换控制器。
  • 如果备件在透写延时保护时间内未到达,评估风险后,可适当增加透写延时,避免透写对业务性能的影响。

存储池剩余空间小于预保留空间

有存储池超过容量阈值的告警,提示用户及时扩容。

影响

该存储池上的文件系统转透写。

处理策略

对该存储池进行扩容。

文件系统剩余空间小于阈值

文件系统剩余空间小于阈值,设备会产生告警。当文件系统剩余空间即将耗尽时,文件系统默认转透写。

说明:
当出现如下情况时,文件系统也会由于容量不足而转透写,但是可能不会产生文件系统剩余空间小于阈值的告警信息:

文件系统已用空间 + Grain持有空间 + Cache的脏数据 > 文件系统总空间

其中Grain持有空间包括碎片空间,预取空间,延迟释放空间。

影响

若文件系统转透写,文件系统性能降低。

处理策略

对文件系统进行扩容。

翻译
下载文档
更新时间:2019-08-14

文档编号:EDOC1000084024

浏览量:10083

下载量:706

平均得分:
本文档适用于这些产品
相关版本
相关文档
Share
上一页 下一页