抑制数据存储容量需求

最后更新:2014年1月

基本指南

浏览部分

编者按

根据您咨询的分析师,数据增长正以每年40%到650%的速度推动企业内的数据存储容量需求。如果你觉得这是一个非常广泛的分析师估计范围,它是。有两种解释。

首先,没有人真正知道数据增长有多快。第二,产能需求趋势与实际数据增长趋势关系不大。它们的依据是对消费者每年购买容量的估计,而不是数据增长速度的估计。

这意味着计划者想要计算出容量管理策略开始时,管理层的任务仅仅是弯曲存储成本曲线——认识到存储现在占IT硬件支出的每一美元的33美分至70美分。确定实际容量需求、增长驱动因素以及减少成本的程序和技术方法的繁重工作g容量需求完全由他们决定。

2011年,马萨诸塞州的弗雷明汉。IDC预计全球部署的外部存储为21.2艾字节。这不仅用于存储生产数据(据分析师称,其中大约55%是文件),还用于存储数据副本和垃圾。根据这位分析师的说法,我们用了大约一半的磁盘来存储另一半磁盘上写入的数据的副本。和我们的不愿意扔掉任何东西使我们的存储基础设施接近厨房垃圾抽屉。

磁盘并不是唯一的存储方式。业界至少定义了两种磁盘——低容量、高速一级和低成本、高容量的Tier 2——并承认一个完全独立的磁带层(Tier 3)主要用于存储备份和归档数据

最近,随着所谓的基于闪存的存储设备的推出硅存储设备,在存储层次结构中引入了一个“新的”Tier 0。从技术上讲,硅存储一直是存储分层架构的一部分。IBM的分层存储管理(HSM)范式——自大型机计算最早出现以来就存在——通常包括系统内存,直接存取存储设备(DASDs),基本上是磁盘阵列和磁带。

多存储层的目的,以及HSM中固有的在层之间移动数据的软件功能,只是为了管理存储容量和成本。该方案基于数据访问频率和数据修改频率特性进行预测。用高频访问和更新的数据使用硅存储。然而,这种存储非常昂贵且有限,因此数据必须尽可能快地从dasd迁移到dasd第0层到Tier 1,在那里可以以相当高的速率访问和更新。在一个经典的HSM战略中——DASD的大小与冰箱一样大,容量有限,并且需要自己的建筑(DASD农场)来处理电源和HVAC需求——面临着尽快将数据从磁盘迁移到磁带的压力,磁带是存储容量层(然后是第2层)针对存储数据进行了优化,这些数据以相当高的访问率或修改率存储的频率要低得多。

分层体系结构和HSM提供了一种简单的容量管理方法,但不幸的是,这种方法没有过渡到许多公司部署的分布式计算环境。部分原因是历史和技术原因:早期的分布式计算环境依靠低速局域网将无法处理HSM数据移动负担的小型计算机(服务器)和微型计算机(PC)互连。此外,业界还寻求扩展磁盘产品,以提供与磁带竞争的专用容量存储。高容量、低成本SATA磁盘阵列,其中一些具有“数据缩减”增值软件(所谓重复数据消除虚拟磁带库[VTL]设备)是最早的,其次是提供第1层和第2层磁盘托盘的分层存储阵列,以及自动将数据从一层移动到另一层的HSM软件;最后,大量闲置磁盘阵列作为一种新的容量存储层在市场上进行了测试。

但专用磁盘设备的成本,特别是阵列控制器上嵌入的增值软件所产生的价格加速,限制了其应用。在采用了重复数据消除VTL等产品的情况下,它们大多被归入了一个利基角色——扩充而不是取代磁带,因为磁带继续存储着全球约80%的数据。

管理数据存储容量所需要的不是将更多数据塞到相同数量的主轴上的设备,而是利用正确的存储层来存储正确的数据的策略。而不是狭隘地关注容量分配效率——这是数据简化技术的要点压缩和重复删除--规划者需要考虑产能利用效率。这是一种奇特的说法,有效的容量管理战略不仅包括战术空间管理(重复数据消除和压缩),还包括战略数据管理(例如归档)。

这个过程从分析你的情况开始。使用存储管理报告工具,如SolarWinds的storage Manager(以前称为Tek Tools storage Profiler),您可以运行一个报告,以标识在过去30、60或90天内未被访问或修改的文件。按所有者(也在文件元数据中)对这些文件进行排序将提供一种方式,可以开始与拥有这些文件的用户(或其经理)进行对话,以便将这些文件移动到存档或删除。

目前,存储在磁盘上的数据中有多达40%可以更经济高效地托管在归档平台,无论是基于磁盘、磁带还是在云服务中。归档数据和将40%的容量返回生产使用所节省的成本,可能足以为未来的整个数据存储容量管理策略买单。

1正确的信息生命周期战略如何节省容量

数据生命周期管理(DLM),也称为信息生命周期管理(ILM),并不是一个新概念,但在控制数据存储容量需求时,它经常被忽视。创建自动移动数据的策略是DLM的基础。例如,组织中某个部门创建的所有数据都可以在元数据中进行标记,并从那里指向特定的存储。对于存储专业人员来说,这是一个很大的好处,可以确定哪些数据存储在哪里,并控制给定数组的容量。

搜索灾难复苏
搜索资料备份
搜索聚合基础设施
关闭
Baidu