本内容是《基本指南》的一部分: 使用OpenStack存储:关于Cinder, Swift和云的提示

使用OpenStack Swift对象存储的建议

资深云架构师Beth Cohen就如何以最高效、最经济的方式使用OpenStack Swift对象存储提供了一些建议。

OpenStack Swift对象存储为组织提供了一种潜在的经济方式,可以在公共和私有云安装的商用硬件上存储大量数据。但是用户可以通过遵循一些提示和建议来获得更好的结果。

在与资深作家Carol Sliwa的播客采访中,波士顿云技术合作伙伴公司的资深云架构师Beth Cohen就OpenStack Swift的数据类型和数量提供了建议最适合,与Swift配合使用的工具,推荐的zone和数据中心数量,以及使用Swift省钱的技巧对象存储

OpenStack Swift适合哪些数据类型,不适合哪些数据类型?

贝丝·科恩:我发现了斯威夫特最适合对于相对较小的数据的非常非常大的池。每个对象有5 GB的限制,所以如果你有大的视频文件,你需要将它们分开。通常,大型存档存储或文档池是Swift的合适用途。

人们可能会考虑使用Swift的最小数据量是多少?

科恩:你可以使用快速几乎任何数量的数据,但现实是,它是填满多个存储盒的数据量。所以,我想说大概半拍字节是你想要开始的地方。对于任何小于这个数的东西,它就会被放在一个或几个盒子里,所以这没有任何意义。

人们可以使用哪些工具来使用OpenStack Swift?

科恩:OpenStack Swift是一个开源项目,这意味着它往往不具备您在商业产品中所期望的完善的工具和开箱即用的功能。现在好消息是你可以买了OpenStack Swift的商用版本.但是,如果您自己开发的话,您将真正使用典型的Linux工具。Euca2ools有一些很好的监视、日志记录和审计工具,当然还有Nagios、Zenoss和其他标准工具。OpenStack Swift也使用了API,所以有许多与OpenStack API一起工作的驱动程序。

你刚刚提到了Swift的API,而且Swift还支持Amazon的简单存储服务,即S3。Swift对S3 API的支持有多好,为什么S3 API支持对终端用户重要吗?

Cohen: S3在这一点上是一种事实上的标准。OpenStack Swift确实支持S3 API,而且支持得相当好。这当然是标准的功能。这一点很重要,因为许多用户正在使用混合云和多个存储端点或着陆点,其中一些可能在S3中,一些可能在OpenStack中,还有一些可能在更传统的存储位置。所以,你真的需要能够混合和匹配的选项。

确保Swift数据保护的最佳方式是什么?

科恩:Swift采用了“尽可能独特”的概念来保护数据。它在位置层次结构中复制了三份数据,最顶端的位置是一个区域,该区域可能位于世界各地的不同数据中心。下面是区域(zone),可以是数据中心中的唯一机架,下面是服务器(有时也称为节点)。最后一个原子元素是服务器上的一个磁盘。在一个非常小的安装中,对象将位于该服务器的三个不同磁盘上。

为了确保您的数据得到尽可能多的保护,您将在满足需求的配置中组合使用区域、区域、服务器和磁盘。所以,在一个非常大的实现中,你会在世界各地有多个区域,这将提供最高级别的数据保护。如果一个数据中心消失了,其他两个数据中心仍然可用。但是在一个非常小的安装中,你可能把它放在一个盒子里,它会有三个副本分布在服务器上的磁盘上。

是否需要拥有区域、区域、服务器和磁盘的完整层次结构?

科恩:不,这就是这个系统的美妙之处,你可以根据自己的需求,将它们组合、混合和搭配使用。在一个非常大的安装中,您很可能会使用所有这四个概念,而在一个非常小的安装中,您可能只使用服务器和磁盘。它比以前的版本提供了更多的灵活性,以前的版本只允许区域。

您是否建议使用Swift使用多个数据中心?

科恩:你当然可以这么做,有很多公司这么做主要是为了数据复制。但是,请注意,当您有多个实例要使用它来实现高可用性时,它也会通过Internet进行传输,这意味着需要大量昂贵的数据进行移动。因此,除非你有一个非常大的安装或有相对便宜的带宽,否则我不会特别推荐在Swift商店中使用它。

组织通常使用Swift的商品硬件。你对使用Swift省钱还有什么建议吗?

科恩:使用Swift真的很便宜,但是有很多地方可以省钱。当然,商用硬件就是其中之一。我发现的另一个可以省钱的地方,尤其是在一个非常非常大的装置中,就是减少冗余的硬件。你可以减少机架顶部开关的数量。你不需要有多个。你可以只吃一个。另一个省钱的地方是,您不需要在节点上实现RAID,因为它内置在Swift自身的架构中。

深入挖掘云对象存储

搜索灾难复苏
搜索数据备份
搜索聚合基础设施
关闭
Baidu