《推进档案》No.1:戴尔流动数据的发展

Niky 发表于:12年10月23日 12:00 [原创] 存储在线

  • 分享:
[导读]数据在戴尔的智能数据管理解决方案下,以不断代的方式在存储系统中存在,用户也就有了更多的样本来分析数据的冷热规律,戴尔的流动数据解决方案根据用户对数据的需求进行跨平台、跨系统的无缝数据迁移,甚至可以在物理和虚拟环境之间进行数据迁移。简而言之,就是在正确的时间用合理的成本将正确的数据放在合适的地方。

所谓的冷热数据分离,就是将热数据剥离出去,核心保证其性能,而相对来说冷数据访问量少,服务等级减低,也可以想象能节省多少的容量。业界现在普遍认为不同的数据“带有不同的温度”,在一定周期内预期将被频繁访问、改写的数据被称为“热数据”,而在很长时间段内访问频率相对较低的数据,则被称为“冷数据”。

当然,冷热数据的划分并非如此简单,首先,这个“一定周期”和“访问频率”就存在不同的划分方式,比如说,有的企业将90天内每周都需要访问2-3次以上的数据,称为热数据,而有的企业,则认为180天内需要访问的数据都是热数据;其次,热数据和冷数据的划分并非完全以线性时间来决定,对于一些以周期性的工程项目为核心的企业来说,往往在某个项目开始时,数据被频繁访问,而这些数据有可能是180天甚至365天之前的数据,另外的一种可能是,企业的这些数据在项目完成后就不再被访问,甚至被丢弃。

但总的来说,按照企业的数据以90、180、365天为周期,以数据在这一周期内的访问频率,按照30%-30%-40%的比率来划分数据热还是冷,是比较常用的方式,也就是说,如果一部分数据在90天内要被访问,那么其可以按照其在这90天的访问次数,再进行划分,也就是为每个时间周期内,以三级访问频率划分数据。

与此对应,我们现在会看到数据中心内包括:SSD固态硬盘、15K转SAS或FC硬盘、10K转SAS或FC硬盘,以及7200转SATA硬盘,这些硬盘的速度由高至底,但在可接受的成本下的可用容量则越来越大,相比只有数百GB的SSD,SATA盘的原始容量已经高达3.0TB,而且很有可能会继续攀升。

对于这些不同的硬盘,我们可以简单的理解为:性能越高的硬盘我们花钱买的是性能,而容量越大的硬盘我们花钱买的是容量——但数据的增速越来越快,其所需要保持的性能却从未被降低要求。我们可能花费一定资金保证了存储性能,但容量显然有很大的差距;而容量采购完成之后,7200转的SATA盘显然无法提供同等盘数SSD的IO性能。

所以,关键的问题是:如何花更少的钱,既保证性能又保证容量?答案很简单,以数据的热度降低为梯度,依次将其放在SSD固态硬盘、15K转SAS或FC硬盘、10K转SAS或FC硬盘,以及7200转SATA硬盘的顺序中,当然,先要做的是分辨出数据的冷热度,确定硬件基础架构中不同盘的数量、类型,再以此划分。

不过,这只是理论上的策略,落实到实际上,显然完全依靠手动是不太可能的,这必须依靠磁盘阵列自身的功能——自动分层存储技术——来实现自动化、智能化的冷热数据划分,这一过程应当是无需干扰的,只需要根据其范式确定一些对冷热数据的划分要求即可;另一方面,仅有SAN——也就是块数据——的自动分层是不足的,在非结构化数据飙升的今天,我们还需要文件系统的自动分层。

[责任编辑:崔昊]
Niky
也许有一天,Fusion-io会说:“我们是真正的混合存储阵列,而不是像硬盘一样在混合存储阵列中使用闪存和硬盘。”
官方微信
weixin
精彩专题更多
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
12月15日,中国闪存联盟成立,同时IBM Flash System卓越中心正式启动
DOIT、DOSTOR、易会移动客户端播报中国存储峰会盛况。
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.