数据存储产业服务平台

1.1.1 数据量增长

1.1.1 数据量增长

存储系统革命性变化首先表现为其容量的急剧膨胀。根据权威机构国际数据公司(International Data Corp.,IDC)最新的研究报告《数字宇宙膨胀:到2010年全球信息增长预测》中统计的数据,2006年全球每年制造、复制出的数字信息量共计1610亿GB,而人类开始记录历史以来,到2006年为止全部的书本文字加起来大约50PB,显然当年信息产生量大约是图书信息总量的300万倍。如果将书籍排列起来,总长度为地球到太阳距离(约1.5亿公里)的12倍。IDC报告同时显示,至2010年,这个数字将猛增到6倍,达9880亿GB,年复合增长率为57%。与这个报告相佐证,AT&T的网络每天流动16PB的数据,Google 每天处理20PB的数据,Facebook每天存储1PB的照片,Opera浏览器每个月处理多于1PB的数据,而BBC的iPlayer每个月有大约7PB的数据流,Youtube存储了31PB的流媒体数据。Cisco公司预计:到2012年每个月网络上视频流大约为5Exabytes(5000PB)。

摩尔定律断言CPU的处理速度每18个月增加一倍,同样通过若干年的观察发现网络带宽和存储容量增长也都具有指数增长的规律。图灵奖获得者Jim Gray提出了一个新的经验定律:网络环境下每18个月产生的数据量等于有史以来数据量之和。至少到目前为止,数据量的增长基本满足这个规律。

在数字化和网络互联环境中,数据信息膨胀的具体表现为:

1. 比特流的无限蔓延,电子数据无处不在;

2. 数据在线时间的延展:过去的信息系统基本上都有后台作业时间,而今天的信息系统却要求网络数据每周7×24小时时刻处于在线状态;

3. 数据存储的结构产生了巨大的变化:在信息孤岛时代,存储设备基本上是与封闭的、特定的计算机系统对应,而在网络互联时代,数据是跨系统、跨部门、甚至是面向全世界用户的。除去安全性要求,数据的存取不再受到时间或者空间约束;

4. 数据类型的多样化:基于文本或者固定结构的数据曾经是计算机处理的主要对象,而当前数据类型极其丰富,特别是具有不同结构的多媒体数据层出不穷。

设计新型存储系统以满足海量数据高效存取的要求成为一种必然的趋势。当然海量数据本身就是一个具有相对性的概念,20年前1GB就是海量数据,10年前1TB也可以称得上海量数据,而当前1PB的系统也并不少见。 虽然在这期间作为主流存储介质的磁盘系统的容量也不断的增加,但一般海量存储系统的容量大约是主流单个磁盘容量的1000倍以上,这必须通过系统的方法构建海量存储系统以满足数据容量的要求。正像前面所说,大容量的存储设备出现会导致更大容量需求的应用产生。因此在本书中讨论的海量存储系统并不限定于一个绝对的容量,而是重点讨论通过特定的系统结构增加整体的存储容量和性能。

未经允许不得转载:存储在线-存储专业媒体 » 1.1.1 数据量增长