主持人:各位尊敬的来宾,大家好,欢迎参加CommVault Simpana7.0新品发布会!请先允许我介绍一下今天的议程安排:首先由CommVault中国区总经理徐永兴做CommVault公司介绍;然后由CommVault全球产品总监梅立宏先生为大家介绍CommVault Simpana7.0的特点;最后,CommVault资深系统工程师孙春杰先生会做“一体化信息管理”的专题演讲。首先掌声有请CommVault中国区总经理徐永兴先生为大家致辞,谢谢。

徐永兴:大家下午好!首先我谨代表CommVault公司,欢迎各位光临今天的新产品发布会!今天是CommVault Simpana7.0发布会的第一站,除了北京以外,在广州、上海、成都相继也会有类似的发布会。下面利用今天的契机,我简单介绍一下CommVault公司。在座有些朋友有的可能都没有听说过,或者即使听说过也不是太了解,其实CommVault公司自进入中国到现在只有一年的时间。

        用一句非常简短的话来概括,CommVault公司应该说是全球唯一一家专门针对数据管理研发软件的公司,我们公司所有的产品都是为了数据管理,我们没有做安全、没有做数据库、没有做ERP软件,只是针对数据进行管理。CommVault是一家美国公司,总部在美国新泽西州。这是因为我们是1996年从AT&T分出来的,AT&T总部是新泽西,所以我们也是在同一个地方。从AT&T贝尔实验室独立出来CommVault这个部门,一直为AT&T开发数据管理软件,包括备份、归档、迁移,开发出来的软件是被AT&T使用的。1996年独立以后,我们也是卖数据方面的产品。但到了1998年之后,我们觉得IT环境和计算机世界发生了很大变化。八、九十年代初设计的软件已经不能适应新时代的发展,1996年Internet初露锋芒,数据量呈指数级增长,一些新的技术,比如说磁盘的技术、磁盘存储网已经开始在各地兴起。所以当时CommVault决定不想继续保留原来的产品了,而要对一个21世纪——新的IT时代重新设计一套产品,所以在1998年把原来的软件全部废掉。当然我们在以前也学到了很多东西,学到了数据管理的很多理念,并把这些应用到新的体系架构里面。等一会儿Simpana 7.0产品会由来自美国的梅立宏先生介绍,他1996年就在AT&T贝尔实验室工作,所以他非常了解我们的产品。现在我们在市场上销售的产品基本上就是在1998-2000年设计的,当时推出了我们第一款旗舰备份产品,从2000年开始扩充到迁移、归档、存储等等。今天我们要发布的7.0的版本实际上是从2000年以后十几个版本当中最强的一个,里面的功能非常强大,我想大家花今天的时间来听一听是非常值得的。

        我们公司于去年9月份在纳斯达克正式上市。实际上我们在1998年设计这个架构的时候,就一直在倡导“统一数据管理”,我们从今年7月份开始,也就是说这个CommVault Simpana7.0版本发布之后,宣布了一个新的理念,叫做“一体化信息管理”。同样我们跟市场上其它公司的产品有很大的不一样,那就是我们通过一个产品能够实现对数据的保护、归档、复制、迁移等,所有操作都是在一个界面就可以完成的。

        公司从成立开始,一直是一个成长非常快速的公司。这里面有一个简单的图片,可以看到从2000年到2007年(2007年财年是在今年3月底结束的),平均年增长率超过了37%。公司从2005年开始实现了盈利,从图中可以看到盈利的水平也呈快速增长的趋势。目前在全球范围内,我们有超过6000个用户,这里要提醒大家一点:我们认为数据管理是属于IT基本架构里面的软件,所以不限于卖到哪个行业,如金融行业、电信行业或者制造业等等,所以可以看到我们的客户在各个地方都有。

        另外,这里面有很多比较熟悉的名字,像诺基亚、ebay、丰田等等,这些企业基本上都是以CommVault的软件替换了他们原来所用的数据管理软件。在2000年以前欧美国家的绝大多数企业,无论是政府、金融、电信都已经有了数据管理软件,至少也会有备份软件,跟我们中国市场不一样,欧美在这方面的市场会比较成熟。我们取得的欧美的客户百分之百都是替换他们原来的产品。很大的一个原因是因为CommVault在1998年开始设计的时候,是基于原来对数据管理的认识,融合了一些最新的技术,能够非常好地去解决客户的一些问题。

        刚才说我们是世界上专业做数据管理的,数据管理在今天会有什么问题呢?实际上今天对任何一个企业来说,IT数据管理都是一个非常大的挑战,为什么呢?因为数据量在非常快速地增长,我想大家都知道。5年前我们买一个电脑会有2G、5G的硬盘,现在的电脑会有80G、100G、120G,大家还会觉得不够用。在服务器这边的增长也是非常快速。现在各种新技术也在不断涌现,在存储方面也没有一个很好的标准。业务对于数据的要求也越来越高,同时随着国外(我相信在中国来说也是非常热门的)法规遵循和部门监管对数据管理也提出了非常高的要求,为IT经理或者专门管理数据存储的人员带来了很大的压力。

        今天来说,在市场上很多的数据可能会有很多种类,其中最常见的可能会放在文件系统里面,同时每个企业都会有数据库,有Oracle数据库、DV2等数据库。我相信99%的企业都会用电子邮件,电子邮件又是一个非常复杂的系统。当然还会有很多应用软件,比如说ERP软件、电信的计费软件等等。无论哪个系统,数据增长都是非常快速的。人们对于数据保留时间的要求也越来越长,举个例子,刚才提到法规遵循 ,中国有些大型企业都会在美国上市,在美国上市有一个要求,就是满足萨班斯法案。在今天来说这个企业可能没有在国外上市,但在美国有业务来往,在美国有办事处。美国在去年12月1日修正了他的《民事诉讼联邦法规》,里面规定,如果有人告你的话,所有的电子存放数据,都应该作为呈堂证供。如果你说你有这个数据,但当法庭要的时候你拿不出来,法庭就会认为你是恶意欺诈,因为你没有办法提供这些数据可能就会被判输官司。所以为了应付这些法规的需求,大家对数据的保留时间要求越来越长。但是现在市场上数据保留的技术是没办法支撑的。现在数据量很大,动不动一个企业里面就有几十个T、上百个T,现在做备份都是很难的,为什么呢?因为好多数据都是衍生自80年代的,一个大型企业可能不得不把这个企业里面的计算机分成很多相互独立的“孤岛”,因为传统的技术已经不能满足现有的需要。

        同时由于一些物理方面的限制,数据要管理地好也不那么容易。包括我看到的媒体或者很多方面都在提绿色存储、绿色IT,尤其在国外发展地比较迅速。今天在很多大的数据中心里面,就算我有钱,他已经没有办法再放个1000个T的数据,因为他已经没有这些空间了,就算有这么多空间,这个数据中心也没有这么多空调、电力让你加更多的设备。所以在这方面也受到了越来越多的限制。整体来说给数据存储带来越来越多的问题。

        如果我们看企业怎样管理这些数据,企业说为了保护数据往往要对数据进行备份。我刚才说了,可能现在有很多法规方面的要求,所以现在大家都开始做归档,尤其在前几年9.11出现,人们说容灾也是很重要的,所以大家花很多钱做容灾。但是大家有没有了解到,今天市场上做的事情都是相互隔离的,大家是为了做备份而做备份,为了做归档而做归档,他们做的所有事情,备份、归档、复制都是针对同一个数据,也要对它进行 容灾、归档,虽然都是为了同一个目标,但是管理的方式、存储的方式、使用的方式是完全不一样的,因为传统的技术带来的就是一个相互隔离管理的方法。

        综合今天讲的,如何管理这些数据,怎样使这些数据为公司发展产生效率,都是一个很重要的命题。所以今天不仅仅这张图上的人在问,包括国际上以及中国的很多其他客户都在问:我怎么样才能有效地对数据进行管理?而且数据即使都保留着,如何才能从这些数据当中找到或者发掘出所需要的信息,为我的企业带来好处?有没有更好的办法?实际上更好的办法是有的,这就是CommVault在2000年就开始倡导的,所谓的一体化架构。不管你是中小企业还是大型企业,完全可以通过一个一体化架构进行管理,在这个架构里面我们不仅仅对数据进行保护,同时可以对它进行归档,把一些非常有意义的数据保留更长的时间,同时也能满足法规方面的需求进行归档。同时可以对一些非常关键的数据进行容灾、复制。可以在一个体系架构里面实现所有这样的功能,而且将所有存储方面的资源虚拟化,变成统一、单一的管理池进行管理。

        如果我明天就要使用一个数据那我就会把这个数据放在一个存储设备里面,这样万一主存储设备出问题,我还可以从这个存储设备中将数据恢复。但随着时间的推移,我也可以把数据迁移到更便宜、更大的存储空间里面去,放一个月或者放三个月;三个月以后访问的次数可能更少了,但是由于法规的要求,之后我还可以把这个数据迁到另外一个存储设备里边,从磁带里面放到仓库里面保留,或者刻成光盘进行保留。我相信大家前几年都听说过“信息生命周期”,数据随着时间的变化,它的价值可能会发生相应的变化。从主存储设备到异地存放,这些都可以虚拟化的技术,通过制订一些策略,这些数据过了多久应该放在什么地方,过了多久应该放在另外的地方,这样一来能使您存储的复杂度大大降低,管理起来就容易了。不用担心这个磁盘是IBM的还是HP的,不用担心带库是从SUN公司买的还是其它公司买的。你只要通过设计一个策略它就可以自动搬迁这些数据。

        我们常常发现,到处都是数据,数据也好好地被存放在各种设备内。但这么多数据如何发挥它的作用?或者我回忆起来在过去的某一天,我似乎看到过一个计划,可忘记了这个计划到底是谁发给我的,好象是去年5、6月份发给我的,里面可能有着很有价值的内容。如果根据我前面说的,数据被保护和归档了,你就会发现这个数据肯定是在我公司的某个地方,有可能这个数据通过归档放在仓库里面了,但仓库里面有一万盒磁带,我也不知道究竟在哪盒磁带里面。那么我有没有可能通过一种技术把我想要的东西找出来,我觉得这是一个非常大的问题。我记得前一阵子听说档案管理,我记不清楚具体是哪件事,是说北京某一个档案馆整理文献的时候突然找到了某位名家的真迹,在IT角度来说就是数据永远在仓库里面放着,但很少有可能找到它。另外举一个例子,我看上海的电视节目说,上海有一个照相馆,叫王开照相馆,前一阵子搬迁的时候找到了一些非常珍贵的照片,就是周璇那些人在王开照相馆拍的照片。

        我的意思是说今天可能有很多非常有价值的资料放在那里,但就是很难找到它。同样在你的IT系统里也是一样,数据都放在你的各个存储设备里,当你查找想要的数据的时候,你就会发现非常难找到,为什么呢?因为你已经记不清楚当初这个文件叫什么名字,已经记不清楚是哪一天谁发给你的文件,你只是隐隐约约记得里面谈到这个事情,所以能不能有这样一个工具把有用的信息找出来,也是数据管理中非常重要的一环。CommVault Simpana7.0版本能够把数据——无论数据在计算机里面还是在仓库里面——能够把它找出来,转换成有用的信息,帮助企业做决策和很多分析的事情。

        所以说CommVault一体化信息管理架构,是在单一的一个界面进行管理,对你的数据监控、备份、迁移、归档等等,使得它们不会因为一些意外、灾难丢掉,可以对它进行统一管理,也可以制订一些策略,在某一时间段放到哪里、对它做哪些设置等等。另外我们也是用一个单一搜索的界面,像百度、Google的界面一样,对你已经存放好的数据进行查找,根据你的需求看看里面有什么内容,或者把它导出来。 把数据管理跟信息查找结合在一起的解决方案,今天来说在世界上我们是第一个提出这样概念的。通过这样的管理使得你的IT和数据管理的成本能够大大下降,因为我们可以把整个资源虚拟化、共享,另外通过策略的制订、虚拟化的技术使得成本大大降低,从而提高管理方面的效率。当然通过数据的挖掘、查找能够使保留下来的数据容易被找到。

        我们是怎样实现一体化信息管理这样一个解决方案的呢?实际上在1998年就已经开始设计这个架构,就是我们所谓的通用技术引擎。我们把所有数据管理的功能,比如说备份、恢复、归档、复制、快照,等等这些东西都是集中统一到一个框架上,这个框架就是CTE。这些功能都是基于一个界面上做的,所谓介质的管理也是完全一样的,不是说备份就用这套硬件架构,容灾就用另外一套架构,架构是可以完全统一的。所有策略可以支持所有的管理。

        举个例子,今天为了保护公司的财务系统,我可以制订这么一个策略,每天早上8点把财务数据利用快照的技术克隆一份,然后每隔2小时或者4小时对前一次的克隆进行保护,随着数据的变化把它迁移到另外一个地方。这时如果出现灾难的话,我可以马上切换到我的容灾中心,如果中心的数据也不可用,我可以看,现在是3点钟,我可以根据8点钟的快照,马上恢复我想要的数据。快照到晚上12点的时候把这份数据拿出来备份,备份到磁盘上存放一个礼拜,一个礼拜之后转移到另外的磁盘存一个月,一个月以后放到仓库里面。今天我们可以通过这样的设计把里面的功能串联起来,然后按照你的策略自动来做。

        这些都是利用我们的通用技术引擎来做的,这是我们今天一体化信息管理的解决方案,我觉得它至少能从三个方面解决你所要做的事情。

        第一,多层次数据保护,能够对各种类型的数据进行数据保护,以满足你RTO、RPO、保留周期的需求。如果出现灾难的话,损失量会很小。

        第二,我们可以帮助你实现全方位的数据查询,我前面也提到,无论你今天查找的是网络上的在线数据,还是离线数据,甚至放在带库里面的近线数据,或者说这个磁带已经从带库里面拿出来,放到海淀区另外一个仓库里面,我们都可以通过一个界面查找出来,分清在线里面有多少、离线里面有多少、仓库里面有多少。

        另外,如果是一个跨国企业,无论在全球有多少个分支机构,或者中国的企业在很多地方都有分支机构,我可以用一个架构来实现前面我所说的多层次的数据保护。

        实现这些功能的就是我们今天发布的CommVault Simpana7.0。Simpana7.0跟以前的版本相比能够实现更好地移动数据,更好地存放数据,能够帮助你很好地查找数据,无论这个数据是在线的、近线的或者是离线的,另外可以使你的数据更安全,能够让你的数据在搬迁过程当中不致出现问题。

        总体来说,CommVault唯一做的事情就是帮助大家管理数据,而我们觉得这个工作对我们来说是非常有前途的。因为今天数据已经成为企业最重要的资产之一,除了人以外,可能数据占第二位。因为数据很重要,所以它不能出问题,所以我们第一要做的就是要对它进行保护。第二,光保护好了,放在保险箱里是没有用的,当你用的时候我能够非常快速地找到,而不是像我刚才说的,周璇的照片要等50年才可以找得到,我要的时候就能找得到。而今天要实现这样两个目的,CommVault的一体化信息管理,应该说是一个最好的解决方案。

        我讲的就这些,谢谢大家。

主持人:非常感谢徐总的介绍,接下来大家一定会对Simpana这个产品非常好奇,所以下面有请CommVault全球产品总监梅立宏先生为我们做介绍,请大家掌声欢迎。

梅立宏:各位来宾下午好,下面我开始介绍Simpana7.0功能。

        刚才徐总总结的时候提到两点,每个人都一样,我们收集了很多数据,我们自己想一想,家用电脑、手提电脑、DVD等等里面为什么有那么多东西,真的能用得到那么多东西吗?企业里为什么会保留那么多东西,目的无非是觉得也许有一天用得到。东西越多,找的时候就越难。那万一我有一天找的时候,这个东西没了,所以就很头痛。越积越高,我们要找的东西越来越多,Simpana提供的是能够让你更有效率的查询,然后能够重复使用这些数据。

        这张PPT就是美国萨班斯法规规定。这张图刚才徐总也用了好几次。下端的数据管理池,今天所有使用者的数据基本上都在一个存储设备上,数据本身保留在哪里,有些可能在磁片,有些可能在磁带,有些可能在线。使用者应该把这些数据分的很清楚,如果对在线数据,要管理的方式跟离线数据管理方式是不一样的。就是说以一个使用者的角度来看,我要找的东西在哪里,然后才知道怎样去管理。CommVault提供的就是,不需要设定数据怎么去读取,不需要知道我的信息到底是存在哪里。我们提供给使用者的是虚拟管理读取方式。怎样去找一个数据,每一位都用过Google、百度这样类似的网站,为什么全球那么多人使用?就是因为它用起来很方便,只要知道怎么上网,把中国和CommVault这两个词输进去就可以找的到相关内容。类似于Google、百度能够提供给你的,就是今天在Internet上面的数据。CommVault Simpana7.0提供的就是类似这样的功能,使得企业内部所保留的数据能够以这种方式来查询。今天也有很多可以查询的类似产品,但是它能够让你查询的只是在线部分。对一个企业来讲在线部分的数据可能只是它全企业、全组织数据的5-10%,所以还有大部分的数据没有一个很实用、很简便的查询方式。最多能够做到类似于Google功能,针对你在线部分来查询。

        而今天Simpana7.0提供给使用者最大的特点就是,让你有一个统一的数据管理池,这个管理池可能会把北京、上海、广州三个数据池加到这个管理池里面,这个池由使用者来定。这个管理池里面的数据是怎么来呢?有可能是备份、有可能是归档,也有可能是复制。使用者对同的数据进行处理,7.0所能提供的,就是让使用者以简便的方式查询、使用。7.0版本大概有300多条未使用者提出的建议,建议我们怎样改进产品的方式、功能。这个产品里面大概有70多个专利。通常每一个版本大概有200条客户提出的建议,这个版本比平时多了大概40-50%客户提出来的建议。

        刚才徐总提到,7.0提供一个很大的功能,就是针对数据移动部分提供更好、更有效的方法。什么是移动?不管今天做备份、迁移、归档还是复制,都是针对你原来的数据做了不同的拷贝移动到不同的地方存储。当然备份的格式、归档、复制的格式会不一样,存储的介质也会不一样,但是它最终只是针对原来的数据做了不同的拷贝之后移动到不同的介质中。比如说今天针对某一台服务器做备份,现在在市场上所有的产品都有一个相同点,就是你一定要针对你的数据每次做备份的时候做扫描,看哪些数据被更改,针对同一个数据源要做归档,每次扫描,服务器里面的数据不管有没有更改都要看一下。这个过程每天做,甚至每天要做好几次,带来的后果,第一是时间上的浪费,第二是服务器本身资源的消耗。7.0就提供了这一点,不需要重复每天去扫描,我知道哪些数据是更改的,哪些数据是新产生的。当我需要备份的时候扫描这个步骤就已经解除了。这样的话,相对来讲针对你的服务器本身的资源节省了很多。

        另外,就是所谓的以更好的方式做数据存储,能够做到针对策略为基础。这一组数据可能是多台服务器,比如说今天是针对ERP的数据,或者针对邮件系统。再比如说今天管理所有的PPT,这一组数据要针对一个策略来定,然后来对应相应的功能。比如说三个服务器在三个不同的时段要做增值备份,做了全备份之后再做增值备份,可能在全备份里面就有些东西是重复的,做归档时,不同服务器上面的数据在有相同步骤的情况下,我只需要针对原始数据保留一份,而由不同的指针指到那边。这样的话原来你可能有100G的磁盘能够保留两个星期。但是还有一点,今天的产品能够达到多高的压缩率?我们在做这个产品规划的时候有一个宗旨,今天客户做这么多事情,目的就是能够把数据读取出来。今天所有产品提供给客户最大的特点,就是当他处理数据的时候,不管是做备份还是归档都要付出代价,这样对使用者来讲就没有意义。而我们提供的产品Simpana,是基于以下平衡点提供给客户的:一方面让使用者达到最高的压缩率,同时对恢复速度没有任何影响。Simpana功能会让你所有的数据,可以针对任何种类的磁盘、操作系统数据做管理。

        用户怎样去管理数据,谁有权限读取这些数据,这些数据有没有可能丢失,是我们必须思考的。在美国、欧洲经常发生的事情是磁带会丢失。如果有朋友在HP、IBM上班的话,很可能会收到一个信息说离线存储的时候磁带丢失了。好多客户在数据加密方面有很多的需求,但问题是你要怎么样做加密?加密是一个很好的东西,但是加密的KEY怎么样保留,因为如果丢失加密的KEY就不能对原来的数据解密了。
不可能把所有的数据都加密,因为加密这个功能本身会消耗很大的资源,CPU、Service等等。是在服务器中加密,还是在数据中心里面加密,还是到离线存储的时候再做加密,还是在磁盘上面就做加密,还是归档到磁带上的时候再做加密。不同的客户对不同的数据的需求不同,制定的加密策略也不一样。我们在7.0版本中为客户解决了怎样做加密最得当的问题。硬件本身有加密的功能,但问题以使用者的角度来看,磁带本身有这个加密功能是很好的,但是由谁来管理这个KEY变成一个很大的问题,我们就提供了一个数据保护的平台,让客户指定这个KEY来管理,用不同的方式再针对KEY来加密,所以Simpana7.0版本中提供给用户很完善、完整加密的功能。

        很多人问,我今天为什么要花那么多金钱、精力保留那么多数据?为的就是在我需要的时候把信息既又容易地找出来。针对数据所产生的索引怎么样管理就变成很关键的一点,Simpana7.0提供的就是数据管理管理查询的功能。Simpana7.0提供的索引管理可以针对不同的文件、不同的语言,可以针对数据的内容做索引。比如说今天这些服务器,有UNIX、Linux等,可以每天针对它做备份,当做完备份以后,再定一个策略,针对备份的部分做离线的内容索引处理,这样做有什么优点呢?尤其对国外的企业中的有些使用者,在购买Google针对内部数据做索引的处理,但他会发现当他做索引的时候会消耗他服务器上面大量的CPU,大到他不能忍受,所有的数据每天都要做备份。备份是什么?就是在线数据某一个时间点的拷贝,比如说晚上8点做备份,8点备份的那部分数据跟昨天晚上8点在线部分的数据相同,我可以针对离线数据做索引,这就不会影响到在线部分。这时候做索引处理的话,我就知道使用者可以针对数据做查询,但这只是到昨天8点,在线部分也可以做索引的处理,怎么做呢?就像我刚才提到的一部分,可以知道在线部分有哪些新的东西,比如说昨天8点的数据都在这边了,所有的变化会自动传送到这个引擎,这样可以在离线部分做索引的处理,不会影响到在线数据,但我会把在线数据和离线数据整合在一起,是同一个索引,这样当我在查询的时候,就可以看到在线部分、离线部分,在不同时间点,这些都可以找到。这就是索引界面,基本上类似于Google界面。
        还有一点,我们每一个使用者都用E-mail、邮件系统,今天我要查询数据的时候,最起码要到邮件系统里面找,第二到文件系统里面找,最起码要两次。我们可以把所有相关文件、数据找回来,而且不管是在线数据还是离线数据。当然用过Google的人都知道,把两个词敲进去,有30万笔,这时候又要选是其中哪一笔,这个系统还可以针对找到的数据做进一步的调整。比如说从30笔调了以后加一个新的关键词进去,再加一个词里面可能就会减少很多笔。这些数据可能在500个不同的带库里面,但是我把这些需要的数据保留成虚拟文件,我下次来的时候可以看,或者说把数据传给他让他做下一步的处理,因为他才真正知道他需要的东西是什么。这样的话,我刚才说的虚拟技术就升级到怎么样读取信息、使用信息。

        比如说我要找到这个东西,不需要打电话到数据中心把文件恢复过来我才可以读,使用者只要有读取的权限就可以直接读取。这样的话一提到一体化信息管理,可以针对用户的需求来分类、来管理。或者说基于一个策略,比如说一个企业针对数据的管理需求是什么,可以定义一个人的权限是什么,比如说这个使用者的权限只能查询到一部分数据,可以针对权限来管理。

        Simpana7.0能够给客户提供的是:一是以更好的方式来管理数据和存储;另外是,以更好的方式来管理信息存取,当我从那么多TB的数据里面,找到需要50笔的东西,保留到一个虚拟的文件夹;然后针对这些信息怎么样去管理,谁有这个权限使用它、读取它、查询它,要有一个完善的体系,所以能够做到以更换的方式来进行信息管理。Simpana7.0可以提供给客户这些功能,但使用者怎样去使用这要看使用者本身的需求,可以针对它来定这些策略,这就是Simpana7.0提供的基本功能。 谢谢。

主持人:谢谢,下面由CommVault资深系统工程师孙春杰先生会做“一体化信息管理”的专题报告,掌声欢迎。

孙春杰:下面就是今天的第三个题目,全面实现一体化的信息管理。刚才都是着其一点介绍,我们怎样把我们的产品落实到实处,怎么给用户提供一个方案呢?下面我们从几方面帮助客户构建一个一体化的方案,从这个角度帮助用户实际的问题。

        首先看第一个片子,提到的是信息时代,数据为王。各位可能都是搞IT,IT经历了很多时代,像网络为王、服务为王、应用为王,我们构建我们的网络、通过服务器、然后通过网络把数据传输出去,基于IT系统又有很多应用。所有这些东西都会反映大数据系统上,像国内客户更多关注是在怎样构建基础架构上,然后开发应用系统,我们知道国外的数据量已经很大了,我们知道国内的数据量虽然这个趋势也会越来越大。不管是网络、服务器所有的东西都是以数据为载体的,通过网络传输,都是文件式载体。所以我们知道数据一定是整个IT系统里面最重要的一部分,现在已经到了这个时代,到了一个叫数据为王的时代,我们怎样管理我们的数据,包括备份、迁移、归档。现在一个企业有10个T,然后是100个T,这么多数据产生,我们怎样针对它进行管理,这将来一定是企业所面临的。可能一个企业今年只有1个T的数据,不可能说明年的数据量减少到了50个G,这是不可能的。

        我们不仅仅要做数据保护,后续的需求也会越来越多。刚才两位花了很长时间讲内容检索,国外企业已经把这些提到了议事日程上,快速找到数据、使用数据都是将来企业必然面临的问题。

        其实在IT管理里面也有很多的模块,网络管理、存储资源、应用管理,作为存储管理来讲的话涉及到很多方面,比如说买交换机、磁盘阵列、买各种各样的硬件,磁带阵列买好了定好分区,建立多路径,然后在服务器上设好文件系统,然后就可以工作了。从硬件角度来讲,存储系统就不会有更多的变化,针对你日常的影响来使用。IT系统里面什么最重要?每天系统要做什么,不再维护你SUN架构、磁盘系统,因为它在正常运行,我们的系统管理员要做什么,每天都要做备份,然后从备份的系统里面获取数据。那当数据量越来越大的时候怎样找到数据,所以对数据的管理在以后是最核心的。在国外的统计,系统管理员每天的工作量60-70%都在数据的保护、恢复上。萨班斯法案规定,如果打官司的时候一定要及时提供这些数据,如果提供不出来就要面临罚款。这些都是企业面临的问题,那么多数据怎样快速备份、恢复。

        这里提到我们在进行数据管理的时候主要面临的就是两个问题。第一个问题就是怎样对数据进行保护,有很多手段比如说快照、迁移、备份。可以放到不同的介质上,磁盘、磁带、光盘,可以放在上面。第二块就是当数据需要查询、恢复的时候该怎么办?传统的时候需要知道文件名,然后进行恢复,你肯定是恢复一个库或者库里面所有的文件,因为不能基于快速的条件,比如说像内容检索这种技术进行恢复。我知道很多客户习惯使用Google这样的工具了,它提供的是web的方式,但如果我们的数据不是放在web服务器上,是放在后端的企业磁盘里面、光盘里面,我们怎样去快速找到,能不能像Google似的输入关键字找到这些文件,这些表面上看来国内的客户需求还并不是很大,但从信息时代发展的趋势来讲这是早晚都要面临的,怎样在海量数据中找到它,然后进而发挥它更大的价值。

        现在的时代已经到了数据为王的时代,那我们怎样对数据进行管理呢?我会从三个方面来介绍。第一块如何提供多层次的数据保护。第二,保护完了之后怎样发挥数据管理的更大价值,怎样在海量数据里面进行查询。第三,针对很多大的企业,像全国性公司或者分散式的机构提供集中管理的方式。一体化解决方案是从这三个方面论述的。

        首先我先来解释一下Simpana的含义,前面三个字母是“sim”,是一体化单一管理,我们知道在业界里面很多客户知道,其实各个公司都是提供一体化的方案,我们可以看一下CommVault的一体化方案,可以在多层次数据保护方面来介绍,我们的一体化方案和其它公司的区别。“pana”是无所不在的意思。大家看到我今天穿的是红色,跟新产品的颜色也是一致的,很有意思的是我们提出的概念叫做“中国红”。

        区别于其它软件,我们都知道业界有很多其它公司,用各种各样不同时期收购不同的产品满足客户的需求,可以说它都是有解决方案的,但各个解决方案之间并没有什么关联,只是说时间长了之后通过开放API来解决问题。而CommVault是通过解决底层的ATE针对不同的需求加入不同的模块来实现的。

        我们可以把用户的数据从产生到消亡分成五个层次。第一层是应用层。第二层叫生产层,就是当应用产生数据,所有的数据都会存在生产层的磁盘阵列上。之后还会有三个层次,像倒数第二层,保护层,把数据备份到离线介质上,基于一个时间点进行备份,每天或者是每几个小时就进行备份,当源数据出问题的时候,可以根据历史点对数据进行恢复。相对于保护层还有恢复层,意思是像传统保护层解决的是以天为单位对数据进行保护,不管是备到磁盘上还是数据库上,调用策略进行增量。备份的单位是以天为单位进行备份,恢复的时候其实也是以天为单位进行恢复的,实际上这已经满足不了一些客户的需求了。像一些企业,我的业务种类必须要提供24×7的服务,像一些中国企业已经走出国门了,他在进行数据备份的时候不能停机备份,这就要用到磁盘快照的技术,每个小时就要备份,比如说5点钟要备份了,就进行快照,然后把硬盘挂到服务器上进行备份,这个过程是用另外一个服务器,不需要用单独窗口。通过这种叫恢复层的技术,我们都知道业界有很多厂商提供磁盘快照技术,通过快照技术可以知道每个小时做快照,可以利用这种磁盘快照的技术进行备份。恢复的时候也是一样,恢复的过程也只是用一个点进行恢复。所以恢复层的技术是利用磁盘这种快速技术达到以小时为单位或者以10分钟对数据进行保护。

        可以说一个例子,在之前有一个银行系统说系统管理员把数据删掉了,他说你能不能提供一种方法,首先解决数据要用自动化的手段,之前是用磁带机的手段,磁带机经常坏,有可能管理员没有时间就不会备份,通常损失会非常大。我们可以想象一下,那就可以用保护层的技术,把它所有的技术都进行集中化,备到集中化的磁带系统里面,通过软件进行统一的管理,定期会产生报表,定期在自循环的系统里面进行磁带的循环,而不用人为的打各种标签,这些都是通过保护层技术实现的。他还提出了第二个需求,如果在系统有误操作就会丢失很多数据,他说能不能用小时的恢复技术,我们就建议他用恢复层的技术,把磁盘做快速恢复,甚至还可以做到以10分钟为单位恢复。

        还有一个归档层,我们知道恢复层是为了快速恢复,保护层是为了传统的保护,数据越来越多了,像银行会对数据进行对信息进行归档,这个过程都是手工的。比如说监管部门对违章汽车的拍照,会以照片文件存在磁盘上的,但磁盘量有限,就会进行归档,当你三个月之后交罚款之后,工作人员会要求你提供一个申请,这个过程我们看到如果一个IT管理员一天处理一个需求的话会非常简单,但如果处理的多这个系统员一天到晚什么都不用做了,只需要做恢复都做不过来。所以我们怎么能够进行数据进行跟踪管理,而且这个数据已经归档放到磁带里面了,我们怎样在生产层上快速找到,我们就可以用一些归档技术,表面上看这些数据是没有动的,但实际上已经归档了,可以用纪念存储的技术解决客户这方面的需求。

        其实各个软件,包括业界的其它公司都是有解决方案应对的。这是一同数据保护方式的总结,基于这些区别,各个厂家都是基于每种技术、每种需求来完成的,比如说一个客户有一个数据中心,又要做快照又要做归档、数据保护,可能用7种、8种甚至10种的技术满足各个需求,用户必须把这7、8套软件装到7、8个管理服务器上,然后对应上7、8套不同的存储上,其实这些软硬件相互之间都是没有联系的,我们可以想象到后期影响到用户管理成本会非常高,追加硬件、软件的投资也会非常大。CommVault跟其它公司跟其它公司的区别就是用同一个架构实现的,比如现在很多企业都上ERP系统,像一个工厂,里面有一个物流部门,用一套Service数据库管理他的系统,比如财务部门用Oracle数据库管理,这两个部门业务模式不一样,这就出现他们的管理数据手段不一样,交互数据是不统一的。现在大企业都在上ERP系统,在底层都构建了统一的架构,比如说用Oracle相应的插件,然后通过底层的架构实现统一信息。我们都知道,这些层之间的数据都是可以流动的,像恢复层的数据,现在做好快照了,之后我会把这个快照剥离开放到其它的服务器上,然后调用保护层的数据进行北门,恢复层和保护层的数据就联到一起了。相对于归档层和保护层也是一样的,归档层的数据已经归档了,放到光盘上或者磁带库中,没有必要每天进行备份的时候,如果两者不相互关联的话,在备份的时候会触发归档层的数据回迁,比如我发现1个月没有读取的数据要进行归档,发现有300个文件符合这个条件,那就可以进行归档了。保护的时候发现1个TB的数据就备1个TB的数据,当读到300个文件进行相应的回迁,那你备份的结果实际上还是1个TB。使用CommVault的技术,备份的模块,我认为一部分的文件是有标志符的,我只需要备份需要备份的文件。生产层会产生不同的拷贝,比如说到恢复层产生3、5份的快照,然后在保护层可以每天做增量,然后保留10个版本,基于这些版本,我们认为其实都是由于生产层的数据产生不同的版本,这些版本之间相互都是有关联的,基于这些关联我们就可以用这套架构实现一体化的管理。CommVault是用一套架构实现的,不需要构建一套新系统去实现。

        我们看到用户数据有生产层了,用户对数据的恢复要求非常高,以小时为单位,我们每天可以做数据的快照,做成克隆卷,和它一模一样,这个肯定能达到以千为单位,我们可以做一个一模一样的快照,如果出问题直接迁移就可以了。另外还提供指针型的快照技术,可以恢复到5点钟、4点钟。我们可以看到恢复层的技术是调用磁盘的技术实现的,通常的手段有快照和复制来实现。怎样引入这个保护层呢?比如说现在发现磁带机经常容易坏,磁带机比起磁盘来讲可靠性没有磁盘高,那我们可以不断把经常变化的数据,用户对数据备份要求非常高的时候我们会建议备份到磁盘上,然后再把它放到磁带库里面来。业界有虚拟带库的技术,这还是不能取代传统磁带库的技术,它只是提供一种离线的存储方式,不像在线的硬盘的技术,放到磁盘上的技术操作系统还是可以看到的,因为虚拟带库提供的是一种备份的格式,无论如何还是不能把数据做下面这个动作,比如说出库,能把磁带拿走,但不能把磁盘拿走。其实这几种技术都是相互补充的,并不是相互替代的,我们可以看到磁带可以拿走,也可以被证实是一种可以保留很长时间的介质,我们可以看到这些技术可以相互进行弥补。很多客户觉得现在的网络比较好了,其实并不见得,你可以计量一下你的数据量多大、带宽多大,能不能同步的运行这些数据。所以当用户有不同需求的时候,我们可以计算出来用哪种方式更经济。

        我们可以把归档层的数据归档到只读设备上进行归档,怎样对数据进行查询?用户会产生相对于生产层好几十倍的数据,我们怎样对这些数据进行快速查询,这是CommVault非常重要的特征。我们可以看到所有一连串的过程都是基于数据保护,都是基于CommVault提供的CAT技术引擎来实现的。你也可以加上复制层的技术,我们还有档案系统,比如说现在要做归档就要对档案系统进行管理,构建好这套系统模型后只要构建模块就可以了,不需要单独构建在新的服务器、新的存储上,数据可以从恢复层到保护层然后进入到归档层。当你要恢复的时候可以选择,现在有4个快照,有10个数据保护,还有50份的归档,你可以选择用任何方式进行归档,比如说你到磁盘快照的技术里面进行查询恢复,它们之间都不是相互关联的。CommVault和其它公司的区别就在这个地方,我们最初设计的时候这个CAT的架构就设计好了,不像其它公司虽然各个层的都有,但事实上都是不同的软件凑在一起实现的,不是像CommVault在底层统一实现的。

        第二块我们可以看一下全方位的数据查询。因为后端数据量越来越大了,怎样发挥后端数据的价值?我知道很多专门做搜索引擎的公司,Simpana可以提供像Google输入关键字查询一样。但是Simpana和Google提供的产品有什么区别?Google提供的是在线文档管理和分类,CommVault是基于后端的数据查询管理,我们知道这块的需求也是很大的。很多公司说我的数据放了50年了,我需要找出需要的文件来,这很头痛,因为我已经不知道这些文件名叫什么了,或者只知道一些关键字,我必须找到它们恢复到一些磁盘里面,你能不能提供一种服务基于内容,然后输入关键字,可能找到10个文件,然后把10个文件进行恢复,之后看哪些文件是我想要的,然后充分加密,然后再把老的存在池删掉。还有做应用系统的开发,我们做研究的时候一定是依赖其它小组的研究成果的。我们可以想象一下国内的这些系统,因为我们接触这个行业很长时间了,基本上把所有的精力定位在前端,数据库怎样管理,应用系统怎么开发。随着数据量越来越大,国内还没有像国外那么成熟,国外把所有的资料、文档全部都是放到电子介质里的,而不像我们都放在磁盘里面,磁盘变得越来越大,磁盘是可以买很多,但你可以想像查询的数据量是1个T跟查询的差距有多大。

        这里提供了查询的各种手段,首先给用户赋予权限,每个用户有自己的界面,事先他在活动目录里面定制好了自己的职责,然后查询相应的数据。CommVault是基于离线系统可以查询,基于在线系统也可以进行查询。CommVault会自动捕捉在在线系统上的数据更新,捕捉之后会更新到中间的内容索引服务器上,同时基于离线的介质,对它再进行内容检索,这个过程很显然不用像其它系统似的,检索的时候需要占用客户端的资源,这样就实现了在线系统的数据到离线系统数据的检索,其它国内的客户现在的需求并不像国外那么强盛。

        我们可以预言一下,再过5年之后国内用户的精力也会放到后端数据管理上。客户可以分成两种类型的客户,每个客户可以赋予不同的权限,这里包括邮件系统、各种平台的文件系统都可以进行检索。CommVault现在支持70多种语言的文件检索。我们现在习惯于在前端发挥价值,但后端的价值会越来越多的。

        适合的应用,这里列举了一下,比如说档案系统、文档系统,其有订单系统,销售订单是放在磁盘上的,比如说三个月,可能在下单的过程中经常需要,但往后要对它进行归档,还需要对它进行查询,既然能够提供离线系统的管理,那我还需要在线系统的管理,可以立刻恢复需要的数据,那么我们可以帮他基于内容在任何情况下把它找出来,这些都是CommVault的优势。

        中国幅员辽阔,我们可以提供跨区域的集中管理,为什么之前跨区域管理弱一点呢,我们现在认为SUN架构在跨区域的系统里面并没有有条件构建SUN架构,更多的是通过网络,那就会出现一些问题,有各种各样的需求,但在整个地理域里,广州有一个系统管理员的帐号,可以恢复上海的数据。很显然这肯定都是不行的。所以我们在这块总结了一些特点,针对跨区域的系统如果要实现数据管理的话会有各种各样的问题,比如说权限,其实权限还有其它的含义,比如说密钥的管理,如果没有密钥的话会出现什么问题,各个人都会恢复这些数据,可以恢复企业里任何的数据,这很显然是非常危险的。那我们可以针对密钥的管理分成很多层次,即便系统管理员拥有最高的权限,他也是打不开这个文件的,通过这样的手段可以支持客户端非常多的用户使用。

        第二条,体系结构的问题,这恰恰也是CommVault的优势,传统软件都是集中化的方式,因为它们的设计年代都非常早,都是80年代末设计的,在备份的时候只是在服务器上进行操作就可以恢复了,所以当所有的索引都集中到一台服务器上,那么这台服务器就会成为很大的瓶颈了,比如说怎样对它进行快速的查找,原来的系统并没有意识到备份系统怎样管理好,CommVault采用的是分布式的索引结构,所有的索引是分布在中间这层上进行管理的,由这层产生一个报告,交给主Service我今天给客户端做了哪些工作,我们都知道现在做管理的时候要实现授权,你必须把所有的权利下发好企业才能支持的足够大,你要进行查询、备份、恢复都是在一台Service上进行恢复,很显然领导者的工作负载是非常大的。CommVault支持分布式的架构,系统可以部署在很广泛的范围里。国外有一个公司,最初在全球构建了9个备份域,由于体系结构的问题,现在全部都是用的CommVault的产品来架构的。像E-mail系统的管理也是一样,今天是100个G,之后就是多少个T,你怎么对所有的索引进行快速的定位,当你索引量以千万或亿进行查询的时候,字对字的查询就真的是一个难题了,你必须采用相应的体系架构才能找到你要找到的数据。

        对于数据加密,我们提供多层次的数据加密,比如说在网络传输过程中加密,在规定归档之后进行加密,美国加州有一个法律,一定要对磁带里的信息进行加密,因为里面会有客户的信息,这样就会造成损失。我们刚才提到各种阶段的加密,然后同时提供密钥的管理,这样就会更方便。

        针对网络带宽的问题,比如网络存储,当一个网络出问题的时候,这时候传50%了,换到正常的网络还可以继续传。WAN网的不稳定会导致远程操作中断,如何处理操作中断是跨区域管理的一个关键问题。基于广域网系统CommVault可以基于它的特点提供快速的手段解决它的问题。

        再有就是集中管理系统的高可靠性,包括监管、监控、服务器的切换,这些全都是可靠性,备份服务器的索引坏了怎样恢复,基于CommVault可以实现非常高的可靠性。

        我们是基于怎样的权限进行管理呢?CommVault可以通过NDS把它的权限管理收集过来,同时CommVault客户可以进行相应工作,因为现在的企业越来越大了,很多企业都基于AD进行管理,设置好客户的功能,比如说他只进行备份和恢复作业,他就有相应的功能了,把这两个资源赋予给他,这个客户就可以进行备份和恢复,其它的各种功能就不可以做了,这样可以赋予整个企业非常高的安全权限。

        CommVault认为用户的数据非常重要,不管系统出了什么问题,我可以立刻把数据通过其它路径进行备份,目的就是为了保护用户的数据安全性。你只要有可用的空间,比如磁带没了,转移到磁盘上都可以。这里说到一个全国性的公司,本地需要建立数据中心,可以用远程复制的技术复制到这个中心,他要求每天做备份,我们在本地放置系统,然后在备份之后的数据传到总中心,这样就构建好了一套跨区域的管理系统。

        现在的很多客户不是用一个控制台管理的,每个地方备份系统都是独立的,不需要往其它地方放,但总部需要获得每个地方运行的情况,比如说第二年又新采购设备了,网络带宽够不够、多少磁带机、磁带是多少,要有这些历史依据。那么CommVault可以到每个地方收集这些日志,然后进而生成图形化的报表,这样就可以清晰的报告给上层机关磁带是多少,使用量是多少,同时为将来企业的发展做一个趋势分析。很多客户都使用这套监控系统监管整个企业。

        下面是案例分析,其中有三个案例。第一个是美国暴雪公司,我们都知道魔兽世界,它从全球来讲使用的是CommVault软件,部署在欧洲、北美,在亚洲像中国大陆、台湾、日本、韩国都有相应的使用,在中国也沿袭美国的方式进行管理。他对数据的管理系统要求也非常的高,不可能在每个地方放一个工程师维护,同时针对里面的60套Oracle数据库进行恢复,恢复的界面非常简单。它使用CommVault就可以实现,针对它在国内的60套数据库全部实现图形化。针对6个地点做断点续传,网络断了也不怕。备份系统出问题的话,备份系统的备份服务器出问题了可以通过其它的备份磁盘进行恢复。不管通过它自己本身的在线系统高可用的设计、包括备份系统的高可用设计都可以实现整个系统正常的运营。

        下面是某跨国公司在中国的总部,它的数据中心部署在四个地方,在全国将近有20个运营机构在运营,要求的只是对各地的文件服务器进行更好的管理,给每个人分配定额,然后监控他,还要进行归档,比如说订单放三个月之后要进行归档,但不能说让IT管理员进行恢复,一定是前面有指针进行自动恢复的。这个磁盘空间是有限的,比如说是1个T,里面可以放各种各样的文件,要求首先不能去删这些文件,各地文件系统要求实现数据复制,因为它要把它的数据放到数据中心来,万一某地的数据损坏了,所以我要做这样的备份。他选用把数据先备份完成之后,然后把备份的数据再采用叫辅助拷贝的方式放到另外一个地点。这样我们可以看到他需要的产品是什么呢?他需要从数据复制、快照,到数据保护、归档、邮件系统的管理、企业存储资源的管理,这个公司最开始找了业界其它的公司进行咨询,之后他最终选择了CommVault,因为只有CommVault只提供一个产品,在一个界面中完成,其它公司都是7、8个产品,他说光这7、8个产品的投资和维护的成本就很高,CommVault就不存在这样的问题,因为都是统一到一套架构实现的。

        我们高兴地看到目前许多客户把大部分的精力放在备份、恢复上,这是中国的案例(暴雪公司),它也是延用了美国的方式。不过我们真的相信国内将来一定会针对数据管理有越来越多的需求,不单单要实现多层次的数据保护,还要实现内容检索,同时如果区域非常大的话,还要实现整个企业集中化的监控。

        今天我的演讲就到这里。