董唯元:闪存引爆X86进化革命

  • wangkeyue
  • 2015-08-07 17:55:08
  • [原创] Doit.com.cn

[导读]2015年8月5日,由DOIT传媒和存储在线联合主办的2015中国闪存峰会在北京盛大开幕。在下午的主题演讲中来自上海天玑数据的董唯元发表了题为《闪存引爆X86进化革命》的演讲,以下为演讲实录。

2015年8月5日,由DOIT传媒和存储在线联合主办的2015中国闪存峰会在北京盛大开幕。本次峰会以“闪存加速数据经济变革——颠覆方式和速度”为主题,超过 500位各行业用户代表,数十位顶级学者、产业精英和技术专家出席,以圆桌讨论和主题演讲等形式,从不同角度深入探讨“闪存加速数据经济变革”这一话题。
 
在下午的主题演讲中来自上海天玑数据公司的董唯元发表了题为《闪存引爆X86进化革命》的演讲,以下为演讲实录:
 
大家下午好,今天这个场合大家都是做广告的,我至少在第一页做一下广告,天玑数据是做融合基础架构产品的。上午大家主要给大家上计算机课、技术课,刚才TCO给大家上经济课,我相信大家听了很多的技术课以后,想听点别的,我们先从生物课开始上。我们知道在生命整个的演化过程中,生命演化过程是非常不均匀的过程,如果我们把整个地球产生到现在46亿年浓缩到24小时以后,我们对应的时间点可以看到,地球早上3点的时候地壳就已经形成了,早上4点的时候生命已经出现了,但是最早的生命是原核细胞生命,不是真核细胞,但是上午10点左右的时候,真核细胞就出现了,但是之后真核单细胞生物统治地球20年之久,下一个重要时刻一直到晚上9点,从早上10点一直到晚上9点才出现了多细胞生物,但是出现多细胞生物以后,在短短10分钟以内就有了含武纪生命大爆发。真核细胞生物统治地球20年以后,寒武纪两三万年年今天地球上的东西都出现了,然后就迎来了各种各样丰富多彩的动物,两栖类大恐龙出现了,实际上比那还早,寒武纪生命大爆发初期就有比恐龙还大的小龙虾。生命的进化大家可以感受到它是极严重的加速过程,特别像我们IT整个技术的发展过程。尤其是单细胞向多细胞进化的时间点上。
 
我介绍一下单细胞怎么进化成多细胞。弱小和无知不是生存的障碍,傲慢才是。细胞进化也是这样的,单细胞在水里游来游去,碰到有机物就抓过来吞到自己的细胞里面就算吃,但是大细胞吞比较大的东西,小细胞就比较痛苦,碰到比自己大的东西自己吃不小,小细胞手拉手围着一个大的东西,这就是消化腔,有了消化腔以后,一堆细胞发现,有一些细胞发现自己可以不用参与消化,就可以干别的了,真正的多细胞生物是有组织分化的,里面的DNA一样,但是有的长成了细长的神经细胞,有的长成了脂肪细胞,不同的组织才形成了一个有机体。
 
我们看整个数据中心的进化,目前我们正在经历的是从Sacle up到Scale at will。拿生物进化的概念类推的话就可以明显预见到未来所谓集群、聚合,不管叫什么名字,应该不是简单的消化腔,不是简单的同质化的集群,一定是有异化特征的,一定是更像一个多细胞生命体一样,有多种不同的共同基因,不同功能的组织有机整合在一起的整体的数据中心。
 
这个事跟我们今天的主题有什么关系?我们今天叫闪存峰会,我们认为闪存在进化过程当中起到了很重要的基因突变的作用。基因进化除了环境选择,很重要的是基因突变,才会产生多样性,通过外界选择。今天闪存的应用,就让这些X86生态里面出现了很多非常强烈的基因的突变,但是这个图里面,同时还会看到说,多个X86组合在一起,他们要有化学协同,今天化学协同机制已经很成熟了,就是软件定义技术和虚拟化技术,这些技术把一堆X86的资源拉通,可以自由流动,自由协同。闪存的突变带来了X86整个生态的变化。具体有哪些变化呢?这个就特别多了,这个地方就更技术化一点。
 
我们具体是做产品的,具体做超融合一体机产品的时候碰到的很多问题,都需要完全换一个角度去看。今天有了闪存以后,传统特别高大上的协议变屌丝了。大家如果接触这些技术的话就特别的明显。传统一个机械磁盘的延迟时间是很长的,中间需要通过各种缓存,但是今天闪存的IO延长时间是亚毫秒级的,这个世界上最大的存储公司,最核心的全闪存磁盘阵列,写在首页的参数,我的全闪存某某IO延迟时间能够低达1毫秒,所有这屋子里的人都觉得这是可笑的数字,简直不能接受。上来第一件事,你会发现现在很多做一体机,包括我们自己做一体机的时候,上来第一件事,把传统的协议替换。大家看到包括我们在内很多做一体机的厂商,做低延长,就要把传统的东西替换。一模一样的硬件环境,一模一样的闪存,跑数据库等等。事实上至少在我们公司里面,研发测试产品的时候,告诉我IO延迟时间大于0.2毫秒,我们就认为这个不用考虑了,这就不是我们想要的东西了。传统很高大上的链路协议,经常被颠覆掉,变成屌丝。传统磁盘阵列,缓存说法特别多,怎么把随机变成顺序,面条带写,说法特别多。但是大家发现闪存不需要自作聪明,你把所有闪存中间层都拿层了,不需要你做随机变顺序。对闪存来说,随机和顺序,我的IO反应时间是一样的,尽快把IO送下来就可以了,所有自作聪明的都是耽误时间,都是额外的负担。设计全闪存系统的时候,或者带有闪存系统的时候,传统IO的策略,基本出发点,基本逻辑就要重新考虑了。Linux访问磁盘的时候,都得过一个设备驱动,最多帮你装多少指令,队列深度,我们测传统磁盘的时候,设计16、32,最多到64就够了,传统的磁盘阵列没有那么快,队列深度32、64已经用不完了,实际上很多操作系统到上面都是假的。Linux就给你设到128,认为你可能有超过128个队列深度。Linux里面的队列深度128完全足够用了。一个PCIe闪存卡不过任何设备,在本机里面有40万个IOPS,但是拉到另外一个主机,通过链路管理,40万个IOPS到这里就变20万IOPS了。队列深度上不去,改参数,这也不是小工程,这是大工程。
 
更有挑战性的比如说中断模式。国内、国外有一些厂商研究,NVME已经出来了,这是最快的闪存接口了,传统的中断处理模式可能对它造成麻烦。传统处理中断的时候,CPU该干什么就干什么。但是NVME快到什么程度?CPU一中断再回来,和处理时间差不多在一个量级上。有人研究过,国内的公司的研究院研究过,把单独核拿出来,单独处理这个,不要中断,我就专门处理IO中断,什么时候扔处理请求我就处理。从模式的切换,让一模一样的闪存卡让一个10万的IOPS提升到20万的IOPS。闪存带来很多传统处理机制的冲击,至少在我们X86体系里面,产生的挑战特别多,所以会带来很多的多样性。
 
在更大的尺度上来看存储这件事,网络是数据跨空间传递,存储是数据跨时间传递。我们现在说大数据,实际上有点从牛顿力学转到爱因斯坦相对论,把时间带进去。以前我们关心的就是静态数据,今天我们关心大数据的时候,要把时间轴带进去。我们倒退回去看整个ID历史的发展过程这点很容易理解。以前单机年代,我还很小的时候,那时候大家买计算机讨论CPU,那时候大公司是微软,后来有了网络,大家就关心网络的事,然后就数据关系就多了,然后专门处理数据之间的关系,这个关系主要是空间的数据关系。实际上早期也不是Oracle一统天下,最早也有最强数据库,各种各样的数据库。后来又了一门专门研究关系数学,这个成为正宗体系,有了比较体系化的研究和论证以后,基于理论才有了关系型数据库的产品。后来出现了存储,实际存储是一个数据跨时间传递,等于说在传统网络上加了一个维度。传统的关系数学没有时间维度。为什么我们今天看大数据,大家永远觉得晕,大数据出一个hadoop,各种各样大大小小的分门别类的东西,特别的乱,就算哪个公司站起来,我整理一下各种场景的商业版本,把它打包成商业化的东西,一看十几个。大家感觉这个东西还没有成型,这个东西还是模糊状态。
 
早期数据库不是光有关系型数据库,还有其他的数据库。大数据也是这样的,缺理论,就是缺关系数学里面跟时间相关的那部分理论,至少在今天关系数学里面把时间带上。今天关系数学从从空间学变成时间空间数学以后,大数据才能会成为产业的征兆或者局面,否则只是局部性的应用,很难做整体性的推广。我们的闪存在存储层面发挥着更大的作用,让时间的颗粒度比原来细了很多。闪存提升了速度,提升的是时间密度。
 
还有外部环境,闪存是基因的突变,基因的突变让X86有很多异化的可能,外部关系是什么?我们看到外部环境,互联网的应用,尤其移动互联的应用,很多需求都是倒推回去,3、5年都没有听说过的东西,都没有看到那么极致化的要求。别说IT了,比如说现在的很多职业,互联网领域新生的职业,我都没有听说过,至于我的父辈根本不理解,他们那个年代这个世界就360行,有了互联网变成了3600行,移动互联就变成了36000行,这个行当之多,每个人都有不同的行当,你一边上班,一边是Uber司机。每个场景都有不同的需求,需求都是极致化的,需修都是极变态的。尤其是我们人口大国,移动互联的基数,上海说无线要覆盖整个会场。一般的wifi设计,一个基站覆盖多少点,他们说那个人口跟公共汽车一样,相当于上百辆公共汽车堆在一起,让每个人都要覆盖。微信要处理几亿在线用户的信息交互,及时性非常好,最后不光自己开发KV的文件系统,而且用全闪存做。很多极致化的需求,让大家尽可能探讨怎么极限化的满足需求,就出现了类似像CAP原理这种框架性原理,在极限化需求推动下,大家突然发现有一些需求要想做到极致,那个东西就保证不了,就像测不准原理一样。从外界环境来讲,对IT应该长成什么样,有了严重差异化的需求,不可能将来的数据中心都长成一个样,用一种技术、一种形态满足所有的需求。今天的需求和框架原理告诉你,这是不可能的,未来一定是多样化的,环境是多样化的,又有了突变的基因,我们就会看到未来的X86在整个生态里面的爆发增长,一定是可以预期的。事实上趋势已经很明显了,截止到2014年底的时候,unix小型机卖六七十亿,存储130亿,X86服务器190亿。今天已经是这样的局面,今天已经是全中国的小机+存储等于X86总额的一半。但是这个还不够,X86自己内部会发生剧烈的分化,就像多细胞生物出现以后,单细胞生物还存在,但是在多细胞研究里面,单细胞生物完全可以忽略不计了,除了非典的时候大家关心它一下。
 
这是我们公司的产品,我们也是基于这样的认识,一个数据中心大一统的方式也好,单一形态的方式也好,很难满足所有的需求,所以我们的融合基础架构的产品,现在分了三个形态,面对三个不同的典型场景,一个是替代传统小机的PBdata,高性能、低延迟,运行传统的关键业务,运营数据库,上面没有虚拟化的事。还有私有云Pridata,它要求性能没有那么高,但是扩展能力和灵活性要求高一点。Phegdata是非结构化的数据。至少我们的理念不同的场景要给不同的东西,朝着不同的方向优化。我们也看到美国超融合的倡导者,他们倡导的比较极致,认为全世界的数据中心完完全全软件定义,硬件都是同样的砖块,我们认为今天还没有到这个时候,我也不认为未来有一天到这个时候。我们认为差异化永远有软件和硬件的差异。至今为止很多大一统的思想和出发点,几乎最终一定面临失败,最近很典型的,今天你去北美、硅谷,跟业内的人员去探讨openstac未来的时候,大部分的人对openstac的未来是非常悲观的,甚至有人说还谈这个干什么,那个不是已经是过去的东西了。理由很简单,长期不稳定,长期没有办法成为可落地稳定的东西,它成为大家自己DIY东西的出发点,追求那么多,想把所有的东西纳入到这个框架里面,大一统的思想给自己本身的稳定带来很大的问题。
 
我们可以展望一下,整个X86的生态是非常多样化的,未来的数据中心满足的是各种各样不同极致化的需求的话,从厂商角度来讲,我认为会发生变化,今天的用户会到大厂商买东西,一站式交互什么都有,既有网络设备、服务器、存储,还卖手机,这个方式决定了你不可能了解你的用户想要什么,这个很像超级市场,你说超级市场了解你要什么吗?其实不了解。其实尽可能把所有的东西摆带那,你挑自己想要的就可以了,并不能给你提供一个为你量身订作的完整的解决方案,虽然天天这么说,但是实际上没有这个能力。不仅没有这个能力,随着极致化需求的推演,精品永远不会出现在超市,只会出现在专卖店里。如果你是普通用户,或者你是过日子的人去超市买日常所需就可以了,如果你是发烧友或者有更多追求的时候,你想喝一杯咖啡,体验一种很悠闲的状态不会去超市买速溶咖啡买杯子自己冲着喝,你一定会去shopmall,超市的业态不会下去,超市就是给普通过日子的人一个日常支撑。在这个业界里面,今天什么都卖的大公司,未来就是一个超市,卖的东西多,东西全,但是不能做最贴心的服务,真正给你最贴心的服务一定是专业的公司只做一件事。乔布斯说用户不知道自己想要什么,做产品的人肯定比用户更知道他想要什么。我从来就没有认为乔布斯这句话说的对,虽然我也是乔布斯的粉丝,我很认同他个人也好、公司也好的成就,但是我从没认为他说的是对的。在数据中心这个领域,用户比厂商更明白他要什么。乔布斯说的是玩具逻辑,玩具用户不知道想要什么,他期待厂商给他惊喜。苹果出的产品,基本上都是更像一个玩具,为什么不是主流商用的东西呢?更多的玩具的成分大于了实用成分。数据中心理论,你是CIO,你经营企业应用,你不需要玩具成分,你需要的是扎扎实实的实用主义的成分,在这些成分上,没有任何一个厂商敢说比用户更了解用户的需求,我是这么认为的。我们能做的只是说,尽可能把我们所了解的,所掌握的,尽可能提供给用户而已,更多的跟用户在一起,谢谢大家。
   
 
欲知更多关于2015中国闪存峰会的精彩内容请点击查看闪存峰会全程直播报道专题。

热点文章

精彩专题

微信公众平台:搜索"doitmedia"
或扫描下面的二维码:


  1. 公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心
  2. Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技术有限公司 版权所有.
  3. 电信与信息服务业经营许可证:030972号 电信业务审批 [2009]字第572号
  4. 京ICP备13004627号-3   京公网安备: 110105001105