Greenplum Chorus问世 EMC完善大数据三部曲

许振新 发表于:12年04月19日 06:00 [原创] 存储在线

  • 分享:
[导读]EMC在京发布了基于大数据分析的社交平台——Greenplum Chorus。这是EMC首个完全由中国研发团队开发的针对大数据的产品。EMC全球副总裁兼中国区总裁蔡汉辉透露,EMC在今年下半年还将让Greenplum Chorus开源,以使更多的用户能享受到Chorus带来的好处。

Chorus的四张“面孔”

Chorus是EMC大数据三部曲第二阶段的“主角”。Chorus是由EMC中国卓越研发集团的技术工程师研发的,历时一年半时间。参与开发工作的EMC中国卓越研发集团Greenplum资深研发产品经理庄富任介绍了Chorus的四大功能——个人沙盒、数据发掘、协作分析和开放数据。

“Greenplum Chorus是数据科学的社交平台。”庄富任说,“它具有社交的、开放的、敏捷的特性。”

EMC中国卓越研发集团Greenplum资深研发产品经理庄富任

“个人沙盒”是指Chorus可以实现自我服务配置,它是弹性的,可以按需求扩展,同时能实现自动的数据导入。“个人沙盒”实则是用户独有的数据库,使用者可以在“沙盒”里做任何分析而不会影响到生产线里面的效能。“数据发掘”是对企业数据进行搜索,同时寻找数据的相互关联性,并对大数据集进行视觉化。 在这一功能里,Chorus对结构化和非结构化的数据都能进行搜索。

“协作分析”则是指员工间共享工作空间、代码,并发布和追踪得到的洞察。强调协作要灵活并兼具安全。“开放数据”指为分析提供整合的开发环境,通过对第三方数据的访问提供进一步的洞察,并与领先的分析和视觉化工具相衔接。

为了更好地进行数据挖掘和分析,EMC还引入了“数据科学家”这一概念。庄富任认为,“数据科学家”必须有数学背景,熟练掌握工具,同时熟悉企业业务,然后再对数据进行挖掘和分析。目前,EMC已经培养出了一些数据科学家,并在国外和一些大学合作,培养“数据科学家”人才。

[责任编辑:许振新]
江南
英特尔通过提供英特尔至强处理器平台、SSD固态硬盘和万兆以太网等技术和产品,满足企业存储对时效和I/O的需求,正在将原先的瓶颈变成康庄大道。
官方微信
weixin
精彩专题更多
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
12月15日,中国闪存联盟成立,同时IBM Flash System卓越中心正式启动
DOIT、DOSTOR、易会移动客户端播报中国存储峰会盛况。
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.