如何逃出大数据困境?开源或是关键手段
剑鱼 发表于:12年04月18日 10:16 [转载] IT168
现在的数据不再整齐划一地按行和列排列,而是大规模地以非结构化形式堆放在数据库中。企业创建、收集、访问、分享和分析这些不同类型的数据以提高经营业绩。曾经用于进行数据分析的商业智能已经不再适用于目前的异构数据类型,包括电子邮件、字处理文档、协作网站和机器生成的数据等。

与此同时,繁琐和昂贵的专有企业搜索产品不能处理现有的结构化数据存储,并且不能以具有成本效益的方式来测量数据的规模和速度。现在我们的目的是找到一种能够对所有数据存储进行搜索、发现和分析(SDA)的解决方案,很多公司试图寻求开源方面的搜索功能应用程序,例如Apache Solr,以及大数据解决方案,例如Apache Hadoop,能够为他们提供及时和具有成本效益的对不断增长的数据总体的访问能力和洞察力。
