Facebook的Hadoop应用与故障转移方案

大数据技术与实战发表于：12年07月04日 14:23 [转载] IT168

分享：

[导读]我们曾提到在短短的60秒内，Facebook的用户会分享684478条信息，Like按钮被点击34772次。

Avatarnode：具备NameNode故障转移的解决方案

为了解决单NameNode节点的设计缺陷，大约在两年前Facebook开始在内部使用AvatarNode工作。

同时AvatarNode提供了高可用性的NameNode以及热故障切换和回滚功能，目前Facebook已经将AvatarNode贡献到了开源社区。经过无数次的测试和Bug修复，AvatarNode目前已在Facebook最大的Hadoop数据仓库中稳定运行。在这里很大程度上要感谢 Facebook的工程师Dmytro Molkov。

当发生故障时，AvatarNode的两个高可用NameNode节点可手动故障转移。AvatarNode将现有的NameNode代码打包并放置在Zookeeper层。

AvatarNode的基本概念如下：

·具备Primary NameNode与Standby NameNode

·当前Master主机名保存在ZooKeeper之中

·改进的DataNode发送block reports到Primary NameNode与Standby NameNode

·改进的HDFS客户端将在每个事物开始之前对Zookeeper进行检查，如果失败会转移到另外的事务之中。同时如果AvatarNode故障转移出现在写入的过程中，AvatarNode的机制将允许保证完整的数据写入。

或许有人会Facebook这一解决方案的名字感到好奇，这是因为Facebook的Hadoop工程师Dhruba Borthakur来到公司时正好是James Cameron《阿凡达》电影热映时间。(我们应该感到庆幸，如果是1998年的话或许应该叫TitanicNode了)。

AvatarNode经受住了Facebook内部最苛刻的工作环境，未来Facebook将继续大幅度改善AvatarNode的可靠性和HDFS集群的管理性。并整合与一般高可用性框架的整合，还将实现无人值守、自动化与安全故障转移等特性。

Facebook已将自身使用的Hadoop与AvatarNode解决方案托管到GitHub。感兴趣的朋友可下载研究。当然不止Facebook在试图解决Hadoop的缺陷，MapR和Cloudera的产品也具备相似的能力。

[责任编辑：王振]

不仅仅是磁带昆腾主要存储产品扫描

昆腾公司已经算是存储行业的“老手”了，在磁带市场一直保持着优势。随着存储技术的发展，昆腾又适时做出调整，开展磁盘方面的业务。

官方微信

相关阅读

精彩专题更多

华为OceanStor V3开启全融合数据架构时代

华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平，很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。

中国闪存联盟成立暨IBM Flash System卓越中心启动仪式直播

12月15日，中国闪存联盟成立，同时IBM Flash System卓越中心正式启动

中国存储峰会现场直播

DOIT、DOSTOR、易会移动客户端播报中国存储峰会盛况。