Hadoop 2.0 之前,在HDFS 叢集中 NameNode 存在單點故障(SPOF )。對于隻有一個NameNode 的叢集,若NameNode 機器出現故障,則整個叢集将無法使用,直到NameNode 重新啟動。
NameNode 主要在以下兩個方面影響HDFS 叢集
NameNode 機器發生意外,如當機,叢集将無法使用,直到管理者重新開機
NameNode 機器需要更新,包括軟體、硬體更新,此時叢集也将無法使用
HDFS HA( High Available, 高可用性群集,是保證業務連續性) 功能通過配置Active/Standby 兩個NameNodes 實作在叢集中對NameNode 的熱備來解決上述問題。如果出現故障,如機器崩潰或機器需要更新維護,這時可通過此種方式将NameNode 很快的切換到另外一台機器。
image.png