YARN HA架構部署測試

2018-02-25 23:50:00

ResourceManager(RM)負責跟蹤叢集中的資源，并排程應用程式(例如MapReduce作業)。在Hadoop 2.4之前，ResourceManager是紗線叢集中的單一故障點。高可用性特性以活動/備用資料總管對的形式添加備援，以删除此故障點。

NodeManagers和用戶端在RM關閉期間将保持對RM的輪詢，直到RM啟動。當啟動後，RM将通過心跳機制向正在與其會話的NodeManager和 ApplicationMasters發送同步指令。目前NodeManager和ApplicationMaster 處理該指令的方式為：NodeManager将殺死它管理的所有容器然後向RM 重新注冊，對于RM來說，這些重新注冊的NodeManager與新加入的 NodeManager相似。ApplicationMasters在接收到RM的同步指令後，将會關閉。在RM重新開機後，從狀态存儲中加載應用中繼資料和認證資訊并放入記憶體後，RM将為每個還未完成的應用建立新的嘗試。正如之前描述的，此種方式下之前正在運作的應用程式的工作将會丢失，因為它們已經被RM在重新開機後使用同步指令殺死了

ResourceManager重新開機可以劃分為兩個階段。

第一階段，

增強的ResourceManager（RM）将應用程式的狀态和其它認證資訊儲存到一個插入式的狀态存儲中。

RM重新開機時将從狀态存儲中重新加載這些資訊，然後重新開始之前正在運作的應用程式，使用者不需要重新送出應用程式。

第二階段，

重新開機時通過從NodeManagers讀取容器的狀态和從ApplicationMasters讀取容器的請求，集中重構RM的運作狀态。與第一階段不同的是，在第二階段中，之前正在運作的應用程式将不會在RM重新開機後被殺死，是以應用程式不會因為RM中斷而丢失工作。

YARN HA架構部署測試

繼續閱讀

Windows下Cygwin環境的Hadoop安裝（3）- 運作hadoop中的wordcount執行個體遇到的問題和解決方法

MapReduce運作Wordcount時一直卡在INFO mapreduce.Job: Running job，web檢視一直處于accepted階段

ubuntu hadoop2.6.1，terminal下運作wordcount

MapReduce(一)：入門級程式wordcount及其分析

hadoop操作遇到的問題問題一：輸出檔案已存在

Hadoop之運作wordcount

jdk1.7+Eclipse+Maven3.5+Hadoop2.7.3建構hadoop項目

Eclipse運作WordCount（詳細版）相關連接配接Eclipse運作WordCount

BMP檔案結構及圖像每行位元組計算方法

磁盤結構及在Linux中的命名

hadoop 用MR實作join操作

Centos7 下 Hadoop 2.6.4 分布式叢集環境搭建摘要叢集準備安裝JDK 安裝 Hadoop 2.6.4 部署 slaver1-slaver4 啟動 hadoop 叢集成功了

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

ubuntu14.04下安裝hbse1.0.1.1

User Defined Hadoop DataType

Ambari介紹和架構原理