Hadoop單機配置(非分布式)

2023-06-24 18:25:20

Hadoop 預設模式為非分布式模式（本地模式），無需進行其他配置即可運作。非分布式即單 Java 程序，友善進行調試。

1. 下載下傳、解壓、安裝Hadoop(至usr/local)

sudo -zxf hadoop-3.1.3.tar.gz -C /usr/local

2. 修改目錄名稱為hadoop

sudo mv ./hadoop-3.1.3 ./hadoop

Hadoop單機配置(非分布式)

3.修改權限

sudo chown -R Hadoop ./hadoop

4.檢視hadoop的版本

./bin/Hadoop version

Hadoop單機配置(非分布式)

5.運作Hadoop

現在我們可以執行例子來感受下 Hadoop 的運作。Hadoop 附帶了豐富的例子,運作：

./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar

可以看到所有例子，包括 wordcount、terasort、join、grep 等。

例如：頻數統計：

在此我們選擇運作grep例子，我們将 input 檔案夾中的所有檔案作為輸入，篩選當中符合正規表達式 dfs[a-z.]+ 的單詞并統計出現的次數，最後輸出結果到 output 檔案夾中。

Hadoop單機配置(非分布式)

注意：Hadoop不會覆寫上次結果，需要手動删除上一次的結果。

rm -r ./output

繼續閱讀