天天看點

胖子哥的大資料之路(10)- 基于Hive建構資料倉庫執行個體

一、引言

  基于hive+hadoop模式建構資料倉庫,是大資料時代的一個不錯的選擇,本文以鄭商所每日交易行情資料為案例,探讨資料hive資料導入的操作執行個體。

二、源資料-每日行情資料

胖子哥的大資料之路(10)- 基于Hive建構資料倉庫執行個體

三、建表腳本

 四、資料導入1

五、資料導入2

六、執行結果

七、問題聚焦

(1)hive分區設定的原則和技巧?

(2)hive分區内行記錄完全一緻問題如何解決?

(3)hive中文亂碼問題如何解決?