大資料互動分析軟體-Zeppelin學習大全

2023-06-29 06:14:51

Apache Zeppelin是基于 Notebook技術開發的大資料互動分析服務軟體，可以基于Web界面組合多個大資料分析引擎的處理能力，并内置提供了基于Web的可視化界面，可以連接配接幾乎所有的Apache大資料處理服務系統。

Zepplin簡介

源碼：https://github.com/apache/zeppelin
官網：http://zeppelin.apache.org/
文檔：http://zeppelin.apache.org/docs/0.7.0/index.html
參考：Top Spark Ecosystem Projects(英)

大資料互動分析軟體-Zeppelin學習大全

這裡收集了Zeppelin的開發、編譯、配置、應用等相關資料，并翻譯為中文，希望對大家使用Apache相關的大資料技術棧有所幫助。

1、編譯與開發

Zeppelin-源碼編譯
Git-Maven-NPM-Bower的代理設定大全
zeppelin自定義interpreter
zeppelin解釋器interpreter的排程和任務封裝- http://blog.csdn.net/spacewalkman/article/details/51569330?locationNum=14&fps=1
Zeppelin-Helium（氦氣）可視化軟體包

2、運作與配置

Zeppelin-基于Docker技術運作容器
Zeppelin-定制自己的首頁面
Zeppelin內建LDAP權限驗證的配置
Zeppelin-在Flink和Spark叢集的安裝
Keras+Tensorflow+Jupyter 安裝在Docker容器中運作

3、REST API接口

Zeppelin的REST API接口
Zeppelin 配置通路 REST API
Zeppelin Notebook 操作REST API
Zeppelin Notebook 存儲通路 REST API
Zeppelin 解釋器的REST API接口
Zeppelin 可視化子產品Helium REST API

4、應用執行個體

Zeppelin-使用TuShare快速入門
使用Zeppelin進行"失信人"公開資料的分析

5、問題解決

TypeError: 'str' object is not callable (Python)

Apache Zeppelin 學習大全

上一篇: Zeppelin介紹與入門實踐

下一篇: zeppelin源碼分析(0)——zeppelin要解決什麼問題

繼續閱讀

MRS +Apache Zeppelin，讓資料分析更便捷
hive hadoop Apache Zeppelin 資料分析可視化
07-22