天天看點

大資料互動分析軟體-Zeppelin學習大全

Apache Zeppelin是基于 Notebook技術開發的大資料互動分析服務軟體,可以基于Web界面組合多個大資料分析引擎的處理能力,并内置提供了基于Web的可視化界面,可以連接配接幾乎所有的Apache大資料處理服務系統。

Zepplin簡介

  • 源碼:https://github.com/apache/zeppelin
  • 官網:http://zeppelin.apache.org/
  • 文檔:http://zeppelin.apache.org/docs/0.7.0/index.html
  • 參考:Top Spark Ecosystem Projects(英)
大資料互動分析軟體-Zeppelin學習大全

這裡收集了Zeppelin的開發、編譯、配置、應用等相關資料,并翻譯為中文,希望對大家使用Apache相關的大資料技術棧有所幫助。

1、編譯與開發

  • Zeppelin-源碼編譯
  • Git-Maven-NPM-Bower的代理設定大全
  • zeppelin自定義interpreter
  • zeppelin解釋器interpreter的排程和任務封裝- http://blog.csdn.net/spacewalkman/article/details/51569330?locationNum=14&fps=1
  • Zeppelin-Helium(氦氣)可視化軟體包

2、運作與配置

  • Zeppelin-基于Docker技術運作容器
  • Zeppelin-定制自己的首頁面
  • Zeppelin內建LDAP權限驗證的配置
  • Zeppelin-在Flink和Spark叢集的安裝
  • Keras+Tensorflow+Jupyter 安裝在Docker容器中運作

3、REST API接口

  • Zeppelin的REST API接口
  • Zeppelin 配置通路 REST API
  • Zeppelin Notebook 操作REST API
  • Zeppelin Notebook 存儲通路 REST API
  • Zeppelin 解釋器的REST API接口
  • Zeppelin 可視化子產品Helium REST API

4、應用執行個體

  • Zeppelin-使用TuShare快速入門
  • 使用Zeppelin進行"失信人"公開資料的分析

5、問題解決

  • TypeError: 'str' object is not callable (Python)