h2o.ai項目簡介
參考h2o.ai官網中給出的項目定位是“open source platform for AI”。相較于目前市面上的機器學習平台,h2o.ai的優勢在于:
- 上乘的開源技術:h2o.ai是基于Java的開源項目,并可以無縫對接Apache hadoop,Spark等優秀的開源項目,為使用者在面臨各種資料分析挑戰時提供了多種靈活的解決方案
- 直覺友善使用的WebUI以及豐富的API接口:h2o.ai提供了基于web的工作流圖形化界面,此外豐富的API接口為R, Python, Java, Scala, JSON等多種程式設計環境提供支援。
- 支援多種資料源和資料格式:除了可對Microsoft Excel, R Studio, Tableau等來源的大資料提供了便捷的資料模組化和分析方式,也支援HDFS, S3, 傳統SQL資料庫及多種NoSQL資料庫的資料源。
- 大規模可擴充的大資料分析:得益于h2o.ai内部封裝的基于記憶體的快速并發計算架構。
- 實時資料評分:支援訓練模型導出成POJO和MOJO(model-optimized Java objects),進而支援在任何環境中快速部署并對新資料提供快速預測評分。
Gartner魔力象限對2016-2017年度資料分析平台的評測如下:
由此可見h2o.ai項目是比較有發展前景的。
h2o.ai整體架構
官方文檔給出的架構圖如下:
【說明】以上是h2o.ai的核心架構h2oai/h2o-3項目的整體架構。目前的h2o.ai體系擴充了h2oai/deepwater項目整合了其核心架構h2o-3和多種深度學習平台的對接。deepwater的整體架構如下
h2o.ai源碼目錄
參考資料
(1)h2o.ai官網:https://www.h2o.ai/
(2)h2o.ai官方文檔:http://docs.h2o.ai/h2o/latest-stable/index.html
(3)h2o.ai源碼github:https://github.com/h2oai/h2o-3