每日推薦
Kettle on MaxCompute使用指南Kettle是一款開源的ETL工具,純java實作,可以運作于Windows, Unix, Linux上運作,提供圖形化的操作界面,可以通過拖拽控件的方式,友善地定義資料傳輸的拓撲。Kettle支援豐富的資料輸入輸出源,資料庫支援Oracle,MySql,DB2等,也支援業界各種開源的大資料系統,例如HDFS, HBase, Cassandra, MongoDB等。本文将介紹如何利用MaxCompute的插件無縫對接阿裡雲的大資料計算平台——MaxCompute。
>>點選了解詳情 MaxCompute中如何通過logview診斷慢作業MaxCompute緻力于批量結構化資料的存儲和計算,提供海量資料倉庫的解決方案及分析模組化服務,在MaxCompute執行sql任務的時候有時候作業會很慢,本文通過檢視logview排查具體任務慢的原因。
MaxCompute Spark 資源使用優化詳解本文主要講解MaxCompute Spark資源調優,目的在于在保證Spark任務正常運作的前提下,指導使用者更好地對Spark作業資源使用進行優化,極大化利用資源,降低成本。
MaxCompute跨境通路加速解決方案MaxCompute聯合全球加速服務,為有跨境通路需求的MaxCompute客戶提供一套高效穩定的跨境通路加速方案。
基于 MaxCompute 的智能推薦解決方案在網際網路行業紅利已過、在獲客成本越來越高、在使用者線上時長全網基本無增長以及資訊大爆炸的情況下,如何更好的轉化新使用者和提升老使用者粘性就變得至關重要,智能化的個性化推薦無疑是經過驗證的重要手段之一,我們每天使用的移動App或企業内都處處有其身影。
MaxCompute執行引擎核心技術DAG揭秘作為業界少有的EB級資料分布式平台,MaxCompute每天支撐上千萬個分布式作業的運作。這些作業特點各異,既有包含數十萬計算節點的超大型作業,也有中小規模的分布式作業。不同使用者對于不同規模/特點的作業,在運作時間,資源使用效率,資料吞吐率等方面,也有着不同的期待。DAG作為MaxCompute執行引擎的核心技術之一,在提供了底層統一的動态執行架構的同時,實作了一個在離線混合的執行模式(Bubble Execution),達到了平衡極緻性能以及高效的資源使用率的目的。