天天看點

MaxCompute問答整理之6月

本文是基于本人對MaxCompute産品的學習進度,再結合開發者社群裡面的一些問題,進而整理成文。希望對大家有所幫助,下面咱們正式開始。

1、什麼是MaxCompute呢?

MaxCompute是由阿裡人自主研發的海量資料處理平台,可以稱它為計算引擎。它主要提供針對TB/PB級資料、實時性要求不高的分布式處理能力,主要服務于批量結構化資料的存儲和計算。簡單來說呢,就是資料要存到MaxCompute裡面,需要的時候再取出來。

2、為什麼要使用MaxCompute呢?

MaxCompute的特點可以簡單總結為5點:

開箱即用線上服務,五分鐘即可開通大資料平台。

高效能低成本,持續高效低成本的大資料引擎。

支援多種分布式計算模型,滿足不同場景下的技術需求。

生态融合,支援多樣資料源、生态工具和标準。

安全可靠,多租戶資料安全保障機制。

3、使用MaxCompute需要什麼專業技能?

JAVA、SQL、Python。

4、使用MaxCompute需要準備什麼開發工具呢?

這裡面的工具有三種:

Odpscmd:MaxCompute用戶端,喜歡用指令行的同學可以試試。

https://help.aliyun.com/document_detail/27971.html

因為odpscmd是基于JAVA開發的,是以記得配置JRE 1.7以上版本,建議使用JRE1.7/1.8。

MaxCompute Studio:是MaxCompute平台提供的安裝在開發者用戶端的大資料內建開發環境工具,是一套基于流行的內建開發平台IntelliJ IDEA的開發插件。

https://help.aliyun.com/document_detail/50889.html

DataWorks:是阿裡雲重要的PaaS平台産品,可以提供資料內建、資料開發、資料管理、資料品質和資料服務等全方位的産品服務,擁有一站式開發管理的界面,DataWorks是基于MaxCompute為核心的計算、存儲引擎,可以提供海量資料的離線加工分析、資料挖掘等功能。

https://help.aliyun.com/product/72772.html

我想大家看完上面的内容之後,以及對MaxCompute有了初步的了解和認知,下面我根據MaxCompute開發者社群裡面大家碰見的問題做一個簡單的整理,我會從初級問題開始一步步整理,大家可以随時查閱。

問題一:怎麼擷取AccesskeyID和 Access key Secret?

使用MaxCompute服務前,我們需要準備一個阿裡雲賬号。

下面這篇文章可以完美解決大家如何擷取AK密鑰。

https://help.aliyun.com/document_detail/27803.html

問題二:MaxCompute如何計費?

當我們開通MaxCompute服務時都會碰見一個問題,如何選擇自己的計費方式,怎麼估算?MaxCompute的産品有兩種計費模型,按量付費(先使用再付費)和CU預付費(先購買資源),簡單來說就是資源共享和資源獨享的差別。

MaxCompute是以project為計費單元,計費項包括存儲、計算、資料下載下傳三類。就是分為計算費用(可預付費和後付費)、存儲費用(按量後付費)、下載下傳費用(按量後計費)。

問題三:嘗試把測試環境rds導入,結果遇到了類似分區,不知道怎麼查文檔解決?

當我們在MaxCompute上面開始建表,檢視分區等操作時,總是會碰見一些各種各樣的問題。不怕,咱們有官方文檔,有非常詳細的解釋和介紹。

https://help.aliyun.com/document_detail/27829.html

問題四:EMR和MaxCompute的差別?

很多人都會問有了EMR,為什麼還有MaxCompute?下面我給大家解釋一下,

EMR是建構在阿裡雲雲伺服器ECS上的開源Hadoop、Spark、Hive、Flink生态大資料PaaS産品,主要是提供使用者在雲上使用開源技術建設資料倉庫、離線批處理、線上流式處理、及時查詢、機器學習等場景下的大資料解決方案。

MaxCompute是阿裡人自主研發的,對外不開源,封裝使用起來友善,而且運維成本比較低,兩者在使用場景上基本沒有差别。

問題五:如何檢視odps裡面sql執行所消耗的資源?

MaxCompute的計費方式有選擇,那我們怎麼去檢視呢?怎麼知道我一條SQL耗費了多少資源,下面這篇文章可以給我們很好的解答。

https://help.aliyun.com/document_detail/106521.html

問題六:MaxCompute和DataWorks的權限關系?

通過MaxCompute的安全模型進行權限控制,并不會影響成員在DataWorks任何界面操作。而通過DataWorks的使用者角色配置設定,則有可能影響成員MaxCompute資源權限。

https://help.aliyun.com/document_detail/105012.html

也可以通過視訊來了解兩者的關系。

https://help.aliyun.com/video_detail/99890.html

問題七:需要從odps資料導入到mysql,但是受到資料保護,無法導出,如何解決?

可以通過關閉資料保護或者配置exception policy 來完成。

https://help.aliyun.com/document_detail/34605.html

問題八:如何賦予操作表的權限?

MaxCompute可以通過授權方式對其中的表、任務、資源等客體的某種操作權限,包括讀、寫、檢視等。

https://help.aliyun.com/document_detail/27935.html

歡迎加入MaxCompute開發者社群2群,與更多大資料開發者一起學習交流大資料技術。

MaxCompute問答整理之6月

繼續閱讀