雲栖号快速入門: 【點選檢視更多雲産品快速入門】 不知道怎麼入門?這裡分分鐘解決新手入門等基礎問題,可快速完成産品配置操作!
下圖為MaxCompute資料倉庫建構的整體流程。
基本概念
在正式學習本教程之前,您需要首先了解以下基本概念:
- 業務闆塊:比資料域更高次元的業務劃分方法,适用于龐大的業務系統。
- 次元:次元模組化由Ralph Kimball提出。次元模型主張從分析決策的需求出發構模組化型,為分析需求服務。次元是度量的環境,是我們觀察業務的角度,用來反映業務的一類屬性 。屬性的集合構成次元 ,也可以稱為實體對象。例如, 在分析交易過程時,可以通過買家、賣家、商品和時間等次元描述交易發生的環境。
- 屬性(次元屬性):次元所包含的表示次元的列稱為次元屬性。次元屬性是查詢限制條件、分組和報表标簽生成的基本來源,是資料易用性的關鍵。
- 度量:在次元模組化中,将度量稱為事實 ,将環境描述為次元,次元是用于分析事實所需要的多樣環境。度量通常為數值型資料,作為事實邏輯表的事實。
- 名額:名額分為原子名額和派生名額。原子名額是基于某一業務事件行為下的度量,是業務定義中不可再拆分的名額,是具有明确業務含義的名詞 ,展現明确的業務統計口徑和計算邏輯,例如支付金額。
(1).原子名額=業務過程+度量。
(2).派生名額=時間周期+修飾詞+原子名額,派生名額可以了解為對原子名額業務統計範圍的圈定。
- 業務限定:統計的業務範圍,篩選出符合業務規則的記錄(類似于SQL中where後的條件,不包括時間區間)。
- 統計周期:統計的時間範圍,例如最近一天,最近30天等(類似于SQL中where後的時間條件)。
-
統計粒度:統計分析的對象或視角,定義資料需要彙總的程度,可了解為聚合運算時的分組條件(類似于SQL中的group by的對象)。粒度是次元的一個組合,指明您的統計範圍。例如,某個名額是某個賣家在某個省份的成交額,則粒度就是賣家、地區這兩個次元的組合。如果您需要統計全表的資料,則粒度為全表。在指定粒度時,您需要充分考慮到業務和次元的關系。統計粒度常作為派生名額的修飾詞而存在。
基本概念之間的關系和舉例如下圖所示。
本文來自 阿裡雲文檔中心
MaxCompute 數倉建構流程【雲栖号線上課堂】每天都有産品技術專家分享!
課程位址:
https://yqh.aliyun.com/zhibo立即加入社群,與專家面對面,及時了解課程最新動态!
【雲栖号線上課堂 社群】
https://c.tb.cn/F3.Z8gvnK