天天看點

基于Dataphin進行主題式查詢的小竅門

作者:李黎 更多内容詳見資料中台官網

https://dp.alibaba.com

導讀:之前給大家介紹了 Dataphin 的主題式資料查詢的相關内容,今天就通過一個案例給大家帶來一些基于Dataphin 提供的邏輯 SQL 進行主題式查詢使用上的小竅門,希望能幫助大家更好的使用 Dataphin 進行主題式查詢。

背景:某企業周年慶推出了一些營銷活動,老闆想檢視一下各個門店的在這次活動中的營銷效果如何,剛剛學會使用Dataphin的小D接到了這個任務,信心滿滿。整個過程分為資料準備、分析思路建構和執行(執行前進行基本的資料探查式分析)。

一、資料準備:

基于Dataphin的規範模組化功能小D建立了如下圖所示的邏輯模型,以活動為中心,同時關聯了參與活動的相關門店資訊。這樣,所有需要分析的活動相關的資料基本上都已經在這個“活動事實表”中可以擷取到了。

基于Dataphin進行主題式查詢的小竅門

二、分析思路建構:

營銷效果的分析,目的是客觀呈現門店的情況,同時發現其中的問題。是以采用了總、分、對比及專項問題探索的方式進行分析。

1、總:對活動總體情況進行分析,宏觀了解活動總體體量;

2、分:拆解至地域(省份、城市)、管道(門店)、時間(各月份),進行細項的了解和檢視;

3、對比:分析中常見的方式是橫向對比(如門店間、城市間等)、縱向對比(時間趨勢、同環比);

4、專項:定義潛在的問題專項,專題量化分析,如門店活動執行率優/劣、營收貢獻度的情況;

三、執行:

在實際執行前,小D主要工作是進行資料的探查。這個時候就要發揮前面準備的資料邏輯表的威力啦!

基于Dataphin進行主題式查詢的小竅門
基于Dataphin進行主題式查詢的小竅門

幾秒鐘的功夫,想要的資料就已經擷取到啦!小D心花怒放。

這裡小編追加給一個小竅門哦!

考慮到邏輯表的字段很多,且是星型模型的,Dataphin 邏輯 SQL 對邏輯SQL的SELECT 進行了一定傳回結果字段限制,即:SELECT 隻會傳回目前邏輯表主表的字段(目前例子中是活動事實表忠心部分的内容),不會傳回引用表(目前例子中的活動次元表)的字段。

如果要查詢引用表字段,可以通過這樣方式:

基于Dataphin進行主題式查詢的小竅門

2、接着,小D決定對活動執行率進行專項分析下:查詢浙江省今年8月份,實際做活動産場次小于計劃活動場次的門店情況:

基于Dataphin進行主題式查詢的小竅門

這裡小編再給一個竅門哦!

邏輯表通常是通過星型模型進行組織,是以使用中可以從一張邏輯表出發,通過引用關系通路其他多張表的字段。

比如小D想擷取 dim_shop 維表中的店鋪資訊,通過關聯查詢語句 a.dim_shop.xxx 就可以直接查詢得到。

要注意的是,引用邏輯表的通路,采用的是角色名而不是邏輯表名,dim_shop就是角色名。類比面向對象方法,一個對象有多個執行個體,在Dataphin中,邏輯表就相當于對象,角色則相當于執行個體。因為有可能多個字段引用了同一張邏輯表,而邏輯表含義(執行個體)其實已經不同了,是以需要通過角色來進行區分。比如:交易活動中,買家和賣家的基本資訊都是來自會員表,那麼會員表就會在這個邏輯模型中出現兩次,一次角色為買家表、另一次角色為賣家表,其中涉及的字段都是一樣的。

于是隻用了幾分鐘,小D又完成了一個分析名額。還好之前認真看了使用者指南,現在查詢起來手到擒來,小D暗喜。

3、最後,小D 決定對活動銷售金額貢獻度專題分析下,查詢 19 年 11 月上半月門店銷售額大于1萬所在的城市情況:

基于Dataphin進行主題式查詢的小竅門

如果沒有在Dataphin中建好的邏輯模型,小D需要執行如下 SQL語句獲得結果:

基于Dataphin進行主題式查詢的小竅門

需要注意的是關于時間分區的使用:

如果查詢語句中顯式指定分區,Dataphin 會按照分區進行對齊查詢這個邏輯表對應的各項資料的時間分區;

如果沒有指定引用表分區(主表分區必須指定),将出現資料關聯暴漲、資料傾斜等可能影響資料查詢結果或查詢時間的情況,是以我們提供了分區的預設指定(引用表預設分區規則:主表分區限定的最大值;如本例中,預設用了主表分區最大值'20191115')。

對比下來,效率真是提升了不少呢,出錯幾率也大大降低了。

接下來,小D針對探索的資料情況,将進行系統性的資料查詢和資料分析報告撰寫啦!

最後小編再給一個竅門哦!

Dataphin的邏輯表打通阿裡雲BI工具Quick BI的功能即将上線,探查完資料後,分析可以到Quick BI中拖拉拽、可視化地完成,導出報告遞交老闆,效率杠杠滴!!

歡迎大家跟小D一起來體驗Dataphin,在業務場景中使用上述小技巧,提升研發效率、探索資料價值哦~

更多内容詳見資料中台官網