天天看點

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

資料準備時,我們經常會遇到需要拆分的字段。對于比較簡單規整的字段,可以用 split() 函數進行拆分。

但是,如果遇到較複雜的情況(如下圖):沒有固定的長度,分隔字元不固定,分隔字元的數量也不固定。用普通的拆分方法,需要重複很多次,費時費力。

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

對于這種複雜字段,有辦法快速拆分麼?有的,試試 Tableau Prep 正規表達式的字元串處理方法吧!

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

本期《舉個栗子》,我們要給大家分享的 Tableau 技巧是:用 Prep 正規表達式拆分複雜字段。

為友善學習,栗子使用自備的上述示例資料。掌握栗子方法後,資料粉可嘗試使用自己的資料源。懶癌患者可通過以下連結擷取栗子資料源:

https://www.dkmeco.com/cms/course/detail/535?suid=5

具體步驟如下:

01、 建立自定義計算替換字元

打開 Tableau Prep 連接配接栗子資料源“複雜拆分”,建立一個清理步驟:單擊資料表右側

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

按鈕,下拉菜單選擇:+ 清理步驟。

首先,需要将多種分隔符号統一替換成可自動拆分的半角符号。

單擊“待拆分字段”右上角圖檔符号,下拉菜單選擇:建立計算字段-自定義計算。使用 REGEXP_REPLACE() 函數,按照正規表達式對字段進行拆分。

Tips:REGEXP_REPLACE 函數的作用是把字段中符合正規表達式的字元,替換成指定的字元。有三個接收的參數,分别是 REGEXP_REPLACE(<待處理的字段名稱>,<正規表達式>,<替換成字元>)。

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

将計算字段命名為:拆分字段,鍵入函數

REGEXP_REPLACE([待拆分字段], “[,, |分數]+”, “,”)

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

計算說明:示例中的正規表達式’[,,| 分數]+’,意思是比對 [] 内的任意字元,比對次數可以是 1 次或多次。連起來的意思是把“待拆分字元串”中包含的任意數量的表達式字元,替換成為半角符号。

計算應用儲存後,可以看到替換效果如下:

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

02、 拆分字段

單擊“拆分字段”右上角

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

符号,下拉菜單選擇:拆分值-自動拆分。

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

如此,就完成了我們想要的字段拆分結果。

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段

本期的 Tableau 技巧,你 Get 到了嗎?趕快試試看吧!

下一期,再見~

舉個栗子!Tableau 技巧(199):用 Prep 正規表達式拆分複雜字段
文章部分資訊來源于網絡,如有侵權請告知

繼續閱讀