天天看點

MaxCompute UDF系列之判斷字元串中是否包含漢字

為了驗證字元串中是否包含中文漢字,今天為大家提供一個自動判斷中文字元的maxcompute udf,下載下傳位址見附件。

效果如下:

MaxCompute UDF系列之判斷字元串中是否包含漢字
MaxCompute UDF系列之判斷字元串中是否包含漢字

maxcompute udf代碼如下:

使用方法:

1、通過eclipse将han.java編譯成jar包,命名為han_udf.jar。

2、通過大資料開發套件,上傳資源han_udf.jar;

MaxCompute UDF系列之判斷字元串中是否包含漢字

3、通過大資料開發套件,引用第二步上傳的han_udf.jar資源,注冊han函數;

MaxCompute UDF系列之判斷字元串中是否包含漢字

4、通過大資料開發套件建立sql腳本,輸入sql函數進行測試。

到此為止,實驗完成。

常見問題

q:無結果?

我們在建立虛拟dual表的時候,一定要保證表中有資料。

q:無法找到han函數?

利用大資料開發套件注冊han函數的時候需要包名+類名,否則會找不到類。

<a target="_blank">---阿裡大資料博文,問答,社群,實踐,有朋自遠方來,不亦說乎……</a>

MaxCompute UDF系列之判斷字元串中是否包含漢字