字段拼接步驟用于将多個字段拼接到一個目标字段中。字段可以用分隔符分隔。此步驟包含了“字段”和“進階”兩個标簽頁。“字段”标簽頁配置資訊如圖1所示。
圖1 整體配置資訊(字段标簽頁)
下文詳細解釋各控件的含義:
1、轉換步驟名稱:步驟的名稱,在單一轉換中,名稱必須唯一。
2、目标字段名稱:指定字段拼接後新字段的名稱。
3、目标字段的長度:指定目标字段(字元串)的長度。
4、分隔符:根據需要指定分割字段的分隔符。特殊字元可以設定為$[序号]格式。序号可以查詢ASCII表,采用十六進制表示其序号。例如$[7C]代表'|'字元。
5、外殼:設定包裹字段的字元。一定要確定每一個切分包含偶數個外殼,否則結果很難預測。Kettle将盡量確定每一個切割包含偶數個外殼,如果目前切分不包含偶數個那麼可以繼續往後連接配接切分直到包含偶數個外殼為止。例如:要拆分的字元串為“$11$|22|3$|$4|5$$6|$7$8$9|$10”,其中分隔符為“|”。如果設定Enclosure為$,那麼結果将拆分為$11$、22、3$|$4、5$$6、$7$8$9|$10;如果未設定外殼,那麼結果将拆分為$11$、22、3$、$4、5$$6、$7$8$9、$10。(1)名稱:指定進行拼接的字段名稱。
(2)類型:指定字段類型:字元串、日期、數字、布爾值、整數、BigNumber、可序列化或二進制。
(3)格式:格式化字元串時需要。例如需要格式化日期與時間,那麼可以用yyyy-MM-dd'T'HH:mm:ss.XXX,注意其中單引号限定部分。如果需要在日期格式中使用原始字母,那麼必須用單引号限定,否則将當成表達式解析。注:需與類型關聯使用。
(4)長度:對于數字:數字的有效長度;對于字元串:字元串的總長度;對于日期:字元串的列印輸出長度(例如,輸入4隻會傳回年份)。
(5)精度:對于數字:小數位數。
(6)貨币符号:貨币符号,主要用在财務場景,一般放在貨币金額數字的字首或者字尾。例如人民币一般用的¥,美元一般用$,歐元一般用€。
(7)小數點符号:在字元型轉小數型(BigNumber)時,識别字元串中的小數點。如字元串“123,456.789”和“123456.789”轉BigNumber型時,設定十進制為“.”,則能轉變為123456.789。有意思的是這裡除了能識别“.”,還能适配其他字元,如“,”、“|”、“_”、甚至字母“a”都可以。隻要字元被替換成“.”之後整個字元串是符合數字格式的就行。注意不管設定多長的字元串,這裡始終隻取第一個字元作為小數點符号。
(8)分組符号:在字元型轉小數型(BigNumber)時,識别字元串中的分隔符(常見的千位分隔符)。如字元串“6,123,456.789”轉BigNumber型時,設定分組為“,”,則能轉變為6123456.789。有意思的是這裡除了能識别“,”,還能适配其他字元,如“.”、“|”、“_”、甚至字母“a”都可以。隻要字元被轉換後整個字元串是符合數字格式的就行。另外分組可以結合小數點符号做一些更有意思的事情,如有一個字元串如“123.456,789”,将小數點符号設為“,”,将分組設為“.”,可轉換為“123,456.789”。
(9)去除空格類型:下拉框根據需要選擇去除空格的方式。
(10)預設:當字段值為空或者“null”時,為字段指定的預設值。
“進階”标簽頁配置資訊如圖2所示:……
更多詳細内容,歡迎點選下述連結檢視。
文章原創首發于:https://ckettle.ccsaii.com.cn/help/StepPluginType/ConcatFields?s=csdn