在本連線學習路徑中,我們將從一個系統中提取資料,並執行多種轉換,以準備資料檔案載入另一個系統。
| 主要學習目標 | 強調 Tabular Transformation Connector 的一些簡單但功能強大的指令,可用於滿足常見的轉換需求 |
| 必要條件 | 配置HTTP,檔案公用程式, 和表格轉換 連接器連線 |
| 支援鏈結模板 | CLP | 表格轉換 |
步驟 1:建立鏈條
- 新增鏈
- 命名鏈:CLP | 表格轉換
- 建立連鎖變數
- 儲存鏈
步驟 2:從源系統擷取資料
使用 HTTP Connector 說明如何從沒有 Workiva Connector 的資料來源擷取資料。
- 從 HTTP Connector 新增 GET 指令到 Start 節點
- 使用下列內容設定指令:
步驟 3:更新資料檔案中的標頭
更新檔案中的標頭,使其與轉換完成後將載入資料檔案的系統的欄位名稱相符。Map Headers 指令允許我們根據索引更新欄位名稱,使 Command 在將來欄位名稱變更時更具彈性。
- 從Tabular Transformation Connector 新增Map Headers Command 到 Chain。
- 將 Start Node (HTTP - Get Source System Data) 連接到Map Headers Command
- 編輯指令:
- 命名該命令:映射標頭
- 按一下輸入檔案 參數。Variable(變量)選擇窗格向左打開。在Command 部分下,展开Get - Source System Data Command 并选择Response Output。
- 將輸出檔案參數留空
- 勾選預覽結果
- 將Delimiter 保留為Comma ,因為來源系統資料檔案是以逗號分隔的。
- 在Input Headers 參數中,輸入數字 0 (0) 到 7 (7),因為檔案有八個欄位,而且清單以 0 為基礎。請務必在輸入每個數字後按 Enter 鍵!
- 勾選使用索引 。這會告訴 Command 輸入標題是基於檔案中的位置,而非實際列名。
- 在輸出標題中,指定要建立的新欄位名稱。順序很重要,因為清單中的第一個項目會取代來源系統檔案中第一個欄位的標頭名稱,其餘每個項目則依此類推。鍵入下列標頭,並在每個標頭後按下 Enter 鍵:
- PRODUCT
- 市場
- 月份
- 案例
- 銷售
- COGS
- 支出
- 營運收入
- 儲存指令
步驟 4:將資料列移至行
接下來,更新資料檔案,將多列資料轉換到行中,以建立單一資料列。此操作稱為取消轉軸。Unpivot 操作將資料對齊成下游系統的預期格式,即包含所有資料的單列。
- 從Tabular Transformation Connector 新增Unpivot 指令到 Chain。
- 連接Map Headers 指令到Unpivot 指令
- 編輯指令
- 命名命令:取消支點 - 移動測量至行
- 為輸入檔案 參數選擇Map Headers Output
- Map Headers 輸出仍以逗號分隔,因此我們將Delimiter 保留為Comma。
- 在Aggregation 參數中,選擇Sum 。當選擇 Sum 時,任何由取消支點所建立的橫跨列相同的結果列,都會將資料值聚合為單一資料點。
- 在New Column Label 參數中,輸入Measures 。這是新欄位的標題,此欄位將會建立,並使用未樞軸化欄位的標題值填入。
- 在資料列標籤 參數中,輸入金額
-
資料標題,起始樞軸列名稱,結束樞軸列名稱,起始樞軸列索引, 和結束樞軸列索引 欄位用於執行樞軸運算。並非所有這些參數都需要指定。
- 如果使用Data Headers 參數,則其餘參數應留空。Data Headers 參數允許指定欄位名稱。此参数对于非并发/并列字段非常有用。
- Starting/Ending Column Name 參數允許指定第一列和最後一列的名稱(對於並行區間)。如果使用這些參數,Data Headers 參數以及Starting/Ending Column Index 必須留空。如果終止列名稱 留空,則會對起始列名稱 之後(包括該欄)的所有欄位執行取消轉軸。
-
Starting/Ending Column Index 參數允許指定第一列和最末一列的位置(對於同時存在的範圍)。如果使用這些參數,Data Headers 參數以及Starting/Ending Column Name 必須留空。如果終止列索引 留空,則將對起始列索引 之後(包括該索引)的所有欄位執行取消支點。我們在本練習中使用這些參數。
- 在Starting Pivot Column Index 中,輸入4 。這會告訴 Command 從第五列開始樞軸運算,因為索引是以零為基礎的。
- 將Ending Pivot Column Index 留空。
- 勾選預覽結果選項
- 儲存指令
步驟 5:更新情境
下一步,變更方案名稱。這說明了適合 Integration Studio 的簡單、一次性轉換。Data Prep 可大幅簡化更廣泛或複雜的重新命名轉換。
- 從Tabular Transformation Connector 新增Find and Replace Command 到 Chain。
- 連接Unpivot 指令到Find and Replace 指令
- 編輯指令:
- 命名命令:查找和替換 - 預算與計劃
- 在輸入檔案 參數中,選擇樞軸結果 Unpivot 指令的輸出
- 將輸出檔案 參數留空
- 勾選預覽結果
- 未引用的檔案仍以逗號分隔,因此請指定Delimiter 為逗號
- 我們將尋找文字 Budget,並將其取代為文字 Plan。在Find pattern 參數中,輸入Budget 。
- 在Match Pattern Value 參數中,選擇Exact。
- Exact 表示我們要尋找 Find 模式參數中指定的整個文字。若要搜尋子串或通配符,我們需要使用正規表示法 (regex) 模式類型。
- 在替換值 參數中,輸入Plan 。任何文字 Budget 的實例都會被文字 Plan 取代。
- Replace matches only 參數不適用於精確匹配,可以不選取,因為這是預設值。
- 不勾選Case Insensitive 選項。這會使 Find and Replace 作業區分大小寫,因此Budget 會被Plan 取代,但budget 不會被取代。
- 尋找樣式 (預算) 位於第四列的 Scenario 列。在Columns 參數中,輸入數字三 (3),因為該參數以零為基礎。
- 儲存指令
步驟 6:僅保留紐約計劃資料
接下來,使用 Smart Filter 指令僅保留 New York 的計劃。此智能篩選器可讓我們根據資料指定條件,從資料集中保留或刪除某些行。
- 從表格轉換連接器 新增Smart Filter Rows 指令至鏈。
- 連接Smart Filter Rows 指令到Find and Replace 指令
- 編輯指令:
- 命名該命令:智能篩選行 - 僅紐約計劃
- 在輸入檔案參數中,從「尋找和取代」指令中選擇「尋找和取代」輸出
- 將輸出檔案 參數留空
- 指定逗號 為分隔符
- 在篩選器 區段中,可使用文字 、數字 和日期 篩選器。可指定多個篩選條件。如果對不同類型(文字、數字、日期)應用篩選器,則需要相應指定左上方的操作符。如果在特定類型 (例如文字) 中應用多個條件,則需要指定該篩選器類型的 Operator。
- 在此練習中,我們將應用基於文字的篩選器,因此全局運算符號可以是和 或或 。
- 如有必要,請將一般操作符設定為AND
- 按一下文字 篩選條件的新增按鈕
- 在欄名稱 參數中,輸入Scenario
- 不勾選大小寫不敏感
- 從Condition 下拉式選單中,選擇Equals
- 在Compare Text 參數中,輸入Actual
- 不勾選Not 和Trim 核取方塊
- 此過濾器將用於移除 Scenario 欄位包含Actual 值的任何記錄。
- 再次按一下文字篩選器部分的新增按鈕
- 將文字篩選條件操作員設定為OR
- 選擇 OR 組合以篩選出 Actual 和 New York
- 在第二個條件中,指定Market 為列名稱
- 設定Condition 至Equals
- 指定比較文字 為紐約
- 最後勾選不是 選項
- 將文字篩選條件操作員設定為OR
- 勾選預覽結果選項
- 如有必要,請將一般操作符設定為AND
- 在此練習中,我們將應用基於文字的篩選器,因此全局運算符號可以是和 或或 。
- 反向選項允許智慧篩選器保留(勾選)或移除(未勾選)所有符合篩選條件的行。在本練習中,我們要移除 Scenario 等於 Actual 或 Market 不等於 New York 的所有行。為了達到這個目的,我們取消勾選 反向 選項。
- 儲存指令
步驟 7:新增年份欄
最後,在資料集中新增一列,表示資料的年份。
- 從表格轉換連接器新增插入欄指令至鏈
- 將插入欄指令連接至智慧過濾行指令
- 編輯指令,並使用下列內容設定:
| 名稱 | 插入欄 - 計劃年度 |
| 輸入檔 | 智能篩選行輸出 |
| 輸出檔案 | <leave blank> |
| 預覽結果 | 已核取 |
| 驅動程式 | 逗號 |
| 標頭文字 | 年 |
| 資料值 | 2022 |
| 插入索引 | 3 |
- 儲存指令
步驟 8:測試練習
現在 Chain 已經完成,請測試結果。
- 發佈 連鎖
- 按一下執行,然後選擇執行連鎖
- 連鎖完成後,按一下插入欄 - 計劃年度節點
- 在「輸出」標籤上,確認385 記錄 已輸出
- 按一下日誌索引標籤,並根據下圖確認資料
輸出索引標籤
日誌標籤
要瞭解有關使用 Chains 進行資料轉換的更多資訊,請查看Connected Learning Paths - Transformation Introduction !