從Data Prep ,您可以建立並執行序列 (pipelines) 以及建立功能轉換(mapping groups)。
管道 是一系列技術轉換,用於鏈中的表格輸出。例如,您可以設定常見轉換的管道,以便為記錄的各個系統準備資料,或從記錄的各個系統中準備資料。
提示: 如果您的鏈使用表格轉換 和檔案公用程式 指令 的共同序列來更新記錄系統中的資料,則可建立管道,使用單個執行管道 指令 執行這些轉換。
管道可以應用轉換 :
- 修改資料的佈局,例如新增或移除欄位或調整其值
- 根據特定條件套用篩選器以移除資料中的行
- 根據特定列排序資料或套用總和
- 根據定義的規則映射資料模型之間的關係
映射組 定義如何將編碼/值從一個系統轉換到另一個系統,從而建立不同企業系統的資料模型之間的關係。它們在 Pipeline 中應用為轉換步驟。
映射群組支援一系列功能強大但使用簡單的映射技術,可滿足一般或複雜的需求。它們專為使用者定義和更新以轉換和協調資料而設計。映射群組可在多個管道中共用。介面非常類似 Excel,提供熟悉且親切的感覺。
要求
Data Prep 完全由組織層級控制,不識別個別工作空間或其權限。
這表示
- Data Prep 由您組織中的所有授權使用者共用。
- 任何具有 Chain Builder 存取權限的使用者也具有 Data Prep 存取權限。
- 所有可以建立或編輯鏈的使用者都可以在 Data Prep 中管理管道。
- 單一 Data Prep 管道可在組織內的多個鏈和工作區中使用。
步驟 1.設定資料準備連接
若要將一個管道的轉換套用到一個鏈中的資料,您需要包含Data Prep connector'sRun pipeline 指令。如果還沒有,設定Data Prep 連接 。設定Data Prep 連線後,您可以開啟Data Prep from WdataChains 。
步驟 2.上傳樣本檔案
FromSample files inData Prep,上傳表示要轉換的表格資料的樣本檔案 ,以協助簡化管道建立。
上傳之後,您可以使用範例檔案:
- 快速定義管道與之互動的資料列和類型
- 預覽管道或映射轉換如何影響資料
步驟 3.為對應轉換建立群組
若要映射管道內資料模型之間的關係,您可以包含映射轉換。來自映射群組 在資料準備,建立映射群組 以定義值之間的關係,以及如何在映射轉換中將值從一個系統轉換到另一個系統。
秘訣: 若要在管道執行時設定映射轉換的值,設定映射群組的執行時間變數 。
建立映射群組時,您可以定義其規則 ,以根據精確匹配、簡單模式或正則表達式來轉換值。
步驟 4.設定管道
管道是應用於 Data Prep 所處理的資料的技術和功能轉換的集合。
-
在 Pipeline 中定義的技術轉換 用於修改資料佈局。新增或移除欄、重新排序欄或插入新欄等活動都是技術轉換的範例。
-
功能轉換 是在被整合的系統的資料模型之間建立關係的過程。功能轉換通常稱為映射,由資料準備映射群組管理。映射組作為轉換步驟應用在 Pipeline 中。
要定義應用於表格資料的轉換順序,從建立管道 在建立管道 在 資料準備.
當您建立管道時,您可以
- 手動或根據樣本檔案或上傳的分隔檔案,定義與其交互的資料列和類型
- 設定管道執行時依序套用的轉換
秘訣: 若要在管道執行時設定變形的值,設定管道的執行時間變數 。
步驟 5.在鏈中執行管道
若要將變換套用至鏈中較早輸出的表格資料,請使用Data Prep 連接器的Run pipeline 指令 。設定命令時,您: 選擇要執行的管道和要轉換的表格輸出:
- 選擇要執行的管道和要轉換的表格輸出
- 將表格檔案的列對應到管道的列定義
- 為管道設定任何執行時間變數值