為了簡化管道 或映射群組的建立,您可以使用樣本檔案來表示部分或全部要轉換的資料。
注意: 範例檔案並未經由管道 轉換;它僅有助於簡化管道的建立,並可預覽轉換的影響。
要求
Data Prep 完全由組織層級控制,不識別個別工作空間或其權限。
這表示
- Data Prep 由您組織中的所有授權使用者共用。
- 任何具有 Chain Builder 存取權限的使用者也具有 Data Prep 存取權限。
- 所有可以建立或編輯鏈的使用者都可以在 Data Prep 中管理管道。
- 單一 Data Prep 管道可在組織內的多個鏈和工作區中使用。
樣本檔案規格
若要供管道使用,樣本檔案必須
- 最大 1 MB
- 包含標頭行
- 包含分隔符 - 逗號 (,)、制表符、管道 (|) 或分號 (;)
- 可在 Notepad++、Wordpad 或 Textpad 等文字編輯器中檢視
- 為所有行設定一致的資料配置
提示: 儘管樣本檔案中的標題名稱和欄位順序不需要與管道轉換的實際資料相符,但盡可能使樣本檔案和實際資料對齊,以避免混淆,並進一步簡化管道的建立。
例如:
PERIOD,YEAR,ENTITY,ACCOUNT,PRODUCT,AMOUNT JAN,2O21,US,SALES,REGULAR-COLA,12500 JAN,2021,US,SALES,DIET-COLA,10000 JAN,2021,US,SALARIES,,3000
注意: 範例檔案定義的欄位可能包含空值或空白值,例如範例第四行中的空白PRODUCT 欄位。
上傳樣本檔案
要上傳樣本檔案:
- 從 WdataChains, 點選Data Prep 。
注意: 要從 WdataChains 存取Data Prep ,首先設定一個Data Prep connector 。
- 從樣本檔案 ,按一下搜尋列旁邊的新增檔案 (+) 。
- 在上傳檔案 下 ,拖曳或瀏覽到要上傳的檔案。
- 在Columns 下 ,檢視並視需要調整檔案的欄定義。
- 按一下「儲存」(Save)。
編輯範例檔案的欄定義
定義樣本檔案欄時,選擇其包含的資料類型:
| 資料類型 | 描述 | 範例值 |
|---|---|---|
| 字串 | 一組字母數字字符 | 加州, 400010 |
| 整數 | 包含或不包含千位分隔符的整數 | 25, 37450 |
| 數字 | 包含小數的數字,可使用或不使用千位分隔符 | 15.75, 37865.95, 25,789.62 |
| 布林值 | 真假值 | 真 或 1, 假 或 0 |
| 日期 | 包含日、月、年的日期 | 1/1/2021, 2021-01-01 |
| 時間 | 一天中的時間 | 14:37, 09:52:10 |
| 日期/時間 | 日期和時間戳記 | 2021-01-01T18:26:33 |
編輯範例檔案的欄定義:
- 從樣本檔案 ,按一下檔案的行。
- 按一下 Columns ,然後視需要調整資料類型和詳細資料。
- 按一下「儲存」(Save)。
注意: 若要編輯或刪除樣本檔案中的欄,請使用Pipelines 索引標籤。
瞭解有關管理管道的更多資訊。
將範本檔案釘選到管道
若要預覽管道套用至資料的轉換,請釘選具有相同列定義的範例檔案:
- 從Pipelines ,開啟管道。
- 在Files 索引標籤上,按一下Pin file 以取得樣本檔案。
注意: 如有必要,請按一下上載樣本檔案 ,將樣本檔案上載到樣本檔案 。
- 將範本檔案中的欄對應到管道的欄定義。
注意: 管道自動對應具有相同確切名稱和資料類型的列。您只能對應具有相同資料類型的列。
- 按一下「提交」
將範本檔案釘選到對應群組
若要預覽映射群組應用於其主要欄位的規則,請釘選顯示其將映射資料的範例檔案:
- 從映射群組 ,開啟映射群組。
- 在Files 索引標籤上,按一下Pin file 以取得範例檔案。
- 在Match columns 下 ,選擇檔案中的哪些列映射到映射群組的列。
注意: ,您只能映射具有相同資料類型的列。
- 按一下「提交」
刪除樣本檔案
若要從移除您不再需要的樣本檔案 ,請按一下其刪除 。