为了简化 管道或 映射组的创建,您可以使用示例文件来指示要转换的部分或全部数据。
注: 示例文件 不会被管道 转换;它仅用于简化管道的创建过程,并允许预览转换的影响。
要求
数据准备完全由组织级别控制,不识别单个工作区或其权限。
这意味着:
- 数据准备功能在组织内所有授权用户之间共享。
- 任何有权访问 Chain Builder 的用户也有权访问 Data Prep。
- 所有能够创建或编辑链的用户都将能够在数据准备中管理管道。
- 组织内的多个链和工作区可以使用单个数据准备管道。
示例文件规范
要供流程使用,示例文件必须满足以下条件:
- 最大可达 1 MB
- 添加标题行
- 请添加分隔符——逗号 (,)、制表符、竖线 (|) 或分号 (;)
- 可在文本编辑器(例如 Notepad++、Wordpad 或 Textpad)中查看
- 所有行的数据布局保持一致
提示:虽然示例文件中的标题名称和列顺序不需要与管道转换后的实际数据完全一致,
但尽可能使示例文件和实际数据保持一致 ,以避免混淆并进一步简化管道创建。例如:
PERIOD,YEAR,ENTITY,ACCOUNT,PRODUCT,AMOUNT JAN,2021,US,SALES,REGULAR-COLA,12500 JAN,2021,US,SALES,DIET-COLA,10000 JAN,2021,US,SALARIES,,3000
注: 示例文件中定义的列可能包含空值或空白值,例如示例第四行中的空白 PRODUCT 字段。
上传示例文件
上传示例文件:
- 从 Wdata Chains中,单击 Data Prep。
注: 要从 Wdata Chains访问 Data Prep ,首先 设置一个 Data Prep 连接器。
- 从 示例文件 中,单击搜索栏旁边的 添加文件 (+)。
- 在 文件上传下,拖动或浏览到要上传的文件。
- 在 列下,根据需要检查和调整文件的列定义。
- 点击 保存。
编辑示例文件的列定义
定义示例文件列时,请选择其包含的数据类型:
| 数据类型 | 描述 | 示例值 |
|---|---|---|
| 字串 | 一串字母数字字符 | 加利福尼亚州,400010 |
| 整数 | 一个整数,带或不带千位分隔符均可。 | 25,37450 |
| 数字 | 包含小数点的数字,可以带千位分隔符,也可以不带千位分隔符。 | 15.75,37865.95,25,789.62 |
| 布尔 | 真值或假值 | 真或1,假或0 |
| 日期 | 包含日、月、年的日期 | 2021年1月1日,2021-01-01 |
| 时间 | 一天中的某个时间 | 14:37,09:52:10 |
| 日期时间 | 日期和时间戳 | 2021-01-01T18:26:33 |
要编辑示例文件的列定义:
- 从 示例文件 中,单击文件的行。
- 单击 列,然后根据需要调整数据类型和详细信息。
- 点击 保存。
注意:要编辑或删除示例文件中的列,请使用 Pipelines 选项卡。
了解更多关于管道管理的信息。
将示例文件固定到管道
要预览管道对数据应用的转换,请固定一个具有相同列定义的示例文件:
- 从 Pipelines 中打开管道。
- 在 文件 选项卡上,单击 Pin file 以固定示例文件。
注: 如有需要,请点击 上传示例文件 将示例文件上传至 示例文件。
- 将示例文件中的列映射到管道的列定义。
注: 该管道会自动映射名称和数据类型完全相同的列。只能映射数据类型相同的列。
- 点击 提交。
将示例文件固定到映射组
要预览映射组应用于其主列的规则,请固定一个示例文件,该文件应指示它将映射到的数据:
- 从 映射组 中,打开映射组。
- 在 文件 选项卡上,单击 Pin file 以固定示例文件。
- 在 匹配列下,选择文件中哪些列映射到映射组的列。
注意:只能映射数据类型相同 的列
。 - 点击 提交。
删除示例文件
要从 示例文件 中删除不再需要的示例文件,请单击其 删除。