创建 管道后,您可以根据需要管理其详细信息、列定义和转换。
要求
数据准备完全由组织级别控制,不识别单个工作区或其权限。
这意味着:
- 数据准备功能在组织内所有授权用户之间共享。
- 任何有权访问 Chain Builder 的用户也有权访问 Data Prep。
- 所有能够创建或编辑链的用户都将能够在数据准备中管理管道。
- 组织内的多个链和工作区可以使用单个数据准备管道。
编辑管道的列定义
您可以随时更新管道列的名称、数据类型或格式。定义管道的列时,请选择它包含的数据类型:
| 数据类型 | 描述 | 示例值 |
|---|---|---|
| 字串 | 一串字母数字字符 | 加利福尼亚州, 400010 |
| 整数 | 一个整数,带或不带千位分隔符均可。 | 25, 37450 |
| 数字 | 包含小数点的数字,可以带千位分隔符,也可以不带千位分隔符。 | 15.75, 37865.95, 25,789.62 |
| 布尔 | 真值或假值 | True 或 1, False 或 0 |
| 日期 | 包含日、月、年的日期 | 1/1/2021, 2021-01-01 |
| 时间 | 一天中的某个时间 | 14:37, 09:52:10 |
| 日期时间 | 日期和时间戳 | 2021-01-01T18:26:33 |
您可以手动定义管道的列,也可以使用示例文件或文件上传中的列定义。
为了简化管道创建,我们建议您使用示例文件来定义其列:
注: 要使用示例文件,请先 将其上传至 示例文件。
- 从 Wdata Chains中,单击 Data Prep。
- 从 Pipelines 中打开管道。
- 在 “列 ”选项卡上,单击 “编辑列” 。
- 在 定义列下,单击 从列表中选择。
- 选择要使用的包含列定义的示例文件,然后单击 确定。
注: 示例文件中的列定义将替换管道中定义的任何列。
- 检查列定义,并根据需要编辑列名称。
- 点击 保存。
要定义管道的列,您可以上传一个具有相同列定义的文件。
注: 文件必须使用分隔符分隔,并且包含标题行。
- 从 Wdata Chains中,单击 Data Prep。
- 从 Pipelines 中打开管道。
- 在 “列 ”选项卡上,单击 “编辑列” 。
- 在 定义列下,单击 从文件创建。
- 浏览并选择包含要使用的列定义的文件,然后单击 确定。
注: 文件中的列定义将替换管道中定义的任何列。
- 检查列定义,并根据需要编辑列名称和数据类型。
注: 请务必检查并更新列定义。该管道使用文件标题行中的列名,并根据数据猜测数据类型。
- 点击 保存。
手动定义列:
- 从 Wdata Chains中,单击 Data Prep。
- 从 Pipelines 中打开管道。
- 在 “列 ”选项卡上,单击 “编辑列” 。
- 在 定义列下,单击 添加列。
- 选择列的数据类型。
- 输入名称和描述,以便识别该列。
- 根据列数据的类型,指定列数据的格式:
- 对于 String 列,可以选择任何特殊格式,例如通用唯一标识符 (UUID)、二进制字符串、电子邮件地址或统一资源标识符 (URI) 网址。
- 对于 整数列,选择 千位分隔符。
- 对于 数字 列,请输入小数位数,并选择小数分隔符和千位分隔符。
- 对于 Date、 Time或 DateTime 列,选择其 string-from-time (strftime) 格式。
注:二进制 列包含诸如 True 或 False,或 1 或 0 之类的值
。 - 定义完所有列后,点击 保存。
复制管道
要快速创建与现有管道具有相似列或转换的新管道,首先复制现有管道:
- 从 Pipelines 中,单击 Copy 以复制现有管道。
- 要重命名新管道,请编辑其名称,然后单击 确定。
- 根据需要编辑列定义或转换。
- 点击 发布。
管道存档
如果不再使用某个管道,您可以将其归档,使其不再处于活动状态:
- 从 Pipelines 中,在 Active 选项卡上,单击 Archive 以查找管道。
- 从管道中,从其菜单中选择 存档 。
注意:要将已归档的管道恢复为 “活动 ”状态,请从 “管道”中选择 “ 已归档 ”选项卡,然后单击管道 的 ”
。删除管道
要彻底移除管道,您可以将其删除。
注意: 与已归档的管道不同,您无法恢复已删除的管道。只有在不再需要某个管道时才将其删除。
- 从 Pipelines 中,如果管道处于活动状态,则归档管道。
- 在 已存档 选项卡上,单击 以删除管道。
- 在 确认中,输入
删除。 - 点击删除。