要使用 数据准备连接器转换表格数据,首先需要设置要应用的转换序列(或 管道) 。管道以图形方式表示其定义的转换,并可以预览每个转换的影响。
提示:如果您的流程使用一系列 通用的 表格转换和 文件实用程序 命令来更新记录系统中的数据,请创建管道 ,以便使用单个运行 管道 命令来
执行这些转换 。
要求
数据准备完全由组织级别控制,不识别单个工作区或其权限。
这意味着:
- 数据准备功能在组织内所有授权用户之间共享。
- 任何有权访问 Chain Builder 的用户也有权访问 Data Prep。
- 所有能够创建或编辑链的用户都将能够在数据准备中管理管道。
- 组织内的多个链和工作区可以使用单个数据准备管道。
步骤 1:创建管道
提示:在创建管道之前,请从 示例文件上传一个示例文件 ,该文件应包含管道将要转换 的列和数据 ,以便轻松定义管道的列并
预览应用的转换。- 在 Wdata中,单击 链 和 数据准备。
注: 要从 Wdata Chains访问 Data Prep ,首先 设置一个 Data Prep 连接器。
- 从 Pipelines 中,在 Active pipelines下,创建管道:
- 对于第一个管道,单击 创建管道。
- 否则,点击搜索栏旁边的 新建管道 (+)。
- 请输入管道名称和描述,以便识别该管道。
- 单击创建。
步骤 2. 定义列
要指定管道将与之交互的字段,请定义它要转换的数据的列。定义列时,需要指定列的名称、数据类型和格式。例如,对于数据类型为 Number 的列,指定其小数位数以及用作小数点和千位分隔符的字符。
注: 管道中定义的列名可以与它所转换的数据中的列名不同。
要定义管道的列,您可以使用上传的示例文件中的列定义,或者使用保存在本地或网络上的分隔符文件中的列定义。您也可以手动定义列。
为了简化管道创建,我们建议您使用示例文件来定义其列:
注: 要使用示例文件,请先 将其上传至 示例文件。
- 在 定义列下,单击 从列表中选择。
- 选择要使用的包含列定义的示例文件,然后单击 确定。
注: 示例文件中的列定义将替换管道中定义的任何列。
- 检查列定义,并根据需要编辑列名称。
- 点击 保存。
要定义管道的列,您可以上传一个具有相同列定义的文件。
注: 文件必须使用分隔符分隔,并且包含标题行。
- 在 定义列下,单击 从文件创建。
- 浏览并选择包含要使用的列定义的文件,然后单击 确定。
注: 文件中的列定义将替换管道中定义的任何列。
- 检查列定义,并根据需要编辑列名称和数据类型。
注: 请务必检查并更新列定义。该管道使用文件标题行中的列名,并根据数据猜测数据类型。
- 点击 保存。
手动定义列:
- 在 定义列下,单击 添加列。
- 选择列的数据类型。
- 输入名称和描述,以便识别该列。
- 根据列数据的类型,指定列数据的格式:
- 对于 String 列,可以选择任何特殊格式,例如通用唯一标识符 (UUID)、二进制字符串、电子邮件地址或统一资源标识符 (URI) 网址。
- 对于 整数列,选择 千位分隔符。
- 对于 数字 列,请输入小数位数,并选择小数分隔符和千位分隔符。
- 对于 Date、 Time或 DateTime 列,选择其 string-from-time (strftime) 格式。
注:二进制 列包含诸如 True 或 False,或 1 或 0 之类的值
。 - 定义完所有列后,点击 保存。
步骤 3. 设置转换
- 要预览转换的影响, 固定一个示例文件 ,该文件指示管道要转换的列和数据。
- 单击 创建转换。
- 选择 要应用的变换,然后单击 下一步。
- 设置转换,然后单击 保存。
- 要设置任何其他转换,请在现有转换之前或之后单击 添加转换 ,具体取决于转换应该何时发生。
提示:要添加管道中已有转换的另一个实例,请单击其 “复制” 按钮,并根据需要设置新实例
。 - 根据需要调整变换:
- 要重新定位管道中的转换,请单击其 向前移动 或 向后移动。
- 要从管道中删除转换,请单击其 删除。
注: 如果您移动或删除某个变换,请根据需要调整依赖于该变换结果的任何变换。
步骤 4. 发布管道
当管道准备就绪后,单击 发布。
发布管道后,您可以将其与 数据准备 [ 连接器 的 运行管道 命令
一起使用,以将其转换应用于链中的表格数据。