パイプライン を作成した後、必要に応じてその詳細、列定義、変換を管理することができます。
要件
データ・プレパレーションは完全に組織レベルで管理され、個々のワークスペースやその権限は認識されない。
ということだ:
- データプレップは、組織内の全認証ユーザー間で共有されます。
- Chain Builderにアクセスできるユーザーは、Data Prepにもアクセスできる。
- チェーンを作成または編集できるすべてのユーザーは、Data Prepでパイプラインを管理できるようになります。
- 単一のデータ準備パイプラインは、組織内の複数のチェーンやワークスペースで使用できる。
パイプラインのカラム定義を編集する
パイプラインのカラムの名前、データタイプ、フォーマットはいつでも更新できます。パイプラインのカラムを定義するときに、そのカラムに含まれるデータのタイプを選択します:
データ型 | 説明 | 値の例 |
---|---|---|
文字列 | 英数字の羅列 | カリフォルニア州 ,400010 |
整数 | 整数。千単位の区切り記号の有無は問わない。 | 25 , 37450 |
号 | 小数を含む数値。千区切りの有無は問わない。 | 15.75 , 37865.95 , 25,789.62 |
ブーリアン型 | 真または偽の値 | 真 または1 ,誤 または0 |
日付 | 日、月、年を含む日付。 | 1/1/2021 , 2021-01-01 |
時間 | 一日のある時間 | 14:37 , 09:52:10 |
日時 | 日付とタイムスタンプ | 2021-01-01T18:26:33 |
パイプラインの列を手動で定義することも、サンプルファイルやファイルアップロードの列定義を使用することもできます。
パイプラインの作成を簡単にするために、サンプルファイルを使用してカラムを定義することをお勧めします:
注: サンプルファイルを使用するには、まずをサンプルファイル にアップロードしてください。
- WdataChains から、Data Prep をクリックする。
- Pipelines から、パイプラインを開きます。
- Columns タブで、Edit columns をクリックする。
-
列の定義 の下で、リストから選択 をクリックする。
- 使用する列定義のサンプルファイルを選択し、OK をクリックします。
注: サンプルファイルのカラム定義は、パイプライン用に定義されたカラムを置き換えます。
- 列の定義を確認し、必要に応じて列の名前を編集する。
- [保存]をクリックします。
パイプラインのカラムを定義するには、同じカラム定義のファイルをアップロードします。
注: ファイルは区切りがあり、ヘッダー行を含んでいなければならない。
- WdataChains から、Data Prep をクリックする。
- Pipelines から、パイプラインを開きます。
- Columns タブで、Edit columns をクリックする。
-
列の定義 の下で、ファイルから作成 をクリックする。
- 使用する列定義のファイルを参照して選択し、OK をクリックします。
注: ファイルのカラム定義は、パイプライン用に定義されたカラムを置き換えます。
- 列の定義を確認し、必要に応じて列の名前とデータ型を編集する。
注: 必ず列の定義を見直して更新すること。パイプラインは、ファイルのヘッダー行から列名を使用し、データに基づいてデータ型を推測する。
- [保存]をクリックします。
手動で列を定義するには
- WdataChains から、Data Prep をクリックする。
- Pipelines から、パイプラインを開きます。
- Columns タブで、Edit columns をクリックする。
-
列の定義 の下で、列の追加 をクリックする。
- 列のデータ型を選択する。
- カラムを識別するための名前と説明を入力します。
- カラムのデータの書式を、その型に基づいて指定する:
- String カラムの場合、universally unique identifiers (UUID)、binary string、e-mailアドレス、uniform resource identifiers (URI) webアドレスなど、特殊なフォーマットを選択します。
- 整数 列の場合は、千のセパレータを選択します。
- 数 列の場合、小数点以下の桁数を入力し、小数点と千のセパレータを選択します。
- Date,Time, またはDateTime カラムについて、そのstring-from-time (strftime) フォーマット を選択します。
注: ABinary 列には、True または False、あるいは 1 または 0 といった値が含まれる。
- すべての列を定義したら、Save をクリックします。
パイプラインをコピーする
他のパイプラインと同じようなカラムやトランスフォームを持つ新しいパイプラインをすばやく作成するには、既存のパイプラインのコピーから始めます:
-
Pipelines
から、既存のパイプラインのCopy をクリックします。 - 新しいパイプラインの名前を変更するには、その名前を編集し、OK をクリックします。
- 必要に応じて、列の定義や変換を編集する。
- [公開]をクリックします。
パイプラインのアーカイブ
パイプラインを使用しなくなった場合は、アーカイブしてアクティブでなくすることができます:
-
Pipelines
から、Active タブの、Archive for the pipeline をクリックします。 - パイプラインのメニューから、Archive 。
注: アーカイブされたパイプラインをアクティブ ステータスに戻すには、パイプライン からアーカイブ タブを選択し、アーカイブ解除
をクリックします。パイプラインの削除
パイプラインを完全に削除するには、パイプラインを削除します。
注: アーカイブされたパイプラインとは異なり、削除されたパイプラインを復元することはできません。パイプラインの削除は、そのパイプラインが不要になった場合にのみ行う。
- Pipelines から、パイプラインがアクティブであればアーカイブする。
-
Archived タブで、パイプラインのDelete
をクリックします。 -
を確認し、
を削除する。
- [削除]をクリックします。