パイプラインを作成した後、必要に応じてその詳細、列定義、変換を管理することができます。
要件
データの準備は完全に組織レベルでコントロールされ、個々のワークスペースやその権限は認識されない。
という意味だ:
- データの準備は、組織内のすべての作成権限者間で共有されます。
- チェーンビルダーにアクセスできるユーザーは、データの準備にもアクセスすることができます。
- チェーンを作成または編集できるすべてのユーザーは、データの準備でパイプラインを管理できるようになります。
- 一つのデータ準備パイプラインは、組織内の複数のチェーンやワークスペースにまたがって使用することができる。
パイプラインの列定義の編集
パイプラインの列の名称、データ型、書式設定はいつでも更新できます。パイプラインの列を定義するときに、その列が含むデータのタイプを選択します:
| データ型 | 説明 | 値の例 |
|---|---|---|
| 文字列 | 英数字の羅列 | カリフォルニア州,400010 |
| 整数 | 1000の区切り記号の有無にかかわらず整数 | 25, 37450 |
| 号 | 1000の区切り記号の有無にかかわらず、小数の桁数を含む数値 | 15.75, 37865.95, 25,789.62 |
| ブーリアン型 | 真または偽の値 | 真または1、誤または0 |
| 日付 | 日、月、年を含む日付。 | 1/1/2021, 2021-01-01 |
| 時間 | ある時間帯 | 14:37, 09:52:10 |
| 日時 | 日付とタイムスタンプ | 2021-01-01T18:26:33 |
パイプラインの列をマニュアルで定義することも、サンプルファイルやアップロードファイルの列定義を使用することもできます。
パイプラインの作成を簡単にするために、サンプルファイルを使用して列を定義することをお勧めします:
注: サンプルファイルを使用するには、まずサンプルファイルにアップロードします。
- Wdataチェーン から、データの準備 をクリックする。
- Pipelines から、パイプラインを開きます。
- 列 タブで、列の編集 をクリックする。
-
列を定義の下で、リストからピッキングをクリックします。
- 使用する列定義のサンプルファイルを選択し、OK をクリックします。
メモ: サンプルファイルの列定義は、パイプライン用に定義された列を置換します。
- 列の定義をレビューし、必要に応じて列の名称を編集する。
- [保存]をクリックします。
パイプラインの列を定義するには、同じ列定義のファイルをアップロードします。
メモ: ファイルは区切りで、ヘッダー行を含んでいなければならない。
- Wdataチェーン から、データの準備 をクリックする。
- Pipelines から、パイプラインを開きます。
- 列 タブで、列の編集 をクリックする。
-
列の定義 の下で、ファイルから作成 をクリックする。
- 使用する列定義のファイルをブラウズして選択し、OK をクリックする。
メモ: ファイルの列定義は、パイプライン用に定義された列を置換する。
- 列の定義をレビューし、必要に応じて列の名称とデータ型を編集する。
メモ: 必ず列の定義をレビューし、更新すること。パイプラインは、ファイルのヘッダー行から列名称を使用し、データに基づいてデータ型を推測する。
- [保存]をクリックします。
手動で列を定義するには:
- Wdataチェーン から、データの準備 をクリックする。
- Pipelines から、パイプラインを開きます。
- 列 タブで、列の編集 をクリックする。
-
列の定義 の下で、列の追加 をクリックする。
- 列のデータタイプを選択する。
- 列を識別するための名称と説明を入力します。
- 列のタイプに応じて、列のデータの書式を設定する:
- String列の場合、universally unique identifiers (UUID)、binary string、e-mail address、uniform resource identifiers (URI) web addressなどの特殊書式設定を選択します。
- 整数 列の場合は、1000 の区切り記号を選択します。
- 数の列の場合、小数の桁数を入力し、小数と1000の区切り記号を選択します。
- Date,Time, またはDateTime 列については、そのstring-from-time (strftime) 書式 を選択する。
メモ: バイナリ 列は、TrueまたはFalse、あるいは1または0といった値を含む。
- すべての列を定義したら、保存 をクリックする。
パイプラインのコピー
他のパイプラインと同様の列や変換/トランスフォーメーションを持つ新規パイプラインを素早く作成するには、既存のパイプラインのコピーから始めます:
-
Pipelines から、既存のパイプラインのCopy をクリックします。
- 新規パイプラインの名前を変更するには、その名称を編集し、OK をクリックします。
- 必要に応じて列定義や変換を編集します。
- [公開]をクリックします。
パイプラインをアーカイブ
パイプラインを使用しなくなった場合は、アーカイブしてアクティビティから外すことができます:
-
パイプライン から、アクティブタブ上でアクティブをクリックし、パイプライン向けにをクリックします。
- パイプラインのメニューから、アーカイブを選択します。
メモ: アーカイブされたパイプラインをアクティブ ステータスに返却するには、パイプライン から、アーカイブ タブを選択し、アーカイブ解除 をクリックします。
パイプラインの削除
パイプラインを完全に削除するには、削除します。
注: アーカイブパイプラインとは異なり、削除したパイプラインを復元することはできません。パイプラインの削除は、不要になった場合のみ行ってください。
- Pipelines から、アクティブであればパイプラインをアーカイブ(する)。
-
アーカイブタブ上で、パイプラインの削除 をクリックします。
-
確認で
削除を入力します。 - [削除]をクリックします。