Data Prep コネクター で表形式データを変換するには、まず適用する変換のシーケンス、つまりパイプラインを設定します。パイプラインは、定義された変換をグラフィカルに表示し、各変換の影響をプレビューできます。
ヒント: チェーンで、Tabular TransformationとFile Utilitiesコマンドの共通のシーケンスを使用して、データレコードのシステムからデータを更新する場合、パイプラインを作成して、これらの変換を単一のRun pipelineコマンドで実行します。
要件
データの準備は完全に組織レベルでコントロールされ、個々のワークスペースやその権限は認識されない。
という意味だ:
- データの準備は、組織内のすべての作成権限者間で共有されます。
- チェーンビルダーにアクセスできるユーザーは、データの準備にもアクセスすることができます。
- チェーンを作成または編集できるすべてのユーザーは、データの準備でパイプラインを管理できるようになります。
- 一つのデータ準備パイプラインは、組織内の複数のチェーンやワークスペースにまたがって使用することができる。
ステップ1.パイプラインの作成
ヒント:パイプラインを作成する前に、サンプルファイルから、サンプルファイルをアップロードします。
-
Wdata で、チェーン とデータの準備 をクリックする。
注: チェーンからデータ準備に使用するには、まずデータ準備コネクターを設定します。
-
Pipelines から、Active pipelines の下に、パイプラインを作成します:
- 最初のパイプラインについては、パイプラインの作成 をクリックする。
- それ以外の場合は、検索棒グラフの津なりの新規パイプライン (+) をクリックします。
- パイプラインの識別子となる名称と説明を入力する。
- 作成をクリックします。
ステップ2.列を定義する
パイプラインが対話するフィールドを指定するには、変換するデータの列を定義します。列を定義する際には、その名称とデータのタイプと書式を指定します。例えば、Numberデータ・タイプを持つ列の場合、小数点以下の桁数と、小数そして1000の区切り記号に使用する文字を指定します。
メモ: パイプライン用に定義された列名称は、変換/トランスフォーメーションするデータの列とは異なる場合があります。
パイプラインの列を定義するには、アップロードされたサンプルファイル、またはローカルまたはネットワーク上に保存された区切りファイルの列定義を使用できます。マニュアルで列を定義することもできる。
パイプラインの作成を簡単にするために、サンプルファイルを使用して列を定義することをお勧めします:
注: サンプルファイルを使用するには、まずサンプルファイルにアップロードします。
-
列を定義の下で、リストからピッキングをクリックします。
- 使用する列定義のサンプルファイルを選択し、OK をクリックします。
メモ: サンプルファイルの列定義は、パイプライン用に定義された列を置換します。
- 列の定義をレビューし、必要に応じて列の名称を編集する。
- [保存]をクリックします。
パイプラインの列を定義するには、同じ列定義のファイルをアップロードします。
メモ: ファイルは区切りで、ヘッダー行を含んでいなければならない。
-
列の定義 の下で、ファイルから作成 をクリックする。
- 使用する列定義のファイルをブラウズして選択し、OK をクリックする。
メモ: ファイルの列定義は、パイプライン用に定義された列を置換する。
- 列の定義をレビューし、必要に応じて列の名称とデータ型を編集する。
メモ: 必ず列の定義をレビューし、更新すること。パイプラインは、ファイルのヘッダー行から列名称を使用し、データに基づいてデータ型を推測する。
- [保存]をクリックします。
手動で列を定義するには:
-
列の定義 の下で、列の追加 をクリックする。
- 列のデータタイプを選択する。
- 列を識別するための名称と説明を入力します。
- 列のタイプに応じて、列のデータの書式を設定する:
- String列の場合、universally unique identifiers (UUID)、binary string、e-mail address、uniform resource identifiers (URI) web addressなどの特殊書式設定を選択します。
- 整数 列の場合は、1000 の区切り記号を選択します。
- 数の列の場合、小数の桁数を入力し、小数と1000の区切り記号を選択します。
- Date,Time, またはDateTime 列については、そのstring-from-time (strftime) 書式 を選択する。
メモ: バイナリ 列は、TrueまたはFalse、あるいは1または0といった値を含む。
- すべての列を定義したら、保存 をクリックする。
ステップ3.変換の設定
- 変換の影響をプレビューすべく、パイプラインによって変換される列とデータを示すサンプルファイルをピンで固定します。
-
トランスフォーメーション作成 をクリックする。
- 適用する変換を選択し、次へをクリックします。
- 変換/トランスフォーメーションを設定し、保存 をクリックする。
- 変換/トランスフォーメーションを追加設定するには、変換の追加 を、既存の変換の前または後にクリックする。
ヒント: すでにパイプラインにあるトランスフォーメーションの別のインスタンスを追加するには、そのコピー をクリックし、必要に応じて新規インスタンスを設定します。
- 必要に応じて変換を調整します:
- 変換をパイプライン内で再配置するには、前に進むまたは後ろに戻るをクリックします。
- パイプラインから変換/トランスフォーメーションを削除するには、その削除 をクリックします。
注: 変換を移動または削除した場合は、その結果に従属する変換を必要に応じて調整します。
ステップ4.パイプラインの更新
パイプラインを使用する準備ができたら、Publish をクリックします。
パイプラインを更新した後、データ準備コネクターのRun pipelineコマンド で使用し、チェーン内の表データに変換を適用できます。