Data Prep から、シーケンス(pipelines )の作成と実行、および機能変換(mapping groups )の作成ができる。
パイプライン は、チェーンの表形式出力に適用する一連の技術的変換である。例えば、一般的な変換のパイプラインをセットアップして、様々な記録システムにデータを準備したり、記録システムからデータを準備したりすることができる。
ヒント: Tabular Transformation およびFile Utilities コマンド の共通のシーケンスを使用してチェーンが記録システムからデータを更新する場合、これらの変換を単一のRun pipeline コマンド で実行するパイプラインを作成します。
パイプラインは、 :
- 列の追加や削除、値の調整など、データのレイアウトを変更する。
- フィルタを適用し、特定の条件に基づいてデータから行を削除する。
- データを並べ替えたり、特定の列に基づいて合計を適用する。
- 定義されたルールに基づいてデータモデル間の関係をマッピングする
マッピンググループ あるシステムから別のシステムへコード/値を変換する方法を定義することによって、異なる企業システムのデータモデル間の関係を構築する。これらは、変換ステップとしてパイプラインに適用される。
マッピンググループは、強力でありながら使いやすく、一般的な要件から複雑な要件まで対応できる、さまざまなマッピング技術をサポートしています。これは、データを変換し、調和させるために、ユーザーが定義し、更新できるように設計されている。マッピンググループは複数のパイプラインで共有できます。インターフェイスは非常にエクセル的で、親しみやすく歓迎される感じを与える。
要件
データ・プレパレーションは完全に組織レベルで管理され、個々のワークスペースやその権限は認識されない。
ということだ:
- データプレップは、組織内の全認証ユーザー間で共有されます。
- Chain Builderにアクセスできるユーザーは、Data Prepにもアクセスできる。
- チェーンを作成または編集できるすべてのユーザーは、Data Prepでパイプラインを管理できるようになります。
- 単一のデータ準備パイプラインは、組織内の複数のチェーンやワークスペースで使用できる。
ステップ1.データ準備の接続を設定する
パイプラインの変換をチェーン内のデータに適用するには、Data Prep コネクタのRun pipeline コマンドを含めます。まだの方は、 データ準備 接続 を セットアップしてください。Data Prep 接続をセットアップした状態で、WdataChains からData Prep を開くことができます。
ステップ2.サンプルファイルをアップロードする
Sample files upload sample files which represents tabular data to transform helps easier pipeline creation.
inData Prep,一旦アップロードされると、サンプルファイルを使用することができます:
- パイプラインが相互作用するデータの列とタイプをすばやく定義する。
- パイプラインやマッピング変換がデータにどのような影響を与えるかをプレビューする。
ステップ3.マッピング変換用のグループを作成する
パイプライン内のデータモデル間の関係をマッピングするには、マッピング変換を含めます。Mapping groups create mapping groups to define values between relationships and how to transform values from one system to another within mapping transformation.
inData Prep,ヒント: パイプラインの実行時にマッピング変換の値を設定するには、マッピンググループの実行時変数 を設定します。
マッピング・グループを作成する際、そのルールを定義することができます。 完全一致、単純パターン、正規表現に基づいて値を変換します。
ステップ4.パイプラインの設定
パイプラインとは、Data Prepが処理するデータに適用される技術的・機能的な変換の集合体である。
-
パイプラインで定義されたテクニカルトランスフォーム は、データレイアウトを変更するために使用される。列の追加や削除、列の並べ替え、新しい列の挿入などは、すべて技術的な変換の例である。
-
機能変換 は、統合されるシステムのデータモデル間の関係を構築するプロセスである。機能変換はしばしばマッピングと呼ばれ、データ準備マッピンググループによって管理される。マッピンググループは、変換ステップとしてパイプラインに適用される。
表データに適用する一連の変換を定義するために、 からパイプライン を作成 データ準備 にパイプライン を作成する。
パイプラインを作るとき、あなたは
- 手動で、またはサンプルファイルやアップロードされた区切りファイルに基づいて、相互作用するデータの列とタイプを定義する。
- パイプラインの実行時に適用する変換を順番に設定する。
ヒント: パイプラインの実行時にトランスフォームの値を設定するには、パイプラインのランタイム変数 を設定します。
ステップ5.パイプラインをチェーンで実行する
チェーン内の先の出力から表形式データに変換を適用するには、Data Prep コネクタのRun pipeline コマンド を使用します。コマンドをセットアップするとき、あなたは
- 実行するパイプラインと変換する表形式出力を選択する。
- 表形式ファイルのカラムをパイプラインのカラム定義にマップする。
- パイプラインのランタイム変数値を設定する