マッピング・グループにルールを追加すると、記録システムの値間の関係を定義できます。記録システム間で値をマッピングするには、完全一致、単純なパターン、正規表現(Regex)に基づいて関係を定義することができます。
ヒント: 効果的なマッピング・グループには、異なるタイプの複数のルールが含まれることが多い。ルールに追加の条件を適用するには、条件付きマッピングを設定することもできる。
要件
データ・プレパレーションは完全に組織レベルで管理され、個々のワークスペースやその権限は認識されない。
ということだ:
- データプレップは、組織内の全認証ユーザー間で共有されます。
- Chain Builderにアクセスできるユーザーは、Data Prepにもアクセスできる。
- チェーンを作成または編集できるすべてのユーザーは、Data Prepでパイプラインを管理できるようになります。
- 単一のデータ準備パイプラインは、組織内の複数のチェーンやワークスペースにまたがって使用できる。
正確
厳密な規則は、値間の明示的な一対一の関係を定義する。例えば、ソース値100-10
を製品コードRegular cola
に直接マッピングするには、 Exact ルールを適用します。
注: Exact ルールを使用すると、パイプラインによって変換されたデータに新しい値が追加された場合、新しい値に対するルールでマッピング グループを更新する必要があります。
いいね!
ルールのように、単純なパターンや標準化された値に基づいて関係を定義する。たとえば、接頭辞、接尾辞、トリミングに基づく多対一(n:1)や多対多(n:n)の関係を定義するために、Likeルールを使用することができます。
Likeルールのパターンマッチを助けるために、クエスチョンマーク(?
?
ワイルドカードは、マッチするパターンが要求する場合など、1文字を置き換える:
- 一定の文字数の値
- 値の途中に特定の文字
例:
より | まで | 説明 | 結果 |
---|---|---|---|
??130 |
IT |
多対一の関係。130 で終わる5桁のソース値はすべて、値IT に対応する。 |
ソース値23130 はIT に対応する。 |
??? |
??? |
多対多のリレーションシップで、3桁のソース値がそれ自身にマッピングされる。 | ソース値630 は630 にマッピングされる。 |
?????? |
AC_? |
多対多のリレーションシップで、6文字のソース値は、AC_の接頭辞でそれ自身にマップされる。 |
ソース値601010 はAC_601010 にマッピングされる。 |
CC_? |
???? |
多対多の関係で、CC_ で始まる7文字のソース値は、その最後の4文字にマッピングされる。 |
ソース値CC_6425 は6425 に対応する。 |
100-??-4000 |
収益 |
100- で始まり、-4000 で終わる 11 文字のソース値が、値収入にマッピングされる。 |
ソース値100-80-4000 は収入にマッピングされる。 |
*
ワイルドカードは複数の文字を置き換える。たとえば、マッチさせるパターンが、可変長の値の先頭または末尾に特定の文字を必要とする場合などである。例:
より | まで | 説明 | 結果 |
---|---|---|---|
*065 |
ファイナンス |
065 で終わるソース値はすべて、値 Finance にマッピングされる。 |
ソース値10065 または9065 はFinance にマッピングされる。 |
* |
* |
多対多のリレーションシップでは、文字に関係なく、どのソース値もそれ自身にマップされます。これはパススルー・マッピングとして知られています。 | ソース値500010 ,1400 , またはSalaries は、それぞれ500010 ,1400 , またはSalaries にマッピングされます。 |
* |
CC_* |
多対多のリレーションシップで、どのソース値も、CC_ というプレフィックスでそれ自身にマップされる。 |
ソース値92230 ,81010 , またはQuality は、それぞれCC_92230 ,CC_81010 , またはCC_Quality にマッピングされる。 |
BU_1* |
1* |
BU_1 で始まるすべてのソース値が、BU_ 接頭辞なしでそれ自体にマップされる多対多の関係。 |
ソース値BU_1200 またはBU_1000 は、それぞれ1200 または1000 にマッピングされる。 注: このルールは、 |
正規表現
正規表現- Regex-ルールは、Likeルールではマッピングできない、より複雑なパターンに基づいて関係を定義する。パターンを識別するために、正規表現では、開閉括弧 (()) で示されるセグメントを使用する。複数の正規表現を使用してマッピング基準を作成することができ、正規表現によって作成されたセグメントはすべて、マッピングされた値を作成することができます。
例:
より | まで | 説明 | 結果 |
---|---|---|---|
([4-7])(.*) |
$2 |
4 ,5 ,6 , または7 で始まるソース値が、最初の桁以降の値にマッピングされる多対多の関係。 |
5-100 または7625 のソース値は、それぞれ-100 または625 、 注: このルールでは93065 のソース値は |