為對應群組新增規則時,您可以定義記錄系統中值之間的關係。要在記錄系統之間對應值,您可以根據精確匹配、簡單模式或正則表達式 (Regex) 定義關係。
秘訣: 有效的對應群組通常包含多個不同類型的規則。若要對規則套用其他條件,您也可以設定條件對應。
要求
Data Prep 完全由組織層級控制,不識別個別工作空間或其權限。
這表示
- Data Prep 由您組織中的所有授權使用者共用。
- 任何具有 Chain Builder 存取權限的使用者也具有 Data Prep 存取權限。
- 所有可以建立或編輯鏈的使用者都可以在 Data Prep 中管理管道。
- 單一資料準備管道可用於組織內的多個鏈和工作區。
完全符合
精確規則定義值之間明確的一對一關係。例如,若要將源值100-10 直接映射為產品代碼普通可樂 ,請套用精確規則。
附註: 使用精確規則時,管道轉換資料的任何新值都需要更新對應群組中的新值規則。
近似
Like 規則根據簡單模式或標準值定義關係。例如,您可以使用 Like 規則定義基於前綴、後綴或修剪的多對一 (n:1) 或多對多 (n:n) 關係。
若要協助匹配「類似」規則的樣式,您可以使用問號 (?) 或星號 (*) 分別作為單個或多個字元的通配符。
? 通配符會取代單一字元,例如當要匹配的模式要求::
- 具有一定數量字元的值
- 數值中間的特定字元
例如:
| 從 | 目的地 | 解釋 | 結果 |
|---|---|---|---|
??130 |
IT |
多對一關係,其中任何以結尾的五位數字的來源值 130 對應至IT 值 |
來源值為23130 對應至IT |
??? |
??? |
多對多關係,其中任何只有三位數的來源值對應到自身 | 來源值630 對應至630 |
?????? |
a+c |
多對多的關係,其中任何 6 個字元的來源值對應到本身,前綴為AC_ |
的來源值 601010 對應至AC_601010 |
CC_* |
???? |
多對多的關係,其中任何以開頭的七個字元的來源值 CC_ 對應到其最後的四個字元 |
CC_6425 的來源值映射至6425 |
100-??-4000 |
收入 |
多對一的關係,其中任何以開始的 11 個字元的來源值 100- 和以 結束的 -4000 對應到值收入 |
來源值100-80-4000 對應至收入 |
* 通配符可取代多個字元,例如,當要匹配的模式需要在長度可變值的開始或結束處使用特定字元時。例如:
| 從 | 目的地 | 解釋 | 結果 |
|---|---|---|---|
*065 |
財務 |
多對一關係,其中任何以065 結尾的來源值都會映射到值 Finance |
10065 或9065 的來源值映射至Finance |
* |
* |
一個多對多的關係,其中任何來源值映射到本身,不論字符;這被稱為穿透映射 |
500010,1400, 或薪資 的來源值對應到自身-500010,1400, 或薪資, 分別為 |
* |
CC_* |
多對多的關係,其中任何來源值映射到其本身,前綴為CC_ |
92230,81010, 或Quality 的源值分別映射到CC_92230,CC_81010, 或CC_Quality, 。 |
BU_1* |
1* |
多對多的關係,其中任何以BU_1 開頭的來源值映射到本身,但不包含BU_ 前綴 |
BU_1200 或BU_1000 的來源值分別映射到1200 或1000 。 注意: 此規則將不會映射來源值為 |
RegEx|Regex
正規表達式-or Regex-rules 基於更複雜的模式定義關係,這些模式無法使用 Like 規則對應。為了識別模式,正規表示式使用分段,以開括號 (()) 和閉合括號 (()) 表示。您可以使用多個正規表示式來建立映射條件,而且由 regex 建立的任何區段都可以建立映射值。
例如:
| 從 | 目的地 | 解釋 | 結果 |
|---|---|---|---|
([4-7])(.*) |
$2 |
多對多的關係,任何以4,5,6, 或7 開頭的來源值都會映射到其值的首數位之後。 |
5-100 或7625 的來源值會分別映射到-100 或625, 注意: 此規則不會 映射 |