テーブルの所有者は、参照メモや日付の追跡などの目的に応じて、データに新しい列を追加する事ができます。列の目的を明確にするために、必要に応じて列の名前と説明の管理も行なえます。
注:バージョンやデータソースなど、組織が定期的に追跡するデータの詳細を保存するために、ワークスペース所有者はデータセットのタグを設定する事ができます 。
テーブルに列を追加する
- Wdataのホーム画面からテーブルを開きます。
- テーブルの下部に新しい列を追加するには、[列の追加]をクリックします。
- 列のデータにコンテキストを提供するため、名前と説明を入力します。
- マッピング中に列を識別しやすくするには、[
acct_id
]や[amount
]などのIDを入力します。スペースや特殊文字を使用せずに、IDは簡潔で汎用的なものを使用して下さい。 - [列の型]セクションから、列で追跡するデータの型を選択します。
タイプ データ テキスト 説明や名前など、文字、数字、記号の任意の組み合わせ。クエリの構造化クエリ言語(SQL)では、このデータは[ VARCHAR
]として解決されます。整数 分数や小数ではなく、正数、負数、または0の整数。人数、年、または月のデータに推奨されます。 10進数 例えば 4.344
などのように、10進数を含む可能性のある数値。通貨、レート、または在庫単位などのデータに推奨されます。クエリのSQLでは、このデータは[DOUBLE
]として解決されます。Boolean型 [ TRUE
]または[FALSE
]のどちらかの値。タイムスタンプ 時刻の値を持つ日付。デフォルトでは ISO 8601 形式を適用。 日付 時刻の値を持たない日付。デフォルトでは ISO 8601 形式の[ YYYY-MM-dd
]を適用。ヒント:月または年は、テキストではなく整数として追跡します。例えば、月の名前(January〜December)ではなく整数のみ(1〜12)で月を記録する場合、データに計算を適用する事ができます。
- ディメンション テーブルの場合、データセットを追加する際の重複を防ぐために、
ID
などの一意の識別子を持つ列の[キー]を選択します。複数 の値を組み合わせて一意の識別子にするには、その列の[キー]を選択します。注: [キー]列をマークするには、最初にテーブルの列IDを編集して、数値以外の値にする必要がある場合があります。
- 列の詳細を確認し、[保存]
注: [保存]をクリックする前に、少なくとも列のIDとタイプを確認してください。接続されたデータの整合性を確保するため、テーブルにインポートされたデータセットがない場合にのみ、列を削除するか、そのIDまたはタイプを編集する事ができます。
をクリックします。
ディメンションテーブルのキー列を選択する
データセットをディメンション テーブルに追加する際の重複を防ぐには、各レコードに対し、IDなどの一意の値を持つ列の[キー]を選択します。複合一意識別子の場合は、複数の列をキーとして選択します。
列をキーとしてマークする手順は次の通りです。
- テーブルのデータセットをステージングする必要があります。インポートされたデータセットを[ステージング]に戻すには、[インポート解除]を[データセット]パネルのメニューから選択します。
- テーブルの列IDは数値以外の値にする必要があります。必要に応じて、列IDを数値以外の値に編集します。
- テーブルは、ディメンション テーブルでなければなりません。ファクトテーブルをディメンションテーブルに変換するには、型を編集します。
クエリにディメンションテーブルを含めると、そのキー列は[ソース]の左パネルに[キー]として識別されます。このインジケーターを使用して、クエリ関係の一部としてテーブルを別のソースと結合するときに一意のディメンションを識別します。
日付またはタイムスタンプ列の書式を設定する
注:接続されたデータの整合性を確保するために、すべてのデータセットが[ステージング済み]の場合にのみ、日付またはタイムスタンプ列の形式を編集する事が可能です。インポートされたデータセットをステージングするには、[インポートの解除]を[データセット]の右パネルのメニューから選択します。
デフォルトでは、日付またはタイムスタンプ列は、[YYYY-MM-dd
]または[yyyy-MM-dd'T'HH:mm:ss.SSSz
]の ISO 8601 形式を使用します。日付またはタイムスタンプ列のデータを別の方法で表示するには、[タイプ]から使用する形式を選択します。
独自の形式を作成するには、[カスタム]を選択し、これらのSimpleDateFormat 文字を使用し、値が表示されるべき順序でパターンを入力します。
文字 | 日付値 |
---|---|
G |
紀元前(キリスト以前)または西暦(anno domini)などの時代表記 |
y |
年の値。2桁表記の場合はyy (例:21)を使用し、4桁表記の場合はyyyy (例:2021)を使用します。 |
M |
月:
|
d |
月間の日付の値。 1桁の日付の値にゼロを含めるには、dd を使用します。 |
h |
12時間制の時刻表記(例:1〜12)。通常は2桁のhh が使用されますが、0〜11の場合はK を使用します。 |
H |
24時間制の時刻表記(例:0〜23)。通常は2桁のHH が使用されますが、1〜24の場合はk を使用します。 |
m |
分の値(例:0〜59)。通常は、2桁のmm が使用されます。 |
s |
秒の値(例:0〜59)。通常は、2桁のss が使用されます。 |
S |
ミリ秒の値(例:0〜59)。通常は、2桁のSS が使用されます。 |
E |
曜日:
|
D |
年間における日付の値(例:1〜366) |
F |
5月の第1木曜日など、月の曜日の値。 |
w |
年間における週の値(例:1〜53) |
W |
月間における週の値(例:0〜5) |
a |
午前または午後を示す値、AMまたはPM |
k |
24時間制の1日中の時間の値(例:1〜24)。0〜23の場合はHH を使用します。 |
K |
12時間制の1日中の時間の値(例:0〜11)。1〜12の場合はHH を使用します。 |
z |
タイムゾーン |
' |
時間区切り文字または単一引用符のためのエスケープ |
注:これら以外の文字は、形式化されたデータでは通常のテキストとして表示されます。
例えば、EEEEE MMMMM yyyy HH:mm:ss.SSSZ
という形式のタイムスタンプは、Saturday September 2021 10:45:42.720+0100と表示されます。
列の名前または説明を編集する
列の名前または説明を更新するには、テーブルを開き、必要に応じて列の詳細を編集して、[保存]
をクリックします。列のIDまたはデータ型を編集する
注:接続されたデータの整合性を確保するため、すべてのデータセットが[ステージング済み]場合にのみ、列のIDまたはデータ型を編集する事ができます。
- テーブルの[データセット]の右側のパネルからインポート済みの任意のデータセットのメニューを開き、[インポート解除]を選択します。
- 必要に応じて、列のIDまたはデータ型を編集します。
- [保存] をクリックします。
- 列の編集内容を確認し、[変更をコミット]をクリックします。
- ステージング済みのデータセットを再インポートするには、[インポート]を[データセット]右パネルのメニューから選択します。
テーブル内に列を配置する
注:接続されたデータの整合性を確保するため、すべてのデータセットが[ステージング済み]場合にのみ、列を移動させる事ができます。
- テーブルの[データセット]の右側のパネルからインポート済みの任意のデータセットのメニューを開き、[インポート解除]を選択します。
- 列を移動させるには、[最上部へ移動]
- すべての列を配置したら、[保存] をクリックします。
テーブルから列を削除する
注:接続されたデータの整合性を確保するため、すべてのデータセットが[ステージング済み]場合にのみ、列を削除する事ができます。
- テーブルの[データセット]の右側のパネルからインポート済みの任意のデータセットのメニューを開き、[インポート解除]を選択します。
- 列を削除するには、メニューから[削除]を選択します。
- [保存] をクリックします。
- 列の編集内容を確認し、[変更をコミット]をクリックします。
- ステージング済みのデータセットを再インポートするには、[インポート]を[データセット]右パネルのメニューから選択します。