テーブルのオーナーは、参照メモや日付を記録するために、データに新しい列を追加することができます。列の意図を明確にするために、必要に応じて列の名前と説明を管理することもできます。
注: バージョンやデータ ソースなど、組織が日常的に追跡しているデータの詳細を保存するために、 ワークスペース所有者はデータセットにタグを設定できます。
テーブルに列を追加する
- Wdataのホーム画面からテーブルを開きます。
- テーブルの下部に新しい列を追加するには、[列を追加] をクリックします。
- 列のデータにコンテキストを提供するため、名前と説明を入力します。
- マッピング時に列を特定しやすくするため、
acct_id
やamount
のように ID を入力します。IDは簡潔かつ一般的なものにし、スペースや特殊文字は使用しないこと。 - [列のタイプ]セクションから、列で追跡するデータの型を選択します。
タイプ データ テキスト 説明や名前など、文字、数字、記号の任意の組み合わせ。クエリの構造化クエリ言語(SQL)では、このデータは VARCHAR
に解決される。整数 分数や小数の桁数ではなく、正数、負数、または0の整数。人数、年、または月のデータに推奨されます。 小数の桁数 4.344
のように、小数の桁数を含むことができる数値。通貨、レート、在庫単位におすすめ。クエリのSQLでは、このデータはDOUBLE
に解決される。ブーリアン型 (Boolean) [TRUE]または[FALSE]のどちらかの値。 タイムスタンプ 時間値を持つ日付。デフォルトでは、ISO 8601 フォーマット。 日付 時間値を持たない日付。デフォルトでは、ISO 8601 形式で、 YYYY-MM-dd
。ヒント: 月や年をテキストではなく整数で記録する。例えば、月名をテキスト(1月~12月)ではなく、整数(1~12)で記録すると、データに計算を適用することができます。
- [インポート形式]で、インポートされた日付、タイムスタンプ、および小数の桁数の書式を選択します。
- 日付列またはタイムスタンプ列について、その値の表示方法を選択する。デフォルトでは、テーブルはISO 8601 フォーマット を使用します。
- 小数の桁数の列の場合、使用する千と小数点の区切り記号を含む形式を選択します。
-
ディメンション テーブルの場合、データセットの追加時に重複を防ぐために、一意の識別子 (
ID
など) を持つ列にキー を選択します。複数の 値を一意な識別子に結合するには、それらの列にキー を選択する。注: キー列をマークするには、まずテーブルの列IDを数値以外の値に編集する必要があるかもしれない。
- 列の詳細を確認し、[保存]をクリックします。
注: 少なくとも、保存 をクリックする前に、列のIDとタイプを確認してください。接続データの整合性を確保するため、列の削除やIDやタイプの編集は、テーブルにインポートされたデータセットがない場合にのみ行うことができます。
ディメンションテーブルのキー列を選択する
ディメンションテーブルにデータセットを追加する際に重複を防ぐには、各レコードに一意の値 (ID など) を持つ列にキー を選択します。複合一意識別子では、複数の列をキーとして選択する。
列をキーとしてマークする手順は次の通りです。
- テーブルのデータセットはステージングされていなければならない。インポート済みデータセットをステージング に返却するには、データセット パネルのメニューからインポート解除 を選択する。
- テーブルの列IDは数字であってはならない。必要であれば、列IDを数値以外の値に編集する。
- テーブルはディメンションテーブルでなければならない。ファクトテーブルをディメンションテーブルに変換するには、そのタイプ を編集します。
ディメンションテーブルをクエリに含めると、そのキー列はソース の左パネルでキー として識別されます。このインジケーターは、クエリ関係の一部として別のソースとテーブルを結合する際に、一意のディメンョンを識別するために使用 します。
日付またはタイムスタンプ列の書式を設定する
注: 接続データの整合性を確保するため、日付またはタイムスタンプ列の書式を編集できるのは、すべてのデータセットがステージング の場合のみです。インポート済みデータセットをステージングするには、データセット右パネルのメニューからインポート解除 を選択する。
デフォルトでは、日付またはタイムスタンプ列はISO 8601の書式YYYY-MM-dd
またはyyyy-MM-dd'T'HH:mm:ss.SSSz
を用います。日付やタイムスタンプ列に異なるデータを表示させるには、インポート書式 で、使用する書式を選択します。
独自の形式を作成するには、[カスタム]を選択し、これらのSimpleDateFormat 文字を使用し、値が表示されるべき順序でパターンを入力します。
文字 | 日付値 |
---|---|
G |
紀元前(キリスト以前)または西暦(anno domini)などの時代表記 |
y |
年。2桁(21)の場合はyy を、4桁(2021)の場合はyyyy を使用する。 |
M |
月:
|
d |
日一桁の日に先頭ゼロを含めるには、dd を使用する。 |
h |
12時間時計で1時から12時まで。通常、hh の2桁で表記される。0時~11時の場合は、K を使用する。 |
H |
24時間時計で、0時から23時まで。通常、HH の2桁で表記される。1時~24時 については、k を使用する。 |
m |
分、0~59。通常、mm の2桁で表記される。 |
s |
秒、0~59。通常、ss の2桁で表記される。 |
S |
秒のミリ秒、0~59。通常、SS の2桁で表記される。 |
E |
曜日:
|
D |
年間における日付の値(例:1~366) |
F |
月の第1木曜日などの曜日 |
w |
年間における週の値(例:1~53) |
W |
月間における週の値(例:0~5) |
a |
午前または午後を示す値、AMまたはPM |
k |
24時間時計で1時~24時。0~23 の場合は、HH を使用する。 |
K |
12時間時計で0時~11時。1~12の場合は、hh を使用する。 |
z |
タイムゾーン |
' |
時間区切り文字または単一引用符のためのエスケープ |
注: これら以外の文字は、書式設定されたデータでは通常のテキストとして表示される。
例えば、EEEEE MMMMM yyyy HH:mm:ss.SSSZという形式のタイムスタンプは、Saturday September 2021 10:45:42.720+0100と表示されます。
列の名前または説明を編集する
列の名前または説明を更新するには、テーブルを開き、必要に応じて列の詳細を編集して、[保存]をクリックします。
列のIDまたはデータタイプを編集する
注: 接続データの整合性を確保するため、列の ID またはデータタイプを編集できるのは、すべてのデータセットがステージング の場合のみです。
- テーブルの[データセット]の右側のパネルからインポート済みの任意のデータセットのメニューを開き、[インポート解除]を選択します。
- 必要に応じて、列のIDまたはデータタイプを編集します。
- [保存]をクリックします。
- 列の編集内容を確認し、[変更をコミット]をクリックします。
- ステージング済みのデータセットを再インポートするには、[インポート]を[データセット]右パネルのメニューから選択します。
テーブル内に列を配置する
注: 接続データの整合性を確保するため、列の移動は、すべてのデータセットがステージング である場合にのみ可能です。
- テーブルの[データセット]の右側のパネルからインポート済みの任意のデータセットのメニューを開き、[インポート解除]を選択します。
- 列を移動するには、最上部へ移動 、上に移動 、下に移動 、または最下部へ移動 を選択する。
- すべての列を配置したら、[保存]をクリックします。
テーブルから列を削除する
注: 接続データの整合性を確保するため、列の削除はすべてのデータセットがステージング である場合にのみ可能です。
- テーブルの[データセット]の右側のパネルからインポート済みの任意のデータセットのメニューを開き、[インポート解除]を選択します。
- 列を削除するには、メニューから[削除]を選択します。
- [保存]をクリックします。
- 列の編集内容を確認し、[変更をコミット]をクリックします。
- ステージング済みのデータセットを再インポートするには、[インポート]を[データセット]右パネルのメニューから選択します。