表格的所有者可以为数据添加新列,如跟踪参考注释或日期。为帮助明确列的意图,您还可以根据需要管理其名称和描述。
注: 要保存贵组织日常跟踪的数据详细信息,如版本或数据源,工作区所有者可为数据集设置标签 。
为表格添加一列
- 从 WdataHome ,打开表格。
- 要在表格底部添加新列,请单击添加列 。
- 为帮助提供列数据的上下文,请输入其名称和描述。
- 为帮助在映射过程中识别列,请输入其 ID,如
acct_id
或amount
。ID 要简洁、通用,不要使用空格或特殊字符。 - 在列类型 下,选择要在列中跟踪的数据类型。
类型 数据 文本 字母、数字或符号的任意组合,如描述和名称。在查询的结构化查询语言(SQL)中,该数据解析为 VARCHAR
。整数 一个整数--不是 分数或小数--可以是正数、负数或 0。建议用于人数、年或月。 十进制 可包含十进制值的数字,如 4.344
。建议用于货币、汇率或库存单位。在查询的 SQL 中,该数据解析为DOUBLE
。布尔型 TRUE
或FALSE
。时间戳 带有时间值的日期。默认情况下,使用ISO 8601 格式。 日期 没有时间值的日期。默认情况下,ISO 8601 格式为 YYYY-MM-dd
。提示: 以整数而非文本形式跟踪月份或年份。例如,将月份记录为整数(1-12)而不是文本名称(1 月-12 月)时,就可以对数据进行计算。
- 在Import Format 下,选择导入日期、时间戳和小数值的格式:
- 对于日期或时间戳列,选择其值的显示方式。默认情况下,表格使用的 ISO 8601 格式 。
- 对于小数列,选择要使用的千位和小数分隔符格式。
- 对于维 表,请为具有唯一标识符(如
ID
)的列选择Key ,以防止添加数据集时出现重复。要将多个 值合并为一个唯一标识符,请为其列选择Key 。注意: 要标记Key列,可能需要先将表格的列 ID 编辑为非数值。
- 验证列的详细信息,然后单击保存 。
注意: 在点击保存 之前,至少要验证列的 ID 和类型。为确保连接数据的完整性,只有当表中没有导入数据集时,才能删除列或编辑其 ID 或类型。
选择维度表的关键列
要防止在维度 表中添加数据集时出现重复,请为每条记录选择Key 。对于复合唯一标识符,可选择多个列作为键。
将一列标记为关键字:
- 表格的数据集必须分期。要将导入的数据集返回Staged ,请从Datasets 面板的菜单中选择Unimport 。
- 表格的列 ID 必须为非数字。如有必要,将列 ID 编辑为非数值。
- 该表必须是维度 表。要将事实表转换为维度表,编辑其类型 。
在查询中包含维度表时,其关键列会在Sources 左侧面板中标识为Key 。将表与另一数据源连接作为查询关系的一部分时,使用该指标可帮助识别唯一维度。
格式化日期或时间戳列
注意: 为确保连接数据的完整性,只有当所有数据集都是Staged 时,才能编辑日期或时间戳列的格式。要分阶段导入数据集,请从数据集右侧面板的菜单中选择Unimport 。
默认情况下,日期或时间戳列使用ISO 8601 YYYY-MM-dd
或yyyy-MM-dd'T'HH:mm:ss.SSSz
格式。要以不同方式显示日期或时间戳列的数据,请在Import format 下选择要使用的格式。
要创建自己的格式,请选择 "自定义",然后使用这些 SimpleDateFormat 字符按其值出现的顺序输入模式:
人物 | 日期值 |
---|---|
G |
年代,公元前(公元前)或公元(anno domini) |
y |
年份使用yy 表示两位数 (21),使用yyyy 表示四位数 (2021)。 |
M |
月:
|
d |
每月的哪一天要在个位数天数中加入前导零,请使用dd 。 |
h |
用 12 小时钟表计算一天中的小时数,从 1 到 12。通常使用两位数,hh 。对于 0-11 岁的儿童,请使用K 。 |
H |
一天中的小时,24 小时时钟,0 至 23。通常使用两位数,HH 。对于 1-24,使用k 。 |
m |
每小时的分钟数,0-59。通常使用两位数,mm 。 |
s |
第二分钟,0-59。通常使用两位数,ss 。 |
S |
第二毫秒,0-59。通常使用两位数,SS 。 |
E |
星期几
|
D |
年中的一天,1-366 |
F |
月份中的星期几,如五月的第一个星期四。 |
w |
一年中的一周,1-53 |
W |
月中的一周,0-5 |
a |
前 或后 ,上午或下午 |
k |
用 24 小时时钟表示一天中的 1-24 小时。对于 0-23,请使用HH 。 |
K |
用 12 小时钟表表示的一天中的小时数,0-11。1-12,使用hh 。 |
z |
时区 |
' |
转义为时间分隔符或单引号 |
注: 除此以外的字符在格式化数据中显示为普通文本。
例如,格式为EEEEE MMMMM yyyy HH:mm:ss.SSSZ
的时间戳会显示为Saturday September 2021 10:45:42.720+0100 。
编辑栏目名称或描述
要更新列的名称或说明,请打开表格,根据需要编辑列的详细信息,然后单击保存 。
编辑列的 ID 或数据类型
注意: 为确保连接数据的完整性,只有当所有数据集都是Staged 时,才能编辑列的 ID 或数据类型。
- 在Datasets 表格右面板中,从任何已导入数据集的菜单中选择Unimport 。
- 根据需要编辑列的 ID 或数据类型。
- 单击保存 。
- 查看对列的编辑,然后单击提交更改 。
- 要重新导入分阶段数据集,请从数据集右侧面板的菜单中选择Import 。
在表格中排列列
注意: 为确保连接数据的完整性,只有当所有数据集都是Staged 时才能移动列。
- 在Datasets 表格右面板中,从任何已导入数据集的菜单中选择Unimport 。
- 要移动一列,请选择Move to Top ,Move Up ,Move Down , 或Move to Bottom 。
- 排列完所有列后,单击保存 。
从表格中删除一列
注意: 为确保连接数据的完整性,只有当所有数据集都是Staged 时才能删除列。
- 在Datasets 表格右面板中,从任何已导入数据集的菜单中选择Unimport 。
- 要删除一列,请从其菜单中选择Delete 。
- 单击保存 。
- 查看对列的编辑,然后单击提交更改 。
- 要重新导入分阶段数据集,请从数据集右侧面板的菜单中选择Import 。