要准备用于上传的分隔符分隔值 (DSV) 数据,例如将表格数据转换为所需的格式,请在使用表格转换连接命令的链中添加一个步骤。例如:
- 根据记录中的内容拆分数据集
- 基于规则的筛选
- 合并来自多个来源的数据集
要启用这些命令,IT 管理员首先 创建一个表格转换连接器。
添加标题
要向逗号分隔值 (CSV) 文件添加标题行,请使用 Add Header 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要添加标题的文件。 |
| 分隔符号 |
选择用于分隔 输入文件中列的分隔符。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
| 标题行 |
请输入标题行的全部内容。用分隔符分隔每个标题,例如 Column1,Column2,Column3。 |
| 标头分隔符 |
输入用于分隔标题的分隔符,例如 , |
输出
| 输出 |
输出类型 |
| 带标题的 CSV 文件 |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
添加行号
要在第一列向 DSV 添加行号,请使用 添加行号 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要添加行号的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
输入用于分隔 中各列的分隔符。输入文件。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
输出
| 输出 |
输出类型 |
| 添加行号输出 |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
高级查询
要对一个或多个 CSV 文件执行 SQL 查询,请使用 高级查询 命令。您还可以将其他附加到此命令的文件合并在一起。
注意: 此命令支持 SELECT 语句和互补的 JOIN 语句,但不支持 诸如 INSERT、 UPDATE或 CREATE之类的语句。要插入行,请使用 “堆叠文件 ”命令;要更新行,请使用 “查找和替换”命令
。
属性
| 摘要信息 |
细节 |
| 表格 |
请输入查询中要使用的所有文件及其表名。 |
| 查询 |
请输入要执行的 SQL 查询语句, 为 SQLite 语法:
- 如果列名或标识符包含空格或特殊字符,请使用方括号。例如,
[列 A],[列 B]。
- 要将数据格式化为两个小数位,请使用语法
SELECT PRINTF('%.2f',(SUM(DATA))) AS EBITDA FROM HFMDat。
- 要选择重复项的第一个实例,例如如果两条记录具有相同的
ID,请使用语法 select * from group by ID having MIN(ID) ORDER BY ID。
- 要将多个字符串连接在一起,请使用
|| 运算符,例如 string1 || string2 [ || string_n ]。
|
| 输入分隔符 |
选择 表中使用的分隔符,以及连接文件。 |
| 输出分隔符 |
选择查询结果中使用的分隔符。 |
| 预览 |
要打印查询结果预览,请选中此框。 |
高级查询 命令会自动尝试确定列的数据类型。要保留命令误判为整数的值的前导零,请使用 查找和替换 命令(选中 正则表达式 和 仅替换匹配项 ),在列值周围添加单引号 ('),然后在 高级查询 命令完成后将其删除:
- 要添加单引号,请查找
(\d+),并将其替换为 '$1'。
- 要删除单引号,请查找
'(\d+)',并将其替换为 $1。
选择 正则表达式 后, 查找和替换 命令使用括号 (()) 捕获一组字符,然后将其替换为第一个参数 $1。要创建多个捕获,请使用后续的括号组和递增值,例如 $2。
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
更改分隔符
要更改 CSV 文件的分隔符,请使用 Change Delimiter 命令。
注: 为符合 RFC 规范, 始终 使用单个字符作为分隔符,最好是逗号或制表符。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输入分隔符 |
输入当前在 输入文件中使用的分隔符。要输入制表符,请输入 \t。 |
| 输出分隔符 |
请输入转换后要使用的分隔符。要输入制表符,请输入 \t。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
| 保留空行 |
选中此框可在输出中保留空行。它们默认会被移除。 |
输出
| 输出 |
输出类型 |
| CSV 结果 |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
干净的未加引号的换行符
要尝试清理除未加引号的新行字符外,其他均符合 RFC 规范的文件,请使用 Clean Unquoted Newlines 命令。例如,使用此命令处理回车符或换行符不一致的数据文件。
注: 此命令仅清除未加引号的新行。其他不合规问题仍会导致数据集失败。
属性
| 摘要信息 |
细节 |
| 预览结果 |
要在命令日志中预览结果,请选中此框。 |
| 输入文件 |
输入要清理的文件。 |
| 文件分隔符 |
选择 输入文件中每一列的分隔符。 |
| 使用惰性引号。 |
要使引号显示在未加引号的字段中,并使非双引号显示在加引号的字段中,请选中此框。 |
| 添加尾随文本 |
要将输入文件 中没有分隔符的任何单列行附加到上一条记录最后一列的最后一个值,请选中此框。 |
输出
注:行计数 输出提供 清理换行符输出 中的记录总数(包括标题行)。
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
创建清理后的换行符输出失败 |
列筛选器
要过滤带有与指定模式匹配的标题的 DSV 列,请使用Column 筛选 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 图案类型 |
选择要筛选的图案类型:
-
索引 用于按列索引筛选
-
精确 用于按逗号分隔的精确值列表进行筛选
-
正则表达式 用于按 正则表达式进行过滤
|
| 图案 |
输入要匹配的列模式。如果 模式类型为 索引,则应用扩展运算符,例如 1:5,7:8,10:15。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
| 逆 |
要保留匹配的列并删除所有其他列,请选中此框。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
连接文件
要将多个表格数据源文件水平合并到单个 CSV 数据集中,请使用 Concat Files 命令。
属性
| 摘要信息 |
细节 |
| 源文件 |
请输入要合并的文件。 |
| 预览结果 |
要在命令日志中预览结果,请选中此框。 |
| 文件分隔符 |
选择 源文件中使用的分隔符。 |
输出
| 输出 |
输出类型 |
| 合并的 CSV |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
生成 CSV 文件失败 |
将 CSV 转换为 XLSX
要将 CSV 文件转换为 Microsoft Excel® 工作簿 (XLSX),请使用 Convert CSV to XLSX 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换为 XLSX 的文件。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 工作表名称 |
输入要在Excel工作簿中创建的工作表名称。 |
| 输出文件 |
输入文件存储路径(可选)。如果用作链中其他命令的输出,请留空。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
将 JSON 转换为 CSV
要将 JSON 文件转换为 CSV,请使用 Convert JSON to CSV 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换为 CSV 的 JSON 文件。 |
| 输出文件 |
请输入保存新 CSV 文件的路径。如果用作链中其他命令的输出,请留空。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
转换为交叉表
要将表格数据集( 例如Oracle Essbase®多维表达式 (MDX) 查询输出)转换为交叉表格式,请使用 “转换为交叉表 ”命令。该命令根据输入表格数据集中定义为元组的列标题和行标题来创建交叉表布局。
例如,使用此命令,可以得到以下数据集:
(指标、产品、市场)(实际值,第一季度)(实际值,第二季度)(实际值,第三季度)(实际值,第四季度)(预算值,第一季度)(预算值,第二季度)(预算值,第三季度)(预算值,第四季度)(纽约州,100-10人次销售额)1995.0 2358.0 2612.0 1972.0 2249.0 2220.0 2470.0 1720.0(马萨诸塞州,100-10人次销售额)1456.0 1719.0 1905.0 1438.0 1360.0 1620.0 1800.0 1250.0(佛罗里达州,100-10人次销售额)620.0 735.0 821.0 623.0 570.0 690.0 770.0 530.0(康涅狄格州,100-10 销售) 944.0 799.0 708.0 927.0 880.0 750.0 660.0 810.0(新罕布什尔州,100-10 销售) 353.0 413.0 459.0 345.0 320.0 370.0 430.0 280.0(加利福尼亚州,100-10 销售) 1998.0 2358.0 2612.0 1972.0 2480.0 2940.0 3250.0 2530.0(销售, 100-10,俄勒冈州)464.0 347.0 345.0 370.0 570.0 420.0 420.0 470.0
可以变成制表符分隔的交叉表:
实际 实际 实际 实际 预算 预算 预算 预算 第一季度 第二季度 第三季度 第四季度 第一季度 第二季度 第三季度 第四季度 销售额 100-10 纽约州 1995.0 2358.0 2612.0 1972.0 2249.0 2220.0 2470.0 1720.0 销售额 100-10 马萨诸塞州 1456.0 1719.0 1905.0 1438.0 1360.0 1620.0 1800.0 1250.0 销售额 100-10 佛罗里达州 620.0 735.0 821.0 623.0 570.0 690.0 770.0 530.0 销售额 100-10 康涅狄格州 944.0 799.0 708.0 927.0 880.0 750.0 660.0 810.0 销售额 100-10 新罕布什尔州 353.0 413.0 459.0 345.0 320.0 370.0 430.0 280.0 销售额 100-10 加利福尼亚州 1998.0 2358.0 2612.0 1972.0 2480.0 2940.0 3250.0 2530.0 销售额 100-10 俄勒冈州 464.0 347.0 345.0 370.0 570.0 420.0 420.0 470.0
S充足的配置
设置过程大致如下:

属性
| 摘要信息 |
细节 |
| 预览结果 |
要预览交叉表格式,请选中此框。 |
| 输入文件 |
输入要转换为交叉表格式的文件,其中列标题和行标题定义为元组。 注意: 请设置输入文件,使其第一列为水平方向的分隔符分隔值集,第一行为垂直方向的分隔符分隔值集。 |
| 文件分隔符 |
选择用于 输入文件中列的分隔符。 |
| 字段分隔符 |
输入用于分隔交叉表格式中每个字段的字符。 |
| 省略图例(A1单元格) |
要从交叉表格式中省略 输入文件的单元格 A1,请选中此框。例如,如果单元格 A1 包含 (A,B),则交叉表格式的单元格 A1 和 A2 为空;否则,它们包含 A 和 B。 |
输出
注:行数统计 输出提供交叉表报告 输出中的总行数,包括所有标题行。
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
将 XLSX 转换为 CSV
该命令的表格转换版本已停用。任何已使用此命令的链都将继续运行,但无法创建未来的实例。
我们建议使用 Excel 连接器的工作表到 CSV 命令。
复制列
要从 DSV 文件复制列,请使用 Copy Column 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 列名称 |
请输入要复制的列的名称。 |
| 新列名 |
输入生成的列副本的名称。 |
| 插入索引 |
输入要插入该列副本的列索引。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
输入文件中使用的转义字符通常是 " |
提取价值
要按行索引和列索引从 DSV 文件中提取值,请使用 Extract Value 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 行索引 |
输入要从中提取值的行号,第一行位于 输入文件 中 1。 |
| 列索引 |
输入要从中提取数据的 行索引 的列号。要提取整行,请留空。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
筛选行
要按 正则表达式 (regex) 或行中一个或多个列的精确匹配来筛选 DSV 中的行,请使用 筛选行 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 寻找规律 |
输入要用于查找匹配项的模式。 |
| 匹配模式类型 |
选择是通过 正则表达式 还是 精确模式 进行匹配。 |
| 不区分大小写 |
要忽略文本的大小写,请选中此框。 |
| 逆 |
要保留所有匹配的行并丢弃其余行,请选中此框。 |
| 搜索列 |
输入以逗号分隔的列索引列表,以限制搜索范围。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此复选框。 |
注意: 筛选 Rows 命令需要一个正确的带标题的 DSV 文件。要筛选出不 带标题的 文件的第一行, 请使用 文件实用工具连接的 查找
命令。
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
寻找与取代
要根据 正 则表达式、全文字符串或列索引查找和替换数据中的列值,请使用查找和替换 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
指定输出原始文件还是副本:
- 要输出包含更新列值的原始文件,请输入与 输入文件相同的文件。
- 要输出包含更新列值的原始文件的副本,请输入新文件的名称。
|
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 寻找规律 |
输入要用于识别要替换的值的正则表达式、文本字符串或列索引,基于 匹配模式类型。 |
| 匹配模式类型 |
选择如何识别要查找的列值:
- 要根据正则表达式查找值,请选择
正则表达式。
- 要查找与完整文本字符串匹配的值,请选择
精确。
- 要根据列查找值,请选择
索引。
注: 精确匹配 每一列中的完整字符串 。要查找并替换列中 的部分值 ,请选择 “正则表达式 ”和 “仅替换匹配项” 。 |
| 重置价值 |
输入要替换匹配值的文本。 注意 :如果 匹配模式类型为索引, 则替换值将替换匹配列中的所有
值。 |
| 不区分大小写 |
要忽略文本的大小写,请选中此框。 |
| 仅替换匹配项 |
如果 匹配模式类型为 正则表达式,选中此框可仅将匹配的文本替换为替换值。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
| 列 |
输入以逗号分隔的列列表,以指定命令的作用范围,第一列用 0 表示。例如, 0,1,2,3 将命令限制为前四列。 |
注: 要将相同的 替换值 输入应用于多个值,请使用正则表达式作为 查找模式 输入,例如 (?:Variance|Variance %|All Periods|FY15|YTD)。
输出
| 输出 |
输出类型 |
| 查找并替换输出 |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
插入列
要将列插入到 DSV 文件中,请使用 Insert Column 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 标题文本 |
输入新列标题的名称。 |
| 数据值 |
请输入要插入到新列中的文本。 |
| 插入索引 |
请输入要插入新列的列索引。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
注意: 要插入 多个 列,请向输入文件添加一个带有标题 EMPTY_REPLACED_HEADER的列,其中每一行的值均为 EMPTY_REPLACED_VALUE。使用 “文件实用工具”连接,通过 “查找和替换 ”命令
,将标题占位符替换为所需的列标题,并将值占位符替换为所需逗号数量的字符串。
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
连接列
要连接 DSV 文件中的多列,并可选择丢弃已使用的列,请使用 Join Columns 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择分隔符 输入文件。 |
| 连接列索引 |
请输入新列的编号索引。在第一列中,输入 0。 |
| 匹配模式类型 |
选择要按以搜索列的模式类型:
- 要按列位置搜索,请选择 索引。
- 要输入以逗号分隔的标题列表,请选择 精确。
- 要使用 正则表达式,请选择 Regex。
|
| 匹配模式 |
输入要使用的模式或索引,以查找要连接的列。 |
| 合并列标题 |
输入通过连接创建的新列的名称。 |
| 加入文本 |
在新列中输入连接各个值的文本,例如 -。 |
| 舍弃 |
要删除合并为新列的列,请选中此框。 |
| 预览结果 |
要预览转换结果的前 10 行和标题,请选中此框。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
地图标题
要将一个标头列表替换为另一个标头列表,请使用 Map Headers 命令。列表中,标题之间用逗号分隔,顺序很重要。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择分隔符 输入文件。 |
| 输入头 |
输入要替换为新值的标头列表,顺序与 相同 输出标头。 |
| 输出头 |
输入要包含在输出中的新标头列表,顺序与 输入标头相同。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
| 使用索引 |
如果 输入标头 使用数字索引,请选中此框。 |
输出
| 输出 |
输出类型 |
| 地图标头输出 |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
枢
要将数据列中的值表示为单独的列,请使用 Pivot 命令。当你透视某一列时,该列中各行的唯一值会变成新的列标题。
例如,给定以下数据:
年份、计量单位、产品、市场、情景、期间、金额 2020财年、销售额、100-10、马萨诸塞州、实际值、1月、125 2020财年、销售额、100-10、马萨诸塞州、实际值、2月、225 2020财年、销售额、100-10、马萨诸塞州、实际值、3月、325 2020财年、销售额、100-10、马萨诸塞州、实际值、4月、425 2020财年、销售额、100-10、马萨诸塞州、实际值、5月、525 2020财年、销售额、100-10、马萨诸塞州、实际值、6月、625 2020财年、销售额、100-10、马萨诸塞州、实际值、7月、725 2020财年,销售额,100-10,马萨诸塞州,实际值,8月,825;2020财年,销售额,100-10,马萨诸塞州,实际值,9月,925;2020财年,销售额,100-10,马萨诸塞州,实际值,10月,1025;2020财年,销售额,100-10,马萨诸塞州,实际值,11月,1125;2020财年,销售额,100-10,马萨诸塞州,实际值,12月,1225;2020财年,销售成本,100-10,马萨诸塞州,实际值,1月,100;2020财年,销售成本,100-10,马萨诸塞州,实际值,2月,200 2020财年,销售成本,100-10,马萨诸塞州,实际,3月,300;2020财年,销售成本,100-10,马萨诸塞州,实际,4月,400;2020财年,销售成本,100-10,马萨诸塞州,实际,5月,500;2020财年,销售成本,100-10,马萨诸塞州,实际,6月,600;2020财年,销售成本,100-10,马萨诸塞州,实际,7月,700;2020财年,销售成本,100-10,马萨诸塞州,实际,8月,800;2020财年,销售成本,100-10,马萨诸塞州,实际,9月,900 2020财年,销售成本,100-10,马萨诸塞州,实际,10月,1000;2020财年,销售成本,100-10,马萨诸塞州,实际,11月,1100;2020财年,销售成本,100-10,马萨诸塞州,实际,12月,1200
如果将 MEASURE 列透视,将 Amount 列聚合,并将其余列指定为行,则输出将用Sales 和COGS 值的列替换 MEASURE 列,并提供它们各自的金额:
年份、产品、市场、情景、期间、销售额、销货成本 2020-10财年、马萨诸塞州、实际值、4月、425,400 2020-10财年、马萨诸塞州、实际值、8月、825,800 2020-10财年、马萨诸塞州、实际值、12月、1225,1200 2020-10财年、马萨诸塞州、实际值、2月、225,200 2020-10财年、马萨诸塞州、实际值、1月、125,100 2020-10财年、马萨诸塞州、实际值、7月、725,700 2020财年,马萨诸塞州,实际,6月,625,600美元;2020财年,马萨诸塞州,实际,3月,325,300美元;2020财年,马萨诸塞州,实际,5月,525,500美元;2020财年,马萨诸塞州,实际,11月,1125,110美元;2020财年,马萨诸塞州,实际,10月,1025,100美元;2020财年,马萨诸塞州,实际,9月,925,900美元
如果从行中排除 期间 列,则剩余行的每种组合都会汇总所有时间段:
年份、产品、市场、情景、销售额、销货成本(2020财年)、100-10、马萨诸塞州、实际值、8100、7800
如果将 MEASURE 和 Period 列都进行透视,则它们的每个唯一值组合都会显示为列,例如 Sales-JAN、Sales-FEB、 COGS-JAN等等:
年份、产品、市场、场景、1月销售额、2月销售额、3月销售额、4月销售额、5月销售额、6月销售额、7月销售额、8月销售额、9月销售额、10月销售额、11月销售额、12月销售额、1月销售成本、2月销售成本、3月销售成本、4月销售成本、5月销售成本、6月销售成本、7月销售成本、8月销售成本、9月销售成本、10月销售成本、11月销售成本、12月销售成本2020财年,100-10,马萨诸塞州,实际,125,225,325,425,525,625,725,825,925,1025,1125,1225,100,200,300,400,500,600,700,800,900,1000,1100,1200
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要进行数据透视的文件。 |
| 分隔符号 |
选择用于分隔 输入文件中字段的分隔符。 |
| 汇总 |
选择如何聚合透视值:
- SUM,将具有相同行值的记录合并为单个记录。受到推崇的。
- NONE,为一组等效值创建多行。透视列的每一行都会被填充,但其他行可能包含 NULL 值。
|
| 要汇总的值 |
输入要包含在透视列的行中的数据的列,例如前面示例中的 金额 列。 |
| 透视列 |
输入要用作列标题的行值所在的列。如果有多列,则每列的值都有其唯一组合,并显示单独的一列。 |
| 列分隔符 |
如果存在多个透视列,请输入用于分隔新列标题中各列值的分隔符。
|
| 透视行 |
在 中输入要保留的列。输入文件 。在输出结果中,这些列值的每种唯一组合都显示为一行。 不要 输入与 要聚合的值相同的列 ,或者输入 透视列。 |
| 预览结果 |
要启用透视数据的预览,请选中此框。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
重新排序列
要重新排列 DSV 文件的列,请使用 Reorder columns 命令。您可以通过列名或索引来识别列。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 列顺序 |
输入文件 中的各个列或范围的数组,顺序应与它们在转换后的文件中出现的顺序一致。要指定列,请使用其名称或索引,从 1开始。例如,输入 4:6 或 ColA:ColC 来指定一个范围,或者输入 7 或 ColH 来指定单个列。 注: 输入文件中未包含在 列顺序 中的任何列 ,都将出现在转换后文件列的末尾,顺序与 输入文件中的顺序相同。
|
| 预览结果 |
要在命令输出中显示结果预览(标题和前 10 行),请选中此框。 |
输出
| 输出 |
输出类型 |
| 转换后的文件 |
文件 |
| 转换后的行 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
智能筛选行
要在 DSV 文件行中应用基于文本、日期或数字值的多个过滤组标准,请使用Smart 筛选 Rows 命令。您可以按 正则表达式 或一个或多个列的精确匹配来筛选行。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择 输入文件中使用的分隔符。 |
| 逆 |
要保留(而不是删除)所有与 筛选条件匹配的行,请选中此框。 |
| 筛选条件 |
要设置应用于 输入文件的文本、数字或日期过滤器,请选择过滤器组的运算符(AND 或 OR),并为每个过滤器组配置条件。 对于 文本 筛选组:
- 在 列名中,输入要筛选的列的名称。
- 要忽略 列名 和 比较文本的大小写,请选择不区分大小写。
- 在 条件 和 比较文本中,输入要搜索列的值的条件,例如“等于 [文本]”或“包含 [文本]”。 <!--To apply
the inverse of the Condition
input, such as to match text that does not
equal or contain the Compare Text
input, select Not.-->
<!---
To remove any leading or trailing spaces from
matched text, select Trim.
-->
对于 数字 筛选组:
- 在 格式中,选择要匹配的数字格式——整数或小数。如果可以选择,请选择十进制。
- 在 列名中,输入要筛选的列的名称。
- 在 条件 和 测试编号中,输入要搜索列的值的条件,例如“等于 [数字]”或“小于 [数字]”。 <!--To apply the inverse
of the Condition input,
such as to match numbers that do not
equal the Test Number input,
select Not.-->
<!---
To match numbers regardless of whether they're
positive or negative, select Absolute Value.
-->
对于 日期 筛选组:
- 在格式中,输入 2006 年 1 月 2 日,日期格式应与实际日期一致,例如 2006-01-02。
- 在 列名中,输入要筛选的列的名称。
- 在 条件 和 比较日期中,输入要搜索列的值的条件,例如“等于 [日期]”或“小于 [日期]”。 <!--To
apply the inverse of the Condition
input, such as to match dates that do not
equal the Compare Date
input, select Not.-->
|
| 预览结果 |
要在命令输出中显示结果预览,请选中此框。 |
输出
| 输出 |
输出类型 |
| 智能过滤器行输出 |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
分割文件
要根据记录数将文件拆分为多个文件,请使用 Split File 命令。例如,使用此命令并行处理较小的数据块,有助于提高性能。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要拆分成多个文件的文件。 |
| 文件分隔符 |
选择 输入文件中每一列的分隔符。 |
| 添加前导标题 |
要将 输入文件 的标头包含在创建的每个文件块中,请选中此框。 |
| 每个文件的记录数 |
请输入每个文件块中要包含的最大记录数。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
创建文件块失败 |
拆分值
要使用值分隔符将一列拆分为多列,请使用 Split Value 命令。
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要转换的文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择用于分隔 输入文件中列的分隔符。 |
| 新标题 |
按顺序输入要根据拆分值创建的新标题列表。 |
| 列名称 |
输入要拆分的列的标题。 |
| 值分隔符 |
请输入分隔符以分割值。 |
| 丢弃列 |
要删除要拆分的列,请选中此框。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
堆栈文件
要将分隔符分隔值 (DSV) 文件列表中的值按指定顺序堆叠在一起,请使用 Stack Files 命令。新文件将使用第一个文件的标题行。
注意: 要使用此命令堆叠文件,它们必须具有相同数量的列。要堆叠 非 对称文件,请使用 文件 实用工具 连接 器及其 堆叠 文件命令
。
属性
| 摘要信息 |
细节 |
| 文件 |
输入要堆叠的DSV文件。 |
| 输出文件 |
输入转换后生成的文件名。 |
| 分隔符号 |
选择用于分隔 文件中列的分隔符。 |
| 输入文件 |
请输入要堆叠的文件,文件之间用逗号分隔。 注意:使用循环时,此字段为必填项(因为文件未上传到“文件”部分)。如果将该命令添加到“文件”部分,则会触发“找不到文件”错误。 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
输出
| 输出 |
输出类型 |
| 堆栈文件输出 |
文件 |
| 记录计数 |
整数 |
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
转置
要将分隔符文件的 所有字段沿其水平和垂直轴旋转,使行变为列 ,反之亦然,请使用转置 命令。例如,使用此命令,生成此 CSV 文件:
id,1,2,3,4
name,"Johnson, Smith, and Jones Co.","Sam Smith",Barney & Co.,Johnson's Auto
amount,345.33,933.40,0,2344
remark,Pays on time,,"合作愉快.",
变为:
id,name,amount,remark
1,"Johnson, Smith, and Jones Co",345.33,按时付款
2,"Sam Smith",933.40,
3,"Barney & Co.,"合作愉快。"
4,"Johnson's Auto",2344,
属性
| 摘要信息 |
细节 |
| 预览结果 |
要预览转换结果的前十行和标题,请选中此框。 |
| 输入文件 |
输入要转置的分隔符文件。 |
| 文件分隔符 |
选择输入文件中每一列的分隔符。
|
| 块大小 |
请输入每个待处理工作文件的最大大小(以 MB 为单位)。 |
输出
| 输出 |
输出类型 |
| 转置的 CSV |
文件 |
| 记录计数 |
整数 |
注:记录计数 提供的是转置 CSV 文件中的总行数, 不包括标题行。
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
输入文件转置失败 |
重新调整方向
要将多列数据(例如财务数据中的时间段)合并到具有多行的单列中,请使用 Unpivot 命令。例如,给定以下数据:
年份、指标、产品、市场、情景、1月、2月、3月、4月、5月、6月、7月、8月、9月、10月、11月、12月 2020财年、销售额、100-10、纽约、实际值、100、200、300、400、500、600、700、800、900、1000、1100、1200 2020财年、销售额、100-10、马萨诸塞州、实际值、125、225、325、425、525、625、725、825、925、1025、1125、1225
您可以将每月金额反向透视到新的 Period 和 Amount 列中:
年份、计量单位、产品、市场、情景、期间、金额 2020财年、销售额、100-10、马萨诸塞州、实际值、1月、125 2020财年、销售额、100-10、马萨诸塞州、实际值、2月、225 2020财年、销售额、100-10、马萨诸塞州、实际值、3月、325 2020财年、销售额、100-10、马萨诸塞州、实际值、4月、425 2020财年、销售额、100-10、马萨诸塞州、实际值、5月、525 2020财年、销售额、100-10、马萨诸塞州、实际值、6月、625 2020财年、销售额、100-10、马萨诸塞州、实际值、7月、725 2020财年,销售额,100-10,马萨诸塞州,实际值,8月,825;2020财年,销售额,100-10,马萨诸塞州,实际值,9月,925;2020财年,销售额,100-10,马萨诸塞州,实际值,10月,1025;2020财年,销售额,100-10,马萨诸塞州,实际值,11月,1125;2020财年,销售额,100-10,马萨诸塞州,实际值,12月,1225;2020财年,销售额,100-10,纽约州,实际值,1月,100;2020财年,销售额,100-10,纽约州,实际值,2月,200;2020财年,销售额,100-10,纽约州,实际值,3月,300 2020财年,销售额,100-10,纽约,实际值,4月,400;2020财年,销售额,100-10,纽约,实际值,5月,500;2020财年,销售额,100-10,纽约,实际值,6月,600;2020财年,销售额,100-10,纽约,实际值,7月,700;2020财年,销售额,100-10,纽约,实际值,8月,800;2020财年,销售额,100-10,纽约,实际值,9月,900;2020财年,销售额,100-10,纽约,实际值,10月,1000;2020财年,销售额,100-10,纽约,实际值,11月,1100;2020财年,销售额,100-10,纽约,实际值,12月,1200
属性
| 摘要信息 |
细节 |
| 输入文件 |
输入要进行数据透视转换的文件。 |
| 分隔符号 |
选择用于分隔 输入文件中字段的分隔符。 |
| 汇总 |
选择如何聚合未透视值:
- SUM,用于聚合所有列中值相同的记录。受到推崇的。
- NONE,以创建重复行,每个记录具有唯一的数据值。
|
| 新列标签 |
输入基于未透视列的输出行的列标题。在前面的例子中, 句号。 |
| 数据列标题 |
输入输出结果中未透视列的数据对应的列标题。在前面的例子中, 金额。 |
| 数据头 |
要取消 透视 特定列,请列出它们的标题,并在每个标题之间按 Enter 键 。在前面的例子中, JAN, FEB, MAR, 等等。
|
| 起始透视列名称 |
要按 标题 对 列范围进行逆透视,请输入范围的第一列的名称。在前面的例子中, JAN。 |
| 结束透视列名称 |
要按 标题 对 列范围进行逆透视,请输入范围最后一列的名称。在前面的例子中, DEC。 注意: 如果您输入 起始透视列名 但 没有 结束透视列名,则该命令会取消透视该列名以及 起始透视列名 [ 右侧的所有列。这对于滚动预测产生的数据非常有用。 |
| 起始枢轴列索引 |
要按 位置 对 列范围进行逆透视,请输入该范围内第一列的索引值。使用从零开始的索引,其中 输入文件 中的列从 0 开始。在前面的示例中, 5。 |
| 结束透视列索引 |
要按 位置 对 列范围进行逆透视,请输入范围最后一列的索引值。使用从零开始的索引,其中 输入文件 中的列从 0 开始。在前面的示例中, 16。 注意: 如果您输入 起始透视列索引 但 没有 结束透视列索引 ,则该命令会取消透视该列及其右侧的所有 列。这对于滚动预测产生的数据非常有用。 |
| 预览结果 |
要启用未透视输出的预览,请选中此框。 |
输出
退出代码
| 代码 |
类型 |
细节 |
| 0 |
成功 |
成功 |
| 1 |
错误 |
无效参数 |
| 2 |
错误 |
普遍失败 |
| 14 |
错误 |
无效的输出文件位置 |
| 15 |
错误 |
在 输入文件中使用的转义字符通常是 " |
疑难解答
如果命令执行失败,请检查以下常见问题。
分隔符错误
如果在配置转换命令时设置了错误的分隔符,则转换将无法按预期执行。
不是标准的 CSV 文件
如果表格数据集不是正确的 CSV 格式,则转换命令不会执行,因为它在处理输入之前会检查格式是否符合 RFC 4180。正确的 CSV 文件:
- 使用 ASCII、Unicode(例如 UTF-8)、EBCDIC 或 Shift JIS 等字符集以纯文本形式存储数据。
- 由每行一条记录组成,记录被分成若干字段,字段之间用分隔符分隔,通常是单个保留字符,例如逗号、分号或制表符。有时分隔符可以包含可选空格。
- 对于每个 记录,字段序列都相同
- 通常以平面文件或关系型数据报表的形式输出
每条记录中的列数不一致
如果表格数据集中的记录列数不同,转换命令会检测到它不是正确的 CSV 文件。
不同的列数
将两个列数不同的标准 CSV 表格数据集合并是行不通的,堆叠文件命令将显示错误。