表形式データを必要な形式にマッサージするなど、区切り文字で区切られた値(DSV)データをアップロード用に準備するには、Tabular Transformation接続コマンドを使用するチェーンのステップを追加します。例:
- レコードの内容に基づいてデータセットを分割する
- ルールに基づくフィルタリング
- 複数のソースからのデータセットを組み合わせる
これらのコマンドを有効にするには、IT管理者はまずTabular Transformationコネクタ を作成します。
ヘッダーの追加
カンマ区切り値(CSV)ファイルにヘッダー行を追加するには、Add Header コマンドを使用する。
プロパティ
プロパティ |
詳細 |
入力ファイル |
ヘッダーを追加するファイルを入力します。 |
区切り記号 |
入力ファイル で列の区切りに使用するデリミタを選択する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
ヘッダー列 |
ヘッダー行の内容をすべて入力する。各ヘッダーは、Column1,Column2,Column3 のように区切り文字で区切ります。 |
ヘッダーの区切り記号 |
ヘッダー行 のヘッダーの区切りに使用される区切り文字を、 のように入力してください、 |
出力
出力 |
出力タイプ |
ヘッダー付きCSV |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
行番号の追加
最初の列のDSVに行番号を追加するには、Add Row Numbers コマンドを使用する。
プロパティ
プロパティ |
詳細 |
入力ファイル |
行番号を追加するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル のカラムを区切るデリミタを入力する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
行番号出力の追加 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
高度なクエリ
1つまたは複数の CSV ファイルに対して SQL クエリを実行するには、Advanced Query コマンドを使用します。このコマンドに添付した他のファイルを結合することもできる。
注: このコマンドは、SELECT
ステートメントおよび補完的なJOIN
ステートメントをサポートしますが、 INSERT
,UPDATE
, またはCREATE
のような ステートメントはサポートしません。行を挿入するには、Stack Files コマンドを使用する。行を更新するには、Find and Replace を使用する。
プロパティ
プロパティ |
詳細 |
テーブル |
クエリで使用するすべてのファイルとそのテーブル名を入力する。 |
クエリ |
実行するSQLクエリを入力する。SQLite構文として :
- カラム名や識別子にスペースや特殊文字が含まれる場合は、括弧を使用する。例えば、
[A列], [B列] 。
- 小数点以下のスペースが2つあるデータをフォーマットするには、構文を使用します
SELECT PRINTF('%.2f',(SUM(DATA)))AS EBITDA FROM HFMDat .
- 2つのレコードが同じ
ID を持つ場合など、重複の最初のインスタンスを選択するには、構文select * from group by ID having MIN(ID) ORDER BY ID を使用する。
- 複数の文字列を連結するには、
string1 || string2 [ || string_n ] のように、|| 演算子を使う。
|
入力区切り文字 |
Tables で使用する区切り文字と、結合ファイルを選択します。 |
出力デリミター |
クエリー結果で使用する区切り文字を選択します。 |
プレビュー |
クエリー結果のプレビューを印刷するには、このボックスをチェックします。 |
Advanced Query コマンドは、自動的に列のデータ型を決定しようとします。コマンドが整数に対して間違えた値の先頭のゼロを保持するには、Find and Replace コマンド(Regex
とReplace matches only が選択されている)を使用して、列の値の周りにシングルクォート('
)を追加し、Advanced Query コマンドが完了した後にそれらを削除します:
- シングルクォートを追加するには、
(\d+)
を見つけ、'$1'
で置き換える。
- シングルクォートを削除するには、
'(\d+)'
を見つけ、$1
と置き換える。
Regex
を選択すると、Find and Replace コマンドは、括弧 (()
) を使ってグループまたは文字をキャプチャし、最初のパラメータ$1
として置換します。複数のキャプチャを作成するには、$2
のように、括弧と増分値のセットを使用する。
出力
出力 |
出力タイプ |
結果 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
区切り文字の変更
CSVファイルの区切り文字を変更するには、Change Delimiter コマンドを使用します。
注: RFC仕様に準拠するため、 区切り文字には常に1文字、できればカンマかタブ文字を使用すること。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
入力区切り文字 |
入力ファイル で現在使用されている区切り文字を入力する。タブ文字は、 \t と入力する。 |
出力デリミター |
変換後に使用する区切り文字を入力します。タブ文字は、 \t と入力する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
空の行を保持する |
出力に空の行を維持するには、このボックスをチェックします。デフォルトでは削除されている。 |
出力
出力 |
出力タイプ |
CSV結果 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
引用符で囲まれていないきれいな改行
引用符で囲まれていない改行文字を除き、RFC(Request for Comments)準拠のファイルをクリーニングするには、Clean Unquoted Newlines コマンドを使用します。例えば、キャリッジ・リターンや改行文字に矛盾があるデータ・ファイルを処理するには、このコマンドを使用する。
注: このコマンドは引用符で囲まれていない改行だけをクリーニングする。その他の非準拠の問題は、やはりデータセットが失敗する原因となる。
プロパティ
プロパティ |
詳細 |
プレビュー結果 |
コマンドのログで結果をプレビューするには、このボックスをチェックする。 |
入力ファイル |
クリーニングするファイルを入力します。 |
ファイルの区切り文字 |
入力ファイル の各列の区切り文字を選択する。 |
ダラダラと引用符を使う |
引用符のないフィールドに引用符を表示し、引用符のあるフィールドに二重引用符以外の引用符を表示するには、このボックスにチェックを入れます。 |
末尾のテキストを追加する |
入力ファイル にある区切り文字のない単一列の行を、前のレコードの最後の列の最後の値に追加するには、このボックスにチェックを入れる。 |
出力
出力 |
出力タイプ |
改行出力のクリーンアップ |
ファイル |
行数 |
整数 |
注: 行数 出力は、クリーン改行出力 出力内のヘッダーを含むレコードの総数を提供する。
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
クリーンな改行出力の作成に失敗 |
カラムフィルター
指定されたパターンに一致するヘッダーを持つDSVカラムをフィルタリングするには、Column Filter コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
パターン・タイプ |
フィルタリングするパターンの種類を選択します:
-
インデックス 列のインデックスでフィルタリングする
-
Exact カンマで区切られた正確な値のリストでフィルタリングする。
-
Regex正規表現でフィルタリングする
|
パターン |
列をマッチさせるパターンを入力する。パターンタイプ がインデックス の場合、1:5,7:8,10:15 のようにスプレッド演算子を適用する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
インバース |
一致した列を残し、それ以外を削除するには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
カラム・フィルター出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
ファイルの連結
複数の表データ ソース ファイルを 1 つの CSV データセットに水平方向にマージするには、Concat Files コマンドを使用します。
プロパティ
プロパティ |
詳細 |
ソースファイル |
連結するファイルを入力する。 |
プレビュー結果 |
コマンドのログで結果をプレビューするには、このボックスをチェックする。 |
ファイルの区切り文字 |
ソースファイル で使用する区切り記号を選択する。 |
出力
出力 |
出力タイプ |
マージされたCSV |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
CSVの生成に失敗しました |
CSVをXLSXに変換する
CSVファイルをMicrosoft Excel®ワークブック(XLSX)に変換するには、Convert CSV to XLSX コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
XLSXに変換するファイルを入力します。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
シート名 |
Excelワークブックに作成するシート名を入力します。 |
出力ファイル |
ファイルを保存する場所のパスを入力します(オプション)。チェイン内の他のコマンドの出力として使用する場合は、空白のままにしておく。 |
出力
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
JSONをCSVに変換する
JSONファイルをCSVに変換するには、Convert JSON to CSV コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
CSVに変換するJSONファイルを入力します。 |
出力ファイル |
新しいCSVファイルの保存先パスを入力します。チェイン内の他のコマンドの出力として使用する場合は、空白のままにしておく。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
出力
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
クロスタブに変換
Oracle Essbase® 多次元式 (MDX) クエリ出力などの表データセットをクロス集計、またはクロス集計 の形式に変換するには、Convert to Cross-Tab コマンドを使用します。このコマンドは、入力された表データセットのタプルとして定義された列と行のヘッダーにクロスタブのレイアウトを基づかせる。
例えば、このコマンドを使えば、このデータセットは
(第1四半期実績) (第2四半期実績) (第3四半期実績) (第4四半期実績) (第1四半期予算) (第2四半期予算) (第3四半期予算) (第4四半期予算) (売上高、100対10、ニューヨーク州) 1995.0 2358.0 2612.0 1972.0 2249.0 2220.0 2470.0 1720.0 (販売 100-10, マサチューセッツ) 1456.0 1719.0 1905.0 1438.0 1360.0 1620.0 1800.0 1250.0 (販売 100-10, フロリダ) 620.0 735.0 821.0 623.0 570.0 690.0 770.0 530.0 (販売 100-10, コネチカット) 944.0 799.0 708.0 927.0 880.0 750.0 660.0 810.0 (販売 100-10, ニューハンプシャー) 353.0 413.0 459.0 345.0 320.0 370.0 430.0 280.0 (販売 100-10, California) 1998.0 2358.0 2612.0 1972.0 2480.0 2940.0 3250.0 2530.0 (販売 100-10, Oregon) 464.0 347.0 345.0 370.0 570.0 420.0 420.0 470.0
はタブ区切りのクロスタブになる:
実績 実績 実績 予算 予算 予算 第1四半期 第2四半期 第3四半期 第4四半期 第1四半期 第2四半期 第3四半期 第4四半期 売上高 100-10 ニューヨーク 1995.0 2358.0 2612.0 1972.0 2249.0 2220.0 2470.0 1720.0 売上高 100-10 マサチューセッツ 1456.0 1719.0 1905.0 1438.0 1360.0 1620.0 1800.0 1250.0 売上高 100-10 フロリダ 620.0 735.0 821.0 623.0 570.0 690.0 770.0 530.0 売上高 100-10 コネチカット州 944.0 799.0 708.0 927.0 880.0 750.0 660.0 810.0 売上高 100-10 ニューハンプシャー州 353.0 413.0 459.0 345.0 320.0 370.0 430.0 280.0 売上高 100-10 カリフォルニア 1998.0 2358.0 2612.0 1972.0 2480.0 2940.0 3250.0 2530.0 売上高 100-10 オレゴン 464.0 347.0 345.0 370.0 570.0 420.0 420.0 470.0
S十分な構成
セットアップは次のようになる:

プロパティ
プロパティ |
詳細 |
プレビュー結果 |
クロスタブ形式をプレビューするには、このボックスをチェックします。 |
入力ファイル |
列と行のヘッダーをタプルとして定義し、クロスタブ形式に変換するファイルを入力します。 注: 入力ファイルの最初の列が、水平方向に広がるように区切られた値の集合であり、最初の行が、垂直方向に広がるように区切られた値の集合であるように設定する。 |
ファイルの区切り文字 |
入力ファイル の列で使用する区切り文字を選択する。 |
フィールド・デリミター |
クロスタブ形式に分割された各フィールドの区切りに使用する文字を入力します。 |
キーを省略(A1セル) |
入力ファイル のセル A1 をクロスタブ形式から省くには、このボックスにチェックを入れる。例えば、セルA1が(A,B)を含む場合、クロス・タブ形式のセルA1とA2は空白になり、含まない場合はAとBが含まれる。 |
出力
出力 |
出力タイプ |
クロス集計レポート |
ファイル |
行数 |
整数 |
注: 行数 出力は、すべてのヘッダー行を含む、クロスタブ・レポート 出力の総行数を提供します。
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
XLSXをCSVに変換する
このコマンドのTabular Transformationバージョンは廃止されました。このコマンドを使った既存のチェーンは機能し続けるが、今後インスタンスを作成することはできない。
代わりに、ExcelコネクタのワークシートからCSVへのコマンド を使用することをお勧めします。
コピー欄
DSVファイルから列をコピーするには、Copy Column コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
カラム名 |
コピーする列の名前を入力する。 |
新しいカラム名 |
結果の列のコピーの名前を入力する。 |
インデックス挿入 |
列のコピーを挿入する列インデックスを入力する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
コピーカラム出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイルで使われるエスケープ文字。通常は" である。 |
抽出値
DSVファイルから行インデックスと列インデックスによって値を抽出するには、Extract Value コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
行インデックス |
入力ファイル の最初の行を1 として、値を抽出する行番号を入力する。 |
列インデックス |
行インデックス 入力から抽出する列番号を入力します。行全体を抽出する場合は空白にする。 |
出力
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
フィルター行
、正規表現 (regex)または行内の1つ以上の列の完全一致によってDSVの行をフィルターするには、Filter Rows コマンドを使用する。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
パターンを探す |
マッチを検索するために使用するパターンを入力します。 |
マッチ・パターン・タイプ |
Regex またはExact のどちらのパターンでマッチするかを選択します。 |
大文字と小文字を区別しない |
テキストの大文字と小文字を無視するには、このボックスをチェックします。 |
インバース |
マッチした行をすべて残し、残りを破棄するには、このボックスをチェックする。 |
検索コラム |
検索対象を限定するカラム・インデックスのリストをカンマ区切りで入力する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
注: Filter Rows コマンドは、ヘッダー付きの適切なDSVファイルを想定しています。 ヘッダーのないファイルの最初の行をフィルタリングするには、ファイル・ユーティリティ接続のFind
コマンドを使用する 。
出力
出力 |
出力タイプ |
フィルター行出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
検索と置換
正規表現 、全文文字列、または列インデックスに基づいてデータ内の列値を検索および置換するには、検索および置換 コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
オリジナルファイルを出力するか、コピーを出力するかを指定する:
- 列の値が更新されたオリジナル・ファイルを出力するには、入力ファイル と同じファイルを入力する。
- 列の値が更新されたオリジナルのコピーを出力するには、新しいファイル名を入力する。
|
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
パターンを探す |
Match pattern type に基づいて、置換する値を特定するために使用する正規表現、テキスト文字列、または列インデックスを入力します。 |
マッチ・パターン・タイプ |
検索する列の値を特定する方法を選択します:
- 正規表現に基づいて値を検索するには、
Regex を選択します。
- 完全なテキスト文字列に一致する値を検索するには、
Exact を選択します。
- 列に基づいて値を検索するには、
Index を選択します。
注: Exact は、各カラム内の完全文字列 と一致する。部分値 を列で検索して置換するには、Regex とReplace matches only を選択します。 |
交換価値 |
一致した値を置換するテキストを入力する。 注: マッチ・パターン・タイプ がインデックス の場合、置換値はマッチした列の値をすべて置き換えます。 |
大文字と小文字を区別しない |
テキストの大文字と小文字を無視するには、このボックスをチェックします。 |
置換マッチのみ |
Match pattern type がRegex の場合、一致するテキストのみを置換値で置き換えるには、このボックスにチェックを入れます。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
列 |
0 を最初のカラムとして、コマンドをスコープするカラムのリストをカンマ区切りで入力する。例えば、0,1,2,3 、コマンドは最初の4列に限定される。 |
注: 同じ置換値 入力を複数の値に適用するには、検索パターン 入力として正規表現を使用します。たとえば、(?:Variance|Variance %|All Periods|FY15|YTD)
のようにします。
出力
出力 |
出力タイプ |
検索&置換出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
列を挿入
DSVファイルに列を挿入するには、Insert Column コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
ヘッダーテキスト |
新しい列ヘッダーの名前を入力します。 |
データ値 |
新しい列に挿入するテキストを入力します。 |
インデックス挿入 |
新しい列を挿入する列インデックスを入力する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
注: 複数の 列を挿入するには、EMPTY_REPLACED_HEADER
のヘッダーを持つ列を入力ファイルに追加し、EMPTY_REPLACED_VALUE
の各行の値を指定する。ファイルユーティリティ接続 で、検索と置換
コマンドを使用して、ヘッダープレイスホルダを希望の列ヘッダに、値プレースホルダを必要な数のカンマ文字列に置き換える。
出力
出力 |
出力タイプ |
カラム出力の挿入 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
列の結合
DSVファイルの複数の列を結合し、オプションで使用済みの列を破棄するには、Join Columns コマンドを使用します。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル の区切り文字を選択する。 |
結合列インデックス |
新しい列の番号インデックスを入力する。最初の列には0 と入力する。 |
マッチ・パターン・タイプ |
列を検索するパターンの種類を選択する:
- 列の位置で検索するには、Index を選択します。
- カンマで区切られたヘッダーのリストを入力するには、Exact を選択します。
- 正規表現 を使用するには、Regex を選択する。
|
マッチパターン |
結合するカラムを見つけるために使用するパターンまたはインデックスを入力します。 |
結合カラム・ヘッダ |
結合から作成される新しいカラムの名前を入力します。 |
参加テキスト |
- のように、新しい列の値を結合するテキストを入力する。 |
破棄 |
新しい列を作成するために結合された列を削除するには、このボックスをチェックします。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
結合カラム出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
地図ヘッダー
ヘッダーのリストを別のヘッダーのリストに置き換えるには、Map Headers コマンドを使います。リストでは、ヘッダーをカンマで区切り、順番を重要視する。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル の区切り文字を選択する。 |
入力ヘッダー |
新しい値に置き換えるヘッダーのリストを、出力ヘッダー と同じ順序で入力する。 |
出力ヘッダー |
出力に含める新しいヘッダーのリストを、入力ヘッダー と同じ順序で入力する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
インデックスを使用する |
入力ヘッダー が数値インデックスを使用する場合は、このボックスにチェックを入れる。 |
出力
出力 |
出力タイプ |
マップヘッダ出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
ピボット
データ列の値を別々の列として表現するには、Pivot コマンドを使用します。列をピボットすると、その行の一意の値が新しい列ヘッダーになります。
例えば、こんなデータがある:
年度,測定,製品,市場,シナリオ,期間,金額 FY20,売上高,100-10,マサチューセッツ州,実績,JAN,125 FY20,売上高,100-10,マサチューセッツ州,実績,FEB、225 FY20,マサチューセッツ州売上高(100-10,Massachusetts)実績 MAR,325 FY20,マサチューセッツ州売上高(100-10,Massachusetts)実績 APR,425 FY20,マサチューセッツ州売上高(100-10,Massachusetts)実績 MAY,525 FY20、売上高 100-10、マサチューセッツ州、実績 JUN,625 FY20、売上高 100-10、マサチューセッツ州、実績 JUL,725 FY20、売上高 100-10、マサチューセッツ州、実績 AUG,825 FY20,Sales、マサチューセッツ州 100-10台販売実績 SEP,925 FY20,マサチューセッツ州 100-10台販売実績 OCT,1025 FY20,マサチューセッツ州 100-10台販売実績 NOV,1125 FY20,100-10、マサチューセッツ州,実績,DEC,1225 FY20,売上高,100-10,マサチューセッツ州,実績,JAN,100 FY20,売上高,100-10,マサチューセッツ州,実績,FEB,200 FY20,売上高,100-10、マサチューセッツ州,実績,MAR,300 FY20,COGS,100-10,マサチューセッツ州,実績,APR,400 FY20,COGS,100-10,マサチューセッツ州,実績,MAY,500 FY20,COGS,100-10,マサチューセッツ州、実績,JUN,600 FY20,COGS,100-10,マサチューセッツ,実績,JUL,700 FY20,COGS,100-10,マサチューセッツ,実績,AUG,800 FY20,COGS,100-10,マサチューセッツ,実績、SEP,900 FY20,COGS,100-10,マサチューセッツ州,実績,OCT,1000 FY20,COGS,100-10,マサチューセッツ州,実績,NOV,1100 FY20,COGS,100-10,マサチューセッツ州,実績,DEC,1200
MEASURE
列をピボットし、Amount
列を集約し、残りの列を行として指定すると、出力はMEASURE
列をそのSales
およびCOGS
値の列に置き換え、それぞれの金額を提供します:
年度,製品,市場,シナリオ,期間,売上高,COGS FY20,100-10,マサチューセッツ,実績,APR,425,400 FY20,100-10,マサチューセッツ,実績,AUG,825,800 FY20,100-10、Massachusetts,Actual,DEC,1225,1200 FY20,100-10,Massachusetts,Actual,FEB,225,200 FY20,100-10,Massachusetts,Actual,JAN,125,100 FY20,100-10,Massachusetts,Actual,JUL,725,700 FY20,100-10,Massachusetts,Actual,JUN,625,600 FY20,100-10,Massachusetts,Actual,MAR,325,300 FY20,100-10,Massachusetts,Actual,MAY,525,500 FY20,100-10,Massachusetts,Actual,NOV,1125,1100 FY20,100-10,Massachusetts,Actual,OCT,1025,1000 FY20,100-10,Massachusetts,Actual,SEP,925,900
行からPeriod
列を除外すると、残りの行の各組み合わせについて、すべての期間が集計される:
年度,製品,市場,シナリオ,売上高,COGS 20年度,100-10,マサチューセッツ,実績,8100,7800
MEASURE
、Period
、両方の列をピボッ トすると、それらの値の一意の組み合わせが列として表示されます(Sales-JAN
、Sales-FEB
、COGS-JAN
など):
YEAR,PRODUCT,MARKET,SCENARIO,売上-JAN,売上-FEB,売上-MAR,売上-APR,売上-MAY,売上-JUN,売上-JUL,売上-AUG,売上-SEP,売上-OCT,売上-NOV,売上-DEC,COGS-JAN,COGS-FEB,COGS-MAR,COGS-APR,COGS-MAY、COGS-JUN,COGS-JUL,COGS-AUG,COGS-SEP,COGS-OCT,COGS-NOV,COGS-DEC FY20,100-10,Massachusetts,Actual,125,225,325,425,525,625,725,825,925,1025,1125,1225,100,200,300,400,500,600,700,800,900,1000,1100,1200
プロパティ
プロパティ |
詳細 |
入力ファイル |
ピボットするデータのファイルを入力します。 |
区切り記号 |
入力ファイル でフィールドの区切りに使用するデリミタを選択する。 |
集計 |
ピボット値の集計方法を選択します:
- SUM 、同じ行の値を持つレコードを1つのレコードにまとめる。おすすめだ。
- NONE, 等価値の1セットに対して複数の行を作成する。ピボットされたカラムの各行は入力されるが、他の行はNULLを含む可能性がある。
|
集約する値 |
ピボットされた列の行に含めるデータを持つ列を入力します。たとえば、先ほどの例では、金額 列のように入力します。 |
ピボット・カラム |
カラムヘッダーとして使用する行の値をカラムに入力します。複数の列がある場合は、それぞれの値のユニークな組み合わせごとに別の列が表示される。 |
列の区切り文字 |
複数のピボット列 、新しい列ヘッダーで値を区切るために使用する区切り記号を入力します。 |
ピボットロー |
入力ファイル に保持する列を入力する。出力では、これらの列の値のそれぞれのユニークな組み合わせが行として表示される。 集計する値と同じ列を入力しない またはピボット列. |
プレビュー結果 |
ピボットされたデータのプレビューを有効にするには、このボックスをチェックします。 |
出力
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
列の並び替え
DSVファイルの列を並べ替えるには、Reorder columns コマンドを使用します。名前またはインデックスでカラムを識別できます。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
カラムオーダー |
入力ファイル の個々の列または範囲を、変換後のファイルに現れるべき順序で配列に入力する。カラムを指定するには、1 で始まるカラム名またはインデックスを使用する。例えば、4:6 またはColA:ColC を入力して範囲を指定し、7 またはColH を入力して個々の列を指定する。 注: 入力ファイル に含まれる列で、 に含まれないものはすべて、列の順序 は、変換されたファイルの列の最後に、入力ファイル と同じ順序で現れる。 |
プレビュー結果 |
コマンド出力に結果のプレビュー(ヘッダーと最初の10行)を表示するには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
変換ファイル |
ファイル |
変換された行 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
スマートフィルター行
テキスト、日付、または数値の値に基づいて複数のフィルタグループの基準をDSVファイルの行に適用するには、Smart Filter Rows コマンドを使用します。、正規表現 、または1つ以上の列の完全一致によって行をフィルタリングすることができます。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル で使用する区切り記号を選択する。 |
インバース |
Filters に一致する行をすべて削除せずに残すには、このボックスをチェックします。 |
フィルター |
入力ファイル に適用するテキスト、数字、または日付フィルタを設定するには、フィルタグループの演算子(AND または OR)を選択し、それぞれの条件を設定します。 テキスト フィルターグループ:
- 列名 に、フィルタリングする列の名前を入力する。
- 列名 および比較テキスト のケーシングを無視するには、大文字小文字を区別しない を選択する。
- Condition とCompare Text に、"Equals [text]" や "Contains [text]" のように、列を検索する値の条件を入力します。
番号 フィルターグループの場合:
- Format で、一致させる数値の形式(整数または小数)を選択する。どちらでもよい場合は、Decimalを選択する。
- 列名 に、フィルタリングする列の名前を入力する。
- Condition およびTest Number に、"Equals [number]" または "Less than [number]" のように、列を検索する値の条件を入力する。
日付 フィルターグループの場合:
- Format に、2006年1月2日を2006-01-02のように、一致させる日付のフォーマットで入力する。
- 列名 に、フィルタリングする列の名前を入力する。
- 条件 および日付の比較 に、「[日付]と等しい」または「[日付]より小さい」など、列を検索する値の条件を入力します。
|
プレビュー結果 |
コマンド出力に結果のプレビューを表示するには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
スマートフィルター行出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
分割ファイル
レコード数に基づいてファイルを複数のファイルに分割するには、Split File コマンドを使用します。例えば、以下のコマンドを使用して、より小さなチャンクを並列処理し、パフォーマンスを向上させます。
プロパティ
プロパティ |
詳細 |
入力ファイル |
複数のファイルに分割するファイルを入力します。 |
ファイルの区切り文字 |
入力ファイル の各列の区切り文字を選択する。 |
ヘッダーのプリペンド |
作成された各ファイルチャンクに入力ファイル のヘッダーを含めるには、このボックスにチェックを入れる。 |
ファイルあたりの記録 |
各ファイルチャンクに含めるレコードの最大数を入力します。 |
出力
出力 |
出力タイプ |
ファイルチャンクを分割する |
ファイル |
チャンク数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
ファイルチャンクの作成に失敗 |
分割値
値の区切り文字を指定して列を複数の列に分割するには、Split Value コマンドを使用する。
プロパティ
プロパティ |
詳細 |
入力ファイル |
変換するファイルを入力します。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
入力ファイル で列の区切りに使用するデリミタを選択する。 |
新しいヘッダー |
スプリット値から作成する新しいヘッダーのリストを順番に入力します。 |
カラム名 |
分割する列のヘッダーを入力する。 |
値の区切り記号 |
値を分割する区切り文字を入力する。 |
廃棄コラム |
分割する列を削除するには、このボックスをチェックします。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
分割値の出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
スタックファイル
区切り文字で区切られた値(DSV)ファイルのリストの値を、指定された順序で積み重ねるには、Stack Files コマンドを使用する。最初のファイルのヘッダー行が新しいファイルで使われる。
注: このコマンドでファイルをスタックするには、すべてのファイルが同じ列数でなければならない。非対称 ファイルをスタックするには、 File Utils connector とそのStack Files コマンドを使用する。
プロパティ
プロパティ |
詳細 |
ファイル |
スタックするDSVファイルを入力する。 |
出力ファイル |
変換結果のファイル名を入力してください。 |
区切り記号 |
Files で列の区切りに使用する区切り文字を選択します。 |
入力ファイル |
スタックするファイルをコンマで区切って入力する。 注: ループを使用する場合、このフィールドは必須です(Filesセクションにファイルがアップロードされないため)。このコマンドをFilesセクションに追加すると、"file not found "エラーが発生する。 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
出力
出力 |
出力タイプ |
スタックファイル出力 |
ファイル |
レコード数 |
整数 |
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
行/列の入れ替え
区切りファイルのすべてのフィールドを水平軸と垂直軸に沿って回転させ、行を列に、その逆を するには、Transpose コマンドを使用する。例えば、このコマンドでは、このCSV:
id,1,2,3,4
name, "Johnson, Smith, and Jones Co.", "Sam Smith", Barney & Co.,Johnson's Auto
amount,345.33,933.40,0,2344
remark,Paysontime,, "一緒に仕事ができて最高です。"、
になる:
id,name,amount,remark
1, "Johnson, Smith, and Jones Co",345.33,Pays on time
2, "Sam Smith",933.40,
3,Barney & Co., "Great to work with."
4,Johnson's Auto,2344、
プロパティ
プロパティ |
詳細 |
プレビュー結果 |
変換結果の最初の10行とヘッダーをプレビューするには、このボックスをチェックする。 |
入力ファイル |
転置する区切りファイルを入力します。 |
ファイルの区切り文字 |
入力ファイル の各列の区切り文字を選択する。 |
チャンクの大きさ |
処理する各作業ファイルの最大サイズを mb 単位で入力します。 |
出力
出力 |
出力タイプ |
転置CSV |
ファイル |
レコード数 |
整数 |
注:Record Count は、Transposed CSV 、ヘッダー行を含まない の総行数を提供します。
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
入力ファイルの転置に失敗 |
アンピボット
財務データの期間など、複数のデータ列を複数行の単一列に統合するには、Unpivot コマンドを使用します。例えば、こんなデータがある:
年,測定,製品,市場,シナリオ,JAN,FEB,MAR,APR,MAY,JUN,JUL,AUG,SEP,OCT,NOV,DEC FY20,販売台数,100-10,ニューヨーク,実績,100,200、300,400,500,600,700,800,900,1000,1100,1200 FY20,Sales,100-10,Massachusetts,Actual,125,225,325,425,525,625,725,825,925,1025,1125,1225
毎月の金額をピボットから外し、新しいPeriod(期間)
とAmount(金額)
列にすることができます:
年度,指標,製品,市場,シナリオ,期間,金額 FY20,売上高,100-10,マサチューセッツ州,実績,JAN,125 FY20,売上高,100-10,マサチューセッツ州,実績,FEB,225 FY20,売上高,100-10,マサチューセッツ州,実績,MAR,325 FY20,売上高,100-10,マサチューセッツ州,実績,APR,425 FY20,売上高,100-10,マサチューセッツ州,実績、MAY,525 FY20,100-10,マサチューセッツ 売上高(実績) JUN,625 FY20,100-10,マサチューセッツ 売上高(実績) JUL,725 FY20,100-10,マサチューセッツ 売上高(実績) AUG,825 FY20,100-10,マサチューセッツ 売上高(実績) SEP,925 FY20,100-10,マサチューセッツ 売上高(実績) OCT,1025 FY20,100-10,マサチューセッツ 売上高(実績)、NOV,1125 FY20,100-10,マサチューセッツ 売上高(実績) DEC,1225 FY20,100-10,ニューヨーク 売上高(実績) JAN,100 FY20,100-10,ニューヨーク 売上高(実績) FEB,200 FY20,100-10,ニューヨーク 売上高(実績) MAR,300 FY20,100-10,ニューヨーク 売上高(実績) APR,400 FY20,100-10,ニューヨーク 売上高(実績) MAY,500 FY20,100-10,ニューヨーク 売上高(実績) FEB,400 FY20,100-10,ニューヨーク 売上高(実績) MAY,500100-10,ニューヨーク 実績 JUN,600 FY20,売上高 100-10,ニューヨーク 実績 JUL,700 FY20,売上高 100-10,ニューヨーク 実績 AUG,800 FY20,売上高 100-10,ニューヨーク 実績 SEP,900 FY20,売上高 100-10,ニューヨーク 実績 OCT,1000 FY20,売上高 100-10,ニューヨーク 実績 NOV,1100 FY20,売上高 100-10,ニューヨーク 実績 DEC,1200
プロパティ
プロパティ |
詳細 |
入力ファイル |
ピボット解除するデータのあるファイルを入力します。 |
区切り記号 |
入力ファイル でフィールドの区切りに使用するデリミタを選択する。 |
集計 |
非分割値の集計方法を選択します:
- SUM 、すべての列で値が同じ場合にレコードを集約する。おすすめだ。
- NONE 、各レコードから一意のデータ値で重複行を作成する。
|
新しい列のラベル |
ピボット化されていない列に基づく行を持つ出力の列のヘッダーを入力する。先の例では、Period 。 |
データ列のヘッダー |
ピボットされていない列のデータを出力する列のヘッダーを入力する。先の例では、量 。 |
データヘッダー |
特定の 列のピボットを解除するには、それらのヘッダーをリストアップし、各列の間に Enter を押す。先の例では、JAN 、FEB 、MAR 、といった具合。 |
ピボット開始カラム名 |
ヘッダー による列の範囲 をピボット解除するには、範囲の最初の列の名前を入力する。先の例では、JAN 。 |
ピボットの終了カラム名 |
ヘッダー による列の範囲 をピボット解除するには、範囲の最後の列の名前を入力する。先の例では、DEC 。 注釈:開始ピボット列名 を入力したが、は入力せず、 終了ピボット列名 を入力した場合、コマンドはこれをピボット解除し、開始ピボット列名 の右側にあるすべての 列をピボット解除します。これは、ローリングフォーキャストによって作成されたデータで有用である。 |
ピボット列の開始インデックス |
、列の範囲 をの位置 でピボット解除するには、範囲の最初の列のインデックス値を入力する。入力ファイル の列が0から始まるゼロベースのインデックスを使用する。先の例では、5 。 |
ピボット・カラムの終了インデックス |
、列の範囲 をの位置 でピボット解除するには、範囲の最後の列のインデックス値を入力する。入力ファイル の列が0から始まるゼロベースのインデックスを使用する。先の例では、16 。 注: ピボット開始列インデックス を入力したが、 ピボット終了列インデックス がない場合、コマンドはこれをピボット解除し、ピボット開始列インデックス の右側にあるすべての 列をピボット解除します。これは、ローリングフォーキャストで作成されたデータで有用である。 |
プレビュー結果 |
ピボット化されていない出力のプレビューを有効にするには、このボックスをチェックします。 |
出力
終了コード
コード |
タイプ |
詳細 |
0 |
成功 |
成功 |
1 |
エラー |
無効な引数 |
2 |
エラー |
一般的な失敗 |
14 |
エラー |
無効な出力ファイルの場所 |
15 |
エラー |
入力ファイル で使用されるエスケープ文字。 |
トラブルシューティング
コマンドに失敗した場合は、以下の一般的な問題をチェックしてください。
誤った区切り文字
変換コマンドを設定する際に間違った区切り文字が設定されると、変換は期待通りに実行されません。
適切なCSVではない
表形式のデータセットが適切なCSVでない場合、変換コマンドは実行されない。入力を処理する前に、フォーマットがRFC 4180に準拠しているかどうかをチェックするからだ。適切なCSV:
- ASCII、Unicode(UTF-8など)、EBCDIC、シフトJISなどの文字セットを使用したプレーンテキストでデータを格納する。
- 1行に1レコードのレコードと、区切り文字(通常はカンマ、セミコロン、タブなどの予約文字1文字)で区切られたフィールドに分けられたレコードから構成される。デリミタに空白が含まれることもある。
- 、すべての レコードに同じ一連のフィールドがある。
- 通常、フラットファイルまたはリレーショナルデータのレポート出力です。
各レコードの列数の不一致
表形式データセットのレコードの列数が異なる場合、変換コマンドはそれが適切なCSVでないことを検出する。
列数の違い
列数の異なる2つの適切なCSV表形式データセットを組み合わせてもうまくいかず、Stack Filesコマンドはエラーを表示します。