- - PR -
タブ区切りファイル(TSV)の仕様
1
投稿者 | 投稿内容 | ||||
---|---|---|---|---|---|
|
投稿日時: 2008-10-20 18:39
投稿場所が違うかもしれませんが、
ご勘弁ください。 タブ区切りファイルの仕様は どのようになっているのでしょうか? CSVファイルであれば、 RFC4180 ttp://www.ietf.org/rfc/rfc4180.txt?number=4180 で定義されていますが、TSVファイルについては良く分りません。 IANA ttp://www.iana.org/assignments/media-types/text/tab-separated-values にてMIME type text/tab-separated-values が定義されているようですが、データとしてタブがあったらどうするか? などの詳細な仕様が載っていませんでした。 CSVファイルのように、データとしてのタブはダブルクォーテーションで囲む、 またデータとしてのダブルクォーテーションは ダブルクォーテーションで重ねる といった感じでいいのでしょうか? みなさんどうされていますか? | ||||
|
投稿日時: 2008-10-20 19:53
CSV,TSV,固定長レコードなどは歴史的なしがらみが多いので、
いまさらRFCで定義されてもほとんど影響力は無さそうに感じます。 Excelが出力する形式に準拠、とかの方がメジャーでは? | ||||
|
投稿日時: 2008-10-20 20:45
汎用的なフォーマットとはならないから、プロジェクト毎にどう特殊文字をエスケープするか選択すれば充分かと。
まあ、無理にテキストで行単位のフォーマットを使用しなくてはならない、わけでもないですから、区切りや特殊文字が解釈できればどうでもいいと思います。 むしろ、その辺りの仕様を考えなくてはならないならば、CSVとかTSVは選択肢から外しますね、XMLとか幾らでも代替手段はありますから。 | ||||
|
投稿日時: 2008-10-20 21:55
この辺りは各ベンダーや、プロジェクトで独自に決めていってるという感じでしょうか。
ある製品を作るにあたって、CSV、TSV、固定長、XMLなどのデータ形式に対応させようとしているのですが、汎用的にするために標準フォーマットを探していたところです。 XMLのように仕様が厳格に決まってないのですね。 | ||||
|
投稿日時: 2008-10-21 09:22
>汎用的にするために標準フォーマット
汎用的なフォーマットはないと思います。 製品の顧客がどこかは解りませんけど、幾つかのフォーマットを選択できるようにし、改行の置換文字などを詳細設定でカスタマイズできる方が便利かと。 その辺はコストとの兼ね合いかとは思いますが、「データの取り込み」に重みを置く製品ならばこだわってもいいんじゃないですかね。 | ||||
|
投稿日時: 2008-10-21 21:59
そうですね、CSVや、TSVに汎用的なフォーマットがないとなると、おっしゃるとおり、 詳細にカスタマイズできるものの方が売りになりそうです。 |
1