TSV 【Tab-Separated Values】 タブ区切り / .tsvファイル
概要
TSV(Tab-Separated Values)とは、複数の項目で構成されるデータを複数件列挙して表現することができる汎用的なデータ形式の一つで、項目間の区切り文字にタブ文字を用いるもの。標準のファイル拡張子は「.tsv」。データを文字の連なりとして表現するテキスト(文字)データおよびテキストファイルの形式の一つで、複数の項目をタブ文字(ASCIIコード9番の制御文字)で区切って一件のレコードを構成し、複数件のレコードを改行文字で区切ってデータ全体を構成する。
縦横に規則正しく項目が並んだ表形式のデータを保存するのによく用いられる形式の一つで、表計算ソフトやデータベースソフト、データ解析ソフトなどの多くが標準でインポート(取り込み)、エクスポート(書き出し)に対応している。
よく似たデータ形式に、項目間の区切りにカンマ(,)を用いた「CSV」(Comma-Separated Values)がある。CSVはデータそのものにカンマや他の記号文字が含まれる場合の取り扱いに注意を要するが、TSVの場合は区切りに用いるタブ文字が制御文字であり、データの表現自体には通常は登場しないため、より簡易な方法で取り扱うことができる利点がある。
また、テキストエディタなどで開いて人間が直に閲覧・編集する場合、タブ文字は数文字分の空白として表示され、項目の先頭が指定の文字数(タブ幅)の整数倍の位置に来るよう揃えて表示される。タブ幅はエディタの設定次第だが、項目の長さよりも長く設定すれば表として表示・編集することができる。
(2023.1.28更新)