【Googleスプレッドシート】タブ区切りテキストTSVのインポート!データの整形

【Googleスプレッドシート】タブ区切りテキストTSVのインポート!データの整形
🛡️ 超解決

タブ区切りテキスト(TSV)ファイルをGoogleスプレッドシートに取り込む方法がわからず、困っていませんか。TSVはデータベースや統計ソフトからエクスポートされることが多く、スプレッドシートで分析したい場面は多いです。この記事では、TSVファイルを正しくインポートする手順と、取り込み後にデータをきれいに整形するテクニックを解説します。これでタブ区切りのデータも安心して扱えるようになります。

【要点】TSVファイルをGoogleスプレッドシートで正しく開き、整形する3つのポイント

  • ファイル→インポート: メニューからTSVファイルをアップロードし、区切り文字を「タブ」に指定してインポートします。
  • ドラッグ&ドロップ: ブラウザ上にTSVファイルを直接ドロップすると、自動でスプレッドシートが作成されます。
  • SPLIT関数: すでに1列にまとまってしまったデータをタブで分割したい場合、SPLIT関数を使って列ごとに分割します。

ADVERTISEMENT

TSVファイルとは何か:インポート前に知っておきたい基礎知識

TSVはTab-Separated Valuesの略で、タブ文字を使ってデータを区切ったテキストファイルの形式です。CSV(カンマ区切り)と似ていますが、区切り文字がタブである点が異なります。TSVはデータにカンマが含まれていても問題なく扱えるため、住所や説明文などカンマが多いデータに適しています。Googleスプレッドシートは標準でTSVのインポートに対応しており、特に追加の設定なしに取り込める場合が多いです。ただし、文字コードがUTF-8でない場合や、ファイル内のタブが正しく認識されないケースもあるため、事前にファイルの特性を確認しておきましょう。

TSVファイルをインポートする具体的な手順

手順1:ファイルメニューからインポートする

  1. 新しいスプレッドシートを開く
    Googleスプレッドシートにログインし、新しい空白のスプレッドシートを作成します。
  2. 「ファイル」→「インポート」を選択する
    メニューバーから「ファイル」→「インポート」をクリックします。画面中央にインポートダイアログが表示されます。
  3. TSVファイルをアップロードする
    「アップロード」タブを選び、「ファイルを選択」ボタンからお使いのTSVファイルを選択します。または、ファイルをダイアログエリアにドラッグ&ドロップしても構いません。
  4. インポート設定を行う
    ファイルを選択すると、インポート設定画面が表示されます。「区切り文字」の項目で「タブ」が自動検出されていることを確認します。もし自動でタブが選択されていない場合は、手動で「タブ」を指定してください。また、「インポート場所」は「新しいシートを作成」を選ぶと元のデータがそのままの形で読み込まれます。
  5. 「インポート」ボタンをクリックする
    設定が完了したら「インポート」をクリックします。数秒でデータが読み込まれ、新しいシートにタブ区切りのデータが各列に正しく配置されます。

手順2:ドラッグ&ドロップで素早くインポートする

  1. ブラウザで新しいスプレッドシートを開く
    Googleスプレッドシートのホーム画面から「空白」をクリックして新しいシートを開きます。
  2. TSVファイルをブラウザウィンドウにドロップする
    エクスプローラーやFinderからTSVファイルをドラッグし、開いているスプレッドシートの上にドロップします。すると自動的に「ファイルをインポート」ダイアログが表示されます。
  3. 設定を確認してインポートする
    先ほどと同じように区切り文字が「タブ」になっていることを確認し、「インポート」をクリックします。ドロップしたファイルは新しいシートとして追加されます。

インポート後のデータ整形:よくある問題と対処法

すべてのデータが1列にまとまってしまう場合

インポート後に全データがA列に縦に並んでしまい、タブで区切られていない状態になることがあります。これはファイルの区切り文字が正しく認識されなかった場合に起こります。このようなときは、インポート設定をやり直すか、SPLIT関数を使ってデータを分割します。例えば、A1セルにデータが入っている場合、B1に「=SPLIT(A1, CHAR(9))」と入力すると、タブ文字(CHAR(9))で分割されて各列に展開されます。行全体に適用したい場合は、B1の数式を下方向にコピーしてください。

文字化けが発生する場合

TSVファイルの文字コードがUTF-8以外(Shift_JISなど)の場合、インポート後に日本語が文字化けすることがあります。この問題を避けるには、インポート前にファイルをUTF-8に変換しておきましょう。テキストエディタ(メモ帳、サクラエディタなど)でTSVファイルを開き、UTF-8で保存し直してからインポートします。GoogleスプレッドシートはUTF-8に最も対応しているため、このひと手間で安定します。

数値が文字列として認識される場合

インポートされた数値が文字列として扱われ、計算ができないことがあります。これはセルの書式が「テキスト」になっているためです。該当の列を選択し、「表示形式」→「数字」→「数値」を選ぶと数値として認識されるようになります。または、セルの左上に表示されるエラーマーク(小さい三角)をクリックし、「数値に変換」を選択しても同じ効果が得られます。

空のタブが欠落して列がずれる場合

TSVファイル内で、ある列が空の場合、連続するタブが1つとして扱われ、列がずれることがあります。例えば「A C」は本来3列ですが、空のタブが無視されて2列としてインポートされることがあるのです。この問題は、インポート設定の「区切り文字」で「タブ」を正しく指定しても、ファイル自体の形式に依存します。対策としては、テキストエディタでTSVファイルを開き、連続するタブの間に何かダミーの文字(NULLやスペース)を入れるか、Googleスプレッドシートにインポートした後で手動で列を挿入してずれを修正してください。

ADVERTISEMENT

CSVとTSVの比較:どちらを使うべきか

項目 CSV TSV
区切り文字 カンマ タブ
データにカンマが含まれる場合 引用符で囲む必要あり そのまま使用可能
データにタブが含まれる場合 問題なし 引用符で囲むかエスケープが必要
主な用途 表計算ソフト間の汎用データ交換 データベースや統計ソフトのエクスポート
Googleスプレッドシートでの扱いやすさ 自動認識されやすい 区切り文字の自動認識がやや不安定

一般的にはCSVのほうが互換性が高く、多くの環境で扱いやすいです。しかし、データにカンマが頻繁に含まれるテキスト(住所、備考など)を扱う場合は、引用符で囲む手間が省けるTSVのほうが便利です。どちらを使うかは、データの特性と使用するツールに合わせて選びましょう。

まとめ

TSVファイルのインポートは、ファイルメニューからのアップロードかドラッグ&ドロップで簡単に行えます。インポート後は区切り文字の認識ミスや文字化けに注意し、必要に応じてSPLIT関数や書式設定でデータを整えてください。CSVとTSVの違いを理解することで、データに最適な形式を選べるようになります。次に、同じルールでCSVをインポートする方法もチェックすると、より幅広いデータ形式に対応できるでしょう。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。