ADVERTISEMENT

【Googleスプレッドシート】TSVファイルの取込!タブ区切りデータをセル展開

【Googleスプレッドシート】TSVファイルの取込!タブ区切りデータをセル展開
🛡️ 超解決

TSVファイル(タブ区切り)をスプレッドシートに取り込もうとして、すべてのデータが1列にまとまってしまった経験はありませんか。これは区切り文字を正しく認識できていないために起こる現象です。この記事では、TSVファイルを正しくセルに展開するための具体的な手順を解説します。ファイルメニューからのインポート、データメニューを使った方法、コピー&ペーストでの取り込み方まで、状況に応じた最適な方法を紹介します。

【要点】TSVファイルをスプレッドシートに正しく取り込む方法

  • ファイルメニューからのインポート: 「ファイル」→「インポート」でTSVファイルを選択し、区切り文字をタブに設定することで、データが各セルに分割されます。
  • データメニューからのインポート: 「データ」→「データをインポート」でURLやアップロードから取り込め、区切り文字の自動認識も行われます。
  • コピー&ペースト時の区切り指定: テキストエディタからコピーしたTSVデータを貼り付ける際、「形式を選択して貼り付け」からタブ区切りを指定して展開できます。

ADVERTISEMENT

TSVファイルとスプレッドシートの関係

TSVは「Tab Separated Values」の略で、タブ文字で各列を区切ったテキストファイルです。CSV(コンマ区切り)と似ていますが、区切り文字が異なります。Googleスプレッドシートはインポート時に区切り文字を自動判別しますが、拡張子が.tsvでない場合や、ファイルの先頭にBOMなどがあると正しく認識されないことがあります。また、タブを含むセルデータが引用符で囲まれていない場合、予期せぬ列分割が発生する可能性もあります。これらの特性を理解した上で、適切なインポート手順を選ぶことが重要です。

スプレッドシートにTSVデータを取り込む方法は主に3つあります。ファイルのアップロード、URLからのインポート、そしてテキストデータのコピー&ペーストです。それぞれの手順を詳しく見ていきましょう。

ファイルメニューからTSVファイルをインポートする手順

もっとも基本的な方法は、スプレッドシートのファイルメニューを使う方法です。この方法では、アップロードしたTSVファイルを任意の区切り文字で解析できます。

  1. スプレッドシートを開く
    新しいスプレッドシートか、インポート先のシートを開きます。
  2. 「ファイル」→「インポート」を選択
    上部メニューから「ファイル」をクリックし、ドロップダウンから「インポート」を選びます。
  3. アップロードするファイルを選択
    「アップロード」タブをクリックし、TSVファイルをドラッグ&ドロップするか、「デバイスから選択」でファイルを選びます。
  4. インポート場所と区切り文字を設定
    「インポート場所」で「新しいシート」や「現在のシート」などを選びます。「区切り文字」は「タブ」を選択します。必要に応じて「テキストを数値や日付に変換する」などのオプションも設定します。
  5. 「インポート」ボタンをクリック
    設定を確認して「インポート」をクリックすれば、データが各セルに展開されます。

この方法では、区切り文字を明示的にタブに指定できるため、TSVファイルを確実に展開できます。また、インポート前のプレビューが表示されるので、列が正しく分割されるか確認できます。

データメニューからTSVファイルをインポートする手順

「データ」メニューからもインポートが可能です。こちらはURLから直接データを取り込める点が便利です。

  1. 「データ」→「データをインポート」を選択
    メニューバーから「データ」をクリックし、「データをインポート」を選びます。
  2. URLまたはアップロードを選択
    「URL」タブでTSVファイルのURLを入力するか、「アップロード」タブでファイルを選択します。
  3. インポートオプションを設定
    「インポート場所」と「区切り文字」を選択します。区切り文字は自動的に検出される場合もありますが、手動で「タブ」に設定できます。
  4. 「インポート」をクリック
    設定が完了したらインポートを実行します。

この方法は、ファイルを毎回ダウンロードせずにオンライン上のTSVデータを直接取り込みたい場合に便利です。ただし、URLが公開されている必要があります。

ADVERTISEMENT

貼り付け時にタブ区切りデータをセルに展開する方法

テキストエディタなどでTSVデータをコピーした場合は、貼り付け時に区切りを指定することで展開できます。

  1. TSVデータをコピー
    テキストエディタやソースからタブ区切りのデータを選択してコピーします。
  2. スプレッドシートで貼り付け位置をクリック
    先頭セルを選択し、右クリックメニューを開きます。
  3. 「形式を選択して貼り付け」→「テキストのみを貼り付け」または「区切り付きテキストを貼り付け」を選択
    通常の貼り付けではデータが1列にまとまるため、形式を選択する必要があります。「テキストのみを貼り付け」では区切りが認識されず1セルに全て入る場合があるため、「区切り付きテキストを貼り付け」を選びます。
  4. 区切り文字を「タブ」に設定して貼り付け
    「区切り付きテキストを貼り付け」ダイアログで区切り文字を「タブ」にチェックし、「貼り付け」をクリックします。

この方法は、少量のデータを手早く取り込みたい場合に適しています。ただし、大量データでは処理が遅くなることがあるので注意が必要です。

TSV取り込み時の注意点とよくあるトラブル

文字化けが発生する場合の対処法

TSVファイルの文字コードがUTF-8以外(Shift_JISなど)の場合、文字化けが発生します。対処法として、インポート前にファイルをUTF-8に変換するか、スプレッドシートの「ファイル」→「インポート」で文字コードを指定できる場合は適切なコードを選択します。Googleスプレッドシートのインポート機能はUTF-8を推奨しています。

数値が文字列として読み込まれる問題

TSVファイル内の数値データが、インポート後に文字列として認識されることがあります。これを防ぐには、インポート時に「テキストを数値や日付に変換する」オプションをオンにします。また、後からセルの書式を「数値」に変更することも可能です。

区切り文字が認識されず1列になる現象

ファイルの拡張子が.tsvでない場合や、タブが引用符で囲まれている場合に、区切りが正しく認識されないことがあります。この場合は、手動で区切り文字をタブに設定するか、データをテキストエディタで確認してタブが正しく含まれているかを確認してください。

大量データのインポートが遅い場合の対策

数十万行を超えるTSVファイルをアップロードすると、処理に時間がかかります。この場合、「データ」メニューから「データをインポート」を選び、分割してインポートするか、Google BigQueryなど外部サービスを検討するとよいでしょう。

空白セルが欠落してしまう問題

TSVの行内でタブが連続すると、空白セルが正しく保持されない場合があります。インポートオプションで「空白を保持する」設定があれば有効にします。また、後から欠落した空白を補正することも可能です。

TSV取り込み方法の比較

方法 操作手順 対応フォーマット URL対応 大量データ 区切り指定
ファイルメニュー ファイル→インポート→アップロード .tsv,.txt,.csvなど 不可 安定 手動で指定可能
データメニュー データ→データをインポート→URL/アップロード .tsv,.csvなど 可能 安定 自動/手動
コピー&ペースト テキストコピー→形式を選択して貼り付け テキストデータ 不可 小規模向き 手動で指定必要

それぞれの方法に利点と制限があります。ファイルメニューは最も確実で、区切り文字を自由に設定できます。データメニューはURLから直接取り込める点が強みです。コピー&ペーストは手軽ですが、大量データには不向きです。

まとめ

TSVファイルをGoogleスプレッドシートに正しく取り込むには、ファイルメニュー、データメニュー、コピー&ペーストの3つの方法があります。それぞれの手順を理解し、適切な区切り文字(タブ)を指定することで、データをセルごとに展開できます。また、文字化けや数値の扱いなどの注意点にも対応できるようになりました。次は、CSVやTSVを自動的にインポートするスクリプトや、IMPORTRANGE関数を使った外部データの自動参照に挑戦してみると、さらに作業効率が向上するでしょう。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。