【Googleスプレッドシート】CSVを文字化けさせずに開く!UTF-8とShift-JISの違い

【Googleスプレッドシート】CSVを文字化けさせずに開く!UTF-8とShift-JISの違い
🛡️ 超解決

CSVファイルをGoogleスプレッドシートで開いたとき、文字化けして困った経験はありませんか。特に日本語を含むCSVは、UTF-8とShift-JISのどちらの文字コードで保存されているかで表示が大きく変わります。この記事では、文字コードの違いを解説し、Googleスプレッドシートで文字化けさせずにCSVを開く手順を詳しく説明します。これを読めば、どの文字コードでも正しく読み込めるようになります。

【要点】CSVを文字化けさせずに開くための3つのポイント

  • UTF-8とShift-JISの違いを理解する: 文字コードによって日本語の表示が変わるため、ファイルの文字コードを確認してから開くことが重要です。
  • Googleスプレッドシートの「インポート」機能を使う: ファイルメニューからインポートを選び、文字コードを指定して読み込むことで文字化けを防げます。
  • 文字化けしたときの対処法を知る: もし文字化けした場合は、テキストエディタでUTF-8に変換するか、スプレッドシートのインポート設定を変更して再試行します。

ADVERTISEMENT

文字コードの基礎とUTF-8・Shift-JISの違い

文字コードとは、コンピュータが文字を数字のデータとして扱うためのルールです。UTF-8とShift-JISはどちらも日本語を扱える文字コードですが、互換性がなく、間違ったコードで開くと文字化けが発生します。UTF-8は世界標準のコードで、WebやGoogleスプレッドシートではデフォルトで使用されます。一方、Shift-JISはWindowsで広く使われる日本語向けのコードです。CSVファイルがUTF-8で保存されているならそのまま開けますが、Shift-JISの場合はGoogleスプレッドシートに正しく認識させるために特別な操作が必要です。

GoogleスプレッドシートでCSVを文字化けさせずに開く手順

ここでは、CSVファイルを文字化けさせずにGoogleスプレッドシートで開く具体的な手順を説明します。ファイルの文字コードに応じて2つの方法を紹介します。

UTF-8のCSVを開く手順

  1. Googleスプレッドシートを開く
    ブラウザでGoogleスプレッドシートにアクセスし、新しいスプレッドシートを作成するか、既存のファイルを開きます。
  2. インポート機能を起動する
    メニューバーから「ファイル」→「インポート」を選択します。
  3. アップロードまたはファイルを選択する
    「アップロード」タブでCSVファイルを選択するか、ファイルをドラッグ&ドロップします。
  4. インポート設定を行う
    表示されるダイアログで、「文字コード」が「UTF-8」になっていることを確認します。「区切り文字」は「カンマ」、「テキストを引用符で囲む」はそのままで構いません。
  5. インポートを実行する
    「データのインポート場所」で「新しいシートに追加」などを選び、「インポート」ボタンをクリックします。文字化けせずに表示されるはずです。

Shift-JISのCSVを開く手順

  1. 同じくインポート機能を起動する
    上記手順1〜3と同様に、CSVファイルを選択します。
  2. 文字コードを「Shift-JIS」に変更する
    インポート設定のダイアログで、文字コードのドロップダウンから「Shift-JIS(日本語)」を選択します。表示されない場合は「その他」から選択肢を探します。
  3. その他設定を確認する
    区切り文字がカンマであることを確認し、必要に応じて「数値として扱う」などのオプションを調整します。
  4. インポートを実行する
    「インポート」をクリックすれば、Shift-JISの日本語も正しく表示されます。

文字コードを指定しても文字化けが直らない場合の対処法

インポート時に文字コードを指定しても文字化けが解消しないことがあります。その原因と対処法を説明します。

ファイルの文字コードが誤って判別されている

CSVファイルが実際にはUTF-8なのにShift-JISと誤認している場合や、その逆の場合があります。まずはファイルをテキストエディタ(メモ帳など)で開いて、文字コードを確認しましょう。メモ帳で開き、「名前を付けて保存」のダイアログで文字コードを確認できます。そこから正しいコードを把握し、スプレッドシートのインポート設定に反映させます。

CSVファイル自体がUTF-8でもBOM付きの場合

UTF-8にはBOM(Byte Order Mark)という識別子が付く場合があります。BOM付きUTF-8はGoogleスプレッドシートでは文字化けの原因になることがあります。その場合は、テキストエディタでBOMなしUTF-8に変換して保存し直します。メモ帳では「UTF-8(BOMなし)」の保存オプションはないため、Visual Studio Codeやサクラエディタなどのエディタを使用します。

CSVファイルの区切り文字がカンマでない場合

CSVはカンマ区切りが基本ですが、タブ区切り(TSV)やセミコロン区切りの場合もあります。Googleスプレッドシートのインポート設定で「区切り文字」を正しく選択してください。また、Excelから出力したCSVは、地域設定によりカンマではなくセミコロンで区切られることもあるので注意が必要です。

ADVERTISEMENT

UTF-8とShift-JISの比較表

項目 UTF-8 Shift-JIS
主な利用環境 Web、Googleスプレッドシート、macOS、Linux Windows(日本語環境)
互換性 世界中の言語に対応、広く普及 日本語に特化、Windows以外で扱いにくい
文字化けの起きやすさ Shift-JIS環境で開くと文字化けする UTF-8環境で開くと文字化けする
Googleスプレッドシートでの扱い デフォルトで正しく開ける インポート時に文字コード指定が必要

まとめ

この記事では、CSVファイルの文字コード(UTF-8とShift-JIS)の違いと、Googleスプレッドシートで文字化けさせずに開く方法を解説しました。文字コードを理解しておけば、インポート時に適切な設定を選べるため、文字化けのストレスから解放されます。次にCSVを扱うときは、まずファイルの文字コードを確認し、Googleスプレッドシートの「ファイル」→「インポート」から正しいコードを指定して開いてみてください。また、ファイルをUTF-8で統一しておくと、異なる環境でもトラブルが減ります。ぜひ本記事の手順を活用し、スムーズなデータ連携を実現してください。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。