CSVファイルをGoogleスプレッドシートで開いたとき、文字化けして困った経験はありませんか。特に日本語を含むCSVは、UTF-8とShift-JISのどちらの文字コードで保存されているかで表示が大きく変わります。この記事では、文字コードの違いを解説し、Googleスプレッドシートで文字化けさせずにCSVを開く手順を詳しく説明します。これを読めば、どの文字コードでも正しく読み込めるようになります。
【要点】CSVを文字化けさせずに開くための3つのポイント
- UTF-8とShift-JISの違いを理解する: 文字コードによって日本語の表示が変わるため、ファイルの文字コードを確認してから開くことが重要です。
- Googleスプレッドシートの「インポート」機能を使う: ファイルメニューからインポートを選び、文字コードを指定して読み込むことで文字化けを防げます。
- 文字化けしたときの対処法を知る: もし文字化けした場合は、テキストエディタでUTF-8に変換するか、スプレッドシートのインポート設定を変更して再試行します。
ADVERTISEMENT
目次
文字コードの基礎とUTF-8・Shift-JISの違い
文字コードとは、コンピュータが文字を数字のデータとして扱うためのルールです。UTF-8とShift-JISはどちらも日本語を扱える文字コードですが、互換性がなく、間違ったコードで開くと文字化けが発生します。UTF-8は世界標準のコードで、WebやGoogleスプレッドシートではデフォルトで使用されます。一方、Shift-JISはWindowsで広く使われる日本語向けのコードです。CSVファイルがUTF-8で保存されているならそのまま開けますが、Shift-JISの場合はGoogleスプレッドシートに正しく認識させるために特別な操作が必要です。
GoogleスプレッドシートでCSVを文字化けさせずに開く手順
ここでは、CSVファイルを文字化けさせずにGoogleスプレッドシートで開く具体的な手順を説明します。ファイルの文字コードに応じて2つの方法を紹介します。
UTF-8のCSVを開く手順
- Googleスプレッドシートを開く
ブラウザでGoogleスプレッドシートにアクセスし、新しいスプレッドシートを作成するか、既存のファイルを開きます。 - インポート機能を起動する
メニューバーから「ファイル」→「インポート」を選択します。 - アップロードまたはファイルを選択する
「アップロード」タブでCSVファイルを選択するか、ファイルをドラッグ&ドロップします。 - インポート設定を行う
表示されるダイアログで、「文字コード」が「UTF-8」になっていることを確認します。「区切り文字」は「カンマ」、「テキストを引用符で囲む」はそのままで構いません。 - インポートを実行する
「データのインポート場所」で「新しいシートに追加」などを選び、「インポート」ボタンをクリックします。文字化けせずに表示されるはずです。
Shift-JISのCSVを開く手順
- 同じくインポート機能を起動する
上記手順1〜3と同様に、CSVファイルを選択します。 - 文字コードを「Shift-JIS」に変更する
インポート設定のダイアログで、文字コードのドロップダウンから「Shift-JIS(日本語)」を選択します。表示されない場合は「その他」から選択肢を探します。 - その他設定を確認する
区切り文字がカンマであることを確認し、必要に応じて「数値として扱う」などのオプションを調整します。 - インポートを実行する
「インポート」をクリックすれば、Shift-JISの日本語も正しく表示されます。
文字コードを指定しても文字化けが直らない場合の対処法
インポート時に文字コードを指定しても文字化けが解消しないことがあります。その原因と対処法を説明します。
ファイルの文字コードが誤って判別されている
CSVファイルが実際にはUTF-8なのにShift-JISと誤認している場合や、その逆の場合があります。まずはファイルをテキストエディタ(メモ帳など)で開いて、文字コードを確認しましょう。メモ帳で開き、「名前を付けて保存」のダイアログで文字コードを確認できます。そこから正しいコードを把握し、スプレッドシートのインポート設定に反映させます。
CSVファイル自体がUTF-8でもBOM付きの場合
UTF-8にはBOM(Byte Order Mark)という識別子が付く場合があります。BOM付きUTF-8はGoogleスプレッドシートでは文字化けの原因になることがあります。その場合は、テキストエディタでBOMなしUTF-8に変換して保存し直します。メモ帳では「UTF-8(BOMなし)」の保存オプションはないため、Visual Studio Codeやサクラエディタなどのエディタを使用します。
CSVファイルの区切り文字がカンマでない場合
CSVはカンマ区切りが基本ですが、タブ区切り(TSV)やセミコロン区切りの場合もあります。Googleスプレッドシートのインポート設定で「区切り文字」を正しく選択してください。また、Excelから出力したCSVは、地域設定によりカンマではなくセミコロンで区切られることもあるので注意が必要です。
ADVERTISEMENT
UTF-8とShift-JISの比較表
| 項目 | UTF-8 | Shift-JIS |
|---|---|---|
| 主な利用環境 | Web、Googleスプレッドシート、macOS、Linux | Windows(日本語環境) |
| 互換性 | 世界中の言語に対応、広く普及 | 日本語に特化、Windows以外で扱いにくい |
| 文字化けの起きやすさ | Shift-JIS環境で開くと文字化けする | UTF-8環境で開くと文字化けする |
| Googleスプレッドシートでの扱い | デフォルトで正しく開ける | インポート時に文字コード指定が必要 |
まとめ
この記事では、CSVファイルの文字コード(UTF-8とShift-JIS)の違いと、Googleスプレッドシートで文字化けさせずに開く方法を解説しました。文字コードを理解しておけば、インポート時に適切な設定を選べるため、文字化けのストレスから解放されます。次にCSVを扱うときは、まずファイルの文字コードを確認し、Googleスプレッドシートの「ファイル」→「インポート」から正しいコードを指定して開いてみてください。また、ファイルをUTF-8で統一しておくと、異なる環境でもトラブルが減ります。ぜひ本記事の手順を活用し、スムーズなデータ連携を実現してください。
ADVERTISEMENT
超解決 第一編集部
疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。
Googleスプレッドシートの人気記事ランキング
- 【Googleスプレッドシート】GOOGLEFINANCE関数で株価・為替を取得!リアルタイムデータの呼び出し
- 【Googleスプレッドシート】印刷範囲を指定して印刷!特定範囲だけPDFや紙に出す手順
- 【Googleスプレッドシート】複合グラフで棒と折れ線を同時表示!2軸グラフの作り方
- 【Googleスプレッドシート】FILTER関数で条件に合う行だけ抽出!数式1つで動的な絞り込み
- 【Googleスプレッドシート】フィルタ表示で他の人の表示を変えずに絞り込み!共有時の使い分け
- 【Googleスプレッドシート】重複データを抽出して表示!COUNTIFと条件付き書式の併用
- 【Googleスプレッドシート】新しいスプレッドシートを作成する3つの方法!ドライブ・URL・テンプレート
- 【Googleスプレッドシート】ARRAYFORMULAで列全体に数式を一括適用!セル分の入力を不要に
- 【Googleスプレッドシート】データ範囲を動的に伸縮させる!INDIRECTと参照範囲のコツ
- 【Googleスプレッドシート】共有解除と権限の取り消し!アクセスを完全に閉じる手順
