【Googleスプレッドシート】CSVファイルをインポート!区切り文字と文字コードの設定

【Googleスプレッドシート】CSVファイルをインポート!区切り文字と文字コードの設定
🛡️ 超解決

CSVファイルをGoogleスプレッドシートに取り込もうとしたとき、文字化けやデータの列がうまく分割されない経験はありませんか。多くの場合、その原因は区切り文字や文字コードの設定が適切でないことにあります。この記事では、GoogleスプレッドシートでCSVファイルを正しくインポートするために、区切り文字と文字コードを適切に設定する方法を詳しく解説します。

具体的な手順からよくあるトラブルの対処法まで網羅しているので、初めての方でも迷わず設定できます。

【要点】CSVインポート時の設定ポイント

  • ファイルメニューからのインポート: 「ファイル」→「インポート」を選択し、アップロードまたはドライブからファイルを選びます。
  • 区切り文字の指定: インポート時に「区切り文字」をカンマ・タブ・カスタムから選択し、データの列分割を制御します。
  • 文字コードの設定: 「ファイルの変換」でUTF-8・Shift_JIS・EUC-JPなど適切なエンコーディングを選び、文字化けを防止します。

ADVERTISEMENT

CSVインポートで区切り文字と文字コードを理解する

CSVファイルは「Comma-Separated Values」の略で、値がカンマで区切られたテキストファイルです。しかし実際にはタブやセミコロンなど、様々な区切り文字が使われることがあります。Googleスプレッドシートはインポート時に自動で区切り文字を推測しますが、推測が外れることがあるため、手動で指定する必要が生じます。

文字コードはファイルの文字の符号化方式です。Windowsでよく使われるShift_JIS( CP932)と、Web標準のUTF-8では互換性がなく、誤った文字コードで読み込むと文字化けが発生します。適切な文字コードを指定することで、特殊文字や記号も正しく表示できます。

CSVファイルをインポートする手順

ファイルメニューからインポートする基本手順

  1. ファイルメニューを開く
    スプレッドシートを開き、メニューバーの「ファイル」をクリックします。次に「インポート」を選択します。
  2. CSVファイルを選択する
    「アップロード」タブでパソコンからファイルを選ぶか、「マイドライブ」から既存のファイルを選択します。ドラッグ&ドロップも可能です。
  3. インポート場所を決める
    「インポート場所」で「新しいシートを作成」「現在のシートの先頭に追加」「現在のシートを置き換える」などから選びます。通常は新規シートが無難です。
  4. 区切り文字を設定する
    「区切り文字」で「カンマ」「タブ」「カスタム」を選択します。CSVファイルの実際の区切り文字に合わせてください。カスタムの場合はセミコロンやパイプなども指定できます。
  5. 文字コードを設定する
    「ファイルの変換」で「UTF-8」「Shift_JIS」「EUC-JP」など適切な文字コードを選びます。日本語のCSVならShift_JISかUTF-8が一般的です。
  6. インポートを実行する
    「データをインポート」ボタンをクリックします。設定が反映された形でデータが読み込まれます。

テキスト読み込み機能を使う代替方法

  1. データメニューを開く
    「データ」メニューから「テキスト読み込み」を選択します。この機能はCSVに限らず、テキストファイルを柔軟に読み込めます。
  2. ファイルを選択する
    「ファイルを選択」ボタンでCSVファイルをアップロードします。
  3. 区切り文字の詳細設定
    「区切り文字として扱う文字」でカスタム設定が可能です。また「連続する区切り文字を1つとみなす」オプションも利用できます。
  4. 文字コードを選択する
    「文字コード」ドロップダウンから適切なものを選びます。事前に元のファイルの文字コードを確認しておくと確実です。
  5. インポートを完了する
    「読み込み」ボタンをクリックすると、同じシートまたは新規シートにデータが展開されます。

インポート時の注意点とよくあるトラブル

文字化けが発生する場合の原因と対処法

文字化けのほとんどは、文字コードの不一致が原因です。CSVファイルがShift_JISで保存されているのにUTF-8で開こうとすると、日本語部分が「縺・繧・縺」のような記号になります。この場合はインポート時に意図的に正しい文字コードを選び直します。もしファイルの文字コードが不明なら、メモ帳などで開いて「名前を付けて保存」で確認する方法が便利です。

列が正しく分割されない場合の原因と対処法

区切り文字の設定ミスが原因です。例えばカンマ区切りのファイルをタブ区切りとして読み込むと、すべてのデータが1列にまとまってしまいます。この場合はインポート設定の「区切り文字」を実際のファイルに合わせて修正します。また、データ内にカンマが含まれている場合(例:「東京都,千代田区」)は、引用符で囲まれている必要がある点にも注意が必要です。

大きなCSVファイルのインポートが遅い場合

Googleスプレッドシートのセル数制限は約1000万セルです。それを超えるデータは一部しか読み込めません。また、行数が多いと処理に時間がかかります。対策として、ファイルを分割してインポートするか、Googleドライブ上のCSVを直接IMPORTRANGEで読み込む方法も検討できます。

ADVERTISEMENT

区切り文字と文字コードの比較表

項目 特徴 主な利用シーン
カンマ区切り 最も標準的なCSV形式。多くのアプリケーションで互換性が高い 一般的なデータ交換、Excelからのエクスポート
タブ区切り データ内にカンマが含まれる場合に適している TSVファイル、システム間のテキストデータ連携
セミコロン区切り ヨーロッパのロケールでよく使われる 小数点にカンマを使う地域のデータ
UTF-8 Web標準。多言語対応。BOMの有無に注意 Googleスプレッドシートの既定、インターネット経由のデータ
Shift_JIS Windows日本語環境で広く使われる。MS-IMEのCSV出力など 国内の業務システム、レガシーなCSVファイル

まとめ

GoogleスプレッドシートでCSVファイルをインポートする際は、区切り文字と文字コードの設定がデータの正確な読み込みに直結します。この記事で紹介した手順を参考に、ファイルに合った区切り文字(カンマ・タブ・カスタム)と文字コード(UTF-8・Shift_JIS)を選択してください。また、インポート後にデータの整合性を確認するクセをつけると、トラブルに早く気づけます。応用として、IMPORTRANGE関数と組み合わせて外部CSVのリアルタイム参照も試してみてください。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。