ADVERTISEMENT

【Googleドキュメント】Drive上のPDFをGoogleドキュメント化したら文字化けする時の対策

【Googleドキュメント】Drive上のPDFをGoogleドキュメント化したら文字化けする時の対策
🛡️ 超解決

Googleドライブに保存したPDFをGoogleドキュメントで開くと、文字化けが発生して読み進められないことがあります。特に日本語を含むPDFでこの問題が頻発し、資料の編集や共同作業に支障をきたします。本記事では、文字化けの原因を切り分け、具体的な対策を会社員向けに解説します。まずは、すぐに試せる基本的な確認ポイントと、組織の管理者へ依頼すべき設定について整理します。

【要点】この記事で確認すること

  • 最初に見る場所: 元のPDFファイルのプロパティで「フォントの埋め込み」が行われているか、またPDFが文字情報を持つテキストベースか画像ベースかを確認します。
  • 切り分けの軸: 端末側(インストールされているフォント)、アカウント側(Googleドキュメントの言語設定)、管理設定側(Google Workspaceの変換オプションやフォントポリシー)の三軸で原因を特定します。
  • 注意点: 会社PCでは管理者権限なしにフォント追加やアプリインストールができない場合があります。設定変更が必要な場合は、必ずIT管理者に相談してください。

ADVERTISEMENT

文字化けの主な原因とその見分け方

GoogleドキュメントでPDFが文字化けする原因は、大きく三つに分類できます。それぞれの特徴を理解することで、適切な対策を選べるようになります。

原因1:フォントの欠落または未埋め込み

PDFに使用されているフォントが埋め込まれていない場合、Googleドキュメントは代替フォントで表示しようとします。日本語フォント(例:游ゴシック、MS明朝)が埋め込まれていないと、文字化けやレイアウト崩れが発生します。この状態は、PDFのプロパティで「フォント」タブを開き、「埋め込み」の有無を確認することで見分けられます。

原因2:スキャンPDF(画像PDF)

紙文書をスキャンして作成したPDFは、文字が画像として保存されています。GoogleドキュメントはこれをOCR(光学文字認識)でテキスト化しようとしますが、認識精度が低いと文字化けや記号の羅列になります。この場合、PDF内のテキスト選択ができない、または選択すると画像全体が選択されるのが特徴です。

原因3:文字コードの問題

PDFを作成するソフトウェアによっては、Unicode以外の文字コード(Shift_JISなど)で保存されていることがあります。GoogleドキュメントはUnicodeを前提としているため、コード変換に失敗して文字化けが起こります。この場合、PDFを開いたときに特定の文字だけが「■」や「?」に置き換わることが多いです。

お探しの解決策が見つからない場合は、こちらの「PDFトラブル完全解決データベース」で他のエラー原因や解決策をチェックしてみてください。

具体的な対策手順

原因に応じた対策を以下に示します。まずは元のPDFを確認し、適切な方法を選んでください。

手順1:フォントが埋め込まれていない場合の対処

  1. 元のPDFを作成したソフト(Microsoft Word、Adobe Acrobatなど)で開きます。
  2. 「PDFとして保存」または「エクスポート」のオプションで、フォントの埋め込み設定を確認します。Adobe Acrobatでは「ファイル」→「プロパティ」→「フォント」から埋め込み状況を確認し、埋め込まれていないフォントを「すべてのフォントを埋め込む」で保存し直します。
  3. 埋め込み済みのPDFをGoogleドライブにアップロードし、再度Googleドキュメントで開きます。
  4. それでも文字化けする場合は、PDFを一度Word形式(.docx)に変換してから、Googleドキュメントにインポートする方法も試してください。

手順2:スキャンPDFの場合の対処

  1. Googleドライブ上でPDFを右クリックし、「Googleドキュメントで開く」を選択します。
  2. 自動的にOCR処理が実行されますが、精度が低い場合は、Googleドキュメントの「ツール」→「音声入力」メニューから手動でテキストを修正するか、別のOCRツールを利用します。
  3. 代替案として、PDFを画像ファイル(PNGなど)に変換し、Googleドキュメントに挿入して画像として扱うことも可能ですが、テキスト編集はできなくなります。
  4. 会社で許可されている場合は、Adobe Acrobat ProやABBYY FineReaderなどのOCR専用ソフトで事前にテキスト化してからアップロードする方法が確実です。

手順3:文字コードが原因の場合の対処

  1. 元のPDFを作成したアプリケーションで、「名前を付けて保存」からテキスト形式(.txt)として出力します。
  2. そのテキストファイルをメモ帳などで開き、「名前を付けて保存」で文字コードを「UTF-8」に指定して保存し直します。
  3. 保存したUTF-8テキストをGoogleドキュメントにアップロードするか、コピー&ペーストで貼り付けます。
  4. または、PDFを一度Microsoft Wordで開き(Word 2013以降対応)、「ファイル」→「オプション」→「詳細設定」で「PDFからテキストを読み込むときにレイアウトを維持する」のチェックを外して保存し直し、その後Googleドキュメントにインポートする方法もあります。

状況別対策比較表

元PDFの状態 最も効果的な対策 成功率(目安)
フォント埋め込みあり(テキストPDF) そのままGoogleドキュメントで開く 90%以上
フォント埋め込みなし(テキストPDF) 元のアプリでフォント埋め込み設定後、保存し直す 80%
スキャンPDF(画像、OCR未処理) 専用OCRソフトで事前テキスト化、またはGoogleドキュメントのOCRを試す 50〜70%(品質による)
文字コードがShift_JISなどの非Unicode テキスト抽出後UTF-8で保存し直す 70%

よくある失敗パターンと注意点

実際の業務でよく見られる失敗例を挙げます。これらを避けることで、余計な手間を省けます。

失敗パターン1:フォント埋め込み設定をせずに変換を繰り返す

一度文字化けしたPDFを、さらに別の形式に変換しても問題は解決しません。元のPDFが正しく埋め込まれているかを確認し、適切な修正が必要です。たとえば、文字化けしたままGoogleドキュメントからPDFにエクスポートしても、文字化けが残ります。

失敗パターン2:スキャンPDFをそのままGoogleドキュメントで編集しようとする

スキャンPDFは画像です。GoogleドキュメントのOCR機能は限定的であり、特に手書き文字や特殊フォントには対応していません。重要な文書は必ず事前にOCEソフトで処理するか、元の電子データを取り寄せてください。

失敗パターン3:会社PCに制限があるまま無理な操作を行う

管理者権限がない状態でフォントを追加したり、アプリをインストールしようとするとトラブルの元です。必ずIT管理者に確認し、許可された方法を選びましょう。

管理者へ確認すべき設定と依頼事項

組織でGoogle Workspaceを利用している場合、管理者側の設定が影響する可能性があります。以下の点を管理者に確認し、必要に応じて設定変更を依頼してください。

  • Googleドライブの変換オプション: 管理者コンソールで「ドライブとドキュメント」→「共有設定」→「アップロード設定」から、PDFをGoogleドキュメント形式に変換する機能が有効になっているか確認させてください。
  • フォントポリシー: 組織で利用できるフォントが制限されている場合、Googleドキュメントが代替フォントを正しく選択できないことがあります。管理者にフォントの追加許可を依頼するか、Webフォントの利用を検討します。
  • セキュリティポリシー: 外部OCRサービス(GoogleのOCRも含む)がブロックされているケースがあります。その場合は、ローカルでOCR処理を行った後、テキストファイルとしてアップロードする方法を管理者に相談してください。

よくある質問(FAQ)

Q1. 一部の文字だけが文字化けするのはなぜ?

原因の多くは、その文字に使用されているフォントが埋め込まれていないか、特殊な文字(機種依存文字、外字)であることです。Googleドキュメントが代替フォントで表示できない場合、その部分だけ文字化けします。元のPDFで使用されているフォントを確認し、埋め込むか、一般的なフォントに置き換えてください。

Q2. スキャンPDFをGoogleドキュメントで編集可能なテキストにする最善の方法は?

推奨する手順は、まずAdobe Acrobat ProやMicrosoft Officeの「PDFからテキストを抽出」機能を使って高精度のOCRを実行し、得られたテキストをGoogleドキュメントに貼り付けることです。GoogleドライブのOCRに頼ると、レイアウトや表組みが崩れやすいため注意してください。

Q3. 会社でGoogle Workspaceを利用しているが、管理者に何を伝えればよい?

上記「管理者へ確認すべき設定」の3点を具体的に伝えましょう。特に「PDFのフォント埋め込みに関する問題」と「Googleドキュメントの変換精度を向上させる設定」を依頼すると、スムーズに調整が進みます。

まとめ

PDFをGoogleドキュメントで開いたときの文字化けは、フォントの埋め込み有無、スキャン画像かどうか、文字コードの違いが主な原因です。まずは元のPDFを調べ、原因に合った対策(フォント埋め込み、事前OCR、UTF-8変換)を選びましょう。会社PCでは管理者の許可なく設定変更ができないケースが多いため、必要に応じてIT部門に相談してください。適切な対策を取れば、多くの文字化けは解消でき、スムーズなドキュメント編集が可能になります。


📑
PDFトラブル・操作完全解決データベース 閲覧エラー、編集・結合、パスワード解除など、PDFに関するあらゆる困りごとを網羅しています。

ADVERTISEMENT

📄
Googleドキュメントトラブル完全解決データベースこの記事以外にも、書式・共有・Apps Script・引用など様々な困りごとへの解決策をまとめています。逆引きに活用してください。
この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。

ADVERTISEMENT