【PDF】AcrobatでOCR(テキスト認識)を実行すると「言語がサポートされていません」エラーになる

【PDF】AcrobatでOCR(テキスト認識)を実行すると「言語がサポートされていません」エラーになる
🛡️ 超解決

スキャンした.pdfファイルでOCRテキスト認識を実行しようとして、「言語がサポートされていません」というエラーに遭遇していませんか。

このエラーは、OCRの言語設定が文書の内容と一致しないことや、必要な言語パックがAcrobatにインストールされていないことが主な原因です。

この記事では、AcrobatでOCRエラーが発生する具体的な原因を解説し、問題を解決するための操作手順を詳しく説明します。

これらの手順を実行することで、.pdfファイルから正確なテキストを認識できるようになります。

【要点】Acrobat OCR「言語がサポートされていません」エラーの解決策

  • OCR言語設定の確認と変更: .pdf文書の言語とAcrobatのOCR設定を一致させ、エラーを解消します。
  • 言語パックのインストール: 認識したい言語のデータがAcrobatにない場合に、追加でインストールし認識を可能にします。
  • Acrobatの更新と修復: ソフトウェアの不具合や古いバージョンに起因する問題を解決し、OCRの安定性を高めます。

ADVERTISEMENT

Acrobat OCRで「言語がサポートされていません」エラーが発生する原因

OCR テキスト認識は、スキャンされた画像データから文字情報を抽出し、編集可能なテキストに変換するAcrobatの主要機能です。この機能を使用する際、「言語がサポートされていません」というエラーが表示されることがあります。

このエラーの主な原因は、認識対象の.pdf文書に含まれる言語と、AcrobatのOCR設定で選択されている言語が一致しないことにあります。Acrobatは、指定された言語の文字パターンや辞書情報に基づいてテキストを認識します。そのため、文書の言語と設定が異なると、文字を正しく識別できず、エラーが発生します。

また、Acrobatに認識したい特定の言語のデータ、つまり言語パックがインストールされていない場合も、このエラーの原因となります。Acrobatの初期設定では、主要な言語のみがインストールされています。日本語や特定の外国語など、追加の言語を認識するには、別途言語パックをインストールする必要があります。

稀に、Acrobatのソフトウェア自体に一時的な不具合や破損がある場合、あるいは古いバージョンを使用している場合にもエラーが発生することがあります。ソフトウェアのバージョンが古いと、最新のOCRエンジンや言語データが適用されていないため、認識精度が低下したり、エラーが出たりする可能性が高まります。

これらの原因を理解し、適切な対処を行うことで、OCRエラーを効果的に解決し、正確なテキスト認識を実現できます。

AcrobatでOCR言語設定を変更しエラーを解決する手順

AcrobatでOCRの「言語がサポートされていません」エラーを解決するための具体的な操作手順を説明します。OCR言語設定の変更、必要な言語パックのインストール、そしてAcrobatの更新と修復の3つの方法があります。

OCR言語設定の確認と変更

  1. .pdfファイルを開く
    Acrobatでエラーが発生する.pdfファイルを開きます。
  2. 「スキャンとOCR」ツールを選択する
    Acrobatの画面右側にある「ツール」ペインから「スキャンとOCR」を選択します。もし見つからない場合は、「ツール」タブをクリックして一覧から探します。
  3. 「テキスト認識」の設定を開く
    「スキャンとOCR」ツールバーが表示されたら、「テキスト認識」の下にある「設定」ボタンをクリックします。これにより、「テキスト認識の設定」ダイアログが開きます。
  4. 主要なOCR言語を確認する
    「テキスト認識の設定」ダイアログ内で、「主要なOCR言語」のドロップダウンリストを確認します。現在選択されている言語が表示されます。
  5. 正しい言語を選択する
    .pdf文書の実際の言語と一致するように、ドロップダウンリストから適切な言語を選択します。例えば、日本語の文書であれば「日本語」を選びます。複数の言語が混在している場合は、「複数の言語」を選択できる場合もあります。
  6. 設定を保存しOCRを実行する
    「OK」ボタンをクリックして設定を保存します。その後、再度「テキスト認識」を実行し、エラーが解消されたか確認します。

必要な言語パックの追加インストール

OCR対象の言語が「主要なOCR言語」のドロップダウンリストに表示されない場合、その言語パックがAcrobatにインストールされていません。以下の手順で追加インストールします。

  1. Acrobatの環境設定を開く
    Acrobatを起動し、「編集」メニューから「環境設定」を選択します。macOSの場合は「Acrobat」メニューから「環境設定」を選択します。
  2. 「言語」カテゴリを選択する
    環境設定ダイアログの左側カテゴリリストから「言語」を選択します。
  3. 追加言語のインストールを開始する
    「OCR言語」セクションにある「追加言語のインストール」ボタンをクリックします。これにより、言語パックのダウンロードとインストールプロセスが開始されます。
  4. インストールしたい言語を選択し完了させる
    表示されるリストから、認識したい言語を選択し、画面の指示に従ってインストールを完了させます。インターネット接続が必要です。
  5. Acrobatを再起動しOCRを実行する
    インストール完了後、Acrobatを一度終了し、再起動します。その後、再度OCRを実行し、言語認識が可能になったか確認します。

Acrobatの更新と修復

Acrobatのソフトウェア自体に問題がある場合、更新や修復を行うことでエラーが解決することがあります。最新の状態に保つことは、セキュリティ面でも重要です。

  1. アップデートを確認する
    Acrobatを起動し、「ヘルプ」メニューから「アップデートを確認」を選択します。
  2. アップデートをインストールする
    利用可能なアップデートがあれば、画面の指示に従ってダウンロードし、インストールします。インストールには時間がかかる場合があります。
  3. Acrobatを再起動する
    アップデート完了後、Acrobatを再起動し、変更を適用します。
  4. インストールの修復を実行する
    「ヘルプ」メニューから「インストールの修復」を選択し、画面の指示に従い修復プロセスを実行します。この機能は、Acrobatのプログラムファイルが破損している場合に有効です。
  5. 修復完了後にOCRを実行する
    修復が完了したら、Acrobatを再起動し、再度OCRを実行してエラーが解消されたか確認します。

OCRが正しく認識されない・エラーが続く場合の確認ポイント

上記の解決手順を試してもOCRが正しく認識されない場合や、エラーが続く場合には、以下の点を確認してください。OCRの精度は、元の文書や設定に大きく左右されます。

スキャン画像の品質が低い場合

OCRは、画像内の文字を解析してテキストに変換します。そのため、スキャンされた画像の品質が低いと、文字の識別が困難になり、認識精度が著しく低下したり、エラーが発生したりします。

原因: 解像度が低い画像、文字が傾いている、文字が滲んでいる、背景が複雑で文字とのコントラストが低いなどの問題が考えられます。また、写真撮影された文書では、影や光の反射が認識を妨げることがあります。

対処法: 元の文書をより高い解像度で再スキャンします。一般的には300DPIから600DPIが推奨されます。スキャナーの設定で、グレースケールや白黒モードを使用すると、文字のコントラストが向上し認識しやすくなる場合があります。また、スキャナーやAcrobatの機能で、傾き補正やノイズ除去、シャープネス調整を行うと改善することがあります。

複数の言語が混在する.pdf文書の場合

一つの.pdf文書内に複数の異なる言語のテキストが含まれている場合、AcrobatのOCR設定で単一の言語しか指定していないと、設定した言語以外の部分が正しく認識されません。

原因: AcrobatのOCRは、通常、設定された主要言語に基づいてテキストを認識します。そのため、文書内に日本語と英語が混在しているにもかかわらず、OCR言語設定が「日本語」のみになっていると、英語部分の認識が困難になります。

対処法: 「テキスト認識の設定」ダイアログで「主要なOCR言語」を「複数の言語」に設定できる場合があります。この設定は、Acrobatのバージョンや機能によって利用できるか確認が必要です。もし「複数の言語」オプションがない場合、文書を言語ごとに分割してOCRを実行し、後で結合するなどの手順を検討します。または、OCR実行後に手動で修正する手間が発生します。

保護された.pdfファイルの場合

セキュリティ設定によって保護されている.pdfファイルでは、テキスト認識や内容の編集が制限されている場合があります。このようなファイルでは、OCR機能が実行できないことがあります。

原因: .pdfファイルの作成者が、閲覧や印刷以外の操作、例えばテキストのコピーや編集、内容の変更などを制限するパスワードを設定している可能性があります。これにより、OCRエンジンがファイルの内容にアクセスできなくなり、エラーが発生します。

対処法: まず、.pdfファイルのプロパティを確認します。Acrobatでファイルを開き、「ファイル」メニューから「プロパティ」を選択し、「セキュリティ」タブをクリックします。「文書の制限の概要」で、テキスト認識やコンテンツの抽出が許可されているか確認します。許可されていない場合は、ファイルの所有者に問い合わせて制限解除のパスワードを入手するか、制限解除の許可を依頼する必要があります。

ADVERTISEMENT

AcrobatとEdgeのOCR機能の比較

Acrobatは高度なOCR機能を提供しますが、Edgeのようなブラウザベースのビューアでは、OCR機能は提供されていません。ここでは、AcrobatのOCR機能とEdgeのテキスト選択機能の違いについて比較します。

項目 Acrobat Edge
OCR機能 スキャン画像から編集可能なテキストを認識・抽出 画像内のテキスト選択は可能だが、OCR機能なし
対応言語 多数の言語に対応、言語パック追加で拡張可能 ブラウザ表示でのテキスト選択機能に依存
編集機能 認識後のテキスト修正、書式変更、編集が可能 テキスト選択のみ、直接編集はできない
出力形式 .pdfファイルに直接OCR結果を埋め込み、検索可能.pdfを作成 選択したテキストをコピーし、別のアプリケーションに貼り付け
利用環境 デスクトップアプリケーションとして動作 Webブラウザ内で.pdfを表示する機能の一部

まとめ

この記事では、AcrobatでOCRを実行する際に発生する「言語がサポートされていません」エラーの解決策を解説しました。

OCR言語設定の調整、必要な言語パックのインストール、Acrobatの更新・修復を行うことで、このエラーは解決できます。

今後は、スキャンした.pdfファイルから正確にテキストを抽出し、編集作業を効率化できるでしょう。

文書の言語に合わせてOCR設定を適切に調整する習慣をつけ、Acrobatのテキスト認識機能を最大限に活用してください。

📑
PDFトラブル・操作完全解決データベース 閲覧エラー、編集・結合、パスワード解除など、PDFに関するあらゆる困りごとを網羅しています。

ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。