【PDF】PDF内の「縦書きの表」から文字をコピーすると順番がめちゃくちゃになる時の読み取り順序

【PDF】PDF内の「縦書きの表」から文字をコピーすると順番がめちゃくちゃになる時の読み取り順序
🛡️ 超解決

PDFの縦書きの表からテキストをコピーすると、文字の並びが意図せず崩れて困ることはありませんか。

これはPDFの内部的な読み取り順序の設定が、見た目のレイアウトと一致していないことが主な原因です。

この記事では、Acrobat Readerを使ってPDFの読み取り順序を調整し、縦書きの表から正確にテキストをコピーする方法を解説します。

この手順を踏むことで、コピーしたテキストの修正作業を大幅に減らせるでしょう。

【要点】PDFの縦書き表から正確に文字をコピーする読み取り順序の設定

  • 読み上げ順序ツールの活用: PDFの内部構造を自動で分析し、テキストの読み取り順序を最適化する初期設定を試みます。
  • コンテンツパネルでの手動調整: 自動修正で不十分な場合、PDF内の各要素の配置を直接編集し、コピー順序を視覚的な並びと一致させます。
  • タグ構造の確認と修正: PDFの論理的な構造であるタグを確認し、テキストの正確なコピーとアクセシビリティの向上を図ります。

ADVERTISEMENT

PDFで縦書き表のテキスト順序が崩れる理由

PDFは文書の見た目を忠実に再現しますが、その内部的なテキストの読み取り順序は、必ずしも視覚的なレイアウトと一致しません。

特に縦書きの表では、元文書の作成アプリケーションやPDFへの変換方法によって、テキストブロックが横方向の順序で内部に記録されることがあります。

このため、テキストをコピーする際に、視覚的な縦方向の並びではなく、内部で定義された横方向の並びでテキストが取得されてしまいます。

Acrobat Readerには「読み上げ順序ツール」や「コンテンツパネル」といった機能があり、これらの内部順序を制御し、正確なテキストコピーを可能にします。

これらのツールを使うことで、PDFの情報を正確に抽出し、再利用できるようになります。

Acrobat ReaderでPDFの読み取り順序を修正する手順

このセクションでは、Acrobat Readerのアクセシビリティ機能を活用して、PDFの読み取り順序を調整する方法を解説します。

主に「読み上げ順序ツール」と「コンテンツパネル」を使用し、縦書き表からの正確なテキストコピーを目指します。

読み上げ順序ツールで自動的に修正を試みる

  1. 読み上げ順序ツールの起動
    Acrobat Readerを開き、対象の.pdfファイルを開きます。右側のツールパネルから「アクセシビリティ」を選択し、「読み上げ順序」ツールボタンをクリックします。このツールが開き、文書内の要素がブロックで囲まれて表示されます。
  2. 自動順序付けの適用
    「読み上げ順序」ダイアログが表示されたら、「ページコンテンツの順序」項目で「文書構造の推測」を選択します。次に「ページ範囲」で「全ページ」または対象ページを選び、「OK」ボタンをクリックします。Acrobat Readerが自動でテキストブロックの順序を再構築します。
  3. コピーして確認
    修正が完了したら、縦書き表のテキストをコピーし、正しい順序で取得されるか確認します。自動修正で改善されない場合は、次の手動修正を試します。

コンテンツパネルで手動で読み取り順序を調整する

  1. コンテンツパネルの表示
    Acrobat Readerの左側にあるナビゲーションパネルを開き、「コンテンツ」アイコンをクリックしてコンテンツパネルを表示します。このパネルには、.pdfファイル内のすべてのコンテンツ要素が階層構造で表示されます。
  2. 対象要素の特定
    コンテンツパネルで、縦書きの表に該当するテキストブロックを見つけます。通常、「テキスト」や「Path」といった要素として表示されます。コピー時に順序が崩れると予想される部分を特定します。
  3. 要素の移動
    順序が間違っているテキスト要素をクリックして選択します。選択した要素をドラッグアンドドロップで、正しい読み取り順序になる位置に移動させます。縦書きの表の場合、縦方向の並びになるように要素の順番を調整します。要素を移動する際は、他の要素との関連性も考慮してください。
  4. タグパネルでの確認と修正
    コンテンツパネルでの調整後、左側の「タグ」アイコンをクリックしてタグパネルを開きます。タグパネルは、.pdfファイルの論理的な構造を示します。タグの階層が視覚的な読み取り順序と一致しているか確認します。必要に応じて、タグの順序もドラッグアンドドロップで修正します。タグ構造を正しくすることで、アクセシビリティも向上します。
  5. 保存と確認
    修正が完了したら、.pdfファイルを上書き保存します。再度、縦書き表のテキストをコピーして、順序が正しくなったか確認します。

PDFの読み取り順序修正時の注意点と追加トラブル

PDFの読み取り順序を修正する際には、いくつかの注意点や関連するトラブルが発生することがあります。

ここでは、それぞれの状況に応じた対処法を解説します。

読み上げ順序ツールで改善されない

読み上げ順序ツールは自動処理のため、複雑なレイアウトの文書では意図しない結果になることがあります。特に、複数の表や複雑な図形が混在するページでは、正確な順序を推測しにくい傾向があります。この場合は、コンテンツパネルやタグパネルでの手動調整が不可欠です。各要素の親子関係を意識し、視覚的な並びと論理的な順序を慎重に一致させるように移動させてください。

タグがないPDFで順序が崩れる

元々タグが付与されていない.pdfファイルの場合、Acrobat Readerはテキストブロックの順序を推測します。この推測が間違っていると、コピー順序も崩れる原因となります。このような場合は、「アクセシビリティ」ツールの「タグを自動作成」機能でタグを付与してから、順序を調整すると効果的です。ツールパネルの「アクセシビリティ」から「タグを自動作成」を選択し、タグ構造を生成してください。その後、コンテンツパネルやタグパネルで詳細な調整を行います。

コピー元が画像化されたテキスト

.pdfファイル内のテキストが画像として埋め込まれている場合、文字として認識されません。この状態では、テキストのコピー自体ができません。この問題を解決するには、「アクセシビリティ」ツールの「テキスト認識」機能でOCR処理を行い、文字情報に変換する必要があります。ツールパネルの「アクセシビリティ」から「テキスト認識」を選択し、文字認識を実行してください。変換後、読み取り順序の調整を試みることが可能です。

ADVERTISEMENT

Acrobat ReaderとEdgeのPDFコピー機能比較

このセクションでは、主要なPDF閲覧ソフトであるAcrobat ReaderとEdgeでのテキストコピーの特性を比較します。

縦書き表のテキストコピーにおける挙動の違いを理解するのに役立ちます。

項目 Acrobat Reader Edge
テキストコピーの精度 内部構造を考慮し、読み取り順序調整が可能 見た目通りのコピーに限定される場合が多い
読み取り順序の調整 「読み上げ順序ツール」「コンテンツパネル」で可能 調整機能は提供されない
タグ構造の利用 タグの確認・編集により、論理順序を制御可能 タグ構造の表示・編集機能はない
OCR機能 高度なテキスト認識機能が利用可能 基本的なテキスト認識機能のみ
縦書き表のコピー 順序調整で正確なコピーを目指せる 順序が崩れる可能性が高い
主な用途 詳細なPDF編集・アクセシビリティ対応 手軽なPDF閲覧・印刷・基本的なコピー

この記事では、PDFの縦書き表から文字をコピーする際に順序が乱れる問題の解決策を解説しました。

Acrobat Readerの読み上げ順序ツールやコンテンツパネルを活用することで、正確なテキストコピーが可能になります。

タグ構造の理解と手動調整は、複雑なPDFでもテキストの整合性を保つ上で重要な要素です。

今後は、PDFからのテキスト抽出作業を効率化し、データ活用の幅を広げてください。

📑
PDFトラブル・操作完全解決データベース 閲覧エラー、編集・結合、パスワード解除など、PDFに関するあらゆる困りごとを網羅しています。

ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。