【PDF】PDFの文字をテキストファイル(.txt)として一括で書き出し、メモ帳で編集する手順

【PDF】PDFの文字をテキストファイル(.txt)として一括で書き出し、メモ帳で編集する手順
🛡️ 超解決

PDFファイルから必要な情報をテキスト形式で取り出して、メモ帳で編集したいと考える方は多いでしょう。しかし、PDFの複雑な書式が邪魔をして、テキストの抽出や編集がうまくいかないことがあります。

この記事では、Acrobat Reader、Edge、そしてスマホのPDFアプリを使って、PDFからテキストファイル(.txt)を書き出し、メモ帳で編集する具体的な手順を解説します。

この記事を読めば、PDF内の文字データを効率的に抽出し、再利用できるようになります。

【要点】PDFのテキスト書き出しと編集の基本

  • Acrobat Readerでの一括書き出し: PDF全体または指定範囲のテキストを.txt形式でまとめて抽出できます。
  • Edgeでのテキストコピー: WebブラウザのEdgeを使ってPDF内のテキストを選択し、メモ帳へ簡単にコピーできます。
  • iPhone・Androidでのテキスト抽出: スマホの標準アプリやGoogleドライブを活用し、PDFから必要なテキストをコピーしてメモアプリで利用できます。

ADVERTISEMENT

PDFのテキスト書き出し機能の概要

PDFのテキスト書き出し機能とは、PDFファイルに含まれる文字情報を、書式を持たないプレーンなテキストデータとして抽出する機能です。この機能を使うと、PDFの内容をメモ帳などのテキストエディタで自由に編集したり、他のアプリケーションに貼り付けたりできます。

元のPDFのレイアウトや画像は含まれず、純粋な文字情報のみが抽出されるため、データ容量が小さく、検索や加工がしやすい点が特徴です。

テキスト抽出のメリット

PDFからテキストを抽出する最大のメリットは、情報の再利用が容易になることです。例えば、報告書や論文のPDFから引用したい部分だけを抜き出したり、会議の議事録をテキスト形式で保存して後から検索しやすくしたりできます。

また、プログラミングやデータ分析の際に、PDF内の構造化されていないテキストデータを取得し、処理することも可能です。書式に縛られない自由な編集作業が可能になります。

テキスト抽出の前提条件

PDFからテキストを正確に抽出するには、PDFがテキストデータを含んでいる必要があります。スキャナーで取り込んだだけの画像ベースのPDFは、文字情報ではなく画像として認識されます。

このような画像PDFからテキストを抽出するには、OCRと呼ばれる光学文字認識機能が必要です。多くのPDF作成ソフトやAcrobatの有料版にはOCR機能が搭載されていますが、Acrobat Readerではテキストの選択や書き出しのみが可能です。

Acrobat ReaderでPDFのテキストを一括書き出しする手順

Acrobat Readerを使えば、PDFファイル全体のテキストを簡単に.txtファイルとして書き出せます。必要な部分だけを抽出することも可能です。

  1. Acrobat ReaderでPDFを開く
    書き出したいPDFファイルをAcrobat Readerで開きます。
  2. 「ファイル」メニューを開く
    画面左上の「ファイル」メニューをクリックします。
  3. 「書き出し形式」を選択する
    表示されたメニューの中から「書き出し形式」を選びます。さらにサブメニューが表示されます。
  4. 書き出し形式を「テキスト(プレーン)」に設定する
    サブメニューから「テキスト(プレーン)」を選択します。これにより、書式なしのテキスト形式で保存されます。
  5. 保存場所とファイル名を指定して保存する
    「名前を付けて保存」ダイアログが表示されます。ファイルを保存したい場所を選び、ファイル名を入力してください。ファイルの種類が「テキストファイル(*.txt)」になっていることを確認し、「保存」ボタンをクリックします。これでPDFのテキストが.txtファイルとして書き出されます。

EdgeでPDFのテキストをコピーしてメモ帳に貼り付ける手順

Microsoft Edgeは、PDFビューアとしても機能します。EdgeでPDFを開き、必要なテキストを選択してコピーし、メモ帳に貼り付ける方法を解説します。

  1. EdgeでPDFを開く
    Edgeブラウザを起動し、PDFファイルをドラッグアンドドロップするか、「ファイル」メニューから「開く」を選択してPDFを開きます。
  2. テキストを選択する
    PDF内でコピーしたいテキストの先頭をクリックし、そのままドラッグして目的の範囲を選択します。複数ページにわたるテキストも選択可能です。
  3. 選択したテキストをコピーする
    選択したテキストの上で右クリックし、表示されるメニューから「コピー」を選択します。または、キーボードのCtrlキーとCキーを同時に押してコピーします。
  4. メモ帳を開く
    Windowsのスタートメニューから「メモ帳」を検索して起動します。
  5. メモ帳にテキストを貼り付ける
    メモ帳の白い画面上で右クリックし、「貼り付け」を選択します。または、キーボードのCtrlキーとVキーを同時に押して貼り付けます。これでPDFからコピーしたテキストがメモ帳に表示され、編集できるようになります。

ADVERTISEMENT

iPhone・AndroidのPDFアプリでテキストを抽出する手順

スマートフォンでもPDFからテキストを抽出できます。iPhoneとAndroidそれぞれの標準的な方法を説明します。

iPhoneのファイルアプリとメモアプリでテキストを抽出する

iPhoneの「ファイル」アプリと「メモ」アプリを使って、PDFのテキストをコピーし、編集する手順です。

  1. PDFをファイルアプリで開く
    「ファイル」アプリを開き、目的のPDFファイルをタップして表示させます。
  2. テキストを選択してコピーする
    PDF内のテキストを長押しすると、選択範囲の調整ハンドルが表示されます。コピーしたい範囲を調整し、「コピー」をタップします。
  3. メモアプリを開く
    ホーム画面に戻り、「メモ」アプリを起動します。
  4. 新規メモを作成し貼り付ける
    右下の新規メモ作成アイコンをタップし、新しいメモを開きます。画面を長押しして「ペースト」をタップすると、コピーしたテキストが貼り付けられます。

AndroidのGoogleドライブでテキストを抽出する

Androidデバイスでは、GoogleドライブのPDFビューア機能を利用してテキストを抽出できます。

  1. GoogleドライブでPDFを開く
    「Googleドライブ」アプリを開き、PDFファイルをタップして表示させます。
  2. テキストを選択してコピーする
    PDF内のテキストを長押しすると、選択範囲の調整ハンドルが表示されます。コピーしたい範囲を調整し、「コピー」をタップします。
  3. テキストエディタアプリに貼り付ける
    メモ帳やGoogleドキュメントなど、テキスト編集が可能なアプリを開きます。新規ファイルを作成し、画面を長押しして「貼り付け」をタップします。

PDFのテキスト書き出し時の注意点

PDFからテキストを書き出す際には、いくつかの注意点があります。これらを理解しておくことで、予期せぬトラブルを避けられます。

画像ベースのPDFからはテキストが抽出できない

スキャンして作成されたPDFファイルは、見た目は文字でも実際は「画像」として扱われます。このため、テキストとして選択したり、書き出したりすることはできません。

このようなPDFからテキストを抽出するには、OCR光学文字認識機能が必須です。OCR機能は、画像の中から文字を識別し、テキストデータに変換します。Acrobat Proなどの有料版PDF編集ソフトにはこの機能が搭載されています。

レイアウト崩れや文字化けが発生する場合がある

PDFは複雑なレイアウトや特殊なフォントを保持できますが、テキストファイルは書式を持たないシンプルな形式です。そのため、PDFからテキストを書き出すと、段落の区切り、スペース、改行などが正しく反映されず、レイアウトが大きく崩れることがあります。

また、PDFで使用されているフォントやエンコードが、書き出し先の環境と合わない場合、特定の文字が文字化けする可能性もあります。この場合、書き出しオプションでエンコード形式を変更したり、手動で修正したりする必要があります。

元の書式は保持されない

テキストファイル(.txt)は、フォントの種類、サイズ、色、太字、斜体、下線などの書式情報を一切保持しません。PDFからテキストを書き出すと、これらの書式はすべて失われ、プレーンな文字情報のみが抽出されます。

元のPDFのデザインや見た目を再現したい場合は、テキストファイルではなく、別の形式(例えばWord文書など)への変換を検討する必要があります。テキストファイルは、あくまで文字情報の再利用を目的とした形式です。

Acrobat ReaderとEdgeのテキスト書き出し機能比較

Acrobat ReaderとEdgeはどちらもPDFのテキストを扱えますが、その機能には違いがあります。それぞれの特徴を比較します。

項目 Acrobat Reader Edge
主な機能 PDFからテキストファイルへの直接書き出し PDFからのテキスト選択とコピー
書式保持 なし(プレーンテキスト) なし(プレーンテキスト)
一括性 PDF全体または指定範囲のテキストを一括書き出し 手動で選択した範囲のテキストをコピー
利用シーン 大量のテキストを再利用したい場合、データ分析 簡単な情報収集、一部のテキスト引用

まとめ

この記事では、Acrobat Reader、Edge、そしてスマートフォンアプリを使って、PDFからテキストを抽出し、メモ帳で編集する具体的な手順を解説しました。

Acrobat Readerを使えばPDF全体のテキストを一括で書き出すことができ、Edgeやスマホアプリでは必要な部分をコピーして手軽に利用できます。

画像ベースのPDFからの抽出や、レイアウト崩れ、書式消失などの注意点を踏まえ、目的に応じた方法を選びましょう。これらの操作を習得することで、PDF内の情報をより柔軟に活用できるようになります。

📑
PDFトラブル・操作完全解決データベース 閲覧エラー、編集・結合、パスワード解除など、PDFに関するあらゆる困りごとを網羅しています。

ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。