【Excel】重複データを自動で検出・削除する方法

【Excel】重複データを自動で検出・削除する方法
🛡️ 超解決

ビジネスシーンでExcelを使う際、大量のデータの中から重複行を見つけ出し、正確に処理する必要がある場面は頻繁に発生します。

手作業で重複を探すのは時間がかかり、ミスも起こりがちです。Excelの機能を使えば、重複データを素早く検出し、効率的に削除できます。

この記事では、重複データを自動で検出・削除する具体的な手順と活用方法を詳しく解説します。

【要点】Excelの重複データ処理で業務効率を高める

  • 条件付き書式: 重複する値: シート上の重複データを色分け表示して視覚的に確認できます。
  • データタブ: 重複の削除: 選択した範囲の重複行を自動で削除し、一意のデータだけを残します。
  • Power Query: 行の削除 → 重複の削除: 大量の外部データから重複行を除去し、クリーンな状態に整形できます。

ADVERTISEMENT

Excelで重複データを処理する目的と機能の概要

Excelで重複データを処理する機能は、入力ミスや複数ソースからのデータ統合によって発生する不整合を解消するために重要です。この機能を使うことで、データ集計の正確性が向上し、分析時の誤りを防げます。

例えば、顧客リストで同じ顧客が複数登録されている場合や、商品データで同じ商品コードが重複している場合などに役立ちます。正確なデータは、ビジネスの意思決定において不可欠です。

Excelには、重複データを視覚的に検出する「条件付き書式」と、重複した行を実際に削除する「重複の削除」機能が標準で搭載されています。さらに、Power Queryを使えば、より複雑な条件での重複除去や、大規模なデータセットの加工も可能です。

これらの機能を適切に使い分けることで、データの整合性を保ちながら業務効率を高められます。

お探しの解決策が見つからない場合は、こちらの「Excelトラブル完全解決データベース」で他のエラー原因や解決策をチェックしてみてください。

条件付き書式で重複データを視覚的に検出する手順

条件付き書式を使うと、重複しているセルを色で強調表示できます。データの内容を確認しながら、必要な重複と不要な重複を区別したい場合に有効です。この機能はデータを削除しないため、元のデータはそのまま残ります。

  1. 対象範囲を選択する
    重複を検出したいセル範囲、または列全体を選択します。例えば、顧客ID列全体を選びます。
  2. 条件付き書式を起動する
    「ホーム」タブの「スタイル」グループにある「条件付き書式」をクリックします。
  3. 強調表示ルールを選択する
    「セルの強調表示ルール」にマウスを合わせ、「重複する値」をクリックします。
  4. 書式設定を決定する
    「重複する値」ダイアログボックスが開きます。「重複」が選択されていることを確認します。適用する書式をドロップダウンリストから選びます。例えば、「濃い赤の文字、明るい赤の背景」を選ぶと、重複するセルが赤色で表示されます。
  5. 設定を確定する
    「OK」ボタンをクリックします。選択した範囲内の重複する値が指定した書式で強調表示されます。

「重複の削除」機能でデータをクリーンにする手順

「重複の削除」機能は、選択した範囲から重複する行を自動で削除し、一意のデータのみを残す強力な機能です。この機能は元のデータを変更するため、事前にデータのバックアップを取ることをお勧めします。

Excel 2019や2021でも同様の操作で実行できます。

  1. 対象範囲を選択する
    重複を削除したいデータ範囲全体を選択します。テーブル形式の場合は、テーブル内の任意のセルを選択するだけで自動で範囲が認識されます。
  2. 重複の削除機能を起動する
    「データ」タブの「データツール」グループにある「重複の削除」をクリックします。
  3. 削除対象の列を選択する
    「重複の削除」ダイアログボックスが開きます。「先頭行をデータの見出しとして使用」のチェックボックスを必要に応じて調整します。重複を判断する基準となる列を一つ以上選択します。例えば、「顧客ID」と「顧客名」の両方が一致した場合に重複とみなす場合は、両方のチェックボックスをオンにします。
  4. 削除を実行する
    「OK」ボタンをクリックします。重複する行が削除され、削除された重複の数と残った一意の行数がメッセージで表示されます。
  5. 結果を確認する
    「OK」をクリックしてメッセージを閉じます。データが整理されていることを確認します。

ADVERTISEMENT

Power Queryで重複データを高度に除去する手順

Power Queryは、外部データソースからのデータの取り込みや整形に特化した機能です。重複削除も強力で、大量データや複雑なクエリ処理の中で重複を除去したい場合に最適です。

Excel for Microsoft 365のPower Queryは機能が豊富ですが、Excel 2019や2021でも基本的な重複削除機能は利用できます。

  1. データをテーブルとして準備する
    Excelシート上のデータ範囲をテーブル形式に変換します。データ範囲を選択し、「挿入」タブの「テーブル」をクリックします。
  2. Power Queryエディターを起動する
    テーブル内の任意のセルを選択し、「データ」タブの「データの取得と変換」グループにある「テーブルまたは範囲から」をクリックします。Power Queryエディターが起動し、選択したテーブルが表示されます。
  3. 重複を削除する列を選択する
    重複を判断する基準となる列のヘッダーを右クリックします。例えば「商品コード」列を選択します。
  4. 重複の削除を実行する
    右クリックメニューから「重複の削除」を選択します。選択した列を基準に重複する行がすべて削除されます。複数の列を基準にしたい場合は、Ctrlキーを押しながら複数の列を選択してから右クリックします。
  5. 結果をExcelシートに読み込む
    「ホーム」タブの「閉じる」グループにある「閉じて読み込む」をクリックし、「閉じて次に読み込む」を選択します。データの読み込み方法ダイアログが表示されます。「テーブル」を選択し、読み込む場所を選んで「OK」をクリックします。整形されたデータが新しいシートにテーブルとして読み込まれます。

重複データ処理時の注意点と失敗パターン

意図しない列で重複が判定されてしまう

「重複の削除」機能やPower Queryで列を選択する際、誤った列を基準にすると、実際には重複していない行が削除されたり、重複しているはずの行が残ったりします。例えば、名前が同じでもIDが異なる顧客を重複とみなしてしまう場合があります。

  1. 重複基準を明確にする
    どの列の組み合わせが「重複」と定義されるのかを事前に確認します。例えば、顧客リストでは「顧客ID」のみを基準にするか、「顧客名」と「住所」の両方を基準にするか検討します。
  2. 複数列を慎重に選ぶ
    「重複の削除」ダイアログボックスで、重複を判断する基準となる列を慎重に選択します。すべての列を選択すると、行全体が完全に一致する場合のみ重複とみなされます。

削除後に必要なデータまで消えてしまった

「重複の削除」機能は、重複と判断された行を元に戻せない形で削除します。そのため、重要なデータが失われるリスクがあります。

  1. バックアップを取る
    重複の削除を実行する前に、必ず元のシートやブックのコピーを作成します。
  2. Power Queryの利用を検討する
    Power Queryで重複を削除した場合、元のデータソースは変更されず、クエリのステップとして処理が記録されます。いつでも元の状態に戻したり、処理を修正したりできます。
  3. 「元に戻す」コマンドを使う
    もし誤って削除してしまった場合は、Excel上部のクイックアクセスツールバーにある「元に戻す」アイコンをクリックするか、CtrlZキーを押して直前の操作を取り消します。ただし、複数の操作を重ねた後は元に戻せない場合があります。

Power Queryで重複削除が反映されない

Power Queryで重複削除を行った後、Excelシートに反映されない、または期待通りに更新されない場合があります。これは主にクエリの更新が不十分な場合や、接続設定に問題がある場合に発生します。

  1. クエリを更新する
    Power Queryで処理したデータをExcelシートに読み込んだ後、元のデータに変更があった場合は、クエリを更新する必要があります。データが読み込まれているテーブル内の任意のセルを選択し、「データ」タブの「クエリと接続」グループにある「すべて更新」をクリックします。
  2. クエリ接続を確認する
    「データ」タブの「クエリと接続」グループにある「クエリと接続」ウィンドウを開きます。該当するクエリを選択し、接続設定に問題がないか確認します。

重複データ処理機能の比較

項目 条件付き書式 重複の削除 Power Query
主な目的 視覚的な検出と確認 シート上の重複行の物理的削除 外部データを含む複雑なデータ変換と削除
元のデータへの影響 なし あり(削除される) なし(変換された結果を別に出力)
操作の柔軟性 限定的(書式設定のみ) シンプルで直接的 高度なカスタマイズが可能
再利用性 書式ルールとして保存 なし(都度実行) クエリとして保存し再利用可能
適用データ量 中程度までが効率的 中程度までが効率的 大規模データに最適

この記事では、Excelで重複データを検出・削除する3つの方法を解説しました。条件付き書式で視覚的な確認、重複の削除機能で簡単除去、Power Queryで柔軟なデータ加工が可能になったはずです。

これらの機能を使いこなすことで、データ処理の正確性と効率を飛躍的に向上させられます。

今後は、定期的なデータクレンジング作業にこれらの機能を組み込み、データの品質を維持することを検討してみてください。

📊
Excelトラブル完全解決データベースこの記事以外にも、様々なエラー解決策をまとめています。困った時の逆引きに活用してください。

ADVERTISEMENT

この記事の監修者
📈

超解決 Excel・Word研究班

企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。

🏆
超解決 Excel検定 あなたのExcel実務能力を3分で測定!【1級・2級・3級】