【Excel】重複データを検出して削除する方法

【Excel】重複データを検出して削除する方法
🛡️ 超解決

Excelで作業をしていると、意図せず同じデータが複数行入力されていることに気づくことがあります。

これらの重複データは、集計結果を誤らせたり、データの可読性を低下させたりする原因となります。

本記事では、Excelで重複データを効率的に検出し、削除する具体的な方法を解説します。

これにより、データの正確性を高め、作業効率を向上させることができます。

【要点】Excelで重複データを検出・削除する手順

  • 条件付き書式の設定: 重複するセルを視覚的にハイライトして検出する。
  • 重複の削除機能: 検出した重複データを一括で削除する。
  • Power Queryの活用: より高度な重複検出・削除や、継続的なデータクリーニングを行う。

ADVERTISEMENT

重複データが生まれる原因と対策

Excelで重複データが発生する主な原因は、手作業によるデータ入力ミスや、複数のソースからのデータ統合時に起こる不整合です。

例えば、顧客リストを作成する際に、同じ顧客情報を誤って二重に入力してしまうケースが考えられます。

また、異なる部署から提供されたデータを一つにまとめる際にも、キーとなる項目(例:社員ID、商品コード)が完全に一致しないために、実質的に同じデータが重複して取り込まれることがあります。

このような重複データは、分析の精度を低下させるだけでなく、誤った意思決定につながるリスクも孕んでいます。

これを防ぐためには、データ入力時のルールを明確にし、入力規則を設定することが有効です。

また、データ統合時には、事前に重複チェックを行うプロセスを組み込むことが推奨されます。

お探しの解決策が見つからない場合は、こちらの「Excelトラブル完全解決データベース」で他のエラー原因や解決策をチェックしてみてください。

重複データを視覚的に検出する方法

まず、重複しているデータをExcel上で分かりやすく「検出」する方法を紹介します。

ここでは、Excelの「条件付き書式」機能を使います。

この機能を使うと、指定した条件に一致するセルに自動で色を付けたり、アイコンを表示させたりできます。

条件付き書式で重複値をハイライトする手順

  1. 対象範囲を選択する
    重複を検出したいデータが含まれるセル範囲を選択します。列全体を選択することも可能です。
  2. 条件付き書式を開く
    「ホーム」タブの「スタイル」グループにある「条件付き書式」をクリックします。
  3. ルールの種類を選択する
    表示されたメニューから「セルの強調表示ルール」を選択し、さらに「重複する値」をクリックします。
  4. 書式を設定する
    「重複する値」ダイアログボックスが表示されます。左側のドロップダウンリストで「重複」が選択されていることを確認します。右側のドロップダウンリストで、重複したセルに適用したい書式(例:「濃い赤の文字と薄い赤の背景」)を選択します。
  5. 設定を確定する
    「OK」ボタンをクリックします。

これで、選択した範囲内で重複している値を持つセルが、指定した書式でハイライトされます。

この方法で、どのデータが重複しているのかを視覚的に把握できます。

重複データを一括で削除する方法

重複データを検出したら、次はそれらを効率的に削除します。

Excelには「重複の削除」という便利な機能が用意されています。

この機能を使えば、条件に一致する重複行を自動で見つけて削除できます。

「重複の削除」機能を使う手順

  1. 対象範囲を選択する
    重複を削除したいデータが含まれるセル範囲を選択します。ヘッダー行(列名)が含まれている場合は、それも一緒に選択してください。
  2. 重複の削除機能を開く
    「データ」タブの「データツール」グループにある「重複の削除」をクリックします。
  3. 削除対象の列を選択する
    「重複の削除」ダイアログボックスが表示されます。「列」の項目で、重複を判定する基準となる列を選択します。
  4. 重複の判定基準を確認する
    「見出し行がある」にチェックが入っていることを確認します。これにより、選択した範囲の1行目がヘッダーとして扱われます。
  5. 削除を実行する
    「OK」ボタンをクリックします。

Excelは、選択した列の値がすべて一致する行を重複とみなし、最初に出現した行を残して、それ以降の重複行を削除します。

削除が完了すると、「〇個の値が見つかり、削除されました。〇個の一意の値が残っています。」というメッセージが表示されます。

「重複の削除」機能の注意点

「重複の削除」機能は非常に便利ですが、いくつか注意すべき点があります。

この機能は、選択した範囲のデータそのものを変更します。つまり、一度削除したデータは元に戻せません。

そのため、操作を実行する前に、必ずデータのバックアップを取っておくか、コピーしたシートで試すことを強く推奨します。

また、重複を判定する列の選択が重要です。意図しない列を選択すると、本来残すべきデータまで削除してしまう可能性があります。

例えば、顧客名と住所のリストで、顧客名のみを重複判定の基準にすると、同じ名前の別人がいる場合に一方を削除してしまうかもしれません。

複数の列を組み合わせて重複を判定したい場合は、すべての関連列を選択してください。

ADVERTISEMENT

Power Queryを使った重複データの管理

より高度なデータクリーニングや、定期的なデータ更新が必要な場合は、Power Queryの活用が有効です。

Power Queryは、Excel 2016以降やMicrosoft 365で利用できる強力なデータ加工ツールです。

これを使えば、データの取り込みから重複の削除、整形までの一連のプロセスを自動化できます。

Power Queryで重複を削除する手順

  1. データをPower Queryに取り込む
    Excelの「データ」タブから「データの取得」を選択し、データのソース(例:「テーブルまたは範囲から」)を指定して、データをPower Queryエディターに読み込みます。
  2. 重複を削除したい列を選択する
    Power Queryエディターで、重複を判定したい列を選択します。
  3. 重複を削除する
    選択した列を右クリックし、「行の削除」>「重複する行の削除」を選択します。あるいは、「ホーム」タブの「行の削減」グループにある「重複の削除」をクリックします。
  4. 変更を適用する
    重複が削除されたら、「ホーム」タブの「閉じて読み込む」をクリックして、結果をExcelシートに読み込みます。

Power Queryの利点は、これらの操作手順が記録されることです。

これにより、次回以降は元データを更新するだけで、同じ手順で重複削除を自動的に実行できます。

また、Power Queryでは、複数の列を組み合わせて重複を判定したり、特定の条件を満たす行のみを削除したりするなど、より柔軟なデータ処理が可能です。

重複データ検出・削除の応用

Excelの重複データ検出・削除機能は、さまざまな場面で応用できます。

例えば、顧客リストから重複するメールアドレスを削除して、メールマーケティングの対象リストを整理する際に役立ちます。

また、商品リストから重複する商品コードを削除し、在庫管理や販売データの整合性を保つためにも利用できます。

さらに、イベント参加者リストから重複登録を削除して、正確な参加者数を把握するといった用途にも適しています。

これらの機能を使いこなすことで、データの品質を維持し、より正確な分析や意思決定が可能になります。

まとめ

本記事では、Excelで重複データを検出し、削除するための主要な方法として、条件付き書式、重複の削除機能、そしてPower Queryの活用法を解説しました。

これらの機能を使いこなすことで、データの正確性を向上させ、作業効率を大幅に改善できます。

まずは条件付き書式で重複を視覚的に確認し、次に「重複の削除」機能で一括削除を試してみてください。

より複雑なデータ処理や自動化が必要な場合は、Power Queryの導入を検討すると良いでしょう。

【要点】Excelで重複データを検出・削除する手順

  • 条件付き書式の設定: 重複するセルを視覚的にハイライトして検出する。
  • 重複の削除機能: 検出した重複データを一括で削除する。
  • Power Queryの活用: より高度な重複検出・削除や、継続的なデータクリーニングを行う。
📊
Excelトラブル完全解決データベースこの記事以外にも、様々なエラー解決策をまとめています。困った時の逆引きに活用してください。

ADVERTISEMENT

この記事の監修者
📈

超解決 Excel・Word研究班

企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。

🏆
超解決 Excel検定 あなたのExcel実務能力を3分で測定!【1級・2級・3級】