ビジネスシーンでExcelを使う際、大量のデータの中から重複行を見つけ出し、正確に処理する必要がある場面は頻繁に発生します。
手作業で重複を探すのは時間がかかり、ミスも起こりがちです。Excelの機能を使えば、重複データを素早く検出し、効率的に削除できます。
この記事では、重複データを自動で検出・削除する具体的な手順と活用方法を詳しく解説します。
【要点】Excelの重複データ処理で業務効率を高める
- 条件付き書式: 重複する値: シート上の重複データを色分け表示して視覚的に確認できます。
- データタブ: 重複の削除: 選択した範囲の重複行を自動で削除し、一意のデータだけを残します。
- Power Query: 行の削除 → 重複の削除: 大量の外部データから重複行を除去し、クリーンな状態に整形できます。
ADVERTISEMENT
目次
Excelで重複データを処理する目的と機能の概要
Excelで重複データを処理する機能は、入力ミスや複数ソースからのデータ統合によって発生する不整合を解消するために重要です。この機能を使うことで、データ集計の正確性が向上し、分析時の誤りを防げます。
例えば、顧客リストで同じ顧客が複数登録されている場合や、商品データで同じ商品コードが重複している場合などに役立ちます。正確なデータは、ビジネスの意思決定において不可欠です。
Excelには、重複データを視覚的に検出する「条件付き書式」と、重複した行を実際に削除する「重複の削除」機能が標準で搭載されています。さらに、Power Queryを使えば、より複雑な条件での重複除去や、大規模なデータセットの加工も可能です。
これらの機能を適切に使い分けることで、データの整合性を保ちながら業務効率を高められます。
条件付き書式で重複データを視覚的に検出する手順
条件付き書式を使うと、重複しているセルを色で強調表示できます。データの内容を確認しながら、必要な重複と不要な重複を区別したい場合に有効です。この機能はデータを削除しないため、元のデータはそのまま残ります。
- 対象範囲を選択する
重複を検出したいセル範囲、または列全体を選択します。例えば、顧客ID列全体を選びます。 - 条件付き書式を起動する
「ホーム」タブの「スタイル」グループにある「条件付き書式」をクリックします。 - 強調表示ルールを選択する
「セルの強調表示ルール」にマウスを合わせ、「重複する値」をクリックします。 - 書式設定を決定する
「重複する値」ダイアログボックスが開きます。「重複」が選択されていることを確認します。適用する書式をドロップダウンリストから選びます。例えば、「濃い赤の文字、明るい赤の背景」を選ぶと、重複するセルが赤色で表示されます。 - 設定を確定する
「OK」ボタンをクリックします。選択した範囲内の重複する値が指定した書式で強調表示されます。
「重複の削除」機能でデータをクリーンにする手順
「重複の削除」機能は、選択した範囲から重複する行を自動で削除し、一意のデータのみを残す強力な機能です。この機能は元のデータを変更するため、事前にデータのバックアップを取ることをお勧めします。
Excel 2019や2021でも同様の操作で実行できます。
- 対象範囲を選択する
重複を削除したいデータ範囲全体を選択します。テーブル形式の場合は、テーブル内の任意のセルを選択するだけで自動で範囲が認識されます。 - 重複の削除機能を起動する
「データ」タブの「データツール」グループにある「重複の削除」をクリックします。 - 削除対象の列を選択する
「重複の削除」ダイアログボックスが開きます。「先頭行をデータの見出しとして使用」のチェックボックスを必要に応じて調整します。重複を判断する基準となる列を一つ以上選択します。例えば、「顧客ID」と「顧客名」の両方が一致した場合に重複とみなす場合は、両方のチェックボックスをオンにします。 - 削除を実行する
「OK」ボタンをクリックします。重複する行が削除され、削除された重複の数と残った一意の行数がメッセージで表示されます。 - 結果を確認する
「OK」をクリックしてメッセージを閉じます。データが整理されていることを確認します。
ADVERTISEMENT
Power Queryで重複データを高度に除去する手順
Power Queryは、外部データソースからのデータの取り込みや整形に特化した機能です。重複削除も強力で、大量データや複雑なクエリ処理の中で重複を除去したい場合に最適です。
Excel for Microsoft 365のPower Queryは機能が豊富ですが、Excel 2019や2021でも基本的な重複削除機能は利用できます。
- データをテーブルとして準備する
Excelシート上のデータ範囲をテーブル形式に変換します。データ範囲を選択し、「挿入」タブの「テーブル」をクリックします。 - Power Queryエディターを起動する
テーブル内の任意のセルを選択し、「データ」タブの「データの取得と変換」グループにある「テーブルまたは範囲から」をクリックします。Power Queryエディターが起動し、選択したテーブルが表示されます。 - 重複を削除する列を選択する
重複を判断する基準となる列のヘッダーを右クリックします。例えば「商品コード」列を選択します。 - 重複の削除を実行する
右クリックメニューから「重複の削除」を選択します。選択した列を基準に重複する行がすべて削除されます。複数の列を基準にしたい場合は、Ctrlキーを押しながら複数の列を選択してから右クリックします。 - 結果をExcelシートに読み込む
「ホーム」タブの「閉じる」グループにある「閉じて読み込む」をクリックし、「閉じて次に読み込む」を選択します。データの読み込み方法ダイアログが表示されます。「テーブル」を選択し、読み込む場所を選んで「OK」をクリックします。整形されたデータが新しいシートにテーブルとして読み込まれます。
重複データ処理時の注意点と失敗パターン
意図しない列で重複が判定されてしまう
「重複の削除」機能やPower Queryで列を選択する際、誤った列を基準にすると、実際には重複していない行が削除されたり、重複しているはずの行が残ったりします。例えば、名前が同じでもIDが異なる顧客を重複とみなしてしまう場合があります。
- 重複基準を明確にする
どの列の組み合わせが「重複」と定義されるのかを事前に確認します。例えば、顧客リストでは「顧客ID」のみを基準にするか、「顧客名」と「住所」の両方を基準にするか検討します。 - 複数列を慎重に選ぶ
「重複の削除」ダイアログボックスで、重複を判断する基準となる列を慎重に選択します。すべての列を選択すると、行全体が完全に一致する場合のみ重複とみなされます。
削除後に必要なデータまで消えてしまった
「重複の削除」機能は、重複と判断された行を元に戻せない形で削除します。そのため、重要なデータが失われるリスクがあります。
- バックアップを取る
重複の削除を実行する前に、必ず元のシートやブックのコピーを作成します。 - Power Queryの利用を検討する
Power Queryで重複を削除した場合、元のデータソースは変更されず、クエリのステップとして処理が記録されます。いつでも元の状態に戻したり、処理を修正したりできます。 - 「元に戻す」コマンドを使う
もし誤って削除してしまった場合は、Excel上部のクイックアクセスツールバーにある「元に戻す」アイコンをクリックするか、CtrlZキーを押して直前の操作を取り消します。ただし、複数の操作を重ねた後は元に戻せない場合があります。
Power Queryで重複削除が反映されない
Power Queryで重複削除を行った後、Excelシートに反映されない、または期待通りに更新されない場合があります。これは主にクエリの更新が不十分な場合や、接続設定に問題がある場合に発生します。
- クエリを更新する
Power Queryで処理したデータをExcelシートに読み込んだ後、元のデータに変更があった場合は、クエリを更新する必要があります。データが読み込まれているテーブル内の任意のセルを選択し、「データ」タブの「クエリと接続」グループにある「すべて更新」をクリックします。 - クエリ接続を確認する
「データ」タブの「クエリと接続」グループにある「クエリと接続」ウィンドウを開きます。該当するクエリを選択し、接続設定に問題がないか確認します。
重複データ処理機能の比較
| 項目 | 条件付き書式 | 重複の削除 | Power Query |
|---|---|---|---|
| 主な目的 | 視覚的な検出と確認 | シート上の重複行の物理的削除 | 外部データを含む複雑なデータ変換と削除 |
| 元のデータへの影響 | なし | あり(削除される) | なし(変換された結果を別に出力) |
| 操作の柔軟性 | 限定的(書式設定のみ) | シンプルで直接的 | 高度なカスタマイズが可能 |
| 再利用性 | 書式ルールとして保存 | なし(都度実行) | クエリとして保存し再利用可能 |
| 適用データ量 | 中程度までが効率的 | 中程度までが効率的 | 大規模データに最適 |
この記事では、Excelで重複データを検出・削除する3つの方法を解説しました。条件付き書式で視覚的な確認、重複の削除機能で簡単除去、Power Queryで柔軟なデータ加工が可能になったはずです。
これらの機能を使いこなすことで、データ処理の正確性と効率を飛躍的に向上させられます。
今後は、定期的なデータクレンジング作業にこれらの機能を組み込み、データの品質を維持することを検討してみてください。
ADVERTISEMENT
超解決 Excel・Word研究班
企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。
Office・仕事術の人気記事ランキング
- 【Outlook】宛先が「オートコンプリート」に出ない・間違っている時の修正手順|履歴の削除と再構築
- 【Outlook】メールの受信が数分遅れる!リアルタイムで届かない時の同期設定と送受信グループ設定
- 【Word】差し込み印刷で数字の桁を整える!金額にカンマ(桁区切り)を入れる設定
- 【Excel】矢印キーで「セルが動かず画面がスクロールする」!ScrollLockの解除方法(ノートPC対応)
- 【Outlook】「メール送信を5分遅らせる」設定!誤送信を防ぐ最強のディレイ機能
- 【神技】保存せずに閉じたExcel・Wordファイルを復元する!消えたデータを復活させる4つの救出法
- 【Outlook】予定表の「祝日」が表示されない!最新カレンダーの追加と二重表示の修正手順
- 【Teams】会議の「参加者リスト」を出席後にダウンロードする!誰が参加したか確認する手順
- 【Teams】メッセージを「保存済み」にして後で読む!重要なチャットをブックマークして整理する技
- 【Excel】文字がセルの枠からはみ出す・隠れる!「折り返して表示」と「縮小して全体を表示」の使い分け
