【要点】Power Queryによる不要な列・行の削除とデータ整形
- 列の削除: 不要な列を選択し、削除することでデータセットをスリム化します。
- 行の削除: 特定の条件に合致する行や、上位・下位の行を削除できます。
- フィルター機能: 特定の値を持つ行のみを残したり、除外したりできます。
- Power Queryエディター: 視覚的な操作で、これらの整形作業を自動記録します。
ADVERTISEMENT
目次
Power Queryによるデータ整形が求められる背景
ビジネスの現場では、日々大量のデータが生成され、活用されています。しかし、これらのデータは必ずしも分析に適した形式で提供されるわけではありません。例えば、Webスクレイピングで取得したデータには、広告バナーやナビゲーションメニューのような不要な情報が含まれることがあります。
また、複数のシステムからエクスポートされたデータを統合する際にも、不要な列や、値が空の行、ヘッダー情報が混在した行などが現れることが一般的です。これらのデータから必要な情報だけを抽出するには、高度なデータクリーニング作業が不可欠となります。
Power Queryは、Excelに標準搭載されている強力なデータ加工ツールです。このツールを利用することで、これらの煩雑なデータ整形作業を、GUI(グラフィカルユーザーインターフェース)操作で直感的に、かつ繰り返し利用可能な形で実行できます。手作業によるミスを減らし、データ分析の精度とスピードを向上させるために、Power Queryによるデータ整形は非常に有効な手段と言えます。
Power Queryエディターでの不要な列削除手順
Power Queryエディターでは、不要な列を簡単に削除できます。この機能を使うことで、データセットから不要な情報を排除し、分析対象を絞り込むことが可能です。
- データの読み込みとPower Queryエディターの起動
Excelの「データ」タブから「データの取得」を選び、対象のデータソース(例:「ファイルから」→「ブックから」)を指定してデータを読み込みます。Power Queryエディターが自動的に起動します。 - 削除したい列の選択
Power Queryエディターのプレビュー画面で、削除したい列のヘッダー(見出し)をクリックして選択します。複数の列を削除したい場合は、Ctrlキーを押しながらクリックして複数選択できます。 - 列の削除を実行
選択した列を右クリックし、「列の削除」を選択します。または、「ホーム」タブの「列の管理」グループにある「列の削除」をクリックしても同様の操作ができます。 - 変更の適用と保存
不要な列が削除されたら、「ホーム」タブの「閉じて読み込む」をクリックして、整形されたデータをExcelシートに読み込みます。
Power Queryエディターでの不要な行削除手順
不要な行の削除も、Power Queryエディターで効率的に行えます。特定の条件に合致する行を削除したり、データの上位・下位の行を除外したりすることが可能です。
条件に基づく行の削除
特定の列に特定の値が含まれる行を削除したい場合などに利用します。
- 削除したい行の条件を設定
Power Queryエディターで、条件設定の元となる列のヘッダーにあるフィルターボタン(▼)をクリックします。 - フィルターオプションの選択
表示されるメニューから、削除したい行を除外するための条件を選択します。例えば、「テキストフィルター」→「指定の値を含まない」や、「数値フィルター」→「指定の値より小さい」などを選びます。 - 条件の入力
表示されるダイアログボックスで、削除したい行を除外するための条件(例:「東京」という値を含まない)を入力し、「OK」をクリックします。 - 変更の適用
指定した条件に合致しない行が削除され、データが整形されます。「閉じて読み込む」でExcelに反映させます。
上位・下位の行の削除
データセットの先頭や末尾にある不要な行(例:不要なヘッダーやフッター、集計行)を削除する場合に便利です。
- 「上位の行の保持」「下位の行の保持」機能の利用
「ホーム」タブの「行の削減」グループにある「上位の行の保持」または「下位の行の保持」をクリックします。 - 保持する行数の指定
表示されるダイアログボックスで、削除したい行数とは逆に、保持したい行数を指定します。例えば、先頭の3行を削除したい場合は、「上位の行の保持」で「保持する行数」に「元の行数 – 3」を入力するか、または「下位の行の保持」で「保持する行数」に「元の行数 – 3」を入力します。 - 「OK」をクリック
指定した行数に基づいて、不要な行が削除されます。
空の行の削除
データ中に存在する、すべてのセルが空になっている行を削除します。
- 「行の削除」メニューから選択
「ホーム」タブの「行の削減」グループにある「行の削除」をクリックします。 - 「空の行」を選択
表示されるメニューから「空の行」を選択します。 - 削除の実行
Power Queryが自動的に空の行を検出し、削除します。
ADVERTISEMENT
Power Queryでのデータ整形における注意点とよくある誤解
Power Queryは非常に強力なツールですが、その特性を理解せずに使用すると、意図しない結果になったり、期待通りの整形ができなかったりすることがあります。
h3「適用されたステップ」の管理の重要性
Power Queryでは、行った操作はすべて「適用されたステップ」として記録されます。このステップは、データの整形プロセスを再現可能にするための鍵となります。
原因: ステップの順序を間違えたり、不要なステップを追加したりすると、意図しないデータ整形が行われることがあります。例えば、列を削除した後にフィルターをかけようとしても、その列が存在しないためエラーになる場合があります。
対処法: 「適用されたステップ」ペインで、各ステップの名前を確認し、必要に応じて名前を変更しましょう。また、ステップの順序を入れ替えたり、不要なステップを削除したりすることで、整形プロセスを最適化できます。ステップを右クリックして「削除」を選択すれば、そのステップ以降のすべてのステップも削除されます。
h3フィルター設定の曖昧さによる意図しないデータ除外
フィルター機能は便利ですが、設定が曖昧だと、本来残したいデータまで除外してしまう可能性があります。
原因: 例えば、「テキストフィルター」で「指定の値を含まない」を選んだ際に、除外したい値のスペルミスがあったり、大文字・小文字の区別を意識していなかったりすると、期待通りの結果になりません。また、「空」と「空白」の違いを混同してしまうこともあります。
対処法: フィルターを設定する前に、対象となる列のデータ形式と内容をよく確認しましょう。特に、大文字・小文字の区別、全角・半角、不要なスペース(空白)の有無などに注意が必要です。必要であれば、事前に「テキストの整形」機能(例:「トリミング」「大文字/小文字の変更」)を使ってデータを統一しておくと、フィルター設定が容易になります。
h3「列の保持」と「列の削除」の使い分け
列の操作には、「列の削除」と「列の保持」の2つの方法があります。
原因: 多くの列の中から、ごく一部の列だけを残したい場合に、「列の削除」を何度も繰り返すのは非効率です。逆に、少数の不要な列を削除したい場合に、「列の保持」で残したい列を一つずつ選択するのも手間がかかります。
対処法: 残したい列が少数であれば、「列の保持」機能(「ホーム」タブ → 「管理」グループ → 「列の保持」)で、残したい列を選択するのが効率的です。一方、削除したい列が少数で、残したい列が多い場合は、「列の削除」機能(「ホーム」タブ → 「管理」グループ → 「列の削除」)で、不要な列をまとめて削除するのが効率的です。状況に応じて最適な機能を選びましょう。
h3「上位/下位の行の保持」におけるソート順の重要性
データの上位または下位の行を保持する際、対象となる列でソート(並べ替え)が適切に行われていないと、意図しない行が保持されてしまうことがあります。
原因: 例えば、最新のデータを保持したいのに、日付列で正しくソートされていない場合、最新でないデータが保持されてしまう可能性があります。
対処法: 「上位/下位の行の保持」を実行する前に、保持したい行を定義する基準となる列(例:日付、ID、数値など)で、必ずデータをソート(昇順または降順)してください。「ホーム」タブの「並べ替え」機能を使用します。ソート後、「上位/下位の行の保持」を実行することで、意図した通りの行を抽出できます。
Power QueryとExcel標準機能の比較
ExcelにはPower Query以外にも、データ整形に利用できる機能がいくつかあります。それぞれの特徴を理解し、使い分けることが重要です。
| 項目 | Power Query | Excel標準機能(フィルター、並べ替え、Find/Replaceなど) |
|---|---|---|
| 操作の自動記録・再現性 | ◎(適用されたステップとして記録され、再実行可能) | ×(手作業の記録はできない) |
| データソースの多様性 | ◎(ファイル、データベース、Webなど多様なソースに対応) | △(主にExcelファイル内のデータに限定) |
| 複雑なデータ変換 | ◎(条件分岐、マージ、グループ化など高度な処理が可能) | △(単純なフィルターや置換が中心) |
| 処理速度 | ◎(大量データでも高速処理が可能) | △(データ量が多いと遅くなる傾向) |
| 学習コスト | △(GUI操作だが、概念理解にやや時間を要する) | ◎(直感的で習得しやすい) |
| データ更新 | ◎(元データ更新時に「すべて更新」で整形プロセスを再実行) | ×(手作業の再現が必要) |
| 不要な列・行の削除 | ◎(視覚的かつ柔軟に削除・保持できる) | △(手作業での選択・削除が必要) |
まとめ
Power Queryを使えば、Excelでの不要な列・行の削除やデータ整形作業を、効率的かつ自動化して実行できます。この記事で解説した列の削除、行の削除、フィルター機能などを活用することで、データの前処理にかかる時間を大幅に削減できるでしょう。
今後は、Power Queryの「データの変換」タブにある様々な機能(例:列の分割、テキストの結合、数値の書式設定など)を組み合わせて、さらに高度なデータ整形に挑戦してみてください。これにより、より精度の高いデータ分析が可能になります。
Power Queryを使いこなすことで、データに基づいた意思決定を迅速に行えるようになり、ビジネスにおける競争力を高めることができるはずです。
ADVERTISEMENT
超解決 Excel・Word研究班
企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。
Office・仕事術の人気記事ランキング
- 【Outlook】宛先が「オートコンプリート」に出ない・間違っている時の修正手順|履歴の削除と再構築
- 【Outlook】メールの受信が数分遅れる!リアルタイムで届かない時の同期設定と送受信グループ設定
- 【Word】差し込み印刷で数字の桁を整える!金額にカンマ(桁区切り)を入れる設定
- 【Excel】矢印キーで「セルが動かず画面がスクロールする」!ScrollLockの解除方法(ノートPC対応)
- 【Outlook】「メール送信を5分遅らせる」設定!誤送信を防ぐ最強のディレイ機能
- 【神技】保存せずに閉じたExcel・Wordファイルを復元する!消えたデータを復活させる4つの救出法
- 【Outlook】予定表の「祝日」が表示されない!最新カレンダーの追加と二重表示の修正手順
- 【Teams】会議の「参加者リスト」を出席後にダウンロードする!誰が参加したか確認する手順
- 【Teams】メッセージを「保存済み」にして後で読む!重要なチャットをブックマークして整理する技
- 【Excel】文字がセルの枠からはみ出す・隠れる!「折り返して表示」と「縮小して全体を表示」の使い分け
