Excelで大量のデータを扱う際、その分布状況を把握したい場面は多いでしょう。
特に、データのばらつきや集中している範囲を知ることは、分析の第一歩となります。
この記事では、Excelのヒストグラム機能を使って、データの度数分布を視覚的に捉える方法を解説します。
複雑な設定は不要で、数クリックで分かりやすいグラフを作成できます。
【要点】Excelでヒストグラムを作成し度数分布を可視化する
- データの準備: 分析したい数値をExcelシートにまとめる。
- 分析ツールのアクティブ化: Excelの「データ分析」アドインを有効にする。
- ヒストグラムの作成: 「データ分析」から「ヒストグラム」を選択し、データ範囲と階級を設定する。
ADVERTISEMENT
目次
ヒストグラム作成の基本:度数分布とは
ヒストグラムは、データのばらつき具合、つまり度数分布を視覚的に表現するグラフです。
度数分布とは、ある範囲にデータがどれだけ含まれているかを示すものです。
例えば、テストの点数分布であれば、何点から何点の間に何人の生徒がいるかを表します。
ヒストグラムでは、横軸にデータの範囲(階級)を、縦軸にその範囲に含まれるデータの個数(度数)を取ります。
これにより、データがどのように分布しているか、どこに集中しているか、あるいは偏りがあるかなどを直感的に把握できます。
Excelでヒストグラムを作成することで、数値だけでは見えにくいデータの傾向を、グラフで簡単に理解できるようになります。
Excelでヒストグラムを作成する手順
Excelでヒストグラムを作成するには、まず「データ分析」ツールを有効にする必要があります。
このツールは標準では表示されていないため、アドインとして追加します。
その後、分析したいデータを用意し、ヒストグラム作成のダイアログボックスで設定を進めます。
1. データ分析ツールの有効化
「データ分析」ツールは、Excelのオプションから有効化します。
- Excelのオプションを開く
Excelのリボンメニューの「ファイル」タブをクリックし、左側のメニューから「オプション」を選択します。 - アドインの設定
Excelのオプション画面が表示されたら、左側のメニューから「アドイン」を選択します。 - 「分析ツール」を選択
画面下部にある「管理」のドロップダウンリストで「Excel アドイン」が選択されていることを確認し、「設定」ボタンをクリックします。 - 「分析ツール」にチェックを入れる
「アドイン」ダイアログボックスが表示されたら、「分析ツール」にチェックを入れて「OK」をクリックします。 - データタブの確認
Excelのメイン画面に戻り、リボンメニューの「データ」タブを確認します。「データ分析」というボタンが右端に追加されていれば完了です。
※Excel 2019・2021でも同様の手順で有効化できます。
2. 分析対象のデータ準備
ヒストグラムを作成したい数値をExcelシートの1列にまとめたデータを用意します。
例えば、あるクラスの生徒のテストの点数であれば、以下のように1列に並べます。
(例)
A1セル:点数
A2セル:85
A3セル:72
A4セル:91
…(以下、データが続く)
データには、項目名(例:「点数」)を1行目に入れておくと、後で分かりやすくなります。
3. 階級(ビンの設定)
ヒストグラムを作成する上で、データの範囲をどのように区切るか(階級)を定義する必要があります。
Excelでヒストグラムを作成する場合、この階級を自分で指定するのが一般的です。
例えば、点数が0点から100点まである場合、10点刻みで「0-9」「10-19」…「90-99」のように区切る方法があります。
この階級の区切り値を、Excelシートの別の列に作成しておきます。
階級の区切り値は、「上限値」で指定します。
例えば、10点刻みで「0~9」「10~19」…「90~99」としたい場合、区切り値は「9」「19」「29」…「99」と入力します。
(例)
C1セル:階級
C2セル:9
C3セル:19
C4セル:29
…(以下、上限値まで入力)
階級の数や幅は、データの性質や分析の目的に応じて調整します。
一般的に、階級が多すぎるとグラフがギザギザになり、少なすぎるとデータの分布が見えにくくなります。
目安としては、5~20個程度の階級に分けるのが良いとされています。
4. ヒストグラムの実行
データと階級の準備ができたら、いよいよヒストグラムを作成します。
- データ分析の起動
リボンメニューの「データ」タブにある「データ分析」ボタンをクリックします。 - ヒストグラムの選択
「データ分析」ダイアログボックスが表示されたら、一覧から「ヒストグラム」を選択し、「OK」をクリックします。 - 入力範囲の設定
「ヒストグラム」ダイアログボックスが表示されます。「入力範囲」に、分析したいデータが入力されているセル範囲を指定します。 - 階級範囲の設定
「階級範囲」に、先ほど作成した階級の上限値が入力されているセル範囲を指定します。 - 出力オプションの設定
「出力先」で、作成されるグラフと度数表の表示場所を指定します。「新規ワークシート」を選択すると、新しいシートに表示されます。 - グラフの出力
「グラフの出力を選択」にチェックを入れて「OK」をクリックします。
これで、指定した範囲のデータに対するヒストグラムと、各階級の度数表が作成されます。
ヒストグラム作成時の注意点とカスタマイズ
Excelでヒストグラムを作成する際には、いくつか注意しておきたい点や、グラフを見やすくするためのカスタマイズ方法があります。
特に、階級の設定やグラフの見た目は、分析結果の解釈に影響を与えることがあります。
階級の設定が不明確な場合
階級の区切り値が適切でないと、データの分布を正しく把握できないことがあります。
例えば、データが集中している範囲が、設定した階級の端に偏ってしまう場合などです。
このような場合は、階級の幅を狭めたり、階級の数を調整したりして、再度ヒストグラムを作成し直してみてください。
Excelの「データ分析」機能では、自動で階級を決定する機能はありません。
そのため、事前のデータ分析や、経験に基づいて適切な階級を設定することが重要です。
もし、自動で階級を決定したい場合は、「分析ツール」を使わずに、「挿入」タブから「グラフ」→「統計グラフ」→「ヒストグラム」を選択する方法もあります。
ただし、この機能はExcel 2016以降で利用可能であり、Excel 2019・2021でも利用できますが、Microsoft 365ではより機能が強化されています。
グラフの棒の間隔
Excelの「データ分析」機能で作成されたヒストグラムは、デフォルトでは棒と棒の間隔が狭く、隣接しています。
これは、ヒストグラムが連続的なデータを表すグラフであるためです。
しかし、棒の間隔を調整したい場合や、棒の幅を変更したい場合もあります。
グラフの棒を右クリックし、「データ系列の書式設定」を選択すると、棒の幅や間隔を調整できます。
「系列のオプション」にある「要素の間に 24pt のギャップ」という項目を調整することで、棒の間隔を変更できます。
この値を0に近づけると棒は結合し、大きくすると間隔が広がります。
度数表の「ビンの値」の意味
ヒストグラムを作成すると、グラフと共に度数表も出力されます。
この度数表の「ビンの値」という項目は、階級の「上限値」を示しています。
つまり、「ビンの値」が9であれば、その度数は0~9の範囲のデータの個数を表します。
「ビンの値」が19であれば、その度数は10~19の範囲のデータの個数を表します。
この「ビンの値」の表記を分かりやすくするために、度数表の列名を変更したり、階級の範囲を明記した列を追加したりすると、より親切な表示になります。
「度数」以外の出力オプション
「データ分析」のヒストグラム機能では、「グラフの出力」以外にもいくつかのオプションがあります。
「度数表」はデフォルトで出力されますが、これに加えて「累積百分率」と「パーセンテージ」を出力することも可能です。
「累積百分率」を選択すると、各階級までのデータの累積的な割合が表示されます。
「パーセンテージ」を選択すると、全データに対する各階級のデータの割合がパーセントで表示されます。
これらのオプションを活用することで、より詳細なデータ分析が可能になります。
ADVERTISEMENT
ヒストグラムと他のグラフの比較
Excelには、度数分布を可視化するためのグラフが他にも存在します。ヒストグラムの特徴を理解するために、他のグラフと比較してみましょう。
| 項目 | ヒストグラム | 棒グラフ | 折れ線グラフ |
|---|---|---|---|
| 目的 | データの度数分布(ばらつき)の把握 | カテゴリごとの値の比較 | 時系列データや連続的な変化の傾向把握 |
| 横軸 | 階級(数値の範囲) | カテゴリ名(離散的) | 時間や順序(連続的または離散的) |
| 縦軸 | 度数(個数や頻度) | 値 | 値 |
| データの性質 | 連続的または離散的な数値データ | カテゴリデータ、離散的な数値データ | 連続的または離散的な数値データ |
| Excelでの作成方法 | データ分析ツール、または統計グラフ | 挿入タブから選択 | 挿入タブから選択 |
ヒストグラムは、まさに「度数分布」を可視化することに特化したグラフです。
棒グラフは、個別のカテゴリの値の大きさを比較するのに適していますが、データのばらつきを見るのには向きません。
折れ線グラフは、時間経過などによる値の変化を追うのに便利ですが、これも度数分布を直接示すものではありません。
したがって、データのばらつきや集中の度合いを把握したい場合は、ヒストグラムが最も適したグラフと言えます。
まとめ
この記事では、Excelでヒストグラムを作成し、データの度数分布を可視化する方法を解説しました。
「データ分析」アドインの有効化から、階級の設定、そしてヒストグラムの作成手順までを順を追って説明しました。
作成したヒストグラムは、データの傾向を掴む上で非常に役立ちます。
今後は、このヒストグラムを基に、さらに詳細な分析や、他のグラフとの組み合わせを試してみてください。
例えば、Excel 2016以降で利用できる、より直感的な「ヒストグラム」グラフ機能も活用してみると良いでしょう。
ADVERTISEMENT
超解決 Excel・Word研究班
企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。
Office・仕事術の人気記事ランキング
- 【Outlook】宛先が「オートコンプリート」に出ない・間違っている時の修正手順|履歴の削除と再構築
- 【Outlook】メールの受信が数分遅れる!リアルタイムで届かない時の同期設定と送受信グループ設定
- 【Word】差し込み印刷で数字の桁を整える!金額にカンマ(桁区切り)を入れる設定
- 【Excel】矢印キーで「セルが動かず画面がスクロールする」!ScrollLockの解除方法(ノートPC対応)
- 【Outlook】「メール送信を5分遅らせる」設定!誤送信を防ぐ最強のディレイ機能
- 【神技】保存せずに閉じたExcel・Wordファイルを復元する!消えたデータを復活させる4つの救出法
- 【Outlook】予定表の「祝日」が表示されない!最新カレンダーの追加と二重表示の修正手順
- 【Teams】会議の「参加者リスト」を出席後にダウンロードする!誰が参加したか確認する手順
- 【Teams】メッセージを「保存済み」にして後で読む!重要なチャットをブックマークして整理する技
- 【Excel】文字がセルの枠からはみ出す・隠れる!「折り返して表示」と「縮小して全体を表示」の使い分け
