Excelでデータの代表値を求めたい場面は多いでしょう。中央値や最頻値は、平均値では見えにくいデータの偏りを把握するのに役立ちます。しかし、これらの値を求める関数を正しく使えるか不安な方もいるかもしれません。この記事では、ExcelのMEDIAN関数とMODE関数を使って、中央値と最頻値を簡単に求める方法を解説します。
Excelの標準機能で中央値と最頻値を計算できるようになれば、データ分析の幅が広がります。ぜひ最後までご覧ください。
【要点】Excelで中央値と最頻値を求める方法
- MEDIAN関数: データの中央に位置する値を求め、データの中心的な傾向を把握します。
- MODE関数: データの中で最も頻繁に出現する値を求め、最も一般的な数値を特定します。
- 代表値の活用: 平均値と併用することで、データの分布や偏りをより正確に理解できます。
ADVERTISEMENT
MEDIAN関数とMODE関数の基本概念
Excelでデータの代表値を把握するために、MEDIAN関数とMODE関数は非常に有効です。これらの関数は、それぞれ異なる方法でデータの中心的な傾向を示します。MEDIAN関数はデータの「中央値」を、MODE関数は「最頻値」を算出します。平均値だけでは外れ値の影響を受けてしまう場合でも、中央値や最頻値を使うことで、より実態に近いデータの中心を捉えることが可能です。
それぞれの関数がどのような値を返すのか、その特性を理解することが重要です。これにより、目的に応じた適切な代表値を選択できるようになります。
中央値とは
中央値とは、データを小さい順または大きい順に並べたときに、ちょうど真ん中に位置する値のことです。データの個数が奇数の場合は、真ん中にくる1つの値が中央値となります。例えば、1, 3, 5, 7, 9というデータの場合、中央値は5です。
データの個数が偶数の場合は、真ん中にくる2つの値の平均値が中央値となります。例えば、1, 3, 5, 7というデータの場合、真ん中の3と5の平均値である4が中央値となります。中央値は、平均値と異なり、極端に大きい値や小さい値(外れ値)の影響を受けにくいという特徴があります。
最頻値とは
最頻値とは、データの中で最も多く出現する値のことです。例えば、1, 2, 2, 3, 4, 4, 4, 5というデータの場合、最も多く出現しているのは4なので、最頻値は4となります。最頻値は、データの中で最も一般的な値や、最もよく見られる傾向を示すのに役立ちます。
データによっては、最頻値が複数存在する場合もあります。また、すべての値が1回ずつしか出現しない場合は、最頻値は存在しないとみなされます。ExcelのMODE関数は、これらの状況に応じて異なる結果を返します。
MEDIAN関数を使った中央値の求め方
MEDIAN関数は、指定した範囲内にある数値データの中央値を返します。この関数を使うことで、データセットの中心的な値を簡単に算出できます。データの個数が奇数でも偶数でも、中央値を正しく計算してくれるため、非常に便利です。
MEDIAN関数は、数値以外のデータ(文字列や論理値、空白セル)は無視して計算します。この特性を理解しておくと、意図しない結果になることを防げます。
MEDIAN関数の基本的な使い方
MEDIAN関数の構文は「=MEDIAN(数値1, [数値2], …)」です。引数には、中央値を求めたい数値や、数値が含まれるセル範囲を指定します。複数の数値を直接入力したり、複数のセル範囲を指定することも可能です。
例えば、セルA1からA10にデータが入っている場合、セルB1に「=MEDIAN(A1:A10)」と入力すれば、A1からA10の範囲の中央値が計算されます。直接数値で指定する場合は、「=MEDIAN(10, 20, 30, 40, 50)」のように記述します。
MEDIAN関数の入力手順
- 中央値を表示したいセルを選択する
計算結果を表示させたいセルをクリックして選択します。 - 数式バーにMEDIAN関数を入力する
選択したセルに「=MEDIAN(」と入力します。 - 数値またはセル範囲を指定する
中央値を求めたい数値データが含まれるセル範囲をマウスでドラッグして選択するか、直接数値を入力します。複数の範囲を指定する場合は、カンマ(,)で区切ります。例:「A1:A10」や「A1:A10, C1:C5」 - 閉じ括弧を入力してEnterキーを押す
数式バーに「)」を入力し、Enterキーを押すと、中央値が計算されて表示されます。
MEDIAN関数でよくある注意点
MEDIAN関数は、引数に文字列や論理値が含まれている場合、それらを無視して計算します。これは意図しないデータまで計算に含めないために便利ですが、数値として扱いたい文字列(例:「100」のような文字列)は正しく計算されない可能性があります。このような場合は、事前にデータを数値に変換しておく必要があります。
また、引数にエラー値が含まれている場合、MEDIAN関数はエラー値を返します。エラー値が発生しているセルがある場合は、そのエラーの原因を特定し、修正してからMEDIAN関数を適用してください。例えば、セルに#DIV/0!などのエラーが表示されている場合、MEDIAN関数も同様のエラーを返すことがあります。
MODE関数を使った最頻値の求め方
MODE関数は、指定した範囲内にあるデータの中で最も頻繁に出現する値、すなわち最頻値を返します。この関数を使うことで、データセットの中で最も一般的な数値を特定できます。データ分析において、最もよく見られる値や傾向を把握するのに役立ちます。
Excelには、単一の最頻値を返すMODE.SNGL関数と、複数の最頻値を配列として返すMODE.MULT関数があります。一般的にはMODE.SNGL関数がよく使われますが、データに複数の最頻値が存在する可能性がある場合はMODE.MULT関数が適しています。
MODE.SNGL関数(単一最頻値)の使い方
MODE.SNGL関数は、データセットの中に1つだけ最頻値がある場合にその値を返します。構文は「=MODE.SNGL(数値1, [数値2], …)」です。MEDIAN関数と同様に、数値やセル範囲を指定します。
もしデータセットに最頻値が複数存在する場合、MODE.SNGL関数は最初に見つかった最頻値のみを返します。また、最頻値が存在しない場合は、#N/Aエラーを返します。この関数は、最も一般的な値が1つだけ存在すると予想される場合に便利です。
MODE.MULT関数(複数最頻値)の使い方
MODE.MULT関数は、データセットに複数の最頻値が存在する場合、それらすべてを配列として返します。この関数は配列数式として入力する必要があるため、少し注意が必要です。構文は「=MODE.MULT(数値1, [数値2], …)」です。
Excel 2019以降では、動的配列機能により、結果が自動的に隣接するセルに展開されます(スピル機能)。それ以前のバージョンでは、結果を表示したい範囲を事前に選択し、数式バーで「Ctrl + Shift + Enter」を押して確定する必要がありました。最頻値が1つしかない場合や存在しない場合は、#N/Aエラーを返します。
MODE関数(.SNGL/.MULT)の入力手順
- 最頻値を表示したいセルを選択する
計算結果を表示させたいセルをクリックして選択します。MODE.MULT関数を使用する場合は、結果を表示させる複数のセル範囲を事前に選択します。 - 数式バーにMODE関数を入力する
選択したセルに「=MODE.SNGL(」または「=MODE.MULT(」と入力します。 - 数値またはセル範囲を指定する
最頻値を求めたい数値データが含まれるセル範囲をマウスでドラッグして選択するか、直接数値を入力します。複数の範囲を指定する場合は、カンマ(,)で区切ります。例:「A1:A10」 - 閉じ括弧を入力してEnterキーを押す
数式バーに「)」を入力し、Enterキーを押します。Excel 2019以降でMODE.MULT関数を使用している場合、結果は自動的にスピルされます。それ以前のバージョンでMODE.MULT関数を使用する場合は、「Ctrl + Shift + Enter」で配列数式として確定してください。
MODE関数でよくある注意点
MODE関数は、引数に文字列や論理値が含まれている場合、それらを無視して計算します。これはMEDIAN関数と同様の挙動です。ただし、数値として認識されない文字列(例:「ABC」)だけでなく、数値として扱いたい文字列(例:「100」)も無視される点に注意が必要です。
また、データセットに最頻値が存在しない場合、MODE.SNGL関数とMODE.MULT関数はともに#N/Aエラーを返します。このエラーが表示された場合は、データの中に重複して出現する数値がないか確認してください。すべての値が1回ずつしか出現しない場合や、すべての値が同じ回数だけ出現する場合などが該当します。
ADVERTISEMENT
代表値の比較と使い分け
Excelで代表値を求める際に、平均値、中央値、最頻値はそれぞれ異なる側面からデータを表します。これらの代表値を理解し、適切に使い分けることで、より深いデータ分析が可能になります。
特に、データに外れ値が含まれている場合や、データの分布が偏っている場合には、平均値だけでは実態を正しく反映できないことがあります。そのような状況で、中央値や最頻値が有効な判断材料となります。
平均値・中央値・最頻値の比較表
| 項目 | 平均値 | 中央値 (MEDIAN) | 最頻値 (MODE) |
|---|---|---|---|
| 定義 | 全データの合計をデータの個数で割った値 | データを昇順または降順に並べたときの真ん中の値 | データの中で最も多く出現する値 |
| 計算方法 | SUM関数 / COUNT関数 など | MEDIAN関数 | MODE.SNGL関数, MODE.MULT関数 |
| 外れ値の影響 | 大きい | 小さい | 影響を受けない |
| 適したデータ | 正規分布に近いデータ、偏りの少ないデータ | 外れ値があるデータ、分布が偏っているデータ | 最も一般的な値を知りたい場合、カテゴリカルデータ(最頻値がない場合もある) |
| 複数存在するか | 常に1つ | 常に1つ | 複数存在する場合がある (MODE.MULT) |
どのような場合にどの代表値を使うか
平均値は、データ全体の合計や均等な配分を知りたい場合に適しています。ただし、極端に大きい値や小さい値(外れ値)があると、平均値が大きく引っ張られてしまうため、データの中心的な傾向を正確に表せなくなることがあります。
中央値は、外れ値の影響を受けにくいため、データの分布が歪んでいる場合や、極端な値が含まれている場合に、データの中心的な傾向を把握するのに適しています。例えば、所得分布のようなデータでは、中央値の方が平均値よりも実態に近い代表値となることが多いです。
最頻値は、データの中で最も頻繁に現れる値を知りたい場合に用います。例えば、アンケート調査で最も多かった回答や、製品のサイズで最も売れているサイズなどを知りたい場合に役立ちます。ただし、最頻値はデータセットによっては存在しない場合や、複数存在する場合があるため、その点に注意が必要です。
まとめ
この記事では、Excelで中央値を求めるMEDIAN関数と、最頻値を求めるMODE関数について解説しました。MEDIAN関数を使えばデータの中心値を、MODE関数を使えば最も一般的な値を簡単に算出できます。
これらの関数を平均値と併用することで、データの分布や偏りをより深く理解できるようになります。ぜひ、ご自身のデータ分析にこれらの関数を活用してみてください。
ADVERTISEMENT
超解決 Excel・Word研究班
企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。
Office・仕事術の人気記事ランキング
- 【Word】差し込み印刷で数字の桁を整える!金額にカンマ(桁区切り)を入れる設定
- 【Teams】メッセージを「保存済み」にして後で読む!重要なチャットをブックマークして整理する技
- 【Outlook】宛先が「オートコンプリート」に出ない・間違っている時の修正手順|履歴の削除と再構築
- 【Excel】矢印キーで「セルが動かず画面がスクロールする」!ScrollLockの解除方法(ノートPC対応)
- 【Outlook】メールの受信が数分遅れる!リアルタイムで届かない時の同期設定と送受信グループ設定
- 【Outlook】予定表の「祝日」が表示されない!最新カレンダーの追加と二重表示の修正手順
- 【Outlook】「メール送信を5分遅らせる」設定!誤送信を防ぐ最強のディレイ機能
- 【Word】校閲機能の基本!赤字(変更履歴)とコメントで修正を見える化する
- 【神技】保存せずに閉じたExcel・Wordファイルを復元する!消えたデータを復活させる4つの救出法
- 【Excel】文字がセルの枠からはみ出す・隠れる!「折り返して表示」と「縮小して全体を表示」の使い分け
