【Googleスプレッドシート】データ→列の統計情報で平均・中央値を瞬時に確認!分布の把握

【Googleスプレッドシート】データ→列の統計情報で平均・中央値を瞬時に確認!分布の把握
🛡️ 超解決

データの平均値や中央値を確認したいとき、関数を書いたりピボットテーブルを作成するのは手間がかかります。Googleスプレッドシートには「列の統計情報」という便利な機能があり、選択範囲の基本統計量を一発で計算してくれます。この記事では、この機能を使って平均や中央値を瞬時に確認し、データの分布を把握する方法を詳しく解説します。

【要点】列の統計情報で平均・中央値を瞬時に確認する方法

  • データメニュー→列の統計情報: 選択した範囲の数値データに対して、平均・中央値・最大値・最小値などの統計量を自動計算し、度数分布グラフも表示します。
  • 平均と中央値の比較: データの中心傾向を2つの指標で確認でき、分布の歪みを直感的に把握できます。
  • 分布グラフの活用: ヒストグラム形式のグラフでデータのばらつきや外れ値を視覚的に捉えられます。

ADVERTISEMENT

列の統計情報が計算できる統計量とは

「列の統計情報」は、選択したセル範囲の数値データに対して、以下の統計量を瞬時に算出します。平均値(AVERAGE)、中央値(MEDIAN)、最大値(MAX)、最小値(MIN)、範囲(最大値-最小値)、標準偏差(STDEV)、分散、四分位範囲、データ数、欠損値の数などです。これらの値は関数を使わずに直ちに表示されるため、データの概要を素早く把握するのに最適です。また、度数分布表とヒストグラムも同時に生成されるため、データの分布形状を一目で確認できます。

列の統計情報を使う手順

  1. 統計を取得したいデータ範囲を選択する
    シート上で、数値が入力されている列(複数列でも可)をマウスでドラッグして選択します。見出し行を含めても問題ありませんが、数値以外のセルがある場合は自動的に無視されます。
  2. 「データ」メニューから「列の統計情報」をクリックする
    画面上部のメニューバーで「データ」を開き、表示されたメニューの中から「列の統計情報」を選択します。ショートカットキーは用意されていません。
  3. 右側に表示されるサイドバーで結果を確認する
    シートの右側にサイドバーが開き、選択した列ごとに統計量がリスト表示されます。平均値や中央値は太字で強調され、その下に度数分布表とグラフが配置されます。
  4. 必要に応じてグラフや統計値をシートに貼り付ける
    サイドバーの下部にある「グラフを挿入」ボタンをクリックすると、現在のシートにヒストグラムが貼り付けられます。統計値はコピーして別の場所に貼り付けられます。

選択範囲に複数列が含まれている場合、サイドバー内で列ごとにタブが分かれて表示されます。各タブを切り替えることで、それぞれの列の統計情報を個別に確認できます。

平均と中央値を正しく読み取るポイント

平均値はすべてのデータを合計して個数で割った値で、外れ値の影響を受けやすい性質があります。一方、中央値はデータを小さい順に並べたときの真ん中の値で、外れ値の影響を受けにくいです。この2つを比較することで、データ分布の歪みを把握できます。例えば、平均値が中央値より大きい場合は右に裾が長い分布、平均値が中央値より小さい場合は左に裾が長い分布と判断できます。列の統計情報では両方が同時に表示されるため、この比較が瞬時に行えます。

ADVERTISEMENT

分布グラフの見方と活用方法

サイドバーに表示されるグラフは、度数分布を表すヒストグラムです。横軸にデータの区間(ビン)、縦軸にその区間に含まれるデータの個数が表示されます。グラフの形状から、データの集中傾向やばらつき、外れ値の有無を確認できます。例えば、グラフが左右対称なら正規分布に近く、特定の値に山が一つある場合は単峰性、複数の山がある場合は多峰性と判断できます。グラフの上部にある「ビンサイズ」を調整すると、区間の幅を変更して分布を詳細に調べられます。

注意点:正しく統計情報を得るための条件

数値データのみが計算対象になる

選択範囲に文字列や日付が含まれている場合、それらのセルは自動的に計算から除外されます。ただし、数値として扱える日付(シリアル値)は計算対象になります。意図しない値が混入していないか、事前にデータの型を確認してください。

空白セルは無視される

空白セルは計算対象から除外されます。平均値は空白を除いたデータ数で計算されるため、空白が多いと実際の分布を反映しない可能性があります。必要に応じて、空白セルに0を入力するか、データの範囲を適切に設定してください。

複数列を選択するときの注意

複数列を選択した場合、各列は独立して統計処理されます。列間の関係(相関など)は計算されません。列間の比較を行いたい場合は、別途関数やツールを使用する必要があります。

グラフのカスタマイズには限界がある

サイドバー内でビンサイズは変更できますが、グラフの色やラベルなどの書式設定は直接変更できません。詳細なカスタマイズが必要な場合は、一度「グラフを挿入」でシート上にグラフを貼り付けた後、グラフエディタで調整してください。

「列の統計情報」と手動関数の比較

項目 列の統計情報 手動関数
平均値の取得 自動表示されるため数秒で確認可能 =AVERAGE(範囲) を記述する必要がある
中央値の取得 自動表示される =MEDIAN(範囲) を記述する必要がある
分布グラフの作成 ボタン一つでヒストグラムを挿入できる QUERYやCOUNTIFで度数分布表を作り、グラフ化する必要がある
複数列の同時処理 タブ切替で各列の統計を個別に確認 列ごとに関数を書く必要がある
データの更新への対応 手動で再実行が必要(自動更新なし) 関数の参照範囲にデータを追加すれば自動更新される
カスタマイズ性 統計量の種類は固定、グラフの書式変更は限定的 自由に関数やグラフを組み合わせて柔軟にカスタマイズできる

まとめ

「列の統計情報」を使えば、平均値や中央値をはじめとする基本統計量を関数を書かずに瞬時に取得できます。分布グラフも同時に表示されるため、データの特徴を直感的に把握できるようになります。この機能は、データの簡易チェックやレポート作成の初期段階で特に役立ちます。より詳細な分析が必要な場合は、AVERAGEやMEDIANなどの関数を組み合わせてみてください。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。