ADVERTISEMENT

【Googleスプレッドシート】データ→列の統計情報のヒストグラム表示の活用!分布把握の基本

【Googleスプレッドシート】データ→列の統計情報のヒストグラム表示の活用!分布把握の基本
🛡️ 超解決

データを受け取ったとき、まず「全体の分布はどうなっているか」を把握することが分析の第一歩です。Googleスプレッドシートには「データ→列の統計情報」という機能があり、選択した列の分布や統計指標を瞬時に確認できます。

この機能の中でもヒストグラム表示は特に強力で、数値の偏りや外れ値を視覚的に確認できます。グラフを別途作る手間なしに、数値列をクリックするだけで分布の全体像が把握できる便利機能です。

本記事では、列の統計情報の開き方、ヒストグラムの読み取り方、活用シーン別の使い方、注意点までをまとめて解説します。

【要点】列の統計情報を活用する3つのポイント

  • 列ヘッダー右クリック→「列の統計情報を表示」: サイドパネルにヒストグラムと基本統計量が表示されます。
  • 件数・合計・平均・中央値・最頻値・最小・最大が一画面で確認: データ概要を瞬時に把握できる集約ビューです。
  • 外れ値や歪みをヒストグラムで視覚化: 数値で気付かない偏りも、グラフで一目瞭然になります。

ADVERTISEMENT

列の統計情報機能の概要

「データ→列の統計情報」は、選択した列のデータを多角的に分析する組み込み機能です。数値列ならヒストグラム、テキスト列なら出現回数のランキング、日付列なら時系列分布が表示されます。

表示される統計指標は、件数・空白セル数・ユニークな値の個数・合計・平均・中央値・最頻値・最小値・最大値の9種類です。これだけ揃えばデータの初期把握としては十分で、追加の関数なしでデータの「健康診断」ができます。

ヒストグラムは標準で20階級程度に自動分割されます。階級幅の指定はできませんが、選択範囲を変えると自動で再計算されるため、データの一部を切り出して分布を確認することも可能です。

列の統計情報を開く基本手順

  1. 分析したい列のヘッダーをクリックします
    列全体を選択した状態で、ヘッダー(A・B・Cなどのアルファベット)を右クリックします。
  2. 「列の統計情報を表示」を選択します
    右クリックメニューから該当項目を選ぶと、画面右にサイドパネルが開きます。メニューバーから「データ→列の統計情報」でも同じパネルを開けます。
  3. サイドパネルでヒストグラムを確認します
    数値データならヒストグラムがグラフ表示され、横軸が値の範囲、縦軸が件数になります。山型・両端集中・単調増加など、データの形が一目で分かります。
  4. 下にスクロールして基本統計量を確認します
    件数・合計・平均・中央値などの数値指標が並びます。複数指標を組み合わせて読むと、データの性質がより正確に把握できます。
  5. 左右のナビゲーションで隣の列に移動
    パネル上部の左右ボタンで、隣接する列の統計情報に切り替えられます。複数列を順次確認するのに便利です。

列の統計情報を業務に活かす手順

  1. 受領データの初期診断
    クライアントから受け取ったCSVを取り込んだ直後に各列の統計情報を確認することで、欠損値や型エラーを早期発見できます。
  2. 外れ値の検出
    ヒストグラムで端に1〜2点だけ突出した値があれば外れ値の候補です。元データを確認し、入力ミスか異常値かを判断できます。
  3. 歪んだ分布の発見
    正規分布(山型)を期待していたのに左寄せ・右寄せの分布になっている場合、データに偏りがある可能性があります。サンプリング方法の見直しが必要です。
  4. カテゴリの偏り把握
    テキスト列で出現回数を見ることで、特定カテゴリが極端に多い・少ないという偏りが分かります。マーケティングの仮説検証に活用できます。

ADVERTISEMENT

列の統計情報でつまずきやすいパターン

ヒストグラムが表示されない

列の値が文字列扱いになっているとヒストグラムが出ません。ASC関数で全角を半角に統一したり、VALUE関数で数値型に変換してから再度開くと表示されます。

統計値がおかしい

列内に文字列と数値が混在していると、文字列セルが無視されて件数と合計値の整合が取れません。データの型を一致させてから統計値を読むのが正しい使い方です。

階級幅をカスタマイズしたい

列の統計情報のヒストグラムは階級幅を変更できません。詳細な分析には別途グラフ機能で「ヒストグラム」を選び、バケットサイズを手動指定する方法に切り替えてください。

列全体の選択ではなく一部範囲を見たい

列ヘッダーではなく、特定範囲(A2:A100など)を選択した状態で右クリックすると、その範囲だけの統計情報が表示されます。期間限定や条件付きの分布把握に便利な使い方です。

分布把握の機能比較

方法 手軽さ カスタマイズ性
列の統計情報 非常に手軽 低(階級幅固定)
挿入→グラフ→ヒストグラム 中程度 高(階級幅指定可)
QUARTILE関数 関数知識必要 低(数値出力のみ)
FREQUENCY関数 関数知識必要 高(階級を任意指定)
ピボットテーブル 中程度 中(グループ化で擬似ヒストグラム)

まとめ

「データ→列の統計情報」のヒストグラム表示は、関数やグラフ作成の手間をかけずに分布を把握できる強力な機能です。列ヘッダーを右クリックして開くだけで、ヒストグラムと基本統計量が一画面に表示され、外れ値や偏りを瞬時に発見できます。受領データの初期診断やマーケティング分析の起点として、まず最初に開く習慣を付けると分析品質が上がります。階級幅をカスタマイズしたい本格的なヒストグラムには、挿入→グラフ→ヒストグラムを使い分けてください。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。