ADVERTISEMENT

【Googleスプレッドシート】VAR関数で分散を計算!STDEVとの関係性

【Googleスプレッドシート】VAR関数で分散を計算!STDEVとの関係性
🛡️ 超解決

標準偏差ほど直感的ではありませんが、データのばらつきを表す統計量として「分散」も重要な役割を果たします。分散は標準偏差を2乗した値で、複数のデータセットを比較するときや回帰分析の中間計算などで使われます。

Googleスプレッドシートには分散を求めるVAR関数が用意されており、サンプル分散と母集団分散の2種類があります。STDEV関数と並列に使い分けるため、考え方は標準偏差と同じです。

本記事では、VAR関数の基本構文、サンプル分散と母集団分散の違い、STDEVとの関係、分散と標準偏差の使い分けまでをまとめて解説します。

【要点】VAR関数で分散を求める3つのポイント

  • =VAR(範囲) でサンプル分散を計算: 標本データに対する分散です。STDEVを2乗した値と一致します。
  • =VARP(範囲) で母集団分散を計算: 範囲が母集団全体のとき使い、STDEVPを2乗した値と一致します。
  • =SQRT(VAR(範囲)) で標準偏差に変換: 平方根を取れば標準偏差になり、必要に応じて指標を切り替えられます。

ADVERTISEMENT

分散と標準偏差の関係性

分散は各データの平均からの差を2乗して平均した値です。元データの単位を2乗するため、点数の分散なら「点^2」のような扱いづらい単位になります。これを平方根で戻したのが標準偏差で、元データと同じ単位で扱えるため実務報告では標準偏差の方が好まれます。

数式で書くと VAR = AVERAGE((x – AVERAGE(x))^2)、STDEV = SQRT(VAR) という関係です。意味は同じばらつき指標ですが、数学的な計算では2乗する前の状態が扱いやすいため、回帰分析・分散分析・F検定などで分散がそのまま使われます。

サンプル分散と母集団分散の違いは標準偏差と同じで、分母がn-1かnかの差です。サンプル分散は不偏分散とも呼ばれ、母集団の分散を統計学的に推定する用途で使われます。

VAR関数で分散を計算する基本手順

  1. 結果を表示するセルを選びます
    例えばA2:A50の数値範囲に対し、B1のような空きセルを使います。範囲のすぐ近くに置くと結果との対応が確認しやすくなります。
  2. =VAR(A2:A50) を入力します
    サンプル分散が瞬時に表示されます。範囲内の文字列や空白は計算から除外されます。
  3. STDEVと一致するか確認します
    =SQRT(VAR(A2:A50)) と =STDEV(A2:A50) が同じ値になることを確認すれば、関数の挙動が理解できます。
  4. 母集団全体ならVARPに切替えます
    調査対象がそのまま母集団なら =VARP(A2:A50) を使います。サンプル抽出データなら VAR のままが正しい選択です。
  5. 分析シートに分散と標準偏差を並列表示します
    =VAR(A2:A50) と =STDEV(A2:A50) を上下に並べると、用途別に参照しやすい分析シートになります。

分散を活用した分析手順

  1. F検定で2集団のばらつきを比較する
    2つのグループの分散比をF分布で評価することで、母集団のばらつきが等しいかどうかを統計的に判断できます。研究・品質管理での標準手法です。
  2. 分散分析で要因の影響を調べる
    群間分散と群内分散の比から、ある要因がデータのばらつきに有意な影響を与えるかを検証できます。マーケティング施策の効果測定にも応用されます。
  3. 共分散と相関係数の中間計算
    共分散はCOVAR関数で計算でき、これを各変数の標準偏差で割ると相関係数になります。COVARの計算過程で分散の概念が活躍します。
  4. 変動係数の計算
    =SQRT(VAR(範囲))/AVERAGE(範囲) で変動係数を出すと、平均値が大きく異なるデータ同士のばらつき度合いを比較できます。

ADVERTISEMENT

VAR関数でつまずきやすいパターン

結果が大きすぎて読みにくい

分散は元データを2乗するため、平均が大きいデータでは結果も非常に大きくなります。実務報告では平方根を取った標準偏差を使うか、対数表示などで桁を整理すると読み取りやすくなります。

VARとVARPで結果が違って混乱する

サンプル版VARの方が母集団版VARPより少し大きな値になります。サンプルから母集団を推定する際の補正のため、データ件数が少ないほど差が顕著です。レポートでは使った関数を明記すると読者に親切です。

STDEVと2乗が一致しない

サンプル版同士・母集団版同士なら必ず一致します。STDEV(範囲)とVARP(範囲)のように混在で2乗比較すると一致しません。比較は同じ系列(STDEV-VARまたはSTDEVP-VARP)で行ってください。

論理値や文字列を含めたい

VARとVARPはTRUE・FALSEや文字列を無視しますが、これらも含めて計算したい場合は VARA・VARPA を使います。アンケートデータでTRUEを1、FALSEを0として扱う場合に便利な関数です。

分散関連関数の使い分け比較

関数 用途 関係性
VAR または VAR.S サンプル分散 STDEV ^ 2 と等しい
VARP または VAR.P 母集団分散 STDEVP ^ 2 と等しい
VARA 論理値・文字列も含めたサンプル分散 STDEVA ^ 2 と等しい
VARPA 論理値・文字列も含めた母集団分散 STDEVPA ^ 2 と等しい
COVAR 2変数間の共分散 相関係数の計算に使用

まとめ

VAR関数はデータのばらつきを2乗の単位で表す統計量で、=VAR(範囲) でサンプル分散、=VARP(範囲) で母集団分散を求められます。標準偏差STDEVと密接な関係があり、SQRTを取ることで相互変換できます。実務報告では単位がそのままの標準偏差が好まれますが、F検定や分散分析など統計的な計算では分散が直接使われます。VAR.SとVAR.Pは現代的な書き方として推奨されますが、互換性のあるVARとVARPも引き続き有効です。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。