データを分析していると、平均値だけでは見えないばらつきを把握したい場面があります。例えば、売上データの月ごとの変動や試験結果の得点分布を評価する際、数値の散らばり具合を知ることが重要です。Googleスプレッドシートには、このようなデータのばらつきを計測するためのSTDEV関数とVAR関数が用意されています。この記事では、これらの関数の基本的な使い方から、実際のデータで応用する方法までをわかりやすく解説します。
【要点】STDEV/VAR関数でデータのばらつきを正確に把握する方法
- STDEV関数: 標本標準偏差を計算します。データが母集団の一部である場合に使用します。
- VAR関数: 標本分散を計算します。標準偏差の前段階として、ばらつきの大きさを平方和で評価したいときに使います。
- 引数指定のコツ: 範囲や個別セルを指定し、数値のみを抽出することで正確な計算ができます。
ADVERTISEMENT
目次
STDEVとVARの概要と使い分け
STDEV関数は、与えられたデータセットの標準偏差を計算します。標準偏差は、データの散らばりを元の数値と同じ単位で表すため、直感的に理解しやすいという特徴があります。一方、VAR関数は分散を計算します。分散は偏差の二乗平均であり、データのばらつきを二乗単位で表します。両者の関係は「標準偏差=分散の平方根」です。Googleスプレッドシートでは、標本データ用のSTDEVとVAR、そして母集団用のSTDEVPとVARPが用意されています。標本データ(サンプル)から母集団を推定する場合はSTDEVとVARを、データ全体が母集団そのものの場合はSTDEVPとVARPを使い分けます。
STDEV関数とVAR関数の基本的な使い方
ここでは、実際のデータを使ってSTDEVとVARを計算する手順を説明します。例として、A1:A10に10個の数値データが入力されている状況を想定します。
STDEV関数で標準偏差を計算する
- 結果を表示するセルを選択する
標準偏差の結果を表示したいセル(例:B1)をクリックします。 - 関数を入力する
「=STDEV(」と入力します。入力中に関数の候補が表示されますので、Tabキーで選択すると便利です。 - データ範囲を指定する
計算したい数値が含まれるセル範囲(例:A1:A10)をドラッグで選択するか、手入力します。閉じ括弧を入力してEnterキーを押します。 - 結果を確認する
セルに標準偏差の値が表示されます。例えば=STDEV(A1:A10)と入力すると、指定範囲の標本標準偏差が計算されます。
VAR関数で分散を計算する
VAR関数の使い方もSTDEVと同様です。手順の「=STDEV」を「=VAR」に置き換えるだけで、分散が計算できます。例:=VAR(A1:A10) と入力すると標本分散が得られます。分散は標準偏差の二乗になるため、数値が大きくなる傾向があります。
実践的な応用例と引数のバリエーション
STDEVとVARは単一の範囲だけでなく、複数の範囲や個別のセルを引数として指定することも可能です。また、条件に合ったデータのみを対象にする場合は、STDEVやVARとIF関数を組み合わせます。
複数の範囲や個別セルを指定する
例えば、データがA1:A5とC1:C5に分かれている場合、「=STDEV(A1:A5, C1:C5)」のようにカンマで区切って複数の範囲を指定します。個別のセルを指定する場合は「=STDEV(A1, A3, A5)」のようにします。これらの引数は最大30個まで指定できます。
条件付きでばらつきを計算する
特定の条件を満たすデータだけの標準偏差を求めたい場合は、ARRAYFORMULAとIFを組み合わせる方法があります。例えば、B列が「東京」の場合のA列のデータの標準偏差は「=STDEV(IF(B1:B10=”東京”, A1:A10))」と入力し、Ctrl+Shift+Enterで配列数式として確定します(スプレッドシートでは自動的にARRAYFORMULAが適用されます)。
ADVERTISEMENT
使用時の注意点とよくあるエラー
STDEV関数やVAR関数を使う際、いくつかの注意点があります。特にデータの種類や空白セルの扱いに気をつける必要があります。
数値以外のデータが含まれている場合
引数に文字列や論理値が含まれていると、それらは無視されます。ただし、エラー値が含まれていると関数自体がエラーになります。そのため、事前にデータをクリーニングしておくことが大切です。エラー値がある場合はIFERRORなどで処理します。
空白セルの扱い
空白セルは自動的に無視されます。ただし、0が入力されているセルは数値として計算に含まれます。データの欠損を0とみなしてよいかどうかは注意が必要です。
標本と母集団の選択を間違えない
データが母集団の一部(サンプル)であればSTDEVまたはVARを、データ全体が母集団そのものであればSTDEVPまたはVARPを使用します。間違えると結果が異なるため、分析の目的に応じて使い分けてください。
STDEV/VARとSTDEVP/VARPの違い
標本用の関数と母集団用の関数では、計算式の分母が異なります。標本標準偏差ではn-1で割り、母標準偏差ではnで割ります。以下に違いをまとめました。
| 関数 | 計算内容 | 分母 | 使用シーン |
|---|---|---|---|
| STDEV | 標本標準偏差 | n-1 | サンプルデータから母集団を推定する場合 |
| STDEVP | 母標準偏差 | n | データ全体が母集団の場合 |
| VAR | 標本分散 | n-1 | サンプルデータから母集団の分散を推定する場合 |
| VARP | 母分散 | n | データ全体が母集団の場合 |
このように、関数によって分母が異なります。データが母集団の一部であるか全体であるかを判断して正しい関数を選びましょう。
まとめ
この記事では、GoogleスプレッドシートのSTDEV関数とVAR関数を使ってデータのばらつきを計測する方法を解説しました。標準偏差と分散を計算することで、平均値だけではわからないデータの特徴を把握できるようになります。次は、これらの結果をグラフに可視化したり、QUERY関数と組み合わせてグループごとのばらつきを比較したりしてみてください。また、STDEVPやVARPとの使い分けを意識すると、より正確な分析が可能になります。
ADVERTISEMENT
超解決 第一編集部
疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。
Googleスプレッドシートの人気記事ランキング
- 【Googleスプレッドシート】GOOGLEFINANCE関数で株価・為替を取得!リアルタイムデータの呼び出し
- 【Googleスプレッドシート】印刷範囲を指定して印刷!特定範囲だけPDFや紙に出す手順
- 【Googleスプレッドシート】新しいスプレッドシートを作成する3つの方法!ドライブ・URL・テンプレート
- 【Googleスプレッドシート】数値の連続データを自動入力!オートフィルの活用
- 【Googleスプレッドシート】ダークモードを有効にする!目に優しい配色への切替
- 【Googleスプレッドシート】株価APIで株式データを自動取得!GOOGLEFINANCE超え活用
- 【Googleスプレッドシート】共有相手が編集できない時のチェック!権限と許可状態の確認
- 【Googleスプレッドシート】ページ設定で用紙サイズと向きを調整!印刷レイアウトの基本
- 【Googleスプレッドシート】Excelファイルxlsxをインポートする手順!ドラッグ&ドロップで取り込み
- 【Googleスプレッドシート】条件付き書式をコピーする!書式のみペーストの活用
