ADVERTISEMENT

【Googleスプレッドシート】CORREL関数で相関係数を計算!2つの変数の関係を測る

【Googleスプレッドシート】CORREL関数で相関係数を計算!2つの変数の関係を測る
🛡️ 超解決

2つの変数の間に「片方が増えるともう片方も増える」のような関係があるかを数値で測る指標が相関係数です。気温とアイス売上、広告費と売上、勉強時間とテスト点数のように、2つの数値の動きをセットで分析するときに役立ちます。

Googleスプレッドシートには相関係数を一発で計算できるCORREL関数が用意されており、2つの範囲を渡すだけで-1から1までの数値が返されます。1に近いほど強い正の相関、-1に近いほど強い負の相関、0に近いほど無相関と判断できます。

本記事では、CORREL関数の基本構文、相関係数の読み取り方、散布図との併用、よくある誤読パターンまでをまとめて解説します。

【要点】CORREL関数で相関を測る3つのポイント

  • =CORREL(範囲1, 範囲2) で相関係数を計算: 2つの数値範囲を渡すと-1から1の値が返ります。範囲のサイズは一致が必須です。
  • 0.7以上で強い正の相関と判断: 一般的な目安として絶対値0.7以上で強い相関、0.4〜0.7で中程度、0.4未満で弱い相関と読みます。
  • 散布図と併せて視覚確認: 数値だけでなくグラフで分布を確認することで、外れ値や非線形関係を見逃さなくなります。

ADVERTISEMENT

相関係数の意味と読み取り方

相関係数は-1から1の範囲を取り、絶対値が大きいほど強い線形関係を示します。1は完全な正の比例関係、-1は完全な反比例関係、0は線形関係なしを意味します。実際のデータで±0.9を超えるような強い相関は珍しく、0.5〜0.7程度でも実務的には十分関係性があると判断されます。

相関係数の数値は2つの変数の単位に依存しません。気温が摂氏でも華氏でも、売上が円でもドルでも、相関係数の値は変わりません。この点が共分散との大きな違いで、異なる単位のデータ同士でも比較できる便利な指標です。

注意点として、相関は線形関係しか測れません。U字型や逆U字型のような非線形な関係は相関係数が0近くになることがあります。必ず散布図を併用して視覚的にも確認することが推奨されます。

CORREL関数で相関係数を計算する基本手順

  1. 2つの数値列を用意します
    例えばA列に気温、B列にアイス売上を並べます。各行が同じ日のデータになるよう揃えるのがポイントです。
  2. 結果を表示するセルに =CORREL(A2:A50, B2:B50) を入力します
    2つの範囲のサイズは必ず一致させます。違うサイズだと#N/Aエラーになります。
  3. 結果の数値を読み取ります
    0.85のような値なら強い正の相関、-0.6なら中程度の負の相関、0.1なら相関がほぼないと判断します。
  4. 散布図を作成して視覚確認します
    挿入→グラフ→散布図でデータをプロットします。点が直線状に並んでいれば相関係数の値が信頼できる目安になります。
  5. 有意性の判断はサンプル数に依存します
    サンプル数が少ない(10件以下)場合は偶然による相関の可能性が高いため、解釈は慎重に行ってください。

相関分析を業務に活かす具体手順

  1. マーケティング施策の効果測定
    広告費とコンバージョン数、SNS投稿数とサイト訪問数など、2つの指標の関係性を CORREL で数値化することで、施策評価の根拠が定量化されます。
  2. 複数指標の総当たり相関マトリクス
    5〜10個の指標について全ペアの相関を計算し、表形式で可視化することで、どの指標同士が連動しているかが一目で分かります。
  3. 条件付き書式で相関の強さを色分け
    カラースケールを使って強い相関を濃い赤、弱い相関を薄い青といった配色にすると、マトリクス全体の傾向が視覚的に把握できます。
  4. FORECAST関数と連携した予測
    強い相関がある2変数なら、FORECAST関数で線形回帰による予測値を出すこともでき、ビジネス計画立案に活用できます。

ADVERTISEMENT

CORREL関数でつまずきやすいパターン

結果が #DIV/0! エラーになる

どちらかの範囲の標準偏差が0(全部同じ値)の場合、相関係数の計算式の分母が0になりエラーになります。数値が変動しているかを確認してください。

「相関がある=因果関係がある」と誤解する

相関は2変数の連動を示すだけで、原因と結果の関係を意味しません。アイスと水難事故が両方夏に増えるのは「気温」という第3変数による疑似相関の典型例です。因果を主張するには別の検証が必要です。

外れ値で相関係数が大きく変わる

1点だけ極端な値があると、相関係数が大きく動いてしまいます。散布図で外れ値を視覚確認し、必要なら除外してから再計算するとより安定した値が得られます。

非線形関係を相関係数で見落とす

U字型のように放物線で関係する場合、CORRELは0近くを返すため「無相関」と誤判定してしまいます。散布図で形状を確認し、必要なら2乗値や対数を取って再計算する判断が必要です。

相関分析関連関数の使い分け比較

関数 用途 戻り値の範囲
CORREL(範囲1, 範囲2) ピアソンの相関係数 -1から1
PEARSON(範囲1, 範囲2) CORRELと同じ計算結果 -1から1
COVAR(範囲1, 範囲2) 母集団の共分散 単位依存(範囲は無制限)
RSQ(範囲1, 範囲2) 決定係数(相関係数の2乗) 0から1
SLOPE(yの範囲, xの範囲) 線形回帰の傾き 単位依存

まとめ

CORREL関数は2つの変数の線形関係の強さを-1から1の範囲で表す相関係数を計算する関数で、=CORREL(範囲1, 範囲2) で簡単に求められます。0.7以上で強い相関、0.4〜0.7で中程度、0.4未満で弱い相関というのが一般的な解釈の目安です。相関と因果は別物である点、外れ値や非線形関係に注意する点を意識しながら、必ず散布図と併用することで誤読を防げます。マーケティング施策の効果測定や指標同士の関連性確認など、データ分析の基本ツールとして活用してください。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。