ADVERTISEMENT

【Googleスプレッドシート】データの相関係数!CORREL関数の使い方

【Googleスプレッドシート】データの相関係数!CORREL関数の使い方
🛡️ 超解決

データの関係性を数値で知りたい場面は多いです。例えば売上と広告費の関連性を調べたいときなどです。GoogleスプレッドシートにはCORREL関数という便利な関数が用意されています。この記事ではCORREL関数の基本的な使い方から注意点までを丁寧に解説します。これを読めばすぐに相関係数を計算できるようになります。

【要点】CORREL関数でデータの相関を簡単に分析する方法

  • =CORREL(配列1, 配列2): 2つのデータ範囲の相関係数を返します。数値データのみ有効で、配列のサイズは同一である必要があります。
  • データ準備のコツ: 欠損値や文字列が含まれているとエラーになるため、事前にクリーニングします。
  • 結果の解釈: 戻り値は-1から1の範囲で、1に近いほど強い正の相関、-1に近いほど強い負の相関を示します。

ADVERTISEMENT

CORREL関数の概要とできること

CORREL関数は、2つのデータセット間の相関係数を計算する関数です。相関係数とは、2つの変数がどの程度直線的な関係にあるかを表す指標で、-1から1の値を取ります。値が1に近いほど正の相関が強く、-1に近いほど負の相関が強いことを意味します。0に近い場合は相関がほとんどないことを示します。

CORREL関数の構文は次のとおりです。

=CORREL(配列1, 配列2)

引数は「配列1」と「配列2」の2つで、どちらも必須です。それぞれ数値データが入力されたセル範囲を指定します。文字列や論理値が含まれている場合は無視されますが、空白セルは無視されるため注意が必要です。配列1と配列2のデータ数が異なる場合はエラーになります。

例えば、A2:A10に気温のデータ、B2:B10にアイスクリームの売上データが入力されている場合、次の式で相関係数を求められます。

=CORREL(A2:A10, B2:B10)

この関数は、データの傾向を把握するための第一歩としてよく使われます。マーケティングや品質管理など、さまざまな分野で活用できます。

CORREL関数の基本的な使い方

ここでは、実際のデータを使ってCORREL関数を使う手順を説明します。例として、ある店舗の広告費と売上のデータを用います。以下の手順に従ってください。

  1. データを用意する
    シートのA列に広告費、B列に売上の数値を入力します。行は2行目から11行目までとします。データはすべて数値で、欠損値がない状態にしてください。
  2. 結果を表示するセルを選択する
    相関係数を表示したいセルをクリックします。例としてC1セルを選びます。
  3. 関数を入力する
    C1セルに「=CORREL(」と入力します。すると関数の候補が表示されるので、Tabキーで選択するかそのまま続けます。
  4. 配列1の範囲を指定する
    マウスでA2:A11の範囲をドラッグするか、手入力で「A2:A11」と入力します。
  5. カンマで区切る
    配列1の後にカンマ「,」を入力します。
  6. 配列2の範囲を指定する
    同様にB2:B11の範囲を指定します。
  7. 閉じ括弧で確定する
    「)」を入力してEnterキーを押します。C1セルに相関係数が表示されます。例えば0.85という値が出れば、強い正の相関があると解釈できます。

このように、わずか数ステップで相関係数を求められます。実際に数値を変えて試してみると、結果がどう変わるか確認できます。

CORREL関数を使う際の注意点

データ数が異なる場合

配列1と配列2の要素数が異なると、CORREL関数はエラー値「#N/A」を返します。必ず両方の範囲の行数または列数をそろえてください。ただし、範囲内に空白セルがあっても要素数としてカウントされます。空白セルは無視されるため、空白があると実質的なデータ数が減ります。その結果、意図しないデータ数違いになることがあります。空白セルは事前に削除するか、データがない行は範囲から除外しましょう。

文字列や論理値が含まれる場合

CORREL関数は、範囲内の文字列や論理値(TRUE/FALSE)を自動的に無視します。しかし、無視されたセルの分だけデータ数が減るため、結果的に他方のデータ数と合わなくなる可能性があります。また、数値として入力された文字列(例:「’100」)は文字列として扱われるため無視されます。数値として認識させたい場合は、VALUE関数などで変換してください。

外れ値の影響

相関係数は外れ値(極端な値)に非常に敏感です。1つの外れ値が結果を大きく歪めることがあります。例えば、ほとんどのデータが正の相関を示していても、1つだけ異常に大きな値があると相関係数が低くなることがあります。データを可視化して外れ値を確認し、必要に応じて除外するか、別の統計手法を検討してください。

非線形な関係には対応できない

CORREL関数は直線的な関係しか測定できません。データが曲線的な関係を持つ場合、相関係数は0に近くなり、実際には強い関係があっても見逃してしまいます。その場合は散布図を描いて視覚的に確認するか、他の分析手法を検討してください。

負の相関の解釈

相関係数が-0.9のように負の値になる場合、強い負の相関があることを意味します。つまり、一方の値が増えるともう一方の値が減る関係です。符号に注意して結果を解釈しましょう。

ADVERTISEMENT

CORREL関数と類似関数の比較

関数名 計算内容 備考
CORREL ピアソン積率相関係数 一般的な相関係数。PEARSONと同じ結果
PEARSON ピアソン積率相関係数 CORRELと全く同じ計算。互換性のために存在
RSQ 決定係数(相関係数の2乗) 回帰分析の当てはまりの良さを示す
COVAR 共分散 単位の影響を受けるため相関係数とは異なる

まとめ

この記事では、GoogleスプレッドシートのCORREL関数を使って相関係数を計算する方法を解説しました。関数の構文はシンプルで、データ範囲を指定するだけで簡単に求められます。ただし、データの前処理や外れ値の確認、結果の解釈には注意が必要です。CORREL関数はPEARSON関数と全く同じ結果を返すため、どちらを使っても構いません。さらに詳しい分析が必要な場合は、RSQ関数で決定係数を求めたり、散布図を作成してデータの傾向を視覚的に確認することをおすすめします。ぜひ実際のデータで試してみてください。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。