【Excel】散布図で2つのデータの相関を可視化する方法

【Excel】散布図で2つのデータの相関を可視化する方法
🛡️ 超解決

2つのデータ間にどのような関係があるか、視覚的に把握したいと考えるビジネスマンは多いでしょう。Excelの散布図は、2つの数値データの相関関係を効果的に可視化し、傾向を分析する強力なツールです。この記事では、散布図の基本的な作成方法から、トレンドラインやR2乗値を使った相関分析まで、具体的な手順を解説します。

この記事を読むことで、データの隠れたパターンを発見し、より精度の高い意思決定に役立てることができます。

【要点】Excel散布図でデータ相関を可視化・分析するポイント

  • 散布図の挿入: 2つの数値データの関係性を視覚的に表示します。
  • トレンドラインの追加: データ全体の傾向を示す直線や曲線をグラフ上に描画します。
  • R2乗値の表示: トレンドラインがデータをどの程度説明しているかを示す指標を確認します。

ADVERTISEMENT

散布図が示すデータの関係性とその種類

散布図は、X軸とY軸にそれぞれ異なる数値データをプロットし、2つの変数の間にどのような関係性があるかを視覚的に分析するグラフ形式です。例えば、広告費と売上、気温とアイスクリームの販売数など、原因となりうる要素と結果となりうる要素の関連性を把握する際に特に有用です。

散布図を使うことで、データが右肩上がりに集中している「正の相関」、右肩下がりに集中している「負の相関」、あるいは特定のパターンが見られない「無相関」といった、さまざまな関係性を直感的に理解できます。これにより、数値だけでは見えにくいデータの傾向やパターンを明確にできます。

散布図を作成するための前提条件として、比較したいデータが数値であること、そして各データポイントがX軸とY軸の対応する値としてペアになっていることが重要です。例えば、ある日の気温と売上のように、日付などの共通の要素に基づいてデータを整理しておく必要があります。

お探しの解決策が見つからない場合は、こちらの「Excelトラブル完全解決データベース」で他のエラー原因や解決策をチェックしてみてください。

Excelで散布図を作成する基本的な手順

  1. データの準備と選択
    Excelシートに、X軸にしたい数値データとY軸にしたい数値データを隣接する2列に用意します。例えば、A列に広告費、B列に売上を配置します。データ範囲全体を選択してください。この際、列の見出しも選択に含めることで、グラフの凡例や軸ラベルに自動的に反映できます。
  2. 散布図の挿入
    Excelのリボンメニューから「挿入」タブをクリックします。「グラフ」グループ内にある「散布図X,Yまたはバブルチャートの挿入」アイコンをクリックし、表示される散布図の種類から「散布図」を選択します。これにより、選択したデータに基づいて基本的な散布図がワークシート上に作成されます。
  3. グラフ要素の追加と調整
    グラフが挿入されたら、グラフ右上の「+」アイコン(グラフ要素)をクリックします。「軸ラベル」と「グラフタイトル」にチェックを入れてください。軸ラベルのプレースホルダーをクリックし、それぞれの軸が何を表しているか(例: X軸「広告費」、Y軸「売上」)を具体的に入力します。グラフタイトルも同様に、グラフの内容を明確に示すタイトル(例: 「広告費と売上の相関」)に変更します。
  4. グラフのデザインと書式設定
    グラフを選択した状態で、リボンメニューに表示される「グラフのデザイン」タブや「書式」タブを使って、グラフの色やスタイル、フォントなどを調整できます。視覚的に見やすいグラフにすることで、分析結果がより伝わりやすくなります。目盛りの間隔や数値の表示形式も、「軸の書式設定」から細かく設定可能です。

Excel2019や2021でも基本的な散布図の作成手順は同じです。

散布図を分析し相関を評価する応用手順

  1. トレンドライン(近似曲線)の追加
    作成した散布図を選択し、グラフ右上の「+」アイコン(グラフ要素)をクリックします。「トレンドライン」にチェックを入れます。標準では「線形」のトレンドラインが追加されます。これにより、データ全体の一般的な傾向を直線で視覚的に把握できます。
  2. トレンドラインの種類変更と詳細設定
    「トレンドライン」の右にある矢印をクリックし、「その他のオプション」を選択します。「トレンドラインの書式設定」ペインが表示されます。ここで「線形」以外に「指数近似」「対数近似」「多項式近似」など、データの特性に合った近似曲線を選択できます。例えば、データが曲線的なパターンを示す場合は多項式近似を試すのも良いでしょう。
  3. 決定係数R2乗値の表示
    「トレンドラインの書式設定」ペインの下部にある「グラフにR2乗値を表示する」にチェックを入れます。グラフ上にR2乗値が表示されます。R2乗値は0から1の間の値を取り、1に近いほどトレンドラインがデータをよく説明している、つまり相関が強いと判断できます。例えば、R2乗値が0.85であれば、モデルがデータの変動の85%を説明できていることを意味します。
  4. 数式の表示(任意)
    同じく「トレンドラインの書式設定」ペインで「グラフに数式を表示する」にチェックを入れると、トレンドラインの数式がグラフ上に表示されます。これにより、Xの値からYの値を予測するモデルとして利用できます。例えば、線形近似であれば「y = ax + b」の形式で表示されます。

Excel2019および2021でも、トレンドラインの追加やR2乗値の表示は同様の手順で実行できます。機能面での大きな違いはありません。

ADVERTISEMENT

散布図作成時の注意点とグラフの解釈ミス

データの範囲選択の誤り

散布図を作成する際、X軸とY軸に対応するデータの選択を誤ると、意図しないグラフが表示されます。例えば、データ範囲に空のセルが含まれていたり、対応する数値がずれていたりすると、正しく相関が可視化されません。必ずX軸となるデータ列とY軸となるデータ列を正確に選択し、それらが同じ行数で構成されていることを確認してください。

  1. データ範囲の確認
    グラフにしたいX軸とY軸のデータ列が連続しており、かつ同じ数のデータポイントを持つことを確認します。
  2. 非連続なデータの選択
    隣接していない列のデータを選択する場合は、最初の列を選択後、Ctrlキーを押しながら2つ目の列を選択します。

相関関係と因果関係の混同

散布図で強い相関が見られたとしても、それは「一方のデータがもう一方の原因である」という因果関係を直接的に証明するものではありません。例えば、「アイスクリームの売上が増えると、水難事故も増える」という相関があっても、アイスクリームが水難事故の原因ではありません。実際には「夏の気温上昇」という第三の要因が両方に影響している可能性が高いです。相関はあくまで関係性の強さを示すものであり、原因と結果を判断するには追加の分析や専門知識が必要です。

外れ値が与える影響

データの中に一つでも極端に大きな値や小さな値(外れ値)があると、散布図全体の傾向やトレンドラインの形が大きく歪められることがあります。特にデータポイントが少ない場合にその影響は顕著です。外れ値が本当にデータのエラーなのか、それとも重要な情報なのかを慎重に判断し、必要に応じて除外するか、別途分析するなどの対応を検討してください。

  1. 外れ値の特定
    グラフ上で明らかにデータ群から離れている点を目視で確認します。
  2. データ精査
    該当する元のデータを調べ、入力ミスや測定エラーがないか確認します。
  3. データの調整
    外れ値がエラーであれば修正または除外を検討し、グラフを再作成します。

データ型の不一致によるエラー

散布図は数値データ専用のグラフです。X軸またはY軸に日付、文字列、論理値などの数値以外のデータが含まれている場合、正しくプロットされないか、エラーが表示されることがあります。事前にデータ型がすべて数値であることを確認し、必要であればTEXT関数やVALUE関数などで数値型に変換してください。日付データはExcel内部ではシリアル値として数値で扱われるため、散布図のX軸やY軸として利用可能です。

散布図と折れ線グラフの使い分け

項目 散布図 折れ線グラフ
目的 2つの数値データ間の相関関係や分布を見る 時間や順序に沿ったデータの推移や変化を見る
X軸のデータ 数値データ カテゴリデータ、時間データ
データポイント 個々のデータ点がXとYの数値でプロットされる データ点が線で結ばれ、連続的な変化を示す
適した場面 広告費と売上、身長と体重など、独立した2変数の関係分析 月ごとの売上推移、株価の変動、気温の変化など、トレンド分析
得られる情報 相関の有無、強さ、方向性、外れ値の存在 トレンド、周期性、特定時点での増減

まとめ

この記事では、Excelで散布図を作成し、2つの数値データの相関関係を視覚的に把握する手順を解説しました。

トレンドラインやR2乗値の活用により、データ全体の傾向をより深く分析できるようになったでしょう。

適切なデータの選択と解釈の注意点を踏まえれば、散布図はビジネスデータの関係性を明らかにする強力なツールとなります。

今後、売上と費用、顧客満足度とリピート率など、身近なデータで散布図を活用し、因果関係ではない相関関係を見つける分析に役立ててください。

📊
Excelトラブル完全解決データベースこの記事以外にも、様々なエラー解決策をまとめています。困った時の逆引きに活用してください。

ADVERTISEMENT

この記事の監修者
📈

超解決 Excel・Word研究班

企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。

🏆
超解決 Excel検定 あなたのExcel実務能力を3分で測定!【1級・2級・3級】