【Excel】散布図で相関関係を視覚化する方法

【Excel】散布図で相関関係を視覚化する方法
🛡️ 超解決

Excelでデータ分析を行う際、2つの数値データの関係性を把握したい場面は多いでしょう。

例えば、広告費と売上高、勉強時間とテストの点数など、一方の数値が増えると、もう一方の数値も増える(または減る)傾向があるかを知りたい場合があります。

このような2つの数値データの相関関係を視覚的に捉えるのに最適なのが「散布図」です。

この記事では、Excelで散布図を作成し、データ間の相関関係を視覚化する手順を詳しく解説します。

Excelの散布図機能を使いこなせば、データに隠された傾向やパターンを素早く発見できるようになります。

【要点】Excelで散布図を作成し相関関係を視覚化する

  • 散布図の作成: 2つの数値データを選択し、「挿入」タブから散布図を選択することで、データ点をプロットしたグラフを作成できます。
  • 近似曲線の追加: 作成した散布図に近似曲線を追加することで、データの傾向や相関の強さを視覚的に把握できます。
  • 相関係数の表示: 近似曲線と同時に相関係数(R-2乗値)を表示させることで、相関の強さを数値で確認できます。

ADVERTISEMENT

散布図で相関関係を視覚化する仕組み

散布図は、2つの数値データをそれぞれ縦軸(Y軸)と横軸(X軸)にプロットし、データ点として表示するグラフです。

このデータ点の配置パターンを見ることで、2つのデータ間にどのような関係があるかを視覚的に理解できます。

例えば、データ点が右肩上がりに並んでいれば「正の相関」、右肩下がりに並んでいれば「負の相関」があると判断できます。

また、データ点が一直線上に密集しているほど相関は強く、ばらついているほど相関は弱いと解釈します。

Excelでは、この散布図に「近似曲線」を追加することで、データ全体の傾向をより明確に把握できるようになります。

近似曲線は、データ点のばらつきを考慮しながら、最もデータによく当てはまる直線を引いたものです。

さらに、近似曲線と同時に「相関係数(R-2乗値)」を表示させることで、相関の強さを客観的な数値で評価できます。

お探しの解決策が見つからない場合は、こちらの「Excelトラブル完全解決データベース」で他のエラー原因や解決策をチェックしてみてください。

散布図を作成する基本的な手順

ここでは、2つの数値データを持つExcelシートを例に、散布図を作成する基本的な手順を解説します。

例えば、「広告費」と「売上高」のデータがあり、両者の関係性を散布図で確認したい場合を想定します。

  1. グラフ化したいデータを選択する
    Excelシート上で、グラフにしたい2つの数値データが含まれる範囲をドラッグして選択します。この際、データに対応する項目名(見出し)も一緒に選択しておくと、グラフ作成後に自動で凡例などに反映されるため便利です。
  2. 「挿入」タブを開く
    Excelのリボンメニューから「挿入」タブをクリックします。
  3. 「散布図」を選択する
    「グラフ」グループ内にある「集合縦棒」や「集合縦棒」などが並んでいるアイコンの中から、「散布図(X、Y)またはレーダーチャートの挿入」アイコンをクリックします。
  4. 散布図の種類を選ぶ
    表示される散布図のオプションから、「散布図」を選択します。通常は、データ点がプロットされただけのシンプルなものが一般的ですが、「平滑線とマーカー」や「平滑線のみ」といったオプションもあります。まずは、最も基本的な「散布図」を選択することをおすすめします。
  5. 散布図が作成される
    選択したデータ範囲に基づいて、散布図がシート上に自動的に作成されます。横軸(X軸)に最初に選択した列のデータ、縦軸(Y軸)に次に選択した列のデータが割り当てられます。

相関関係をより深く分析するための設定

散布図を作成しただけでは、データ間の関係性がどの程度強いのか、客観的な判断が難しい場合があります。

そこで、近似曲線を追加し、相関係数(R-2乗値)を表示させることで、より詳細な分析が可能になります。

近似曲線の追加方法

近似曲線は、データ点のばらつきを考慮して、最も当てはまる直線を引く機能です。

  1. グラフを選択する
    作成済みの散布図グラフをクリックして選択します。グラフを選択すると、「グラフのデザイン」タブと「書式」タブが表示されます。
  2. 「グラフのデザイン」タブを開く
    リボンメニューの「グラフのデザイン」タブをクリックします。
  3. 「グラフ要素を追加」を選択する
    「グラフのデザイン」タブにある「グラフ要素を追加」をクリックします。
  4. 「近似曲線」から種類を選択する
    表示されるメニューから「近似曲線」にカーソルを合わせます。さらに右側に表示されるオプションから、「線形」を選択します。線形近似曲線は、データが直線的な関係にある場合に最も適しています。
  5. 近似曲線が追加される
    散布図上に、データに最もフィットする直線(近似曲線)が追加されます。

相関係数(R-2乗値)の表示方法

相関係数(R-2乗値)は、近似曲線がデータにどれだけ適合しているかを示す指標です。値は0から1の間を取り、1に近いほど相関が強いと判断できます。

  1. 近似曲線を選択する
    散布図上に表示されている近似曲線をクリックして選択します。
  2. 「近似曲線の書式設定」ウィンドウを開く
    近似曲線を選択した状態で右クリックし、表示されるメニューから「近似曲線の書式設定」を選択します。または、「グラフのデザイン」タブの「グラフ要素を追加」→「近似曲線」→「その他の近似曲線のオプション」を選択します。
  3. 「近似曲線の書式設定」ウィンドウで設定する
    画面右側に「近似曲線の書式設定」ウィンドウが表示されます。
  4. 「近似曲線のオプション」で「グラフにR-2乗値を表示する」にチェックを入れる
    ウィンドウ下部にある「近似曲線のオプション」を展開し、「グラフにR-2乗値を表示する」という項目にチェックを入れます。
  5. 相関係数が表示される
    散布図上に、近似曲線の近傍にR-2乗値が表示されます。

近似曲線の種類について

Excelでは、線形(直線)以外にも様々な種類の近似曲線を作成できます。データが直線的な関係にない場合は、これらのオプションを試すことで、より適切な傾向線を把握できる場合があります。

指数近似

データが指数関数的に増加または減少する傾向がある場合に適しています。

対数近似

データが対数関数的に増加または減少する傾向がある場合に適しています。

多項式近似

データが曲線的な傾向を示す場合に有効です。次数を設定することで、曲線の複雑さを調整できます。一般的には、次数2または3がよく利用されます。

移動平均

データの短期的な変動を平滑化し、長期的なトレンドを把握するのに役立ちます。これは厳密な意味での近似曲線ではありませんが、データの傾向を視覚化するのに使われます。

近似曲線の種類を変更したい場合は、上記「近似曲線の追加方法」のステップ4で、「線形」以外のオプションを選択するか、「近似曲線の書式設定」ウィンドウで「近似曲線のオプション」から変更します。

ADVERTISEMENT

散布図作成時の注意点とよくある失敗

散布図は非常に便利なグラフですが、作成時や解釈時にいくつか注意すべき点があります。

データ選択の誤り

散布図を作成する際、最も基本的なミスは、グラフ化したい2つの数値データ以外の列を選択してしまうことです。

例えば、ID列やテキストデータを含む列を数値データとして選択してしまうと、意図しないグラフになったり、エラーが発生したりします。

対処法: グラフ化する前に、必ず選択範囲が2つの数値データ列のみ(必要であれば項目名も含む)であることを確認してください。データが離れた場所にある場合は、Ctrlキーを押しながら範囲を選択することで、複数の範囲を一度に選択できます。

項目軸と値軸の混同

Excelでは、最初に選択した列がX軸(横軸、項目軸)、次に選択した列がY軸(縦軸、値軸)として自動的に割り当てられます。

もし、想定していた軸と異なる場合は、グラフを選択し、「グラフのデザイン」タブの「データの選択」から「系列の編集」で軸データを変更する必要があります。

対処法: グラフ作成後、軸ラベルを確認し、意図したデータが正しく表示されているか確認してください。必要であれば、「グラフのデザイン」タブの「グラフ要素を追加」→「軸」から軸ラベルを追加・編集できます。

相関関係と因果関係の混同

散布図や相関係数は、2つのデータ間に「関連性(相関)」があることを示しますが、「原因と結果(因果関係)」があることを直接証明するものではありません。

例えば、アイスクリームの売上と水難事故件数には強い正の相関が見られることがありますが、アイスクリームを食べることが水難事故の原因ではありません。どちらも「気温の上昇」という共通の原因に影響されている可能性が高いです。

対処法: 散布図の結果を解釈する際は、常に他の要因や背景知識を考慮し、安易に因果関係を断定しないように注意しましょう。

外れ値の影響

散布図上のデータ点の中には、他のデータから大きく離れた「外れ値」が存在することがあります。

外れ値は、近似曲線や相関係数の値に大きな影響を与える可能性があります。

対処法: 散布図を作成したら、まず外れ値がないか確認しましょう。外れ値が見つかった場合は、その原因を調査し、データ入力ミスであれば修正するか、分析から除外するかを検討します。ただし、外れ値を除外する際は、その根拠を明確にしておく必要があります。

Excelのバージョンによる違い

Excelの散布図機能は、基本的な操作や表示はどのバージョンでも大きく変わりません。Excel 2019やExcel 2021でも、上記の手順で同様に散布図を作成し、近似曲線を追加することが可能です。

Microsoft 365版Excelでは、より洗練されたグラフデザインオプションや、リアルタイムでのデータ更新機能などが強化されていますが、散布図の基本機能に大きな違いはありません。

Excelの他のグラフとの比較

Excelには様々な種類のグラフがありますが、相関関係の視覚化という点では、散布図が最も適しています。

グラフの種類 主な用途 相関関係の視覚化
散布図 2つの数値データの関係性、相関の分析 ◎ 最も適している
折れ線グラフ 時系列データの変化、推移の表示 △ 限られた状況(例:2つの時系列データを並べて比較)
棒グラフ カテゴリごとの数量比較 × 不向き
円グラフ 全体に対する各項目の割合 × 不向き

折れ線グラフも2つの系列を比較することで、ある程度の関係性を読み取ることは可能ですが、散布図のようにデータ点一つ一つを独立してプロットするわけではないため、相関の強さやパターンを正確に把握するには限界があります。

棒グラフや円グラフは、そもそも数値データ同士の関係性を見るためのグラフではないため、相関関係の視覚化には全く適していません。

まとめ

この記事では、Excelで散布図を作成し、2つの数値データ間の相関関係を視覚化する方法を解説しました。

散布図を作成し、近似曲線と相関係数(R-2乗値)を表示させることで、データに隠された傾向や関係性の強さを客観的に把握できます。

今後は、作成した散布図を元に、さらに詳細な統計分析に進んだり、他のグラフと組み合わせて多角的なデータ分析に挑戦してみてください。

Excelの散布図機能を活用して、データ分析の質を高めましょう。

📊
Excelトラブル完全解決データベースこの記事以外にも、様々なエラー解決策をまとめています。困った時の逆引きに活用してください。

ADVERTISEMENT

この記事の監修者
📈

超解決 Excel・Word研究班

企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。

🏆
超解決 Excel検定 あなたのExcel実務能力を3分で測定!【1級・2級・3級】