データの相関

スポンサーリンク
数学Ⅰ

相関

2つのデータの間に

一方が増えると他方も増える

一方が増えると他方が減る

という傾向がみられるとき

この2つのデータは「相関がある」という

例えば,身長と体重は,

一方が増えると他方も増える傾向にあるので

「相関がある」という

正の相関と負の相関

相関には「正の相関」と「負の相関」の2種類あるよ!

正の相関

一方が増えると他方も増える傾向

負の相関

一方が増えると他方が減る傾向

相関がない

相関係数

「相関係数」を学ぶ前に「標準偏差」と「共分散」から!

分散

分散

$(分散)=(偏差の2乗の平均)$

分散を求めたら標準偏差が求まるよ!

次のデータの分散を求めよ

$x  1 3 5 7 9$

 $x_1$  $x_2$  $x_3$  $x_4$  $x_5$  合計  平均 
$x$$1$$3$$5$$7$$9$$25$$\bar{x}=5$
偏差 $x-\bar{x}$$-4$$-2$$0$$2$$4$$0$/
偏差の2乗 $(x-\bar{x})^2$$16$$4$$0$$4$$16$$40$$s^2=8$

偏差の2乗の和が $40$

(分散)=(偏差の2乗の平均) なので

分散 $\displaystyle s^2=\frac{1}{5}・40=8$

詳しくはこれ↓

分散と標準偏差
分散と標準偏差の求め方をマスターしよう!データの散らばり度合は分散と標準偏差で調べる!

共分散

共分散
$(xとyの共分散)=(xの偏差とyの偏差の積の平均)$

$x$ と $y$ の共分散 $s_{xy}$ は

$\displaystyle s_{xy}=\frac{1}{n}\{(x_1-\overline{x})(y_1-\overline{y})+(x_2-\overline{x})(y_2-\overline{y})+……+(x_n-\overline{x})(y_n-\overline{y})\}$

共分散の符号と相関関係

散布図を以下のように $x$ の平均値 $\overline{x}$ と $y$ の平均値 $\overline{y}$ で4つの領域に分ける

  • 正の相関がみられるとき,点は①と③に集まる
  • 負の相関がみられるとき,点は②と④に集まる
  • 4つの領域について,偏差の符号をみると

  • ①と③は $x$ と $y$ の偏差の積が正
  • ②と④は $x$ と $y$ の偏差の積が負
  • $(xとyの共分散)=(xの偏差とyの偏差の積の平均)$ なので

  • 正の相関がある(点が①と③に集まる)ときは $x$ と $y$ の共分散が正
  • 負の相関がある(点が②と④に集まる)ときは $x$ と $y$ の共分散が負
  • 相関係数の計算式

    相関係数
    $\displaystyle(xとyの相関係数)=\frac{(xとyの共分散)}{\sqrt{(xの分散)}×\sqrt{(yの分散)}}$

    分子が $x$ と $y$ の共分散なので

    相関係数が正のときは正の相関,負のときは負の相関がある

    ポイント

    相関係数 $r$ は $-1≦r≦1$ で

  • $1$ に近づくほど強い正の相関がある
  • $-1$ に近づくほど強い負の相関がある
  • $0$ に近いと相関がない
  • 問題

    次のデータの相関係数を求めよ

    \begin{array}{c|ccccc} x & 1 & 3 & 5 & 7 & 9 \\ \hline y & 1 & 5 & 7 & 3 & 9 \\ \end{array}

     $x_1$  $x_2$  $x_3$  $x_4$  $x_5$  合計  平均 
    $x$$1$$3$$5$$7$$9$$25$$\overline{x}=5$
    $y$$1$$5$$7$$3$$9$$25$$\overline{x}=5$
    $x-\overline{x}$$-4$$-2$$0$$2$$4$$0$/
    $y-\overline{y}$$-4$$0$$2$$-2$$4$$0$/
    $(x-\overline{x})^2$$16$$4$$0$$4$$16$$40$$s_x^2=8$
    $(y-\overline{y})^2$$16$$0$$4$$4$$16$$40$$s_y^2=8$
    $(x-\overline{x})(y-\overline{y})$$16$$0$$0$$-4$$16$$28$$\displaystyle s_{xy}=\frac{28}{5}$

    $x$ の分散 $s_x^2=8$,$y$ の分散 $s_y^2=8$,$x$ と $y$ の共分散 $\displaystyle s_{xy}=\frac{28}{5}$ より

    $\displaystyle(xとyの相関係数)=\frac{(xとyの共分散)}{\sqrt{(xの分散)}×\sqrt{(yの分散)}}$ を用いて

    相関係数 $\displaystyle r=\frac{\frac{28}{5}}{\sqrt{8}×\sqrt{8}}=0.7$

    $x$ と $y$ には正の相関がある

    まとめ

    ● 相関係数の求め方

     $\displaystyle(xとyの相関係数)=\frac{(xとyの共分散)}{\sqrt{(xの分散)}×\sqrt{(yの分散)}}$

     ここで $(分散)=(偏差の2乗の平均)$

         $(xとyの共分散)=(xの偏差とyの偏差の積の平均)$

    ● 相関係数の特徴

     相関係数 $r$ は $-1≦r≦1$ で
     ・ $1$ に近づくほど強い正の相関がある
     ・ $-1$ に近づくほど強い負の相関がある
     ・ $0$ に近いと相関がない

    「相関係数」も表にして求めた方がいいね!

    コメント

    タイトルとURLをコピーしました