データの相関

スポンサーリンク
数学Ⅰ

相関

2つのデータの間に

一方が増えると他方も増える

一方が増えると他方が減る

という傾向がみられるとき

この2つのデータは「相関がある」という

例えば,身長と体重は,

一方が増えると他方も増える傾向にあるので

「相関がある」という

正の相関と負の相関

相関には「正の相関」と「負の相関」の2種類あるよ!

正の相関

一方が増えると他方も増える傾向

負の相関

一方が増えると他方が減る傾向

相関がない

相関係数

「相関係数」を学ぶ前に「標準偏差」と「共分散」から!

分散

分散

()=()

分散を求めたら標準偏差が求まるよ!

次のデータの分散を求めよ

x  1 3 5 7 9

 x1  x2  x3  x4  x5  合計  平均 
x1357925x¯=5
偏差 xx¯420240/
偏差の2乗 (xx¯)2164041640s2=8

偏差の2乗の和が 40

(分散)=(偏差の2乗の平均) なので

分散 s2=1540=8

詳しくはこれ↓

分散と標準偏差
分散と標準偏差の求め方をマスターしよう!データの散らばり度合は分散と標準偏差で調べる!

共分散

共分散
(xy)=(xy)

xy の共分散 sxy

sxy=1n{(x1x)(y1y)+(x2x)(y2y)++(xnx)(yny)}

共分散の符号と相関関係

散布図を以下のように x の平均値 xy の平均値 y で4つの領域に分ける

  • 正の相関がみられるとき,点は①と③に集まる
  • 負の相関がみられるとき,点は②と④に集まる
  • 4つの領域について,偏差の符号をみると

  • ①と③は xy の偏差の積が正
  • ②と④は xy の偏差の積が負
  • (xy)=(xy) なので

  • 正の相関がある(点が①と③に集まる)ときは xy の共分散が正
  • 負の相関がある(点が②と④に集まる)ときは xy の共分散が負
  • 相関係数の計算式

    相関係数
    (xy)=(xy)(x)×(y)

    分子が xy の共分散なので

    相関係数が正のときは正の相関,負のときは負の相関がある

    ポイント

    相関係数 r1r1

  • 1 に近づくほど強い正の相関がある
  • 1 に近づくほど強い負の相関がある
  • 0 に近いと相関がない
  • 問題

    次のデータの相関係数を求めよ

    x13579y15739

     x1  x2  x3  x4  x5  合計  平均 
    x1357925x=5
    y1573925x=5
    xx420240/
    yy402240/
    (xx)2164041640sx2=8
    (yy)2160441640sy2=8
    (xx)(yy)160041628sxy=285

    x の分散 sx2=8y の分散 sy2=8xy の共分散 sxy=285 より

    (xy)=(xy)(x)×(y) を用いて

    相関係数 r=2858×8=0.7

    xy には正の相関がある

    まとめ

    ● 相関係数の求め方

     (xy)=(xy)(x)×(y)

     ここで ()=()

         (xy)=(xy)

    ● 相関係数の特徴

     相関係数 r1r1
     ・ 1 に近づくほど強い正の相関がある
     ・ 1 に近づくほど強い負の相関がある
     ・ 0 に近いと相関がない

    「相関係数」も表にして求めた方がいいね!

    コメント

    タイトルとURLをコピーしました