トーフメモ

主にゲーム制作

3秒でわかる「分散」【確率統計学】

f:id:tofgame:20190429000018j:plain

分散とは

データのちらばり具合です!
分散という言葉からもなんとなくそんな感じがしますね!

詳しく

分散を \sigma ^2、確率変数を x、期待値を E(x)として、
 \displaystyle \sigma ^2 = E((x-E(x) )^2) = E(x^2)-E(x)^2 (確率変数と期待値の二乗誤差の期待値)

また、分散の平方根標準偏差といいます。
 \displaystyle \sigma = \sqrt {E((x-E(x) )^2)}

身長の分散

A~Dさんがいるとします。

f:id:tofgame:20190502015723p:plain
Aさん(140cm)
f:id:tofgame:20190502015747p:plain
Bさん(163cm)
f:id:tofgame:20190502015802p:plain
Cさん(185cm)
f:id:tofgame:20190502015916p:plain
Dさん(155cm)

この4人の身長の分散を計算しましょう。
(1) 4人の身長の平均( E(x))
 \displaystyle
\frac {140+163+185+155}{4}=160.75

(2) (1)の二乗( E(x)^2)
 \displaystyle
(160.75)^2=25840.5625

(3) 4人の身長の二乗の平均( E(x^2))
 \displaystyle
\frac {140^2+163^2+185^2+155^2}{4}=26104.75

よって分散は、
 \displaystyle
(3)-(2)=264.1875
です!

では、4人とも同じ身長だったらどうなるでしょうか?
全員140cmだとして、
(1) 4人の身長の平均( E(x))
 \displaystyle
140

(2) (1)の二乗( E(x)^2)
 \displaystyle
140^2

(3) 4人の身長の二乗の平均( E(x^2))
 \displaystyle
140^2

分散は、
 \displaystyle
(3)-(2)=0
です!

分散は値が大きければ大きいほどデータが散らばっているのがわかりますね。
今回はこれで終わりです!