トーフメモ

主にゲーム制作

3秒でわかる!「中央値」【確率統計学】

f:id:tofgame:20190429000018j:plain

中央値とは

集まりのちょうど真ん中のことです!

詳しく

確率を \displaystyle Pとして、
 \displaystyle P(x \leq a) = 1/2を満たす \displaystyle aを中央値と言います。

集まりを小さい順に並べて、小さい順(大きい順)に集まりの数の半分まで数え上げると、中央値がわかります。
集まりの数が偶数の時は集まりの数の半分が二つあるので、その二つの平均が中央値です。

また、確率変数をx、確率関数をf(x)として、
 \displaystyle 
\int |x-y|f(x)dx
を最小にする \displaystyle yも中央値になります。

年収の中央値

年収は何億何十億と、ものすごい稼いでいる人もいます。
なので、平均値(期待値)にすると、「あれ?平均でみんなこんなに稼いでいるのか・・・」となります。
中央値は「集まりのちょうど真ん中」をみるので、集まりで一番稼いでいる人などのデータが邪魔しません。
中央値は外れ値に強いのです。

実際に、平成29年度の日本人全体の平均年収は432万ですが、中央値を国税庁のデータから推測すると、300~400万の間になります。

参照

www.nta.go.jp