FIREを目指すITエンジニア

湖国に住むITエンジニアが思った事を日記にまとめます。

統計学のお勉強①

9月前半に受けたFP2級の試験は、おそらく受かったであろうと思いますので、気持ちを切り替えて、英語の勉強を再開しようかと思ったのですが、いやいやいやいや!!!totoの当選確率を少しでも高める為に統計検定2級の本と練習問題も買ったし、年内の合格を目指して勉強せねば!!!っと思い、統計検定2級の合格を目指し、日々、勉強中でございます!!!w

 

昔の復習?っというよりも、めちゃめちゃ忘れてて、ほぼ初見なんですが。。。本当にこんなの習ったか?ってレベルで覚えてません(泣)学生時代の自分に会ったら、後で苦労するから、ちゃんと勉強しとけ!!!っと言いたくなります(笑)

 

分散

分散とは、平均値からのばらつき度合いを示す値です。標準偏差を求める為にも、まずは分散を求めます。

 

計算方法・・・はい!求め方覚えてません!ってか習ったか?

では、駄目なので、ちゃんと求め方を脳に刻み込みます!

A 3 4 5 6 7
B 1 3 5 7 9
C 0 4 5 6 10
D 0 1 5 9 10

アルファベットがクラス、数値が点数とします。

これで分散を求めた場合、以下の通りとなります。

A 2
B 8
C 10.4
D 16.4

 

Excelなどであれば、サクッとVAR.P関数で求められますが、流石にそれでは覚えられませんwので、求め方は以下の通りとなります。

分散

文字では表現出来なかったので、すいません!画像としています!

プログラムをやっている方だと、ぴんとくる方も多いと思います。間違ってたら、ご指摘いただきたいですが、

Σの下のi = 1がnに達するまで計算するという事を示しています。

A〜Dのデータの個数は、5個なので、n = 5となります。Aの例で分散を求めます。

※2乗を^ 2で表現しており、5はAのデータ群の平均値です。

 

i = 1 : (3 ー 5) ^ 2 = 4

i = 2 : (3 ー 4) ^ 2 = 1

i = 3 : (3 ー 5) ^ 2 = 0

i = 4 : (3 ー 6) ^ 2 = 1

i = 5 : (3 ー 7) ^ 2 = 4

これらの和が

10

となり、Σの左側の

 \dfrac {1}{n}

にあてはめると、

 \dfrac {10(和)}{     5(データの個数)}

となるので、分散は

となります。要は各データを平均で引いた2乗を足していき、それをB、C、Dも同じように計算すると、上の表の通りの分散の値となります。なお、標準偏差は、

{\displaystyle s={\sqrt {{\frac {1}{n}}\textstyle \sum \limits _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}

で、求められます。

Aの場合だと、

√2で、

1.41

となりますね。

よく葬儀代金などの相場をはかる指標として全国平均と言われる事がありますが、ばらつきが大きい場合、都市部や一部の富裕層が豪華な葬儀をあげて平均を押し上げてる事もあるでしょうから、最頻値や中央値を知るか、都市部以外の地域だと、その地域の平均を知っておけば、ぼったくられずに済みますw

 

引っ越しや葬儀などは「全国平均よりも安いですよ!」っと言われた場合、安く感じるかもですが、実はそうでもなかったっていうことも多々あると思います。

数字は嘘をつかないですが、嘘つきは数字を使いますね。。。