統計第3回-中心極限定理とは?
こんにちは、えちけんです。
今回は中心極限定理について詳しく見ていきます。
中心?極限?
なんでしょう。
言葉だけではさっぱり何のことか想像できませんね。
僕もこの言葉を最初に聞いた時は、難しそうなお話の始まりかっ!!と思いましたが、いざ聞いてみるとそうでもなかったです。
では、
- 中心極限定理とは何なのか?
1.中心極限定理
中心極限定理とは、平均、分散のある母集団から抜き取ったn個のデータの平均値は、平均、分散の正規分布に従うということです。
では、どういうことか順を追って見ていきましょう。
1-1.ある母集団から、n個抜き取る。
例えば、平均、分散の正規分布の母集団から、n個のデータ(,,,・・・)を抜き取ります。
そして、そのn個のデータの平均をとします。
次に、もう一度、n個のデータ(,,,・・・)を抜き取ります。
そして、そのn個のデータの平均をとします。
そして、この作業をm回繰り返します。
1-2.抜き取ったn個のそれぞれの平均値の分布
そうすると、、・・・のm個のデータが得られるわけですが、そのm個のデータは、平均、分散の正規分布に従います。
つまり、分布で表すとこんなイメージです。
平均値が元の分布と同じμになるのはイメージできますね。
元の分布はμ付近のデータの割合が多いのですから、ランダムにデータを抜き取ると、μ付近のデータを抜き取る確率が高いので、その抜き取ったデータの平均値もμ付近になりますからね。
では、分散の方はどうでしょう?
例えばの時を考えてみましょう。
ということは、元の母集団から1個抜き取って、その1個の平均(つまりその抜き取った値そのもの)の分布・・・もとの分布とおなじやん!!
ということで、分散も元の分布と同じですね。
次に、の時を考えてみましょう。
ということは、元の母集団から∞個なので、全部のデータを抜き取って、
その平均の分布・・・平均値はすべて同じ値やん!!
ということで、すべてのデータの値が同じなので、つまり、バラツキ(分散)が0の分布になりますね。
イメージと合ってますね。
2.中心極限定理の使い道
中心極限定理は母集団からサンプリングとしてデータを抜き取って解析する際に使用します。
特に検定の際には必須となりますので、覚えておきましょう。
そしてもう一つ。
今回は正規分布を例にお話ししましたが、中心極限定理を適用する母集団は正規分布である必要はありません。
どのような分布でも中心極限定理は成り立ちます。
中心極限定理について分かって頂いたでしょうか?
これで検定に立ち向かうための武器を手に入れましたね!!