統計第2回-σ(シグマ)の数値から何が分かるか?
こんにちは、えちけんです。
前回はσ(シグマ)とは何か?について詳しく見てきました。
そして、データを取得した際、σ(シグマ)をなぜ算出しなければいけないか、分かってもらえたと思います。
次に、σ(シグマ)の値そのものが何を示しているのか?についてみていきましょう。
これが分かると、σ(シグマ)をもっと積極的に算出しようという気持ちが湧いてくるかと思います。
では、
- σの値から何がわかるのか?
1.正規分布とは?
1-1.正規分布
σ(シグマ)の事を理解するためには、正規分布の話を避けては通れません。
正規分布とは、下の図のように横軸をデータの区間、縦軸を頻度や個数にとったとき、その分布が左右対称になるもののことです。
どんぴしゃで、左右対称にならなければいけないということではありません。
ぱっと見た感じ左右対称だな~と言えそうなら正規分布と言ってもいいでしょう。
ここで裏話です。
偶然誤差を含むデータは正規分布に従う事が、過去の偉人の調査によって分かってます。
偶然誤差というのは、測定バラツキのような、制御できない、規則性のない、偶然におきる誤差の事です。
そして、天文学者のガウスさん(1800年頃)が、偶然誤差である測定誤差が正規分布に従うことを発見しました。
従って、あまり言いませんが、正規分布を”ガウス分布”とも言います。
1-2.標準正規分布
平均が”0”でσ(シグマ)が”1”の正規分布のことです。
下のような分布ですね。
なお、標準正規分布を上の図中にもあるように
と表します。
この書式はどういう意味かというと、
です。
標準正規分布は、工程能力や検定などの統計的手法を活用する際に頻繁に出てくる考え方なので、仲良くなっておきましょう。
2.σと標準正規分布
2-1.σから何が分かるか?
標準正規分布において、横軸が-1~1のデータ区分に存在するデータは、全体の68.2%になってます。
そして、標準正規分布はσ(シグマ)が1の正規分布だった事を思い出すと、-σ~σの範囲内に存在するデータが、全体の68.2%であるということが言えます。(下図)
次に、標準正規分布において、横軸が-2~2のデータ区分に存在するデータは、全体の95.5%になってます。
そして、標準正規分布はσ(シグマ)が1の正規分布だった事を思い出すと、-2σ~2σの範囲内に存在するデータが、全体の95.5%であるということが言えます。(下図)
最後に、標準正規分布において、横軸が-3~3のデータ区分に存在するデータは、全体の99.7%になってます。
そして、標準正規分布はσ(シグマ)が1の正規分布だった事を思い出すと、-3σ~3σの範囲内に存在するデータが、全体の99.7%であるということが言えます。(下図)
2-1.σとデータの発生確率の関係
これまでで、正規分布となるデータ群を扱う場合、σの値が分かるとデータの一つ一つが、どれくらいの発生率で出るデータなのかが、予測することが出来ます。
以下に、σとデータの発生率の関係をまとめます。
データの平均値(Ave.)とσの値が分かるだけで、そのデータの発生割合が予測できるなんて、驚きですね!
データをまとめる時にσ(シグマ)がなぜ必要なのかが分かってもらえたでしょうか。