統計第3回-中心極限定理とは?
こんにちは、えちけんです。
今回は中心極限定理について詳しく見ていきます。
中心?極限?
なんでしょう。
言葉だけではさっぱり何のことか想像できませんね。
僕もこの言葉を最初に聞いた時は、難しそうなお話の始まりかっ!!と思いましたが、いざ聞いてみるとそうでもなかったです。
では、
- 中心極限定理とは何なのか?
1.中心極限定理
中心極限定理とは、平均、分散のある母集団から抜き取ったn個のデータの平均値は、平均、分散の正規分布に従うということです。
では、どういうことか順を追って見ていきましょう。
1-1.ある母集団から、n個抜き取る。
例えば、平均、分散の正規分布の母集団から、n個のデータ(,,,・・・)を抜き取ります。
そして、そのn個のデータの平均をとします。
次に、もう一度、n個のデータ(,,,・・・)を抜き取ります。
そして、そのn個のデータの平均をとします。
そして、この作業をm回繰り返します。
1-2.抜き取ったn個のそれぞれの平均値の分布
そうすると、、・・・のm個のデータが得られるわけですが、そのm個のデータは、平均、分散の正規分布に従います。
つまり、分布で表すとこんなイメージです。
平均値が元の分布と同じμになるのはイメージできますね。
元の分布はμ付近のデータの割合が多いのですから、ランダムにデータを抜き取ると、μ付近のデータを抜き取る確率が高いので、その抜き取ったデータの平均値もμ付近になりますからね。
では、分散の方はどうでしょう?
例えばの時を考えてみましょう。
ということは、元の母集団から1個抜き取って、その1個の平均(つまりその抜き取った値そのもの)の分布・・・もとの分布とおなじやん!!
ということで、分散も元の分布と同じですね。
次に、の時を考えてみましょう。
ということは、元の母集団から∞個なので、全部のデータを抜き取って、
その平均の分布・・・平均値はすべて同じ値やん!!
ということで、すべてのデータの値が同じなので、つまり、バラツキ(分散)が0の分布になりますね。
イメージと合ってますね。
2.中心極限定理の使い道
中心極限定理は母集団からサンプリングとしてデータを抜き取って解析する際に使用します。
特に検定の際には必須となりますので、覚えておきましょう。
そしてもう一つ。
今回は正規分布を例にお話ししましたが、中心極限定理を適用する母集団は正規分布である必要はありません。
どのような分布でも中心極限定理は成り立ちます。
中心極限定理について分かって頂いたでしょうか?
これで検定に立ち向かうための武器を手に入れましたね!!
ISO第2回-ISO9001の原則
こんにちは、えちけんです。
前回は、ISOとは何か?についてISOの歴史、目的、そしてISOの認定を取得するメリットとともに記載いたしました。
今回は品質マネジメントシステムISO9001の原理原則について見ていきましょう。
1.ISO9001の7原則
1-1.顧客重視
品質マネジメントシステムは何の品質をマネジメントするのでしょうか?
それは、当然、扱っている製品やサービスの品質ですね。
なぜ、製品やサービスの品質をマネジメントするのでしょうか?
製品やサービスの品質が低下しないよう、また、継続的に向上させていくためです。
では、なぜ継続的な向上をするのでしょうか?
もちろん、お客様に満足をして頂くためです。
製品やサービスの品質の低下が起こらないことは当たり前ですが、継続して品質を向上していくことで、お客様の満足度は大きくなります。
つまり、製品やサービスの品質をマメジメントするのは、お客様のため、顧客重視ということです。
1-2.リーダーシップ
リーダーシップとはなんでしょうか?
みんなを導く事ですね。
どこに導くのか?
組織のTOPが描いたビジョンや目標の達成に導くんです。
それには、組織のTOPがリーダーシップを発揮する必要があります。
といっても、例えば、会社のTOPの社長だけが、リーダーシップを発揮すれば良いというわけではないです。
事業部のTOP、部のTOP、課のTOP、すべてがそれぞれの組織でのTOPという立場でリーダーシップを発揮していく必要があります。
さらに言うと、個人も自分を目標に向かって導くためのリーダーシップ、自己リーダーシップが必要となります。
1-3.人々の積極的参加
先ほどの自己リーダーシップというところにつながります。
組織のメンバー全員が自己リーダーシップを発揮して、積極的に、主体的に参加して目標達成に向かって行動するということです。
指示待ち人間にならないようにしようということですね。
そして、組織の中の全員の力を結集すれば、組織の目標を達成する事は容易です。
1-4.プロセスアプローチ
組織の各々の業務は目標達成の為のプロセスの中で相互に関係し合っています。
その事を認識し、その体制を組織の中のみんなが、見えるように構築していく事です。
下図のように、業務Aのアウトプットが業務Bのインプット情報になって、業務Bのアウトプットが業務Cのインプット情報になって・・・という事です。
伝言ゲームのようですね。
正しい伝言できるように、情報の受け渡しのところは正確に行わないと、得たい結果が得られない可能性がありますすね。
1-5.改善
周囲の状況は日々変わっていきます。
お客様が求めている製品やサービスも同じように、時代が進むとともに変わっていきます。
だから、常にその時々の状況に合わせて、我々も自分達の製品やサービス、それを作り出すための仕組みを変化していく必要があります。
そのためには、継続して改善し続ける姿勢が大切です。
1-6.客観的事実に基づく意思決定
目標を達成するために、主観的な経験や勘ではなく、データやその分析結果に基づいて意思決定を行う事が大事ということです。
経験や勘も完全に捨て去るという事ではありません。
時には経験や勘が必要になり、時にはそれに頼る場面も多々ある事でしょう。
しかし、常日頃から主観的な勘や経験になるべく頼らず、客観的事実であるデータをもとに意思決定する事が大切です。
その一時の主観的な経験や勘に頼っていては、後世まで継続して成長していくという事が難しくなるためです。
1-7.関係性管理
組織と利害関係者がWIN-WINとなるような関係性を築き続けていく事。
利害関係者といっても色々あります。
組織というものを一般の企業で考えると、利害関係者はお客様はもちろんのこと、従業員もそうです。
協力会社や地域の人達もそうです。
その人達すべてが各々の思うように進むというのは、なかなか難しいでしょう。いかにその人達と良いバランスを保ちながら進めるかを考えていく必要があります。
以上、ISO9001の七つの原則でした。
この七つの原則が、ISO9001の要求事項の各項目に散らばめられています。
注意して眺めてみて下さい。
統計第2回-σ(シグマ)の数値から何が分かるか?
こんにちは、えちけんです。
前回はσ(シグマ)とは何か?について詳しく見てきました。
そして、データを取得した際、σ(シグマ)をなぜ算出しなければいけないか、分かってもらえたと思います。
次に、σ(シグマ)の値そのものが何を示しているのか?についてみていきましょう。
これが分かると、σ(シグマ)をもっと積極的に算出しようという気持ちが湧いてくるかと思います。
では、
- σの値から何がわかるのか?
1.正規分布とは?
1-1.正規分布
σ(シグマ)の事を理解するためには、正規分布の話を避けては通れません。
正規分布とは、下の図のように横軸をデータの区間、縦軸を頻度や個数にとったとき、その分布が左右対称になるもののことです。
どんぴしゃで、左右対称にならなければいけないということではありません。
ぱっと見た感じ左右対称だな~と言えそうなら正規分布と言ってもいいでしょう。
ここで裏話です。
偶然誤差を含むデータは正規分布に従う事が、過去の偉人の調査によって分かってます。
偶然誤差というのは、測定バラツキのような、制御できない、規則性のない、偶然におきる誤差の事です。
そして、天文学者のガウスさん(1800年頃)が、偶然誤差である測定誤差が正規分布に従うことを発見しました。
従って、あまり言いませんが、正規分布を”ガウス分布”とも言います。
1-2.標準正規分布
平均が”0”でσ(シグマ)が”1”の正規分布のことです。
下のような分布ですね。
なお、標準正規分布を上の図中にもあるように
と表します。
この書式はどういう意味かというと、
です。
標準正規分布は、工程能力や検定などの統計的手法を活用する際に頻繁に出てくる考え方なので、仲良くなっておきましょう。
2.σと標準正規分布
2-1.σから何が分かるか?
標準正規分布において、横軸が-1~1のデータ区分に存在するデータは、全体の68.2%になってます。
そして、標準正規分布はσ(シグマ)が1の正規分布だった事を思い出すと、-σ~σの範囲内に存在するデータが、全体の68.2%であるということが言えます。(下図)
次に、標準正規分布において、横軸が-2~2のデータ区分に存在するデータは、全体の95.5%になってます。
そして、標準正規分布はσ(シグマ)が1の正規分布だった事を思い出すと、-2σ~2σの範囲内に存在するデータが、全体の95.5%であるということが言えます。(下図)
最後に、標準正規分布において、横軸が-3~3のデータ区分に存在するデータは、全体の99.7%になってます。
そして、標準正規分布はσ(シグマ)が1の正規分布だった事を思い出すと、-3σ~3σの範囲内に存在するデータが、全体の99.7%であるということが言えます。(下図)
2-1.σとデータの発生確率の関係
これまでで、正規分布となるデータ群を扱う場合、σの値が分かるとデータの一つ一つが、どれくらいの発生率で出るデータなのかが、予測することが出来ます。
以下に、σとデータの発生率の関係をまとめます。
データの平均値(Ave.)とσの値が分かるだけで、そのデータの発生割合が予測できるなんて、驚きですね!
データをまとめる時にσ(シグマ)がなぜ必要なのかが分かってもらえたでしょうか。
ISO第1回-ISO9001の正体
こんにちは、えちけんです。
社会人になっての数年間、開発や技術の仕事をしていた時、年に1度、上の人達がザワザワし始める時期がありました。
ISOだの、今回はこのチームだの、書類集めろだの。
正直、何をやっているのかサッパリ分かりませんでした。
その後、どうもISO9001が品質マネジメントでISO14001が環境マネジメントという区別くらいは分かるようになりましたが、「で、それって結局何?」という状況でした。
そもそも、法律や規定系の文書が苦手なえちけんは、全く興味がわかず、調べようという気にもなりませんでした。
そうこうして十数年。
会社も変わり、品質管理課という課に所属する事となり、お客様の監査を受ける立場になり、「興味ない」とは言ってられなくなりました。
- では、ISO9001って結局何なのでしょうか?
1.ISO誕生までの歩み
1-1.ISOとは?
ISOという言葉に何の意味があるのでしょう?
ISOはある言葉の略語です。その言葉とは、
International Organization for Standard
って、これからとったら、IOSじゃないか・・・と思ってしまいましたが・・・。
日本語では”国際標準化機構”といいます。
なるほど、ISOは組織の事だったのですね。
そして、ISOはスイスのジュネーブに本部をおいている、非政府機関です。
1-2.ISOの目的
ISOの活動目的は、国際的に通用する規格を制定することです。
この規格というものには、ネジなどの物に対する規格と品質マネジメントシステムなどのシステムに対する規格があります。
確かに、色々な国でそれぞれの規格で活動していたら、みんなで協力して何かをやっていこう!っていう時に障壁になりますね。
ネジ1本とっても、他の国で買ったネジを使おうと思ったら、全然使い物にならないのですけど・・・、みたいな事になると不便極まりないですね。
いや~、ISO様はこんなところでも活躍していたんですね。
1-3.ISOの歴史
1926年 万国規格協会設立
1942年 万国規格協会 活動停止
※第二次世界大戦のため
1944年 国連規格調整委員会が業務引継ぎ
1947年 国際標準化機構(ISO)設立
1987年 ISO9001制定。ISO認証制度開始。
2022年 全世界170ヵ国以上100万以上の組織が利用
最初に世界で規格を統一しよう!とみんなが集まってから、ISOが設立されるまで20年くらい経ってたんですね。
その間、戦争もあり、この時代の人はとても大変な時期を生きていたんだと思います。
そしてさらに、ISO9001が制定されるまで40年、僕が小学5年生の時にISO9001が出来たのか。
それが今や、170ヵ国、100万以上の組織で利用されているとは、このシステムが組織運営には必要なシステムだと多くの組織・人が認めているということなんですね。
1-4.ISO9001とは
ここまでで、ISOという組織がどういう組織で何をしているのかは分かったと思いますが、ISO9001ってつまり何なのでしょう?
ISO9001は”顧客に提供する製品・サービスの品質を継続的に向上させていく仕組みを構築するための要求事項を国際的に標準化したもの”です。
組織が取り扱っている製品やサービスに適した品質マネジメントシステムはそれぞれ異なってくると思います。
ただ、品質を継続的に向上させていくために、ここだけはおさえておいて!という項目を”要求事項”として整理し、標準化してくれているんですね。
1-5.ISO9001認証取得後に陥りがちなワナ
どの組織もそうだとは思うのですが、ISO認証取得が目的になっている組織が多いのではと思います。
ISO9001の認定を取得するだけで品質が向上すると勘違いをしているのか、若しくはもはや何のためにISO9001の認定を取得したのかが分からなくなっていまっているのでしょう。
これでは、多大な工数をかけて、何のためにISO認証を取得したのかが、さっぱり分からないです。
2.なぜISOを取得するのか?
最後に多大な工数と費用をかけてまで、なぜISOを取得するのか?
ISOを認定を取得するメリットをまとめます。
1.社会的信頼を獲得できる。
2.仕事の流れや手順が明確になる事で業務が効率的
になる。
3.個人特有の知識やスキルが共有化されるため、
組織の知識として後世に伝える事ができる。
4.継続的な改善により組織の成長が見込まれる。
やはり国際的に認められた規格であるISO9001の認定を取得しておけば、グローバル展開を行った際に信用の第一関門は突破できますね。
ISO9001の中の要求事項には、組織内の仕事の流れを明確にして文書化するというような事も含まれてますので、ISO9001を認定を取得する際には必然的に組織の業務をしっかり整理でき、後世にも残す事ができます。
また、特に製造業の場合、製造技術を職人的技術や知識として特定の社員が持っている場合があります。
その様な、特別な技術や知識も組織内で共有化・文書化する事で後世に残す事ができます。
そして、継続的に改善を行っていく事になりますので、組織が継続的に成長していく事ができるようになります。
ここまでで、みなさんもISO9001認定を取得しようという気持ちがわいてきたのではないでしょうか。
またISO9001の認定を取得している組織の人達も、改めてISO9001に対する見る目が変わってきたのではないでしょうか。
次回は、ISO9001の”原理・原則”について記載していきたいと思います。
統計第1回-σ(シグマ)とは?
こんにちは、えちけんです。
以前開発や技術の仕事をしていた時は、データをまとめる際に"σ(シグマ)"を算出して、製造条件変更前後で比較をしたりしていました。
しかし、今の会社に来た際、σ(シグマ)を使ってデータをまとめている人が一人もいませんでした。
みんな、統計データと言いながら、平均値と最大値と最小値 までしか算出しておらず、それだけの情報でデータを解釈して判断をしていたのです。
少し衝撃でした。
これでは、データのバラツキを加味した判断が全くできていません。
でも、みんなにσ(シグマ)を算出するように言いましたが、そもそもσ(シグマ)を算出した事が無い人たちにそんな事を言っても、何のために、どうやってσ(シグマ)を使うのかがわかりません。
そして、その時、それを説明しようとしたのですが、僕もうまく説明できませんでした。
僕も誰かに教わったというよりは、先輩達の真似をしてエクセルで算出していただけで、σ(シグマ)の原理については良く分かったいなかったのです。
では、
- σとはなんでしょう?
1.σを算出しないでデータを解釈する危険性
1-1.σ(シグマ)は正しい判断をするための武器
σ(シグマ)を算出しないでも先には進めます。
「じゃあ、σ(シグマ)なんか算出しなくてもいいじゃないか!」
という声もがるかもしれません。
しかし、σ(シグマ)を算出しないと、間違った道に進む可能性があるのです。
つまり、間違った判断をするということです。
σ(シグマ)を算出したら100%正しい道を選択できるわけではありませんが、正しい道を選択する可能性は格段に跳ね上がります。
1-2.間違った判断をする例
以下のような場合を考えてみましょう。
抵抗値ではなくても、2つのロットの違いを比較するというシチュエーションはよくありますね。
さて、まずは各Lotの平均値と最大値と最小値を算出してみましょう。
おやおや?2Lotの平均値と最大値と最小値はまったく同じ値になりました。
この結果だけで判断するとしたら、「2Lot間に抵抗値の差は無し」と判断するでしょう。
少なくとも、平均値と最大値と最小値だけでデータを判断している人達に「2Lot間に抵抗値の差は無し」という結論以外の導く道はありません。
しかし、本当にそうなのでしょうか?
この統計値には欠けているものがあります。
それはデータの”バラツキ”です。
では、どうやってデータのバラツキを表していけばいいのでしょうか。
2.データのばらつきを算出
2-1.分散
データの”バラツキ”なので、それぞれのデータが平均値からどれくらい離れているかを見えるようにしてみようと思います。
赤い線が平均値です。
赤い数字がそれぞれのデータの平均値との差分です。
これを見ると、Lot1とLot2ではそれぞれのデータの平均値との差分に差がありそうですね。
なんとなく、Lot2の方がそれぞれのデータの平均との差分が小さいように感じます。
つまり、”Lot2の方がLot1よりもデータのバラツキは小さいのではないか?”ということが言えそうです。
これを数字でバシッと言いたいところです。
どうしよう、どうしよう・・・。
Lot1とLot2それぞれの平均値との差分のデータの平均を比較すればいいのでは?
計算してみましょう。
🎵計算中🎵
なんと、Lot1とLot2の平均値からの差分の平均値は両方とも”0”になってしまいました・・・。
そうでした。そもそもデータの平均値とは、そうなるように算出した値でした・・・。
では、どうしよう、どうしよう・・・。
Lot1とLot2それぞれの平均値との差分のデータを2乗した値の平均を比較すればいいのでは?
実は、この計算方法で出てきた値は、統計学でいう”分散”という値になります。
えちけんが思いついた訳ではありません・・・💦
計算してみましょう。
なんと、これからはLot1よりもLot2の方が分散が小さい事が明確に分かりました。
つまり、Lot1よりもLot2の方がデータのバラツキが小さいのです。
ん?これで一件落着?
では、σ(シグマ)ってなんでしょう・・・?
2-2.σ(シグマ)
さて先ほど算出した分散の値、単位はなんでしょう?
今は抵抗値のデータを扱っているので、[Ω]だとバラツキの違いにイメージがつきやすいのですが・・・。
分散の算出方法を振り返ってみましょう。
たしか、単位が[Ω]のデータをすべて2乗したような・・・、つまりその時点で単位は[Ω]ではなくて、[Ω2]ですね。
これを[Ω]にするには、分散を値の平方根をとってあげればいいですね。
では計算してみましょう。
これでバラツキの値の単位がデータの単位と同じ[Ω]になりました。
イメージがつきやすいですね。
実はこの値がσ(シグマ)です。
別名、標準偏差です。
3.エクセル関数によるσ(シグマ)の算出
エクセル関数でσ(シグマ)を算出する際は、どの関数を使えば良いのでしょうか?
何種類か似たようなのがありますので注意が必要です。
以下にまとめました。
結論から言うと、STDEVのみ覚えておけば十分です。
ちなみに、“STDEV” はσ(シグマ)の別名である
Standard Deviation(標準偏差)からきてます。
表中の”標本標準偏差”とは、サンプリングデータの標準偏差という事です。
普段仕事等でデータを扱う際は、ほぼサンプリングデータしか扱いません。
例えば、製品AのロットBの抵抗値データを全数取得しました。
ロットBの抵抗値を全部取得したのだから、このデータを全て使えば母標準偏差ではないのか?と思うかもしれません。
これは、製品AがロットBしか存在しなければ正しいです。
しかし、製品AにはロットB以外にもロットCもロットDもあるということであれば、いくらロットBを全数データ取得したところで、サンプリングデータにしかなりません。
ちなみに、STDEVとSTDEV.Sは全く同じです。
以上、σ(シグマ)とは何か?について説明させて頂きました。
明日から、σ(シグマ)をどんどん算出しましょう!
ブログの説明
こんにちは、えちけんです。
僕は仕事で品質管理にふれる機会が多く、品質管理の勉強を日々行ってます。
その中で、品質管理の考え方は仕事だけではなく、自分の人生にも役立つスキルであることをしみじみと感じました。
より多くの人に品質管理の知識を広げていきたいと思ってます。
本ブログの構成は以下のような形になってます。
1.ブログの説明
このページの事です。
2.ISO9001
品質マネジメントシステムISO9001について、解説しております。
3.統計的手法
品質管理に使用する統計的な考え方について解説しております。
4.QC検定1級を取得するために
品質管理の資格の最高峰であるQC検定1級。
合格率は1桁です。
QC検定1級を取得するためのポイントを記載しております。
5.品質管理の実践
えちけんが品質管理の実践を行った時の疑問やその対処方法について記載しております。