公開日2020年8月29日 最終更新日 2021年9月19日
みなさんこんにちは、michiです。
前回の記事では二元配置実験について学びました。
今回はサンプリングについて学んでいきます。
今回はそんなに長くないですよ
キーワード:「単純、層別、集落、系統、二段、有意」
目次
①サンプリングとは
サンプリングとは、母集団から標本を抽出することです。
ある母集団の特性や合否を判断したくても、母集団が大きすぎたり、将来の予測に対しては、全てのデータを抽出することができないため、サンプリングをします。
詳しくは、記事「母集団と標本」をご参照ください。
\[\]
さて、サンプリングといっても、次の6種類があります。
- 単純ランダムサンプリング
- 層別サンプリング
- 集落サンプリング
- 系統サンプリング
- 二段サンプリング
- 有意サンプリング
それでは、それぞれについて解説していきます。
\[\]
②単純ランダムサンプリング
単純ランダムサンプリングとは、「母集団からランダムにサンプリングすること」 になります。
もう少し格式張って言うと、
「\(n\) 個のサンプリング単位の可能な全ての組み合わせが同じ確率で抽出される方法」となります。
(;-ω-)ウーン
\[\]
例えば、ビンゴ大会でどの数字が抽出されるかは、完全にランダムなので、単純ランダムサンプリングになります。
※同じ数字が繰り返し抽出されないので、ビンゴ大会は正確には少し違います
\[\]
③層別サンプリング
層別サンプリングとは、「いくつかの層に分け、その分けた層からサンプリングすること」になります。
もう少し格式張って言うと、
「サンプルの部分が様々な層から抽出され、かつ、各層が少なくとも一つのサンプリング単位を持つように抽出されるサンプリング」 となります。
(。´・ω・)?
\[\]
例えば、ある工場の労働環境を調べるために、各部門で働く20代、30代、40代、50代の社員をそれぞれ2名ずつ抽出する場合が、層別サンプリングになります。
\[\]
この時、1次サンプルは層別された集団を作ることになるため、層間のばらつきは大きく、層内のばらつきは小さくなります。
\[\]
\[\]
④集落サンプリング
集落サンプリングとは、「母集団をいくつかの集落(クラスター)に分けてサンプリングし、その集落の全数をサンプリングすること」 になります。
格式張って言うと、
「全クラスターからのランダムサンプリングで、サンプリングされたクラスターを構成する全サンプリング単位が、サンプリングに含まれるようにしたサンプリング」 です。
\[\]
例えば、全国コンビニチェーンA社が、コンビニで働く従業員の労働環境を調査する場合を考えます。
全国にあるチェーン店の中からランダムにコンビニを抽出し、抽出されたコンビニで働く全員に対して調査をします。
この時、一次サンプリングの集落はばらつきが小さく、集落内のばらつきは大きくなります。
(。´・ω・)?
例えば、B市にあるコンビニとC市にあるコンビニでは、働く人の構成員(店長、アルバイト、パート、学生・・・)に大きな差はないものの、構成員内では差があると考えられます。
店長しかいないコンビニってありませんよね?
\[\]
\[\]
⑤系統サンプリング
系統サンプリングとは、「母集団に番号をつけて、一定間隔でサンプリングすること」 となります。
単純ランダムサンプリングを簡略化した手法で、単純ランダムサンプリングより精度が低いといわれています。
精度が低いといわれる理由は「一定の間隔でしか抽出できないから」です。
(。´・ω・)?
\[\]
例えば、自動餃子製造機を考えています。
自動餃子製造機で製造されている餃子を、100個に1個をサンプリングしているとします。
餃子製造機には、具材を混ぜたり、皮に包んだり、冷凍したりといった工程があります。
その中で、例えば皮に包む工程について考えます。
この工程では、20個を同時に包み、その後順番に次の工程へ運ばれているとします。
すると100個ずつサンプリングしていては、常に同じ場所で包んだ餃子製造機しか調査していないことになります。
\[\]
このように、系統サンプリングは仕組み化できるので、簡単なサンプリングにはなるのですが、その精度は悪くなります。
\[\]
\[\]
⑥二段サンプリング
二段サンプリングとは、「母集団からいくつかのサンプルを採り、さらに各サンプル内でいくつかのサンプルを採ること」 になります。
格式張って言うと、
「サンプルを段階的に選択したサンプリングで、各段階でのサンプリング単位がその前段階に選ばれたより大きなサンプリング単位から抽出されるようになっているサンプリング」 となります。
(´・ω・`)
ややこしいですが、「単純ランダムサンプリングを、段階的に繰り返している」と考えればわかりやすいと思います。
\[\]
層別サンプリングのように、母集団を層別したり、集落サンプリングのように母集団を集落に分けることはしません。
一次サンプルは母集団からランダムに選ばれ、二次サンプルは一次サンプルの中から選ばれます。
単純ランダムサンプリングを複数回するサンプリングを「多段サンプリング」といいます。
\[\]
\[\]
⑦有意サンプリング
有意サンプリングとは、「母集団を構成する要素がサンプリングとして選ばれる確率が等しくないサンプリングのこと」 になります。
例えば、製品展示会用のサンプルを選択する場合などが該当します。
くじ引きで決めない方法と考えればわかりやすいです。
普通、展示会に出すようなサンプルは一番見た目がきれいなものを出しますよね?
\[\]
このように、明らかに意思・意図がはいいているサンプリングになります。
ですので、単純ランダムサンプリングや層別サンプリング、集落サンプリング、系統サンプリング、二段サンプリングとは毛色の違うサンプリングとなります。
\[\]
\[\]
まとめ
①サンプリングとは、母集団から標本を抽出すること
②単純ランダムサンプリングは、単純にランダム
③層別サンプリングは、層別してからサンプリング
④集落サンプリングは、集落に分けて、集落内を全数抽出
⑤系統サンプリングは一定間隔で抽出
⑥二段サンプリングは単純ランダムサンプリング×2
⑦有意サンプリングは、見栄を張ったサンプリング
今回は、数式もなく概念的な内容でした。
少し記事は短めですが、QC検定の出現頻度も高めなので、しっかり勉強しましょう。
次回は検査について勉強していきます。
[…] 次回は「サンプリング」について学んでいきましょう。 […]
[…] 前回の記事ではサンプリングについて勉強しました。 […]