QC検定2級 出題範囲

二項分布期待値の導出

公開日2020年3月22日  最終更新日 2022年5月8日

みなさんこんにちは、michiです。

今回は前回の記事「二項分布の考え方」で出てきた二項分布の期待値の導出を行います。

QC検定に出るかと言われると怪しいですが、式の導出方法が気になる人は読んでみてください。

目次

二項分布の期待値の導出

前回二項分布について勉強しましたが、今回は期待値を定義に従って導出してみます。

\[期待値 E(X)=\sum_{x} x・ \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]

\[=\sum_{x} n×\scriptsize{n-1}\large{C}\scriptsize{x-1} ×p× p^{x-1} × (1-p)^{n-x} \]

\[=np\sum_{x} \scriptsize{n-1}\large{C}\scriptsize{x-1} × p^{x-1} × (1-p)^{n-x}\]

\[=np\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y}\]

\[=np \qquad ※\small{y=x-1}\]

・・・(。´・ω・)?

そうですよね、一行目から謎ですよね。いくら定義だからと言われても…

この式変形について解説していきます!

\[\]

①1行目の理解

前回のコインの計算をもう一度考えましょう。

\[ 0× \frac{1}{64} + 1× \frac{6}{64}+ ・・・ + 6× \frac{1}{64}\]

「期待値 = (得点 × その得点が出る確率) の合計」

でした。これはコインの表の数×1点としたから成り立ちましたが、もしコインの表の数×100点であった場合の期待値はどうでしょうか?

表の数×1点の時の期待値が3 ですから、表の数×100点の時は、期待値が300とかんたんにイメージできますね。これを式で表すと、 

\[ 0× \frac{1}{64} + 100× \frac{6}{64}+ ・・・ + 600× \frac{1}{64}\]

\[100×( 0× \frac{1}{64} + 1× \frac{6}{64}+ ・・・ + 6× \frac{1}{64})\]

Σ(・ω・ノ)ノ! 

100点は共通項なので前に持ってきて一括りにできました。つまり、期待値の定義は、

「期待値 = 得点倍率×(ある得点の出た回数 × ある得点が出る確率) の合計」 です。

そして、この「ある得点が出る確率」が二項分布の確率分布\( P(x) = \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \)  なのでした。

\[\]



②1行目から3行目への式変形(一部抜粋)

次に最初の二文字(\(x・ \scriptsize{n}\large{C}\scriptsize{x}\))の式変形を考えます。

\(\scriptsize{n}\large{C}\scriptsize{x}\) は \( \frac{n!}{(n-x)! × x!}\)と書けるので、

\[ x・ \scriptsize{n}\large{C}\scriptsize{x} \]

\[= x・ \frac{n!}{(n-x)! × x!}\]

\[= x・ \frac{n・(n-1)!}{(n-x)! ×x× (x-1)!}\]

\[= \frac{n・(n-1)!}{((n-1)-(x-1))! × (x-1)!}\]

\[= n・ \frac{(n-1)!}{((n-1)-(x-1))! × (x-1)!}\]

\[=n・ \scriptsize{n-1}\large{C}\scriptsize{x-1} \]

これで、\(x\)が消えて\(n\)が出現、\(n ⇒n-1,x ⇒x-1,\)の謎がわかりました。

\[\]

また、冒頭の式変形2行目から3行目への式変形は、

\[=\sum_{x} n×\scriptsize{n-1}\large{C}\scriptsize{x-1} ×p× p^{x-1} × (1-p)^{n-x} \]

\[=np\sum_{x} \scriptsize{n-1}\large{C}\scriptsize{x-1} × p^{x-1} × (1-p)^{n-x}\]

\(p^{n}=p・p^{n-1}\) であり、\(n\)も\(p\)も「定数」であることから、\(\sum_{} \) の前面に移動できました。

\(\)

③3行目から4行目までの式変形

もうひとがんばりです。3行目の

\[=np\sum_{x} \scriptsize{n-1}\large{C}\scriptsize{x-1} × p^{x-1} × (1-p)^{n-x} \]

この式の \(x-1\) を \(y\) に置き換えます。すると下のように書き直せます。

\[=np\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y}\]

\(\sum_{} \)より右側を見てみると、二項分布の式にみえますね。

\[\]

いままで勉強してきた二項分布の式は、

\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]

これは、\(n\)個のものの中から\(x\)個選んだ時の二項分布の式でした。(\(x\)は0~\(n\)まで)

今回の場合は\(\sum_{} \)より右側で・・・

\[\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y}\]

これは、\(n-1 \)個のものの中から \(y \)個 (\(x-1\)個)選んだ時の二項分布の式を表します。(\(y\)は0~\(n-1\)まで)

\[\]



④4行目から最後までの式変形

いよいよ最後の式変形ですが、

\[=np\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y} \normalsize{=np}\]

つまり、

\[\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y} \normalsize{=1} \]

となります。

(。´・ω・)? なんで・・・?

実は、二項分布の式は以下の式で表されます。

\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \normalsize{=(p+q)^n =1}\]

(。´@ω@)?  イミフ・・・

もっと混乱してしいまいそうですね。ひとつずつ数式の意味を考えてみましょう。

\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]

この式は、「\(n\)個のものの中から \(x\)個 選んだ時の二項分布の式」 です。

ポイントは\(x\)の値は0から\(n\)個までの値の合計(Σ)で考えているという点です。

\[\]

コインの例で説明すると「コインの表(または裏)の出る回数が、全パターン(0回の場合+1回の場合+・・・+\(n\)回)の確率」です。

今 \(n\)回コインを投げているのですから、コインの表(または裏)が出る回数は0回から\(n\)回の間になります。

したがって、「コインの表(または裏)の出る回数が、全パターン(0回の場合+1回の場合+・・・+\(n\)回)の確率」は100%(=1)になります。

\[\]

つぎに、\((p+q)^n\)ですが、これは、「コインの表(確率\(p\))またはコインの裏(確率\(q(=1-p)\))が出る試行を\(n\)回繰り返したときのコインの表または裏が出る確率」です。

コインは表か裏しかでないので、何回やってもこの確率は100%(=1)になります。

\[\]

なんか数式を使って難しそうだけど、実は当たり前のことをいっているだけでした。

\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \normalsize{=(p+q)^n =1}\]

この式を考えることで、二項分布の期待値は、

\[期待値 E(X)=\sum_{x} x・ \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]

\[=np \qquad ※\small{y=x-1}\]

となります。

\[\]



まとめ

①「期待値 = 得点倍率×(ある得点の出た回数 × ある得点が出る確率) の合計」

②\(x\)が消えて\(n\)が出現、\(n ⇒n-1,x ⇒x-1,\)は、次数を落として計算

③\(n-1 \)個のものの中から \(y \)個 (\(x-1\)個)選んだ時の二項分布の式 で考える

④難しそうな数式も実は当たり前のことを言っていた

\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \normalsize{=(p+q)^n =1}\]

\[\]今回はここまでです、次回はポアソン分布について勉強します!

⇒オススメ書籍はこちら

⇒サイトマップ

POSTED COMMENT

  1. […] でした。詳細は記事「二項分布の考え方」「二項分布期待値の導出」をご参考ください。 […]

  2. […] ※標準偏差が(sqrt{bar{c}}) となる理由は、記事「二項分布期待値の導出」をご参考ください。 […]

  3. […] 次回は、期待値の式の導出を学んでいきましょう!(ちょっと厄介) […]

  4. […] この式は、ある値(x) と確率変数(f(x)) を掛けた合計値を表すのですが、「二項分布の期待値の導出」の記事でその意味を説明しました。 […]

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です