公開日2020年3月22日 最終更新日 2022年5月8日
みなさんこんにちは、michiです。
今回は前回の記事「二項分布の考え方」で出てきた二項分布の期待値の導出を行います。
QC検定に出るかと言われると怪しいですが、式の導出方法が気になる人は読んでみてください。
目次
二項分布の期待値の導出
前回二項分布について勉強しましたが、今回は期待値を定義に従って導出してみます。
\[期待値 E(X)=\sum_{x} x・ \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]
\[=\sum_{x} n×\scriptsize{n-1}\large{C}\scriptsize{x-1} ×p× p^{x-1} × (1-p)^{n-x} \]
\[=np\sum_{x} \scriptsize{n-1}\large{C}\scriptsize{x-1} × p^{x-1} × (1-p)^{n-x}\]
\[=np\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y}\]
\[=np \qquad ※\small{y=x-1}\]
・・・(。´・ω・)?
そうですよね、一行目から謎ですよね。いくら定義だからと言われても…
この式変形について解説していきます!
\[\]
①1行目の理解
前回のコインの計算をもう一度考えましょう。
\[ 0× \frac{1}{64} + 1× \frac{6}{64}+ ・・・ + 6× \frac{1}{64}\]
「期待値 = (得点 × その得点が出る確率) の合計」
でした。これはコインの表の数×1点としたから成り立ちましたが、もしコインの表の数×100点であった場合の期待値はどうでしょうか?
表の数×1点の時の期待値が3 ですから、表の数×100点の時は、期待値が300とかんたんにイメージできますね。これを式で表すと、
\[ 0× \frac{1}{64} + 100× \frac{6}{64}+ ・・・ + 600× \frac{1}{64}\]
\[100×( 0× \frac{1}{64} + 1× \frac{6}{64}+ ・・・ + 6× \frac{1}{64})\]
Σ(・ω・ノ)ノ!
100点は共通項なので前に持ってきて一括りにできました。つまり、期待値の定義は、
「期待値 = 得点倍率×(ある得点の出た回数 × ある得点が出る確率) の合計」 です。
そして、この「ある得点が出る確率」が二項分布の確率分布\( P(x) = \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \) なのでした。
\[\]
②1行目から3行目への式変形(一部抜粋)
次に最初の二文字(\(x・ \scriptsize{n}\large{C}\scriptsize{x}\))の式変形を考えます。
\(\scriptsize{n}\large{C}\scriptsize{x}\) は \( \frac{n!}{(n-x)! × x!}\)と書けるので、
\[ x・ \scriptsize{n}\large{C}\scriptsize{x} \]
\[= x・ \frac{n!}{(n-x)! × x!}\]
\[= x・ \frac{n・(n-1)!}{(n-x)! ×x× (x-1)!}\]
\[= \frac{n・(n-1)!}{((n-1)-(x-1))! × (x-1)!}\]
\[= n・ \frac{(n-1)!}{((n-1)-(x-1))! × (x-1)!}\]
\[=n・ \scriptsize{n-1}\large{C}\scriptsize{x-1} \]
これで、\(x\)が消えて\(n\)が出現、\(n ⇒n-1,x ⇒x-1,\)の謎がわかりました。
\[\]
また、冒頭の式変形2行目から3行目への式変形は、
\[=\sum_{x} n×\scriptsize{n-1}\large{C}\scriptsize{x-1} ×p× p^{x-1} × (1-p)^{n-x} \]
\[=np\sum_{x} \scriptsize{n-1}\large{C}\scriptsize{x-1} × p^{x-1} × (1-p)^{n-x}\]
\(p^{n}=p・p^{n-1}\) であり、\(n\)も\(p\)も「定数」であることから、\(\sum_{} \) の前面に移動できました。
\(\)
③3行目から4行目までの式変形
もうひとがんばりです。3行目の
\[=np\sum_{x} \scriptsize{n-1}\large{C}\scriptsize{x-1} × p^{x-1} × (1-p)^{n-x} \]
この式の \(x-1\) を \(y\) に置き換えます。すると下のように書き直せます。
\[=np\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y}\]
\(\sum_{} \)より右側を見てみると、二項分布の式にみえますね。
\[\]
いままで勉強してきた二項分布の式は、
\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]
これは、\(n\)個のものの中から\(x\)個選んだ時の二項分布の式でした。(\(x\)は0~\(n\)まで)
今回の場合は\(\sum_{} \)より右側で・・・
\[\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y}\]
これは、\(n-1 \)個のものの中から \(y \)個 (\(x-1\)個)選んだ時の二項分布の式を表します。(\(y\)は0~\(n-1\)まで)
\[\]
④4行目から最後までの式変形
いよいよ最後の式変形ですが、
\[=np\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y} \normalsize{=np}\]
つまり、
\[\sum_{y} \scriptsize{n-1}\large{C}\scriptsize{y} × p^{y} × (1-p)^{(n-1)-y} \normalsize{=1} \]
となります。
(。´・ω・)? なんで・・・?
実は、二項分布の式は以下の式で表されます。
\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \normalsize{=(p+q)^n =1}\]
(。´@ω@)? イミフ・・・
もっと混乱してしいまいそうですね。ひとつずつ数式の意味を考えてみましょう。
\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]
この式は、「\(n\)個のものの中から \(x\)個 選んだ時の二項分布の式」 です。
ポイントは\(x\)の値は0から\(n\)個までの値の合計(Σ)で考えているという点です。
\[\]
コインの例で説明すると「コインの表(または裏)の出る回数が、全パターン(0回の場合+1回の場合+・・・+\(n\)回)の確率」です。
今 \(n\)回コインを投げているのですから、コインの表(または裏)が出る回数は0回から\(n\)回の間になります。
したがって、「コインの表(または裏)の出る回数が、全パターン(0回の場合+1回の場合+・・・+\(n\)回)の確率」は100%(=1)になります。
\[\]
つぎに、\((p+q)^n\)ですが、これは、「コインの表(確率\(p\))またはコインの裏(確率\(q(=1-p)\))が出る試行を\(n\)回繰り返したときのコインの表または裏が出る確率」です。
コインは表か裏しかでないので、何回やってもこの確率は100%(=1)になります。
\[\]
なんか数式を使って難しそうだけど、実は当たり前のことをいっているだけでした。
\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \normalsize{=(p+q)^n =1}\]
この式を考えることで、二項分布の期待値は、
\[期待値 E(X)=\sum_{x} x・ \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \]
\[=np \qquad ※\small{y=x-1}\]
となります。
\[\]
まとめ
①「期待値 = 得点倍率×(ある得点の出た回数 × ある得点が出る確率) の合計」
②\(x\)が消えて\(n\)が出現、\(n ⇒n-1,x ⇒x-1,\)は、次数を落として計算
③\(n-1 \)個のものの中から \(y \)個 (\(x-1\)個)選んだ時の二項分布の式 で考える
④難しそうな数式も実は当たり前のことを言っていた
\[\sum_{x} \scriptsize{n}\large{C}\scriptsize{x} × p^ x × (1-p)^{n-x} \normalsize{=(p+q)^n =1}\]
\[\]今回はここまでです、次回はポアソン分布について勉強します!
[…] でした。詳細は記事「二項分布の考え方」「二項分布期待値の導出」をご参考ください。 […]
[…] ※標準偏差が(sqrt{bar{c}}) となる理由は、記事「二項分布期待値の導出」をご参考ください。 […]
[…] 次回は、期待値の式の導出を学んでいきましょう!(ちょっと厄介) […]
[…] この式は、ある値(x) と確率変数(f(x)) を掛けた合計値を表すのですが、「二項分布の期待値の導出」の記事でその意味を説明しました。 […]