公開日2020年4月14日 最終更新日 2022年5月29日
みなさんこんにちは、michiです。
前回までに二項分布とポアソン分布という二種類の確率分布を学びました。
確率分布を勉強していく中で「期待値」と「分散」というキーワードがでてきましたね。
この記事では「期待値」と「分散」の性質の意味を考えていきましょう。
キーワード「期待値・分散の加法性」「庭にひくワニ」
目次
①期待値の性質
確率分布の期待値 \(E(X)\)は次の性質があります。
- \(E(c) = c\)
- \(E(X+c) = E(X) + c\)
- \(E(cX) = cE(X)\)
- \(E(X+Y) = E(X) + E(Y) \qquad \)分散の加法性
\[\]
ひとつずつ内容を説明していきます。
1. \(E(c) = c\) :定数の期待値は定数になる。
2. \(E(X+c) = E(X) + c\) :変数Xが +c だけずれた場合の期待値は、変数Xの期待値から +c だけずれたものに等しい。
3. \(E(cX) = cE(X)\) :変数Xが c 倍された場合の期待値は、変数Xの期待値を c 倍したものに等しい。
4. \(E(X+Y) = E(X) + E(Y)\) :変数Xと変数Yの合計の期待値は、変数Xの期待値と変数Yの期待値の合計に等しい。
\[\]
② 期待値の性質の例
(-ω-;)ウーン 少しわかりにくいのでサイコロを例に考えましょう。
1. の場合:サイコロを1回投げた時のサイコロの「重さ」の期待値は?
サイコロを何回投げたかによらず、サイコロは一定の「重さ」です。つまり、確率分布に依存しない定数(この場合はサイコロの重さ)は常に一定になります。
\[\]
2. の場合:サイコロの目が3,4,5,6,7,8,の場合の期待値は?
サイコロの目が3~8の場合(X+2)の場合の期待値(=5.5)は、サイコロの目が1~6の場合の期待値(=3.5)に+2 をした値と等しくなります。
\[\]
3. の場合:サイコロの目が10,20,30,40,50,60の場合の期待値は?
サイコロの目が10~60の場合(X×10)の場合の期待値(=35)は、サイコロの目が1~6の場合の期待値(=3.5)を10倍した値と等しくなります。
\[\]
4. の場合:サイコロ1の目が1,2,3,4,5,6、サイコロ2の目が 11,12,13,14,15,16 の場合、二つのサイコロの合計の期待値は?
サイコロ1とサイコロ2を同時に投げて出た目の合計の期待値(=17)は、サイコロ1の出る目の期待値(=3.5)とサイコロ2の出る目の期待値(=13.5)の合計に等しくなります。
\[\]
特に 4. の性質を期待値の加法性と言います。
サイコロの例を考えると、期待値の性質は、なんか当たり前のことを言っている気がしますね。
\[\]
③分散の性質
確率分布の分散 \(V(X)\)は次の性質があります。
- \(V(c) = 0\)
- \(V(X+c) = V(X)\)
- \(V(cX) = c^2V(X)\)
- \(V(X+Y) = V(X) + V(Y) \qquad \)分散の加法性
- \(V(X+Y) = V(X) + V(Y)+2Cov(X,Y) \quad \)分散の加法性が成り立たない場合
\[\]
期待値の性質とは全然違いますね。
分散の性質を説明する前にそもそも分散とは何だったでしょうか?
(。´・ω・)?
\[\]
分散は一言でいえば、データの「ばらつき」を表す値です。
(分散の平方根が標準偏差で、標準偏差もまた「ばらつき」の指標です。)
それでは、ひとつずつその性質をみていきましょう。
\[\]
1. \(V(c) = 0\) :定数の分散は 0 になる。
2. \(V(X+c) = V(X)\) :変数Xが +c だけずれた場合の分散は、変数Xの分散に等しい。
3. \(V(cX) = c^2E(X)\) :変数Xが c 倍された場合の分散は、変数Xの分散を \(c^2\) 倍したものに等しい。
4. \(V(X+Y) = V(X) + V(Y)\) :変数Xと変数Yの合計の分散は、変数Xの分散と変数Yの分散の合計に等しい。 ※分散の加法性が成り立つ場合
5. \(V(X+Y) = V(X) + V(Y)+2Cov(X,Y)\) :変数Xと変数Yの合計の分散は、変数Xの分散と変数Yの分散の合計に共分散(Cov(X,Y))の2倍を足したものに等しい。 ※分散の加法性が成り立たない場合
\[\]
④ 分散の性質の例
(◎ω◎;)ウーーン わかりにくいのでサイコロを例にまた考えましょう。
1. の場合:サイコロを1回投げた時のサイコロの「重さ」の分散(ばらつき)は?
サイコロは何回投げても「重さ」は一定のため、「重さ」の「ばらつき」に変化はないですよね?つまり、定数の分散は 0 になります。
\[\]
2. の場合:サイコロの目が3,4,5,6,7,8,の場合の分散は?
サイコロの目が何であろう(今回の場合は、本来の目+2)と、その出方のばらつきは同じと言えます。
ポイントは期待値と違い、「出た目が何か」が重要ではなく、「出方(それぞれの目が出る確率)のばらつき」に着目している点です。
\[\]
3. の場合:サイコロを100回なげたときの出た目の分散は、10回投げた時の分散の何倍?
答えは100倍になるのですが、サイコロの例では実感がわきにくいですよね。この記事の最後に解説を載せるので、最後まで読んでみてください。
\[\]
4. の場合:通常サイコロとイカサマサイコロの合計値の分散は?
「通常サイコロの分散 と イカサマサイコロの分散 の合計」と等しくなります。
これは通常サイコロとイカサマサイコロが互いに影響を及ぼさない(=分散の加法性が成り立つ)場合に適用できます。
つまり、通常サイコロの目の出方とイカサマサイコロの目の出方が独立している条件です。
\[\]
5. の場合:イカサマサイコロ1とイカサマサイコロ2は、重りの量に差があり(=分散が異なる)、互いのある一面に弱い磁石が埋め込まれている。イカサマサイコロ1と2の合計値の分散は?
4の場合と条件が変わりました。
埋め込まれた磁石が作用し、互いの目の出方に影響を及ぼします。(=分散の加法性が成り立たない)
そのため、\(2Cov(X,Y)\) (=共分散) という、互いの相互作用を考慮する必要があります。
\[\]
※QC検定2級では、過去問見る限りは共分散の値を求めることはなさそうです。
数値を計算する場合は、分散の加法性が成り立つ場合で出題されます。
※また、計算問題では分散を求めるのではなく、標準偏差=\(\sqrt{分散}\) を求められることが多いです。
\[\]
例)全長の標準偏差 「3」の製品Aと全長の標準偏差 「4」の製品Bをくっつけた時の合計の全長の標準偏差は?
\[全長の標準偏差= \sqrt{3^2+4^2}=5\]
\[\]
⑤期待値の定義と分散の定義
かなり導入説明が長くなりましたが、そもそも期待値と分散の定義は何でしょうか?
(。´・ω・)?
二項分布やポアソン分布などの離散型の確率変数の期待値は以下の式です。
\[E(X)=\sum_{x}{xf(x)}\]
この式は、ある値\(x\) と確率変数\(f(x)\) を掛けた合計値を表すのですが、「二項分布の期待値の導出」の記事でその意味を説明しました。
もしよかったら復習してみてください。
\[\]
次に分散の定義を考えるのですが、期待値 \(E(X)=μ=定数\) とします。※期待値が変動しない値という条件です。
平方和の記事で書いたように、分散のばらつきの定義は {測定値(X) – 期待値(μ)}\(^2\) で以下のようにあらわします。
\[V(X)=E((X-μ)^2)\]
\[\]
(。´・ω・)? あれ? と思いませんでしたか?
不偏分散では、自由度\(n-1\)で平方和を割り算していました。しかし今回の分散では、自由度で割っていません。
これは母分散と標本分散の違いなのですが、その詳細は次回「母集団と標本」の記事をご参考ください。
\[\]
⑥分散の式変形
分散の定義式は \(V(X)=E((X-μ)^2)\) でしたが、使いやすい形に変形しましょう
\[V(X)=E((X-μ)^2)=E((X^2-2μX+μ^2)\]
\[=E(X^2)-2μE(X)+μ^2\]
この式変形は期待値の性質を利用しています。
いま、期待値\((μ)\) は定数であり、\(E(X)=μ\) としたので、
\[\quad V(X)=E(X^2)-2μE(X)+μ^2\]
\[ =E(X^2)-μ^2 \]
\[\qquad =E(X^2)-(E(X))^2 \]
これは「庭にひくワニ」と覚えられます。
「に乗の和 引く 和のに乗」です。
※「平方和の式の暗記法」で覚えた語呂「庭にひくサンプル分のワニ」と比較すると「サンプル分の」がなくなっています。これは母分散を考えているためです・・・
\[\]
⑦\(V(cX)=c^2V(X)\) になる理由
最後に、「④分散の性質の例」で説明を後回にしていた \(V(cX)=c^2V(X)\) の理由を考えていきます。
(ㆁωㆁ*)わくわく
直感的に説明すると、「分散={測定値(x) – 期待値(μ)}\(^2\)」でした。
差分を二乗したものが分散なので、測定値\(x\)と期待値\((μ)\)が\(c\)倍されると、分散は\(c^2\)倍されます。
\[\]
数式を使って説明すると・・・ \(X=cX’ , \quad μ=cμ’\) して
\[V(X)=V(X^2-2μX+μ^2)\]
\[=V(c^2X’^2-2c^2μ’X’+c^2μ’^2 )\]
\[=V(c^2(X’^2-2μ’X’+μ’^2))\]
\[=c^2V(X’) \]
たしかに、測定値\(X\)が\(c\)倍されたとき、分散は\(c^2\) 倍されています。
\[\]
まとめ
①期待値の性質は直感的にわかりやすい
②期待値の計算例はサイコロの出る目で考えるべし
③分散の性質は「ばらつきの変化」に着目すれば理解しやすい
④分散の計算例はサイコロの出方のばらつきで考えるべし
⑤母分散では分散は「分散={測定値(x) – 期待値(μ)}\(^2\)」
⑥母分散では、「庭にひくワニ」。不偏分散では「庭にひくサンプル分のワニ」
⑦差分を二乗したものが分散だから、変数\(c\)倍で分散\(c^2\)倍
\[\]
次回は検定統計量の基本、「母集団と標本」について勉強していきましょう!
[…] 次回は期待値と分散の性質について勉強していきましょう! […]
[…] 1行目から2行目の変形で、なんで(frac{1}{n}→frac{1}{n^2}) になるんだ? と思った方は、「期待値と分散の性質」をご参考ください。 […]