QC検定2級 出題範囲

カイ二乗分布とは

公開日2020年4月27日  最終更新日 2022年6月12日

みなさんこんにちは、michiです。

前回の記事では母集団と標本の違いについて勉強しました。

今回は \(χ^2\)分布(カイ二乗分布)について勉強していきましょう!

キーワード「\(χ^2\) カイ二乗分布」

①\(χ^2\) カイ二乗分布とは?

いままでの記事で、正規分布、二項分布、ポアソン分布、について勉強してきました。

今回勉強する \(χ^2\) カイ二乗分布は「標準正規分布を基にした確率分布(検定統計量)」になります。

\[\]

具体的な式は以下の通りです。

\[χ^2=Z_1^2+Z_2^2+・・・+Z_n^2\]

この式で表される確率分布を 「自由度\(n-1\) の\(χ^2\)分布(カイ二乗分布)」と言います。

※データ数が\(n\) なので、自由度は\(n-1\) となります。

“φ(・ω・。)フムフム…

\[\]

このとき、統計量\(Z\)は標準化した統計量で、 \(Z=\frac{x-μ}{σ}\) (\(x\):測定値、\(μ\):母平均、\(σ\):母標準偏差)です。

これをグラフで書くと、以下のようになります。

正規分布に比べると、だいぶ見た目が変わっていますね。

このグラフからわかる特徴について考えてみましょう。

\[\]



②なぜ左右対称なのか

正規分布では、母平均(標準正規分布では 0 )を中心に左右対称につりがね型の分布をしていました。

カイ二乗分布のグラフをみて、「左右非対称」ということに気づきます。

なぜ左右非対称になるのでしょうか? 

(。´・ω・)?

\[\]

 カイ二乗分布の式を変形させてみると、

\[χ^2=Z_1^2+Z_2^2+・・・+Z_n^2\]

\[=(\frac{x_1-μ}{σ})^2+(\frac{x_2-μ}{σ})^2+・・・+(\frac{x_n-μ}{σ})^2\]

カイ二乗分布では、測定値と母平均との差を二乗しているために、マイナスの値はなくなります。

さらに、二乗の和の合計が\(χ^2\)カイ二乗分布となるので、左右非対称の形になってしまうのです。

※上のイメージ図では、標準正規分布の中心(= 0)から、測定値との差を二乗したものを5点分(自由度 5 の場合)を足した確率分布をプロットしています。

\[\]

③なぜ自由度によって形が変わるのか?

さて、カイ二乗分布の特徴は左右非対称というだけではありません。

自由度によって形がかわる」というのもその特徴です。

\[\]

カイ二乗分布は統計量\(Z\)の二乗の和です。

\(Z^2\)は「マイナス」にならないので、測定数\(n\) が増えれば、必然的にカイ二乗の値も増えます。

\[\]

ここでのポイントは、統計量\(Z\)は「標準化された統計量」ということです。

標準化とは、「正規分布のミカタ」の記事より

\[平均値(期待値)=0、分散=1^2 \]

の分布です。

つまり、標準化によって、元のデータの平均や標準偏差が何であろうと、同じ方法で統計量を評価できることを示唆してます。

\[\]



④実用的には 「平方和÷母分散」

カイ二乗分布について何となくわかってきました。

実用的にはどう使えばよいのでしょうか?

(。´・ω・)?

\[\]

カイ二乗分布の定義式をもう少し変形させてみましょう。

\[χ^2=Z_1^2+Z_2^2+・・・+Z_n^2\]

\[=(\frac{x_1-μ}{σ})^2+(\frac{x_2-μ}{σ})^2+・・・+(\frac{x_n-μ}{σ})^2\]

\[=\frac{1}{σ^2}((x_1-μ)^2+(x_2-μ)^2+・・・+(x_n-μ)^2)\]

\[=\frac{1}{σ^2}\sum (x_i – μ)^2\]

\(\frac{1}{σ^2}\) を無視すると、見覚えのある形が出てきました。これは・・・

平方和」の定義ですよね。

(´・ω・`)モキュ?

\[\]

詳細は、記事「平方和の式の暗記法」をご参考ください。

つまり、カイ二乗分布は、

\[χ^2=\frac{S}{σ^2}=\frac{平方和}{母標準偏差^2(=母分散)}\]

ということになります。

Σ(・ω・ノ)ノ!

\[\]

⑤なぜ\(χ^2\) カイ二乗分布を使うのか

カイ二乗分布の統計量が「平方和」と「母標準偏差\(^2\)」で表されることがわかりました。

平方和も母標準偏差も「ばらつき」を評価するものでした。

つまり、カイ二乗分布は評価したい集団の「ばらつき」の評価に使います。

\[\]

ここで一つの疑問が生じます。

なぜわざわざ平方和を母標準偏差で割ったものを使うのか?」です。

・・・(。´・ω・)?

\[\]

この疑問に答えるために、カイ二乗分布の式をもう少し変形させてみます。

\[χ^2=\frac{S}{σ^2}=\frac{ΦV}{σ^2}\]

\[=Φ\frac{s^2}{σ^2}=自由度 × \frac{標本の標準偏差^2(=不偏分散)}{母標準偏差^2(=母分散)}\]

自由度は定数になるので今回は無視して考える(検定で説明します)と、カイ二乗分布は母標準偏差と、標本の標準偏差の比を評価しているだけのようです。

つまり、カイ二乗分布は母集団の「ばらつき」と標本の「ばらつき」の違いを評価するために使われているのです。

\[\]

⑥例題

説明が続いたので、例題を一問といてみましょう。

問)母標準偏差 0.3 の正規分布をする母集団から、サンプルを13個取り出したときのサンプルの平均値は 6.7、平方和は 4.05 であった。この時のカイ二乗統計量をもとめよ。

答)

\[χ^2=\frac{平方和}{母標準偏差^2}=\frac{4.05}{0.3^2}\]

\[=45\]

この問題のポイントは

  • サンプル数に惑わされない
  • サンプルの平均値に惑わされない

カイ二乗の統計量を計算するには、標本の平方和と母標準偏差がわかればOKです。

\[\]



まとめ

①\(χ^2\)カイ二乗分布は、\(χ^2=Z_1^2+Z_2^2+・・・+Z_n^2\)

②\(χ^2\)カイ二乗分布は、左右非対称な分布関数

③\(χ^2\)カイ二乗分布は、自由度(サンプル数)によって形が変化

④\(χ^2\)カイ二乗分布は、\(χ^2=\frac{平方和}{母標準偏差^2(=母分散)}\)

⑤\(χ^2\)カイ二乗分布は母集団の「ばらつき」と標本の「ばらつき」の違いを評価

⑥標本の平方和と母標準偏差がわかれば、統計量を計算できる。

\[\]

今回は\(χ^2\)カイ二乗分布とは何かについて勉強しました。

\(χ^2\)カイ二乗分布を使った検定や推定の方法については、またの機会にまとめます。

次回はF分布について勉強していきましょう!

⇒オススメ書籍はこちら

⇒サイトマップ



POSTED COMMENT

  1. […] 前回勉強した(χ^2)カイ二乗分布では、母分散と標本の分散のばらつきを評価していました。 […]

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です