検定・推定

カイ二乗分布の非対称性|なぜ「上側」と「下側」で値が違うのか?バラつき検定の罠

こんにちは、シラスです。

前回の記事で、1つの機械のバラつきを判定する「カイ二乗検定」を行いました。

その際、判定基準となる「カイ二乗分布表」を見て、違和感を覚えませんでしたか?

🤔 素朴な疑問

「正規分布(t検定など)のときは、右側が $+1.96$ なら、左側は $-1.96$ だったよね?
なんでカイ二乗検定は、右側(16.92)と左側(3.33)で、全然違う数字になるの?

実は、これこそが「バラつき(分散)」を扱うときに避けて通れない「非対称性の罠」なのです。

今日は、なぜこんな歪んだ形になるのか、その理由を直感的に解説します。

1. 正規分布 vs カイ二乗分布

百聞は一見にしかず。まずは実際の分布の形を見てみましょう。

  • 正規分布: 平均値(0)を中心に、左右対称の美しい釣鐘型です。
  • カイ二乗分布(上図): 「0」の壁にぶつかって、左側が絶壁になり、右側にだけなだらかに伸びています。

なぜ、こんな形になるのでしょうか?
理由は、カイ二乗検定が「二乗(平方)」の世界の話だからです。

2. 理由A:左側に「0の壁」があるから

分散(バラつき)を計算するとき、私たちは必ず「二乗」をします。

$$ (x - \bar{x})^2 $$

マイナスの値を二乗するとプラスになりますよね?
つまり、バラつきの世界には「マイナス」が存在しません。

  • どんなにバラつきが小さくても、最小値は「0」です。
  • 正規分布のように「マイナス側」に広がることができず、左側に「0という鉄壁」が存在します。

だから、分布の左側はスパッと断ち切られたような形になるのです。

3. 理由B:右側は「暴走」するから

一方で、右側(プラス方向)には制限がありません。

しかも、「二乗」という計算は、「外れ値(大きなズレ)」を極端に巨大化させる性質があります。

🔥 二乗の増幅作用
  • ズレが 2 のとき → $2^2 = 4$
  • ズレが 10 のとき → $10^2 = 100$

少しでも異常なデータが混じると、カイ二乗値($\chi^2$)は右側にビヨーンと大きく引っ張られます。
その結果、右に長い裾野(すその)を持つ形になるのです。

4. QC検定での注意点:上側と下側

この「左右非対称」という性質は、試験や実務で表を読み取る時にミスを誘発します。

「異常(バラつきすぎ)」を検定したいときは、分布の右端(上側確率)を見ます。
逆に、「精度が良すぎる(データ改ざんの疑い?)」を検定したいときは、左端(下側確率)を見ます。

見たいもの 見るべき場所 表の記号(例) 値のイメージ
バラつきすぎ
(異常)
右端 5%
(上側確率)
$\chi^2_{0.05}$ 大きい数字
(例: 16.92)
バラつかなすぎ
(不自然)
左端 5%
(下側確率)
$\chi^2_{0.95}$ 0に近い数字
(例: 3.33)

※表によっては「0.95」が「左側の面積」を指す場合と、「右側の面積」を指す場合がありますが、「大きい数字が右(異常)、小さい数字が左(静寂)」と覚えておけば間違いありません。

まとめ

カイ二乗分布が歪んでいる理由は、「バラつきにはマイナスがなく、プラス方向には青天井だから」でした。

左側: 0の壁がある。
右側: 二乗によってどこまでも伸びる。

さて、ここまでは「1つの機械」のバラつきを見てきました。
しかし、実務で本当によくあるのは、こんなシチュエーションではないでしょうか?

  • 「古い機械Aと、新しい機械B。どっちが優秀(バラつきが小さい)か比べたい!
  • 「工場Aと工場B、品質が安定しているのはどっち?」

2つのバラつきを比較するとき、カイ二乗検定は使えません。
次回は、2つの怪獣(バラつき)を戦わせるためのリング、「F検定」の世界へ進みます。

タグ

-検定・推定
-