検定・推定

カイ二乗検定(母分散)「この機械、バラつき増えてない?」を1つのデータで検証する手順

こんにちは、シラスです。

製造現場や品質管理の仕事をしていると、平均値(ズレ)よりも「バラつき」の方が気になる瞬間があります。

  • 「最近、この加工機の精度が落ちてきた気がする…」
  • 「新しい材料に変えたら、寸法のブレが大きくなったかも?」

平均値がど真ん中でも、バラつきが大きければ不良品は発生します。
技術者としては、感覚だけでなく、データで「バラつきが増えた(精度が落ちた)」ことを証明しなければなりません。

そんな時に使うのが、今回紹介する「母分散の検定(カイ二乗検定)」です。

1. 何をする検定なのか?

この検定は、手元のデータ(標本分散)が、「基準となるバラつき(母分散)」と比べて異常に大きいか?を判定するものです。

📊 検定の目的
  • 基準値: いつものバラつき(標準値 $\sigma_0^2$)
  • 現状: 今日のデータのバラつき(不偏分散 $V$)

「今日のバラつき $V$ は、いつもの $\sigma_0^2$ と比べて、誤差の範囲内か? それとも故障と言えるレベルか?」

これに白黒つけるのがカイ二乗検定です。

2. 検定統計量 $\chi^2$ の計算式

判定に使う数値(統計量)は、ギリシャ文字のカイ($\chi$)を使って表します。
式はとてもシンプルです。

$$ \chi_0^2 = \frac{(n-1)V}{\sigma_0^2} $$

または、平方和 $S$ を使ってこう書くこともあります。

$$ \chi_0^2 = \frac{S}{\sigma_0^2} $$

この式が意味しているのは、「基準(分母)に対して、現状のズレ(分子)が何倍あるか?」という比率です。

  • もしバラつきが基準通りなら、値は自由度 $(n-1)$ くらいになります。
  • もしバラつきが異常に大きければ、この値はドーンと跳ね上がります。

3. 実践:機械の精度を判定してみよう

では、具体的な数値でやってみましょう。

🏭 ケーススタディ

ある部品カット機の管理基準は、標準偏差 $\sigma = 0.1$(分散 $\sigma^2 = 0.01$)です。

今日、製品を $n=10$ 個抜き取って検査したところ、不偏分散は $V = 0.025$ でした。
「分散が2.5倍にもなっている!これは機械の異常か?」

(有意水準 $\alpha = 5\%$ で片側検定します)

ステップ1:仮説を立てる

  • 帰無仮説 ($H_0$): バラつきは変わっていない($\sigma^2 = 0.01$)
  • 対立仮説 ($H_1$): バラつきは大きくなった($\sigma^2 > 0.01$)

ステップ2:統計量 $\chi_0^2$ を計算する

先ほどの公式に代入します。
(※スマホで見やすいように式を改行しています)

$$ \begin{aligned} \chi_0^2 &= \frac{(10-1) \times 0.025}{0.01} \\ &= \frac{0.225}{0.01} \\ &= \mathbf{22.5} \end{aligned} $$

ステップ3:判定基準(限界値)を調べる

ここで「カイ二乗分布表」を使います。
試験や実務で使う表から、必要な部分を抜き出してみました。

見るべきポイントは以下の2つだけです。

  1. 縦の列(自由度): $n-1$ なので 9 の行を見る。
  2. 横の行(確率): 5%(0.05)の列を見る。
自由度 $\phi$ 0.10 (10%) 0.05 (5%) 0.01 (1%)
8 13.36 15.51 20.09
9 14.68 16.92 21.67
10 15.99 18.31 23.21

縦の「9」と、横の「0.05」がぶつかる場所にある数字。
それが 16.92 です。

これが今回の「デッドライン(棄却限界値)」になります。
この数値を超えてしまったら、「偶然のバラつき」としては説明がつかない異常事態だと判断します。

ステップ4:結論

  • 計算値:22.5
  • 基準値:16.92

22.5 > 16.92 なので、デッドラインを大きく超えています。
判定:有意である(帰無仮説を棄却)。

つまり、「今日の機械は、明らかにいつもよりバラつきが大きい(異常だ)」と結論づけられます。

4. あれ?表の値が左右で違う…?

さて、ここで鋭い方は、カイ二乗分布表を見てあることに気づくはずです。

正規分布(t検定など)のときは、分布が左右対称だったので、プラスの値だけ見ておけばOKでした。

しかし、カイ二乗分布表には「上側確率」「下側確率」という欄があり、値が全然違います。

自由度9のとき:
・上側 5%(右端) = 16.92
・下側 5%(左端) = 3.33

「えっ、中心(0)からプラスマイナスじゃないの?」
「3.33って何? どうやって使い分けるの?」

実は、これがバラつきの検定(カイ二乗分布)の最大の罠であり、特徴でもある「非対称性」なのです。

まとめ

まずは、1つのデータセットに対して「バラつきの異常」を見抜く手順を解説しました。

目的: 基準値に対してバラつきが増えたかを判定する。
計算: $\chi^2 = (n-1)V \div \sigma_0^2$
注意: 分布表を見る時、左右の値が違うことに気をつける。

では、なぜカイ二乗分布は左右で形が歪んでいるのでしょうか?
これを理解すると、統計学の「バラつき」に対する考え方がストンと腹に落ちます。

次回は、この「カイ二乗分布の非対称性の謎」に迫ります。

タグ

-検定・推定
-