こんにちは、シラスです。
これまで、カイ二乗検定やF検定を使って、「バラつきに異常があるか?(Yes/No)」を判定してきました。
しかし、実務の現場では「異常があります!」と報告するだけでは不十分なことがあります。
上司やクライアントは、必ずこう聞き返してくるからです。
この問いに答えるためには、「白黒つける(検定)」思考から卒業し、「幅を持って予測する(区間推定)」思考に切り替える必要があります。
今日は、バラつきシリーズの最終章。
カイ二乗分布を使って、「真のバラつき(母分散)」が収まる範囲を計算してみましょう。
目次
1. 平均値の推定とは「ココが違う」
まず、多くの人が陥る「勘違い」を正しておきましょう。
平均値の区間推定(t検定)では、推定値は以下のような形になりました。
中心からプラスマイナス均等に広がっていますね。
しかし、分散(バラつき)の推定は、均等にはなりません。
このように、下側は狭く、上側(悪い方)に広く伸びるのが特徴です。
これは、以前解説した「カイ二乗分布の非対称性(右に裾野が長い)」が原因です。
2. 推定の公式(逆算のロジック)
では、計算式を見てみましょう。
実はこれ、No.6でやった「カイ二乗検定の公式」を変形させただけなんです。
▼ 元の公式(検定統計量)
この式の主役を、$\sigma^2$(知りたい真の分散)に入れ替えると…?
▼ 今回の公式(信頼区間)
「分子」は計算した平方和 $S = (n-1)V$ そのまま。
それを、カイ二乗分布表から取ってきた「2つの値」で割り算するだけです。
- 大きい値($\chi^2_{下側}$)で割ると、区間の最小値が出ます。
- 小さい値($\chi^2_{上側}$)で割ると、区間の最大値が出ます。
3. 実践:バラつきの範囲を予言する
では、具体的な数字でやってみましょう。
新しい機械から $n=10$ 個のサンプルを取りました。
計算した不偏分散は $V = 0.025$ でした。
「この機械の真のバラつき(母分散)は、95%の確率でどの範囲にあると言えるか?」
ステップ1:分子(平方和)を計算する
まずは式の上の部分です。
ステップ2:分母(カイ二乗値)を探す
分布表から、自由度 $9$ ($10-1$)の列を見ます。
95%信頼区間なので、「右端の2.5%」と「左端の97.5%」の値を探します。
- 下側2.5%点($\chi^2_{0.975}$): 2.70 (大きい値)
- 上側2.5%点($\chi^2_{0.025}$): 19.02 (小さい値)
ステップ3:割り算して範囲を出す
最後に割り算です。
- 上限値(最悪ケース):
$0.225 \div 2.70 = \mathbf{0.083}$ - 下限値(最良ケース):
$0.225 \div 19.02 = \mathbf{0.011}$
答え: $0.011 \le \sigma^2 \le 0.083$
4. 結果の解釈:リスク管理として使う
計算結果が出ました。
「手元のデータでは分散0.025だったけど、真の実力は 0.011 〜 0.083 の間にあるよ」ということです。
ここで注目すべきは、上限値(0.083)です。
手元のデータ(0.025)だけ見て安心していませんか?
統計学的には、「運が悪ければ 0.083 までバラつく可能性がある」と警告が出ているのです。
この「最悪値(0.083)」でも規格に収まるように設計するのが、プロの仕事です。
まとめ
これで「バラつきシリーズ」は完結です。
平均値だけでなく、「バラつきの未来」まで予測できるようになれば、あなたはもう立派なデータの支配者です。
次回のシリーズでは、いよいよ複数のデータを操る「実験計画法」の深淵へと進んでいきましょう。