検定・推定

【完全実践】母分散のカイ二乗検定&区間推定|仮説から信頼区間まで一気通貫で解く全手順

😣 こんな悩みはありませんか?
  • 母分散の検定と区間推定、それぞれ別々に学んだけど、いざ問題になると手順がごちゃごちゃになる
  • カイ二乗分布表の「上側確率」の読み方がいつまでも曖昧で、χ²(φ, 0.05) と χ²(φ, 0.95) のどちらを使うか迷う
  • 「片側検定(上側・下側)」と「両側検定」で棄却限界値が変わる理由がピンとこない
  • 検定で棄却した後、同じデータで区間推定をするときの手順がつながらない
✅ この記事でわかること
  • 母分散の検定と区間推定に必要な「3つの武器」の全体像
  • 1つの具体例で仮説設定→検定統計量→棄却判定→信頼区間を一気通貫で実践する手順
  • 片側・両側で「どのカイ二乗値を見るか」を一発で判定できるフローチャート
  • QC検定で頻出の「母分散の検定→そのまま区間推定へ」の流れを完全マスター
🎯 先に結論

母分散の検定も区間推定も、使う分布はカイ二乗分布、使う統計量はχ₀² = S / σ₀²(Sは偏差平方和)の1本です。検定では「この統計量が棄却域に入るか?」を見て、区間推定では「この統計量を使ってσ²の取りうる範囲を計算する」だけ。同じ道具で2つのことができるので、一緒に学ぶと理解が格段に深まります。

母分散の検定(カイ二乗検定)と区間推定は、QC検定では1つの問題の中でセットで出題されることが非常に多いテーマです。しかし、多くの参考書では「検定」と「推定」を別の章で説明しているため、実際の問題でつなげて解く練習が不足しがちです。

この記事では、「クッキー工場のバラつき問題」という1つのストーリーを使って、仮説の立て方から信頼区間の計算まで、一気通貫でやってみます。

🗺️ 検定・推定の全体像を知りたい方へ
📖 【完全版】検定・推定の学習ロードマップ|初心者が「どの検定を使うか」迷わなくなる全28記事の読み順ガイド →

この記事は上記ロードマップの一部です。全体像から学びたい方はこちらからどうぞ。

母分散の検定・推定に必要な「3つの武器」

実践に入る前に、3つの前提知識を確認しておきましょう。これが揃えば、あとは手順に沿って機械的に解くだけです。

🔧 武器① 検定統計量 χ₀²

母分散の検定・推定で使う検定統計量は、以下の1つだけです。

📐 検定統計量

χ₀² =
S
σ₀²
=
(n − 1) s²
σ₀²

S = 偏差平方和 = Σ(xᵢ − x̄)²、s² = 不偏分散 = S/(n−1)、σ₀² = 帰無仮説で仮定する母分散

直感的に言うと、この式は「データから計算したバラつき(S)を、基準となるバラつき(σ₀²)で割ったもの」です。もしバラつきが基準通りなら、この値はだいたい自由度φ(= n−1)くらいの値になります。基準より大きくズレていれば、「バラつきが変わった!」と判断できるわけです。

💡 帰無仮説のもとでの分布
帰無仮説 H₀: σ² = σ₀² が正しいとき、χ₀² は自由度φ = n−1のカイ二乗分布に従います。これが検定の数学的な裏付けです。

🔧 武器② カイ二乗分布表の「上側確率」の読み方

カイ二乗分布表でつまずく最大の原因は、「上側確率」という概念です。

カイ二乗分布表の値 χ²(φ, p) は、「分布の右側(上側)の面積がちょうど p になる点」を意味します。

🔍 具体例で確認(自由度φ = 9の場合)
表記 意味
χ²(9, 0.05) 16.919 右側面積が5%になる点(大きい値
χ²(9, 0.95) 3.325 右側面積が95%になる点(小さい値
χ²(9, 0.025) 19.023 右側面積が2.5%になる点(両側検定の上側)
χ²(9, 0.975) 2.700 右側面積が97.5%になる点(両側検定の下側)

ここが混乱のポイントです。pの値が大きいほど、χ²の値は小さくなります。「右側面積が95%」ということは、分布のかなり左側の点を指しているからです。

⚠️ 覚え方のコツ
「上側確率 p が大きい → 分布のもっと左側 → χ²の値は小さい」と覚えましょう。映画館で「後ろの席(右側)がたくさん空いている(面積が大きい)=自分は前の方(左側の小さい値)に座っている」とイメージすると忘れにくいです。

🔧 武器③ 片側・両側の棄却限界値の選び方

母分散の検定では、対立仮説の立て方によって棄却限界値が変わります。以下の早見表を覚えておけば迷いません。

検定したいこと 対立仮説 H₁ 棄却域 棄却限界値
バラつきが大きくなったか? σ² > σ₀² 右側(上側) χ²(φ, α)
バラつきが小さくなったか? σ² < σ₀² 左側(下側) χ²(φ, 1−α)
バラつきが変わったか? σ² ≠ σ₀² 両側 χ²(φ, α/2) と χ²(φ, 1−α/2)
💡 判断のコツ
対立仮説の不等号の向きと棄却域の向きは一致します。「σ² < σ₀²(バラつきが小さい)」→ 検定統計量も小さい側に外れる → 棄却域は左側。「σ² > σ₀²(バラつきが大きい)」→ 検定統計量も大きい側に外れる → 棄却域は右側

🍪 【実践】クッキー工場の「バラつき」問題を解く

ここからは具体的なストーリーで、仮説の設定から信頼区間の算出までを一気通貫でやってみましょう。

🍪 ストーリー

あるクッキー工場では、製品の重量のバラつきを管理しています。従来の機械では、母標準偏差 σ₀ = 0.5 g(母分散 σ₀² = 0.25 g²)でした。最近、新しい機械を導入したところ、ランダムに10枚のクッキーを測定して偏差平方和を計算したら S = 0.72 でした。新しい機械でバラつきは本当に小さくなったのでしょうか?有意水準5%で検定し、さらに信頼率95%で母分散の信頼区間を求めましょう。

まず、与えられた情報を整理します。

項目
従来の母分散 σ₀² 0.25 g²
サンプルサイズ n 10
自由度 φ = n−1 9
偏差平方和 S 0.72 g²
不偏分散 s² = S/(n−1) 0.08 g²
有意水準 α 0.05(5%)

不偏分散は s² = 0.08 なので、標本標準偏差は s = √0.08 ≒ 0.283 g です。従来のσ₀ = 0.5 g と比べると、データ上は確かに小さくなっているように見えます。でも、これが「たまたま」なのか「本当に改善された」のか。それを統計的に判断するのが検定です。

ステップ1:仮説を立てる

検定の第一歩は仮説の設定です。「バラつきが小さくなったか?」を検討したいので、次のように設定します。

帰無仮説 H₀

σ² = σ₀²

「バラつきは変わっていない」

対立仮説 H₁

σ² < σ₀²

「バラつきは小さくなった」

「小さくなったか?」という問いなので、対立仮説の不等号は「<」です。これは片側検定(下側)になります。もし「変わったか?(大きくなったか小さくなったかはわからない)」という問いなら「≠」で両側検定になります。

ステップ2:検定統計量を計算する

📐 計算

χ₀² =
S
σ₀²
=
0.72
0.25
= 2.88

もし H₀ が正しければ(バラつきが変わっていなければ)、この検定統計量は自由度φ = 9のカイ二乗分布に従い、平均的に「9」あたりの値になるはずです。ところが計算値は2.88。かなり小さいですよね。「この小ささは偶然で説明できるのか?」を次のステップで判定します。

ステップ3:棄却限界値を見つける

対立仮説が σ² < σ₀²(下側検定)なので、武器③の早見表から、棄却限界値は χ²(φ, 1−α) です。

具体的に代入すると、

棄却限界値
χ²(9, 1−0.05) = χ²(9, 0.95) = 3.325

なぜ「1−α」なのかを図で確認しましょう。下側検定では、分布の左側の裾が棄却域です。χ²(φ, 0.95) は「右側面積が95%の点」=「左側面積が5%の点」です。つまり、この値より左側が有意水準5%の棄却域になります。

カイ二乗分布(φ = 9)の棄却域イメージ
■■■■|═══════════════════════════════════
棄却域 5%     採択域 95%
← χ₀²=2.88 はここ   ↑ χ²(9, 0.95) = 3.325

ステップ4:判定する

判定ルールはシンプルです。

📐 下側検定の判定ルール
χ₀² < χ²(φ, 1−α) ならば → H₀を棄却(バラつきは小さくなった)
χ₀² χ²(φ, 1−α) ならば → H₀を採択(小さくなったとは言えない)

今回の場合、

✅ 判定結果

χ₀² = 2.88 < χ²(9, 0.95) = 3.325

→ 棄却域に入っているので、H₀ を有意水準5%で棄却します。

新しい機械の導入により、クッキーの重量のバラつきは小さくなったと結論づけられます。

🌸 下側検定では不等号の向きに注意
上側検定では「χ₀² > 棄却限界値 → 棄却」ですが、下側検定では「χ₀² < 棄却限界値 → 棄却」と不等号の向きが逆になります。検定統計量が「小さすぎる」ことが異常の証拠になるからです。ここを間違えると判定が逆になるので要注意です。

【実践】ステップ5:母分散の信頼区間を求める

検定で「バラつきが小さくなった」とわかりました。では、新しい機械での母分散は実際にどのくらいの範囲にあるのでしょうか?それを求めるのが区間推定です。

母分散の区間推定の公式

📐 母分散σ²の信頼率(1−α)の信頼区間

S
χ²(φ, α/2)
≤ σ² ≤
S
χ²(φ, 1−α/2)

区間推定は両側で考えるので、αを2等分して上下に配分します。信頼率95%(α = 0.05)のとき、α/2 = 0.025 です。

💡 なぜSを「割る」のか?
検定統計量は χ₀² = S/σ² でした。これを σ² について解くと σ² = S/χ² です。つまり、カイ二乗値の範囲がわかれば、それを使ってσ²の範囲を逆算できるのです。大きいカイ二乗値で割ると小さいσ²(下側信頼限界)、小さいカイ二乗値で割ると大きいσ²(上側信頼限界)になります。

実際に計算してみる

必要なカイ二乗値を数値表から読み取ります。

必要な値 表記 数値
上側2.5%点 χ²(9, 0.025) 19.023
下側2.5%点(上側97.5%点) χ²(9, 0.975) 2.700

下側信頼限界(σ²の下限)

S
χ²(9, 0.025)
=
0.72
19.023
≒ 0.038

上側信頼限界(σ²の上限)

S
χ²(9, 0.975)
=
0.72
2.700
≒ 0.267
✅ 信頼区間の結果

0.038 ≤ σ² ≤ 0.267

標準偏差σで表すと:0.194 g ≤ σ ≤ 0.517 g

結果の解釈

新しい機械でのバラつき(母分散)は、95%の確率で 0.038 〜 0.267 の範囲にあると推定されます。従来のσ₀² = 0.25 は信頼区間の上限ギリギリに位置しており、新しい機械のバラつきが従来より改善されている可能性が高いことが読み取れます。

⚠️ 検定と区間推定は「同じデータで別の角度から見る」
検定は「バラつきが小さくなったか?→Yes/No」を判定し、区間推定は「バラつきはどの程度か?→範囲」を示します。検定で「棄却」されたなら、従来の値が信頼区間の外(またはギリギリ)にあるはずです。両者の結果は必ず整合します。

迷ったときの判断フローチャート

母分散の検定で「どの棄却限界値を使うか」は、以下のフローチャートで一発判定できます。

STEP 1

「何を検定したいか」を明確にする → 対立仮説の不等号を決める

STEP 2

不等号の向きで棄却域を決める
・H₁: σ² > σ₀² → 棄却域は右側 → 棄却限界値は χ²(φ, α)
・H₁: σ² < σ₀² → 棄却域は左側 → 棄却限界値は χ²(φ, 1−α)
・H₁: σ² σ₀² → 棄却域は両側 → 棄却限界値は χ²(φ, α/2) と χ²(φ, 1−α/2)

STEP 3

検定統計量 χ₀² = S/σ₀² を計算する

STEP 4

χ₀² が棄却域に入っているか判定する

区間推定で使うカイ二乗値の早見表

区間推定は常に両側なので、シンプルです。

📐 母分散の信頼区間で使うカイ二乗値

下側信頼限界(σ²の下限)を求めるとき → 大きいカイ二乗値 χ²(φ, α/2) で割る
上側信頼限界(σ²の上限)を求めるとき → 小さいカイ二乗値 χ²(φ, 1−α/2) で割る

「大きい数で割ると小さくなる、小さい数で割ると大きくなる」→ 直感的にも自然ですよね

まとめ

この記事で解説した内容を振り返ります。

手順 やること 今回の例
1. 仮説設定 H₀とH₁を立てる H₀: σ²=0.25、H₁: σ²<0.25
2. 検定統計量 χ₀² = S/σ₀² を計算 0.72/0.25 = 2.88
3. 棄却限界値 片側/両側に応じた値を読む χ²(9, 0.95) = 3.325
4. 判定 棄却域に入るか判定 2.88 < 3.325 → 棄却
5. 区間推定 S/χ²で信頼区間を計算 0.038 ≤ σ² ≤ 0.267

母分散の検定と区間推定は、道具(カイ二乗分布)も統計量(S/σ₀²)も同じです。「検定で有意差を判定し、推定で具体的な範囲を知る」というワンセットで使えるようになると、データ分析の実力が格段に上がります。QC検定でもセットで出題されることが多いので、この一気通貫の流れをぜひ身につけてください。

❓ よくある質問(FAQ)

Q. 下側検定で「χ₀² < 棄却限界値 → 棄却」の不等号の向きが直感に反するのですが…
A. 下側検定は「バラつきが小さくなったか?」を調べています。検定統計量 χ₀² = S/σ₀² は、データのバラつきSが小さいほど小さくなります。つまり「検定統計量がすごく小さい=データのバラつきがすごく小さい=バラつきが減った証拠」です。棄却限界値よりも「さらに左(さらに小さい)」に検定統計量があれば棄却、という流れは、実は「バラつきが異常なほど小さい」ことを検出しているので、自然な判定です。
Q. 検定で棄却されたのに、信頼区間に従来のσ₀²が含まれることはありますか?
A. 片側検定と両側の信頼区間は「視点が違う」ため、まれにそのような結果になることがあります。片側検定は「小さくなったか?」だけを見ますが、区間推定は両側に確率を配分します。厳密に対応させたい場合は「片側信頼区間」を使います。ただし、QC検定では両側の信頼区間が出題されることがほとんどなので、「検定と推定はセットだが完全には一致しない場合もある」と覚えておきましょう。
Q. 偏差平方和Sが与えられていない場合、自分で計算する必要がありますか?
A. はい、QC検定ではデータが直接与えられて「偏差平方和を自分で計算せよ」というパターンも頻出です。手順は①平均値x̄を計算 → ②各データとx̄の差を2乗 → ③すべて合計、です。計算ミスを防ぐコツは、S = Σxᵢ² − (Σxᵢ)²/n という「計算用公式」を使うことです。引き算1回で済むので圧倒的に楽になります。

📚 次に読むべき記事

📘 F検定(等分散の検定)「A機とB機、精度が良いのはどっち?」2つのバラつきを比較する →

1つの母分散の検定ができたら、次は「2つの母分散の比較」です。F検定はカイ二乗検定の自然な拡張です。

📘 【計算例あり】t検定(一標本)|「規格通りか?」を検証する実務の基本 →

母分散ではなく「母平均」の検定を学びたい方はこちら。t検定とカイ二乗検定はセットで出題されることが多いです。

📘 【保存版】統計検定の選び方フローチャート|計量・計数、対応あり・なしで迷わない最強の地図 →

「どの検定を使えばいいか」で迷ったら、このフローチャートで一発解決できます。

🗺️ 検定・推定の全体像を知りたい方へ
📖 【完全版】検定・推定の学習ロードマップ|初心者が「どの検定を使うか」迷わなくなる全28記事の読み順ガイド →

この記事は上記ロードマップの一部です。全体像から学びたい方はこちらからどうぞ。

タグ

-検定・推定