検定・推定

F検定(等分散の検定)とは?分散比の計算からWelch・カイ二乗まで例題で完全マスター

😣 こんなことで困っていませんか?
  • 「平均は同じくらいなのに、製品のバラつきが気になる」けど比べ方がわからない
  • なぜ分散の比較は「引き算」ではなく「割り算(比)」なのか腑に落ちない
  • F検定・カイ二乗検定・Welchの検定、どれをいつ使うか混乱する
  • QC検定でF分布表の読み方や、Welchの「線形補間」でつまずく
✅ この記事でわかること
  • F検定(等分散の検定)の考え方と分散比の計算手順(例題つき)
  • なぜ「比」を使うのか=F分布のイメージ
  • 3つ以上のバラつきを比べるハートレーの検定
  • 等分散でない2群の平均を比べるWelchの検定と「線形補間」
  • 1つの母分散を調べるカイ二乗検定・区間推定(Z検定との違いも)
🎯 結論:F検定は「2つのバラつきの比」で精度を比べる

F検定(等分散の検定)とは、2つのグループのバラつき(分散)に差があるかを判定する検定です。
やることは1つ。2つの不偏分散の比(大きい方÷小さい方)を計算し、F分布表の値と比べるだけ。比が1に近ければバラつきは同じ、1から大きく離れればバラつきが違うと判断します。
「割合・平均」ではなく「バラつきそのもの」を比べるのが、この分野の特徴です。

F検定とは?なぜ「差」ではなく「比」で比べるのか

F検定は「2つのグループのバラつき(分散)が同じかどうか」を調べる検定です。たとえば、同じ部品を作るA機械とB機械。平均寸法は同じでも、A機は寸法がそろっていて、B機はバラバラなら、精度が良いのはA機ですよね。この「バラつきの差」を統計的に判定するのがF検定です。

⚠️ ここが最初の疑問:なぜ引き算じゃないの?
平均の比較では「A−B」と引き算をします。でも分散の比較では「A÷B」と割り算(比)を使います。これがF検定の正体で、最初につまずくポイントです。理由を次で説明します。

「比」を使う理由|分散はマイナスにならないから

分散は「バラつきの2乗の平均」なので、絶対にマイナスにならず、0以上の値になります。0以上の2つの量を比べるとき、自然なのは「何倍か(比)」を見ることです。

💡 たとえ:身長より「倍率」で考えるのが自然な世界
「2と4」の差は2、「100と102」の差も2。でも前者は「2倍」も違い、後者は「ほぼ同じ」です。0以上の量は、差より比のほうが実態に合うのです。
だから「2つの分散が同じなら、比は1になるはず」という考えでF検定が組み立てられています。
📐 F検定の検定統計量(分散比)
F₀ =
大きい方の不偏分散 V₁
小さい方の不偏分散 V₂
必ず「大きい方 ÷ 小さい方」にするので、F₀ は常に1以上になります。

F分布のイメージ|「1」が中心の山

F分布は、この「分散比」が従う分布です。2つの分散が本当は等しいなら、比はだいたい1の周りに集まるはず。だからF分布は1付近に山があり、右に長く裾を引く非対称な形をしています。

⚠️ F₀が大きいほど「バラつきが違う」
比が1から大きく離れる(=F₀が大きくなる)ほど、「偶然では説明できないほどバラつきが違う」ことになります。F分布表で決めた境界線(棄却限界値)を超えたら「等分散とは言えない」と判定します。

F検定の計算手順|A機とB機、精度がいいのはどっち

実際に手を動かしてみましょう。A機とB機で部品の寸法を測り、バラつきに差があるかを有意水準5%(両側)で検定します。

機械 データ数 n 不偏分散 V
A機 10 0.45
B機 8 0.15
STEP 1

仮説を立てる
H₀:σ₁²=σ₂²(バラつきは等しい)/ H₁:σ₁²≠σ₂²(バラつきが違う・両側)

STEP 2

分散比F₀を計算(大きい方÷小さい方)
F₀ = 0.45 ÷ 0.15 = 3.0
このとき分子の自由度 φ₁=10−1=9、分母の自由度 φ₂=8−1=7。

STEP 3

F分布表から棄却限界値を読む
両側5%なので、片側2.5%(0.025)の表を使う。F(9, 7; 0.025) ≒ 4.82

STEP 4

判定する
F₀=3.0 < 4.82 なので棄却できない →「A機とB機のバラつきに差があるとは言えない」。

⚠️ つまずきポイント:両側検定なら表は「2.5%」を見る
有意水準5%の両側検定でも、F分布表は片側2.5%(0.025)の表を引きます。常に「大÷小」で右側だけを見るので、5%を両側に分けた片方(2.5%)を使うのです。ここを5%の表で引いてしまうミスが多いので注意してください。

3つ以上のバラつきを比べる|ハートレーの検定

F検定は2つのバラつきの比較でした。では3つ以上のグループのバラつきが「全部そろっているか」を一気に調べたいときは?そこで使うのがハートレーの検定です。

考え方はシンプルで、「一番バラついている子」と「一番揃っている子」だけを取り出して比べる方法です。両端さえ問題なければ、間のグループも問題ないだろう、という発想です。

📐 ハートレーの検定統計量
Fmax =
最大の不偏分散 Vmax
最小の不偏分散 Vmin
この Fmax を「ハートレー表」の限界値と比べます。
⚠️ 使う条件:各群のデータ数が等しいこと
ハートレーの検定は各グループのサンプル数が同じ(等しいn)であることが前提です。データ数がバラバラの場合は、バートレットの検定など別の手法を使います。
なお、ハートレー表は「群の数 k」と「各群の自由度 φ」で限界値が決まります。Fmax が表の値を超えたら「等分散とは言えない(バラつきがそろっていない)」と判定します。
💡 ポイント:等分散性の確認は分散分析の「準備運動」
3つ以上の平均を比べる分散分析(ANOVA)は、「各群のバラつきが同じ」が前提です。だから本番の前に、ハートレーやバートレットの検定で等分散性をチェックすることがあります。

等分散でないとき|Welchの検定と線形補間

F検定で「2群のバラつきは違う(等分散でない)」とわかったとします。このとき、その2群の平均を比べたいなら、普通のt検定は使えません。等分散を前提としないWelch(ウェルチ)の検定の出番です。

💡 検定の流れ:まずF検定 → 次にWelch
① F検定で等分散かどうかを確認
② 等分散なら → 普通の2標本t検定
③ 等分散でないなら → Welchの検定
Welchはバラつきが違っても使える「万能型のt検定」と覚えておけば十分です。
📐 Welchの検定統計量
t₀ =
x̄₁ − x̄₂
√( V₁/n₁ + V₂/n₂ )
分母で2群のバラつきを「別々に」足すのがポイント(プールしない)。

普通のt検定は2群のバラつきを1つにまとめて(プールして)使いますが、Welchはバラつきが違うので、それぞれ別々に扱うのが特徴です。

最難関:Welchの「等価自由度 φ*」の計算

Welchの検定が難しいのは、自由度が整数にならない「等価自由度(φ*)」を計算する点です。サタースウェイトの式で求めます。

📐 等価自由度 φ*(サタースウェイトの式)
φ* =
( V₁/n₁ + V₂/n₂ )²
(V₁/n₁)²/(n₁−1) + (V₂/n₂)²/(n₂−1)
覚える必要はありません。式に当てはめれば出ます。

自由度が小数になる!?「線形補間」で表を読む

等価自由度は「7.4」のように小数になります。ところがt分布表には整数(7や8)しか載っていません。そこで「7のときの値」と「8のときの値」のあいだを比例配分で求める=線形補間(直線補間)を使います。

💡 線形補間の例(φ*=7.4、両側5%のt値を求める)
・t(7) = 2.365、t(8) = 2.306 とする
・7と8の間で「7.4」は 0.4 の位置
・差は 2.306 − 2.365 = −0.059
・補間値 = 2.365 + (−0.059)×0.4 = 2.365 − 0.0236 = 約 2.341
「2点を直線で結んで、その途中の値を読む」だけ。中学で習った比例配分と同じです。
⚠️ 補足:自由度が大きいときは逆数補間
自由度が30を超えると、直線補間より逆数(1/φ)で補間するほうが正確とされます。ただしQC検定では自由度が小さい範囲が多く、線形補間で対応できる出題がほとんどです。

1つの母分散を調べる|カイ二乗検定(この機械、バラつき増えてない?)

ここまでは「2つ以上のバラつきの比較」でした。次は「1つの機械のバラつきが、基準値より大きくなっていないか」を調べます。比べる相手が決まった基準値(σ₀²)なので、F分布ではなくカイ二乗分布を使います。

📐 母分散のカイ二乗検定統計量
χ₀² =
S(平方和)
σ₀²(基準の母分散)
S = (n−1)V とも書けます。自由度 φ = n−1。

やることは、「実際のバラつきの合計(平方和S)」を「基準のバラつき(σ₀²)」で割るだけです。値が大きければ「基準よりバラついている」ことになります。

例題:バラつきが基準より増えたか

基準の母分散は σ₀²=0.20 でした。最近、16個(n=16)のデータから平方和 S=4.5 が得られました。バラつきが増えたか、有意水準5%(片側)で検定します。

STEP 1

仮説:H₀:σ²=0.20 / H₁:σ²>0.20(増えた・片側)。自由度 φ=16−1=15。

STEP 2

χ₀²を計算:χ₀² = 4.5 ÷ 0.20 = 22.5

STEP 3

棄却限界値を読む:「増えたか」を見るので上側を使う。χ²(15; 0.05) ≒ 24.996

STEP 4

判定:χ₀²=22.5 < 24.996 なので棄却できない →「バラつきが増えたとは言えない」。

⚠️ カイ二乗分布は左右非対称|上側・下側を間違えない
カイ二乗分布は左右対称ではありません。だから「バラつきが増えたか(上側)」「減ったか(下側)」「変わったか(両側)」で、表のどちら側を読むかが変わります。
・増えた? → 上側(例:0.05)
・減った? → 下側(例:0.95)
・変わった?(両側5%) → 上側0.025 と 下側0.975 の両方
ここは間違えやすいので、詳しくは下の関連記事で確認してください。

【参考】Z検定(母分散が既知の場合)

教科書には「母分散が分かっている前提のZ検定」も出てきます。ただし現実には母分散が分かっていることはほぼなく、実務では使いません。「神様だけが真の分散を知っている」という理論上の話です。

💡 なぜ学ぶのか
Z検定はすべての検定の「原型」だからです。「真のバラつきが分かれば正規分布(Z)で判定できる」という基礎を理解すると、「分からないからt分布やカイ二乗分布で代用する」という応用がスッと入ります。試験では深追いせず、考え方の土台として押さえれば十分です。

母分散の区間推定|本当のバラつきはどの範囲か

検定が「基準より大きいか」を判定するなら、推定は「本当の母分散はどの範囲にあるか」を予測します。母分散の区間推定も、検定と同じくカイ二乗分布を使います。

📐 母分散の95%信頼区間
下限
S
χ²(φ; 0.025)
≦ σ² ≦
上限
S
χ²(φ; 0.975)
S=平方和、φ=n−1。下限には上側の値、上限には下側の値を使う点に注意。
⚠️ 一番のワナ:分母のカイ二乗値が「逆」になる
区間の下限を出すには大きいカイ二乗値(上側0.025)で割り、上限を出すには小さいカイ二乗値(下側0.975)で割ります。
「大きい数で割ると小さくなる=下限、小さい数で割ると大きくなる=上限」と考えれば納得できます。カイ二乗が非対称だからこそ起きる、引っかけ問題の定番です。

例題:母分散の信頼区間を求める

n=16(φ=15)、平方和 S=4.5 のとき、母分散 σ² の95%信頼区間を求めます。

STEP 1

カイ二乗値を読む(φ=15)
上側 χ²(15; 0.025)=27.488 / 下側 χ²(15; 0.975)=6.262

STEP 2

下限を計算:4.5 ÷ 27.488 ≒ 0.164

STEP 3

上限を計算:4.5 ÷ 6.262 ≒ 0.719
→ 母分散の95%信頼区間は 0.164 ≦ σ² ≦ 0.719

💡 実務での読み方:上限=「最悪のケース」
品質管理では、区間の上限に注目します。「本当のバラつきは、悪くてもこのくらいまで」という最悪値の見積もりになるからです。標準偏差で見たいときは、区間の両端の平方根をとればσの区間になります。

全体マップ|分散の検定はどれをいつ使うか

「バラつきの検定」は種類が多くて迷いますが、①いくつのグループを比べるか ②相手は基準値か他のグループかで整理すれば一発で選べます。

分かれ道1

1つのグループ vs 基準値カイ二乗検定(母分散の検定・区間推定)
※真の分散が既知という理論なら参考としてZ検定

分かれ道2

2つのグループのバラつき比較F検定(分散比)

分かれ道3

3つ以上のバラつき比較ハートレーの検定(nが等しいとき)/バートレットの検定(nが違うとき)

調べたいこと 使う手法 使う分布
1つの分散 vs 基準値 母分散の検定・区間推定 カイ二乗分布
2つの分散の比較 F検定(等分散の検定) F分布
3群以上の分散(n等しい) ハートレーの検定 Fmax分布
等分散でない2群の平均 Welchの検定 t分布(等価自由度)

よくある質問(FAQ)

Q. なぜ分散の比較は「差」ではなく「比」なの?

A. 分散は0以上の値しか取らないため、差より比(何倍か)で比べるのが自然だからです。等しいなら比は1になり、F分布で判定できます。

Q. F検定の表は、5%検定なのになぜ2.5%を見るの?

A. 常に「大きい方÷小さい方」で右側だけを見るため、両側5%を片側に直した2.5%(0.025)の表を引きます。

Q. F検定とカイ二乗検定はどう使い分ける?

A. 2つの分散を比べるならF検定、1つの分散を基準値と比べるならカイ二乗検定です。比較する相手が「他の群」か「決まった値」かで決まります。

Q. Welchの検定の「線形補間」って何をしているの?

A. 等価自由度が小数になるため、t分布表の整数値2点を直線で結び、途中の値を比例配分で求めています。中学の比例配分と同じ計算です。

Q. 母分散の区間推定で、なぜ下限に大きいカイ二乗値を使うの?

A. 平方和Sを大きい値で割ると結果が小さくなり下限に、小さい値で割ると大きくなり上限になるからです。カイ二乗が非対称なため起きます。

まとめ:分散・等分散の検定はこれで完成

📌 この記事の要点
  • F検定=2つの分散の比(大÷小)で等分散かを判定。F分布は1が中心の非対称な山
  • 両側5%検定でも、F分布表は片側2.5%を読む
  • ハートレーの検定=3群以上のバラつきを「最大÷最小」で一気に比較(n等しい)
  • Welchの検定=等分散でない2群の平均比較。等価自由度は小数になり線形補間で読む
  • カイ二乗検定=1つの分散を基準値と比較・区間推定。上側/下側の読み間違いに注意

「いくつ比べるか」「相手は基準値か群か」で手法が決まります。この地図が頭に入れば、QC検定の計量値の検定はぐっと得点しやすくなります。

📚 次に読むべき記事

📘 検定・推定の学習ロードマップ|どの検定を使うか迷わなくなる全記事の読み順ガイド →

検定・推定の全体像を体系的に学べるマップ。まず最初に押さえたい1本です。

📘 t検定(2標本・等分散)|AとBの平均に差があるか検証する方法 →

F検定で「等分散」とわかった後に使う、平均の差の検定。F検定とセットで学ぶと実戦的です。

📘 カイ二乗分布の非対称性|なぜ「上側」と「下側」で値が違うのか →

母分散の検定・推定でつまずきやすい「表のどちらを読むか」を深掘りした隣接記事です。

タグ

-検定・推定
-