F検定（等分散の検定）とは？分散比の計算からWelch・カイ二乗まで例題で完全マスター

😣 こんなことで困っていませんか？

「平均は同じくらいなのに、製品のバラつきが気になる」けど比べ方がわからない
なぜ分散の比較は「引き算」ではなく「割り算（比）」なのか腑に落ちない
F検定・カイ二乗検定・Welchの検定、どれをいつ使うか混乱する
QC検定でF分布表の読み方や、Welchの「線形補間」でつまずく

✅ この記事でわかること

F検定（等分散の検定）の考え方と分散比の計算手順（例題つき）
なぜ「比」を使うのか＝F分布のイメージ
3つ以上のバラつきを比べるハートレーの検定
等分散でない2群の平均を比べるWelchの検定と「線形補間」
1つの母分散を調べるカイ二乗検定・区間推定（Z検定との違いも）

🎯 結論：F検定は「2つのバラつきの比」で精度を比べる

F検定（等分散の検定）とは、2つのグループのバラつき（分散）に差があるかを判定する検定です。
やることは1つ。2つの不偏分散の比（大きい方÷小さい方）を計算し、F分布表の値と比べるだけ。比が1に近ければバラつきは同じ、1から大きく離れればバラつきが違うと判断します。
「割合・平均」ではなく「バラつきそのもの」を比べるのが、この分野の特徴です。

F検定とは？なぜ「差」ではなく「比」で比べるのか
- 「比」を使う理由｜分散はマイナスにならないから
- F分布のイメージ｜「1」が中心の山
F検定の計算手順｜A機とB機、精度がいいのはどっち
3つ以上のバラつきを比べる｜ハートレーの検定
等分散でないとき｜Welchの検定と線形補間
- 最難関：Welchの「等価自由度 φ*」の計算
- 自由度が小数になる！？「線形補間」で表を読む
1つの母分散を調べる｜カイ二乗検定（この機械、バラつき増えてない？）
- 例題：バラつきが基準より増えたか
- 【参考】Z検定（母分散が既知の場合）
母分散の区間推定｜本当のバラつきはどの範囲か
- 例題：母分散の信頼区間を求める
全体マップ｜分散の検定はどれをいつ使うか
よくある質問（FAQ）
まとめ：分散・等分散の検定はこれで完成
- 📚 次に読むべき記事

F検定とは？なぜ「差」ではなく「比」で比べるのか

F検定は「2つのグループのバラつき（分散）が同じかどうか」を調べる検定です。たとえば、同じ部品を作るA機械とB機械。平均寸法は同じでも、A機は寸法がそろっていて、B機はバラバラなら、精度が良いのはA機ですよね。この「バラつきの差」を統計的に判定するのがF検定です。

⚠️ ここが最初の疑問：なぜ引き算じゃないの？
平均の比較では「A−B」と引き算をします。でも分散の比較では「A÷B」と割り算（比）を使います。これがF検定の正体で、最初につまずくポイントです。理由を次で説明します。

「比」を使う理由｜分散はマイナスにならないから

分散は「バラつきの2乗の平均」なので、絶対にマイナスにならず、0以上の値になります。0以上の2つの量を比べるとき、自然なのは「何倍か（比）」を見ることです。

💡 たとえ：身長より「倍率」で考えるのが自然な世界
「2と4」の差は2、「100と102」の差も2。でも前者は「2倍」も違い、後者は「ほぼ同じ」です。0以上の量は、差より比のほうが実態に合うのです。
だから「2つの分散が同じなら、比は1になるはず」という考えでF検定が組み立てられています。

📐 F検定の検定統計量（分散比）

F₀ =

大きい方の不偏分散 V₁

小さい方の不偏分散 V₂

必ず「大きい方 ÷ 小さい方」にするので、F₀ は常に1以上になります。

F分布のイメージ｜「1」が中心の山

F分布は、この「分散比」が従う分布です。2つの分散が本当は等しいなら、比はだいたい1の周りに集まるはず。だからF分布は1付近に山があり、右に長く裾を引く非対称な形をしています。

⚠️ F₀が大きいほど「バラつきが違う」
比が1から大きく離れる（＝F₀が大きくなる）ほど、「偶然では説明できないほどバラつきが違う」ことになります。F分布表で決めた境界線（棄却限界値）を超えたら「等分散とは言えない」と判定します。

F検定の計算手順｜A機とB機、精度がいいのはどっち

実際に手を動かしてみましょう。A機とB機で部品の寸法を測り、バラつきに差があるかを有意水準5%（両側）で検定します。

機械	データ数 n	不偏分散 V
A機	10	0.45
B機	8	0.15

STEP 1

仮説を立てる
H₀：σ₁²＝σ₂²（バラつきは等しい）／ H₁：σ₁²≠σ₂²（バラつきが違う・両側）

STEP 2

分散比F₀を計算（大きい方÷小さい方）
F₀ ＝ 0.45 ÷ 0.15 ＝ 3.0
このとき分子の自由度 φ₁＝10−1＝9、分母の自由度 φ₂＝8−1＝7。

STEP 3

F分布表から棄却限界値を読む
両側5%なので、片側2.5%（0.025）の表を使う。F(9, 7; 0.025) ≒ 4.82。

STEP 4

判定する
F₀＝3.0 ＜ 4.82 なので棄却できない →「A機とB機のバラつきに差があるとは言えない」。

⚠️ つまずきポイント：両側検定なら表は「2.5%」を見る
有意水準5%の両側検定でも、F分布表は片側2.5%（0.025）の表を引きます。常に「大÷小」で右側だけを見るので、5%を両側に分けた片方（2.5%）を使うのです。ここを5%の表で引いてしまうミスが多いので注意してください。

📘 関連記事
分散と標準偏差｜「バラつき」を数値化する魔法の公式 →

3つ以上のバラつきを比べる｜ハートレーの検定

F検定は2つのバラつきの比較でした。では3つ以上のグループのバラつきが「全部そろっているか」を一気に調べたいときは？そこで使うのがハートレーの検定です。

考え方はシンプルで、「一番バラついている子」と「一番揃っている子」だけを取り出して比べる方法です。両端さえ問題なければ、間のグループも問題ないだろう、という発想です。

📐 ハートレーの検定統計量

F_max =

最大の不偏分散 V_max

最小の不偏分散 V_min

この F_max を「ハートレー表」の限界値と比べます。

⚠️ 使う条件：各群のデータ数が等しいこと
ハートレーの検定は各グループのサンプル数が同じ（等しいn）であることが前提です。データ数がバラバラの場合は、バートレットの検定など別の手法を使います。
なお、ハートレー表は「群の数 k」と「各群の自由度 φ」で限界値が決まります。F_max が表の値を超えたら「等分散とは言えない（バラつきがそろっていない）」と判定します。

💡 ポイント：等分散性の確認は分散分析の「準備運動」
3つ以上の平均を比べる分散分析（ANOVA）は、「各群のバラつきが同じ」が前提です。だから本番の前に、ハートレーやバートレットの検定で等分散性をチェックすることがあります。

等分散でないとき｜Welchの検定と線形補間

F検定で「2群のバラつきは違う（等分散でない）」とわかったとします。このとき、その2群の平均を比べたいなら、普通のt検定は使えません。等分散を前提としないWelch（ウェルチ）の検定の出番です。

💡 検定の流れ：まずF検定 → 次にWelch
① F検定で等分散かどうかを確認
② 等分散なら → 普通の2標本t検定
③ 等分散でないなら → Welchの検定
Welchはバラつきが違っても使える「万能型のt検定」と覚えておけば十分です。

📐 Welchの検定統計量

t₀ =

x̄₁ − x̄₂

√( V₁/n₁ + V₂/n₂ )

分母で2群のバラつきを「別々に」足すのがポイント（プールしない）。

普通のt検定は2群のバラつきを1つにまとめて（プールして）使いますが、Welchはバラつきが違うので、それぞれ別々に扱うのが特徴です。

最難関：Welchの「等価自由度 φ*」の計算

Welchの検定が難しいのは、自由度が整数にならない「等価自由度（φ*）」を計算する点です。サタースウェイトの式で求めます。

📐 等価自由度 φ*（サタースウェイトの式）

φ* =

( V₁/n₁ + V₂/n₂ )²

(V₁/n₁)²/(n₁−1) + (V₂/n₂)²/(n₂−1)

覚える必要はありません。式に当てはめれば出ます。

自由度が小数になる！？「線形補間」で表を読む

等価自由度は「7.4」のように小数になります。ところがt分布表には整数（7や8）しか載っていません。そこで「7のときの値」と「8のときの値」のあいだを比例配分で求める＝線形補間（直線補間）を使います。

💡 線形補間の例（φ*＝7.4、両側5%のt値を求める）
・t(7) ＝ 2.365、t(8) ＝ 2.306 とする
・7と8の間で「7.4」は 0.4 の位置
・差は 2.306 − 2.365 ＝ −0.059
・補間値＝ 2.365 + (−0.059)×0.4 ＝ 2.365 − 0.0236 ＝ 約 2.341
「2点を直線で結んで、その途中の値を読む」だけ。中学で習った比例配分と同じです。

⚠️ 補足：自由度が大きいときは逆数補間
自由度が30を超えると、直線補間より逆数（1/φ）で補間するほうが正確とされます。ただしQC検定では自由度が小さい範囲が多く、線形補間で対応できる出題がほとんどです。

1つの母分散を調べる｜カイ二乗検定（この機械、バラつき増えてない？）

ここまでは「2つ以上のバラつきの比較」でした。次は「1つの機械のバラつきが、基準値より大きくなっていないか」を調べます。比べる相手が決まった基準値（σ₀²）なので、F分布ではなくカイ二乗分布を使います。

📐 母分散のカイ二乗検定統計量

χ₀² =

S（平方和）

σ₀²（基準の母分散）

S ＝ (n−1)V とも書けます。自由度 φ ＝ n−1。

やることは、「実際のバラつきの合計（平方和S）」を「基準のバラつき（σ₀²）」で割るだけです。値が大きければ「基準よりバラついている」ことになります。

例題：バラつきが基準より増えたか

基準の母分散は σ₀²＝0.20 でした。最近、16個（n＝16）のデータから平方和 S＝4.5 が得られました。バラつきが増えたか、有意水準5%（片側）で検定します。

STEP 1

仮説：H₀：σ²＝0.20 ／ H₁：σ²＞0.20（増えた・片側）。自由度 φ＝16−1＝15。

STEP 2

χ₀²を計算：χ₀² ＝ 4.5 ÷ 0.20 ＝ 22.5

STEP 3

棄却限界値を読む：「増えたか」を見るので上側を使う。χ²(15; 0.05) ≒ 24.996。

STEP 4

判定：χ₀²＝22.5 ＜ 24.996 なので棄却できない →「バラつきが増えたとは言えない」。

⚠️ カイ二乗分布は左右非対称｜上側・下側を間違えない
カイ二乗分布は左右対称ではありません。だから「バラつきが増えたか（上側）」「減ったか（下側）」「変わったか（両側）」で、表のどちら側を読むかが変わります。
・増えた？ → 上側（例：0.05）
・減った？ → 下側（例：0.95）
・変わった？（両側5%） → 上側0.025 と下側0.975 の両方
ここは間違えやすいので、詳しくは下の関連記事で確認してください。

【参考】Z検定（母分散が既知の場合）

教科書には「母分散が分かっている前提のZ検定」も出てきます。ただし現実には母分散が分かっていることはほぼなく、実務では使いません。「神様だけが真の分散を知っている」という理論上の話です。

💡 なぜ学ぶのか
Z検定はすべての検定の「原型」だからです。「真のバラつきが分かれば正規分布（Z）で判定できる」という基礎を理解すると、「分からないからt分布やカイ二乗分布で代用する」という応用がスッと入ります。試験では深追いせず、考え方の土台として押さえれば十分です。

母分散の区間推定｜本当のバラつきはどの範囲か

検定が「基準より大きいか」を判定するなら、推定は「本当の母分散はどの範囲にあるか」を予測します。母分散の区間推定も、検定と同じくカイ二乗分布を使います。

📐 母分散の95%信頼区間

下限

χ²(φ; 0.025)

≦ σ² ≦

上限

χ²(φ; 0.975)

S＝平方和、φ＝n−1。下限には上側の値、上限には下側の値を使う点に注意。

⚠️ 一番のワナ：分母のカイ二乗値が「逆」になる
区間の下限を出すには大きいカイ二乗値（上側0.025）で割り、上限を出すには小さいカイ二乗値（下側0.975）で割ります。
「大きい数で割ると小さくなる＝下限、小さい数で割ると大きくなる＝上限」と考えれば納得できます。カイ二乗が非対称だからこそ起きる、引っかけ問題の定番です。

例題：母分散の信頼区間を求める

n＝16（φ＝15）、平方和 S＝4.5 のとき、母分散 σ² の95%信頼区間を求めます。

STEP 1

カイ二乗値を読む（φ＝15）
上側 χ²(15; 0.025)＝27.488 ／下側 χ²(15; 0.975)＝6.262

STEP 2

下限を計算：4.5 ÷ 27.488 ≒ 0.164

STEP 3

上限を計算：4.5 ÷ 6.262 ≒ 0.719
→ 母分散の95%信頼区間は 0.164 ≦ σ² ≦ 0.719

💡 実務での読み方：上限＝「最悪のケース」
品質管理では、区間の上限に注目します。「本当のバラつきは、悪くてもこのくらいまで」という最悪値の見積もりになるからです。標準偏差で見たいときは、区間の両端の平方根をとればσの区間になります。

全体マップ｜分散の検定はどれをいつ使うか

「バラつきの検定」は種類が多くて迷いますが、①いくつのグループを比べるか ②相手は基準値か他のグループかで整理すれば一発で選べます。

分かれ道1

1つのグループ vs 基準値 → カイ二乗検定（母分散の検定・区間推定）
※真の分散が既知という理論なら参考としてZ検定

分かれ道2

2つのグループのバラつき比較 → F検定（分散比）

分かれ道3

3つ以上のバラつき比較 → ハートレーの検定（nが等しいとき）／バートレットの検定（nが違うとき）

調べたいこと	使う手法	使う分布
1つの分散 vs 基準値	母分散の検定・区間推定	カイ二乗分布
2つの分散の比較	F検定（等分散の検定）	F分布
3群以上の分散（n等しい）	ハートレーの検定	Fmax分布
等分散でない2群の平均	Welchの検定	t分布（等価自由度）

よくある質問（FAQ）

Q. なぜ分散の比較は「差」ではなく「比」なの？

A. 分散は0以上の値しか取らないため、差より比（何倍か）で比べるのが自然だからです。等しいなら比は1になり、F分布で判定できます。

Q. F検定の表は、5%検定なのになぜ2.5%を見るの？

A. 常に「大きい方÷小さい方」で右側だけを見るため、両側5%を片側に直した2.5%（0.025）の表を引きます。

Q. F検定とカイ二乗検定はどう使い分ける？

A. 2つの分散を比べるならF検定、1つの分散を基準値と比べるならカイ二乗検定です。比較する相手が「他の群」か「決まった値」かで決まります。

Q. Welchの検定の「線形補間」って何をしているの？

A. 等価自由度が小数になるため、t分布表の整数値2点を直線で結び、途中の値を比例配分で求めています。中学の比例配分と同じ計算です。

Q. 母分散の区間推定で、なぜ下限に大きいカイ二乗値を使うの？

A. 平方和Sを大きい値で割ると結果が小さくなり下限に、小さい値で割ると大きくなり上限になるからです。カイ二乗が非対称なため起きます。

まとめ：分散・等分散の検定はこれで完成

📌 この記事の要点

F検定＝2つの分散の比（大÷小）で等分散かを判定。F分布は1が中心の非対称な山
両側5%検定でも、F分布表は片側2.5%を読む
ハートレーの検定＝3群以上のバラつきを「最大÷最小」で一気に比較（n等しい）
Welchの検定＝等分散でない2群の平均比較。等価自由度は小数になり線形補間で読む
カイ二乗検定＝1つの分散を基準値と比較・区間推定。上側/下側の読み間違いに注意

「いくつ比べるか」「相手は基準値か群か」で手法が決まります。この地図が頭に入れば、QC検定の計量値の検定はぐっと得点しやすくなります。

📚 次に読むべき記事

📘 検定・推定の学習ロードマップ｜どの検定を使うか迷わなくなる全記事の読み順ガイド →

検定・推定の全体像を体系的に学べるマップ。まず最初に押さえたい1本です。

📘 t検定（2標本・等分散）｜AとBの平均に差があるか検証する方法 →

F検定で「等分散」とわかった後に使う、平均の差の検定。F検定とセットで学ぶと実戦的です。

📘 カイ二乗分布の非対称性｜なぜ「上側」と「下側」で値が違うのか →

母分散の検定・推定でつまずきやすい「表のどちらを読むか」を深掘りした隣接記事です。