検定・推定

【計算例あり】ウェルチのt検定|バラつきが違う2群を比較する方法

😰 こんな経験、ありませんか?

  • F検定をしたら「等分散でない」と出た…どうすれば?
  • 2群を比較したいのに、バラつきが全然違う…
  • 「スチューデントのt検定は使えません」と言われた…
  • そもそもウェルチって誰?何が違うの?

💡 この記事の結論

ウェルチのt検定は、2つのグループのバラつき(分散)が異なる場合でも平均値の差を検定できる手法です。

「スチューデントのt検定」が等分散を前提とするのに対し、ウェルチのt検定は前提なしで使える「万能選手」です。

📚 この記事でわかること

  • ウェルチのt検定が必要になる場面理由
  • スチューデントのt検定との違い(図解つき)
  • 自由度の計算方法(ウェルチ-サタスウェイトの近似式
  • 具体的な計算例(手計算できるレベルで)

📖 この記事を読む前に

「スチューデントのt検定」や「F検定」の基礎がわかっていると、この記事がスムーズに読めます。

なぜウェルチのt検定が必要なのか?

前回の記事で学んだ「スチューデントのt検定」は、2つのグループの平均を比較する強力な手法でした。

しかし、この検定には大前提がありましたよね。

⚠️ スチューデントのt検定の前提条件

「2つのグループの母分散が等しい」こと

でも、現実のデータはそんなに都合よくありません

たとえば、こんなケースを想像してみてください。

🏭 例:2つの工場の品質比較

状況:同じ製品を作る2つの工場の品質を比較したい。

工場 平均寸法 バラつき(分散) 特徴
A工場 50.2 mm 1.5 ベテラン職人が多く安定
B工場 51.8 mm 8.2 新人が多くバラつき大

→ 分散が 1.5 vs 8.2 で全然違う!等分散とは言えない…

このように、バラつきの大きさが違う2つのグループを比較したい場面は、実務では頻繁に発生します。

🎯 イメージで理解する:的当てゲームで考えよう

🎯 2人の選手が的当てをする場面

選手A(ベテラン)

🎯

的の中心付近に
密集して当たる

バラつき:小

選手B(初心者)

🎯

的のあちこちに
散らばって当たる

バラつき:大

この2人の「平均的な的中位置」を比較したい場合、単純に「同じ尺度」で測っていいでしょうか?

選手Aの「5cm外れた」と、選手Bの「5cm外れた」は意味が違いますよね。
選手Aにとっては大きなミス、選手Bにとってはいつも通り。

ウェルチのt検定は、この「バラつきの違い」を考慮して、フェアに比較できる手法なのです。

スチューデント vs ウェルチ:何が違う?

2つのt検定の違いを、でスッキリ整理しましょう。

比較項目 スチューデントのt検定 ウェルチのt検定
等分散の前提 必要 不要
分散の扱い プールして1つにまとめる 各群の分散をそのまま使う
自由度の計算 シンプル(n₁ + n₂ − 2) 複雑(近似式を使用)
検出力 等分散なら高い やや低い(保守的)
使う場面 F検定で等分散が確認できた時 等分散かわからない/違う時

💡 実務でのポイント

最近の統計ソフトでは、「迷ったらウェルチを使え」という考え方が主流です。
等分散の場合でもウェルチのt検定は使えますし、結果も大きくは変わりません。
安全策として、常にウェルチを使う研究者も多いです。

📖 関連記事

「そもそもF検定って何?」という方はこちらで復習できます。

→ F検定とは?|2つの分散を比較する基本

ウェルチのt検定の公式

📐 t値の計算式

t = (x̄₁ − x̄₂) ÷ √(s₁²/n₁ + s₂²/n₂)

各記号の意味を確認しましょう。

記号 意味
x̄₁, x̄₂ 各グループの標本平均
s₁², s₂² 各グループの不偏分散
n₁, n₂ 各グループのサンプルサイズ

🔍 スチューデントのt検定との違い

スチューデントのt検定では、分母に「プールした分散」を使いました。
ウェルチのt検定では、各群の分散をそのまま別々に計算に使います。

「混ぜないで、それぞれの個性を尊重する」イメージです。

🧮 自由度の計算(ウェルチ-サタスウェイトの近似式)

ここがウェルチのt検定の最大の特徴であり、難しいポイントです。

通常のt検定では自由度は「n₁ + n₂ − 2」という単純な式でしたが、ウェルチのt検定では複雑な近似式を使います。

📊 ウェルチ-サタスウェイトの自由度

df ≈ (s₁²/n₁ + s₂²/n₂)² ÷ [(s₁²/n₁)²/(n₁−1) + (s₂²/n₂)²/(n₂−1)]

式が複雑に見えますが、心配しないでください

この計算はExcelや統計ソフトが自動でやってくれます。大切なのは「なぜ複雑になるか」を理解することです。

🤔 なぜ自由度が複雑になるのか?(イメージで理解)

🎒 例え話:2人の荷物の重さを比べる

スチューデントのt検定
「2人の荷物は同じ種類のものが入っている」と仮定。
だから、荷物を全部まとめて平均的な重さを計算できる。
自由度の計算も単純。

ウェルチのt検定
「2人の荷物には違う種類のものが入っているかも」と考える。
Aさんの荷物の重さのバラつきと、Bさんの荷物の重さのバラつきを別々に考慮する必要がある。
その「別々に考慮する」処理が、自由度の式を複雑にしている。

⚠️ 重要なポイント

ウェルチの自由度は、整数にならないことが多いです(例:df = 12.7)。
t分布表を使う場合は、小数点以下を切り捨てて保守的に判定します。
統計ソフトを使えば、小数のまま正確に計算してくれます。

📖 関連記事

「不偏分散」について詳しく知りたい方はこちら。

→ 分散・標準偏差・不偏分散の違いを完全解説

【具体例】ウェルチのt検定を手計算してみよう

📋 ケーススタディ:2つの工場の製品比較

🏭 設定

A工場とB工場で作られた部品の平均寸法に差があるかを検定します。
F検定の結果、等分散でないことがわかりました。
そのため、ウェルチのt検定を使います。

有意水準 α = 0.05(両側検定)とします。

📊 測定データ

工場 測定値(mm)
A工場(n₁=6) 50, 51, 50, 51, 50, 50
B工場(n₂=6) 48, 54, 47, 55, 52, 50

📝 STEP 1:基本統計量を計算

統計量 A工場 B工場
サンプルサイズ n 6 6
標本平均 x̄ 50.33 mm 51.00 mm
不偏分散 s² 0.27 10.00

👀 注目ポイント

不偏分散を見てください。0.27 vs 10.00約37倍も違います!
これが「等分散でない」状態です。
A工場は安定、B工場はバラバラ。この状況でスチューデントのt検定を使うのは不適切です。

📝 STEP 2:t値を計算

公式:t = (x̄₁ − x̄₂) ÷ √(s₁²/n₁ + s₂²/n₂)

分子:50.33 − 51.00 = −0.67

分母:√(0.27/6 + 10.00/6) = √(0.045 + 1.667) = √1.712 ≈ 1.31

t = −0.67 ÷ 1.31 ≈ −0.51

📝 STEP 3:自由度を計算(ウェルチ-サタスウェイト)

ここが複雑な部分ですが、順番に計算していきましょう。

A = s₁²/n₁ = 0.27/6 = 0.045

B = s₂²/n₂ = 10.00/6 = 1.667

分子:(A + B)² = (0.045 + 1.667)² = 1.712² = 2.93

分母:A²/(n₁−1) + B²/(n₂−1)

   = 0.045²/5 + 1.667²/5

   = 0.0004 + 0.556 = 0.556

df = 2.93 ÷ 0.556 ≈ 5.27

自由度が整数にならない点に注目してください。これがウェルチのt検定の特徴です。
t分布表を使う場合は、切り捨てて df = 5 として判定します。

📝 STEP 4:判定

項目
計算したt値 −0.51(絶対値 0.51)
自由度 5(5.27を切り捨て)
臨界値(α=0.05, 両側) 2.571

📊 判定結果

|t| = 0.51 < 臨界値 2.571

→ 帰無仮説を棄却できない

📝 結論の書き方

「ウェルチのt検定を行った結果、A工場とB工場の製品の平均寸法に有意な差は認められなかった(t = −0.51, df = 5.27, p > 0.05)。

ただし、B工場は分散が大きく品質の安定性に課題がある可能性があり、別途検討が必要である。」

📖 関連記事

t分布表の読み方を確認したい方はこちら。

→ 臨界値と統計数値表の使い方

実務での注意点とよくある誤解

⚠️ よくある誤解

❌ 誤解1:「等分散ならウェルチは使えない」

正解:等分散の場合でもウェルチのt検定は使えます。
結果はスチューデントのt検定とほぼ同じになります。
むしろ、「迷ったらウェルチ」が現代の主流です。

❌ 誤解2:「ウェルチの方が常に正確」

正解:ウェルチのt検定は「安全」ですが、等分散が明らかな場合はスチューデントのt検定の方が検出力(Power)が高いです。
つまり、差があるときに「差がある」と見抜く力が強いということです。

❌ 誤解3:「F検定で有意でなければスチューデントでOK」

正解:F検定で「有意でない」≠「等分散が証明された」です。
サンプルサイズが小さいと、本当は分散が違っても検出できないことがあります。
不安な場合は、ウェルチを使う方が安全です。

🔧 実務でのフローチャート

📋 2群の平均を比較するときの判断フロー

① 対応があるか?
 → Yes:対応のあるt検定
 → No:②へ

② F検定で等分散を確認
 → 等分散:スチューデントのt検定
 → 等分散でない:ウェルチのt検定
 → よくわからない:ウェルチのt検定(安全策)

📖 関連記事

「対応のあるt検定」についてはこちらで解説しています。

→ 対応のあるt検定|ビフォーアフターの差を検証する方法

まとめ:ウェルチのt検定のポイント

使う場面 2群の平均を比較したいが、分散が異なる(または不明な)とき
前提条件 正規性は必要。等分散は不要
特徴 各群の分散を別々に使う。自由度の計算が複雑
実務のコツ 迷ったらウェルチを選べば安全

💡 覚え方のコツ

ウェルチ」=「Well Check(よく確認)」

バラつきが違っても「よく確認」して比較できる、安全な検定方法!

📖 NEXT STEP

次に学ぶべきは「対応のあるt検定」

同じ人のビフォー・アフターを比較したい場合は、また別の検定が必要です。
「個人差」という厄介な変動を消し去る最強の方法を学びましょう。

→ 対応のあるt検定を学ぶ

🎉

お疲れ様でした!

ウェルチのt検定は、実務で最も安全に使える2群比較の方法です。
「迷ったらウェルチ」を合言葉に、自信を持って分析を進めてください。

関連記事

統計学のおすすめ書籍

統計学の「数式アレルギー」を治してくれた一冊

「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。

この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。

「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。

¥2,420 (2025/11/23 09:57時点 | Amazon調べ)

【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル

私がQC検定2級に合格した際、使い倒したのがこの一冊です。

この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。

解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。

タグ

-検定・推定
-