✋ ちょっと待った!
「自由度って何?なぜ-1するの?」
「t検定やカイ二乗検定で計算方法が違って混乱する…」
そんな悩みを抱えていませんか?
この記事を読めば、もう迷いません。
統計学の最大の壁「自由度」の本質を、身近な例でやさしく、しかもQC検定で即使える形でお伝えします。
💡 この記事で得られること
✅ 自由度とは何かが直感的に理解できる
✅ なぜ「-1」するのかが腹落ちする
✅ t検定・カイ二乗検定・分散分析の自由度が計算できる
✅ QC検定2級・1級で確実に得点できる
目次
😰 なぜ自由度の計算でつまずくのか?
💬 統計学でよくあるこんな悩み…
「データ数-1って言われても、なぜ1を引くのか分からない」
「t検定では『n-1』なのに、カイ二乗検定は『(行-1)×(列-1)』で混乱する」
「検定ごとに公式が違って覚えられない」
「QC検定で分散分析表を作るとき、自由度で必ずミスする…」
これらの悩みは、自由度の本質的な意味を理解せず、公式だけを暗記しようとするから生まれます。
この記事では、公式暗記ではなく「自由度とは何なのか?」を徹底的に理解することを目指します。
🎯 この記事のゴール
✅ 自由度の本質「自由に決められる数の個数」を理解する
✅ なぜ平均を使うと「-1」するのかが分かる
✅ t検定・カイ二乗検定・分散分析の自由度を自力で計算できる
✅ QC検定で自信を持って解答できる
🔍 1. 自由度とは何か?(直感的な理解)
📋 自由度の本質:「自由に決められる数の個数」
自由度とは、「制約の中で、自分で自由に決められる数値がいくつあるか」を表します。
🎓 自由度の定義
「n個の数値があり、何らかの制約条件(例:合計が固定)がある時、
自由に決められる数値の個数」
簡単に言うと:
最後の1つは自動的に決まるから、自由に決められるのは(n-1)個!
🍕 身近な例で理解する
あなたが友達3人と旅行に行き、合計で1万円を支払うとします。
A + B + C + あなた = 10,000円
この時:
- Aさんが3,000円払うと決めた
- Bさんが2,000円払うと決めた
- Cさんが4,000円払うと決めた
- あなたが払う金額は? → 自動的に1,000円に決まる!
💡 ポイント!
4人いるのに自由に決められるのは3人だけです。
これが「自由度3」の意味です!
✅ 4人 - 1(制約) = 3(自由度)
📐 数学的な表現
n個の数値があり、その合計が固定されている場合:
自由度 = n - 1
❓ なぜ「-1」するのか?
→ 合計という「制約条件」が1つあるため、最後の1つは自動的に決まる
→ だから自由に決められるのは(n-1)個だけ!
📊 2. 統計における自由度:なぜ平均を使うと「-1」するのか
🔒 平均が制約条件になる
統計では、平均を計算した時点で、データに制約が生まれます。
この制約こそが、自由度を「n-1」にする理由です。
🔢 具体例で理解する
5つのデータ: 3, 5, 7, 9, 11
平均を計算すると:
平均 = (3 + 5 + 7 + 9 + 11) ÷ 5 = 7
平均を使って偏差(データ - 平均)を計算します:
| データ | 偏差(データ - 平均) |
|---|---|
| 3 | 3 - 7 = -4 |
| 5 | 5 - 7 = -2 |
| 7 | 7 - 7 = 0 |
| 9 | 9 - 7 = +2 |
| 11 | 11 - 7 = +4 |
⚠️ 重要な性質!
偏差の合計は必ずゼロになります:
(-4) + (-2) + 0 + 2 + 4 = 0
🔑 これが「自由度 = n - 1」の理由
偏差の合計が0という制約があるため:
- 最初の4つの偏差は自由に決められる
- しかし、5つ目の偏差は自動的に決まる(合計が0になるように)
自由度 = 5 - 1 = 4
📐 分散・標準偏差の計算でも同じ
分散の公式:
分散 = Σ(データ - 平均)² ÷ (n - 1)
❓ なぜ n ではなく (n-1) で割るのか?
→ 平均を使った時点で制約が1つ生まれ、自由度が n-1 になるから
→ より正確な推定値を得るための補正
🧪 3. t検定における自由度
t検定は、平均値の差が偶然か、本当に差があるかを判定する検定です。
🔬 1標本t検定の自由度
状況: あるクラス10人の平均点が、全国平均60点と比べて有意に高いか検証する。
📊 自由度の計算
データ数: n = 10人
平均を計算するため: 制約が1つ
自由度 = n - 1 = 10 - 1 = 9
💡 なぜこの自由度なのか?
10人のテスト結果から平均を計算すると、10個のうち9個の偏差が決まれば、
10個目の偏差は自動的に決まります(偏差の合計 = 0より)
🔬 2標本t検定の自由度
状況: A組(n₁ = 8人)とB組(n₂ = 10人)の平均点に差があるか検証する。
📊 自由度の計算(対応なし)
それぞれの組で制約が1つずつ:
自由度 = (n₁ - 1) + (n₂ - 1) = n₁ + n₂ - 2
= 8 + 10 - 2 = 16
💡 なぜこの自由度なのか?
✅ A組: 8人のデータで平均を計算 → 自由度7
✅ B組: 10人のデータで平均を計算 → 自由度9
✅ 合計: 7 + 9 = 16
🔬 対応のあるt検定の自由度
状況: 同じ10人が、授業前と授業後にテストを受けた。改善したか検証する。
📊 自由度の計算
差(授業後 - 授業前)を計算して、その差の平均を使うため:
自由度 = n - 1 = 10 - 1 = 9
🎲 4. カイ二乗検定における自由度
カイ二乗検定は、観測された度数が、期待される度数とズレているかを判定します。
🎲 適合度検定の自由度
状況: サイコロを60回振って、各目の出る回数が均等か検証する。
| 目 | 1 | 2 | 3 | 4 | 5 | 6 | 合計 |
|---|---|---|---|---|---|---|---|
| 観測度数 | 8 | 12 | 9 | 11 | 10 | 10 | 60 |
| 期待度数 | 10 | 10 | 10 | 10 | 10 | 10 | 60 |
📊 自由度の計算
カテゴリー数: k = 6
制約条件: 「合計 = 60」が固定
自由度 = k - 1 = 6 - 1 = 5
💡 なぜこの自由度なのか?
6つの目のうち、5つの度数が決まれば、6つ目の度数は自動的に決まります
(合計60になるように)
具体例:
目1が8回、目2が12回、目3が9回、目4が11回、目5が10回
→ 目6は? 60 - (8+12+9+11+10) = 10回(自動的に決まる)
📊 独立性検定の自由度
状況: 性別と商品の好みに関連があるか検証する。
| 商品A | 商品B | 商品C | 合計 | |
|---|---|---|---|---|
| 男性 | 20 | 15 | 10 | 45 |
| 女性 | 10 | 20 | 25 | 55 |
| 合計 | 30 | 35 | 35 | 100 |
📊 自由度の計算
行数: r = 2(男性・女性)
列数: c = 3(商品A・B・C)
自由度 = (r - 1) × (c - 1) = (2 - 1) × (3 - 1) = 1 × 2 = 2
💡 なぜ「(行-1)×(列-1)」なのか?
制約条件が複数あるためです:
1️⃣ 各行の合計が固定: 男性45人、女性55人
2️⃣ 各列の合計が固定: 商品A30人、商品B35人、商品C35人
この制約の中で、2つのセルだけ自由に決められる → 自由度 = 2
📊 5. 一元配置分散分析の自由度
一元配置分散分析は、3つ以上のグループの平均に差があるかを検証します。
🏭 状況
3つの製造ラインA・B・Cで作った製品の品質に差があるか検証する。
- ラインA: 5個測定
- ラインB: 5個測定
- ラインC: 5個測定
- 総データ数: n = 15個
📐 自由度の計算
① 総自由度(φT)
全データの自由度:
φT = n - 1 = 15 - 1 = 14
意味: 15個のデータから全体の平均を計算すると、14個の偏差が自由に決められる
② 群間(水準間)の自由度(φA)
グループ数: a = 3(ライン数)
φA = a - 1 = 3 - 1 = 2
意味: 3つのグループ平均から全体平均を計算すると、2つのグループ平均が自由に決められる
③ 群内(誤差)の自由度(φe)
φe = φT - φA = 14 - 2 = 12
または:
φe = a × (r - 1) = 3 × (5 - 1) = 3 × 4 = 12
意味: 各グループ内で、5個のデータから平均を引いた偏差は4個が自由に決められる。
それが3グループあるので 4 × 3 = 12
✅ 自由度の確認
必ず成り立つ関係:
φT = φA + φe
14 = 2 + 12 ✓
📊 6. 二元配置分散分析の自由度
二元配置は、2つの因子とその交互作用を同時に調べる実験です。
🏭 状況
- 因子A(温度): 3水準(低・中・高)
- 因子B(時間): 2水準(短・長)
- 繰り返し: 各条件で2回測定
- 総データ数: n = 3 × 2 × 2 = 12個
📐 自由度の計算
① 総自由度(φT)
φT = n - 1 = 12 - 1 = 11
② 因子Aの自由度(φA)
φA = a - 1 = 3 - 1 = 2
意味: 温度3水準の平均を使うと、2つが自由に決められる
③ 因子Bの自由度(φB)
φB = b - 1 = 2 - 1 = 1
意味: 時間2水準の平均を使うと、1つが自由に決められる
④ 交互作用A×Bの自由度(φA×B)
⚠️ 重要ポイント: 交互作用は「掛け算」です!
φA×B = (a - 1) × (b - 1) = 2 × 1 = 2
なぜ掛け算なのか?
交互作用は「組み合わせの効果」です。
✅ 因子Aで2つの自由度
✅ 因子Bで1つの自由度
✅ その組み合わせ → 2 × 1 = 2
⑤ 誤差の自由度(φe)
φe = φT - φA - φB - φA×B
= 11 - 2 - 1 - 2 = 6
または:
φe = a × b × (r - 1) = 3 × 2 × (2 - 1) = 6
✅ 自由度の確認
φT = φA + φB + φA×B + φe
11 = 2 + 1 + 2 + 6 ✓
📝 最後に
🎓 この記事で学んだこと
✅ 自由度の本質: 自由に決められる数の個数
✅ なぜ「-1」するのか: 平均という制約条件があるから
✅ t検定: n-1、(n₁+n₂-2)、n-1(対応あり)
✅ カイ二乗検定: k-1、(r-1)×(c-1)
✅ 分散分析: 総・群間・群内・交互作用の自由度
✅ 公式暗記ではなく本質理解が重要
🚀 次のアクション
1️⃣ 自分の業務データでt検定を実施し、自由度を計算してみる
2️⃣ QC検定の過去問で分散分析表を作成してみる
3️⃣ この記事をブックマークして、検定のたびに確認する
理解してこそ、真の実力になります!
📚 統計学をもっと深く学ぶ
💡 統計学を体系的に学びたい方へ
この記事で自由度の基礎を掴んだら、次は検定・推定の全体像を理解しましょう。
以下の記事は、統計学初心者から実務者まで幅広くおすすめできる内容です。
✨ この記事が役に立ったら、ぜひシェアしてください! ✨
あなたの学びが、誰かの未来を変えるかもしれません。
📚 実験計画法の「挫折」を救う2冊
「数式を見た瞬間に本を閉じた」
そんな経験がある私だからこそ推せる、厳選のバイブルです。