統計学基礎

【初心者向け】自由度の意味と計算方法|なぜn-1?を徹底解説

「自由度の計算がわからない…」そう感じているのは、あなただけではありません。QC検定や統計学で多くの人が挫折する最大の原因が、この「自由度」の理解です。

この記事では、自由度とは何か?という本質から、t検定・カイ二乗検定・実験計画法まで、徹底的に分かりやすく解説します。計算ミスを防ぐチェックリストも用意しましたので、QC検定対策に活用してください。

なぜ自由度の計算でつまずくのか?

統計学で自由度を学ぶ際、以下のような悩みをよく聞きます:

  • 「データ数-1」と言われても、なぜ1を引くのか理解できない
  • t検定では「n-1」なのに、実験計画法では計算方法が違う
  • カイ二乗検定の「(行-1)×(列-1)」の意味がわからない
  • 検定ごとに公式が違って覚えられない

これらの悩みは、自由度の本質的な意味を理解せず、公式だけを暗記しようとするから生まれます。

この記事では、公式暗記ではなく「自由度とは何なのか?」を徹底的に理解することを目指します。


1. 自由度とは何か?(直感的な理解)

自由度の本質:「自由に決められる数の個数」

自由度とは、「制約の中で、自分で自由に決められる数値がいくつあるか」を表します。

身近な例で理解する

あなたが友達3人と旅行に行き、合計で1万円を支払うとします。

A + B + C + あなた = 10,000円

この時:

  • Aさんが3,000円払うと決めた
  • Bさんが2,000円払うと決めた
  • Cさんが4,000円払うと決めた
  • あなたが払う金額は? → 自動的に1,000円に決まる

つまり、4人いるのに自由に決められるのは3人だけです。これが「自由度3」の意味です。

数学的な表現

n個の数値があり、その合計が固定されている場合:

自由度 = n - 1

なぜ「-1」するのか?
→ 合計という「制約条件」が1つあるため、最後の1つは自動的に決まる


2. 統計における自由度:なぜ平均を使うと「-1」するのか

平均が制約条件になる

統計では、平均を計算した時点で、データに制約が生まれます

具体例で理解する

5つのデータ:3, 5, 7, 9, 11

平均を計算すると:

平均 = (3 + 5 + 7 + 9 + 11) ÷ 5 = 7

平均を使って偏差(データ - 平均)を計算します:

データ偏差(データ - 平均)
33 - 7 = -4
55 - 7 = -2
77 - 7 = 0
99 - 7 = +2
1111 - 7 = +4

重要な性質:偏差の合計は必ずゼロになります。

(-4) + (-2) + 0 + 2 + 4 = 0

これが「自由度 = n - 1」の理由

偏差の合計が0という制約があるため:

  • 最初の4つの偏差は自由に決められる
  • しかし、5つ目の偏差は自動的に決まる(合計が0になるように)

→ 自由度 = 5 - 1 = 4

分散・標準偏差の計算でも同じ

分散の公式:

分散 = Σ(データ - 平均)² ÷ (n - 1)

なぜ n ではなく (n-1) で割るのか?

→ 平均を使った時点で制約が1つ生まれ、自由度が n-1 になるから


3. t検定における自由度

t検定は、平均値の差が偶然か、本当に差があるかを判定する検定です。

1標本t検定の自由度

状況

あるクラス10人の平均点が、全国平均60点と比べて有意に高いか検証する。

自由度の計算

データ数:n = 10人
平均を計算するため:制約が1つ

自由度 = n - 1 = 10 - 1 = 9

なぜこの自由度なのか?

10人のテスト結果から平均を計算すると、10個のうち9個の偏差が決まれば、10個目の偏差は自動的に決まります(偏差の合計 = 0より)。

2標本t検定の自由度

状況

A組(n₁ = 8人)とB組(n₂ = 10人)の平均点に差があるか検証する。

自由度の計算(対応なし)

それぞれの組で制約が1つずつ:

自由度 = (n₁ - 1) + (n₂ - 1) = n₁ + n₂ - 2
     = 8 + 10 - 2 = 16

なぜこの自由度なのか?

  • A組:8人のデータで平均を計算 → 自由度7
  • B組:10人のデータで平均を計算 → 自由度9
  • 合計:7 + 9 = 16

対応のあるt検定の自由度

状況

同じ10人が、授業前と授業後にテストを受けた。改善したか検証する。

自由度の計算

(授業後 - 授業前)を計算して、その差の平均を使うため:

自由度 = n - 1 = 10 - 1 = 9

なぜこの自由度なのか?

10組のペアデータから10個の差を計算し、その差の平均を使います。差の偏差が n-1 個自由に決められるため、自由度は9です。

4. カイ二乗検定における自由度

カイ二乗検定は、観測された度数が、期待される度数とズレているかを判定します。

適合度検定の自由度

状況

サイコロを60回振って、各目の出る回数が均等か検証する。

123456合計
観測度数812911101060
期待度数10101010101060

自由度の計算

カテゴリー数:k = 6
制約条件:「合計 = 60」が固定

自由度 = k - 1 = 6 - 1 = 5

なぜこの自由度なのか?

6つの目のうち、5つの度数が決まれば、6つ目の度数は自動的に決まります(合計60になるように)。

具体例

  • 目1が8回
  • 目2が12回
  • 目3が9回
  • 目4が11回
  • 目5が10回
  • 目6は? → 60 - (8+12+9+11+10) = 10回(自動的に決まる)

独立性検定の自由度

状況

性別と商品の好みに関連があるか検証する。

商品A商品B商品C合計
男性20151045
女性10202555
合計303535100

自由度の計算

行数:r = 2(男性・女性)
列数:c = 3(商品A・B・C)

自由度 = (r - 1) × (c - 1) = (2 - 1) × (3 - 1) = 1 × 2 = 2

なぜ「(行-1)×(列-1)」なのか?

制約条件が複数あるためです。

  1. 各行の合計が固定:男性45人、女性55人
  2. 各列の合計が固定:商品A30人、商品B35人、商品C35人

この制約の中で、自由に決められるセルは限られます。

具体的に考えてみましょう

表の左上2つのセル(男性×商品A、男性×商品B)を決めると:

商品A商品B商品C合計
男性201545
女性55
合計303535100
  • 男性×商品C = 45 - 20 - 15 = 10(自動的に決まる)
  • 女性×商品A = 30 - 20 = 10(自動的に決まる)
  • 女性×商品B = 35 - 15 = 20(自動的に決まる)
  • 女性×商品C = 35 - 10 = 25(自動的に決まる)

つまり、2つのセルだけ自由に決められる → 自由度 = 2

5. 一元配置分散分析の自由度

一元配置分散分析は、3つ以上のグループの平均に差があるかを検証します。

状況

3つの製造ラインA・B・Cで作った製品の品質に差があるか検証する。

  • ラインA:5個測定
  • ラインB:5個測定
  • ラインC:5個測定
  • 総データ数:n = 15個

自由度の計算

① 総自由度(φT)

全データの自由度:

φT = n - 1 = 15 - 1 = 14

意味:15個のデータから全体の平均を計算すると、14個の偏差が自由に決められる。

② 群間(水準間)の自由度(φA)

グループ数:a = 3(ライン数)

φA = a - 1 = 3 - 1 = 2

意味:3つのグループ平均から全体平均を計算すると、2つのグループ平均が自由に決められる。

③ 群内(誤差)の自由度(φe)

φe = φT - φA = 14 - 2 = 12

または:

φe = a × (r - 1) = 3 × (5 - 1) = 3 × 4 = 12

意味:各グループ内で、5個のデータから平均を引いた偏差は4個が自由に決められる。それが3グループあるので 4 × 3 = 12。

自由度の確認

必ず成り立つ関係

φT = φA + φe
14 = 2 + 12 ✓

6. 二元配置分散分析の自由度

二元配置は、2つの因子とその交互作用を同時に調べる実験です。

状況

因子A(温度):3水準(低・中・高)
因子B(時間):2水準(短・長)
繰り返し:各条件で2回測定
総データ数:n = 3 × 2 × 2 = 12個

自由度の計算

① 総自由度(φT)

φT = n - 1 = 12 - 1 = 11

② 因子Aの自由度(φA)

φA = a - 1 = 3 - 1 = 2

意味:温度3水準の平均を使うと、2つが自由に決められる。

③ 因子Bの自由度(φB)

φB = b - 1 = 2 - 1 = 1

意味:時間2水準の平均を使うと、1つが自由に決められる。

④ 交互作用A×Bの自由度(φA×B)

重要ポイント:交互作用は「掛け算」です。

φA×B = (a - 1) × (b - 1) = 2 × 1 = 2

なぜ掛け算なのか?

交互作用は「組み合わせの効果」です。

  • 因子Aで2つの自由度
  • 因子Bで1つの自由度
  • その組み合わせ → 2 × 1 = 2

⑤ 誤差の自由度(φe)

φe = φT - φA - φB - φA×B
   = 11 - 2 - 1 - 2 = 6

または:

φe = a × b × (r - 1) = 3 × 2 × (2 - 1) = 6

自由度の確認

φT = φA + φB + φA×B + φe
11 = 2 + 1 + 2 + 6 ✓

最後に

自由度は、公式を暗記するのではなく、「なぜそうなるのか」を理解することが重要です。

この記事で学んだ「自由に決められる数の個数」という本質を押さえれば、どんな検定や実験計画法でも自由度を正しく計算できるようになります。

QC検定では、自由度が分散分析表の作成やt値・χ²値の判定に必須です。この記事のチェックリストを活用し、確実に得点につなげましょう!

タグ

-統計学基礎
-