回帰分析

【図解】重回帰の分散分析表の作り方|自由度・平均平方・F値の計算を完全マスター

😣 こんな悩みはありませんか?
  • 「分散分析表って何?どうやって作るの?」
  • 「自由度の決め方がわからない…」
  • 「平均平方とF値って何を計算しているの?」
✅ この記事でわかること
  • 分散分析表の役割と構造
  • 自由度の決め方(なぜその数になるのか)
  • 平均平方の計算方法
  • F値の意味と計算
  • 具体例で表を完成させる全手順

前回の記事で、平方和(ST, SR, Se)の計算方法を学びました。

今回は、その平方和を使って「分散分析表」を完成させます。

分散分析表を作れば、「この重回帰式は本当に使えるのか?」を統計的に判断できるようになります。

📘 平方和の計算をまだ見ていない方はこちら
【計算例あり】重回帰の平方和の分解|SR, Se, ST の意味と求め方 →

📊 分散分析表とは?

分散分析表(ANOVA表)は、「バラつきを要因ごとに整理した表」です。

📐 分散分析表の役割

「回帰によるバラつき」と「残差(誤差)によるバラつき」を比較して、
回帰モデルが統計的に意味があるかどうかを判定する

📋 分散分析表の構造

重回帰分析の分散分析表は、以下のような形をしています。

要因平方和 S自由度 φ平均平方 VF値 F₀
回帰 RSRφRVRF₀
残差 eSeφeVe
計 TSTφT

🔤 各列の意味

記号意味
平方和Sバラつきの大きさ(前回計算済み)
自由度φ(ファイ)自由に動けるデータの数
平均平方V1自由度あたりのバラつき(= S ÷ φ)
F値F₀回帰と残差のバラつきの比(= VR ÷ Ve)
💡 計算の流れ
S(平方和)→ φ(自由度)→ V(平均平方)→ F₀(F値)

左から右へ順番に埋めていけば、表が完成します。
📗 一元配置実験の分散分析表を復習したい方はこちら
分散分析表の作り方|表を完成させる手順 →

🎯 自由度の決め方

分散分析表で最も「なぜ?」と思うのが自由度ではないでしょうか。

でも、ルールを覚えれば簡単です。

📐 重回帰分析の自由度公式

φT(総)

n − 1
=
φR(回帰)

k
+
φe(残差)

n − k − 1

n = データ数、k = 説明変数の数

🤔 なぜこの数になるの?

🟢 総自由度 φT = n − 1

データがn個あっても、平均を固定すると自由に動けるのは n−1 個です。

💡 イメージ
5人の合計点が100点と決まっていたら、4人の点数が決まれば最後の1人は自動的に決まりますよね。自由に決められるのは4人分(n−1)です。

🔵 回帰自由度 φR = k

回帰式で推定するパラメータ(偏回帰係数)の数です。説明変数がk個なら、β₁, β₂, ..., βk の k 個を推定します。

💡 例
説明変数が2つ(x₁, x₂)なら、φR = 2 です。

🟠 残差自由度 φe = n − k − 1

「総自由度」から「回帰自由度」と「切片の分(1)」を引いた残りです。

💡 計算
φe = φT − φR = (n − 1) − k = n − k − 1

データがn個、推定するパラメータがk+1個(切片β₀ + 偏回帰係数k個)なので、残りは n − k − 1 個です。

✅ 自由度の検算

自由度も平方和と同じく、足し算が成り立ちます

φT = φR + φe

(n − 1) = k + (n − k − 1) ✓

計算が合わなければ、どこかでミスしています。必ず検算しましょう。

📐 平均平方の計算

平均平方(V)は、「1自由度あたりのバラつき」です。

📐 平均平方の公式
V = S ÷ φ

平均平方 = 平方和 ÷ 自由度

🤔 なぜ平均平方を計算するの?

平方和(S)だけでは、データ数や説明変数の数が違うと比較できないからです。

【例え:クラスの合計点】

Aクラス(30人)の合計点 = 2400点
Bクラス(20人)の合計点 = 1800点

どっちが優秀? → 人数で割って平均を出さないとわからない!

平均平方も同じです。自由度で割ることで、公平に比較できるようになります。

🔥 F値の計算と意味

F値は、「回帰のバラつき」と「残差のバラつき」を比較した比です。

📐 F値の公式
F₀ =
VR(回帰の平均平方)
Ve(残差の平均平方)

🎯 F値の解釈

F₀の値意味判定
大きい 📈回帰による説明 > 残差(誤差)回帰モデルは有効 😊
1に近い回帰による説明 ≒ 残差(誤差)微妙… 🤔
小さい 📉回帰による説明 < 残差(誤差)回帰モデルは無効 😢
💡 イメージ
F値は「シグナル(回帰)とノイズ(残差)の比」です。

シグナルがノイズより十分大きければ(F値が大きければ)、回帰モデルは「意味がある」と判断できます。

📊 具体例で分散分析表を完成させよう

前回の記事で計算した平方和を使って、分散分析表を完成させましょう。

📋 前回までの結果

  • データ数:n = 5
  • 説明変数の数:k = 2(温度 x₁、圧力 x₂)
  • 総平方和:ST = 49.20
  • 回帰平方和:SR = 48.93
  • 残差平方和:Se = 0.27

🔢 Step 1:自由度を計算

自由度公式計算結果
φR(回帰)k22
φe(残差)n − k − 15 − 2 − 12
φT(総)n − 15 − 14

検算:φR + φe = 2 + 2 = 4 = φT ✓

🔢 Step 2:平均平方を計算

平均平方公式計算結果
VR(回帰)SR ÷ φR48.93 ÷ 224.47
Ve(残差)Se ÷ φe0.27 ÷ 20.135

🔢 Step 3:F値を計算

F₀ =
VR
Ve
=
24.47
0.135
=
181.3

🎉 完成!分散分析表

要因平方和 S自由度 φ平均平方 VF値 F₀
回帰 R48.93224.47181.3
残差 e0.2720.135
計 T49.204
💡 結果の解釈
F₀ = 181.3 は非常に大きな値です。これは「回帰によるバラつき」が「残差(誤差)によるバラつき」の181倍以上あることを意味します。

つまり、この重回帰モデルは非常によく当てはまっていると言えそうです。

ただし、「F₀が大きい」だけでは統計的に有意とは言えません。次の記事で、F表と比較して正式に判定する方法を学びます。

📋 まとめ

この記事では、重回帰分析の分散分析表の作り方を解説しました。

✅ この記事のポイント
  • 分散分析表は「バラつきを要因ごとに整理した表」
  • 自由度:φR = k、φe = n−k−1、φT = n−1
  • 平均平方:V = S ÷ φ(1自由度あたりのバラつき)
  • F値:F₀ = VR ÷ Ve(シグナル÷ノイズ)
  • F値が大きいほど、回帰モデルは有効

【計算の流れ】

平方和 S自由度 φ平均平方 VF値 F₀

分散分析表が完成したら、次はF表と比較して「統計的に有意かどうか」を正式に判定します。

📚 次に読むべき記事

📘 【計算例あり】重回帰モデルの有意性検定|F₀とF表を比較して判定 →

F検定で「このモデルは統計的に有意か?」を判定する

📖 重回帰分析の全体像を確認したい方へ

分散分析表は、重回帰分析の評価ステップの1つです。

📊 重回帰分析とは?(超入門)→
📘 実験計画法の分散分析表を復習したい方はこちら
分散分析表の作り方完全ガイド|S→V→Fの流れを総復習 →
📗 決定係数R²との関係を知りたい方はこちら
決定係数(R²)の正体|「あてはまりの良さ」を視覚的に理解する →

タグ

-回帰分析
-