📊 こんな疑問、ありませんか?
- 「平方和(S)」と「自由度(f)」って、なぜいつもセットで出てくるの?
- 分散分析表を作るとき、S÷fって何をしているの?
- 「分散」を求めるのに、なぜn-1で割るの?
こんにちは、シラスです。
前回の記事で、データの「底上げ分(下駄)」を取り除く修正項(CT)について解説しました。
この修正項を手に入れたことで、私たちはついに統計学で最も重要な指標である「平方和(S)」を計算できるようになりました。
しかし、分散分析表(ANOVA)を見ると、平方和(S)の隣には必ず「自由度(f)」というパートナーがいます。
「Sとf、この2つはどういう関係なの?」
「なぜセットで計算するの?」
✅ この記事で学べること
- 平方和(S)=データのバラつきの「総エネルギー」
- 自由度(f)=エネルギーが広がっている「個数」
- 分散(V)=SをfでVに直した「公平な単価」
- 具体的な数値で、CT→S→f→Vの計算を実践
目次
結論:Sとfは「総額」と「個数」の関係
最初に結論をお伝えします。
💡 Sとfの関係を一言で言うと?
S(総額)÷ f(個数)= V(単価)
平方和だけでは比較できないから、
自由度で割って「公平な基準」にするのです!

1. 平方和(S)とは「データの総エネルギー」
まずは平方和(Sum of Squares)です。
名前だけ見ると難しそうですが、文字通り「2乗(平方)の合計(和)」という意味です。
🔋 イメージ①:「バッテリー残量」で考える
平方和を、スマホの「バッテリー残量」にたとえてみましょう。
🔋
バッテリー残量 = 平方和(S)
データ全体が持っている
「バラつきのエネルギー総量」
📊
エネルギーが大きい = バラつきが大きい
数値が大きいほど
データが平均から離れている
バッテリーが100%あるスマホと、10%しかないスマホ。どちらが「エネルギーを持っている」でしょうか?
もちろん100%のスマホですよね。
平方和(S)も同じです。値が大きいほど、データに「バラつきのエネルギー」がたくさん詰まっていることを意味します。
📐 平方和(S)の計算式
S = Σx² − CT(修正項)
データそれぞれの「高さ」を2乗して足し合わせ、そこから「底上げ分(CT)」を引くことで、純粋なバラつきの大きさだけを取り出します。
💰 イメージ②:「預金残高」で考える
もう一つ、銀行の預金残高で考えてみましょう。
あなたの口座に100万円あります。
この「100万円」は、今まで稼いだお金の総額ですよね。
平方和(S)は、データの「バラつき預金残高」のようなものです。
預金残高が多いほどお金持ちなように、平方和が大きいほど「バラつきが激しいデータ」です。
でも、ここで問題があります。
「100万円」と聞いて、あなたはこう思いませんか?
🤔 「それって、何年分の貯金?」
1年で100万円貯めたのか、10年で100万円貯めたのか。
「期間」がわからないと、その100万円の価値(貯蓄ペース)は判断できないのです。
平方和(S)も同じ。データが何個あるかわからないと、バラつきの「激しさ」は判断できません。

2. 自由度(f)とは「エネルギーの個数」
次に自由度(df / f)です。
「自由度」という言葉、いきなり出てきて戸惑いますよね。
😵 「自由度」ってなに?いきなり出てきた!
統計学の教科書を読んでいると、突然「自由度」という言葉が出てきます。しかも、ほとんどの教科書は説明なしに「自由度 = n - 1」と書いてあるだけ。これではわかりませんよね。
🎮 イメージ①:「自由に動かせるコマの数」
自由度とは、文字通り「自由に動かせるデータの数」です。
ここで、簡単なゲームを考えてみましょう。
🎲 「合計を10にするゲーム」
3つの数字 □、□、□ を使って、合計を 10 にしてください。
最初の2つ(3と5)は自由に決められました。
でも、3つ目は「2」に決まりますよね?(3+5+2=10)
このように、合計が決まっていると、最後の1つは自動的に決まってしまうのです。
だから、3つのデータがあっても、自由に動かせるのは2つだけ。
これが「自由度 = n - 1」の正体です。
📐 自由度(f)の計算式
f = n − 1
データ数(n)から1を引いた数。
「平均」という縛りがあるため、最後の1つは自由に動かせないから。
🍕 イメージ②:「ピザの切れ端」で考える
もう一つ、ピザでたとえてみましょう。
ピザを8等分したとします。
7人に1切れずつ配ったら、残りの1切れは自動的に8人目のものですよね。
「自由に選べたのは7回だけ」。これが自由度 = 8 - 1 = 7 の意味です。
つまり自由度とは、「情報として意味のある独立したデータの数」と考えればOKです。

3. Sとfの関係=「お肉のパック」の値段
ここからが本題です。
なぜ、分散分析表では「S」と「f」が必ずセットで書かれているのでしょうか?
それは、「S(平方和)」単体では、バラつきの激しさを比較できないからです。
🥩 スーパーのお肉で考える
スーパーでお肉を買うとき、あなたはどうやって「お得かどうか」を判断しますか?
🥩
パックA
1,000円
「高い!」と思いますか?
でも、10kg入っていたら?
🥩
パックB
500円
「安い!」と思いますか?
でも、10gしか入っていなかったら?
そうなんです。
平方和(S)は、データ数が増えれば増えるほど、どんどん足し算されて大きくなってしまう「総額(トータルプライス)」なのです。
データ数が違う実験同士を比べるためには、「単価(1単位あたりのバラつき)」に直す必要があります。
💡 そこで生まれたのが「分散(V)」
総額(S)を、個数(f)で割ることで、「単価」が出ます。
この単価こそが、私たちが最終的に欲しい「分散(V:Variance)」です。
📊 お肉と統計の対応関係
| お肉の話 | 統計の話 |
|---|---|
| 総額(1000円) | 平方和 S |
| グラム数(10kg) | 自由度 f |
| 単価(100円/kg) | 分散 V |
実験計画法では、この「V(単価)」を使って、次のような判定を行います。
「A工場(V=100)は、B工場(V=10)よりもバラつきが10倍大きい!」
このように、分散(V)に直すことで、データ数が違う実験同士でも公平に比較できるようになるのです。

4. 実践:数値で計算してみよう
では、前回使ったデータ {3, 4, 5} を使って、CT → S → f → V を一気に計算してみましょう。
📊 今回のデータ
{3, 4, 5}
データ数 N = 3
ステップ1:修正項(CT)を出す
まずは、データの「底上げ分」を計算します。
合計 T = 3 + 4 + 5 = 12
データ数 N = 3
CT = 12² ÷ 3 = 144 ÷ 3 = 48
ステップ2:平方和(S)を出す
生の2乗和からCTを引きます。
Σx² = 3² + 4² + 5² = 9 + 16 + 25 = 50
S = 50 − 48 = 2
これで「総エネルギーは 2 だ」と分かりました!
ステップ3:自由度(f)を出す
データ数から1を引きます。
データ数 n = 3
f = 3 − 1 = 2
ステップ4:分散(V)を出す
最後に割り算をして「単価」を出します。
V = S ÷ f = 2 ÷ 2 = 1
このデータの不偏分散は「1」です!
✅ 検算してみよう
Excelで =VAR.S(3,4,5) と入力してみてください。
ちゃんと 1 になります!
📋 計算結果まとめ
| 記号 | 名前 | 計算式 | 結果 |
|---|---|---|---|
| CT | 修正項 | T²÷N = 12²÷3 | 48 |
| S | 平方和 | Σx²−CT = 50−48 | 2 |
| f | 自由度 | n−1 = 3−1 | 2 |
| V | 分散 | S÷f = 2÷2 | 1 |

まとめ
平方和(S)と自由度(f)の関係は、切っても切れない関係です。
📝 今日のポイント
✅ S(平方和)
とにかく全部足した
「バラつきの総量」
✅ f(自由度)
そのデータが持っている
「広さ(N-1)」
✅ V(分散)
Sをfで割って公平にした
「評価基準」
分散分析表(ANOVA)を作るときは、ただ機械的に計算するのではなく、
💡「まずは総額(S)を出して、それを個数(f)で割って、単価(V)を出しているんだな」
とイメージしながら計算すると、ミスの発見も早くなりますよ。
📖 次に読む記事
総平方和(S_T)の計算|データ全体のバラつきを数値化する|一元配置実験⑥
今回学んだ「平方和」と「自由度」を使って、いよいよ実験データ全体のバラつき(総平方和)を計算します。分散分析表を作るための第一歩です!
次の記事を読む →📚 あわせて読みたい
📖 一元配置実験マスター講座【全16回】
このシリーズを順番に読めば、一元配置実験を完全マスターできます!
