実験計画法

平方和(S)と自由度の関係|「分散」を求める準備|一元配置実験⑤

📊 こんな疑問、ありませんか?

  • 「平方和(S)」と「自由度(f)」って、なぜいつもセットで出てくるの?
  • 分散分析表を作るとき、S÷fって何をしているの?
  • 「分散」を求めるのに、なぜn-1で割るの?

こんにちは、シラスです。

前回の記事で、データの「底上げ分(下駄)」を取り除く修正項(CT)について解説しました。

この修正項を手に入れたことで、私たちはついに統計学で最も重要な指標である「平方和(S)」を計算できるようになりました。

しかし、分散分析表(ANOVA)を見ると、平方和(S)の隣には必ず「自由度(f)」というパートナーがいます。

「Sとf、この2つはどういう関係なの?」
「なぜセットで計算するの?」

✅ この記事で学べること

  • 平方和(S)=データのバラつきの「総エネルギー」
  • 自由度(f)=エネルギーが広がっている「個数」
  • 分散(V)=SをfでVに直した「公平な単価」
  • 具体的な数値で、CT→S→f→Vの計算を実践

📖 前回の記事

修正項(CT)とは?T²/Nの計算式を図解で理解する|一元配置実験④

修正項の意味と計算方法を解説しています。まだ読んでいない方は先にこちらをどうぞ!

結論:Sとfは「総額」と「個数」の関係

最初に結論をお伝えします。

💡 Sとfの関係を一言で言うと?

S(総額)÷ f(個数)= V(単価)

平方和だけでは比較できないから、
自由度で割って「公平な基準」にするのです!

1. 平方和(S)とは「データの総エネルギー」

まずは平方和(Sum of Squares)です。

名前だけ見ると難しそうですが、文字通り「2乗(平方)の合計(和)」という意味です。

🔋 イメージ①:「バッテリー残量」で考える

平方和を、スマホの「バッテリー残量」にたとえてみましょう。

🔋

バッテリー残量 = 平方和(S)

データ全体が持っている
「バラつきのエネルギー総量」

📊

エネルギーが大きい = バラつきが大きい

数値が大きいほど
データが平均から離れている

バッテリーが100%あるスマホと、10%しかないスマホ。どちらが「エネルギーを持っている」でしょうか?

もちろん100%のスマホですよね。

平方和(S)も同じです。値が大きいほど、データに「バラつきのエネルギー」がたくさん詰まっていることを意味します。

📐 平方和(S)の計算式

S = Σx² − CT(修正項)

データそれぞれの「高さ」を2乗して足し合わせ、そこから「底上げ分(CT)」を引くことで、純粋なバラつきの大きさだけを取り出します。

💰 イメージ②:「預金残高」で考える

もう一つ、銀行の預金残高で考えてみましょう。

あなたの口座に100万円あります。

この「100万円」は、今まで稼いだお金の総額ですよね。

平方和(S)は、データの「バラつき預金残高」のようなものです。

預金残高が多いほどお金持ちなように、平方和が大きいほど「バラつきが激しいデータ」です。

でも、ここで問題があります。

「100万円」と聞いて、あなたはこう思いませんか?

🤔 「それって、何年分の貯金?」

1年で100万円貯めたのか、10年で100万円貯めたのか。

「期間」がわからないと、その100万円の価値(貯蓄ペース)は判断できないのです。

平方和(S)も同じ。データが何個あるかわからないと、バラつきの「激しさ」は判断できません

2. 自由度(f)とは「エネルギーの個数」

次に自由度(df / f)です。

「自由度」という言葉、いきなり出てきて戸惑いますよね。

😵 「自由度」ってなに?いきなり出てきた!

統計学の教科書を読んでいると、突然「自由度」という言葉が出てきます。しかも、ほとんどの教科書は説明なしに「自由度 = n - 1」と書いてあるだけ。これではわかりませんよね。

🎮 イメージ①:「自由に動かせるコマの数」

自由度とは、文字通り「自由に動かせるデータの数」です。

ここで、簡単なゲームを考えてみましょう。

🎲 「合計を10にするゲーム」

3つの数字 □、□、□ を使って、合計を 10 にしてください。

3
+
5
+
?
=
10

最初の2つ(3と5)は自由に決められました。
でも、3つ目は「2」に決まりますよね?(3+5+2=10)

このように、合計が決まっていると、最後の1つは自動的に決まってしまうのです。

だから、3つのデータがあっても、自由に動かせるのは2つだけ

これが「自由度 = n - 1」の正体です。

📐 自由度(f)の計算式

f = n − 1

データ数(n)から1を引いた数。
「平均」という縛りがあるため、最後の1つは自由に動かせないから。

🍕 イメージ②:「ピザの切れ端」で考える

もう一つ、ピザでたとえてみましょう。

ピザを8等分したとします。

7人に1切れずつ配ったら、残りの1切れは自動的に8人目のものですよね。

「自由に選べたのは7回だけ」。これが自由度 = 8 - 1 = 7 の意味です。

つまり自由度とは、「情報として意味のある独立したデータの数」と考えればOKです。

📖 もっと詳しく知りたい方へ

自由度(f)とは?なぜn-1で割るのかを完全解説

不偏分散で「n-1で割る理由」をさらに詳しく解説しています。

3. Sとfの関係=「お肉のパック」の値段

ここからが本題です。

なぜ、分散分析表では「S」と「f」が必ずセットで書かれているのでしょうか?

それは、「S(平方和)」単体では、バラつきの激しさを比較できないからです。

🥩 スーパーのお肉で考える

スーパーでお肉を買うとき、あなたはどうやって「お得かどうか」を判断しますか?

🥩

パックA

1,000円

「高い!」と思いますか?
でも、10kg入っていたら?

🥩

パックB

500円

「安い!」と思いますか?
でも、10gしか入っていなかったら?

そうなんです。

平方和(S)は、データ数が増えれば増えるほど、どんどん足し算されて大きくなってしまう「総額(トータルプライス)」なのです。

データ数が違う実験同士を比べるためには、「単価(1単位あたりのバラつき)」に直す必要があります。

💡 そこで生まれたのが「分散(V)」

総額(S)を、個数(f)で割ることで、「単価」が出ます。

この単価こそが、私たちが最終的に欲しい「分散(V:Variance)」です。

🎯 分散(V)の計算式

V = S ÷ f

S

平方和
(総額)

f

自由度
(個数)

V

分散
(単価)

📊 お肉と統計の対応関係

お肉の話統計の話
総額(1000円)平方和 S
グラム数(10kg)自由度 f
単価(100円/kg)分散 V

実験計画法では、この「V(単価)」を使って、次のような判定を行います。

「A工場(V=100)は、B工場(V=10)よりもバラつきが10倍大きい!」

このように、分散(V)に直すことで、データ数が違う実験同士でも公平に比較できるようになるのです。

4. 実践:数値で計算してみよう

では、前回使ったデータ {3, 4, 5} を使って、CT → S → f → V を一気に計算してみましょう。

📊 今回のデータ

{3, 4, 5}

データ数 N = 3

ステップ1:修正項(CT)を出す

まずは、データの「底上げ分」を計算します。

合計 T = 3 + 4 + 5 = 12

データ数 N = 3

CT = 12² ÷ 3 = 144 ÷ 3 = 48

ステップ2:平方和(S)を出す

生の2乗和からCTを引きます。

Σx² = 3² + 4² + 5² = 9 + 16 + 25 = 50

S = 50 − 48 = 2

これで「総エネルギーは 2 だ」と分かりました!

ステップ3:自由度(f)を出す

データ数から1を引きます。

データ数 n = 3

f = 3 − 1 = 2

ステップ4:分散(V)を出す

最後に割り算をして「単価」を出します。

V = S ÷ f = 2 ÷ 2 = 1

このデータの不偏分散は「1」です!

✅ 検算してみよう

Excelで =VAR.S(3,4,5) と入力してみてください。
ちゃんと 1 になります!

📋 計算結果まとめ

記号名前計算式結果
CT修正項T²÷N = 12²÷348
S平方和Σx²−CT = 50−482
f自由度n−1 = 3−12
V分散S÷f = 2÷21

まとめ

平方和(S)と自由度(f)の関係は、切っても切れない関係です。

📝 今日のポイント

✅ S(平方和)

とにかく全部足した
「バラつきの総量」

✅ f(自由度)

そのデータが持っている
「広さ(N-1)」

✅ V(分散)

Sをfで割って公平にした
「評価基準」

分散分析表(ANOVA)を作るときは、ただ機械的に計算するのではなく、

💡「まずは総額(S)を出して、それを個数(f)で割って、単価(V)を出しているんだな」

とイメージしながら計算すると、ミスの発見も早くなりますよ。

📖 次に読む記事

総平方和(S_T)の計算|データ全体のバラつきを数値化する|一元配置実験⑥

今回学んだ「平方和」と「自由度」を使って、いよいよ実験データ全体のバラつき(総平方和)を計算します。分散分析表を作るための第一歩です!

次の記事を読む →

📚 あわせて読みたい

🔢 計算の前提知識

修正項(CT)とは?T²/Nの計算式を図解で理解する

平方和を計算するために必要な「修正項」の意味と計算方法を解説。

📊 基礎知識

自由度(f)とは?なぜn-1で割るのかを完全解説

不偏分散で「n-1で割る理由」をさらに詳しく解説しています。

📈 分散の基礎

分散と標準偏差の違いをわかりやすく解説

分散と標準偏差の意味、使い分けについて解説しています。

🔬 実験計画法

誤差とは?実験や統計で必ず出るズレの正体を解説

実験計画法で重要な「誤差」の概念を初心者向けに解説。

📖 一元配置実験マスター講座【全16回】

このシリーズを順番に読めば、一元配置実験を完全マスターできます!

① 分散分析とは?「平均の差」ではなく「分散」を見る理由 ② 一元配置実験とは?1つの因子で白黒つける実験の基本形 ③ 一元配置実験の計算の全体像|分散分析表を作るまでの地図 ④ 修正項(CT)とは?T²/Nの計算式を図解で理解する
⑤ 平方和(S)と自由度の関係|「分散」を求める準備 👈 今ここ
⑥ 総平方和(S_T)の計算|データ全体のバラつきを数値化する ⑦ 群間平方和と群内平方和|バラつきを「効果」と「誤差」に分解する ⑧ 分散分析表(ANOVA)の作り方|表を完成させる手順 ⑨ F検定で有意差を判定する|F分布表の使い方 ⑩ 母平均の点推定と区間推定|最適条件の結果を予測する ⑪ 有効繰返し数とは?実験回数の最適解を導く考え方 ⑫ 有効繰返し数の計算方法|2つの公式を使い分ける ⑬ 平均平方の期待値E(V)とは?数式の意味を直感的に理解する ⑭ 分散分析表の作り方完全ガイド|S→V→Fの流れを総復習 ⑮ 一元配置実験の分散分析を実践|カレーの例で手を動かす ⑯ 一元配置実験の計算を完全図解|分散分析表を1から作る全手順

タグ

-実験計画法
-