実験計画法

【実験計画法】群間平方和(SA​)と群内平方和(Se​)の分解|データを「効果」と「誤差」に切り分ける

こんにちは、シラスです。

前回、実験データ全体のバラつきである「総平方和($S_T$)」を計算しました。

しかし、この「28」という数字(前回の計算結果)だけを見ても、実験が成功したのか失敗したのかは分かりません。

  • 「温度を変えたからデータが良くなったのか?」(効果)
  • 「単に測定ミスや偶然でズレただけなのか?」(誤差)

この2つがごちゃ混ぜになっているからです。

今日は、この塊($S_T$)を、手術用メスのように鋭い計算式を使って、「効果($S_A$)」「誤差($S_e$)」の2つにきれいに解体します。

これができれば、実験の全貌が手に取るように分かるようになります。

1. 分解のイメージ:「テストの点数」

計算に入る前に、「何を分けようとしているのか」をイメージで掴みましょう。

ある塾で、AクラスとBクラスの生徒のテストの点数を比べるとします。

📝

生徒全員の点数のバラつき($S_T$)は、以下の2つの理由で起きています。

  • ① 先生の教え方の違い($S_A$)
    「Aクラスの先生は教え方が上手いから、クラス全体の平均点が高いよね」(=実験の効果)
  • ② 生徒個人の実力差($S_e$)
    「同じクラスの中でも、できる子とできない子がいるよね」(=偶然の誤差)

実験計画法の目的は、全体のバラつきの中から①(先生の実力)だけを抽出することです。
もし①が大きければ、「この先生の教え方には効果がある!」と証明できます。

数式で書くとこうなります。

$$ S_T = S_A + S_e $$

全体($S_T$)から、効果($S_A$)と誤差($S_e$)に分ける。
とても美しい関係式ですね。

2. 群間平方和($S_A$)の計算

では、具体的な計算に入りましょう。
まずは主役である「効果($S_A$)」を計算します。

定義は「各水準の平均値と、全体平均とのズレ」ですが、実務では以下の「一発公式」を使います。

群間平方和($S_A$)の公式

$$ S_A = \left( \frac{T_1^2}{n_1} + \frac{T_2^2}{n_2} + \dots \right) - CT $$

手順:
1. 各クラスの合計点($T$)を二乗して、生徒数($n$)で割る。
2. それらを全部足す。
3. 最後に修正項($CT$)を引く。

実践計算(前回のデータ)

前回のデータ(プラスチック強度)を使います。

  • 修正項 $CT = 216$
  • 温度A1(低温): 3, 4, 5
    → 合計 $T_1 = 12$、個数 $n_1 = 3$
  • 温度A2(高温): 7, 8, 9
    → 合計 $T_2 = 24$、個数 $n_2 = 3$

公式に当てはめます。

$$ \begin{aligned} S_A &= \left( \frac{12^2}{3} + \frac{24^2}{3} \right) - 216 \\[10pt] &= \left( \frac{144}{3} + \frac{576}{3} \right) - 216 \\[10pt] &= (48 + 192) - 216 \\[10pt] &= 240 - 216 \\[10pt] &= \mathbf{24} \end{aligned} $$

$S_A = 24$
これが「温度を変えたこと(先生の違い)によって生まれたズレのエネルギー」です。

3. 群内平方和($S_e$)の計算

次に、残りの「誤差($S_e$)」を計算します。
本来なら「各データと、そのグループ平均とのズレ」を計算するのですが、そんな面倒なことはしません。

なぜなら、私たちはすでに「全体($S_T$)」「効果($S_A$)」を知っているからです。

引き算で出す(残差)

$$ S_e = S_T - S_A $$

「全体から、分かっている効果を引けば、残りは全部ノイズ(個人の実力差)だよね」という考え方です。
これが一番早くて正確です。

実践計算

  • 総平方和 $S_T = 28$ (前回計算済み)
  • 群間平方和 $S_A = 24$ (さっき計算した)
$$ S_e = 28 - 24 = \mathbf{4} $$

あっという間に求まりました。
$S_e = 4$。これが「温度とは関係のない、偶然のバラつき」です。

4. 結果の解釈:シグナルとノイズ

計算結果を並べてみましょう。

成分 平方和 ($S$) 意味
全体 ($S_T$) 28 総エネルギー
温度 ($S_A$) 24 シグナル(デカい!)
誤差 ($S_e$) 4 ノイズ(小さい)

どうでしょうか。
全体の「28」のうち、大部分の「24」は温度によるもので、誤差はたったの「4」しかありません。

この比率を見ただけでも、直感的に「あ、これは温度の影響がめちゃくちゃ強いな(実験成功だな)」と感じませんか?

この直感を、統計的に「合格!」と証明するのが、次のステップである「分散分析(ANOVA)」です。

まとめ

✅ 全体($S_T$)を、効果($S_A$)と誤差($S_e$)に分解できる。
$S_A$ は、「各水準の合計の二乗」を使って計算する。
$S_e$ は、面倒なので「引き算($S_T - S_A$)」で求める。

これで、分散分析表を作るための「材料($S$)」は全て揃いました。

次回、これらを一枚の表にまとめ上げ、ついに「F値(シグナル ÷ ノイズ)」を算出します。
実験計画法のゴールまで、あと一歩です。

統計学のおすすめ書籍

統計学の「数式アレルギー」を治してくれた一冊

「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。

この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。

「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。

¥2,420 (2025/11/23 09:57時点 | Amazon調べ)

【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル

私がQC検定2級に合格した際、使い倒したのがこの一冊です。

この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。

解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。

タグ

-実験計画法