- 二元配置実験の計算、どこから手をつければいいのか分からない
- 交互作用の平方和って、なぜあんな引き算の式になるの?
- 分散分析表の数字が、何を意味しているのかイメージできない
- 実際のデータを使って、分散分析表を「ゼロから完成」まで電卓で解ける
- 交互作用の式(SAB−SA−SB)の「なぜ」が、たとえで腹落ちする
- F検定で「どの効果が効いているか」を自分で判定できる
二元配置実験の計算とは、データのばらつき(散らばり)を「因子Aのせい」「因子Bのせい」「AとBの組み合わせのせい」「偶然のせい」の4つに切り分ける作業です。やることは、修正項 → 平方和 → 自由度 → 分散 → F値の順に、決まった式へ数字を入れていくだけ。この記事では実際のデータで、一つも式を飛ばさず最後まで電卓で解ききります。
計算と聞くと身構えますよね。でも、はじめは戸惑って当然です。やることは「足して・二乗して・引く」のくり返しだけ。電卓があれば中学生でも解けます。一緒に1歩ずつ進めましょう。
目次
そもそも二元配置実験の計算で何をするの?
二元配置実験(にげんはいちじっけん)とは、2つの条件(因子)を同時に変えて、結果がどう変わるかを調べる実験です。「二元」は「2つの要因」という意味です。
たとえば「製品の強さ」を上げたいとき、温度と時間という2つの条件を変えて試します。このとき知りたいのは、次の3つです。
- 温度を変えると、強さは変わる?(因子Aの効果)
- 時間を変えると、強さは変わる?(因子Bの効果)
- 温度と時間の「組み合わせ」に、特別な相性はある?(交互作用)
カレーの味が変わったとき、「スパイスのせい?」「煮込み時間のせい?」「それともスパイスと時間の組み合わせの妙?」と原因を切り分けますよね。二元配置実験の計算は、まさにこの「味の変化の原因を、数字で切り分ける」作業です。
つまりこの計算のゴールは、「結果のばらつきは、何のせいでどれくらい起きたのか」を数字で分けること。それが分かれば、「どの条件をいじれば結果が良くなるか」が見えてきます。

ばらつきを「4つの原因」に分ける
計算に入る前に、全体像だけつかみましょう。ここが分かれば、あとの計算は「作業」になります。
データには必ず「ばらつき(数字の散らばり)」があります。二元配置実験では、この全体のばらつきを、次の4つの原因に切り分けます。専門用語で「ばらつき」を表す数字を「平方和(へいほうわ)」と呼びます。平方和とは、ざっくり言えば「散らばりの大きさを数字にしたもの」です。
ST = SA + SB + SA×B + Se
| 記号 | 意味(何のせいのばらつきか) |
|---|---|
| ST | 全体のばらつき(合計) |
| SA | 因子A(温度)のせい |
| SB | 因子B(時間)のせい |
| SA×B | AとBの組み合わせのせい(交互作用) |
| Se | 偶然のせい(誤差) |
この記事でやるのは、全体のばらつき(ST)を測って、4つの原因に振り分けるだけ。最後に「どの原因が大きいか」を見れば、結果を左右している犯人が分かります。

今回つかう実験データ
それでは、実際のデータで解いていきます。設定はとてもシンプルです。
- 調べたいこと:製品の引張強度(引っぱって壊れにくさ)を最大にする条件
- 因子A=温度:A1=低温/A2=高温
- 因子B=時間:B1=短時間/B2=長時間
- くり返し:各組み合わせで2回ずつ測定(r=2)
測定した強度の数字(全部で8個)が、これです。スマホでも読めるよう、組み合わせごとに分けて並べます。
| 組み合わせ | 1回目 | 2回目 | 小計 |
|---|---|---|---|
| A1低温×B1短時間 | 45 | 47 | 92 |
| A1低温×B2長時間 | 52 | 54 | 106 |
| A2高温×B1短時間 | 50 | 48 | 98 |
| A2高温×B2長時間 | 46 | 44 | 90 |
計算で使う「合計」も先に出しておきます。ここを準備しておくと、あとの計算がスムーズです。
| 合計の種類 | 値 |
|---|---|
| A1(低温)の合計 = 92+106 | 198 |
| A2(高温)の合計 = 98+90 | 188 |
| B1(短時間)の合計 = 92+98 | 190 |
| B2(長時間)の合計 = 106+90 | 196 |
| 全データの総合計(T) | 386 |
| データの個数(N) | 8 |

STEP1・2:まず全体のばらつきを測る
STEP1:修正項(CT)を計算する
修正項(しゅうせいこう、CT)とは、計算をラクにするための「下準備の数字」です。平均をわざわざ引かなくて済むように、先にこれを作っておきます。式はこれです。
CT = T²(総合計の2乗)÷ N(データ数)
総合計 T=386、データ数 N=8 を入れます。1ステップずつ進めます。
386 × 386 = 148,996
148,996 ÷ 8 = 18,624.5(これがCT)
STEP2:総平方和(ST)を計算する
総平方和(ST)は、全体のばらつきの大きさです。「全データを2乗して足し、そこからCTを引く」だけです。
ST =(各データを2乗して全部足す)− CT
各データを2乗して足します。
45²+47²+52²+54²+50²+48²+46²+44²
= 2025+2209+2704+2916+2500+2304+2116+1936
= 18,710
ここからCTを引きます。
18,710 − 18,624.5 = ST = 85.5
全体のばらつきは「85.5」。この85.5を、これから4つの原因(A・B・A×B・誤差)に振り分けていきます。

STEP3・4:温度のせい・時間のせいを測る
STEP3:因子A(温度)の平方和 SA
温度のせいで起きたばらつきを測ります。使うのは「A1とA2それぞれの合計」です。式は「各水準の合計を2乗して、その水準のデータ数で割り、足してCTを引く」です。
A1の合計=198(データ4個)、A2の合計=188(データ4個)。
SA =(198²÷4)+(188²÷4)− CT
=(39,204÷4)+(35,344÷4)− 18,624.5
= 9,801 + 8,836 − 18,624.5
= SA = 12.5
STEP4:因子B(時間)の平方和 SB
やり方はSTEP3と全く同じ。今度は「B1とB2の合計」を使うだけです。
B1の合計=190(データ4個)、B2の合計=196(データ4個)。
SB =(190²÷4)+(196²÷4)− CT
=(36,100÷4)+(38,416÷4)− 18,624.5
= 9,025 + 9,604 − 18,624.5
= SB = 4.5
SAとSBは「やり方が同じで、使う合計が違うだけ」です。温度を調べるときは温度の合計(A1・A2)、時間を調べるときは時間の合計(B1・B2)。これだけ意識すれば迷いません。

STEP5:交互作用の平方和(ここが山場)
交互作用(こうごさよう)とは、「AとBを組み合わせたときだけ生まれる、特別な効果」のことです。多くの人がつまずくポイントですが、式の意味さえ分かれば怖くありません。
飲み会の合計が1万円。「Aさんが頼んだ分」「Bさんが頼んだ分」を引いて、それでも余った金額があれば、それは「2人で一緒に頼んだ特別メニューの分」ですよね。交互作用も同じ。組み合わせ全体の効果から、Aの分とBの分を引いて、残ったものが「組み合わせならではの効果」なんです。
SA×B = SAB −(SA + SB)
ここで新しく出てきた SAB は「組み合わせ全体のばらつき(4つのセルの効果ぜんぶ)」です。まずこれを計算します。
STEP5-1:セルの平方和 SAB を計算
各組み合わせ(セル)の小計を使います。小計を2乗して、くり返し数(2)で割り、足してCTを引きます。
SAB =(92²÷2)+(106²÷2)+(98²÷2)+(90²÷2)− CT
= 4,232 + 5,618 + 4,802 + 4,050 − 18,624.5
= 18,702 − 18,624.5
= SAB = 77.5
STEP5-2:交互作用の平方和を計算
あとは「会費の精算」のとおり、SABからSAとSBを引くだけです。
SA×B = 77.5 −(12.5 + 4.5)= SA×B = 60.5
交互作用=60.5は、全体85.5の大半を占めます。つまり「温度だけ」「時間だけ」より、「温度と時間の組み合わせ」こそが結果を大きく動かしている、というサインです。

STEP6〜8:誤差・自由度・F値を出す
STEP6:誤差の平方和 Se(引き算でラク)
誤差(Se)は「偶然のばらつき」。全体から、原因が分かっている3つを引けば、残りが誤差です。
Se = ST −(SA+SB+SA×B)= 85.5 −(12.5+4.5+60.5)= Se = 8.0
STEP7:自由度(φ)を出す
自由度(じゆうど、φ)は、ざっくり「自由に動かせる数字の個数」。下の公式に当てはめるだけです(a=Aの水準数2、b=Bの水準数2、r=くり返し2)。
| 要因 | 公式 | 値 |
|---|---|---|
| 因子A | a − 1 | 1 |
| 因子B | b − 1 | 1 |
| 交互作用 | (a−1)(b−1) | 1 |
| 誤差 | ab(r−1) | 4 |
| 総計 | N − 1 | 7 |
確認:1+1+1+4=7。総計とぴったり合えばOKです。
STEP8:分散(V)とF値を出す
分散(V)は「平方和 ÷ 自由度」。F値は「その要因の分散 ÷ 誤差の分散」です。誤差の分散 Ve = 8.0÷4 = 2.0 を使います。
FA =(12.5÷1)÷2.0 = 6.25
FB =(4.5÷1)÷2.0 = 2.25
FA×B =(60.5÷1)÷2.0 = 30.25

分散分析表の完成とF検定の判定
ここまでの数字を1枚の表にまとめます。これが「分散分析表」です。
| 要因 | 平方和S | 自由度φ | 分散V | F値 |
|---|---|---|---|---|
| A(温度) | 12.5 | 1 | 12.5 | 6.25 |
| B(時間) | 4.5 | 1 | 4.5 | 2.25 |
| A×B(交互作用) | 60.5 | 1 | 60.5 | 30.25 |
| 誤差 e | 8.0 | 4 | 2.0 | — |
| 総計 T | 85.5 | 7 | — | — |
最後にF検定です。計算したF値を「F分布表の数字(基準値)」と比べます。今回は自由度(1, 4)、有意水準5%なので、基準値は 7.71 です。F値がこれを超えていれば「効いている(有意)」と判定します。
| 要因 | F値 | 基準7.71と比較 | 判定 |
|---|---|---|---|
| A(温度) | 6.25 | 6.25 < 7.71 | 効いていない |
| B(時間) | 2.25 | 2.25 < 7.71 | 効いていない |
| A×B(交互作用) | 30.25 | 30.25 > 7.71 | 効いている! |
温度だけ・時間だけでは強度は上がりません。効いているのは「組み合わせ」です。だから最適な「組み合わせ」を選ぶ必要があります。4つの平均を比べると——低温×短時間46.0/低温×長時間53.0 ⭐/高温×短時間49.0/高温×長時間45.0。最適条件は「低温×長時間」(平均53.0)です。

よくある質問(FAQ)
まとめ
- 計算の正体は、全体のばらつき(ST)を4つの原因に振り分けること
- 順番は CT → ST → SA → SB → SA×B → Se → 自由度 → 分散 → F値
- 交互作用は SA×B=SAB−SA−SB(会費の精算と同じ「余りの計算」)
- F値を基準値7.71と比べて「効いているか」を判定する
- 交互作用が効いているときは、単独ではなく「組み合わせの平均」で最適条件を選ぶ
最初は記号だらけに見えても、やっているのは「足して・2乗して・引く」のくり返しだけ。一度自分の手で最後まで解ききれば、分散分析表はもう怖くありません。お疲れさまでした。

自動車部品メーカーで電気設計・品質保証に携わってきた経験をもとに執筆しています。むずかしい数式をできるだけ避け、はじめて統計を学ぶ人がつまずかないように、図とたとえで説明することを大切にしています。
📚 次に読むべき記事
どの順で学べば迷わないか、全体像をつかみたい人はここから。
今回の山場「交互作用」を、グラフ(折れ線)でさらに深く理解できます。
因子が3つ以上に増えたら、少ない回数で調べる「直交表」の出番です。