実験計画法

平均平方の期待値E(V)とは?数式の意味を直感的に理解する|一元配置実験⑬

😣 こんな経験はありませんか?
  • 分散分析を勉強していたら、急に「E(V) = σ² + nσ²ₐ」という式が出てきた
  • この「n」はどこから来たの?なぜ掛け算するの?
  • 二元配置になると「br」とか「ar」とか、もう意味不明…
  • 直交表や乱塊法では係数がまた違う。覚えられない!
  • 過去問で「E(Vᵣ)を求めよ」と出てきて、何をすればいいかわからなかった
✅ この記事でわかること
  • E(V)の「本当の意味」を直感的に理解する
  • 係数が「なぜその数字になるか」の統一ルール
  • 一元配置から三元配置まで、すべて同じ考え方で解ける
  • 直交表・乱塊法での係数の決め方
  • E(V)がわかれば「F検定」の意味も完全理解できる

実験計画法やQC検定の勉強をしていると、突然現れる謎の概念「平均平方の期待値 E(V)」

参考書を開けば、当たり前のように「E(Vₐ) = σ² + nσ²ₐ」なんて数式が出てきます。

でも正直、こう思いませんでしたか?

「え、この n ってどこから来たの?」
「なんで掛け算するの?」
「そもそも、これ何のために計算してるの?」

安心してください。ここでつまずくのはあなただけではありません。私もそうでした。

この記事では、数式の丸暗記は一切禁止。「どういう発想で作られているのか」をイメージで理解し、一元配置から乱塊法まで「全部同じルールで解ける」ことを体感してもらいます。

💡 30秒でわかるこの記事の結論
  • E(V)とは、データの「中身(成分)」を分解して見せるレントゲン写真
  • 基本は「ノイズ(誤差σ²)」+「シグナル(効果)× 増幅率」
  • 増幅率(係数)は「その要因の1水準に何個のデータがあるか」で決まる
  • このルールさえ知れば、一元〜三元配置、直交表、乱塊法、すべて同じ考え方で解ける
📘 前提知識

「期待値」という言葉にモヤモヤする方は、先にこちらで頭をほぐしてください:

期待値とは?確率分布の中心を知る →

そもそも「平均平方の期待値 E(V)」とは何か?

まずは「E(V)とは何か」を、数式ではなくイメージで理解しましょう。

教科書的な定義

「もし同じ実験を無限回繰り返して平均をとったとき、その分散(V)が理論的にどんな値に落ち着くか」

…これだけだとイメージしづらいですよね。

もっとざっくり言うと、E(V)は「データの成分表」または「レントゲン写真」だと思ってください。

データは「シグナル」と「ノイズ」の混合物

実験で得られるデータは、常に2つの成分が混ざってできています。

📻 ラジオの電波で例えると

🎵 シグナル(信号):聴きたい音楽や声=「要因の効果」

→ 温度を変えたら強度が変わった、という「意味のある変化」

📡 ノイズ(雑音):ザーザーという雑音=「偶然の誤差」

→ 同じ条件でも毎回少し違う、という「避けられないばらつき」

実験データを分析するとき、私たちは「このシグナルは本物か?それともただのノイズか?」を知りたいのです。

E(V)は、データの中に「シグナル」と「ノイズ」がどれくらいの割合で含まれているかを教えてくれるのです。

E(V)の基本形

E(V) = ノイズ + シグナル × 増幅率
↓ 数式で書くと ↓
E(V) = σ² + (係数) × σ²効果

これがE(V)のすべての基本形です。一元配置でも、三元配置でも、直交表でも、乱塊法でも、この形は変わりません。

変わるのは「係数」の部分だけ。そして、この係数には明確なルールがあるのです。

係数の決め方|たった1つの統一ルール

E(V)で最もつまずきやすいのが「なぜこの係数になるのか」という点です。

でも実は、係数の決め方にはたった1つのルールしかありません。

🎯 係数の統一ルール
係数 = その要因の「1水準」に含まれるデータの個数

言い換えると:「その要因の効果を計算するとき、何個のデータを平均しているか」

このルールさえ覚えれば、一元配置から乱塊法まで、すべてのE(V)を自分で導き出せます。

なぜ「データの個数」を掛けるのか?

これを理解するために、「同じメッセージを繰り返し伝える」という比喩で考えてみましょう。

📢 騒がしい部屋で名前を呼ぶ

あなたは騒がしいパーティー会場で、友人の「田中さん」を呼ぼうとしています。

1回だけ「田中さん!」と叫ぶ場合:
→ 周りの雑音(ノイズ)にかき消されて、聞こえにくい

5回繰り返し「田中さん!田中さん!田中さん!田中さん!田中さん!」と叫ぶ場合:
→ 同じメッセージが5回届くので、雑音の中でも聞き取りやすくなる

→ 繰り返し回数が多いほど、「シグナル」が「ノイズ」に対して強くなる!

実験でも同じことが起きています。

同じ条件(同じ水準)でn回データを取ると、その条件の「効果」がn倍強調されて分散の中に現れるのです。

💡 係数の意味まとめ

係数 = 増幅率 = その効果が何回分重なっているか

データが多いほど、効果(シグナル)はノイズに対して目立ちやすくなる。
その「目立ちやすさの倍率」が係数なのです。

【一元配置実験】E(V)の基本を完全理解

まずは最もシンプルな「一元配置実験」でE(V)の考え方をマスターしましょう。

一元配置実験の設定

📝 例題の設定
  • 因子A:3水準(A₁, A₂, A₃)
  • 繰り返し:各水準で4回ずつ実験
  • 総データ数:3 × 4 = 12個

この実験のデータ構造を表にすると:

1回目 2回目 3回目 4回目 データ数
A₁ x₁₁ x₁₂ x₁₃ x₁₄ 4個
A₂ x₂₁ x₂₂ x₂₃ x₂₄ 4個
A₃ x₃₁ x₃₂ x₃₃ x₃₄ 4個

E(Vₑ):誤差分散の期待値

まず、誤差分散Vₑの期待値から考えます。

📐 誤差分散の期待値
E(Vₑ) = σ²

誤差は純粋な「ノイズ」だけで構成されているので、シグナル成分はゼロ
だから、E(Vₑ)は単純にσ²(誤差の真の分散)になります。

E(Vₐ):因子Aの分散の期待値

次に、因子Aの分散Vₐの期待値を考えます。

ここで「統一ルール」を使います。

質問:因子Aの「1水準」に、何個のデータがあるか?

→ A₁には4個、A₂には4個、A₃には4個のデータがある

答え:4個(= n = 繰り返し回数)

→ 係数は「4」!

📐 因子Aの分散の期待値
E(Vₐ) = σ² + n × σ²ₐ
この例では:E(Vₐ) = σ² + 4 × σ²ₐ

σ²:どのデータにも含まれるノイズ
n × σ²ₐ:因子Aの効果が「n回分」増幅されたシグナル

💡 なぜn倍になるのか?

A₁の平均を計算するとき、4個のデータを使います。
この4個のデータには、すべて「A₁の効果」が含まれています。
だから、A₁の効果は「4回分」積み重なって、分散の中で4倍に増幅されるのです。

【二元配置実験】「自分以外を全部掛ける」ルール

要因が2つになる「二元配置実験」でも、基本は同じです。ただし、係数の計算が少し複雑になります。

ここで覚えてほしいのが「自分以外を全部掛ける」というルールです。

二元配置実験の設定

📝 例題の設定
  • 因子A:a = 2水準(A₁, A₂)
  • 因子B:b = 3水準(B₁, B₂, B₃)
  • 繰り返し:r = 2回
  • 総データ数:2 × 3 × 2 = 12個

データ構造を表にすると:

B₁ B₂ B₃ Aの1水準の
データ数
A₁ x x x x x x 6個
(= b × r)
A₂ x x x x x x 6個
(= b × r)
Bの1水準の
データ数
4個
(= a × r)
4個
(= a × r)
4個
(= a × r)

「自分以外を全部掛ける」ルールの適用

各E(V)の係数を、統一ルールで求めてみましょう。

E(Vₐ):因子Aの期待値

質問:Aの「1水準」に何個のデータがあるか?

A₁には:B₁で2個 + B₂で2個 + B₃で2個 = 6個

これは b × r = 3 × 2 = 6 と計算できる

→ 係数は「b × r」!

E(Vₐ) = σ² + br × σ²ₐ = σ² + 6σ²ₐ

E(V_B):因子Bの期待値

質問:Bの「1水準」に何個のデータがあるか?

B₁には:A₁で2個 + A₂で2個 = 4個

これは a × r = 2 × 2 = 4 と計算できる

→ 係数は「a × r」!

E(V_B) = σ² + ar × σ²_b = σ² + 4σ²_b

E(V_AB):交互作用の期待値

質問:交互作用A×Bの「1組み合わせ」に何個のデータがあるか?

A₁B₁の組み合わせには:繰り返し2回分 = 2個

これは r = 2 と計算できる

→ 係数は「r」!

E(V_AB) = σ² + r × σ²_ab = σ² + 2σ²_ab
💡 「自分以外を全部掛ける」の意味

よく見ると、係数は「自分以外の添字の積」になっています:

  • E(Vₐ)の係数 → Aじゃない添字(bとr)の積 = b × r
  • E(V_B)の係数 → Bじゃない添字(aとr)の積 = a × r
  • E(V_AB)の係数 → AでもBでもない添字(r)だけ = r

二元配置実験のE(V)一覧表

二元配置実験(繰り返しあり)のE(V)をまとめると:

要因 E(V)の式 係数の意味 この例での値
A σ² + br × σ²ₐ Aの1水準のデータ数 3×2 = 6
B σ² + ar × σ²_b Bの1水準のデータ数 2×2 = 4
A×B σ² + r × σ²_ab A×Bの1組み合わせのデータ数 2
E(誤差) σ² (係数なし)

繰り返しなしの二元配置は?

繰り返しがない(r = 1)の場合、交互作用と誤差が分離できないため、E(V)の形が少し変わります。

要因 E(V)の式(繰り返しなし) 備考
A σ² + b × σ²ₐ r=1なのでbだけ
B σ² + a × σ²_b r=1なのでaだけ
E(誤差) σ² + σ²_ab 交互作用が誤差に混入!
⚠️ 繰り返しなしの注意点

繰り返しがないと、誤差のE(V)に交互作用σ²_abが混入します。これは「交互作用がないと仮定」しないとF検定ができないことを意味します。

【三元配置実験】同じルールで拡張できる

因子が3つになる「三元配置実験」でも、全く同じルールが適用できます。

三元配置実験の設定

📝 例題の設定
  • 因子A:a = 2水準
  • 因子B:b = 3水準
  • 因子C:c = 2水準
  • 繰り返し:r = 2回
  • 総データ数:2 × 3 × 2 × 2 = 24個

三元配置のE(V)一覧

要因 E(V)の式 係数の計算 この例での値
A σ² + bcr × σ²ₐ Aの1水準のデータ数 3×2×2 = 12
B σ² + acr × σ²_b Bの1水準のデータ数 2×2×2 = 8
C σ² + abr × σ²_c Cの1水準のデータ数 2×3×2 = 12
A×B σ² + cr × σ²_ab A×Bの1組み合わせのデータ数 2×2 = 4
A×C σ² + br × σ²_ac A×Cの1組み合わせのデータ数 3×2 = 6
B×C σ² + ar × σ²_bc B×Cの1組み合わせのデータ数 2×2 = 4
A×B×C σ² + r × σ²_abc A×B×Cの1組み合わせのデータ数 2
E(誤差) σ²
💡 パターンが見えましたか?

どの要因でも、係数は「自分以外の添字を全部掛け合わせたもの」になっています。

  • Aの係数 → Aを除くb, c, rの積 = bcr
  • A×Bの係数 → AとBを除くc, rの積 = cr
  • A×B×Cの係数 → A, B, Cを除くrだけ = r

【直交表】実験回数が減っても同じ考え方

直交表を使った実験でも、E(V)の基本的な考え方は同じです。ただし、「全部の組み合わせを実験していない」点に注意が必要です。

L8直交表の例

📝 例題の設定
  • 因子A, B, C, D:各2水準
  • 実験回数:N = 8回(L8直交表使用)
  • 繰り返し:なし(各条件1回ずつ)

L8直交表では、8回の実験で4因子を調べます。各因子には2水準あるので:

因子Aの1水準(A₁)に何個のデータがあるか?

→ 8回の実験のうち、A₁が使われるのは4回

→ これは N / a = 8 / 2 = 4 と計算できる

→ 係数は「N / a」!

直交表のE(V)公式

📐 直交表での期待値
E(Vₐ) = σ² + (N / a) × σ²ₐ

N:総実験回数
a:因子Aの水準数
N / a:Aの1水準に含まれるデータ数

L8直交表で因子A〜Dがすべて2水準の場合:

要因 E(V)の式 係数
A σ² + 4σ²ₐ 8/2 = 4
B σ² + 4σ²_b 8/2 = 4
C σ² + 4σ²_c 8/2 = 4
D σ² + 4σ²_d 8/2 = 4
E(誤差) σ²
💡 直交表の特徴

直交表では、すべての因子が「バランスよく」配置されています。
だから、各因子のE(V)は同じ形になり、係数もすべて N/水準数 になります。

【乱塊法】ブロック因子のE(V)はここが違う

乱塊法では、ブロック因子RのE(V)が試験で頻出します。ここでも統一ルールが使えます。

乱塊法の設定

📝 例題の設定
  • 因子A:a = 2水準
  • 因子B:b = 3水準
  • ブロック因子R:r = 2水準(2日間)
  • 総データ数:2 × 3 × 2 = 12個
  • 繰り返し:なし(各ブロックで各組み合わせ1回)

乱塊法の特徴は、各ブロック(各日)にすべてのA×Bの組み合わせが含まれることです。

A₁B₁ A₁B₂ A₁B₃ A₂B₁ A₂B₂ A₂B₃ データ数
R₁(1日目) x x x x x x 6個
(= a × b)
R₂(2日目) x x x x x x 6個
(= a × b)

ブロック因子RのE(V)

質問:ブロック因子Rの「1水準」に何個のデータがあるか?

→ R₁(1日目)には、A×Bのすべての組み合わせ = 6個

→ これは a × b = 2 × 3 = 6 と計算できる

→ 係数は「a × b」!

📐 ブロック因子Rの期待値(超重要!)
E(Vᵣ) = σ² + (a × b) × σ²ᵣ

この例では:E(Vᵣ) = σ² + 6σ²ᵣ

乱塊法のE(V)一覧

要因 E(V)の式 係数の意味
R(ブロック) σ² + ab × σ²ᵣ Rの1水準のデータ数 = a × b
A σ² + br × σ²ₐ Aの1水準のデータ数 = b × r
B σ² + ar × σ²_b Bの1水準のデータ数 = a × r
A×B σ² + r × σ²_ab A×Bの1組み合わせのデータ数 = r
E(誤差) σ²
💡 乱塊法でのポイント

ブロック因子Rの係数が「a × b」になるのは、各ブロック(各日)にa×b個のデータが含まれるからです。1日目と2日目の「差」を見るとき、この6個分のデータが比較されるので、Rの効果は6倍に増幅されて現れます。

E(V)からブロック分散σ²ᵣを推定する

乱塊法の問題で頻出なのが、「ブロック因子の母分散σ²ᵣを推定せよ」という問題です。

E(V)の式を理解していれば、この問題は簡単に解けます。

σ²ᵣの推定公式の導出

E(Vᵣ)の式から、σ²ᵣを逆算します。

Step 1:E(Vᵣ)の式を書く

E(Vᵣ) = σ² + (a × b) × σ²ᵣ

Step 2:σ²ᵣについて解く

(a × b) × σ²ᵣ = E(Vᵣ) − σ²

σ²ᵣ = {E(Vᵣ) − σ²} / (a × b)

Step 3:期待値を実測値に置き換える

E(Vᵣ) → Vᵣ(分散分析表の値)
σ² → Vₑ(誤差分散)

📐 ブロック分散の推定公式
σ̂²ᵣ =
Vᵣ − Vₑ
a × b

計算例

📝 与えられた情報
  • Vᵣ = 48.0(分散分析表から)
  • Vₑ = 2.0(分散分析表から)
  • 因子Aの水準数 a = 2
  • 因子Bの水準数 b = 3

σ̂²ᵣ = (Vᵣ − Vₑ) / (a × b)
  = (48.0 − 2.0) / (2 × 3)
  = 46.0 / 6
  = 7.67

✅ 結果の解釈

日間変動(ブロック因子R)の母分散は約7.67と推定されます。
これは「日によって、標準偏差で約±2.8(= √7.67)程度のばらつきがある」ことを意味します。

E(V)がわかれば「F検定」の意味がわかる

最後に、E(V)を学ぶことで「なぜF検定をするのか」が理解できることを確認しましょう。

F値の計算を「中身」で見る

分散分析でF値を計算するとき、私たちは「Vₐ ÷ Vₑ」という割り算をしています。

この割り算の「中身」をE(V)で見てみましょう。

Vₐの中身
σ² + n × σ²ₐ
(ノイズ + シグナル)
÷
Vₑの中身
σ²
(ノイズのみ)

ケース1:因子Aに効果がない場合(σ²ₐ = 0)

F = (σ² + 0) / σ² = σ² / σ² ≈ 1

→ F値は1に近くなる(分子と分母がほぼ同じ)

ケース2:因子Aに効果がある場合(σ²ₐ > 0)

F = (σ² + n × σ²ₐ) / σ² = 1 + n × (σ²ₐ / σ²) > 1

→ F値は1より大きくなる(分子が分母より大きい)

💡 F検定の本質

F検定とは、「分子のシグナル成分がゼロかどうか」を確かめる検定です。

  • F ≈ 1 → シグナルがない(効果なし)
  • F >> 1 → シグナルがある(効果あり)

E(V)の式を知っていることは、「何を何で割れば正しい検定ができるか」を知っていることと同じなのです。

【保存版】E(V)の公式一覧表

この記事で解説したE(V)の公式を、一覧表にまとめます。試験直前の確認用にご活用ください。

統一ルール(これだけ覚えれば全部導ける)

E(V要因) = σ² + (その要因の1水準に含まれるデータ数) × σ²要因

実験タイプ別一覧

一元配置実験(因子A:a水準、繰り返しn回)

E(Vₐ) σ² + n × σ²ₐ
E(Vₑ) σ²

二元配置実験(繰り返しあり:因子A a水準、因子B b水準、繰り返しr回)

E(Vₐ) σ² + br × σ²ₐ
E(V_B) σ² + ar × σ²_b
E(V_AB) σ² + r × σ²_ab
E(Vₑ) σ²

直交表(総実験回数N、各因子k水準)

E(V因子) σ² + (N/k) × σ²因子
E(Vₑ) σ²

乱塊法(因子A a水準、因子B b水準、ブロックR r水準)

E(Vᵣ) σ² + ab × σ²ᵣ ← 頻出!
E(Vₐ) σ² + br × σ²ₐ
E(V_B) σ² + ar × σ²_b
E(V_AB) σ² + r × σ²_ab
E(Vₑ) σ²

分散推定の逆算公式

一般形 σ̂²要因 = (V要因 − Vₑ) / 係数
乱塊法のσ̂²ᵣ σ̂²ᵣ = (Vᵣ − Vₑ) / (a × b)

タグ

-実験計画法
-