実験計画法の勉強していると平均平方の期待値という概念が突然出てくる。QC検定の参考書では割と当たり前かのように出てくるが初見だとこれがそもそも何なのか、どういう計算で出してるのかが分からないと思います。
簡単に言うと、平均平方の期待値E(V)は、
「もし同じ実験を何百回もやって平均を取ったら、各平均平方 が理論的にどのくらいの値になるか」
を数式で表したものです。・・・よく分からないですね。
ここでは
-
① 1元配置(要因Aが 水準、各水準に 回観測)
-
② 繰り返しあり2元配置(要因Aが 水準、要因Bが 水準、各セルに 回観測)
の順で、
「どういう発想で 平均平方の期待値を作るのか」→「実際の式に何が足し算・掛け算で入るのか」を
初心者向けに段階を追って説明します。
1 そもそも“平均平方の期待値”とは何をしているのか
-
実験モデルを立てる
ここで は偶然誤差(平均0、分散 )です。
-
このモデルのまま まったく同じ手順を無限回くり返す と仮定する。
-
その無限回分の平均を取る操作が「期待値 」。
平均平方の期待値 は「平方和 → 平均平方 → 期待値」の順に操作するだけですが、
途中で 重複して数えた誤差の分 と 要因そのものの分 に自然と分かれます。
2 1元配置で EMS を作る手順
2.1 モデルと記号
-
観測 (i = 1,…,g, j = 1,…,n)
-
真の効果
-
誤差分散
2.2 平均平方の式
平方和 と誤差平方和 を
と割れば平均平方です。
2.3 期待値を取るとどうなるか
-
誤差項
分子も分母も誤差だけで出来ているのでで終わります。
-
要因項
分子には-
誤差に由来するばらつき →
-
要因効果 のばらつき → その分散を と書く
が両方入ります。
誤差は各水準で n 個まとめて平均を取った値 が入るため、誤差分散は のまま。
反対に要因効果は n 回分そろって現れるので n 倍に増幅され、
となります。
ここで n が大きいほど 要因効果の存在を検出しやすい係数 になっています。 -
3 繰り返しあり2元配置で EMS が長くなる理由
3.1 モデル
(i = 1,…,l j = 1,…,m k = 1,…,r)
3.2 どの項が誰とペアになるか
平均平方 | 誤差部分 | 効果部分 | 効果部分の倍率 |
---|---|---|---|
なし | – |
倍率に r(繰り返し数) と “もう一方の水準数” が掛かるのは、
そのぶんだけ同じ効果がデータの中に重複出現するからです。
3.3 式で書くと
4 初心者向けの“分けて足す”イメージ
-
誤差のばらつき … 実験を何回やっても付いて回る基礎ノイズ。
-
要因(主効果・交互作用)のばらつき … 本当に効いているなら平均平方が“上乗せ”される。
-
倍率 … 同じ効果がデータ中に何回顔を出すか。
回数が多ければその効果は統計的に太い線で見つけやすい。
EMS は「1+2×倍率」という足し算なので、
-
要因効果がゼロなら 2 が消え、どの平均平方も 1(=)だけ。
-
効果があれば 2×倍率 がプラスされ、対応する平均平方だけ大きくなる。
これを 大きさ比 (F 値) で検定するのが分散分析の仕組みです。
5 まとめ
-
誤差成分は に落ち着き、要因成分は“繰り返し”と“他要素数”で増幅。
-
1元配置では「2元配置では「
-
F 検定は「要因効果がゼロなら平均平方の期待値が等しい」性質を利用した比べっこ。
これがわかれば、どんな分散分析でも「どの効果をどれで割ればいいか」を迷わず組み立てられるようになります。