分散分析とは？「平均の差」を"分散"で判定する理由を初心者向けに完全図解

😣 こんなことで困っていませんか？

「分散分析」と聞くと拒否反応が出る。教科書を開くと数式だらけで何の話かわからない
"平均の差"を調べたいのに、なぜ"分散"を計算するのか意味がわからない
「一元配置」「平方和」「自由度」「F検定」と用語が次々出てきて、つながりが見えない
QC検定の勉強で分散分析が出てきたが、いきなり計算問題から入って挫折した

✅ この記事でわかること

分散分析が「3つ以上の平均を比較する道具」だと一発で理解できる
なぜ"分散"を使うのか、その直感が身近な例で腑に落ちる
これから自分が何の計算をするのか、計算全体の地図が頭に入る
「なぜF検定で判定していいのか」という理論的な裏付けまでスッキリわかる

🎯 結論（答えファースト）

分散分析（ANOVA）とは、3つ以上のグループの「平均に差があるか」を、データの"バラつき（分散）"を使って判定する統計手法です。
なぜ平均を比べるのに分散を見るのか？
答えは「グループ間のバラつき」が「グループ内のバラつき」より明らかに大きければ、それは偶然ではなく"本当に平均が違う証拠"だと言えるからです。
この「バラつき同士の比較」を数値化するのが F値であり、その比較が成立する理由が 平均平方の期待値 E(V) という考え方です。

そもそも、なぜ"分散分析"が必要なのか？
- シチュエーション：3つのカレー、どれが一番おいしい？
- 「t検定を3回やればいい」が間違いである理由
分散分析とは何か｜"平均の差"を"分散"で見る不思議
一元配置実験とは｜1つの因子で白黒つける
計算の全体像｜これから何をするのか俯瞰する
なぜF検定で判定できるのか｜E(V)が語る理論的な裏付け
初心者が陥りやすい3つの落とし穴
よくある質問（FAQ）
まとめ｜分散分析を一言で言えるようになろう
- 📚 次に読むべき記事

そもそも、なぜ"分散分析"が必要なのか？

まず、分散分析が「何のために生まれた道具なのか」から押さえましょう。ここを飛ばすと、後の計算が全部「呪文」になります。

シチュエーション：3つのカレー、どれが一番おいしい？

あなたが食品メーカーの開発担当者だとします。3種類のスパイス配合（A, B, C）でカレーを試作し、それぞれ5人に試食してもらって10点満点で点数をつけてもらいました。

配合A	配合B	配合C
6, 7, 5, 6, 6	8, 7, 9, 8, 8	7, 6, 8, 7, 7
平均 6.0	平均 8.0	平均 7.0

さて、ここで知りたいのは「この3つの配合は、本当に味（評価）に差があるのか？」です。
パッと見るとBが一番高そうですが、5人しか試していません。「たまたまB好きの人が集まっただけ」かもしれないのです。

「t検定を3回やればいい」が間違いである理由

2つのグループの平均を比べるならt検定を使います。だったら「A対B」「B対C」「A対C」と3回やればよさそうに思えますよね。
しかし、これは絶対にやってはいけません。

⚠️ なぜ繰り返してはダメなのか
検定を1回やるごとに「本当は差がないのに、差があると間違える確率（第1種の過誤）」が5%発生します。
これを3回繰り返すと、間違える確率は約14%まで膨れ上がるのです（1 − 0.95³ ≒ 0.143）。
つまり「本当は差がないのに、差があると勘違いする」リスクが約3倍。これでは検定の意味がありません。

💡 ここで登場するのが「分散分析」
3つ以上の平均を、たった1回の検定で「どこかに差があるかどうか」を判定できる魔法の道具。それが分散分析（ANOVA：Analysis of Variance）です。

分散分析とは何か｜"平均の差"を"分散"で見る不思議

ここが分散分析を学ぶ上で最大の山場です。多くの初心者がここでつまずきます。
「平均を比べたいのに、なぜ"分散"を計算するの？」という素朴な疑問。これを身近な例で完全に解消します。

キーワードは「2種類のバラつき」

データには、必ず2種類のバラつきが存在します。これを区別できるようになれば、分散分析の8割は理解できたも同然です。

📊

①グループ間のバラつき

配合Aの平均6点・Bの平均8点・Cの平均7点。
この「グループの平均同士のズレ」がグループ間のバラつき。
→ 因子（配合の違い）の効果

📈

②グループ内のバラつき

配合Aだけ見ても、5人の点数は6, 7, 5, 6, 6とバラついている。
同じ配合なのにズレるのは、個人の好み・気分など。
→ 偶然の誤差

分散分析の超シンプルなロジック

もし「グループ間のバラつき」が「グループ内のバラつき」より明らかに大きいなら
→「配合の違いが、個人差では説明できないほど効いている」
→ 平均に差がある！と判定できる。

逆に、グループ間のズレが、グループ内の個人差と同じ程度しかなければ、「たまたまの誤差の範囲内」と判定します。
この「2つのバラつきの大きさを比べる」のが、分散分析の核心です。

「バラつき」を数値化したのが「分散」

バラつきを「目で見て大きい/小さい」と判断するのではなく、数値で客観的に比較するために使うのが分散です。
分散とは、平たく言えば「平均からのズレを2乗して平均したもの」。バラつきが大きいほど大きな値になります。

🔑 だから「分散」分析と呼ぶ
分散分析という名前は「分散を使って分析する」という意味です。
「平均の差を検定したいのに分散を見る」のではなく、「2種類のバラつきの比較によって、平均の差を判定する」のが本質。
名前で混乱しないでください。「分散を分析する」のではなく「分散で（平均の差を）分析する」のです。

📘 関連記事
分散と標準偏差｜「バラつき」を数値化する魔法の公式 →

ゼロからわかる! QC検定 2級テキスト & 問題集新装版 [品質管理検定(QC検定)2級最新レベル表対応](TAC出版)

¥1,980 （2026/05/10 14:50時点 | Amazon調べ）

Amazon

楽天市場

メルカリ

ポチップ

一元配置実験とは｜1つの因子で白黒つける

分散分析にはいくつかの「型」があります。その中でも一番シンプルで、最初に学ぶべきなのが一元配置（いちげんはいち）実験です。

「一元配置」の意味を分解する

「一元」 ＝ 1つの因子だけを変化させる
「配置」 ＝その因子の水準（値）を配置して実験する

つまり一元配置実験とは、「結果に影響しそうな要因（因子）を1つだけ取り上げて、その水準を変えながら実験する」方法です。

「因子」と「水準」を3秒で覚える

用語	意味	カレーの例
因子	結果に影響を与える要因	スパイス配合
水準	因子の具体的な値・種類	A・B・C（3水準）
特性値	測定する結果	試食評価点

実験計画のイメージ図

因子：スパイス配合（3水準）　×　各水準5回の繰り返し

A:6点

A:7点

A:5点

A:6点

B:8点

B:7点

B:9点

B:8点

C:7点

C:6点

C:8点

C:7点

一元配置実験を使う場面の見極め方

💡 一元配置を選ぶ判断基準
結果に影響する要因を考えたとき、「明らかにこれだろう」という主犯格が1つに絞れる場合は一元配置でOK。
「温度と時間、両方が効きそう」など、影響しそうな因子が2つ以上ある場合は、一元配置では不十分。二元配置や直交表を使います。

⚠️ よくある誤解
「水準が3つだから一元配置」ではありません。
因子（要因の種類）が1つなら、水準がいくつあっても一元配置です。配合A・B・Cの3種類でも、A〜Eの5種類でも、因子が「配合」1つなら一元配置です。

計算の全体像｜これから何をするのか俯瞰する

分散分析でつまずく最大の理由は、「今、何のために何を計算しているのか分からなくなる」こと。
ここで全体の地図を頭に入れておきましょう。この地図さえあれば、もう迷子になりません。

ゴールは「分散分析表」を完成させること

分散分析の計算は、最終的に下のような分散分析表（ANOVA表）を完成させることがゴールです。

要因	平方和 S	自由度 φ	分散 V	F値
群間（A）	S_A	φ_A	V_A	F₀
群内（誤差e）	S_e	φ_e	V_e	—
全体（T）	S_T	φ_T	—	—

「うわっ、記号だらけ……」と思いましたよね。でも安心してください。やることは「左から右へ、順番に計算していくだけ」。1つずつ見ていきます。

計算の5ステップ｜これだけ覚えればOK

STEP 1

平方和（S）を計算する
「バラつきの合計」を数値化します。全体（S_T）、群間（S_A）、群内（S_e）の3種類。
→ 「平均からのズレを2乗して合計」しただけ。

STEP 2

自由度（φ）を計算する
平方和を「平均」するために必要な"割る数"。データ数や水準数からシンプルな引き算で出ます。

STEP 3

分散（V）を計算する
V = S ÷ φ。平方和を自由度で割るだけ。これが「ならした1個あたりのバラつき」になります。

STEP 4

F値を計算する
F₀ = V_A ÷ V_e。「群間のバラつき」÷「群内のバラつき」。
これが大きければ「平均に差がある」候補です。

STEP 5

F表と比較して判定する
F₀ が F表（巻末付録）の境界値より大きければ「有意差あり」と判定します。

分散分析の核心｜「バラつきの分解」

実は、ここまでの計算には1つの美しい考え方が隠れています。
それが「全体のバラつき＝群間のバラつき＋群内のバラつき」という分解です。

📐 公式（平方和の分解）
S_T ＝ S_A ＋ S_e
（全体のバラつき = 群間のバラつき + 群内のバラつき）

全体のバラつきを「因子による効果」と「偶然の誤差」の2つに切り分ける。これが分散分析の核心です。
そしてF値は「効果のバラつき／誤差のバラつき」。つまり「信号の大きさ／ノイズの大きさ」のS/N比のような指標なのです。

🗺️ 全体像のまとめ

分散分析は、「バラつきを2つに分解 → それぞれの分散を計算 → 比をとる（F値）→ F表と比べる」という一連の流れ。
どの計算もこの地図のどこかに必ず位置しています。迷ったらここに戻ってきてください。

なぜF検定で判定できるのか｜E(V)が語る理論的な裏付け

最後に、QC検定1級受験者向けに少しだけ理論的な話をします。難しそうに聞こえますが、ここを理解すると「なぜF値を計算すれば平均の差がわかるのか」がスッキリ腑に落ちます。
キーワードは「平均平方の期待値 E(V)」です。

期待値 E( ) とは何か

E( ) は 期待値（Expectation） の略。
「もし同じ実験を何度も何度も繰り返したら、平均してどんな値になるか」を表します。
今回の1回限りのデータではなく、"理論的に何度もやったらこうなる"という長期的な平均のことです。

E(V_A) と E(V_e) の式が、すべてを語る

一元配置実験では、群間分散 V_A と群内分散 V_e の期待値が、それぞれ次のような形になることが理論的に証明されています。

📐 平均平方の期待値

E(V_e) ＝ σ²　（誤差分散の真の値）

E(V_A) ＝ σ² ＋ n × σ_A²　（誤差分散＋因子の効果）

記号が多くて怖く見えますが、言っていることは1つだけです。順に読み解きましょう。

この式が意味すること（超重要）

🤝

もし差がないなら（σ_A² = 0）

E(V_A) = σ²
E(V_e) = σ²

→ V_A と V_e は同じくらいの値になる
→ F = V_A/V_e ≒ 1

💥

もし差があるなら（σ_A² > 0）

E(V_A) = σ² + n × σ_A²
E(V_e) = σ²

→ V_A の方が大きくなる
→ F = V_A/V_e > 1

🎯 つまり、これがF検定の正体

F値（V_A ÷ V_e）は、
・差がないなら 1に近い値
・差があるなら 1より大きい値
になる。だから「F値が十分に大きいか」を見れば、平均に差があるかどうかを判定できる──これが分散分析の理論的な裏付けです。

なぜ「分散の比」が役に立つのか

もう1つ重要なポイントがあります。
V_e（誤差分散）は、差がある場合もない場合も σ² のまま変わらないことに注目してください。
つまり V_e は「ものさし」として常に一定。そこに V_A が「ものさし何個分か」を比べているわけです。

💡 ものさし比較のイメージ
身長の差を測るとき、「メートル」という共通のものさしがあるから比較できますよね。
分散分析では V_e（誤差分散）が"統計のものさし"になり、V_A がそのものさし何個分なのかを見て差を判定しているのです。

F検定の判定ルール

F値の大きさ	解釈	判定
F₀ ≒ 1	群間も群内も同じくらいバラついている	差なし
F₀ > F表の値	群間のバラつきが偶然では説明できないほど大きい	有意差あり

わかりやすい品質管理(第5版)

¥2,803 （2026/05/10 14:53時点 | Amazon調べ）

Amazon

楽天市場

メルカリ

ポチップ

初心者が陥りやすい3つの落とし穴

分散分析を学ぶときに、多くの人がつまずくポイントを3つだけ先に潰しておきます。

落とし穴①｜「分散を分析する」と勘違いする

❌ Before
「分散分析だから、分散の大きさ自体を調べる手法だ」

✅ After
「分散を"道具に使って"、平均の差を判定する手法」が正解。バラつきを分解して比較するのが目的。

落とし穴②｜「F値が大きい＝確実に差がある」と思い込む

❌ Before
「F値が3.0出た！絶対に差があるはずだ！」

✅ After
F値そのものではなく、F表の境界値（自由度で決まる）と比較する。同じF=3.0でも、自由度によって「有意」にも「有意でない」にもなる。

落とし穴③｜「どの水準が他と違うのか」までわかると思う

❌ Before
「分散分析で有意差が出たから、配合Bが一番良い！」

✅ After
分散分析でわかるのは「どこかに差があるか」だけ。「A対B」「B対C」など、どの組み合わせに差があるかは、多重比較法（テューキー法など）という別の手順で調べる。

よくある質問（FAQ）

Q1. 分散分析とt検定はどう違うのですか？

t検定は2つのグループの平均を比較する手法、分散分析は3つ以上のグループの平均を比較する手法です。2グループだけなら分散分析でもt検定でも結果は一致しますが、3グループ以上ではt検定の繰り返しはNG（誤判定率が膨らむ）なので、分散分析を使います。

Q2. ANOVAって何の略ですか？

Analysis of Variance（分散の分析）の頭文字を取ったものです。読み方は「アノーヴァ」または「アノバ」。分散分析の英語表記なので、海外の論文や統計ソフトでは ANOVA と表記されます。

Q3. 一元配置と二元配置の違いは何ですか？

扱う因子の数が違います。一元配置は因子が1つ（例：配合のみ）、二元配置は因子が2つ（例：配合×加熱温度）。実務では「複数の要因が絡む」ことが多いので二元配置以上がよく使われますが、まずは一元配置で土台を作るのが最短ルートです。

Q4. F値が1より小さくなったら何かおかしいですか？

おかしくありません。F値が1未満ということは「群間のバラつきが、群内のバラつきよりも小さい」状態。これは 因子の効果がほぼゼロであることを示し、もちろん「有意差なし」と判定されます。実験データでは普通に起こり得ます。

Q5. QC検定では何級から分散分析が出ますか？

QC検定2級から、一元配置・二元配置の分散分析が本格的に出題されます。3級では「分散分析の概念」を問われる程度。1級では繰返しのある二元配置や直交表の解析まで必須です。本記事の内容は2級対策の土台として最低限押さえておきたいレベルです。

〈図解〉基本からよくわかる品質管理と品質改善のしくみ

¥1,760 （2026/05/10 14:52時点 | Amazon調べ）

Amazon

楽天市場

メルカリ

ポチップ

まとめ｜分散分析を一言で言えるようになろう

📝 この記事の要点

分散分析は 3つ以上の平均を1回の検定で比較するための手法
"分散"を見るのは 「グループ間バラつき vs グループ内バラつき」を比較するため
一元配置実験は 1つの因子だけを変える、最もシンプルな実験設計
計算の地図：平方和 S → 自由度 φ → 分散 V → F値 → F表で判定
F検定の理論的根拠は E(V_A) = σ² + nσ_A²、E(V_e) = σ²。差があれば V_A だけが大きくなる
F値が大きい＝信号（効果）がノイズ（誤差）より大きい、ということ

🎯 一言で言えるか？

「分散分析って何？」と聞かれたら、こう答えられればOK。
「3つ以上のグループの平均に差があるかを、"グループ間のバラつき"と"グループ内のバラつき"を比べることで判定する手法です」

ここまでで「分散分析の概念」は完全に理解できました。
次は 「実際に手を動かして計算してみる」 ステップに進みましょう。具体的な数値で平方和や自由度を計算すれば、もっと深く理解できます。

📚 次に読むべき記事

📘 実験計画法の学習マップ｜基礎から直交表・応用までを体系的に学ぶ →

実験計画法全体のロードマップ。今あなたが分散分析のどの位置にいるかを俯瞰できる体系図です。

📘 一元配置実験の計算を完全図解｜分散分析表を1から作る全手順 →

概念を理解したら、次は実際に分散分析表を作る計算実践編。途中式を一切省かず、手を動かして覚えられます。

📘 二元配置実験とは？2つの要因を同時に調べる実験方法をわかりやすく解説 →

一元配置の次のステップ。「2つの因子が結果にどう影響するか」を同時に調べる方法。実務で最も使える分散分析です。

分散分析とは？「平均の差」を"分散"で判定する理由を初心者向けに完全図解

そもそも、なぜ"分散分析"が必要なのか？

シチュエーション：3つのカレー、どれが一番おいしい？

「t検定を3回やればいい」が間違いである理由

分散分析とは何か｜"平均の差"を"分散"で見る不思議

キーワードは「2種類のバラつき」

①グループ間のバラつき

②グループ内のバラつき

分散分析の超シンプルなロジック

「バラつき」を数値化したのが「分散」

一元配置実験とは｜1つの因子で白黒つける

「一元配置」の意味を分解する

「因子」と「水準」を3秒で覚える

実験計画のイメージ図

一元配置実験を使う場面の見極め方

計算の全体像｜これから何をするのか俯瞰する

ゴールは「分散分析表」を完成させること

計算の5ステップ｜これだけ覚えればOK

分散分析の核心｜「バラつきの分解」

なぜF検定で判定できるのか｜E(V)が語る理論的な裏付け

期待値 E( ) とは何か

E(VA) と E(Ve) の式が、すべてを語る

この式が意味すること（超重要）

もし差がないなら（σA² = 0）

もし差があるなら（σA² > 0）

なぜ「分散の比」が役に立つのか

F検定の判定ルール

初心者が陥りやすい3つの落とし穴

落とし穴①｜「分散を分析する」と勘違いする

落とし穴②｜「F値が大きい＝確実に差がある」と思い込む

落とし穴③｜「どの水準が他と違うのか」までわかると思う

よくある質問（FAQ）

Q1. 分散分析とt検定はどう違うのですか？

Q2. ANOVAって何の略ですか？

Q3. 一元配置と二元配置の違いは何ですか？

Q4. F値が1より小さくなったら何かおかしいですか？

Q5. QC検定では何級から分散分析が出ますか？

まとめ｜分散分析を一言で言えるようになろう

📚 次に読むべき記事

E(V_A) と E(V_e) の式が、すべてを語る

もし差がないなら（σ_A² = 0）

もし差があるなら（σ_A² > 0）