プーリングとは？誤差を併合する意味と手順｜実験計画法の基礎概念⑬

🎯 この記事でわかること

✅ 「分散をプールする」の直感的なイメージ（お風呂のお湯で理解！）

✅ なぜプーリングすると「お得」なのか？（自由度のパワー）

✅ t検定と実験計画法での使われ方の違い

✅ 「混ぜてはいけない」危険なパターンの見分け方

はじめに｜「プールする」って、泳ぐプールじゃないの？
結論｜「情報を合体させて信頼度を上げる」テクニック
たとえ話①｜お風呂のお湯で理解する「プーリング」
- 🛁 シチュエーション：2つの浴槽の温度を知りたい
- 💡 答え：2つの浴槽のお湯を「混ぜて」測定する
たとえ話②｜2人の職人の「腕前」を比べる
なぜプーリングすると「お得」なのか？
- 🔍 自由度は「レンズの解像度」
実験計画法（DOE）でのプーリング
- 🏭 たとえ話：工場の「犯人探し」
⚠️ ただし「混ぜるな危険」のルールがある
- 🛁 お風呂のたとえで考える「混ぜるな危険」
- ✅ 「混ぜていいか」を判断するルール
まとめ｜「混ぜる」は「騙す」ではなく「賢く使う」

はじめに｜「プールする」って、泳ぐプールじゃないの？

統計学を勉強していると、「プールする（Pooling）」という言葉によく出会います。

t検定では「プールした分散（Pooled Variance）」、実験計画法では「誤差項へのプーリング」…

「プール」と聞くと、どうしても水泳のプールを思い浮かべてしまいますよね。

でも、統計学での「プール」は「溜める・合算する・混ぜ合わせる」という意味です。英語の「pool」には「資源を共有する・一緒にする」という意味があるんですね。

💡 この記事のゴール

「分散をプールする」という操作が、なぜ必要で、何をしているのかを、数式なしでイメージできるようになること。これがわかると、t検定も実験計画法も「そういうことか！」と腑に落ちます。

結論｜「情報を合体させて信頼度を上げる」テクニック

まず結論から言います。

📊 プーリング（Pooling）とは？

複数のグループの「バラつき（分散）」が「同じくらいだ」とみなせるとき、それらのデータをひとまとめ（プール）にして、より精度の高い「共通の分散」を計算すること。

メリットは？

データ数（自由度）が増えるため、検定の「パワー（検出力）」が上がります。つまり、微妙な差でも「有意」と判定できるようになるのです。

これだけだと抽象的なので、「お風呂のお湯」のたとえで説明しますね。

たとえ話①｜お風呂のお湯で理解する「プーリング」

想像してください。あなたの家には2つの浴槽があります。

🛁 シチュエーション：2つの浴槽の温度を知りたい

浴槽A：手を入れてみた → 「だいたい40℃くらいかな？」
浴槽B：手を入れてみた → 「こっちも40℃くらいかな？」

ただし、1回ずつしか確認していないので、「本当に40℃か？」には自信がありません。

ここで問いです。

🤔 問題

「2つの浴槽は同じ給湯器から同じ設定でお湯を入れている」とわかっている場合、「お湯の温度」をより正確に知るには、どうすればいい？

💡 答え：2つの浴槽のお湯を「混ぜて」測定する

もし2つの浴槽が「同じ給湯器・同じ設定」なら、お湯の温度は本来同じはず。

だったら、2つの浴槽からお湯を汲んできて、大きなバケツで混ぜて測定したほうが、「1回ずつバラバラに測る」より正確な値が出せますよね？

これが「プーリング」の発想です。

「同じ性質を持つデータ」なら、合体させたほうがデータ数が増えて、より正確な推定ができる——これが統計学における「プール」の本質です。

🛁 お風呂のたとえまとめ

浴槽A = グループAのデータ

浴槽B = グループBのデータ

同じ給湯器 = 「分散が同じ」という前提

バケツで混ぜる = データをプールして「共通の分散」を計算

📘 分散の基礎を復習したい方へ
第5回：分散と標準偏差｜「バラつき」を数値化する魔法の公式 →

たとえ話②｜2人の職人の「腕前」を比べる

もう少し実践的な例を見てみましょう。t検定での使われ方です。

🔧 シチュエーション：どっちの職人が速い？

ある工場で、「Aさんと Bさん、どっちが作業が速いか？」を調べるために、作業時間を5回ずつ計測しました。

職人	計測回数	平均作業時間	バラつき
Aさん	5回	10分	小さい
Bさん	5回	12分	小さい

平均を見ると、Aさんのほうが2分速い。でも、「この2分の差は偶然？それとも実力？」を判定するには、「作業時間のバラつき（標準偏差）」を基準にする必要があります。

ここで、2つの計算方法があります。

❌ 方法①：プールしない（別々に計算）

「Aさんのバラつき」はAさんの5個のデータだけで計算。
「Bさんのバラつき」はBさんの5個のデータだけで計算。

⚠️ 問題点

データがたった5個ずつしかないので、計算された「バラつき」の値はあまり信用できません。たまたま安定していただけかもしれない…。

これは「ウェルチのt検定」と呼ばれる手法で使われます。

⭕ 方法②：プールする（合体して計算）

ここで、もし「AさんもBさんもベテランだから、作業の安定感（分散）自体は同じくらいのはずだ」と仮定できたらどうでしょうか？

それなら、AさんとBさんのデータを「合計10個のデータ」としてひとまとめ（プール）にして、「職人の平均的な作業バラつき」を計算したほうが、より正確な値が出せますよね？

💡 プーリングの発想

「別々に計算するより、合わせたほうがデータ数（n）が増えてお得でしょ？」という考え方。これが「スチューデントのt検定」で使われます。

📘 2つのt検定の違いを詳しく
t検定（2標本・等分散）「スチューデントのt検定」でAとBの差を証明する手順 →

ウェルチのt検定（等分散なし）｜F検定で「バラつきが違う」と出た後の救世主 →

なぜプーリングすると「お得」なのか？

「なぜそこまでしてデータを合体させたいの？」と思いますよね。

その理由は、統計的検定のパワーの源である「自由度」にあります。

🔍 自由度は「レンズの解像度」

統計の世界では、データ数（自由度）が増えるほど、判定用の分布（t分布）の形が鋭くなります。

これは「メガネの度数を上げる」ようなもの。解像度が上がって、「わずかな差」でも厳密に見分けられるようになるのです。

🔬 たとえ話：虫眼鏡の例

データ数が少ない = 100円ショップの虫眼鏡 → ぼんやりしか見えない

データ数が多い = 高性能顕微鏡 → 細かい差まで見える！

プーリングとは、「分散が同じ」という条件でデータを借りてきて、メガネの度数を上げる（＝検定力を高める）テクニックなのです。

📘 自由度の詳しい解説
【完全図解】自由度とは？｜「なぜn-1で割るのか」を中学生でも分かるように解説 →

実験計画法（DOE）でのプーリング

さて、この「プーリング」の考え方は、もっと複雑な「実験計画法」でも全く同じように使われます。

実験計画法では、「効果のなかった因子を誤差項（Error）にプーリングする」という操作をしますよね？

あれは一体、何をやっているのでしょうか？

🏭 たとえ話：工場の「犯人探し」

あなたは工場の品質管理担当。製品の強度がバラつく原因を突き止めたい。

容疑者は3人です。

容疑者（因子）	調査結果
因子A：温度	めちゃくちゃ効いてる！
因子B：圧力	まあまあ効いてる
因子C：湿度	ほぼ効いてない…

因子C（湿度）は、調べてみたら「ほとんど強度に影響していない」ことがわかりました。

このとき、統計学ではこう考えます。

🔄 プーリングの思考プロセス

①「この因子（湿度）は、結果に影響を与えていないようだ」

②「ということは、この因子の変動は、ただの偶然のノイズ（誤差）と同じ性質のものだ」

③「だったら、誤差項と混ぜて（プールして）、誤差のデータ数を増やしてあげよう」

④「そうすれば、分母（誤差分散）の精度が上がって、本当に重要な因子（温度・圧力）をより正確に見つけられるはずだ！」

少ない実験回数（L8やL18）で戦うエンジニアにとって、「死に体の因子を誤差にプールする」ことは、「かき集められる情報は全部かき集めて、判定精度を上げる」ための生存戦略なのです。

📘 実験計画法の基礎を学びたい方へ
【初心者向け】実験計画法とは？効率よく成果を出すための実験設計の基本 →

【初心者向け】誤差とは？実験や統計で必ず出るズレの正体をわかりやすく解説 →

⚠️ ただし「混ぜるな危険」のルールがある

最後に、超重要な注意点です。

プーリングは常に許されるわけではありません。

🚫 大前提：「等分散（バラつきが同じ）」であること

プーリングは「バラつきが同じ」という前提があって初めて成り立ちます。バラつきが明らかに違う場合、混ぜてはいけません。

🛁 お風呂のたとえで考える「混ぜるな危険」

もし2つの浴槽が「別々の給湯器」で、「温度設定も違う」としたらどうでしょう？

浴槽A：常に40℃（安定）
浴槽B：35℃〜45℃（日によってバラバラ）

この2つを混ぜて「平均的な温度」を計算しても、実態とかけ離れた値になってしまいますよね？

これと同じことが、統計でも起こります。

✅ 「混ぜていいか」を判断するルール

場面	プールしていい場合	プールしてはいけない場合
t検定	F検定で「等分散」と判定された → スチューデントのt検定	F検定で「不等分散」と判定された → ウェルチのt検定を使う
実験計画法	P値が大きい（効果なし）因子 → 誤差にプール	P値が小さい（効果あり）因子 → 無理やりプールしない