こんにちは、シラスです。
前回までは「1つのデータ」と「規格値」を比べる検定をしてきました。
しかし、実務で本当にやりたいのは、「2つのデータ同士」の比較ではないでしょうか。
- 「A工場の製品と、B工場の製品。平均値に差はあるか?」
- 「改善前と改善後。歩留まりは向上したと言えるか?」
これに白黒つけるのが「2標本のt検定」です。
今回は、その中でも最も基本となる「等分散(バラつきが同じ)」の場合の手法を解説します。
通称「スチューデントのt検定」と呼ばれる、統計学の王道中の王道です。
目次
1. スタート地点:まずは「F検定」から
2つの平均値を比べる前に、必ず確認しなければならないことがあります。
それは「土俵(バラつき)は同じか?」ということです。
まず、2つのデータの分散($V_1, V_2$)を使って「F検定」を行います。
- 有意差なし(等分散): 今回紹介する「スチューデントのt検定」へ。
- 有意差あり(非等分散): 次回紹介する「ウェルチのt検定」へ。
「バラつきが同じ(等分散)」とみなせる場合、私たちは「分散をプールする(混ぜる)」という必殺技を使うことができます。
2. 必殺技:分散をプールする(合併分散 $s_p^2$)
これが今回の最重要ポイントです。
「AとB、バラつき具合はだいたい同じだね」と分かったなら、AとBの分散を別々に計算するのではなく、ひとまとめ(プール)にして、より精度の高い「共通の分散」を作ってしまおう、という考え方です。
2つの鍋(AとB)にスープが入っています。
「塩加減(分散)は同じ」だと分かっています。
それなら、別々に味見するよりも、2つの鍋を大きな寸胴にまとめて(プールして)から味見したほうが、量がたっぷりで測定しやすくないですか?
統計学的に言うと、データを混ぜることで「自由度」が増えます。
自由度が増えると、情報の信頼性が上がり、微妙な差でも「有意差あり」と検出しやすくなる(検出力が上がる)のです。
合併分散 $s_p^2$ の計算式
2つの分散を、データ数(自由度)で重み付けして平均します。
一見複雑そうですが、要するに「平方和($S_1+S_2$)を足して、自由度($f_1+f_2$)の合計で割っている」だけです。
3. 実践:A工場とB工場の比較
では、実際に計算してみましょう。
製品の強度を比較します。F検定の結果、等分散とみなせました。
- A工場: 平均 $\bar{x}_A = 50$, 分散 $s_A^2 = 10$, データ数 $n_A = 10$
- B工場: 平均 $\bar{x}_B = 55$, 分散 $s_B^2 = 10$, データ数 $n_B = 10$
「平均値に5の差があるが、これは有意か?」(有意水準5%)
ステップ1:合併分散 $s_p^2$ を求める
まずは分散をプールします。
※今回は元々分散が同じ(10)だったので、プールしても10のままです。
ステップ2:t値を計算する
プールした分散を使って、標準誤差を作ります。
数値を代入します。($s_p = \sqrt{10} \approx 3.16$)
t値の大きさ(絶対値)は 3.54 です。
ステップ3:判定(自由度に注意!)
判定基準(t分布表)を見ますが、ここの自由度がポイントです。
2つのデータを合体させたので、自由度も合体します。
今回は $10 + 10 - 2 = 18$ です。
自由度18、有意水準5%の基準値は 2.101 です。
$3.54 > 2.101$ なので、有意差あり!
「A工場とB工場の強度には、明確な差がある」と証明できました。
まとめ
しかし、世の中そんなに都合よく「バラつきが同じ」ケースばかりではありません。
F検定で「バラつきが違う(非等分散)」と判定されてしまったら、どうすればいいのでしょうか?
「分散が違うなら、混ぜちゃダメだよね?」
そんなピンチを救うのが、現代の実務におけるスタンダード、「ウェルチのt検定」です。