こんにちは、シラスです。
これまで、t検定を使って「規格と差があるか?」「AとBに差があるか?」を判定してきました。
しかし、現場の仕事は「差がありました!」と報告して終わりではありません。
上司やクライアントは、必ずこう聞いてくるはずです。
ここで「平均値は52です(点推定)」と言い切ってしまうのはリスクがあります。
なぜなら、手元のデータはあくまで「たまたま取れたサンプル」に過ぎないからです。
今日は、t検定の式を逆算して、「真の平均値(母平均)が含まれる範囲」を予測する、区間推定の手順を解説します。
目次
1. 計算式の正体:検定の「逆算」
いきなり公式を覚える必要はありません。
実は、この式は「t検定の公式」を変形させただけなんです。
1. t検定の式(スタート)
2. $\mu$(母平均)について解く(ゴール)
この式を見ると、区間推定の構造がよく分かります。
- 中心: 手元のデータ平均($\bar{x}$)
- 幅(誤差): t値 $\times$ 標準誤差($s/\sqrt{n}$)
つまり、「手元の平均値を中心に、t値の分だけプラスマイナスに幅を取ったもの」が信頼区間なのです。
2. 実践:真の強度はどれくらい?
具体的な数字で計算してみましょう。
新しい材料の強度試験を行いました。
- データ数: $n = 9$
- 標本平均: $\bar{x} = 100$ MPa
- 不偏標準偏差: $s = 3$ MPa
「この材料の真の強度(母平均)は、95%の確率でどの範囲にあるか?」
ステップ1:標準誤差を出す
データのブレ幅(標準誤差)を計算します。
ステップ2:t値を探す
t分布表から、係数となる「t値」を探します。
- 自由度: $9 - 1 = 8$
- 確率: 両側 5%(0.05)
表を見ると、2.306 です。
ステップ3:幅(マージン)を計算する
t値と標準誤差を掛け合わせます。
ステップ4:足し引きして完成
平均値(100)から、幅をプラスマイナスします。
- 下限: $100 - 2.306 = 97.694$
- 上限: $100 + 2.306 = 102.306$
答え: $97.7 \le \mu \le 102.3$ (MPa)
「手元の平均は100だったけど、真の実力は 97.7 〜 102.3 のどこかにあるよ(95%の信頼度で)」という結論が出ました。
3. 精度を上げる(幅を狭くする)には?
さて、ここからがエンジニアの腕の見せ所です。
もし上司にこう言われたらどうしますか?
「97.7〜102.3? 幅が広すぎる! もっとピンポイントに予測しろ!」
信頼区間の幅を狭くする(精度を上げる)方法は2つしかありません。
- 妥協する: 信頼度を95%から90%に下げる(t値を小さくする)。
→ 外れるリスクが増えるので推奨されません。 - データを増やす: サンプル数 $n$ を増やす。
→ こちらが王道です。
データ数 $n$ の威力
もし、サンプル数を $n=9$ から $n=100$ に増やしたらどうなるでしょうか?
| 項目 | n = 9 の時 | n = 100 の時 |
|---|---|---|
| 標準誤差 ($3/\sqrt{n}$) | 1.0 | 0.3 |
| t値 (分布表) | 2.306 | 1.984 |
| 区間の幅 | ± 2.3 | ± 0.6 |
ご覧の通り、データ数を増やすと、分母($\sqrt{n}$)が大きくなるため、誤差が劇的に小さくなります。
結果、信頼区間は 99.4 〜 100.6 となり、かなりピンポイントな予測ができるようになります。
まとめ
「精度を上げたければ、データを増やせばいい」
これは直感的に分かります。
では、「具体的にあと何個増やせばいいの?」
「実験をする前に、最低何個サンプルが必要か分かる?」
次回は、実験計画の最初にして最大の難関、「必要サンプル数(検出力)」の決め方について解説します。