検定・推定

母平均の区間推定|「真の平均値はどこにある?」95%信頼区間の計算手順

こんにちは、シラスです。

これまで、t検定を使って「規格と差があるか?」「AとBに差があるか?」を判定してきました。

しかし、現場の仕事は「差がありました!」と報告して終わりではありません。
上司やクライアントは、必ずこう聞いてくるはずです。

「差があるのは分かった。で、結局、真の平均値はいくつなの?」

ここで「平均値は52です(点推定)」と言い切ってしまうのはリスクがあります。
なぜなら、手元のデータはあくまで「たまたま取れたサンプル」に過ぎないからです。

今日は、t検定の式を逆算して、「真の平均値(母平均)が含まれる範囲」を予測する、区間推定の手順を解説します。

1. 計算式の正体:検定の「逆算」

いきなり公式を覚える必要はありません。
実は、この式は「t検定の公式」を変形させただけなんです。

🔄 式の変形プロセス

1. t検定の式(スタート)

$$ t = \frac{\bar{x} - \mu}{s / \sqrt{n}} $$

2. $\mu$(母平均)について解く(ゴール)

$$ \mu = \bar{x} \pm t \times \frac{s}{\sqrt{n}} $$

この式を見ると、区間推定の構造がよく分かります。

  • 中心: 手元のデータ平均($\bar{x}$)
  • 幅(誤差): t値 $\times$ 標準誤差($s/\sqrt{n}$)

つまり、「手元の平均値を中心に、t値の分だけプラスマイナスに幅を取ったもの」が信頼区間なのです。

2. 実践:真の強度はどれくらい?

具体的な数字で計算してみましょう。

🏭 ケーススタディ

新しい材料の強度試験を行いました。

  • データ数: $n = 9$
  • 標本平均: $\bar{x} = 100$ MPa
  • 不偏標準偏差: $s = 3$ MPa

「この材料の真の強度(母平均)は、95%の確率でどの範囲にあるか?」

ステップ1:標準誤差を出す

データのブレ幅(標準誤差)を計算します。

$$ \frac{s}{\sqrt{n}} = \frac{3}{\sqrt{9}} = \frac{3}{3} = \mathbf{1.0} $$

ステップ2:t値を探す

t分布表から、係数となる「t値」を探します。

  • 自由度: $9 - 1 = 8$
  • 確率: 両側 5%(0.05)

表を見ると、2.306 です。

ステップ3:幅(マージン)を計算する

t値と標準誤差を掛け合わせます。

$$ \text{幅} = 2.306 \times 1.0 = \mathbf{2.306} $$

ステップ4:足し引きして完成

平均値(100)から、幅をプラスマイナスします。

  • 下限: $100 - 2.306 = 97.694$
  • 上限: $100 + 2.306 = 102.306$

答え: $97.7 \le \mu \le 102.3$ (MPa)

「手元の平均は100だったけど、真の実力は 97.7 〜 102.3 のどこかにあるよ(95%の信頼度で)」という結論が出ました。

3. 精度を上げる(幅を狭くする)には?

さて、ここからがエンジニアの腕の見せ所です。
もし上司にこう言われたらどうしますか?

「97.7〜102.3? 幅が広すぎる! もっとピンポイントに予測しろ!」

信頼区間の幅を狭くする(精度を上げる)方法は2つしかありません。

  1. 妥協する: 信頼度を95%から90%に下げる(t値を小さくする)。
    → 外れるリスクが増えるので推奨されません。
  2. データを増やす: サンプル数 $n$ を増やす。
    → こちらが王道です。

データ数 $n$ の威力

もし、サンプル数を $n=9$ から $n=100$ に増やしたらどうなるでしょうか?

項目 n = 9 の時 n = 100 の時
標準誤差 ($3/\sqrt{n}$) 1.0 0.3
t値 (分布表) 2.306 1.984
区間の幅 ± 2.3 ± 0.6

ご覧の通り、データ数を増やすと、分母($\sqrt{n}$)が大きくなるため、誤差が劇的に小さくなります。
結果、信頼区間は 99.4 〜 100.6 となり、かなりピンポイントな予測ができるようになります。

まとめ

区間推定は、検定の式を「$\mu =$」の形に変形したもの。
✅ 計算式は $\bar{x} \pm t \times \text{標準誤差}$
データ数 $n$ を増やすと、区間はギュッと狭くなる(精度が上がる)。

「精度を上げたければ、データを増やせばいい」
これは直感的に分かります。

では、「具体的にあと何個増やせばいいの?」
「実験をする前に、最低何個サンプルが必要か分かる?」

次回は、実験計画の最初にして最大の難関、「必要サンプル数(検出力)」の決め方について解説します。

タグ

-検定・推定
-