【統計学】t検定(母分散未知・一標本)|「この部品の長さは規格通り?」実務で最も使う基本の検定
こんにちは、シラスです。
前回、統計学の理想形である「Z検定」を紹介しました。
しかし、それは「真のバラつき($\sigma$)」を知っている神様にしか使えない手法でした。
私たち人間は、現場で日々こんな課題と戦っています。
- 🛠 「このロットの部品、平均50mmの規格通りに作れてるか?」
- 🧪 「新しい材料の強度は、目標値(100MPa)をクリアしているか?」
真のバラつきなんて誰も知りません。分かるのは、今手元にある数個のサンプルデータだけ。
そんな状況で使える、実務で最も基本的な検定が、今回紹介する「t検定(一標本)」です。
1. Z検定との違い:代用品を使う
Z検定とt検定の違いは、たった一つだけです。
- 神様(Z検定): 真の標準偏差 $\sigma$ を使う。
- 人間(t検定): 標本の不偏標準偏差 $s$ を使う。
真の値($\sigma$)が分からないので、仕方なく手元のデータから計算したバラつき($s$)で代用して計算します。
計算式を見比べてみましょう。
分母の $\sigma$ が $s$ に変わっただけですね。
やっている計算自体は、「ズレを標準誤差で割る」という同じロジックです。
2. 代償としての「ペナルティ」
しかし、この「代用」には代償が伴います。
手元のデータから計算した $s$ は、たまたまデータが偏っていたりすると、真の値 $\sigma$ とはズレてしまいます。
つまり、Z検定よりも「情報の信頼度」が少し落ちるのです。
信頼度が落ちるとどうなるか?
判定基準(ハードル)が厳しくなります。
- Z検定: 1.96 を超えたらアウト(異常)。
- t検定: 2.31 とか 2.78 を超えないとアウトにできない。
データ数($n$)が少ないほど、$s$ の信頼性が低いとみなされ、より大きなズレがないと「異常だ!」と認定してもらえなくなります。
3. 実践:部品の長さを検定する
では、具体的なケースで計算してみましょう。
規格値 $\mu = 50mm$ の部品を作っています。
抜き取り検査で $n=9$ 個を測ったところ、以下の結果でした。
- 平均値: $\bar{x} = 52.0mm$
- 不偏標準偏差: $s = 2.0mm$
「このロットの平均値は、規格(50mm)からズレていると言えるか?」
(有意水準 5% で検定)
ステップ1:t値を計算する
公式に代入します。
t値は 3.0 になりました。
ステップ2:判定基準(t分布表)を見る
ここで使うのは「正規分布表」ではなく「t分布表」です。
見るべきポイントは「自由度($n-1$)」です。
- データ数 $n=9$ なので、自由度は $9 - 1 = 8$。
- 自由度8、両側5%(0.05)の値を探します。
表を見ると、基準値は 2.306 です。
(Z検定の1.96よりも、少しハードルが高くなっていますね)
ステップ3:結論
- 計算値:3.0
- 基準値:2.306
3.0 > 2.306 なので、基準を超えています。
判定:有意差あり(規格からズレている)。
「サンプル数が少なくても、これだけズレていれば文句なしで異常だ」と判断されました。
まとめ
さて、ここで気になるのが「判定基準が厳しくなる」という部分です。
なぜデータが少ないと、基準値が 1.96 から 2.306 に増えるのでしょうか?
その理由こそが、今回新しく登場した「t分布」という山の形の秘密にあります。
次回は、このt分布の「裾野の広がり」と「自由度」の関係について、図解で詳しく見ていきましょう。