検定・推定

母不適合数の差の検定とは?生産量が違う2つのラインを比較する方法

こんにちは、シラスです。

前回、ポアソン分布を使って「キズの数(不適合数)」が異常かどうかを検定しました。

しかし、実務で本当にやりたいのは、以下のような「比較」ではないでしょうか。

「Aラインではキズが5個、Bラインではキズが8個出た。Bラインの方が成績が悪いと言えるか?」

ここで単純に「5個 vs 8個」を比べてはいけません。
なぜなら、「そもそも何個作ったのか(分母)」が違うかもしれないからです。

今日は、生産量や稼働時間が異なる2つのグループを公平に比較する、「母不適合数の差の検定」について解説します。

1. その比較、フェアですか?

まず、直感的な罠を回避しましょう。

⚖️ 分母の重要性

もし、生産量が以下のような状況だったらどうでしょう?

  • Aライン: 100個作って、キズ 5個
  • Bライン: 200個作って、キズ 8個

個数だけ見ればBの方が多いですが、「1個あたりの発生率」で見ると…?

  • Aライン:$5 \div 100 = 0.05$
  • Bライン:$8 \div 200 = 0.04$
なんと、Bラインの方が優秀(キズが少ない)なのです。

このように、サンプルサイズ($n$:生産数、面積、時間など)が違う場合、生の個数($c$)で比較することは無意味です。

必ず「単位あたりの平均発生数($u$)」に変換して比較する必要があります。

2. 計算式:やはり「プール」する

検定のロジックは、前回の「母比率の差」や「t検定」と全く同じです。
帰無仮説として「AとBの実力(発生頻度)は同じだ」と仮定し、データを合体(プール)させます。

ステップ1:全体の平均発生率 $\bar{u}$ を出す

2つのラインのデータを混ぜて、「全体としての平均」を計算します。

$$ \bar{u} = \frac{c_1 + c_2}{n_1 + n_2} $$
  • $c$:不適合数の合計(キズの総数)
  • $n$:サンプルサイズの合計(生産総数)

ステップ2:検定統計量 Z を計算する

ポアソン分布も、発生数が多ければ正規分布(Z検定)に近似できます。

$$ Z = \frac{u_1 - u_2}{\sqrt{\bar{u} \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}} $$
  • 分子: 単位あたりの発生数の差($u_1 - u_2$)
  • 分母: 合体させた標準誤差

この式、どこかで見覚えがありませんか?
そう、「母比率の差の検定」の式とほぼ同じ形をしています。
(比率 $p$ が 発生率 $u$ に変わっただけです)

3. 実践:生産量が違うラインの比較

では、具体的なデータで検定してみましょう。

🏭 ケーススタディ

AラインとBラインの塗装欠点を比較します。

  • Aライン: 1,000枚 作って、欠点 20個 ($u_A = 0.020$)
  • Bライン: 1,500枚 作って、欠点 45個 ($u_B = 0.030$)

単位あたりの欠点数は、Aが0.02、Bが0.03です。
「Bラインの方が欠点が多い(品質が悪い)と言えるか?」
(有意水準 5% 片側検定)

ステップ1:全体の平均率 $\bar{u}$ を出す

データを合体させます。

$$ \bar{u} = \frac{20 + 45}{1000 + 1500} = \frac{65}{2500} = \mathbf{0.026} $$

ステップ2:Z値を計算する

公式に代入します。

$$ \begin{aligned} Z &= \frac{0.030 - 0.020}{\sqrt{0.026 \left( \frac{1}{1500} + \frac{1}{1000} \right)}} \\[10pt] &= \frac{0.010}{\sqrt{0.026 \times 0.001666}} \\[10pt] &= \frac{0.010}{\sqrt{0.0000433}} \\[10pt] &= \frac{0.010}{0.00658} \approx \mathbf{1.52} \end{aligned} $$

Z値は 1.52 でした。
(※比較しやすいよう、分子は「大きい方-小さい方」で計算しました)

ステップ3:判定(1.645の壁)

片側5%の基準値は 1.645 です。

  • 計算値: 1.52
  • 基準値: 1.645

1.52 < 1.645 なので、基準を超えていません。
判定:有意差なし(帰無仮説を棄却できない)。

🤔 結論

「0.02 と 0.03 で、1.5倍も違うのに!?」と思うかもしれません。
しかし、統計学的には「この程度の差は、偶然のバラつきでも起こりうる(有意ではない)」と判定されました。

もしこれを「有意な差」として証明したいなら、もっとサンプル数(生産枚数)を増やしてデータを取る必要があります。

まとめ

✅ 生産量($n$)が違う場合、単位あたりの発生数($u$)に直して比較する。
✅ データを合体させて「全体の平均率 $\bar{u}$」を使う。
✅ 使う分布は正規分布(Z検定)

これで、「計数値(数えられるデータ)」の検定はほぼ網羅しました。

さて、検定が終わったら次は「予測(推定)」です。
「来月の事故件数は何件くらいになりそうか?」

ここで一つ、統計学の不思議な現象が起きます。
これまではZ分布(正規分布)を使ってきましたが、不適合数(ポアソン分布)の区間推定を行うときだけ、なぜか突然「カイ二乗分布」が登場するのです。

次回、この謎めいた「母不適合数の区間推定」について解説します。

統計学のおすすめ書籍

統計学の「数式アレルギー」を治してくれた一冊

「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。

この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。

「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。

¥2,420 (2025/11/23 09:57時点 | Amazon調べ)
\楽天ポイント4倍セール!/
楽天市場

【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル

私がQC検定2級に合格した際、使い倒したのがこの一冊です。

この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。

解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。

タグ

-検定・推定
-