こんにちは、シラスです。
前回、ポアソン分布を使って「キズの数(不適合数)」が異常かどうかを検定しました。
しかし、実務で本当にやりたいのは、以下のような「比較」ではないでしょうか。
ここで単純に「5個 vs 8個」を比べてはいけません。
なぜなら、「そもそも何個作ったのか(分母)」が違うかもしれないからです。
今日は、生産量や稼働時間が異なる2つのグループを公平に比較する、「母不適合数の差の検定」について解説します。
目次
1. その比較、フェアですか?
まず、直感的な罠を回避しましょう。
もし、生産量が以下のような状況だったらどうでしょう?
- Aライン: 100個作って、キズ 5個
- Bライン: 200個作って、キズ 8個
個数だけ見ればBの方が多いですが、「1個あたりの発生率」で見ると…?
- Aライン:$5 \div 100 = 0.05$
- Bライン:$8 \div 200 = 0.04$
このように、サンプルサイズ($n$:生産数、面積、時間など)が違う場合、生の個数($c$)で比較することは無意味です。
必ず「単位あたりの平均発生数($u$)」に変換して比較する必要があります。
2. 計算式:やはり「プール」する
検定のロジックは、前回の「母比率の差」や「t検定」と全く同じです。
帰無仮説として「AとBの実力(発生頻度)は同じだ」と仮定し、データを合体(プール)させます。
ステップ1:全体の平均発生率 $\bar{u}$ を出す
2つのラインのデータを混ぜて、「全体としての平均」を計算します。
- $c$:不適合数の合計(キズの総数)
- $n$:サンプルサイズの合計(生産総数)
ステップ2:検定統計量 Z を計算する
ポアソン分布も、発生数が多ければ正規分布(Z検定)に近似できます。
- 分子: 単位あたりの発生数の差($u_1 - u_2$)
- 分母: 合体させた標準誤差
この式、どこかで見覚えがありませんか?
そう、「母比率の差の検定」の式とほぼ同じ形をしています。
(比率 $p$ が 発生率 $u$ に変わっただけです)
3. 実践:生産量が違うラインの比較
では、具体的なデータで検定してみましょう。
AラインとBラインの塗装欠点を比較します。
- Aライン: 1,000枚 作って、欠点 20個 ($u_A = 0.020$)
- Bライン: 1,500枚 作って、欠点 45個 ($u_B = 0.030$)
単位あたりの欠点数は、Aが0.02、Bが0.03です。
「Bラインの方が欠点が多い(品質が悪い)と言えるか?」
(有意水準 5% 片側検定)
ステップ1:全体の平均率 $\bar{u}$ を出す
データを合体させます。
ステップ2:Z値を計算する
公式に代入します。
Z値は 1.52 でした。
(※比較しやすいよう、分子は「大きい方-小さい方」で計算しました)
ステップ3:判定(1.645の壁)
片側5%の基準値は 1.645 です。
- 計算値: 1.52
- 基準値: 1.645
1.52 < 1.645 なので、基準を超えていません。
判定:有意差なし(帰無仮説を棄却できない)。
「0.02 と 0.03 で、1.5倍も違うのに!?」と思うかもしれません。
しかし、統計学的には「この程度の差は、偶然のバラつきでも起こりうる(有意ではない)」と判定されました。
もしこれを「有意な差」として証明したいなら、もっとサンプル数(生産枚数)を増やしてデータを取る必要があります。
まとめ
これで、「計数値(数えられるデータ)」の検定はほぼ網羅しました。
さて、検定が終わったら次は「予測(推定)」です。
「来月の事故件数は何件くらいになりそうか?」
ここで一つ、統計学の不思議な現象が起きます。
これまではZ分布(正規分布)を使ってきましたが、不適合数(ポアソン分布)の区間推定を行うときだけ、なぜか突然「カイ二乗分布」が登場するのです。
次回、この謎めいた「母不適合数の区間推定」について解説します。
統計学のおすすめ書籍
統計学の「数式アレルギー」を治してくれた一冊
「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。
この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。
「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。
【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル
私がQC検定2級に合格した際、使い倒したのがこの一冊です。
この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。
解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。