検定・推定

母比率の差の検定|「A工場とB工場の不良率に差はある?」2つの割合を比較する手順

こんにちは、シラスです。

前回は、「基準値(5%)」と「現状(3%)」を比較しました。
しかし、実務で本当にやりたいのは、「2つの現場同士」の比較ではないでしょうか。

  • 🏭 「A工場(不良率3%)とB工場(不良率5%)。B工場の方が品質が悪いと言えるか?」
  • 🖱 「WebサイトのボタンA(クリック率1%)とボタンB(クリック率1.5%)。どっちを採用すべき?」

これはいわゆる「A/Bテスト」の統計学的正体です。
今回は、2つのグループの比率(確率)に有意な差があるかを判定する、「母比率の差の検定」を解説します。

1. 必殺技アゲイン:「比率」もプールする

この検定のロジックは、以前紹介した「t検定(等分散)」と非常によく似ています。

検定のスタート地点(帰無仮説)では、「AとBの比率は同じだ(差はない)」と仮定します。
「同じ」だと仮定するなら、別々に計算するよりも、データを合体(プール)させて「全体の比率」を計算したほうが、精度が高くなりますよね?

💧 合併比率 $\hat{p}$ の計算
$$ \hat{p} = \frac{x_1 + x_2}{n_1 + n_2} $$

難しく考える必要はありません。
「2つのグループの『発生数』と『分母』を、それぞれ単純に足し算して割る」だけです。

この「全体の平均比率($\hat{p}$)」を使って、標準誤差を計算します。

2. 検定統計量 Z の計算式

公式は少し長く見えますが、分解すれば単純です。

$$ Z = \frac{p_1 - p_2}{\sqrt{\hat{p}(1-\hat{p}) \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}} $$
  • 分子: 2つの比率の差($3\% - 5\%$ など)
  • 分母: 合体させた標準誤差

データ数($n$)が十分大きければ、このZ値は正規分布に従います。
つまり、今回も判定基準はあの数字、「1.96(5%の壁)」です。

3. 実践:工場の品質対決

具体的なデータで計算してみましょう。

🏭 ケーススタディ

A工場とB工場の不良率を比較します。

  • A工場: 1000個作って、不良品 30個 ($p_1 = 0.03$)
  • B工場: 1000個作って、不良品 50個 ($p_2 = 0.05$)

「2%の差があるが、B工場の方が品質が悪いと言えるか?」
(有意水準 5%)

ステップ1:合併比率 $\hat{p}$ を出す

まずはデータを合体させます。

$$ \hat{p} = \frac{30 + 50}{1000 + 1000} = \frac{80}{2000} = \mathbf{0.04} $$

全体で見ると、不良率は 4% ということですね。

ステップ2:Z値を計算する

公式に代入します。

$$ \begin{aligned} Z &= \frac{0.03 - 0.05}{\sqrt{0.04 \times 0.96 \times (\frac{1}{1000} + \frac{1}{1000})}} \\[10pt] &= \frac{-0.02}{\sqrt{0.0384 \times 0.002}} \\[10pt] &= \frac{-0.02}{\sqrt{0.0000768}} \\[10pt] &= \frac{-0.02}{0.00876} \approx \mathbf{-2.28} \end{aligned} $$

Z値(絶対値)は 2.28 でした。

ステップ3:判定(1.96の壁)

正規分布(両側5%)の基準値は 1.96 です。

$|2.28| > 1.96$ なので、有意差あり!

✅ 結論

「たった2%の違い」と思うかもしれませんが、サンプル数が1000個もあるため、統計学的には「偶然の誤差とは考えにくい(B工場は明確に品質が悪い)」と判定されました。

4. もしサンプル数が少なかったら?

ちなみに、もし同じ不良率(3%と5%)でも、サンプル数が「100個ずつ」だったらどうなっていたでしょうか?

  • 分母の $\sqrt{1/n}$ が大きくなるため、Z値は約 0.72 になります。
  • $0.72 < 1.96$ なので、今度は「有意差なし(誤差の範囲)」になります。

比率の検定は、平均値の検定以上に「サンプル数($n$)の暴力」が効きます。
「1%の違い」を証明したければ、数千、数万というデータが必要になることも珍しくありません。

まとめ

比率の差の検定も、やることはt検定(等分散)と同じ。
✅ まずデータを合体させて「合併比率 $\hat{p}$」を作る。
✅ Z検定(正規分布)を使うので、基準は1.96

これで「差があるか?」の判定はできました。
では最後に、上司からのこの質問に答えましょう。

「差があるのは分かった。で、本当の不良率は何%くらいになりそうなの?」

次回、選挙速報やニュースでよく見る「支持率 ±3%」の正体、「母比率の区間推定」について解説します。

統計学のおすすめ書籍

統計学の「数式アレルギー」を治してくれた一冊

「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。

この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。

「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。

¥2,420 (2025/11/23 09:57時点 | Amazon調べ)

【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル

私がQC検定2級に合格した際、使い倒したのがこの一冊です。

この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。

解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。

タグ

-検定・推定
-