検定・推定

母比率の検定(大標本Z検定)|「不良率が5%から3%に減った」は改善か誤差か?

こんにちは、シラスです。

前回までは、「長さ」や「重さ」といった「計量値(平均値)」の検定を行ってきました。

しかし、製造現場やマーケティングの現場では、平均値以上に気になる数字があります。

  • 🏭 「不良率が 5% から 3% に減った!」
  • 📺 「内閣支持率が 40% を切った!」
  • 🖱 「Webサイトのクリック率が 1% 上がった!」

これらは全て「〇〇率(%)」、つまり「計数値(比率)」のデータです。

「たった2%の違いでしょ? 誤差じゃないの?」
そう突っ込まれた時、自信を持って「いいえ、改善です!」と答えるための武器。
それが今回紹介する「母比率の検定(Z検定)」です。

1. なぜ「Z検定」が使えるのか?(正規分布近似)

本来、合格・不合格のような「2択(0か1か)」のデータは、二項分布というカクカクした階段状の分布に従います。

しかし、データ数($n$)が十分に大きいとき、この階段は滑らかになり、「正規分布」とほぼ同じ形になります。

📏 大標本の条件
データ数 $n$ と比率 $P$ が以下の条件を満たす時、正規分布として扱って計算してOKです。
$$ np > 5 \quad \text{かつ} \quad n(1-P) > 5 $$

目安として、「発生回数が5回以上ある」なら、正規分布に近似できます。

正規分布が使えるということは、あの最強の「Z検定(1.96の壁)」が使えるということです。

2. 計算式:比率の「標準誤差」を知る

検定統計量 $Z$ の形は、平均値の時と同じです。

$$ Z = \frac{p - P_0}{\sqrt{\frac{P_0(1-P_0)}{n}}} $$
  • 分子: ズレ(データ比率 $p$ - 基準比率 $P_0$)
  • 分母: 比率のバラつき(標準誤差)

この分母のルートの中身 $\frac{P(1-P)}{n}$ は、比率の検定で何度も出てくるので、「比率の分散は $P(1-P)$」と覚えてしまいましょう。

3. 実践:不良率低減プロジェクト

具体的なケースで計算してみましょう。

🏭 ケーススタディ

従来の不良率は $P_0 = 5\%$ ($0.05$) でした。
改善活動の後、製品を $n=200$ 個作ったら、不良品は $6$ 個でした。

  • 今回の不良率: $p = 6 \div 200 = 3\%$ ($0.03$)

「不良率が 5% → 3% に減ったのは、改善効果か? それとも偶然か?」
(有意水準 5% 片側検定:「減ったこと」を確認したいので)

ステップ1:近似条件のチェック

$np = 200 \times 0.05 = 10$。
5以上あるので、正規分布近似OKです。

ステップ2:Z値を計算する

公式に代入します。

$$ \begin{aligned} Z &= \frac{0.03 - 0.05}{\sqrt{\frac{0.05 \times 0.95}{200}}} \\[10pt] &= \frac{-0.02}{\sqrt{0.0002375}} \\[10pt] &= \frac{-0.02}{0.0154} \\[10pt] &\approx \mathbf{-1.30} \end{aligned} $$

Z値は -1.30 でした。

ステップ3:判定(1.64の壁)

今回は「片側検定(減ったかどうか)」なので、正規分布の片側5%の基準値 1.645 を使います。

  • 計算値の絶対値: 1.30
  • 基準値: 1.645

1.30 < 1.645 なので、基準を超えていません。
判定:有意差なし(帰無仮説を棄却できない)。

😱 結論

「200個作って不良率が3%に減った!やったー!」と喜んでいましたが、統計学的には「いや、運が良かっただけでしょ(実力は5%のままかもよ)」と判定されてしまいました。

もしこれを「有意」にするには、もっとサンプル数($n$)を増やして実験する必要があります。

まとめ

比率の検定は、サンプル数が多ければZ検定(正規分布)が使える。
✅ 条件は、発生回数($np$)が5回以上あること。
✅ 計算式は平均値のZ検定とそっくり。

今回は「基準値(5%)」との比較でしたが、実務では「A工場とB工場」のように2つの現場を比較したいことも多いはずです。

「A工場は不良率3%、B工場は5%。これって差があるの?」

次回は、この疑問に答える「母比率の差の検定」について解説します。

統計学のおすすめ書籍

統計学の「数式アレルギー」を治してくれた一冊

「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。

この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。

「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。

¥2,420 (2025/11/23 09:57時点 | Amazon調べ)

【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル

私がQC検定2級に合格した際、使い倒したのがこの一冊です。

この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。

解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。

タグ

-検定・推定
-