こんにちは、シラスです。
前回までは、「長さ」や「重さ」といった「計量値(平均値)」の検定を行ってきました。
しかし、製造現場やマーケティングの現場では、平均値以上に気になる数字があります。
- 🏭 「不良率が 5% から 3% に減った!」
- 📺 「内閣支持率が 40% を切った!」
- 🖱 「Webサイトのクリック率が 1% 上がった!」
これらは全て「〇〇率(%)」、つまり「計数値(比率)」のデータです。
「たった2%の違いでしょ? 誤差じゃないの?」
そう突っ込まれた時、自信を持って「いいえ、改善です!」と答えるための武器。
それが今回紹介する「母比率の検定(Z検定)」です。
目次
1. なぜ「Z検定」が使えるのか?(正規分布近似)
本来、合格・不合格のような「2択(0か1か)」のデータは、二項分布というカクカクした階段状の分布に従います。
しかし、データ数($n$)が十分に大きいとき、この階段は滑らかになり、「正規分布」とほぼ同じ形になります。
目安として、「発生回数が5回以上ある」なら、正規分布に近似できます。
正規分布が使えるということは、あの最強の「Z検定(1.96の壁)」が使えるということです。
2. 計算式:比率の「標準誤差」を知る
検定統計量 $Z$ の形は、平均値の時と同じです。
- 分子: ズレ(データ比率 $p$ - 基準比率 $P_0$)
- 分母: 比率のバラつき(標準誤差)
この分母のルートの中身 $\frac{P(1-P)}{n}$ は、比率の検定で何度も出てくるので、「比率の分散は $P(1-P)$」と覚えてしまいましょう。
3. 実践:不良率低減プロジェクト
具体的なケースで計算してみましょう。
従来の不良率は $P_0 = 5\%$ ($0.05$) でした。
改善活動の後、製品を $n=200$ 個作ったら、不良品は $6$ 個でした。
- 今回の不良率: $p = 6 \div 200 = 3\%$ ($0.03$)
「不良率が 5% → 3% に減ったのは、改善効果か? それとも偶然か?」
(有意水準 5% 片側検定:「減ったこと」を確認したいので)
ステップ1:近似条件のチェック
$np = 200 \times 0.05 = 10$。
5以上あるので、正規分布近似OKです。
ステップ2:Z値を計算する
公式に代入します。
Z値は -1.30 でした。
ステップ3:判定(1.64の壁)
今回は「片側検定(減ったかどうか)」なので、正規分布の片側5%の基準値 1.645 を使います。
- 計算値の絶対値: 1.30
- 基準値: 1.645
1.30 < 1.645 なので、基準を超えていません。
判定:有意差なし(帰無仮説を棄却できない)。
「200個作って不良率が3%に減った!やったー!」と喜んでいましたが、統計学的には「いや、運が良かっただけでしょ(実力は5%のままかもよ)」と判定されてしまいました。
もしこれを「有意」にするには、もっとサンプル数($n$)を増やして実験する必要があります。
まとめ
今回は「基準値(5%)」との比較でしたが、実務では「A工場とB工場」のように2つの現場を比較したいことも多いはずです。
「A工場は不良率3%、B工場は5%。これって差があるの?」
次回は、この疑問に答える「母比率の差の検定」について解説します。
統計学のおすすめ書籍
統計学の「数式アレルギー」を治してくれた一冊
「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。
この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。
「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。
【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル
私がQC検定2級に合格した際、使い倒したのがこの一冊です。
この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。
解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。