こんにちは、シラスです。
前回は、「基準値(5%)」と「現状(3%)」を比較しました。
しかし、実務で本当にやりたいのは、「2つの現場同士」の比較ではないでしょうか。
- 🏭 「A工場(不良率3%)とB工場(不良率5%)。B工場の方が品質が悪いと言えるか?」
- 🖱 「WebサイトのボタンA(クリック率1%)とボタンB(クリック率1.5%)。どっちを採用すべき?」
これはいわゆる「A/Bテスト」の統計学的正体です。
今回は、2つのグループの比率(確率)に有意な差があるかを判定する、「母比率の差の検定」を解説します。
目次
1. 必殺技アゲイン:「比率」もプールする
この検定のロジックは、以前紹介した「t検定(等分散)」と非常によく似ています。
検定のスタート地点(帰無仮説)では、「AとBの比率は同じだ(差はない)」と仮定します。
「同じ」だと仮定するなら、別々に計算するよりも、データを合体(プール)させて「全体の比率」を計算したほうが、精度が高くなりますよね?
難しく考える必要はありません。
「2つのグループの『発生数』と『分母』を、それぞれ単純に足し算して割る」だけです。
この「全体の平均比率($\hat{p}$)」を使って、標準誤差を計算します。
2. 検定統計量 Z の計算式
公式は少し長く見えますが、分解すれば単純です。
- 分子: 2つの比率の差($3\% - 5\%$ など)
- 分母: 合体させた標準誤差
データ数($n$)が十分大きければ、このZ値は正規分布に従います。
つまり、今回も判定基準はあの数字、「1.96(5%の壁)」です。
3. 実践:工場の品質対決
具体的なデータで計算してみましょう。
A工場とB工場の不良率を比較します。
- A工場: 1000個作って、不良品 30個 ($p_1 = 0.03$)
- B工場: 1000個作って、不良品 50個 ($p_2 = 0.05$)
「2%の差があるが、B工場の方が品質が悪いと言えるか?」
(有意水準 5%)
ステップ1:合併比率 $\hat{p}$ を出す
まずはデータを合体させます。
全体で見ると、不良率は 4% ということですね。
ステップ2:Z値を計算する
公式に代入します。
Z値(絶対値)は 2.28 でした。
ステップ3:判定(1.96の壁)
正規分布(両側5%)の基準値は 1.96 です。
$|2.28| > 1.96$ なので、有意差あり!
「たった2%の違い」と思うかもしれませんが、サンプル数が1000個もあるため、統計学的には「偶然の誤差とは考えにくい(B工場は明確に品質が悪い)」と判定されました。
4. もしサンプル数が少なかったら?
ちなみに、もし同じ不良率(3%と5%)でも、サンプル数が「100個ずつ」だったらどうなっていたでしょうか?
- 分母の $\sqrt{1/n}$ が大きくなるため、Z値は約 0.72 になります。
- $0.72 < 1.96$ なので、今度は「有意差なし(誤差の範囲)」になります。
比率の検定は、平均値の検定以上に「サンプル数($n$)の暴力」が効きます。
「1%の違い」を証明したければ、数千、数万というデータが必要になることも珍しくありません。
まとめ
これで「差があるか?」の判定はできました。
では最後に、上司からのこの質問に答えましょう。
「差があるのは分かった。で、本当の不良率は何%くらいになりそうなの?」
次回、選挙速報やニュースでよく見る「支持率 ±3%」の正体、「母比率の区間推定」について解説します。
統計学のおすすめ書籍
統計学の「数式アレルギー」を治してくれた一冊
「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。
この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。
「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。
【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル
私がQC検定2級に合格した際、使い倒したのがこの一冊です。
この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。
解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。