統計学基礎

第12回:二項分布とは?|コイン投げで理解する「成功回数」の確率分布

😣 こんな疑問はありませんか?
  • 「二項分布」ってどんな分布?どういうときに使うの?
  • 公式 P(X=k) = nCk × p^k × (1-p)^(n-k) の意味がわからない…
  • 期待値がnp、分散がnp(1-p)になるのはなぜ?
  • 「正規分布で近似できる」ってどういう条件?
✅ この記事でわかること
  • 二項分布の意味を「コイン投げ」で直感的に理解
  • 確率の公式がなぜその形になるのか、一から導出
  • 期待値np・分散np(1-p)の「なぜ」を完全解説
  • 正規分布で近似できる条件と、連続修正の意味

「コインを10回投げて、表が何回出るか?」

「100個の製品を検査して、不良品は何個あるか?」

これらの問いに答えてくれるのが、二項分布です。

二項分布は統計学で最も重要な離散分布の一つで、品質管理、世論調査、医学研究、マーケティングなど、あらゆる分野で活用されています。

この記事では、公式を暗記するのではなく、「なぜその式になるのか」をコイン投げのイメージで徹底的に解説します。

二項分布とは?一言でいうと

📐 二項分布の定義
「成功」か「失敗」の2択をn回繰り返したとき成功がk回起きる確率を表す分布

「二項」という名前は、結果が2種類(成功・失敗)しかないことに由来します。

🎯 二項分布が使える4つの条件

二項分布は、以下の4つの条件をすべて満たす場合に使えます。

条件説明コイン投げの例
① 試行回数が固定何回繰り返すかが決まっている「10回投げる」と決めている
② 各試行が独立1回目の結果が2回目に影響しない1回目が表でも、2回目の確率は変わらない
③ 結果は2種類のみ成功か失敗の2択表(成功)か裏(失敗)
④ 成功確率が一定毎回同じ確率どの回も表が出る確率は50%
💡 イメージ
「同じサイコロを何度も振る」「同じ条件で何度も抽選する」ような状況が二項分布です。毎回条件が変わってしまう場合は使えません。

📊 二項分布の記号

二項分布は B(n, p) と書きます。

記号意味
BBinomial(二項)の頭文字
n試行回数コインを10回投げる → n = 10
p1回の試行での成功確率表が出る確率 → p = 0.5

「コインを10回投げて表の回数を数える」なら、X 〜 B(10, 0.5) と書きます。

二項分布の確率公式を「導出」する

いよいよ本題です。二項分布の確率公式を、「なぜその式になるのか」を理解しながら導出しましょう。

🎯 具体例:コインを3回投げて、表が2回出る確率

まず、簡単な例で考えてみましょう。

【問題】

公正なコインを3回投げて、表がちょうど2回出る確率は?

Step 1:すべてのパターンを書き出す

3回投げて「表が2回」になるパターンは、何通りあるでしょうか?

パターン1回目2回目3回目表の回数
2回
2回
2回

「表が2回」のパターンは3通りありますね。

Step 2:1パターンの確率を計算

例えば「表→表→裏」というパターンが起きる確率はいくつでしょう?

各回は独立なので、掛け算で計算できます。

「表→表→裏」の確率

= (表が出る確率)×(表が出る確率)×(裏が出る確率)

= 0.5 × 0.5 × 0.5 = 0.125

他の2パターン(「表→裏→表」「裏→表→表」)も同じく0.125です。

Step 3:全パターンを足す

「表が2回」になるのは、3つのパターンのいずれかが起きればいいので、足し算です。

📐 計算結果
P(表が2回) = 0.125 + 0.125 + 0.125 = 3 × 0.125 = 0.375

つまり、37.5%の確率で「表が2回」になります。

🔍 この計算を一般化する

今の計算を振り返ると、確率は次の2つの要素の掛け算で求められました。

要素今回の例一般化
パターン数(何通りあるか)3通りnCk
1パターンの確率0.5² × 0.5¹pk × (1-p)n-k

📐 二項分布の確率公式(完成形)

以上をまとめると、二項分布の確率公式が導けます。

二項分布の確率公式
P(X = k) = nCk × pk × (1-p)n-k

nCk:n回中k回成功するパターン数(組み合わせ)
pk:k回成功する確率
(1-p)n-k:(n-k)回失敗する確率

🧮 組み合わせ nCk の計算方法

「n回中k回を選ぶ」組み合わせの数は、次の公式で計算します。

📐 組み合わせの公式
nCk =
n!
k! × (n-k)!
※ n! = n × (n-1) × (n-2) × ... × 2 × 1 (nの階乗)

例:3C2 の計算

3C2 =
3!
2! × 1!
=
3 × 2 × 1
2 × 1 × 1
=
6
2
= 3

「3回中2回を選ぶ」方法は3通り。先ほど書き出した「表表裏」「表裏表」「裏表表」の3パターンと一致しますね!

💡 公式の意味を言葉で表すと
P(X = k) = 「k回成功するパターンが何通りあるか」×「そのパターンが起きる確率」

期待値 E(X) = np の導出

二項分布の期待値はE(X) = npという非常にシンプルな形になります。なぜこうなるのか、直感的に理解しましょう。

🎯 直感的な理解:「1回あたりの期待値」を足す

まず、1回だけコインを投げる場合を考えます。

【1回投げの期待値】

表(成功)が出たら「1」、裏(失敗)なら「0」とカウントすると…

期待値 = 1 × p + 0 × (1-p) = p

1回投げたときの「表の期待回数」はpです(確率がそのまま期待値になる)。

これをn回繰り返すので、期待値は単純にn倍です。

📐 期待値の公式
E(X) = np
n:試行回数、p:成功確率

例:コインを10回投げる場合

n = 10、p = 0.5 のとき:

E(X) = 10 × 0.5 = 5回

「10回投げたら、平均して5回くらい表が出るだろう」という直感と一致しますね!

🔢 厳密な導出(数学的証明)

直感的な理解ができたところで、数学的にも確認しておきましょう。

【期待値の定義に従って計算】

E(X) = Σ k × P(X = k) (k = 0, 1, 2, ..., n)

ここで、二項分布は「n回のベルヌーイ試行の和」と考えられます。

X = X₁ + X₂ + ... + Xₙ (Xᵢは各回の結果、0か1)

期待値の加法性より:

E(X) = E(X₁) + E(X₂) + ... + E(Xₙ) = p + p + ... + p = np

分散 V(X) = np(1-p) の導出

分散も同じように、「1回あたりの分散」を足し上げることで導出できます。

🎯 直感的な理解:「1回あたりの分散」を足す

まず、1回だけコインを投げる場合の分散を計算します。

【1回投げの分散(ベルヌーイ分布)】

結果は「1(成功)」か「0(失敗)」

期待値:E(Xᵢ) = p

分散:V(Xᵢ) = E(Xᵢ²) - [E(Xᵢ)]²

   = (1² × p + 0² × (1-p)) - p²

   = p - p²

   = p(1 - p)

各回の試行は独立なので、分散は足し算できます(分散の加法性)。

📐 分散の公式
V(X) = np(1-p)
n:試行回数、p:成功確率、(1-p):失敗確率

例:コインを10回投げる場合

n = 10、p = 0.5 のとき:

V(X) = 10 × 0.5 × 0.5 = 2.5

標準偏差 = √2.5 ≈ 1.58回

💡 解釈
10回投げると平均5回表が出て、±1.58回程度のばらつきが予想される。つまり「3〜7回くらいが普通」ということです。

🤔 なぜ分散は p(1-p) の形なのか?

分散の式 V = np(1-p) をよく見ると、p(1-p) という部分があります。これには深い意味があります。

p(1-p) の最大値はいつ?

p(1-p) は p = 0.5 のときに最大値 0.25 を取ります。

p1-pp(1-p)
0.10.90.09
0.30.70.21
0.50.50.25(最大)
0.70.30.21
0.90.10.09
💡 直感的な意味
成功確率が50%のとき、結果が最も「読めない」ので、ばらつき(分散)が最大になります。

逆に、p = 0.01(ほぼ失敗)や p = 0.99(ほぼ成功)のときは、結果がほぼ決まっているので、ばらつきは小さくなります。

二項分布の「形」はどう変わる?

二項分布のグラフの形は、成功確率p試行回数nによって大きく変わります。

📊 成功確率pによる形の変化

pの値分布の形イメージ
p = 0.5左右対称な山型きれいな釣鐘型。中央が最も高い。
p < 0.5
(例:p = 0.2)
右に歪んだ形成功が少ない(左側)に偏る。右に長い尾。
p > 0.5
(例:p = 0.8)
左に歪んだ形成功が多い(右側)に偏る。左に長い尾。
💡 イメージ
pが0.5から離れるほど、分布は「偏る」。成功しにくい(p小)なら成功0〜1回に集中し、成功しやすい(p大)なら成功n回近くに集中します。

📊 試行回数nによる形の変化

nの値分布の形イメージ
nが小さい
(例:n = 5)
階段状・ガタガタ棒グラフが数本だけ。離散的な印象。
nが大きい
(例:n = 100)
なめらかな山型棒グラフが密集して、正規分布に近い曲線に。
⚠️ 重要
nが大きくなると、二項分布は正規分布に近づく。これが後で学ぶ「正規近似」の根拠です。

具体例で計算してみよう

📋 例題1:コイン投げ(n=5, p=0.5)

【問題】

公正なコインを5回投げて、表がちょうど3回出る確率は?

Step 1:必要な値を確認

  • n = 5(5回投げる)
  • k = 3(表が3回)
  • p = 0.5(表が出る確率)
  • 1 - p = 0.5(裏が出る確率)

Step 2:組み合わせ 5C3 を計算

5C3 =
5!
3! × 2!
=
5 × 4 × 3 × 2 × 1
(3 × 2 × 1) × (2 × 1)
=
120
6 × 2
= 10

Step 3:確率を計算

P(X = 3) = 5C3 × p³ × (1-p)²

= 10 × (0.5)³ × (0.5)²

= 10 × 0.125 × 0.25

= 10 × 0.03125

✅ 答え
P(X = 3) = 0.3125 = 31.25%

📋 例題2:品質検査(n=50, p=0.03)

【問題】

不良率3%の製品を50個検査して、不良品が0個である確率は?

Step 1:必要な値を確認

  • n = 50(50個検査)
  • k = 0(不良品0個)
  • p = 0.03(不良率3%)
  • 1 - p = 0.97(良品率97%)

Step 2:計算

P(X = 0) = 50C0 × (0.03)⁰ × (0.97)⁵⁰

= 1 × 1 × (0.97)⁵⁰

= (0.97)⁵⁰

≈ 0.218

✅ 答え
P(X = 0) ≈ 0.218 = 21.8%
約22%の確率で「不良品ゼロ」になる
💡 品質管理での活用
この計算を逆に使うと、「不良品がX個以上出たら異常」という管理限界を設定できます。これが抜取検査の基礎です。

二項分布を正規分布で近似する

二項分布の計算は、nが大きくなると非常に面倒になります。たとえば100C47を手計算するのは大変ですよね。

しかし、ある条件を満たせば、二項分布を正規分布で近似できます。これにより計算が劇的に簡単になります。

🤔 なぜ正規分布で近似できるのか?

これは中心極限定理という統計学の最も重要な定理によります。

📐 中心極限定理(ざっくり版)
同じ分布に従う独立な確率変数をたくさん足し合わせると、その和は正規分布に近づく

二項分布は、「n回のベルヌーイ試行の」でしたよね。

つまり、nが十分大きければ、中心極限定理により正規分布に近づくのです。

✅ 正規近似が使える条件

どんなときでも近似できるわけではありません。以下の条件を満たす必要があります。

📐 正規近似の条件
np ≥ 5 かつ n(1-p) ≥ 5
(より厳密には np ≥ 10 かつ n(1-p) ≥ 10 を使うこともある)

この条件の意味

条件意味
np ≥ 5「成功」の期待回数が5回以上
n(1-p) ≥ 5「失敗」の期待回数が5回以上
💡 直感的な理解
成功も失敗も「ある程度の回数が期待できる」状態でないと、正規分布の釣鐘型にならないのです。

たとえば p = 0.01, n = 10 だと np = 0.1 となり、ほとんど成功しない極端な分布になります。これを正規分布で近似するのは無理があります。

条件を満たすかチェックする例

設定npn(1-p)近似OK?
n=100, p=0.33070✅ OK
n=50, p=0.52525✅ OK
n=20, p=0.1218❌ NG(np < 5)
n=10, p=0.555△ ギリギリ

📐 正規近似の公式

条件を満たせば、二項分布 B(n, p) は次の正規分布で近似できます。

正規近似

X 〜 B(n, p) → X ≈ N(np, np(1-p))

平均:μ = np
分散:σ² = np(1-p)

つまり、二項分布の期待値と分散を、そのまま正規分布のパラメータとして使うだけです。

連続修正(Yatesの修正)とは?(QC検定1級レベル)

正規近似を使うとき、連続修正を行うと精度が上がります。

🤔 なぜ連続修正が必要なのか?

二項分布は離散分布(0, 1, 2, 3, ...の整数値のみ)ですが、正規分布は連続分布(どんな実数も取れる)です。

この「離散→連続」の変換でズレが生じるため、±0.5の補正を行います。

📐 連続修正のルール
P(X = k) → P(k − 0.5 < Y < k + 0.5)
P(X ≤ k) → P(Y < k + 0.5)
P(X ≥ k) → P(Y > k − 0.5)

※ Y は近似した正規分布に従う確率変数
💡 イメージ
離散値「30」は、連続値では「29.5〜30.5」の区間に対応すると考えます。
階段の1段を、坂道の一定区間に置き換えるイメージです。

🧮 正規近似の計算例(連続修正あり)

【問題】

ある製品の不良率は5%である。1000個検査したとき、不良品が40個以下である確率を求めよ。

Step 1:正規近似の条件を確認

  • n = 1000, p = 0.05
  • np = 1000 × 0.05 = 50 ≥ 5 ✅
  • n(1-p) = 1000 × 0.95 = 950 ≥ 5 ✅

条件を満たすので、正規近似が使えます。

Step 2:正規分布のパラメータを計算

  • 平均:μ = np = 1000 × 0.05 = 50
  • 分散:σ² = np(1-p) = 1000 × 0.05 × 0.95 = 47.5
  • 標準偏差:σ = √47.5 ≈ 6.89

X 〜 B(1000, 0.05) ≈ N(50, 47.5)

Step 3:連続修正を適用

P(X ≤ 40) を求めたいので、連続修正により:

P(X ≤ 40) ≈ P(Y < 40.5) (0.5を足す)

Step 4:標準化してZ値を計算

Z =
40.5 − 50
6.89
=
−9.5
6.89
−1.38

Step 5:標準正規分布表から確率を読む

P(Z < −1.38) ≈ 0.0838

✅ 答え
P(X ≤ 40) ≈ 0.084 = 8.4%
1000個検査して不良品が40個以下になる確率は約8.4%
⚠️ 連続修正をしないと?
連続修正なしで計算すると:
Z = (40 − 50) / 6.89 = −1.45
P(Z < −1.45) ≈ 0.0735 = 7.4%

約1%の差が生じます。試験では連続修正が指定されることがあるので、問題文をよく確認しましょう。

まとめ:二項分布の全体像

  • 二項分布 B(n, p):「成功・失敗」をn回繰り返し、成功回数の確率を表す分布
  • 4つの条件:① 固定回数、② 独立、③ 2択、④ 成功確率一定
  • 確率公式:P(X=k) = nCk × pk × (1-p)n-k
  • 期待値:E(X) = np(「1回あたりの期待値」×「回数」)
  • 分散:V(X) = np(1-p)(p=0.5で最大)
  • 正規近似の条件:np ≥ 5 かつ n(1-p) ≥ 5
  • 連続修正:離散→連続の変換で ±0.5 の補正を行う

キーワード解説一覧

用語意味・ポイント
二項分布
B(n, p)
成功確率pの試行をn回繰り返したとき、成功回数Xが従う確率分布。Binomial Distributionの略。
ベルヌーイ試行結果が「成功」か「失敗」の2通りしかない試行。各回が独立で、成功確率が一定。
ベルヌーイ分布n=1の二項分布。1回の試行の結果(0か1)が従う分布。期待値p、分散p(1-p)。
組み合わせ
nCk
n個からk個を選ぶ方法の数。n!/(k!(n-k)!)で計算。順序は考慮しない。
正規近似nが大きいとき、二項分布をN(np, np(1-p))で近似すること。np≥5, n(1-p)≥5が条件。
連続修正
(Yatesの修正)
離散分布を連続分布で近似するとき、±0.5の補正を行うこと。近似精度が向上する。
中心極限定理独立な確率変数の和が、十分な数を足し合わせると正規分布に近づくという定理。正規近似の根拠。
離散分布確率変数が0, 1, 2, ...のような飛び飛びの値を取る分布。二項分布、ポアソン分布など。

試験で問われるポイント

⚠️ QC検定・統計検定での出題パターン
パターン1:確率の計算
「n回中k回成功する確率を求めよ」→ 公式に代入して計算

パターン2:期待値・分散の計算
「期待値と標準偏差を求めよ」→ E(X)=np, V(X)=np(1-p)

パターン3:正規近似の条件判定
「正規近似が適用できるか判定せよ」→ np≥5 かつ n(1-p)≥5 を確認

パターン4:正規近似による確率計算
「P(X≤k)を正規近似で求めよ」→ 連続修正してZ値を計算

📚 次に読むべき記事

📘 第13回:ポアソン分布とは?|「めったに起きないこと」を予測する魔法の道具 →

二項分布でnが大きくpが小さいとき、ポアソン分布で近似できます。事故件数や来客数の分析に使われる重要な分布です。

📗 第16回:【完全解説】正規分布とは?|統計の王様を初心者向けに徹底図解 →

正規近似の「近似先」である正規分布を詳しく学びましょう。統計学で最も重要な連続分布です。

📙 【完全初心者向け】抜取検査とは?|全数検査との違いと基本をゼロから図解 →

二項分布は抜取検査の基礎です。「何個中何個不良だったらNG?」を決める方法を学びましょう。

📕 【完全版】統計学の勉強ロードマップ|初心者が「データ分析」を武器にするまでの全手順 →

統計学を体系的に学びたい方はこちら。全体像から詳細まで網羅しています。

タグ

-統計学基礎