第12回：二項分布とは？｜コイン投げで理解する「成功回数」の確率分布

😣 こんな疑問はありませんか？

「二項分布」ってどんな分布？どういうときに使うの？
公式 P(X=k) = nCk × p^k × (1-p)^(n-k) の意味がわからない…
期待値がnp、分散がnp(1-p)になるのはなぜ？
「正規分布で近似できる」ってどういう条件？

✅ この記事でわかること

二項分布の意味を「コイン投げ」で直感的に理解
確率の公式がなぜその形になるのか、一から導出
期待値np・分散np(1-p)の「なぜ」を完全解説
正規分布で近似できる条件と、連続修正の意味

「コインを10回投げて、表が何回出るか？」

「100個の製品を検査して、不良品は何個あるか？」

これらの問いに答えてくれるのが、二項分布です。

二項分布は統計学で最も重要な離散分布の一つで、品質管理、世論調査、医学研究、マーケティングなど、あらゆる分野で活用されています。

この記事では、公式を暗記するのではなく、「なぜその式になるのか」をコイン投げのイメージで徹底的に解説します。

二項分布とは？一言でいうと
- 🎯 二項分布が使える4つの条件
- 📊 二項分布の記号
二項分布の確率公式を「導出」する
期待値 E(X) = np の導出
- 🎯 直感的な理解：「1回あたりの期待値」を足す
- 🔢 厳密な導出（数学的証明）
分散 V(X) = np(1-p) の導出
- 🎯 直感的な理解：「1回あたりの分散」を足す
- 🤔 なぜ分散は p(1-p) の形なのか？
二項分布の「形」はどう変わる？
- 📊 成功確率pによる形の変化
- 📊 試行回数nによる形の変化
具体例で計算してみよう
- 📋 例題1：コイン投げ（n=5, p=0.5）
- 📋 例題2：品質検査（n=50, p=0.03）
二項分布を正規分布で近似する
連続修正（Yatesの修正）とは？(QC検定１級レベル)
- 🤔 なぜ連続修正が必要なのか？
- 🧮 正規近似の計算例（連続修正あり）
まとめ：二項分布の全体像
キーワード解説一覧
試験で問われるポイント
- 📚 次に読むべき記事

二項分布とは？一言でいうと

📐 二項分布の定義
「成功」か「失敗」の2択をn回繰り返したとき、成功がk回起きる確率を表す分布

「二項」という名前は、結果が2種類（成功・失敗）しかないことに由来します。

🎯 二項分布が使える4つの条件

二項分布は、以下の4つの条件をすべて満たす場合に使えます。

条件	説明	コイン投げの例
① 試行回数が固定	何回繰り返すかが決まっている	「10回投げる」と決めている
② 各試行が独立	1回目の結果が2回目に影響しない	1回目が表でも、2回目の確率は変わらない
③ 結果は2種類のみ	成功か失敗の2択	表（成功）か裏（失敗）
④ 成功確率が一定	毎回同じ確率	どの回も表が出る確率は50%

💡 イメージ
「同じサイコロを何度も振る」「同じ条件で何度も抽選する」ような状況が二項分布です。毎回条件が変わってしまう場合は使えません。

📊 二項分布の記号

二項分布は B(n, p) と書きます。

記号	意味	例
B	Binomial（二項）の頭文字	−
n	試行回数	コインを10回投げる → n = 10
p	1回の試行での成功確率	表が出る確率 → p = 0.5

「コインを10回投げて表の回数を数える」なら、X 〜 B(10, 0.5) と書きます。

📘 関連記事
第7回：確率とは何か - 基本概念を理解する →

二項分布の確率公式を「導出」する

いよいよ本題です。二項分布の確率公式を、「なぜその式になるのか」を理解しながら導出しましょう。

🎯 具体例：コインを3回投げて、表が2回出る確率

まず、簡単な例で考えてみましょう。

【問題】

公正なコインを3回投げて、表がちょうど2回出る確率は？

Step 1：すべてのパターンを書き出す

3回投げて「表が2回」になるパターンは、何通りあるでしょうか？

パターン	1回目	2回目	3回目	表の回数
①	表	表	裏	2回
②	表	裏	表	2回
③	裏	表	表	2回

「表が2回」のパターンは3通りありますね。

Step 2：1パターンの確率を計算

例えば「表→表→裏」というパターンが起きる確率はいくつでしょう？

各回は独立なので、掛け算で計算できます。

「表→表→裏」の確率

= （表が出る確率）×（表が出る確率）×（裏が出る確率）

= 0.5 × 0.5 × 0.5 = 0.125

他の2パターン（「表→裏→表」「裏→表→表」）も同じく0.125です。

Step 3：全パターンを足す

「表が2回」になるのは、3つのパターンのいずれかが起きればいいので、足し算です。

📐 計算結果
P(表が2回) = 0.125 + 0.125 + 0.125 = 3 × 0.125 = 0.375

つまり、37.5%の確率で「表が2回」になります。

🔍 この計算を一般化する

今の計算を振り返ると、確率は次の2つの要素の掛け算で求められました。

要素	今回の例	一般化
パターン数（何通りあるか）	3通り	_nC_k
1パターンの確率	0.5² × 0.5¹	p^k × (1-p)^n-k

📐 二項分布の確率公式（完成形）

以上をまとめると、二項分布の確率公式が導けます。

二項分布の確率公式

P(X = k) = _nC_k × p^k × (1-p)^n-k

_nC_k：n回中k回成功するパターン数（組み合わせ）
p^k：k回成功する確率
(1-p)^n-k：(n-k)回失敗する確率

🧮 組み合わせ _nC_k の計算方法

「n回中k回を選ぶ」組み合わせの数は、次の公式で計算します。

📐 組み合わせの公式

_nC_k =

k! × (n-k)!

※ n! = n × (n-1) × (n-2) × ... × 2 × 1 （nの階乗）

例：₃C₂ の計算

₃C₂ =

2! × 1!

3 × 2 × 1

2 × 1 × 1

= 3

「3回中2回を選ぶ」方法は3通り。先ほど書き出した「表表裏」「表裏表」「裏表表」の3パターンと一致しますね！

💡 公式の意味を言葉で表すと
P(X = k) = 「k回成功するパターンが何通りあるか」×「そのパターンが起きる確率」

📘 関連記事
第8回：期待値 - 確率分布の中心を知る →

期待値 E(X) = np の導出

二項分布の期待値はE(X) = npという非常にシンプルな形になります。なぜこうなるのか、直感的に理解しましょう。

🎯 直感的な理解：「1回あたりの期待値」を足す

まず、1回だけコインを投げる場合を考えます。

【1回投げの期待値】

表（成功）が出たら「1」、裏（失敗）なら「0」とカウントすると…

期待値 = 1 × p + 0 × (1-p) = p

1回投げたときの「表の期待回数」はpです（確率がそのまま期待値になる）。

これをn回繰り返すので、期待値は単純にn倍です。

📐 期待値の公式
E(X) = np
n：試行回数、p：成功確率

例：コインを10回投げる場合

n = 10、p = 0.5 のとき：

E(X) = 10 × 0.5 = 5回

「10回投げたら、平均して5回くらい表が出るだろう」という直感と一致しますね！

🔢 厳密な導出（数学的証明）

直感的な理解ができたところで、数学的にも確認しておきましょう。

【期待値の定義に従って計算】

E(X) = Σ k × P(X = k)　（k = 0, 1, 2, ..., n）

ここで、二項分布は「n回のベルヌーイ試行の和」と考えられます。

X = X₁ + X₂ + ... + Xₙ　（Xᵢは各回の結果、0か1）

期待値の加法性より：

E(X) = E(X₁) + E(X₂) + ... + E(Xₙ) = p + p + ... + p = np

分散 V(X) = np(1-p) の導出

分散も同じように、「1回あたりの分散」を足し上げることで導出できます。

🎯 直感的な理解：「1回あたりの分散」を足す

まず、1回だけコインを投げる場合の分散を計算します。

【1回投げの分散（ベルヌーイ分布）】

結果は「1（成功）」か「0（失敗）」

期待値：E(Xᵢ) = p

分散：V(Xᵢ) = E(Xᵢ²) - [E(Xᵢ)]²

　　　= (1² × p + 0² × (1-p)) - p²

　　　= p - p²

　　　= p(1 - p)

各回の試行は独立なので、分散は足し算できます（分散の加法性）。

📐 分散の公式
V(X) = np(1-p)
n：試行回数、p：成功確率、(1-p)：失敗確率

例：コインを10回投げる場合

n = 10、p = 0.5 のとき：

V(X) = 10 × 0.5 × 0.5 = 2.5

標準偏差 = √2.5 ≈ 1.58回

💡 解釈
10回投げると平均5回表が出て、±1.58回程度のばらつきが予想される。つまり「3〜7回くらいが普通」ということです。

🤔 なぜ分散は p(1-p) の形なのか？

分散の式 V = np(1-p) をよく見ると、p(1-p) という部分があります。これには深い意味があります。

p(1-p) の最大値はいつ？

p(1-p) は p = 0.5 のときに最大値 0.25 を取ります。

p	1-p	p(1-p)
0.1	0.9	0.09
0.3	0.7	0.21
0.5	0.5	0.25（最大）
0.7	0.3	0.21
0.9	0.1	0.09

💡 直感的な意味
成功確率が50%のとき、結果が最も「読めない」ので、ばらつき（分散）が最大になります。

逆に、p = 0.01（ほぼ失敗）や p = 0.99（ほぼ成功）のときは、結果がほぼ決まっているので、ばらつきは小さくなります。

二項分布の「形」はどう変わる？

二項分布のグラフの形は、成功確率pと試行回数nによって大きく変わります。

📊 成功確率pによる形の変化

pの値	分布の形	イメージ
p = 0.5	左右対称な山型	きれいな釣鐘型。中央が最も高い。
p < 0.5 （例：p = 0.2）	右に歪んだ形	成功が少ない（左側）に偏る。右に長い尾。
p > 0.5 （例：p = 0.8）	左に歪んだ形	成功が多い（右側）に偏る。左に長い尾。

💡 イメージ
pが0.5から離れるほど、分布は「偏る」。成功しにくい（p小）なら成功0〜1回に集中し、成功しやすい（p大）なら成功n回近くに集中します。

📊 試行回数nによる形の変化

nの値	分布の形	イメージ
nが小さい（例：n = 5）	階段状・ガタガタ	棒グラフが数本だけ。離散的な印象。
nが大きい（例：n = 100）	なめらかな山型	棒グラフが密集して、正規分布に近い曲線に。

⚠️ 重要
nが大きくなると、二項分布は正規分布に近づく。これが後で学ぶ「正規近似」の根拠です。

具体例で計算してみよう

📋 例題1：コイン投げ（n=5, p=0.5）

【問題】

公正なコインを5回投げて、表がちょうど3回出る確率は？

Step 1：必要な値を確認

n = 5（5回投げる）
k = 3（表が3回）
p = 0.5（表が出る確率）
1 - p = 0.5（裏が出る確率）

Step 2：組み合わせ ₅C₃ を計算

₅C₃ =

3! × 2!

5 × 4 × 3 × 2 × 1

(3 × 2 × 1) × (2 × 1)

120

6 × 2

= 10

Step 3：確率を計算

P(X = 3) = ₅C₃ × p³ × (1-p)²

= 10 × (0.5)³ × (0.5)²

= 10 × 0.125 × 0.25

= 10 × 0.03125

✅ 答え
P(X = 3) = 0.3125 = 31.25%

📋 例題2：品質検査（n=50, p=0.03）

【問題】

不良率3%の製品を50個検査して、不良品が0個である確率は？

Step 1：必要な値を確認

n = 50（50個検査）
k = 0（不良品0個）
p = 0.03（不良率3%）
1 - p = 0.97（良品率97%）

Step 2：計算

P(X = 0) = ₅₀C₀ × (0.03)⁰ × (0.97)⁵⁰

= 1 × 1 × (0.97)⁵⁰

= (0.97)⁵⁰

≈ 0.218

✅ 答え
P(X = 0) ≈ 0.218 = 21.8%
約22%の確率で「不良品ゼロ」になる

💡 品質管理での活用
この計算を逆に使うと、「不良品がX個以上出たら異常」という管理限界を設定できます。これが抜取検査の基礎です。

二項分布を正規分布で近似する

二項分布の計算は、nが大きくなると非常に面倒になります。たとえば₁₀₀C₄₇を手計算するのは大変ですよね。

しかし、ある条件を満たせば、二項分布を正規分布で近似できます。これにより計算が劇的に簡単になります。

🤔 なぜ正規分布で近似できるのか？

これは中心極限定理という統計学の最も重要な定理によります。

📐 中心極限定理（ざっくり版）
同じ分布に従う独立な確率変数をたくさん足し合わせると、その和は正規分布に近づく。

二項分布は、「n回のベルヌーイ試行の和」でしたよね。

つまり、nが十分大きければ、中心極限定理により正規分布に近づくのです。

✅ 正規近似が使える条件

どんなときでも近似できるわけではありません。以下の条件を満たす必要があります。

📐 正規近似の条件
np ≥ 5 かつ n(1-p) ≥ 5
（より厳密には np ≥ 10 かつ n(1-p) ≥ 10 を使うこともある）

この条件の意味

条件	意味
np ≥ 5	「成功」の期待回数が5回以上
n(1-p) ≥ 5	「失敗」の期待回数が5回以上

💡 直感的な理解
成功も失敗も「ある程度の回数が期待できる」状態でないと、正規分布の釣鐘型にならないのです。

たとえば p = 0.01, n = 10 だと np = 0.1 となり、ほとんど成功しない極端な分布になります。これを正規分布で近似するのは無理があります。

条件を満たすかチェックする例

設定	np	n(1-p)	近似OK？
n=100, p=0.3	30	70	✅ OK
n=50, p=0.5	25	25	✅ OK
n=20, p=0.1	2	18	❌ NG（np < 5）
n=10, p=0.5	5	5	△ ギリギリ

📐 正規近似の公式

条件を満たせば、二項分布 B(n, p) は次の正規分布で近似できます。

正規近似

X 〜 B(n, p) → X ≈ N(np, np(1-p))

平均：μ = np
分散：σ² = np(1-p)

つまり、二項分布の期待値と分散を、そのまま正規分布のパラメータとして使うだけです。

連続修正（Yatesの修正）とは？(QC検定１級レベル)

正規近似を使うとき、連続修正を行うと精度が上がります。

🤔 なぜ連続修正が必要なのか？

二項分布は離散分布（0, 1, 2, 3, ...の整数値のみ）ですが、正規分布は連続分布（どんな実数も取れる）です。

この「離散→連続」の変換でズレが生じるため、±0.5の補正を行います。

📐 連続修正のルール
P(X = k) → P(k − 0.5 < Y < k + 0.5)
P(X ≤ k) → P(Y < k + 0.5)
P(X ≥ k) → P(Y > k − 0.5)

※ Y は近似した正規分布に従う確率変数

💡 イメージ
離散値「30」は、連続値では「29.5〜30.5」の区間に対応すると考えます。
階段の1段を、坂道の一定区間に置き換えるイメージです。

🧮 正規近似の計算例（連続修正あり）

【問題】

ある製品の不良率は5%である。1000個検査したとき、不良品が40個以下である確率を求めよ。

Step 1：正規近似の条件を確認

n = 1000, p = 0.05
np = 1000 × 0.05 = 50 ≥ 5 ✅
n(1-p) = 1000 × 0.95 = 950 ≥ 5 ✅

条件を満たすので、正規近似が使えます。

Step 2：正規分布のパラメータを計算

平均：μ = np = 1000 × 0.05 = 50
分散：σ² = np(1-p) = 1000 × 0.05 × 0.95 = 47.5
標準偏差：σ = √47.5 ≈ 6.89

X 〜 B(1000, 0.05) ≈ N(50, 47.5)

Step 3：連続修正を適用

P(X ≤ 40) を求めたいので、連続修正により：

P(X ≤ 40) ≈ P(Y < 40.5)　（0.5を足す）

Step 4：標準化してZ値を計算

Z =

40.5 − 50

6.89

−9.5

6.89

≈ −1.38

Step 5：標準正規分布表から確率を読む

P(Z < −1.38) ≈ 0.0838

✅ 答え
P(X ≤ 40) ≈ 0.084 = 8.4%
1000個検査して不良品が40個以下になる確率は約8.4%

⚠️ 連続修正をしないと？
連続修正なしで計算すると：
Z = (40 − 50) / 6.89 = −1.45
P(Z < −1.45) ≈ 0.0735 = 7.4%

約1%の差が生じます。試験では連続修正が指定されることがあるので、問題文をよく確認しましょう。

まとめ：二項分布の全体像

二項分布 B(n, p)：「成功・失敗」をn回繰り返し、成功回数の確率を表す分布
4つの条件：① 固定回数、② 独立、③ 2択、④ 成功確率一定
確率公式：P(X=k) = _nC_k × p^k × (1-p)^n-k
期待値：E(X) = np（「1回あたりの期待値」×「回数」）
分散：V(X) = np(1-p)（p=0.5で最大）
正規近似の条件：np ≥ 5 かつ n(1-p) ≥ 5
連続修正：離散→連続の変換で ±0.5 の補正を行う

キーワード解説一覧

用語	意味・ポイント
二項分布 B(n, p)	成功確率pの試行をn回繰り返したとき、成功回数Xが従う確率分布。Binomial Distributionの略。
ベルヌーイ試行	結果が「成功」か「失敗」の2通りしかない試行。各回が独立で、成功確率が一定。
ベルヌーイ分布	n=1の二項分布。1回の試行の結果（0か1）が従う分布。期待値p、分散p(1-p)。
組み合わせ _nC_k	n個からk個を選ぶ方法の数。n!/(k!(n-k)!)で計算。順序は考慮しない。
正規近似	nが大きいとき、二項分布をN(np, np(1-p))で近似すること。np≥5, n(1-p)≥5が条件。
連続修正（Yatesの修正）	離散分布を連続分布で近似するとき、±0.5の補正を行うこと。近似精度が向上する。
中心極限定理	独立な確率変数の和が、十分な数を足し合わせると正規分布に近づくという定理。正規近似の根拠。
離散分布	確率変数が0, 1, 2, ...のような飛び飛びの値を取る分布。二項分布、ポアソン分布など。

試験で問われるポイント

⚠️ QC検定・統計検定での出題パターン
パターン1：確率の計算
「n回中k回成功する確率を求めよ」→ 公式に代入して計算

パターン2：期待値・分散の計算
「期待値と標準偏差を求めよ」→ E(X)=np, V(X)=np(1-p)

パターン3：正規近似の条件判定
「正規近似が適用できるか判定せよ」→ np≥5 かつ n(1-p)≥5 を確認

パターン4：正規近似による確率計算
「P(X≤k)を正規近似で求めよ」→ 連続修正してZ値を計算

📚 次に読むべき記事

📘 第13回：ポアソン分布とは？｜「めったに起きないこと」を予測する魔法の道具 →

二項分布でnが大きくpが小さいとき、ポアソン分布で近似できます。事故件数や来客数の分析に使われる重要な分布です。

📗 第16回：【完全解説】正規分布とは？｜統計の王様を初心者向けに徹底図解 →

正規近似の「近似先」である正規分布を詳しく学びましょう。統計学で最も重要な連続分布です。

📙 【完全初心者向け】抜取検査とは？｜全数検査との違いと基本をゼロから図解 →

二項分布は抜取検査の基礎です。「何個中何個不良だったらNG？」を決める方法を学びましょう。

📕 【完全版】統計学の勉強ロードマップ｜初心者が「データ分析」を武器にするまでの全手順 →

統計学を体系的に学びたい方はこちら。全体像から詳細まで網羅しています。

第12回：二項分布とは？｜コイン投げで理解する「成功回数」の確率分布

二項分布とは？一言でいうと

🎯 二項分布が使える4つの条件

📊 二項分布の記号

二項分布の確率公式を「導出」する

🎯 具体例：コインを3回投げて、表が2回出る確率

Step 1：すべてのパターンを書き出す

Step 2：1パターンの確率を計算

Step 3：全パターンを足す

🔍 この計算を一般化する

📐 二項分布の確率公式（完成形）

🧮 組み合わせ nCk の計算方法

例：3C2 の計算

期待値 E(X) = np の導出

🎯 直感的な理解：「1回あたりの期待値」を足す

例：コインを10回投げる場合

🔢 厳密な導出（数学的証明）

分散 V(X) = np(1-p) の導出

🎯 直感的な理解：「1回あたりの分散」を足す

例：コインを10回投げる場合

🤔 なぜ分散は p(1-p) の形なのか？

p(1-p) の最大値はいつ？

二項分布の「形」はどう変わる？

📊 成功確率pによる形の変化

📊 試行回数nによる形の変化

具体例で計算してみよう

📋 例題1：コイン投げ（n=5, p=0.5）

Step 1：必要な値を確認

Step 2：組み合わせ 5C3 を計算

Step 3：確率を計算

📋 例題2：品質検査（n=50, p=0.03）

Step 1：必要な値を確認

Step 2：計算

二項分布を正規分布で近似する

🤔 なぜ正規分布で近似できるのか？

✅ 正規近似が使える条件

この条件の意味

条件を満たすかチェックする例

📐 正規近似の公式

連続修正（Yatesの修正）とは？(QC検定１級レベル)

🤔 なぜ連続修正が必要なのか？

🧮 正規近似の計算例（連続修正あり）

Step 1：正規近似の条件を確認

Step 2：正規分布のパラメータを計算

Step 3：連続修正を適用

Step 4：標準化してZ値を計算

Step 5：標準正規分布表から確率を読む

まとめ：二項分布の全体像

キーワード解説一覧

試験で問われるポイント

📚 次に読むべき記事

🧮 組み合わせ _nC_k の計算方法

例：₃C₂ の計算

Step 2：組み合わせ ₅C₃ を計算