統計学基礎

第13回:ポアソン分布 - 稀な事象をモデル化する

はじめに

「1時間に店に来るお客さんは何人か?」「1日に発生する交通事故は何件か?」「1分間に検出される放射線の数は?」...これらはすべて「一定時間内に稀な事象が何回起こるか」を扱う問題です。

このような状況を数学的にモデル化したものが「ポアソン分布」です。19世紀のフランスの数学者シメオン・ドニ・ポアソンにちなんで名付けられたこの分布は、稀な事象の発生を予測・分析する強力なツールとして、現代でも幅広く活用されています。

今日は、ポアソン分布の基本的な性質から実際の応用例、そして二項分布との深い関係まで、具体例を交えながら詳しく学んでいきましょう。

ポアソン分布の特徴とパラメータ

ポアソン分布が適用される条件

ポアソン分布は、以下の条件を満たす事象に適用できます:

1. 稀な事象

例:交通事故、機器の故障、突然変異
→ 個々の発生確率は非常に小さい

2. 一定の時間・空間・面積内での発生

例:1時間あたり、1日あたり、1平方メートルあたり
→ 観測期間・範囲が明確に定義されている

3. 事象の独立性

例:1件目の事故が2件目の事故の発生に影響しない
→ 各事象は互いに独立

4. 平均発生率が一定

例:平日の昼間は平均して1時間に3件の事故
→ 時期や条件によって平均発生率は変わらない

ポアソン分布の定義

ポアソン分布 Po(λ)は、平均発生率λの下で、一定期間内にちょうどk回事象が起こる確率を表す分布です。

確率質量関数

P(X = k) = (λ^k × e^(-λ)) / k!

X:発生回数(確率変数)
λ:平均発生率(パラメータ)
k:実際の発生回数(0, 1, 2, 3, ...)
e:自然対数の底(≈2.718)

ポアソン分布の基本性質

期待値と分散

E(X) = λ
V(X) = λ

特徴:期待値と分散が等しい!

確率の計算例

λ = 2(平均2回発生)の場合:

P(X = 0) = (2⁰ × e^(-2)) / 0! = e^(-2) ≈ 0.135 = 13.5%
P(X = 1) = (2¹ × e^(-2)) / 1! = 2e^(-2) ≈ 0.271 = 27.1%
P(X = 2) = (2² × e^(-2)) / 2! = 2e^(-2) ≈ 0.271 = 27.1%
P(X = 3) = (2³ × e^(-2)) / 3! = (8/6)e^(-2) ≈ 0.180 = 18.0%

二項分布からの極限として

ポアソン分布の導出

ポアソン分布は、二項分布B(n,p)において「nが非常に大きく、pが非常に小さく、npが一定値λに収束する」極限として得られます。

極限の条件

n → ∞(試行回数を無限に増やす)
p → 0(成功確率を0に近づける)  
np → λ(一定値)を保つ

この時:B(n,p) → Po(λ)

直感的な理解

二項分布の設定

・1時間を3600秒に分割(n = 3600)
・各1秒間で事故が起こる確率:p = λ/3600
・1時間での平均事故件数:np = λ

→ 1秒をさらに細かく分割すると...
→ ポアソン分布に収束

近似の精度

近似が有効な条件

n ≥ 20, p ≤ 0.05, np < 5

この条件下で:B(n,p) ≈ Po(np)

数値例での確認

B(100, 0.02) と Po(2) の比較:

P(X = 0):
二項分布:(0.98)^100 ≈ 0.133
ポアソン分布:e^(-2) ≈ 0.135

P(X = 1):  
二項分布:100 × 0.02 × (0.98)^99 ≈ 0.271
ポアソン分布:2e^(-2) ≈ 0.271

→ 非常に良い近似!

身近なポアソン分布の例

例1:交通事故件数

設定

ある交差点での1日あたりの事故件数
過去のデータから平均1.5件/日
X ~ Po(1.5)

基本統計量

期待値:E(X) = 1.5件/日
分散:V(X) = 1.5
標準偏差:SD(X) = √1.5 ≈ 1.22件

具体的な確率

1日に事故が0件の確率:
P(X = 0) = e^(-1.5) ≈ 0.223 = 22.3%

1日に事故が1件の確率:
P(X = 1) = 1.5 × e^(-1.5) ≈ 0.335 = 33.5%

1日に3件以上の確率:
P(X ≥ 3) = 1 - P(X ≤ 2)
         = 1 - [P(X=0) + P(X=1) + P(X=2)]
         ≈ 1 - (0.223 + 0.335 + 0.251)
         ≈ 0.191 = 19.1%

安全対策の評価

対策実施後、1ヶ月で5件の事故が発生
期待値:1.5 × 30 = 45件
実際:5件

→ 大幅な改善効果が確認できる

例2:コールセンターへの問い合わせ

設定

平日10-11時の問い合わせ件数
平均12件/時間
X ~ Po(12)

スタッフ配置の計算

期待値:12件/時間
標準偏差:√12 ≈ 3.46件

95%信頼区間(±2標準偏差):
12 ± 2 × 3.46 = 12 ± 6.92
→ 約5~19件の範囲

→ 20件/時間の処理能力があれば安全

具体的な確率計算

15件以上の問い合わせがある確率:
P(X ≥ 15) = 1 - P(X ≤ 14)

正規近似を使用:X ~ N(12, 12)
Z = (14.5 - 12) / √12 = 0.72
P(Z ≤ 0.72) ≈ 0.764
P(X ≥ 15) ≈ 1 - 0.764 = 0.236 = 23.6%

例3:放射線検出

設定

放射線検出器での1分間あたりの検出数
バックグラウンド:平均20カウント/分
X ~ Po(20)

異常検知の基準

期待値:20カウント/分
標準偏差:√20 ≈ 4.47カウント

通常範囲(99.7%信頼区間):
20 ± 3 × 4.47 = 20 ± 13.4
→ 7~33カウントが正常範囲

35カウント以上 → 異常の可能性

検出感度の計算

真の線源がある場合:λ = 25カウント/分
35カウント以上で異常と判定する場合の検出率:

P(X ≥ 35 | λ = 25) = ?

正規近似:X ~ N(25, 25)
Z = (34.5 - 25) / 5 = 1.9
P(Z ≥ 1.9) ≈ 0.029 = 2.9%

→ 検出感度が低い。基準を下げる必要がある

ポアソン過程との関係

ポアソン過程とは

ポアソン過程は、時間の経過とともに事象がランダムに発生する確率過程です。ポアソン分布は、ポアソン過程の一定時間内での事象発生回数を表します。

ポアソン過程の性質

1. 事象の発生は独立
2. 平均発生率λは一定
3. 同時発生の確率は0
4. 任意の時間間隔での発生数はポアソン分布に従う

指数分布との関係

事象間の時間間隔

ポアソン過程で事象が発生する時間間隔は指数分布に従う

事象発生率:λ件/時間
次の事象までの時間:T ~ Exp(λ)

E(T) = 1/λ 時間

具体例:バス停での待ち時間

バスの到着:平均6台/時間(λ = 6)
次のバスまでの待ち時間:T ~ Exp(6)

平均待ち時間:E(T) = 1/6 時間 = 10分

重ね合わせの性質

独立なポアソン過程の合成

X₁ ~ Po(λ₁), X₂ ~ Po(λ₂) が独立の場合:
X₁ + X₂ ~ Po(λ₁ + λ₂)

例:
・平日の事故:X₁ ~ Po(2)
・休日の事故:X₂ ~ Po(1.5)
・全体の事故:X₁ + X₂ ~ Po(3.5)

ポアソン分布の実践的活用

1. 在庫管理

需要予測

日用品の1日あたり需要:λ = 8個
安全在庫の設定:

95%の確率で需要を満たす在庫レベル:
P(X ≤ k) = 0.95 となるkを求める

正規近似:X ~ N(8, 8)
Z = (k + 0.5 - 8) / √8 = 1.645
k ≈ 8 + 1.645 × 2.83 - 0.5 ≈ 12個

→ 12個の在庫があれば95%安全

2. ネットワーク設計

パケット到着のモデル化

Webサーバーへの1秒あたりのリクエスト数:λ = 50
処理能力:60リクエスト/秒

待ち行列が発生する確率:
P(X > 60) ≈ P(Z > (60.5-50)/√50) = P(Z > 1.48) ≈ 0.07

→ 約7%の時間で待ち行列が発生

3. 品質管理

欠陥発生のモニタリング

製造工程での1日あたりの欠陥数:通常λ = 3
管理限界:99%信頼区間の上限

上限値:λ + 3√λ = 3 + 3√3 ≈ 8.2件

1日に9件以上の欠陥 → 工程異常の疑い

ポアソン分布の近似と限界

正規近似

大きなλに対する近似

λ ≥ 10 の場合:Po(λ) ≈ N(λ, λ)

連続性補正:
P(X = k) ≈ P(k-0.5 < Z < k+0.5)
P(X ≤ k) ≈ P(Z ≤ k+0.5)

適用の限界

仮定が成り立たない場合

1. 事象が独立でない
   例:感染症の拡大(伝染性あり)

2. 発生率が一定でない  
   例:時間帯による変動がある交通事故

3. 同時発生がある
   例:地震とその余震

→ より複雑なモデルが必要

まとめ

ポアソン分布は、稀な事象の発生回数をモデル化する基本的な分布です。パラメータλ一つで期待値と分散が決まる単純さと、二項分布からの自然な導出により、現実の多くの現象を効果的に分析できます。

今日のポイント

✅ 適用条件:稀な事象、独立性、一定発生率、明確な期間・範囲
✅ 基本性質:期待値=分散=λの特殊な性質
✅ 二項分布との関係:n→∞, p→0, np→λの極限
✅ 実践例:事故分析、需要予測、品質管理、ネットワーク設計
✅ ポアソン過程:時間発展を含む確率過程との深い関係

次回は「幾何分布」について学びます。「初回成功までの試行回数」をモデル化する分布で、待ち時間分析や信頼性工学で重要な役割を果たす分布を詳しく解説します!

タグ

-統計学基礎