検定・推定

母不適合数の区間推定とは?ポアソン分布なのに「カイ二乗」を使う理由

こんにちは、シラスです。

これまで、キズの数や事故件数などの「不適合数(ポアソン分布)」について、Z検定(正規分布)を使って検定してきました。

しかし、いざ「来月の事故件数は、何件〜何件の間になるか?」を予測しようとすると、統計学の教科書には奇妙なことが書かれています。

🤔 謎のルール

「不適合数の区間推定には、カイ二乗分布 ($\chi^2$) を使いなさい」

「えっ? カイ二乗って『バラつき(分散)』を見るための分布だよね? なんで『回数』の予測に出てくるの?」

多くの人がここで混乱します。
今日は、この統計学のミステリーを解き明かしつつ、ポアソン分布の信頼区間を計算する手順を解説します。

1. なぜ「カイ二乗分布」が登場するのか?

結論から言うと、「ポアソン分布とカイ二乗分布は、実は親戚(数学的に同じ形)」だからです。

少しイメージの話をしましょう。

  • ポアソン分布: 「ランダムに発生するイベント(事故など)の回数」を表す。
  • カイ二乗分布: 「ランダムなズレ(標準正規分布)を二乗して足し合わせたもの」を表す。

実は、ポアソン過程(ランダムな発生)における「イベントが発生するまでの待ち時間」は指数分布に従い、それを積み重ねていくとガンマ分布になり…と数式変換していくと、最終的に「自由度 $2\lambda$ のカイ二乗分布」と同じ形になることが証明されているのです。

💡 覚えるべきこと

理屈は難しいですが、実務で覚えるべきルールは1つだけです。
「回数($c$)を2倍すると、カイ二乗分布の自由度として使える!」

2. 計算式:回数を「2倍」して表を引く

母不適合数 $\lambda$ の信頼区間を求める公式は、以下の通りです。

$$ \frac{1}{2} \chi^2(\phi_L, 0.975) \le \lambda \le \frac{1}{2} \chi^2(\phi_U, 0.025) $$

何やら複雑そうですが、ポイントは「自由度($\phi$)の決め方」だけです。

  • 下限の自由度 $\phi_L$: $2 \times c$
  • 上限の自由度 $\phi_U$: $2 \times (c+1)$

「観測した回数($c$)を2倍する」。
そして、表から読み取ったカイ二乗値を「半分($1/2$)にする」。
これだけで、真の発生数($\lambda$)の範囲が求まります。

3. 実践:事故件数のリスク予測

具体的なデータで計算してみましょう。

🏭 ケーススタディ

ある工場で、先月の労働災害(ヒヤリハット含む)は $c = 4$ 件 でした。

「この工場の潜在的な事故発生率(母不適合数 $\lambda$)は、95%の確率で何件〜何件の間にあるか?」

ステップ1:自由度を決める

観測数 $c=4$ なので、

  • 下限用: $\phi_L = 2 \times 4 = \mathbf{8}$
  • 上限用: $\phi_U = 2 \times (4+1) = \mathbf{10}$

ステップ2:カイ二乗分布表を見る

95%信頼区間なので、分布表の「右側2.5%(0.025)」と「左側97.5%(0.975)」の値を探します。

  • 下限用(自由度8, 左側): $\chi^2(8, 0.975) = \mathbf{2.18}$
  • 上限用(自由度10, 右側): $\chi^2(10, 0.025) = \mathbf{20.48}$
[Image of F distribution probability density function curve]

ステップ3:半分にして範囲を出す

最後に、表の値を2で割ります。

  • 下限: $2.18 \div 2 = \mathbf{1.09}$
  • 上限: $20.48 \div 2 = \mathbf{10.24}$

答え: $1.09 \le \lambda \le 10.24$

4. 結果の解釈:「たまたま4件」の裏側

この結果は、恐ろしい事実を示唆しています。

「先月はたまたま4件で済んだけど、この工場の実力値(リスク)としては、最大で月10件ペースで事故が起きてもおかしくない状態だよ」

たった4件のデータからでも、カイ二乗分布を使うことで、これだけ幅を持った(安全サイドの)リスク評価ができるのです。

特に、発生数が少ない($c=0$や$1$)の時ほど、この区間推定は威力を発揮します。
「0件だったからヨシ!」ではなく、「上限値は3.7件だから油断するな!」と言えるようになるからです。

まとめ

不適合数(回数)の区間推定には、カイ二乗分布を使う。
✅ 自由度は、観測数 $c$ を2倍して決める(上限は $+1$ して2倍)。
✅ 表の値を半分にすると、信頼区間になる。

これで「計数値(比率・回数)」の検定・推定シリーズは全て完了です。

  • 比率(%)なら正規分布。
  • 回数(個)ならポアソン分布(推定はカイ二乗)。

この使い分けができれば、QC検定や実務のデータ分析で迷うことはもうありません。

統計学のおすすめ書籍

統計学の「数式アレルギー」を治してくれた一冊

「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。

この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。

「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。

¥2,420 (2025/11/23 09:57時点 | Amazon調べ)

【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル

私がQC検定2級に合格した際、使い倒したのがこの一冊です。

この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。

解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。

タグ

-検定・推定
-