統計学基礎

第7回:確率とは何か - 基本概念を理解する

はじめに

「今日の降水確率は30%です」「宝くじで1等が当たる確率は1000万分の1」「この薬の効果がある確率は80%」...私たちは日常的に「確率」という言葉を使っていますが、実は確率には複数の定義があり、それぞれ異なる考え方に基づいているんです。

確率は統計学の土台となる重要な概念です。データ分析、予測、意思決定...すべての場面で確率的な思考が求められます。でも「確率って結局何なの?」と聞かれると、意外と答えに困ってしまう人も多いのではないでしょうか。

今日は、確率の基本的な考え方から、日常生活での応用まで、具体例を交えながら学んでいきましょう。

確率の3つの定義

1. 古典的確率(数学的確率)

古典的確率は、「すべての結果が同じように起こりやすい」場合の確率です。数学的に計算できる最もシンプルな確率の定義です。

公式

確率 = 求める事象の場合の数 ÷ すべての場合の数

身近な例:サイコロ

6の目が出る確率 = 6の出る場合の数(1) ÷ すべての場合の数(6) = 1/6
偶数の目が出る確率 = 偶数の場合の数(3) ÷ すべての場合の数(6) = 1/2

身近な例:トランプ

52枚のトランプから1枚引く場合:
スペードを引く確率 = 13/52 = 1/4
キングを引く確率 = 4/52 = 1/13
スペードのキングを引く確率 = 1/52

古典的確率が使える条件

  • すべての結果が「同様に確からしい」
  • 場合の数が有限で数えられる
  • 理論的に計算可能

2. 統計的確率(頻度確率)

統計的確率は、実際に試行を繰り返した結果から求める確率です。「長期間の頻度」として確率を定義します。

考え方

確率 = 事象が起こった回数 ÷ 試行の総回数(試行回数→∞)

身近な例:コイン投げ

コイン投げ100回の結果:
表が52回、裏が48回
→ 表の出る確率 ≈ 52/100 = 0.52

コイン投げ10,000回の結果:
表が4,998回、裏が5,002回  
→ 表の出る確率 ≈ 4,998/10,000 = 0.4998 ≈ 0.5

身近な例:不良品率

工場で製品1,000個を検査:
不良品が25個発見
→ 不良品率 = 25/1,000 = 0.025 = 2.5%

統計的確率の特徴

  • 実際のデータに基づく
  • 試行回数が多いほど正確
  • 現実的で実用的

3. 主観的確率(ベイズ確率)

主観的確率は、個人の知識や経験に基づく「信念の度合い」を表す確率です。客観的なデータが不足している場合によく使われます。

身近な例

「明日雨が降る確率は70%」
→ 気象予報士の知識と経験による判断

「この新商品が成功する確率は60%」
→ マーケティング担当者の経験による推測

「彼が試験に合格する確率は80%」
→ これまでの学習状況を見た先生の判断

主観的確率の特徴

  • 個人の知識・経験に依存
  • 新しい情報で更新される
  • 不確実な状況での意思決定に有用

3つの確率の比較

確率の種類基づくもの特徴
古典的理論・対称性サイコロ、トランプ計算可能、厳密
統計的実際のデータ不良品率、事故率実用的、客観的
主観的知識・経験天気予報、株価予測柔軟、更新可能

確率の性質と基本法則

確率の基本性質

1. 確率の範囲

0 ≤ P(A) ≤ 1

・絶対起こらない事象:P(A) = 0
・必ず起こる事象:P(A) = 1
・例:サイコロで7の目 → P = 0
・例:サイコロで1~6のいずれか → P = 1

2. 全事象の確率

すべての起こりうる事象の確率の合計 = 1

サイコロの例:
P(1) + P(2) + P(3) + P(4) + P(5) + P(6) = 1/6 × 6 = 1

3. 余事象の確率

P(Aが起こらない) = 1 - P(A)

例:サイコロで1以外が出る確率
P(1以外) = 1 - P(1) = 1 - 1/6 = 5/6

確率の加法定理

互いに排他的な事象(同時に起こらない)の場合

P(AまたはB) = P(A) + P(B)

例:サイコロで1または2が出る確率
P(1または2) = P(1) + P(2) = 1/6 + 1/6 = 1/3

一般的な場合(同時に起こる可能性がある)

P(AまたはB) = P(A) + P(B) - P(AかつB)

例:トランプでスペードまたはキングを引く確率
P(スペードまたはキング) = P(スペード) + P(キング) - P(スペードのキング)
= 13/52 + 4/52 - 1/52 = 16/52 = 4/13

確率の乗法定理

独立な事象の場合

P(AかつB) = P(A) × P(B)

例:コイン2回投げで両方とも表が出る確率
P(表かつ表) = P(表) × P(表) = 1/2 × 1/2 = 1/4

従属な事象の場合

P(AかつB) = P(A) × P(B|A)
※P(B|A)は条件付き確率(後述)

例:トランプから2枚連続でエースを引く確率(戻さない)
P(1枚目エースかつ2枚目エース) = P(1枚目エース) × P(2枚目エース|1枚目エース)
= 4/52 × 3/51 = 12/2652 = 1/221

条件付き確率の考え方

条件付き確率とは

条件付き確率は、「ある条件が与えられた下で、別の事象が起こる確率」です。P(B|A)と表記し、「Aが起こった条件の下でBが起こる確率」と読みます。

公式

P(B|A) = P(AかつB) ÷ P(A)

身近な例で理解する

例1:病気の検査

ある病気の検査について:
・病気にかかっている人:全体の1%
・検査で陽性と出る確率:病気の人で95%、健康な人で5%

質問:検査で陽性が出た人が実際に病気である確率は?

解答:
P(病気|陽性) = P(陽性かつ病気) ÷ P(陽性)

P(陽性かつ病気) = 0.01 × 0.95 = 0.0095
P(陽性) = P(陽性かつ病気) + P(陽性かつ健康)
        = 0.0095 + 0.99 × 0.05 = 0.0095 + 0.0495 = 0.059

P(病気|陽性) = 0.0095 ÷ 0.059 ≈ 0.161 = 16.1%

驚きの結果:検査で陽性が出ても、実際に病気である確率は約16%!

例2:通勤と天気

データ:
・雨の日:全体の30%
・雨の日に傘を持参:80%
・晴れの日に傘を持参:10%

質問:傘を持参した人が見かけた日が雨である確率は?

P(雨|傘) = P(傘かつ雨) ÷ P(傘)

P(傘かつ雨) = 0.3 × 0.8 = 0.24
P(傘) = P(傘かつ雨) + P(傘かつ晴れ)
      = 0.24 + 0.7 × 0.1 = 0.24 + 0.07 = 0.31

P(雨|傘) = 0.24 ÷ 0.31 ≈ 0.77 = 77%

ベイズの定理

ベイズの定理は、条件付き確率を逆転させる強力な公式です。新しい情報(証拠)を得た時に、元の信念をどう更新すべきかを教えてくれます。

公式

P(A|B) = P(B|A) × P(A) ÷ P(B)

実用例:スパムメール判定

・スパムメール:全体の40%
・「激安」という単語が含まれる確率:
  スパムメールで70%、通常メールで5%

質問:「激安」と書かれたメールがスパムである確率は?

P(スパム|激安) = P(激安|スパム) × P(スパム) ÷ P(激安)

P(激安) = P(激安|スパム) × P(スパム) + P(激安|通常) × P(通常)
        = 0.7 × 0.4 + 0.05 × 0.6 = 0.28 + 0.03 = 0.31

P(スパム|激安) = 0.7 × 0.4 ÷ 0.31 = 0.28 ÷ 0.31 ≈ 0.90 = 90%

確率の実践的応用

1. リスク評価

投資のリスク

・株価上昇の確率:60%
・上昇時の利益:+20%
・下落時の損失:-10%

期待リターン = 0.6 × 20% + 0.4 × (-10%) = 12% - 4% = 8%

2. 品質管理

検査の精度

・不良品率:2%
・検査で不良品を正しく検出:95%
・検査で良品を誤って不良品と判定:3%

実際の活用:検査結果の信頼性評価

3. 医療診断

診断の精度

・病気の有病率
・検査の感度(真陽性率)
・検査の特異度(真陰性率)

→ 検査結果の解釈に条件付き確率を使用

よくある誤解と注意点

1. 賭博者の誤謬

❌ 間違った考え:
「コインで表が5回連続で出たから、次は裏が出やすい」

✅ 正しい理解:
各回のコイン投げは独立。過去の結果は次の結果に影響しない。

2. 基準率の無視

❌ 間違った考え:
「検査の精度が95%なら、陽性の人は95%の確率で病気」

✅ 正しい理解:
病気の基準率(有病率)を考慮する必要がある。

3. 条件付き確率の混同

P(A|B) ≠ P(B|A)

例:
P(雲|雨) ≠ P(雨|雲)
雨が降っている時に雲がある確率 ≠ 雲がある時に雨が降る確率

まとめ

確率は統計学の基礎であり、日常生活の意思決定にも深く関わっています。古典的、統計的、主観的という3つの定義を理解し、条件付き確率やベイズの定理を活用することで、不確実な状況下でもより良い判断ができるようになります。

今日のポイント

✅ 3つの確率定義:古典的(理論)、統計的(頻度)、主観的(信念)
✅ 基本法則:加法定理と乗法定理で複合事象の確率を計算
✅ 条件付き確率:追加情報がある状況での確率更新
✅ ベイズの定理:新しい証拠による信念の更新
✅ 実践応用:リスク評価、品質管理、医療診断での活用

次回は「期待値」について学びます。確率分布の中心を表す重要な概念で、ギャンブルから投資まで幅広い分野で活用される実用的な統計量を詳しく解説します!

タグ

-統計学基礎