統計学基礎

第7回:確率とは何か - 基本概念を理解する

こんにちは、シラスです。

「降水確率30%」「宝くじの当選確率」「薬が効く確率80%」...
私たちは日常的に「確率」という言葉を使っていますが、実はその意味は一つではありません。

🎲 確率は統計学の「エンジン」

データ分析やAI予測の裏側では、常に確率が計算されています。
「なんとなく」使っている確率の正体を、今日はしっかりと言語化していきましょう。

1. 「確率」には3つの顔がある

実は、確率には大きく分けて3つの定義が存在します。場面によって使い分けられています。

① 古典的確率(数学的)

計算で出せる理論上の確率。


  • 例:サイコロ、トランプ
  • 条件:すべてが平等に起こる(同様に確からしい)
② 統計的確率(頻度)

過去のデータから出す確率。


  • 例:降水確率、製品の不良率
  • 条件:「100回中何回起きたか」という実績ベース
③ 主観的確率(ベイズ)

経験や信念に基づく確率。


  • 例:「あの新商品は80%売れる」
  • 条件:新しい情報が入ると更新される

2. 絶対に知っておきたい「基本ルール」

確率は必ず 0 〜 1 の間になります(0% 〜 100%)。

💡 重要な計算ルール
  • 足し算(または):A または B が起きる確率
    サイコロで1か2が出る = 1/6 + 1/6 = 2/6 (1/3)
  • 引き算(余事象):A じゃ・な・い・確率
    サイコロで1以外が出る = 1 - 1/6 = 5/6
  • 掛け算(かつ):A も B も起きる確率
    コインを2回投げて両方表 = 1/2 × 1/2 = 1/4

3. 直感を裏切る?「条件付き確率」

ここが今回の一番の山場です。
「ある条件がわかっている時に、確率がどう変わるか」という考え方です。

🤔 クイズ:病気の検査

前提:100人に1人(1%)がかかる病気があります。
この病気の検査キットは、病気の人には95%の確率で正しく「陽性」と出ますが、健康な人にも5%の確率で間違って「陽性」と出てしまいます。

質問:あなたが検査を受けて「陽性」でした。本当に病気である確率は何%?

答え:約 16.1% です。

「えっ、95%じゃないの?」と思った方、それが正常な感覚です。
しかし、そもそも病気の人が少ない(1%)ため、「健康なのに間違って陽性と言われた人」の数の方が圧倒的に多くなってしまうのです。

4. ベイズの定理:情報のアップデート

上記の「条件付き確率」を応用したのが、現代のAIやスパムメール判定に使われる「ベイズの定理」です。

ベイズ的思考のイメージ

事前の確率
(たぶんこうだ)
新しい証拠
(データ入手!)
更新された確率
(確信度が変化)

「メールに『激安』という単語がある」という証拠が見つかると、「これはスパムだ!」という確率がグンと跳ね上がる。これがベイズの仕組みです。

まとめ

3つの定義:計算(古典)、実績(統計)、信念(主観)。
基本ルール:確率は0〜1の間。足し算・掛け算で組み合わせる。
条件付き確率:「Bが起きた前提でAが起きる確率」。直感とズレやすいので注意。
ベイズの定理:新しい情報が入るたびに、確率(予測)をアップデートする考え方。

確率は、不確実な未来に対して「どれくらい信じていいか」という物差しを与えてくれます。
これが分かると、ニュースの数字や検査結果に踊らされずに冷静な判断ができるようになります。

次回は、確率を使って未来の平均を予測する「期待値(きたいち)」について学びます。
「宝くじは買うべきか?」「投資はどれくらい儲かるか?」を計算できる強力なツールです!

タグ

-統計学基礎