統計学基礎

第16回:正規分布 - 統計の王様

はじめに

「身長を測ったら、なんで平均付近の人が多いんだろう?」「テストの点数って、いつも真ん中あたりに集中するよね」「なんで極端に高い人や低い人は少ないの?」

こんな疑問を感じたことはありませんか?実は、私たちの身の回りには「真ん中に集まって、両端は少ない」というパターンがあふれているんです。

この自然界の不思議なパターンを数学で表現したものが「正規分布」です。身長、体重、テストの点数、測定誤差...ありとあらゆるデータが正規分布に従うため、統計学では「王様」と呼ばれています。

今日は、この正規分布の魅力と実用性を、身近な例と簡単な計算で一緒に学んでいきましょう!

正規分布って何?日常で見つけよう

こんな場面で正規分布が登場します

学校生活で

📏 クラスメイトの身長:平均付近が多い、極端に高い・低い人は少ない
📝 テストの点数:真ん中の点数が多い、満点・0点は稀
⚖️ 体重測定:平均体重付近に集中
🕐 通学時間:だいたい同じくらい、極端に早い・遅いは少ない

日常生活で

🌡️ 毎日の気温:平年並みが多い、異常気象は稀
🚗 車の燃費:カタログ値付近が多い、極端に良い・悪いは少ない
💰 家計の支出:平均的な支出が多い、極端な節約・浪費は稀
📊 血圧の値:正常値付近が多い、極端に高い・低いは少ない

正規分布の特徴を日常語で表現すると

正規分布は「真ん中が一番多くて、端っこほど少ない釣鐘型」の分布です。

特徴1:「平均付近が最も多い」

例:身長170cmが平均の男性グループ
📊 170cm付近の人が最も多い
📊 160cmや180cmの人は少なめ
📊 150cmや190cmの人はかなり少ない

特徴2:「左右対称」

例:テストの平均点が70点
📊 平均より10点高い人(80点)の数
📊 平均より10点低い人(60点)の数
📊 この2つはほぼ同じ!

特徴3:「極端な値は稀」

例:平均身長170cm、標準偏差6cmの場合
📊 99.7%の人が152cm〜188cmの範囲
📊 2m超えや140cm未満は非常に稀

正規分布の基本的な計算

正規分布の基本公式

正規分布の記号

N(μ, σ²)

μ(ミュー):平均値
σ(シグマ):標準偏差
σ²:分散

例:N(170, 36) = 平均170cm、分散36(標準偏差6cm)の正規分布

基本の性質

・平均値 = 中央値 = 最頻値(すべて同じ値)
・左右完全対称
・平均から±1標準偏差に約68%のデータ
・平均から±2標準偏差に約95%のデータ
・平均から±3標準偏差に約99.7%のデータ

68-95-99.7ルール:魔法の数字

この数字を覚えれば正規分布がわかる!

正規分布では「68-95-99.7」という魔法の数字があります。これさえ覚えれば、どんな正規分布でも大体の範囲がわかります!

68-95-99.7ルールとは

68%:平均 ± 1標準偏差の範囲
95%:平均 ± 2標準偏差の範囲
99.7%:平均 ± 3標準偏差の範囲

実際に計算してみよう:身長の例

設定

👨 成人男性の身長
平均:170cm
標準偏差:6cm

ステップ1:各範囲を計算

1標準偏差の範囲:170 ± 6 = 164cm〜176cm
2標準偏差の範囲:170 ± 12 = 158cm〜182cm  
3標準偏差の範囲:170 ± 18 = 152cm〜188cm

ステップ2:人数の割合を理解

身長の範囲含まれる人の割合感覚的な表現具体例
164〜176cm68%約3人に2人標準的な身長
158〜182cm95%ほとんどの人普通の範囲
152〜188cm99.7%ほぼ全員極端でない範囲
152cm未満0.15%1000人に1.5人かなり低い
188cm超0.15%1000人に1.5人かなり高い

実際に計算してみよう:テストの点数

設定

📝 数学のテスト結果
平均:70点
標準偏差:10点

ステップ1:各範囲を計算

1標準偏差:70 ± 10 = 60点〜80点
2標準偏差:70 ± 20 = 50点〜90点
3標準偏差:70 ± 30 = 40点〜100点

ステップ2:生徒の分布を理解

点数の範囲生徒の割合クラス30人での人数成績の評価
60〜80点68%約20人標準的
50〜90点95%約29人普通の範囲
40〜100点99.7%ほぼ全員想定内
90点超2.5%1人未満優秀
50点未満2.5%1人未満要注意

標準化とz得点:どんな正規分布も比較できる魔法

z得点って何?

z得点は「平均からどれだけ離れているか」を標準偏差を単位として表した数値です。これを使えば、異なる正規分布同士を比較できます!

z得点の計算式

z = (データの値 - 平均) ÷ 標準偏差

例:身長180cm、平均170cm、標準偏差6cmの場合
z = (180 - 170) ÷ 6 = 10 ÷ 6 = 1.67

実際に計算してみよう:成績比較

設定

👨‍🎓 太郎くんの成績比較
数学:80点(平均70点、標準偏差10点)
英語:75点(平均60点、標準偏差15点)

どちらの科目の方が優秀?

ステップ1:それぞれのz得点を計算

数学のz得点:
z = (80 - 70) ÷ 10 = 1.0

英語のz得点:
z = (75 - 60) ÷ 15 = 1.0

ステップ2:結果を解釈

📊 両方ともz = 1.0
→ どちらも平均より1標準偏差上
→ どちらも同じレベルの優秀さ!

z得点の実用的な解釈表

z得点平均からの位置上位からの%感覚的な表現
-3平均-3標準偏差99.85%最下位レベル
-2平均-2標準偏差97.5%かなり低い
-1平均-1標準偏差84%やや低い
0平均50%真ん中
+1平均+1標準偏差16%やや高い
+2平均+2標準偏差2.5%かなり高い
+3平均+3標準偏差0.15%トップレベル

中心極限定理:なぜ正規分布がこんなに多いの?

中心極限定理をわかりやすく

中心極限定理とは「たくさんの要因が積み重なると、結果は正規分布になりやすい」という法則です。

身近な例で理解

📏 身長が正規分布になる理由:
・遺伝的要因(両親の身長)
・栄養状態(幼少期の食事)
・運動習慣(成長期の活動)
・睡眠時間(成長ホルモン)
・病気の有無(健康状態)
...など多数の要因が組み合わさる結果

テストの点数が正規分布になる理由

📝 数学のテスト結果:
・基礎学力(計算能力)
・理解度(概念の把握)
・勉強時間(準備期間)
・体調(当日のコンディション)
・運の要素(出題傾向との相性)
...など多数の要因が組み合わさる結果

サイコロ実験で体感してみよう

実験:サイコロを複数個振った平均

🎲 1個の場合:1,2,3,4,5,6(均等、正規分布ではない)

🎲🎲 2個の平均:
平均1.0:(1,1)だけ → 1通り
平均2.5:(1,4),(2,3),(3,2),(4,1) → 4通り  
平均3.5:最も多い → 6通り

🎲🎲🎲🎲 4個の平均:
→ ほぼ正規分布の形になる!

身近な場面での正規分布活用

場面1:学校の成績管理

先生の視点

👩‍🏫 「クラスのテスト結果を分析したい」

平均点:75点、標準偏差:12点の場合:

68%の生徒:63〜87点(普通の成績)
95%の生徒:51〜99点(想定範囲内)
上位2.5%:87点以上(優秀)
下位2.5%:63点以下(要サポート)

実用的な活用

📊 成績評価の基準設定
📊 補習対象者の特定(下位15%など)
📊 進路指導の参考資料
📊 問題の難易度調整

場面2:品質管理の現場

工場の品質管理担当者

👨‍🏭 「製品の重量管理をしたい」

目標重量:100g、標準偏差:2gの場合:

合格範囲:94g〜106g(平均±3標準偏差)
→ 99.7%の製品が合格
→ 0.3%の製品が不良品

管理限界:96g〜104g(平均±2標準偏差)
→ この範囲を外れたら工程調整

場面3:医療現場での判定

健康診断での活用

👩‍⚕️ 「血圧の正常範囲を知りたい」

収縮期血圧の平均:120mmHg、標準偏差:15mmHgの場合:

正常範囲(68%):105〜135mmHg
注意範囲(95%):90〜150mmHg
要治療(上位2.5%):150mmHg超
低血圧(下位2.5%):90mmHg未満

電卓での実用計算

z得点の計算練習

例題1:偏差値の計算

📝 模試の結果
自分の点数:80点
平均点:65点  
標準偏差:10点

z得点 = (80 - 65) ÷ 10 = 1.5
偏差値 = 50 + 10 × 1.5 = 65

→ 偏差値65!

例題2:身長の相対位置

📏 自分の身長:175cm
平均身長:170cm
標準偏差:6cm

z得点 = (175 - 170) ÷ 6 = 0.83

→ 平均より0.83標準偏差高い
→ 上位約20%の身長

範囲計算の練習

例題:製品の合格率

🏭 製品の重量
平均:500g、標準偏差:20g
合格範囲:460g〜540g

合格範囲をz得点で表すと:
下限:(460 - 500) ÷ 20 = -2
上限:(540 - 500) ÷ 20 = +2

→ 平均±2標準偏差の範囲
→ 95%の製品が合格
→ 5%の製品が不良品

正規分布を使った予測

予測の実例:売上予測

設定

🏪 コンビニの1日の売上
平均:50万円、標準偏差:8万円

予測計算

売上40万円以下の確率:
z = (40 - 50) ÷ 8 = -1.25
→ 約10%の確率

売上60万円以上の確率:
z = (60 - 50) ÷ 8 = 1.25  
→ 約10%の確率

売上34万円以下の確率:
z = (34 - 50) ÷ 8 = -2
→ 約2.5%の確率(かなり珍しい)

まとめ:正規分布は統計の王様

正規分布は「68-95-99.7ルール」と「z得点の計算」さえマスターすれば、日常の様々な場面で活用できます。テストの成績から品質管理まで、データの「普通」と「異常」を判断する強力なツールです。

今日のポイント

🎯 重要な公式

✅ z得点 = (データ - 平均) ÷ 標準偏差
✅ 68%:平均 ± 1標準偏差
✅ 95%:平均 ± 2標準偏差  
✅ 99.7%:平均 ± 3標準偏差

🔍 実用的な活用法

✅ 成績の相対評価(偏差値計算)
✅ 品質管理の基準設定  
✅ 異常値の検出
✅ 予測と計画立案
✅ リスク評価

💡 覚えておくべきz得点

✅ z = ±1 → 上位・下位約15%
✅ z = ±2 → 上位・下位約2.5%
✅ z = ±3 → 上位・下位約0.15%

次回は「t分布」について学びます。正規分布の弟分のような分布で、少ないデータで分析する時の救世主です。正規分布との違いと使い分けを、身近な例で分かりやすく解説します!

タグ

-統計学基礎