目次
はじめに
「身長を測ったら、なんで平均付近の人が多いんだろう?」「テストの点数って、いつも真ん中あたりに集中するよね」「なんで極端に高い人や低い人は少ないの?」
こんな疑問を感じたことはありませんか?実は、私たちの身の回りには「真ん中に集まって、両端は少ない」というパターンがあふれているんです。
この自然界の不思議なパターンを数学で表現したものが「正規分布」です。身長、体重、テストの点数、測定誤差...ありとあらゆるデータが正規分布に従うため、統計学では「王様」と呼ばれています。
今日は、この正規分布の魅力と実用性を、身近な例と簡単な計算で一緒に学んでいきましょう!
正規分布って何?日常で見つけよう
こんな場面で正規分布が登場します
学校生活で
📏 クラスメイトの身長:平均付近が多い、極端に高い・低い人は少ない
📝 テストの点数:真ん中の点数が多い、満点・0点は稀
⚖️ 体重測定:平均体重付近に集中
🕐 通学時間:だいたい同じくらい、極端に早い・遅いは少ない
日常生活で
🌡️ 毎日の気温:平年並みが多い、異常気象は稀
🚗 車の燃費:カタログ値付近が多い、極端に良い・悪いは少ない
💰 家計の支出:平均的な支出が多い、極端な節約・浪費は稀
📊 血圧の値:正常値付近が多い、極端に高い・低いは少ない
正規分布の特徴を日常語で表現すると
正規分布は「真ん中が一番多くて、端っこほど少ない釣鐘型」の分布です。
特徴1:「平均付近が最も多い」
例:身長170cmが平均の男性グループ
📊 170cm付近の人が最も多い
📊 160cmや180cmの人は少なめ
📊 150cmや190cmの人はかなり少ない
特徴2:「左右対称」
例:テストの平均点が70点
📊 平均より10点高い人(80点)の数
📊 平均より10点低い人(60点)の数
📊 この2つはほぼ同じ!
特徴3:「極端な値は稀」
例:平均身長170cm、標準偏差6cmの場合
📊 99.7%の人が152cm〜188cmの範囲
📊 2m超えや140cm未満は非常に稀
正規分布の基本的な計算
正規分布の基本公式
正規分布の記号
N(μ, σ²)
μ(ミュー):平均値
σ(シグマ):標準偏差
σ²:分散
例:N(170, 36) = 平均170cm、分散36(標準偏差6cm)の正規分布
基本の性質
・平均値 = 中央値 = 最頻値(すべて同じ値)
・左右完全対称
・平均から±1標準偏差に約68%のデータ
・平均から±2標準偏差に約95%のデータ
・平均から±3標準偏差に約99.7%のデータ
68-95-99.7ルール:魔法の数字
この数字を覚えれば正規分布がわかる!
正規分布では「68-95-99.7」という魔法の数字があります。これさえ覚えれば、どんな正規分布でも大体の範囲がわかります!
68-95-99.7ルールとは
68%:平均 ± 1標準偏差の範囲
95%:平均 ± 2標準偏差の範囲
99.7%:平均 ± 3標準偏差の範囲
実際に計算してみよう:身長の例
設定
👨 成人男性の身長
平均:170cm
標準偏差:6cm
ステップ1:各範囲を計算
1標準偏差の範囲:170 ± 6 = 164cm〜176cm
2標準偏差の範囲:170 ± 12 = 158cm〜182cm
3標準偏差の範囲:170 ± 18 = 152cm〜188cm
ステップ2:人数の割合を理解
| 身長の範囲 | 含まれる人の割合 | 感覚的な表現 | 具体例 |
|---|---|---|---|
| 164〜176cm | 68% | 約3人に2人 | 標準的な身長 |
| 158〜182cm | 95% | ほとんどの人 | 普通の範囲 |
| 152〜188cm | 99.7% | ほぼ全員 | 極端でない範囲 |
| 152cm未満 | 0.15% | 1000人に1.5人 | かなり低い |
| 188cm超 | 0.15% | 1000人に1.5人 | かなり高い |
実際に計算してみよう:テストの点数
設定
📝 数学のテスト結果
平均:70点
標準偏差:10点
ステップ1:各範囲を計算
1標準偏差:70 ± 10 = 60点〜80点
2標準偏差:70 ± 20 = 50点〜90点
3標準偏差:70 ± 30 = 40点〜100点
ステップ2:生徒の分布を理解
| 点数の範囲 | 生徒の割合 | クラス30人での人数 | 成績の評価 |
|---|---|---|---|
| 60〜80点 | 68% | 約20人 | 標準的 |
| 50〜90点 | 95% | 約29人 | 普通の範囲 |
| 40〜100点 | 99.7% | ほぼ全員 | 想定内 |
| 90点超 | 2.5% | 1人未満 | 優秀 |
| 50点未満 | 2.5% | 1人未満 | 要注意 |
標準化とz得点:どんな正規分布も比較できる魔法
z得点って何?
z得点は「平均からどれだけ離れているか」を標準偏差を単位として表した数値です。これを使えば、異なる正規分布同士を比較できます!
z得点の計算式
z = (データの値 - 平均) ÷ 標準偏差
例:身長180cm、平均170cm、標準偏差6cmの場合
z = (180 - 170) ÷ 6 = 10 ÷ 6 = 1.67
実際に計算してみよう:成績比較
設定
👨🎓 太郎くんの成績比較
数学:80点(平均70点、標準偏差10点)
英語:75点(平均60点、標準偏差15点)
どちらの科目の方が優秀?
ステップ1:それぞれのz得点を計算
数学のz得点:
z = (80 - 70) ÷ 10 = 1.0
英語のz得点:
z = (75 - 60) ÷ 15 = 1.0
ステップ2:結果を解釈
📊 両方ともz = 1.0
→ どちらも平均より1標準偏差上
→ どちらも同じレベルの優秀さ!
z得点の実用的な解釈表
| z得点 | 平均からの位置 | 上位からの% | 感覚的な表現 |
|---|---|---|---|
| -3 | 平均-3標準偏差 | 99.85% | 最下位レベル |
| -2 | 平均-2標準偏差 | 97.5% | かなり低い |
| -1 | 平均-1標準偏差 | 84% | やや低い |
| 0 | 平均 | 50% | 真ん中 |
| +1 | 平均+1標準偏差 | 16% | やや高い |
| +2 | 平均+2標準偏差 | 2.5% | かなり高い |
| +3 | 平均+3標準偏差 | 0.15% | トップレベル |
中心極限定理:なぜ正規分布がこんなに多いの?
中心極限定理をわかりやすく
中心極限定理とは「たくさんの要因が積み重なると、結果は正規分布になりやすい」という法則です。
身近な例で理解
📏 身長が正規分布になる理由:
・遺伝的要因(両親の身長)
・栄養状態(幼少期の食事)
・運動習慣(成長期の活動)
・睡眠時間(成長ホルモン)
・病気の有無(健康状態)
...など多数の要因が組み合わさる結果
テストの点数が正規分布になる理由
📝 数学のテスト結果:
・基礎学力(計算能力)
・理解度(概念の把握)
・勉強時間(準備期間)
・体調(当日のコンディション)
・運の要素(出題傾向との相性)
...など多数の要因が組み合わさる結果
サイコロ実験で体感してみよう
実験:サイコロを複数個振った平均
🎲 1個の場合:1,2,3,4,5,6(均等、正規分布ではない)
🎲🎲 2個の平均:
平均1.0:(1,1)だけ → 1通り
平均2.5:(1,4),(2,3),(3,2),(4,1) → 4通り
平均3.5:最も多い → 6通り
🎲🎲🎲🎲 4個の平均:
→ ほぼ正規分布の形になる!
身近な場面での正規分布活用
場面1:学校の成績管理
先生の視点
👩🏫 「クラスのテスト結果を分析したい」
平均点:75点、標準偏差:12点の場合:
68%の生徒:63〜87点(普通の成績)
95%の生徒:51〜99点(想定範囲内)
上位2.5%:87点以上(優秀)
下位2.5%:63点以下(要サポート)
実用的な活用
📊 成績評価の基準設定
📊 補習対象者の特定(下位15%など)
📊 進路指導の参考資料
📊 問題の難易度調整
場面2:品質管理の現場
工場の品質管理担当者
👨🏭 「製品の重量管理をしたい」
目標重量:100g、標準偏差:2gの場合:
合格範囲:94g〜106g(平均±3標準偏差)
→ 99.7%の製品が合格
→ 0.3%の製品が不良品
管理限界:96g〜104g(平均±2標準偏差)
→ この範囲を外れたら工程調整
場面3:医療現場での判定
健康診断での活用
👩⚕️ 「血圧の正常範囲を知りたい」
収縮期血圧の平均:120mmHg、標準偏差:15mmHgの場合:
正常範囲(68%):105〜135mmHg
注意範囲(95%):90〜150mmHg
要治療(上位2.5%):150mmHg超
低血圧(下位2.5%):90mmHg未満
電卓での実用計算
z得点の計算練習
例題1:偏差値の計算
📝 模試の結果
自分の点数:80点
平均点:65点
標準偏差:10点
z得点 = (80 - 65) ÷ 10 = 1.5
偏差値 = 50 + 10 × 1.5 = 65
→ 偏差値65!
例題2:身長の相対位置
📏 自分の身長:175cm
平均身長:170cm
標準偏差:6cm
z得点 = (175 - 170) ÷ 6 = 0.83
→ 平均より0.83標準偏差高い
→ 上位約20%の身長
範囲計算の練習
例題:製品の合格率
🏭 製品の重量
平均:500g、標準偏差:20g
合格範囲:460g〜540g
合格範囲をz得点で表すと:
下限:(460 - 500) ÷ 20 = -2
上限:(540 - 500) ÷ 20 = +2
→ 平均±2標準偏差の範囲
→ 95%の製品が合格
→ 5%の製品が不良品
正規分布を使った予測
予測の実例:売上予測
設定
🏪 コンビニの1日の売上
平均:50万円、標準偏差:8万円
予測計算
売上40万円以下の確率:
z = (40 - 50) ÷ 8 = -1.25
→ 約10%の確率
売上60万円以上の確率:
z = (60 - 50) ÷ 8 = 1.25
→ 約10%の確率
売上34万円以下の確率:
z = (34 - 50) ÷ 8 = -2
→ 約2.5%の確率(かなり珍しい)
まとめ:正規分布は統計の王様
正規分布は「68-95-99.7ルール」と「z得点の計算」さえマスターすれば、日常の様々な場面で活用できます。テストの成績から品質管理まで、データの「普通」と「異常」を判断する強力なツールです。
今日のポイント
🎯 重要な公式
✅ z得点 = (データ - 平均) ÷ 標準偏差
✅ 68%:平均 ± 1標準偏差
✅ 95%:平均 ± 2標準偏差
✅ 99.7%:平均 ± 3標準偏差
🔍 実用的な活用法
✅ 成績の相対評価(偏差値計算)
✅ 品質管理の基準設定
✅ 異常値の検出
✅ 予測と計画立案
✅ リスク評価
💡 覚えておくべきz得点
✅ z = ±1 → 上位・下位約15%
✅ z = ±2 → 上位・下位約2.5%
✅ z = ±3 → 上位・下位約0.15%
次回は「t分布」について学びます。正規分布の弟分のような分布で、少ないデータで分析する時の救世主です。正規分布との違いと使い分けを、身近な例で分かりやすく解説します!