こんにちは、シラスです。
前回は「データの種類(尺度)」について学びました。
今回からはいよいよ、データを要約する「代表値」の世界に入ります。
その第一弾が、誰もが知っている「平均値(Mean)」です。
そう思ったあなた。実は平均値には、知らずに使うと痛い目を見る「3つの落とし穴」があります。
今日は、私たちが普段何気なく使っている「平均」の奥深い世界と、その危険な罠について解説します。
目次
1. 実は3種類ある!平均の使い分け
統計学には、主に3つの「平均」が存在します。
状況に合わせて使い分けないと、計算結果がデタラメになってしまいます。
① 算術平均(いつもの平均)
私たちが普段使っている「足して割る」平均です。
テストの点数、身長、体重など、一般的なデータに使います。
80点, 90点, 70点の平均
(80 + 90 + 70) ÷ 3 = 80点
② 幾何平均(成長率・比率)
「掛け算」の関係にあるデータに使います。
投資のリターン、成長率、インフレ率などに適しています。
1年目:+10%(1.1倍)、2年目:-5%(0.95倍)
√(1.1 × 0.95) ≒ 1.022
→ 平均成長率は +2.2%
※これを普通の平均で計算すると (10-5)÷2 = 2.5% となり、実際より良く見えてしまいます。
③ 調和平均(速度・効率)
「速度」や「効率」など、単位あたりのデータに使います。
往復の平均速度などで真価を発揮します。
行き:時速60km、帰り:時速30km
2 ÷ (1/60 + 1/30) = 時速40km
※足して2で割る(45km)と間違いです。遅い速度(30km)で走っている時間の方が長いため、平均は遅い方に引っ張られます。
2. 平均値の恐ろしさ:「大谷翔平」の衝撃
さて、ここまで3つの平均を紹介しましたが、最も一般的な「算術平均」には致命的な弱点があります。
それは、「たった1つの極端なデータ(外れ値)によって、全体が歪められてしまう」ことです。
分かりやすい例として、メジャーリーガー大谷翔平選手を輩出した「花巻東高校の同級生」を想像してみましょう。
⚾ 花巻東高校の同窓会にて
同級生10人が集まって、「平均年収」を計算したとします。
- Aくん:300万円
- Bくん:400万円
- (中略...みんな一般的な年収)
- Iくん:500万円
- そして、大谷翔平選手:150億円
クラスの平均年収
約15億円!!
「平均年収15億円のクラス」と聞くと、全員が大金持ちのように聞こえます。
しかし実態は、9割の人は年収400万円前後です。
このように、平均値は「たった1人の大スター」がいるだけで、実態とかけ離れた数字になってしまうのです。
これを「平均の罠」と言います。
まとめ:平均値だけを信じてはいけない
では、大谷選手のような外れ値がいても、クラスの「真ん中の実力」を正しく知るにはどうすればいいのでしょうか?
次回は、平均値の弱点を補う最強のパートナー、「中央値」と「最頻値」について解説します。
統計学のおすすめ書籍
統計学の「数式アレルギー」を治してくれた一冊
「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。
この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。
「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。
【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル
私がQC検定2級に合格した際、使い倒したのがこの一冊です。
この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。
解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。
