こんにちは、シラスです。
前回は「平均値」について学びましたが、最後に少し怖い話をしましたね。
「平均値は、たった一人の大富豪がいるだけで跳ね上がってしまう」という話です。
「日本人の平均年収は約460万円」
これを聞いて「そんなに貰ってる人、周りに多くないけど…?」と感じたことはありませんか?
その違和感は正解です。実はこの場合、平均値よりも「もっと適切な数字」があるんです。
今回は、平均値の弱点を補う最強のパートナー、「中央値」と「最頻値」について解説します。
1. 中央値(メディアン):真ん中の人
中央値とは、その名の通り「データを順に並べたとき、ど真ん中に来る値」のことです。
データ全体を「上半分」と「下半分」に分ける境界線になります。
計算方法:奇数と偶数で違う!
順に並べて…
中央値 = 82点
真ん中の数字をそのまま採用!
順に並べて…
(79 + 82) ÷ 2 = 80.5点
真ん中2つの平均をとる!
年収データ:300, 350, 380, 400, 3000(社長) 万円
・平均値:846万円(社長に引っ張られる)
・中央値:380万円(実感に近い!)
2. 最頻値(モード):一番人気
最頻値は、「最も頻繁に登場する値」です。
多数決で1位になったもの、と考えると分かりやすいですね。
例:靴のサイズ販売数
| 23.5cm | 24.0cm | 24.5cm | 25.0cm |
| 8足 | 15足 | 12足 | 7足 |
最頻値 = 24.0cm (最も売れたサイズ)
「平均サイズは24.32cmです」と言われても靴は作れませんよね。
商品の仕入れや、「好きな色」のような数字ではないデータ(名義尺度)の時は、最頻値が活躍します。
3. データの形で使い分ける!
データの分布(ヒストグラム)の形によって、平均値・中央値・最頻値の位置関係が変わります。
ここが一番重要なポイントです!
① 右に歪んだ分布(年収・貯蓄など)
少数の「超・大金持ち」が右側に長く裾を引いている状態です。
平均値が右(高い方)に引っ張られます。
この場合、実態を表すのは「中央値」や「最頻値」です。
② 左に歪んだ分布(簡単なテストなど)
みんな高得点で、少数の人だけ0点に近いような状態です。
平均値が左(低い方)に引っ張られます。
「平均点とったけど、順位は真ん中より下だった…」という現象はこれで起きます。
4. 実践:どれを使うべき?
最後に、ケーススタディで実践力をつけましょう。
まとめ
これで「代表値(平均・中央・最頻)」の3つが揃いました!
しかし、代表値だけでは分からないことがあります。
それは「データのばらつき」です。
平均点が同じ80点のクラスでも、「全員80点」なのか「100点と60点ばかり」なのかで状況は全く違いますよね。
次回は、データの散らばり具合を数値化する「分散」と「標準偏差」について解説します!
