統計学基礎

中央値と最頻値とは?平均値との違いを年収の例でやさしく解説

😣 こんなふうに思っていませんか?
  • 「日本人の平均年収460万円」と聞くと、自分の周りと感覚がズレている気がする
  • 中央値・最頻値という言葉は知っているけど、平均値と何が違うのか説明できない
  • どんなときに、どの数字を使えばいいのか分からない
✅ この記事でわかること
  • 中央値と最頻値が、どんな意味なのかが一発でわかる
  • 平均値との違いを、年収や靴のサイズの例で実感できる
  • 3つの数字(平均・中央・最頻)をどう使い分けるかがわかる
✅ 結論(まず30秒でわかる答え)

中央値(ちゅうおうち)とは「データを順番に並べたときの、ど真ん中の値」、最頻値(さいひんち)とは「いちばん多く出てくる値」のことです。どちらも平均値と同じく、データの「だいたい真ん中」を表す仲間です。平均値とのいちばんの違いは、中央値と最頻値は「ずば抜けた極端な値(外れ値)」に強いこと。だから年収のように一部の大金持ちがいるデータでは、平均値より中央値のほうが実感に近くなります。

中央値とは?「ど真ん中に並んだ人」

中央値(ちゅうおうち)とは、その名のとおり「データを小さい順に並べたとき、ちょうど真ん中に来る値」のことです。英語ではメディアンとも呼ばれます。

イメージしやすいのは、背の順に並んだ列です。クラス全員が背の順に並んだとき、列の真ん中に立っている人の身長——それが中央値です。前半分(背が低い人たち)と後半分(背が高い人たち)を、ちょうど分ける境目になります。

🚶 たとえると
運動会で背の順に一列に並んだとき、いちばん前でもいちばん後ろでもなく、列のど真ん中に立っている人。その人の身長が「中央値」です。両はしに何人いても、真ん中の位置は変わりません。

つまり中央値とは、「順番に並べたときの、ど真ん中の値」だ、ということです。平均のように全部を足したりはしません。ただ並べて、真ん中を見るだけです。

中央値の求め方|「人数が奇数か偶数か」で少し変わる

中央値を求めるときに、1か所だけ注意が必要です。それは「データの個数が奇数か偶数か」で、やり方がちょっと変わること。とはいえ、どちらも簡単です。

奇数個(5人)のとき:真ん中をそのまま

テストの点数が 67, 75, 82, 88, 91 の5人だとします。小さい順に並んでいますね。5人なら、3番目の人がど真ん中です。

💡 答え
67, 75, 82, 88, 91 → 真ん中は3番目の 82点。これがそのまま中央値です。前に2人、後ろに2人で、ぴったり真ん中ですね。

偶数個(6人)のとき:真ん中2つの平均

では 67, 75, 79, 82, 88, 91 の6人だとどうでしょう。6人だと、真ん中の人が1人に決まりません。3番目と4番目の、ちょうど間が真ん中になります。

こういうときは、真ん中の2つ(79と82)を足して2で割ります。

中央値 = (79 + 82) ÷ 2 = 80.5点
⚠️ ここで間違えやすい
中央値を出す前に、必ずデータを小さい順(または大きい順)に並べ替えてください。バラバラのまま真ん中を見ても、正しい中央値にはなりません。「並べてから真ん中」が鉄則です。

つまり、奇数個なら真ん中の値そのまま、偶数個なら真ん中2つの平均。これだけ覚えれば中央値は出せる、ということです。

中央値の最大の強み「外れ値に負けない」

中央値のいちばんの魅力は、「ずば抜けた極端な値(外れ値)」に振り回されないことです。実際に計算して、平均値と比べてみましょう。

ある会社の年収データです(単位:万円)。社長だけ飛びぬけています。

📊 データ
300、350、380、400、3000(社長)

平均値を計算すると…

全部足して、人数(5)で割ります。

(300 + 350 + 380 + 400 + 3000) ÷ 5 = 4430 ÷ 5 = 886万円

平均は886万円。でも、5人中4人は400万円以下です。「平均886万円」と言われても、ほとんどの人が「自分はそんなにもらっていない」と感じますよね。

中央値を見ると…

5人なので、真ん中の3番目を見るだけ。300, 350, 380, 400, 3000 → 中央値は 380万円

💡 ここがポイント
同じデータなのに、平均886万円・中央値380万円と、こんなに差がつきました。平均は社長1人にグイッと引っ張られますが、中央値は「真ん中の人」を見るだけなので、社長がどれだけ高くても動きません。だから実感に近いのです。

つまり、一部に極端な値があるデータでは、平均値より中央値のほうが「みんなの実感」に近い、ということです。冒頭の「平均年収の違和感」も、これが正体でした。

最頻値とは?「いちばん人気の値」

最頻値(さいひんち)とは、「いちばん多く出てくる値」のことです。英語ではモードとも呼びます。多数決で1位になったもの、と考えるとわかりやすいですね。

靴屋さんで、あるモデルの靴が次のように売れたとします。

サイズ売れた数
23.5cm8足
24.0cm15足 ← 最多
24.5cm12足
25.0cm7足

いちばん売れたのは24.0cm(15足)。だから最頻値は 24.0cm です。

💡 ポイント
もし「平均サイズは24.3cm」と言われても、24.3cmの靴は売っていませんよね。仕入れで「どのサイズを多めに用意するか」を決めたいときは、平均より最頻値が役立ちます。「好きな色」のような数字でないデータでも、最頻値なら一番人気が分かります。

つまり最頻値とは、「いちばん多く出てきた値=一番人気」だ、ということです。

3つの数字の関係|データの「形」で位置が変わる

ここがこの記事でいちばん大事なところです。データの分布(散らばり方)の形によって、平均値・中央値・最頻値の位置がズレていきます。少し難しく感じても、絵をイメージすれば大丈夫です。

右にしっぽが伸びる分布(年収・貯蓄など)

年収のグラフは、ほとんどの人が左側(少ない方)に集まり、一部の大金持ちが右側にポツポツいる形になります。グラフの右側に長いしっぽが伸びたような形です。

このとき、平均値はしっぽ(大金持ち)に引っ張られて、いちばん右(高い方)に来ます。順番はこうなります。

最頻値 < 中央値 < 平均値
🎯 たとえると
綱引きを想像してください。右側に体重300kgの巨人(大金持ち)が1人いると、綱の中心(平均値)はグイッと右に引っ張られます。でも「真ん中に並んだ人(中央値)」は、巨人がいても動きません。だから平均値がいちばん右に来るのです。

左にしっぽが伸びる分布(やさしいテストなど)

逆に、簡単なテストではほとんどの人が高得点を取り、少数の人だけが低い点を取ります。今度は左側にしっぽが伸びる形。順番もさっきと逆になります。

平均値 < 中央値 < 最頻値

「平均点は取れたのに、順位は真ん中より下だった…」という経験はありませんか?これは、少数の低い点が平均を下に引っ張っているから起きる現象です。

つまり「平均値はしっぽ(極端な値)のある方向に引っ張られる」と覚えておけば、3つの順番で迷わなくなる、ということです。

結局どれを使う?かんたん使い分けガイド

3つの数字、いつどれを使えばいいのか。迷ったときの目安を表にまとめました。

数字向いている場面外れ値への強さ
平均値極端な値がない、きれいに散らばったデータ弱い(引っ張られる)
中央値年収・地価など極端な値があるデータ強い
最頻値サイズ・色・評価など「一番人気」を知りたいとき強い

練習:マンションの価格

2800万、3500万、4000万…と続く中に、1件だけ 8億円 の超高級物件があります。「一般的な価格」を知りたいとき、どれを使うべき?

✅ 正解:中央値
8億円は明らかな外れ値。平均を使うと価格が高くなりすぎて実態とズレます。こういうときは中央値が、ふつうの物件の価格をよく表してくれます。

練習:レストランの評価(★1〜5)

★1が2件、★2が5件、★3が8件、★4が25件、★5が10件。このお店の評判を伝えるなら?

✅ 正解:最頻値
「平均3.7点」と言うより、「★4をつける人が一番多い」と言ったほうが、お店の雰囲気が伝わります。一番人気を知りたいなら最頻値の出番です。

つまり、「極端な値があるなら中央値、一番人気を知りたいなら最頻値」と覚えておけば、ほとんどの場面で困らない、ということです。

「平均だけ」を信じないのが賢いデータの見方

ニュースやアンケートでは、たいてい「平均」だけが大きく報じられます。でも、平均だけを見ると、ときどき実態を見誤ります。

⚠️ 気をつけたいこと
「平均年収○○万円」という数字を見たら、心の中で「中央値はもっと低いかも?」と一歩立ち止まる。これだけで、数字にだまされにくくなります。年収のように一部の大金持ちがいるデータでは、平均は実態より高く出やすいからです。

だから、もしあなたが誰かにデータを伝える側になったときは、平均値だけでなく中央値も一緒に示すと、ぐっと信頼できる報告になります。「平均はこうですが、真ん中の人(中央値)はこのくらいです」と添えるだけで、聞き手の理解が深まります。

つまり、平均・中央・最頻の3つをセットで見るクセをつけると、データの本当の姿が見えてくる、ということです。

よくある質問

Q. 中央値と最頻値の違いは?

A. 中央値は「並べたときの真ん中の値」、最頻値は「いちばん多く出てくる値」です。どちらも外れ値に強い点が共通です。

Q. 中央値の求め方は?

A. データを小さい順に並べ、個数が奇数なら真ん中の値、偶数なら真ん中2つの平均をとります。

Q. 年収はなぜ平均より中央値がいいの?

A. 一部の大金持ちが平均を引き上げてしまうためです。中央値は真ん中の人を見るので、実感に近くなります。

Q. 最頻値はどんなときに使う?

A. 靴のサイズや好きな色など「一番人気」を知りたいときに使います。仕入れの判断などで役立ちます。

まとめ:3つの数字を使い分けよう

📌 この記事の要点
  • 中央値=並べたときの真ん中の値。外れ値に強い
  • 中央値の求め方は、奇数なら真ん中、偶数なら真ん中2つの平均
  • 最頻値=いちばん多く出てくる値(一番人気)
  • 平均値は極端な値に引っ張られる→年収などは中央値が実感に近い
  • データの形で順番が変わる(平均は「しっぽ」のある方向に引っ張られる)
  • 平均だけでなく中央値も見ると、データにだまされない

これで「代表値」と呼ばれる3つ(平均・中央・最頻)がそろいました。でも、代表値だけでは分からないことがあります。それは「データのばらつき」です。

同じ平均80点のクラスでも、「全員80点」なのか「100点と60点ばかり」なのかでは、まったく状況が違いますよね。次は、この散らばり具合を数字にする「分散」と「標準偏差」を学んでいきましょう。

S
シラス
電験三種 / QC検定1級 / パワエレ設計・品質保証 実務10年

自動車部品メーカーで電気設計・品質保証に携わってきた経験をもとに執筆しています。むずかしい専門用語をできるだけ使わず、はじめて統計を学ぶ人がつまずかないように、図とたとえで説明することを大切にしています。

📚 次に読むべき記事

📘 【完全版】統計学の勉強ロードマップ|初心者が「データ分析」を武器にするまでの全手順 →

代表値を含む統計学全体を、どの順番で学べばいいか迷わなくなる学習地図です。

📘 平均値の罠|「平均年収500万円」を信じてはいけない3つの理由 →

この記事の前編。平均値の弱点を知ると、中央値のありがたみがより深く分かります。

📘 第5回:分散と標準偏差|「バラつき」を数値化する魔法の公式 →

この記事の続き。代表値では分からない「データの散らばり」を数字にする方法です。

タグ

-統計学基礎