統計学基礎

平均値の奥深い世界平均値の罠|「平均年収500万円」を信じてはいけない3つの理由

山田課長から「先月のライン不良率の平均出しといて」と言われた。Excelで =AVERAGE() を叩いて「2.3%です」と報告したら、「で、実態はどうなの?」と聞き返された。

…平均、出したんですけど。何がダメだったんでしょう?

😣 こんな経験はありませんか?
  • 「平均値」を出して報告したのに、上司に「実態と違うよね」と返された
  • ニュースの「平均年収」「平均貯蓄額」を見て、自分が異常に低い気がして落ち込む
  • ExcelのAVERAGE関数は使えるけど、それが何を意味しているか自信がない
  • 「平均」「中央値」「最頻値」の使い分けを後輩に聞かれて、しどろもどろになった
✅ この記事でわかること
  • 平均値が「実態」を表さないことがある、その具体的な3つの理由
  • 「算術平均」「幾何平均」「調和平均」の使い分け(往復速度の罠)
  • 明日から「平均値だけで判断しない」ためのチェックリスト

結論を先に言います。平均値は便利すぎるがゆえに、信じすぎると実態を見誤る危険な指標です。テレビも新聞も会社も、なんでもかんでも「平均」で語ろうとします。でも、平均だけを見て判断するのは、霧の中で運転するのと同じくらい危険です。

この記事を読み終わる頃には、「平均◯◯」というニュースを見たときに「で、中央値は?」と冷静にツッコめるようになります。

1. そもそも平均値とは?「真ん中っぽい1つの数字」

平均値(Mean)とは、ひと言でいうと 「全部足して、個数で割った数字」 です。小学校で習ったあれです。

📐 平均値の計算式
平均値 = データの合計 ÷ データの個数

たとえば3人のテストの点数が 80点・90点・70点 だったとき、平均は (80 + 90 + 70) ÷ 3 = 80点 ですね。

平均値の役割は、「バラバラのデータを、たった1つの数字に圧縮する」ことです。3人なら全員の点数を覚えられますが、これが300人だったら?平均1つで「だいたいどんな集団か」がイメージできる。これが平均値の便利なところです。

💡 平均値の本質
平均値は「データの重心(バランスを取ったときの中心点)」です。シーソーに全データを乗せて、ピタッと水平になるところが平均値だと考えてください。

…ここまでは小学校レベルの話です。問題はここから。「重心」って、極端に重いものが片側にあると、簡単にズレます。これが平均値の最大の弱点です。

2. 罠その1:たった1人で平均が壊れる「外れ値の罠」

平均値の最大の弱点は、「極端に大きい(小さい)データが1つでも混じると、全体が歪む」ことです。

この弱点を体感するために、ちょっと面白いシミュレーションをしてみましょう。

⚾ 花巻東高校の同窓会で平均年収を計算したら…

メジャーリーガーの大谷翔平選手の母校、花巻東高校。同じクラスだった10人が同窓会で集まり、「俺たちの平均年収どれくらいだろう?」と計算してみました。

名前 職業 年収
Aくん公務員350万円
Bくんメーカー勤務450万円
Cくん中小企業400万円
Dくん介護職320万円
Eくん建設業500万円
Fくん飲食店380万円
Gくん営業職550万円
Hくん事務職400万円
Iくんエンジニア600万円
⚾ 大谷選手MLB選手150億円

さて、このクラスの平均年収を電卓で叩いてみると…

合計:350+450+400+320+500+380+550+400+600+1,500,000 = 約1,503,950万円

平均年収 ≒ 約15億円!?

…えっ、このクラスみんな金持ち?

もちろん違います。9人は普通のサラリーマンで、年収400万円前後。たった1人の超人がいるだけで、平均は実態と完全にかけ離れた数字になってしまいました。

⚠️ これが「外れ値の罠」
平均値は、極端なデータ(外れ値)に引っ張られる性質があります。シーソーの端っこに大谷選手という巨人を乗せたら、当然バランスは崩れますよね。あれと同じです。

3. 罠その2:日本人の「平均貯蓄額」が異常に高い理由

ニュースで「日本人の平均貯蓄額は1,904万円」(総務省・2023年家計調査)と聞いて、「えっ、自分そんなにないんだけど…俺、底辺なの?」と落ち込んだことはありませんか?

でも、安心してください。これも「外れ値の罠」です。

平均値と中央値、こんなにズレている

同じ「2023年家計調査」で、もう一つの指標も発表されています。それが 「中央値」 です。中央値とは「全員を一列に並べたときの、ど真ん中の人の数字」のこと。

📊

平均値

1,904万円

→ 一部の超富裕層に引っ張られている

🎯

中央値

1,168万円

→ こっちの方が「普通の人」の感覚に近い

平均と中央値で 700万円以上の差。これが何を意味しているか分かりますか?

答えは、「貯蓄額が数億円ある一部のお金持ちが、平均を引き上げている」ということ。日本人の貯蓄分布は、低い側に人が集まり、高い側に少数の超富裕層がいる「右に裾が長い分布」なんです。

🔧 現場の声
製造業の不良率データも全く同じ構造です。普段は不良率0.1%なのに、月に1回だけライン停止で5%まで跳ね上がる日がある。これを「平均」で見ると0.5%に見えるけど、実態は「ほとんどの日は優秀、たまにめちゃくちゃ悪い」。山田課長が「実態はどうなの?」と聞いてきたのは、こういう構造を見抜きたかったからです。
📘 関連記事
第4回:中央値と最頻値 - 平均以外の代表値 →

平均値の弱点を補う「中央値」「最頻値」の使い方を解説

4. 罠その3:「足して2で割る」が間違いになる場面

ここまでは「平均値が外れ値に弱い」という話でした。でも実は、もっと根本的な問題があります。それは 「平均にはいくつか種類があって、場面によって使い分けないと答えが間違う」 ということ。

代表的なのが3つ。算術平均・幾何平均・調和平均です。

クイズ:刈谷駅から名古屋駅まで、平均時速は何km?

田中さんの会社(刈谷市)から名古屋まで、車で往復したとします。

  • 行き:渋滞で 時速30km
  • 帰り:道が空いてて 時速60km

さて、この往復の平均時速はいくら?

❌ ありがちな間違い

(30 + 60) ÷ 2 = 時速45kmと計算してしまう

これ、間違いです。正解は時速40km。なぜか?

理由はシンプル。遅い方(時速30km)の方が、長い時間を費やしているからです。たとえば刈谷~名古屋を片道30kmとすると:

区間 距離 速度 かかった時間
行き30km30km/h1時間
帰り30km60km/h0.5時間
合計60km1.5時間

平均速度 = 総距離 ÷ 総時間

= 60km ÷ 1.5h = 時速40km

このように「速度」「効率」「単位あたりの量」を平均するときは、普通の足し算では間違える。こういうときに使うのが「調和平均」です。

5. 知らないと損する「3つの平均」の使い分け

平均には主に3種類あります。どれも「平均」と呼びますが、計算方法も使う場面も違います。

① 算術平均(みんなが知ってる「足して割る」)

私たちが普段「平均」と呼んでいるのはこれ。テストの点数、身長、体重、不良率など、「足し算で意味が通じる」データに使います。

📐 算術平均の式
算術平均 = (x₁ + x₂ + ... + xₙ) ÷ n

② 幾何平均(成長率・利率を平均するときの正解)

投資のリターン、インフレ率、年成長率など、「掛け算で繋がるデータ」に使います。

📐 幾何平均の式
幾何平均 = ⁿ√(x₁ × x₂ × ... × xₙ)
(全部掛けて、個数分のルートをとる)

具体例:あなたが投資をしていて、1年目に+10%(1.1倍)、2年目に-5%(0.95倍)になったとします。平均成長率はいくら?

❌ 算術平均だと…

(+10 + -5) ÷ 2 = +2.5%

→ 実際より良く見える!

✅ 幾何平均が正解

√(1.1 × 0.95) ≒ 1.022 = +2.2%

→ 実際の成績はこっち

③ 調和平均(速度・効率の平均)

さきほどの往復速度の話。これに使うのが調和平均です。「単位あたりの量(速度、燃費、生産効率)」に使います。

📐 調和平均の式
調和平均 = n ÷ (1/x₁ + 1/x₂ + ... + 1/xₙ)
(個数 ÷ 逆数の合計)

往復速度の例で確認:2 ÷ (1/30 + 1/60) = 2 ÷ 0.05 = 時速40km。ちゃんと正解になりました。

6. 3つの平均、ひと目でわかる早見表

ここまでの内容を1枚の表にまとめました。実務で迷ったらこれを見てください。

種類 こんなときに使う 具体例
算術平均 足し算で意味が通じるデータ テストの点数、身長、不良率、品質特性値
幾何平均 掛け算で繋がるデータ(成長率、利率) 投資のリターン、年成長率、インフレ率
調和平均 単位あたりの量(速度・効率) 往復の平均速度、燃費、生産効率
💡 覚え方のコツ
迷ったら「足し算で意味が通じる?」と自問してください。
・点数を足す → 意味ある → 算術平均
・成長率を足す → 意味ない(掛け算で繋がる)→ 幾何平均
・速度を足す → 意味ない(時間×速度が距離)→ 調和平均

7. じゃあ、どうすれば騙されないのか?

ここまで読んで、「平均値ってけっこう信用できないな…」と感じたかもしれません。それで正解です。でも平均値が悪いわけじゃない。「平均値だけを信じる」のがダメなんです。

じゃあどうすればいいか。答えはシンプル。「他の代表値と一緒に見る」です。

データを見るときの3点セット

① 平均値

全体の重心。ただし外れ値に弱い。

データを並べた真ん中の値。外れ値に強いので、平均と組み合わせると分布の歪みがわかる。

③ 最頻値

一番多い値。「いちばんありがちな値」を知りたいときに使う。

🔧 現場の声
品質保証の世界では、平均値だけ見て「OKです」と報告するのはNGです。必ず「ばらつき(標準偏差)」とセットで見る。これが基本中の基本。さらに分布の形(ヒストグラム)も併せて確認すれば、「平均は良いけど、たまに外れ値が出る」みたいな危険なパターンを見抜けます。

明日から使える「平均値チェックリスト」

平均値を出す(見る)ときに、自問する4つの質問:

  • ☑️ そのデータに外れ値はないか?(極端に大きい/小さい値)
  • ☑️ そのデータは「足し算で意味が通じる」か?(速度や成長率じゃないか)
  • ☑️ 中央値と並べて見たか?(大きく違うなら分布が歪んでいる)
  • ☑️ ばらつき(標準偏差)はどれくらいか?
📘 関連記事
第5回:分散と標準偏差|「バラつき」を数値化する魔法の公式 →

平均値とセットで使う「ばらつき」の話。これがわかると現場のデータが10倍読めるようになります。

8. まとめ:「平均◯◯」というニュースに騙されない大人になろう

この記事のポイント

  • 平均値は「データの重心」を表す便利な指標、ただし外れ値に弱い
  • 「平均年収」「平均貯蓄額」は、超富裕層に引っ張られている可能性大
  • 平均には 算術平均・幾何平均・調和平均 の3種類があり、使い分けが必要
  • 速度や成長率を「足して2で割る」のは間違い。場面に応じた平均を使う
  • 正しくデータを読むには、平均・中央値・最頻値・ばらつき の4点セットで見る

世の中には「平均◯◯」という数字が氾濫しています。テレビ、新聞、社内資料、客先プレゼン。でも、平均だけ見て判断するのは、目隠しをして道路を渡るようなものです。

今日からは、平均値を見たら「で、中央値は?」「ばらつきは?」と一歩立ち止まる癖をつけてください。それだけで、データを見る目が一気にレベルアップします。

次回は、平均値の弱点を完璧にカバーする頼れる相棒、「中央値」と「最頻値」 について深掘りしていきます。

📚 次に読むべき記事

📘 【完全版】統計学の勉強ロードマップ|初心者がデータ分析を武器にするまでの全手順 →

統計学を体系的に学びたい人向けの全体マップ。どこから始めればいいかが一目でわかります。

📘 第4回:中央値と最頻値 - 平均以外の代表値 →

平均値の弱点を補う「中央値」と「最頻値」。外れ値に強い代表値の使い方を解説。

📘 第5回:分散と標準偏差|「バラつき」を数値化する魔法の公式 →

平均とセットで使う「ばらつき」の話。これがわかると品質データが本当に読めるようになります。

タグ

-統計学基礎