検定・推定

【超入門】「統計的仮説検定」と「推定」って何?数式なしでイメージだけで理解する

こんにちは、シラスです。

統計学の勉強を始めると、すぐに「推定」「検定」という漢字の壁にぶつかります。

「帰無仮説を棄却する…?」 「信頼区間95%…?」

教科書には難しい言葉が並んでいますが、実はこれ、私たちが日常生活で当たり前のようにやっていることを、カッコつけて数字で言っているだけなんです。

今日は、難しい数式は一切使いません。 「お味噌汁の味見」「イカサマコイン」の例え話だけで、この2つの統計用語の正体を暴いていきましょう。

1. そもそも統計学は何のためにある?

まず大前提です。統計学がやりたいことは、たった一つしかありません。

📊 統計学のゴール
「一部分(スプーン一杯)」を見て、
「全体(鍋の中身)」を言い当てること。

お味噌汁を作っているとき、味を確認するために鍋の中身を全部飲み干す人はいませんよね? スプーン一杯(サンプル)を飲んで、「うん、鍋全体(母集団)も美味しくできているはずだ!」と判断します。

これが統計学の基本です。そして、この「判断」のアプローチが2種類あります。それが「推定」「検定」です。

2. 推定(Estimation)=「ズバリ予想する」

まずは「推定」から。これはシンプルに「全体はどんな状態か?」を予想することです。

お味噌汁の味見で言うなら、こうです。

  • スプーンを飲む: 「ふむ、塩分濃度はこれくらいか…」
  • 予想する: 「ということは、鍋全体の塩分濃度も〇〇%くらいだな!」

この予想の仕方には、2つのスタイルがあります。

🎯 点推定と区間推定
① 点推定(ピンポイント予想)
「鍋の塩分は、ズバリ 3.5% だ!」
→ 言い切りはカッコいいですが、外れるリスクが高いです。
② 区間推定(幅を持たせる)
「鍋の塩分は、だいたい 3.0% 〜 4.0% の間 だと思うよ」
→ 「信頼区間」とも言います。少し曖昧ですが、嘘をつく確率は減ります。誠実な予想です。

ビジネスや研究では、一点張りで外すリスクを避けるために、幅を持たせた「区間推定」がよく使われます。

3. 検定(Hypothesis Testing)=「白黒つける」

次に「検定(仮説検定)」です。これが初心者を苦しめますが、やっていることは「犯人探し(裁判)」と同じです。

「数値はいくらか?」を当てるのではなく、「意味のある違いがあるのか? それとも偶然の誤差か?」に白黒つけるのが検定です。

例え話:イカサマコイン疑惑

友人が「このコイン、表が出やすいんだぜ」と言ってきました。あなたは疑います。 そこで、実際に10回投げてみました。すると10回とも「表」が出ました。

あなたならどう思いますか?

  • 考えA(偶然): 「まあ、普通のコインでも10回連続で表が出ることは…あるよね?」
  • 考えB(必然): 「いやいや!普通のコインで10連続なんて、確率的にほぼありえない(0.1%以下)。このコインはイカサマだ!

この「考えB」の思考プロセスこそが「統計的仮設検定」です。

⚖️ 検定のロジック(背理法)
  1. まず「これは普通のコインだ(差はない)」と仮定する。(帰無仮説)
  2. 実際に実験してみる。
  3. 「うわっ、こんなレアな結果が出ちゃった!」(P値が小さい)
  4. 「普通のコインでこんなことが起きるはずがない。最初の仮定が間違っていたんだ!」と結論づける。(棄却=イカサマ認定)

「普通ならこんなこと起きないよね? だからこれは意味のある違い(有意差)なんだよ」と主張するための手続き。それが検定です。

まとめ:使い分けのイメージ

最後に、この2つの使い分けをまとめます。

🔍 推定(Estimation)
「値はいくつ?」を知りたいとき。
例:全国の平均年収はいくら? 支持率は何%?
⚖️ 検定(Testing)
「差はあるの?」を知りたいとき。
例:新薬は旧薬より効果がある? 工場Aと工場Bの不良率に違いはある?

統計学の教科書を開いて数式に溺れそうになったら、この「お味噌汁」と「コイン」の話を思い出してください。

やっていることは、実はとても人間くさい「判断」なのです。

タグ

-検定・推定