こんにちは、シラスです。
統計学の勉強を始めると、すぐに「推定」や「検定」という漢字の壁にぶつかります。
「帰無仮説を棄却する…?」 「信頼区間95%…?」
教科書には難しい言葉が並んでいますが、実はこれ、私たちが日常生活で当たり前のようにやっていることを、カッコつけて数字で言っているだけなんです。
今日は、難しい数式は一切使いません。 「お味噌汁の味見」と「イカサマコイン」の例え話だけで、この2つの統計用語の正体を暴いていきましょう。
目次
1. そもそも統計学は何のためにある?
まず大前提です。統計学がやりたいことは、たった一つしかありません。
「全体(鍋の中身)」を言い当てること。
お味噌汁を作っているとき、味を確認するために鍋の中身を全部飲み干す人はいませんよね? スプーン一杯(サンプル)を飲んで、「うん、鍋全体(母集団)も美味しくできているはずだ!」と判断します。
これが統計学の基本です。そして、この「判断」のアプローチが2種類あります。それが「推定」と「検定」です。
2. 推定(Estimation)=「ズバリ予想する」
まずは「推定」から。これはシンプルに「全体はどんな状態か?」を予想することです。
お味噌汁の味見で言うなら、こうです。
- スプーンを飲む: 「ふむ、塩分濃度はこれくらいか…」
- 予想する: 「ということは、鍋全体の塩分濃度も〇〇%くらいだな!」
この予想の仕方には、2つのスタイルがあります。
「鍋の塩分は、ズバリ 3.5% だ!」
→ 言い切りはカッコいいですが、外れるリスクが高いです。
「鍋の塩分は、だいたい 3.0% 〜 4.0% の間 だと思うよ」
→ 「信頼区間」とも言います。少し曖昧ですが、嘘をつく確率は減ります。誠実な予想です。
ビジネスや研究では、一点張りで外すリスクを避けるために、幅を持たせた「区間推定」がよく使われます。
3. 検定(Hypothesis Testing)=「白黒つける」
次に「検定(仮説検定)」です。これが初心者を苦しめますが、やっていることは「犯人探し(裁判)」と同じです。
「数値はいくらか?」を当てるのではなく、「意味のある違いがあるのか? それとも偶然の誤差か?」に白黒つけるのが検定です。
例え話:イカサマコイン疑惑
友人が「このコイン、表が出やすいんだぜ」と言ってきました。あなたは疑います。 そこで、実際に10回投げてみました。すると10回とも「表」が出ました。
あなたならどう思いますか?
- 考えA(偶然): 「まあ、普通のコインでも10回連続で表が出ることは…あるよね?」
- 考えB(必然): 「いやいや!普通のコインで10連続なんて、確率的にほぼありえない(0.1%以下)。このコインはイカサマだ!」
この「考えB」の思考プロセスこそが「統計的仮設検定」です。
- まず「これは普通のコインだ(差はない)」と仮定する。(帰無仮説)
- 実際に実験してみる。
- 「うわっ、こんなレアな結果が出ちゃった!」(P値が小さい)
- 「普通のコインでこんなことが起きるはずがない。最初の仮定が間違っていたんだ!」と結論づける。(棄却=イカサマ認定)
「普通ならこんなこと起きないよね? だからこれは意味のある違い(有意差)なんだよ」と主張するための手続き。それが検定です。
まとめ:使い分けのイメージ
最後に、この2つの使い分けをまとめます。
「値はいくつ?」を知りたいとき。
例:全国の平均年収はいくら? 支持率は何%?
「差はあるの?」を知りたいとき。
例:新薬は旧薬より効果がある? 工場Aと工場Bの不良率に違いはある?
統計学の教科書を開いて数式に溺れそうになったら、この「お味噌汁」と「コイン」の話を思い出してください。
やっていることは、実はとても人間くさい「判断」なのです。