回帰分析

【統計学】因果関係と相関関係の違いは?「擬似相関」の罠をアイスクリームの例で解説

こんにちは、シラスです。

回帰分析を使って $y = ax + b$ という数式を作ると、私たちはついこう考えてしまいます。

「$x$(原因)が $y$(結果)を作り出しているんだ!」
「だから $x$ を変えれば、$y$ も思い通りに動かせるはずだ!」

しかし、ここに大きな落とし穴があります。
統計学において、「相関関係(一緒に動くこと)」と「因果関係(原因と結果)」は全くの別物だからです。

もしここを履き違えると、良かれと思ってやった対策が全くの無駄に終わるどころか、事態を悪化させることさえあります。

今日は、データ分析者が最も警戒すべき罠、「擬似相関(ぎじそうかん)」について解説します。

1. 有名なパラドックス:アイスクリーム殺人事件

統計学の世界で、あまりにも有名な例え話があります。

🍦 データの事実

ある都市のデータを分析したところ、以下の強い相関が見つかりました。

  • アイスクリームの売上が増えると、水難事故(溺れる人)が増える。
  • アイスクリームの売上が減ると、水難事故も減る。

回帰分析をすれば、見事な右肩上がりの直線が引けます。
$R^2$(決定係数)も非常に高い値が出るでしょう。

では、市長であるあなたは、水難事故を減らすために以下の政策を実行すべきでしょうか?

「アイスクリームの販売を禁止せよ!」

……もちろん、違いますよね。
アイスを禁止しても、水難事故は1件も減りません。

2. 真犯人:「交絡因子」の存在

なぜアイスと事故が連動していたのか?
それは、両方の背後に隠れた「第三の要因」がいたからです。

☀ 気温(夏)

暑いから → アイスが売れる
暑いから → 海に行って泳ぐ(事故が増える)

アイスと事故の間には、直接的な関係(因果)はありません。
共通の原因である「気温」によって、あたかも関係があるかのように見えていただけなのです。

このように、隠れた第三者(交絡因子)のせいで見えるニセモノの相関を、「擬似相関(Spurious Correlation)」と呼びます。

3. 回帰分析の限界:因果の壁

ここで重要な事実をお伝えします。

回帰分析(数式)だけでは、それが「本当の因果」なのか「擬似相関」なのかを見抜くことはできません。

計算ソフトは優秀ですが、常識を持っていません。
「アイス」と「事故」の数字を与えれば、喜んで「強い関係があります!」と計算してしまいます。

だからこそ、最後に判断するのは「人間のドメイン知識(現場の知見)」なのです。

  • 「物理的に考えて、アイスが人を溺れさせるメカニズムはあるか?」
  • 「他に影響している要因(気温など)はないか?」

この「疑う力」こそが、データサイエンティストに求められる最大のスキルです。

まとめ

相関関係 $\neq$ 因果関係 である。
✅ 第三の要因(交絡因子)による「擬似相関」に注意せよ。
✅ 回帰分析の結果を鵜呑みにせず、「なぜ?」というメカニズムを考える。

「データドリブン(データ駆動)」は素晴らしいことですが、「データだけ」見て判断するのは危険です。

回帰直線を引いた後は、必ず一度立ち止まって、「これは本当に因果関係なのか? 別の黒幕がいるんじゃないか?」と自問してみてください。

その慎重さが、あなたと組織を誤った意思決定から守ってくれるはずです。

📚 回帰分析を「武器」にする3冊

数式アレルギーだった私でも読破できた、厳選の良書です。

まずはここから

『マンガでわかる統計学 回帰分析編』(高橋信)

「回帰分析って、結局なに?」
そんな疑問を、マンガのストーリーで直感的に解決してくれる一冊です。
喫茶店の売上予測という身近なテーマを通じて、「単回帰」から「重回帰」「ロジスティック回帰」まで、驚くほどスムーズに理解できます。
数式を見るだけで拒否反応が出るなら、迷わずここから始めてください。

理論のバイブル

『完全独習 統計学入門』(小島寛之)

このブログでも何度も紹介している名著ですが、実は「回帰分析」の章が秀逸なんです。
「なぜ最小二乗法で線を引くのか?」「t検定と回帰分析はどう繋がっているのか?」
そんな本質的な問いに、中学数学レベルの言葉で答えてくれます。
計算手順だけでなく「意味」を理解したいエンジニアの必読書です。

Excelで即実践

『Excelで学ぶ回帰分析入門』(上田太一郎)

理論は分かった。でも「明日までにデータ分析して」と言われたらどうする?
この本は、Excelの「分析ツール」を使った具体的な操作手順と、出力結果の読み方を手取り足取り教えてくれます。
「ダミー変数」や「マルチコ」といった実務でつまずくポイントも網羅されており、デスクに一冊あると安心できる実用書です。

タグ

-回帰分析