回帰分析

【統計学】説明変数(x)と目的変数(y)の違いとは?どっちが原因か迷わない覚え方

こんにちは、シラスです。

回帰分析を始めるとき、最初にデータを $x$ と $y$ に振り分ける必要があります。

しかし、Excelの入力画面で手が止まってしまうことはありませんか?

「あれ? 気温がXだっけ? Yだっけ?」
「逆に入力したらどうなるの?」

結論から言うと、逆に入力すると分析結果は全くのデタラメ(無意味)になります。

今日は、回帰分析の命運を分ける「2つの変数」の役割分担について、絶対に迷わなくなるイメージ法を解説します。


1. 役割の違い:矢印の向きを意識せよ

回帰分析とは、因果関係(原因と結果)を数式にする技術です。

それぞれの役割は以下の通りです。

説明変数 ($x$)

Explanatory Variable

  • 役割: 原因、理由
  • 別名: 独立変数
  • イメージ: 操作する側

目的変数 ($y$)

Objective Variable

  • 役割: 結果、予測したいもの
  • 別名: 従属変数、応答変数
  • イメージ: 変化させられる側

矢印は常に、「説明変数($x$) → 目的変数($y$)」 の向きに流れます。

2. 覚え方:「リモコン」と「テレビ」

どっちがどっちか分からなくなったら、この例えを思い出してください。

📺 テレビの音量を変えたい時

あなたは「リモコン ($x$)」を操作して、
「テレビの音量 ($y$)」を変えますよね?

  • $x$(説明変数): リモコンのボタン
    あなたが直接いじれるもの。原因を作るもの。
  • $y$(目的変数): 画面の数値
    リモコン操作の結果として勝手に変わるもの。あなたが直接触れないもの。

「逆」はあり得ません。
テレビ画面の数字を指で押しても、リモコンのボタンは動きませんよね?

データ分析でも同じです。
「自分がコントロールできるもの(あるいは先に決まるもの)」を $x$ に入れます。

3. 具体例:どっちが $x$ でどっちが $y$?

以下のケースで、どちらを $x$(説明変数)にすべきか考えてみましょう。

Q1. おでんの売上予測

データ:「気温」と「売上個数」

正解:
$x$ = 気温
$y$ = 売上個数
(理由:気温が下がるから売れるのであって、売れたから気温が下がるわけではない)

Q2. テスト勉強

データ:「点数」と「勉強時間」

正解:
$x$ = 勉強時間
$y$ = 点数
(理由:時間をかけた結果として点数が出るから)

まとめ

説明変数 ($x$) は「原因・操作するもの」。
目的変数 ($y$) は「結果・予測したいもの」。
✅ 迷ったら「リモコン($x$) → テレビ($y$)」の関係を思い出す。

この関係を逆にして分析してしまうと、「おでんがたくさん売れたから、明日は寒くなるぞ!」という、とんでもない迷信のような結論になってしまいます。

正しい予測は、正しい $x$ と $y$ の設定から始まります。

📚 回帰分析を「武器」にする3冊

数式アレルギーだった私でも読破できた、厳選の良書です。

まずはここから

『マンガでわかる統計学 回帰分析編』(高橋信)

「回帰分析って、結局なに?」
そんな疑問を、マンガのストーリーで直感的に解決してくれる一冊です。
喫茶店の売上予測という身近なテーマを通じて、「単回帰」から「重回帰」「ロジスティック回帰」まで、驚くほどスムーズに理解できます。
数式を見るだけで拒否反応が出るなら、迷わずここから始めてください。

理論のバイブル

『完全独習 統計学入門』(小島寛之)

このブログでも何度も紹介している名著ですが、実は「回帰分析」の章が秀逸なんです。
「なぜ最小二乗法で線を引くのか?」「t検定と回帰分析はどう繋がっているのか?」
そんな本質的な問いに、中学数学レベルの言葉で答えてくれます。
計算手順だけでなく「意味」を理解したいエンジニアの必読書です。

Excelで即実践

『Excelで学ぶ回帰分析入門』(上田太一郎)

理論は分かった。でも「明日までにデータ分析して」と言われたらどうする?
この本は、Excelの「分析ツール」を使った具体的な操作手順と、出力結果の読み方を手取り足取り教えてくれます。
「ダミー変数」や「マルチコ」といった実務でつまずくポイントも網羅されており、デスクに一冊あると安心できる実用書です。

タグ

-回帰分析