こんにちは、シラスです。
回帰分析を始めるとき、最初にデータを $x$ と $y$ に振り分ける必要があります。
しかし、Excelの入力画面で手が止まってしまうことはありませんか?
「逆に入力したらどうなるの?」
結論から言うと、逆に入力すると分析結果は全くのデタラメ(無意味)になります。
今日は、回帰分析の命運を分ける「2つの変数」の役割分担について、絶対に迷わなくなるイメージ法を解説します。
目次
1. 役割の違い:矢印の向きを意識せよ
回帰分析とは、因果関係(原因と結果)を数式にする技術です。
それぞれの役割は以下の通りです。
矢印は常に、「説明変数($x$) → 目的変数($y$)」 の向きに流れます。
2. 覚え方:「リモコン」と「テレビ」
どっちがどっちか分からなくなったら、この例えを思い出してください。
📺 テレビの音量を変えたい時
あなたは「リモコン ($x$)」を操作して、
「テレビの音量 ($y$)」を変えますよね?
-
$x$(説明変数): リモコンのボタン
あなたが直接いじれるもの。原因を作るもの。 -
$y$(目的変数): 画面の数値
リモコン操作の結果として勝手に変わるもの。あなたが直接触れないもの。
「逆」はあり得ません。
テレビ画面の数字を指で押しても、リモコンのボタンは動きませんよね?
データ分析でも同じです。
「自分がコントロールできるもの(あるいは先に決まるもの)」を $x$ に入れます。
3. 具体例:どっちが $x$ でどっちが $y$?
以下のケースで、どちらを $x$(説明変数)にすべきか考えてみましょう。
Q1. おでんの売上予測
データ:「気温」と「売上個数」
正解:
$x$ = 気温
$y$ = 売上個数
(理由:気温が下がるから売れるのであって、売れたから気温が下がるわけではない)
Q2. テスト勉強
データ:「点数」と「勉強時間」
正解:
$x$ = 勉強時間
$y$ = 点数
(理由:時間をかけた結果として点数が出るから)
まとめ
この関係を逆にして分析してしまうと、「おでんがたくさん売れたから、明日は寒くなるぞ!」という、とんでもない迷信のような結論になってしまいます。
正しい予測は、正しい $x$ と $y$ の設定から始まります。
📚 回帰分析を「武器」にする3冊
数式アレルギーだった私でも読破できた、厳選の良書です。