こんにちは、シラスです。
「AI」や「データ分析」という言葉が飛び交う現代。
その中で最も基本にして最強のツール、それが「回帰分析(かいきぶんせき)」です。
名前は難しそうですが、やっていることはシンプルです。
一言で言えば、「過去のデータから、未来を予言する魔法の数式を作ること」です。
今日は、難しい数式は一切使いません。
「おでん屋さんの店長」になったつもりで、回帰分析のイメージを掴んでいきましょう。
目次
1. 勘と経験 vs データ分析
あなたは、おでん屋の店長です。
明日の仕込み量を決めるために、「明日はどれくらい売れるかな?」と悩んでいます。
👩🍳 パターンA:ベテラン店長の「勘」
「明日は寒そうだし、なんとなく200個くらい売れる気がするな…。
長年の勘だよ!」
👨💻 パターンB:回帰分析
「過去のデータを見ると、気温が1℃下がると売上が10個増える傾向がある。
明日は今日より3℃下がるから、売上は30個増えるはずだ!」
パターンAの「勘」は、当たるかもしれませんが、他の人には真似できません。
パターンBのように、「気温」という手がかりを使って、「売上」を計算で導き出すこと。 これが回帰分析です。
2. 回帰分析の仕組み:線を引くこと
では、どうやって計算しているのでしょうか?
実は、小学生の頃にやった「グラフに直線を引く」作業と同じなんです。
📉 散布図に線を引く
横軸に「気温」、縦軸に「おでんの売上」をとって、過去のデータを点(プロット)で打ちます。
すると、右下がりのバラバラした点が見えてきます。
この点の真ん中をズバッと通る「代表的な直線」を一本引く。
これが回帰分析の正体です。
この線さえ引けてしまえば、あとは簡単です。
「明日の気温は5℃か…じゃあ、この線でいうと売上は何個かな?」と、線をたどるだけで未来が予測できるのです。
3. 専門用語:「説明」と「目的」
ここで、2つだけ専門用語を覚えてください。
この用語が分かると、これからの学習が劇的に楽になります。
-
説明変数($x$): 原因となるデータ。
例:気温、広告費、勉強時間 -
目的変数($y$): 知りたい結果のデータ。
例:おでんの売上、来客数、テストの点数
「説明変数(気温)を使って、目的変数(売上)を説明する」
という親子関係をイメージしてください。
まとめ
「経験と勘」だけに頼るビジネスや研究は、もう終わりです。
回帰分析を使えば、誰でも根拠のある予測ができるようになります。
しかし、ここで一つ疑問が浮かびます。
「関係があること(相関)」と「予測できること(回帰)」って、何が違うの?
次回は、よく混同される「相関と回帰の決定的な違い」について解説します。
これを知らないと、思わぬ落とし穴にハマることになります。
📚 回帰分析を「武器」にする3冊
数式アレルギーだった私でも読破できた、厳選の良書です。