回帰分析

単回帰分析と回帰直線の超入門 ─ 中学「比例」でスッとわかるデータ分析の第一歩

はじめに

「気温が高いほどアイスが売れる」「勉強時間が長いほどテストの点が上がる」──
日常で感じる “右肩上がり・下がり” を 一本の直線で数値化 するのが単回帰分析です。
中学の「比例」を少し拡張しただけなので、ポイントを押さえればすぐに使いこなせます。


なぜ単回帰分析が必要なのか

課題 平均だけでは足りない理由 単回帰で得られるもの
① 変化量を知りたい 「1℃上がると何個増える?」が分からない 傾き β₁ で効果量を数値化
② 将来を予測したい 条件が変わると平均は役立たない 入力を変えて未来の y を計算
③ 意思決定の説得力 「多分いける」では稟議が通らない 決定係数 R² で説明力を提示

回帰式のかたちと用語

予測値 y^  =  β0  +  β1x

記号 日本語でひとこと 直感的な意味
β0 切片 x=0 のときの y (スタート地点)
β1 傾き x が 1 増えると y がどれだけ増減するか
y^ 予測値 直線が示す「期待される y 」

比例との違いは切片が自由に動くことだけ。
だから「気温0 ℃でもアイスは多少売れる」といった現実的な線が引けます


回帰直線の決め方 ― “残差”を最小にする発想

  1. 散布図を描く
    点の雲から右肩上がり/下がり・外れ値を目視チェック

  2. 残差(観測値 − 予測値)を計算
    各点が直線からズレた距離

  3. 残差²を全部足す
    正負を打ち消さず、大きなズレを強調

  4. その合計が最小になる直線を選ぶ
    これが最小二乗法のゴール

イメージとしては「みんなのズレを正方形にして合計 → いちばん面積が小さい線」を探す作業です


具体例1:気温とアイス売上

気温 ℃ 売上 個
1 21 180
12 32 260

回帰式(例)

売上^=120+12.5×気温

  • 傾き 12.5 → 気温が 1 ℃上がると約 13 個売上増

  • 切片 -120 → 気温 0 ℃なら売上は 0 以下。あくまでも式の“延長線”上の値

このシンプルな式で、在庫や仕入れを温度ごとに自動計算できます


具体例2:勉強時間とテスト得点

生徒 勉強時間 h 得点
A 1 55
B 3 68
C 5 79

回帰式(例)

得点^=50+6×時間

  • 傾き 6 → 1時間増えると平均 6 点アップ

  • R² が 0.85 なら、「得点の 85 %は勉強時間だけで説明できた」

残った 15 %は睡眠・集中度・過去の基礎力など。他の変数を追加すれば多変量回帰へ発展します。


決定係数 R2 で回帰直線の“信頼度”をチェック

R2=1SEST

  • ST:総平方和(データ全体のばらつき)

  • SE:残差平方和(線が説明しきれなかったばらつき)

たとえば R2 なら ばらつきの 82 %は直線で説明済みビジネスでは 0.3 程度でも十分使える場合もあるので、数値は目的と難易度で解釈してください


まとめ

  • 単回帰分析は「比例」+切片でデータを一直線に説明

  • 必要な理由:変化量の定量化・未来予測・意思決定の説得力

  • 回帰直線は “残差²の合計”を最小に して決定

  • 傾きで効果量、切片でスタート位置、R2 で信頼度を把握

  • 気温×売上や勉強時間×得点など、身近な例で即実践可能

これで「単回帰分析って何?」がスッと理解できたはずです。
次のステップでは “残差”のチェック方法と外れ値の扱い方 を掘り下げていきましょう。

-回帰分析