目次
はじめに
「気温が高いほどアイスが売れる」「勉強時間が長いほどテストの点が上がる」──
日常で感じる “右肩上がり・下がり” を 一本の直線で数値化 するのが単回帰分析です。
中学の「比例」を少し拡張しただけなので、ポイントを押さえればすぐに使いこなせます。
なぜ単回帰分析が必要なのか
課題 | 平均だけでは足りない理由 | 単回帰で得られるもの |
---|---|---|
① 変化量を知りたい | 「1℃上がると何個増える?」が分からない | 傾き β₁ で効果量を数値化 |
② 将来を予測したい | 条件が変わると平均は役立たない | 入力を変えて未来の y を計算 |
③ 意思決定の説得力 | 「多分いける」では稟議が通らない | 決定係数 R² で説明力を提示 |
回帰式のかたちと用語
記号 | 日本語でひとこと | 直感的な意味 |
---|---|---|
切片 | のときの y (スタート地点) | |
傾き | が 1 増えると y がどれだけ増減するか | |
予測値 | 直線が示す「期待される y 」 |
比例との違いは切片が自由に動くことだけ。
だから「気温0 ℃でもアイスは多少売れる」といった現実的な線が引けます
回帰直線の決め方 ― “残差”を最小にする発想
-
散布図を描く
点の雲から右肩上がり/下がり・外れ値を目視チェック -
残差(観測値 − 予測値)を計算
各点が直線からズレた距離 -
残差²を全部足す
正負を打ち消さず、大きなズレを強調 -
その合計が最小になる直線を選ぶ
これが最小二乗法のゴール
イメージとしては「みんなのズレを正方形にして合計 → いちばん面積が小さい線」を探す作業です
具体例1:気温とアイス売上
日 | 気温 ℃ | 売上 個 |
---|---|---|
1 | 21 | 180 |
… | … | … |
12 | 32 | 260 |
回帰式(例)
-
傾き 12.5 → 気温が 1 ℃上がると約 13 個売上増
-
切片 -120 → 気温 0 ℃なら売上は 0 以下。あくまでも式の“延長線”上の値
このシンプルな式で、在庫や仕入れを温度ごとに自動計算できます
具体例2:勉強時間とテスト得点
生徒 | 勉強時間 h | 得点 |
---|---|---|
A | 1 | 55 |
B | 3 | 68 |
C | 5 | 79 |
回帰式(例)
-
傾き 6 → 1時間増えると平均 6 点アップ
-
R² が 0.85 なら、「得点の 85 %は勉強時間だけで説明できた」
残った 15 %は睡眠・集中度・過去の基礎力など。他の変数を追加すれば多変量回帰へ発展します。
決定係数 で回帰直線の“信頼度”をチェック
-
:総平方和(データ全体のばらつき)
-
:残差平方和(線が説明しきれなかったばらつき)
たとえば ビジネスでは 0.3 程度でも十分使える場合もあるので、数値は目的と難易度で解釈してください
まとめ
-
単回帰分析は「比例」+切片でデータを一直線に説明
-
必要な理由:変化量の定量化・未来予測・意思決定の説得力
-
回帰直線は “残差²の合計”を最小に して決定
-
傾きで効果量、切片でスタート位置、 で信頼度を把握
-
気温×売上や勉強時間×得点など、身近な例で即実践可能
これで「単回帰分析って何?」がスッと理解できたはずです。
次のステップでは “残差”のチェック方法と外れ値の扱い方 を掘り下げていきましょう。