残差とは？ “誤差”とゴッチャにしないためのやさしい基礎講座

「モデルの当てはまりを確かめるために残差を見ましょう」と聞いて、「それって“誤差”と同じじゃないの？」と感じたことはありませんか。
実はこの２つ、見ている世界が違うので混同すると理解が一気に難しくなります。この記事では

をやさしく解説します。

残差と誤差のちがいを一枚で整理

ポイント

残差は「観測できるズレ」。

誤差は「理想の世界と現実のズレ」で、直接は測れない。

残差は誤差の“見える化”に相当し、解析後の健康診断に使う。

気温（x）とアイス売上（y）の点をプロット。点の「雲」を観察し、右肩上がりかどうか感覚をつかみます。

最小二乗法で直線

$\hat{y} = {\hat{β}}_{0} + {\hat{β}}_{1} x$

を求めます。ここまでが“モデル作り”。

各点について

$e_{i} = y_{i} - {\hat{y}}_{i}$

を求めると、縦方向の短い矢印（画像参照）が残差。矢印が上下に散っていればモデルにまだ吸収しきれない要因が潜んでいる合図です。

残差が上下にランダムなら「良い当てはまり」。もし右上がりにトレンドが残るなら、直線ではなく曲線モデルを検討します。

ほかの点から大きく飛び出した残差は外れ値候補。クック距離などで影響の大きさを数値化し、必要ならデータ確認やロバスト回帰を行います。

回帰分析では「誤差は平均０・分散一定・独立・正規分布」という仮定を置きます。残差をヒストグラムやQQプロットで調べることで、誤差の仮定が破れていないかを推測できます。