はじめに
「散布図(さんぷず)」は、縦軸と横軸に 2 つの数値を取り、各データを 1 つの点で示すグラフです。点が集まってできる“雲”の形から、2 つの変数の関係(向き・強さ・例外)をひと目で把握できるため、統計解析やビジネス現場で幅広く使われています。平均や合計では分からない「変化の筋道」を視覚的につかむ第一歩として最適です。
散布図は何をしているグラフ?
散布図の仕組みはとてもシンプルです。
-
横軸(X)に説明したい要因を決める──例:気温
-
縦軸(Y)に結果となる数値を決める──例:アイスの売上
-
データを (X, Y) の座標として点でプロット
これだけで「気温が高いほどアイスは売れる?」という問いを視覚化できます。散布図は相関関係を探す最も直感的な方法として紹介されています。
散布図で読める三つのポイント
読み取れること | 見るポイント | 例え話 |
---|---|---|
向き(プラスかマイナスか) | 右肩上がりなら正の関係、右肩下がりなら負の関係 | ボウリングのレーンが上り坂か下り坂か |
強さ | 点が帯のように細いほど強い、散らばるほど弱い | ゴムバンドで束ねた鉛筆がキュッと締まるかゆるいか |
外れ値 | 雲から離れた孤立点は外れ値の可能性 | クラス写真で 1 人だけ立ち位置を間違えた友達 |
散布図を説明するときには「形(form)・方向(direction)・強さ(strength)・外れ値(outliers)」の 4 点をセットで述べるのが基本とされています
実例:気温とアイスの売上
アメリカの高校教材では、気温とアイス売上の 12 日分データを散布図に取り、右肩上がりの雲から「1 ℃上がると売上が増える傾向」を読み取る例が紹介されています。
平均売上だけを見ていると「暑い日は多めに仕入れる」という判断が難しいですが、散布図なら気温と売上の変化量を視覚的に確認できます。
散布図を描く五つのステップ
-
データを集める – 例:気温と売上
-
軸を決める – 単位や範囲をそろえて見やすくする
-
点を打つ – 1 行 1 点でプロットし、必要に応じて色分け
-
タイトルとラベル – 図を見ただけで内容がわかるようにする
-
傾向線を重ねる(任意) – 直線や曲線を引くと関係がさらに鮮明になる
散布図は相関分析の出発点として欠かせない、と国内のデータ可視化解説サイトでも強調されています。
散布図が役立つ四つの場面
-
相関の有無を瞬時にチェック
-
会議資料 1 枚で「広告費を増やすと売上は伸びる?」を説明できる。
-
-
単回帰・重回帰分析の前哨戦
-
点の向きが直線的なら線形モデルが有効かどうか判断できる。
-
-
外れ値の発見
-
製造ラインで規格外品をすぐに洗い出せる。
-
-
カテゴリー比較
-
点の色や形を変えれば、部署ごとのパフォーマンスをひと目で比較できる。
-
外れ値の扱いには注意が必要で、原因調査や分析目的に応じた対処が推奨されています。
よくある勘違いと注意点
よくある誤解 | なぜ起こる? | 正しい見方 |
---|---|---|
相関があれば必ず因果がある | 散布図は“仲良し度”を示すだけ | 因果を語るには実験や追加変数が必要 |
点の雲が丸いなら問題なし | 線形相関が弱いだけで、曲線や階段状の関係かもしれない | 曲線が疑われる場合は軸変換や非線形モデルを検討 |
外れ値は全部捨てるべき | 異常値=悪という思い込み | 入力ミス以外なら貴重なシグナルの可能性がある |
まとめ
散布図は「データ同士の会話」を視覚で聞くための最初の道具です。
-
2 変数の関係の方向・強さ・外れ値をひと目で把握できる
-
平均だけでは見えない「変化の筋道」を示してくれる
-
単回帰分析など、より高度な手法への橋渡しになる
次回の記事では、散布図に 1 本の直線を当てはめる「単回帰分析」に進み、数字で関係を語る方法を紹介します。