統計学基礎

共分散とは?求め方を計算例つきでやさしく解説|相関係数との違いも図解

😣 こんなふうに思っていませんか?
  • 「共分散って言葉は習ったけど、結局なにを表してるの?」
  • 「公式は知ってるけど、実際にどう計算して、いくつになるのかが分からない」
  • 「相関係数と何が違うの?どっちを使えばいいの?」
✅ この記事でわかること
  • 共分散が「結局なにを表す数字か」
  • 共分散の求め方を、実際の数字で答えまで計算(ここが本記事の目玉)
  • プラス・マイナス・ゼロが意味すること
  • 共分散と相関係数の違い・使い分け

「共分散(きょうぶんさん)」——名前からして難しそうですよね。教科書を見ても記号だらけで、「で、結局どう計算するの?」と手が止まってしまう人が本当に多いです。

この記事では、むずかしい記号はいったん置いて、「2人の友達の仲良し度」というたとえと、実際の数字を使った計算で、共分散をスッキリ理解していきます。最後には自分で計算できるようになります。

✅ 結論(まず30秒でわかる答え)

共分散とは、「2つのデータが、どれくらい一緒に動くか」を表す数字です。一緒に上がる関係はプラス、片方が上がると片方は下がる逆の関係はマイナス、関係がなければゼロに近くなります。求め方は、各データの「平均からのズレ(偏差)」どうしをかけ算して、その平均をとるだけ。この記事では実際に数字を入れて、共分散の値を最後まで計算します。

そもそも共分散とは?「2つのデータの仲良し度」

共分散とは、ひとことで言えば「2つのデータが、どれくらい一緒に動くか」を数字で表したものです。世の中には、一緒に動くものがたくさんありますよね。

たとえば「気温が上がるとアイスが売れる」「勉強時間が増えるとテストの点が上がる」。こういう“2つで連動する関係”の強さや向きを、感覚ではなく数字でとらえる道具が共分散です。

🎭 たとえると「2人の友達の仲良し度」
AさんとBさんの、毎日のテンションを観察するとします。

・Aが上がる日はBも上がる → いつも一緒。仲良し(=共分散プラス)
・Aが上がる日はBは下がる → シーソーの関係(=共分散マイナス)
・Aと関係なくBは自由 → 無関係(=共分散ほぼゼロ)

このように「2人がどれくらい連動しているか」を数字にしたもの、と考えるとイメージしやすいです。

つまり共分散とは、「2つのデータが、いっしょに動く仲良しさんか、逆に動くシーソーか、それとも他人か」を数字で見分ける道具、ということです。

プラス・マイナス・ゼロの意味を3パターンで理解

共分散は、計算すると「プラスの値」「マイナスの値」「ゼロに近い値」のどれかになります。その3つの意味を、身近な例で押さえましょう。

➕ プラス(正)

一緒に上がる・一緒に下がる仲良しの関係。

  • 気温 ↔ アイス売上
  • 勉強時間 ↔ テストの点

➖ マイナス(負)

片方が上がると片方は下がるシーソーの関係。

  • 気温 ↔ 暖房費
  • 値段 ↔ 売れる数

0️⃣ ゼロに近い

お互いに関係のない他人どうし。

  • 身長 ↔ 数学の点
  • 靴のサイズ ↔ 年収

つまり、共分散は「符号(プラスかマイナスか)」を見るだけで、2つのデータが同じ向きに動くのか、逆向きに動くのか、関係ないのかが一発で判断できる、ということです。

なぜ「かけ算」で仲良し度がわかるの?

共分散の計算では「ズレどうしをかけ算」します。ここが共分散のいちばん賢いところなので、先に仕組みだけ理解しておきましょう。

使うのは「偏差(へんさ)」という考え方。偏差とは「平均からどれだけズレているか」のことです。平均より上ならプラス、下ならマイナスになります。この偏差どうしをかけ算すると、不思議なことが起きます。

気温のズレ 売上のズレ かけ算 意味
+(高い)+(多い)一緒に上がってる
−(低い)−(少ない)一緒に下がってる
+(高い)−(少ない)逆向きに動いてる
💡 ポイント
マイナス×マイナスはプラスになりますよね。だから「一緒に上がる」も「一緒に下がる」も、どちらもかけ算するとプラス。逆向きのときだけマイナス。この性質のおかげで、ズレの積を全部足せば「同じ向きが多いか、逆向きが多いか」が数字で出るのです。

つまり「ズレどうしをかけ算して平均する」だけで、2つのデータの動く向きが自動的に数字に変わる——これが共分散のからくりです。次は実際に計算してみましょう。

共分散の求め方|実際に計算して答えを出す

いよいよ本番です。ここを言葉だけで終わらせず、最後まで数字で計算します。題材は「気温とアイス売上」の5日分データ。1つずつ進めるので、電卓があれば一緒にやってみてください。

気温(℃) アイス売上(個)
1日目2010
2日目2214
3日目2416
4日目2618
5日目2822
STEP 1

それぞれの平均を出す。
気温の平均=(20+22+24+26+28)÷5=24℃
売上の平均=(10+14+16+18+22)÷5=16個

STEP 2

平均からのズレ(偏差)を出してかけ算する。
1日目:(20−24)×(10−16)=(−4)×(−6)=+24
2日目:(22−24)×(14−16)=(−2)×(−2)=+4
3日目:(24−24)×(16−16)=0×0=0
4日目:(26−24)×(18−16)=2×2=+4
5日目:(28−24)×(22−16)=4×6=+24

STEP 3

かけ算の結果を全部足す。
24+4+0+4+24=56

STEP 4

データの個数(5)で割る。
56 ÷ 5 =11.2
これが共分散です。

📐 答え
共分散 = 11.2(プラス)
プラスの値なので、「気温が上がるとアイスも売れる」という同じ向きの関係がある、と数字で確認できました。
⚠️ ここで混乱しやすい:5で割る?4で割る?
データの個数 n(今回は5)で割るのが基本形(標本共分散)です。ただし統計の場面によっては、n−1(今回なら4)で割る「不偏共分散」を使うこともあります。高校数学やまず理解したい段階では n で割る、と覚えておけば大丈夫です。なぜ n−1 で割ることがあるの?という疑問はこちらで詳しく解説しています。

共分散には「弱点」がある

便利な共分散ですが、じつは大きな弱点があります。それは「関係の強さがわからない」こと。共分散の値だけ見ても、それが強い関係なのか弱い関係なのか判断できないのです。

❌ 弱点:単位を変えると値が変わる

さきほどの共分散は11.2でした。でも、売上を「個」ではなく「ダース(12個ずつ)」で測り直すと、まったく同じ関係なのに値が変わってしまいます。同じ関係なのに数字が変わるので、「11.2は大きいの?小さいの?」が判断できないのです。

たとえば「身長と体重の共分散が100」「気温と売上の共分散が600」と言われても、単位がバラバラなので「どっちが強い関係?」には答えられません。これでは比べものになりませんよね。

⚠️ つまり
共分散は「向き(プラスかマイナスか)」はわかるけれど、「強さ」はわからない。これが共分散の限界です。この弱点を解決するために登場するのが、次に説明する「相関係数」です。

共分散と相関係数の違いは?

共分散の弱点(強さがわからない)を解決したのが「相関係数(そうかんけいすう)」です。中身は、共分散をちょっと加工しただけのものです。

📐 相関係数のつくり方
相関係数 = 共分散 ÷(Xの標準偏差 × Yの標準偏差)
こうやって割り算で“ものさし”をそろえると、値が必ず −1 〜 +1 の範囲に収まります。

相関係数は必ず −1〜+1 に収まるので、「どれくらい強い関係か」を比べられます。目安はこちらです。

相関係数 関係の強さ
+0.7 〜 +1.0強い正の相関(一緒に動く)
−0.2 〜 +0.2ほぼ無関係
−0.7 〜 −1.0強い負の相関(逆に動く)
💡 使い分け
共分散は「向きだけわかる」、相関係数は「向きも強さもわかる」。だから実際の分析では相関係数を使うことが多いです。共分散は、相関係数を作るための“材料”だと思っておくとスッキリします。

相関係数について深く知りたい方は、相関と回帰分析の基礎|散布図・相関係数の解説もあわせて読むと理解が一段深まります。

注意!「一緒に動く=原因」ではない

共分散や相関係数を使うとき、絶対に忘れてはいけない落とし穴があります。それは「2つが一緒に動くからといって、片方がもう片方の原因とは限らない」ということです。

🍦 有名な例:アイスと水難事故
「アイスの売上」と「水難事故の件数」には強い正の相関があります。でも「アイスを食べると事故が起きる」わけではありませんよね。

正解は、「夏」という第3の原因が、アイス売上と水難事故の両方を同時に増やしているから。このように、見えない第3の原因が両方に効いている見せかけの関係を「擬似相関(ぎじそうかん)」と呼びます。

つまり、数字の上で一緒に動いていても、それだけで「原因と結果」と決めつけてはいけない、ということです。これはデータを扱うすべての人が引っかかる落とし穴なので、最初に覚えておきましょう。

擬似相関のおもしろい例をもっと知りたい方は、「アイスが売れると事故が増える?」擬似相関の罠がおすすめです。

よくある質問(FAQ)

Q. 共分散とは何ですか?

A. 2つのデータがどれくらい一緒に動くかを表す数字です。プラスなら同じ向き、マイナスなら逆向きです。

Q. 共分散の求め方は?

A. 各データの「平均からのズレ」どうしをかけ算し、その合計をデータの個数で割れば求まります。

Q. 共分散と相関係数の違いは?

A. 共分散は向きだけ、相関係数は向きと強さの両方がわかります。相関係数は−1〜+1に収まります。

Q. 共分散は n と n−1 どちらで割る?

A. 基本は個数 n で割ります。推定で使う「不偏共分散」では n−1 で割ります。まずは n で覚えてOKです。

まとめ|共分散のポイント

むずかしそうに見えた共分散も、「2つのデータの仲良し度を数字にしたもの」とわかれば怖くありません。最後に要点をおさらいします。

📌 この記事のまとめ
  • 共分散=2つのデータがどれくらい一緒に動くかを表す数字
  • プラス=同じ向き/マイナス=逆向き/ゼロ=無関係
  • 求め方=偏差どうしをかけ算 → 合計 → 個数で割る
  • 今回の例では共分散=11.2(一緒に動く関係)
  • 弱点は「強さがわからない」→ 相関係数で解決
  • 一緒に動いても「原因」とは限らない(擬似相関に注意)

共分散は、回帰分析や相関分析といった、より進んだ分析の入口になる大事な考え方です。基礎が固まったら、ぜひ次のステップにも進んでみてください。

S
シラス
電験三種 / QC検定1級 / パワエレ設計・品質保証 実務10年

自動車部品メーカーで電気設計・品質保証に携わってきた経験をもとに執筆しています。むずかしい統計用語をできるだけ使わず、はじめて学ぶ人がつまずかないように、図と具体的な計算例で説明することを大切にしています。

📚 次に読むべき記事

📘 統計学の勉強ロードマップ|データ分析を武器にするまでの全手順 →

どこから学べばいいか迷ったらこれ。統計学の全体像と読む順番がわかります。

📘 相関と回帰分析の基礎|散布図・相関係数をやさしく解説 →

共分散の次のステップ。強さを測る相関係数を、もっと詳しく学べます。

📘 分散と標準偏差|「バラつき」を数値化する公式 →

共分散の計算に出てきた「偏差」「標準偏差」の土台がわかる基礎記事です。

タグ

-統計学基礎