統計学基礎

カイ二乗分布とは?「正規分布を二乗して足すだけ」を初心者向けにやさしく解説

😣 こんなことで困っていませんか?
  • カイ二乗分布の公式を見ても、何を表しているのかさっぱりわからない
  • 「なぜ二乗するの?」がモヤモヤして腹落ちしない
  • 正規分布とどう違うのか、関係がわからない
✅ この記事でわかること
  • カイ二乗分布の正体は「正規分布を二乗して足したもの」だけ
  • なぜ二乗するのか、その理由がイメージでわかる
  • 実務やテストでどこに使われているのか

統計学を学び始めて、最初に「意味がわからない」とつまずく分布。それがカイ二乗分布(χ²分布)です。公式にギリシャ文字が並んでいて、見た瞬間に身構えてしまいますよね。わからなくて当然です。

でも安心してください。この記事を読み終わるころには、カイ二乗分布が「なんだ、そういうことか」と思えるようになります。

📌 結論:カイ二乗分布とは
「正規分布に従う値を、二乗して、何個か足し合わせたもの」です。
難しい数式を覚える必要はありません。まずはこのイメージだけ持って帰ってください。

そもそもカイ二乗分布とは何か?

カイ二乗分布は、ゼロから新しく作られた特別な分布ではありません。みなさんが知っている正規分布から作られた「親戚」のような分布です。

作り方はとてもシンプル。正規分布から数字を取り出して、二乗して、足すだけ。これを繰り返すと、自然とできあがる分布のことを「カイ二乗分布」と呼んでいます。

📊
正規分布の値
→ 二乗して足す →
📈
カイ二乗分布
💡 ひとことで言うと
カイ二乗分布とは「ズレ(誤差)を二乗して足し算した結果が、どんな形に散らばるか」を表したものです。

正規分布をまだよく知らない方は、先にこちらの記事を読むと、この後がぐっとわかりやすくなります。

実際に「作ってみる」とよくわかる

言葉だけだとピンとこないので、頭の中で簡単な実験をしてみましょう。カイ二乗分布は、3つの手順で作れます。

STEP 1

正規分布から数字を1つ取り出す。たとえば「−1.2」が出たとします。

STEP 2

その数字を二乗する。 (−1.2)² = 1.44。マイナスがプラスに変わりました。

STEP 3

この作業を何回か繰り返して、全部足す。

たとえば5回繰り返すと、こうなります。

取り出した値 二乗した値
1回目−1.21.44
2回目0.80.64
3回目−0.30.09
4回目1.52.25
5回目−0.70.49
合計4.91

この「4.91」がカイ二乗値です。そして、この実験を何万回も繰り返して合計値の散らばり方を調べると、それがカイ二乗分布になります。

💡 ポイント
「正規分布を二乗して足す」を5回やったので、これは自由度5のカイ二乗分布と呼びます。自由度とは、ざっくり言えば「足した回数」のことです。

なぜ「二乗」するのか?

「そのまま足せばいいのに、なぜわざわざ二乗するの?」これがカイ二乗分布で一番のつまずきポイントです。的当てゲームで考えてみましょう。

そのまま足すと…

右に+5cm、左に−5cmズレた場合、合計は 0
「完璧!」に見えるが、実際は両方とも5cmもズレている。バラつきが消えてしまう。

二乗して足すと…

(+5)² + (−5)² = 25 + 25 = 50
マイナスの符号が消えて、ズレがちゃんと積み上がる。バラつきが正しく見える。

つまり二乗するのは、プラスのズレとマイナスのズレが打ち消し合わないようにするためです。「本当はバラついているのに、バラついていないように見える」という誤解を防げるわけですね。

⚠️ よくある疑問
「絶対値を取ればいいのでは?」という声もあります。確かに符号は消せますが、二乗のほうが計算で扱いやすく、分散や標準偏差ともピッタリ合うため、統計では二乗が主流です。

自由度が変わると、形が変わる

カイ二乗分布の面白いところは、「足した回数(=自由度)」によって、グラフの形がガラッと変わることです。

自由度 分布の形
小さい(1〜3)左に寄って、右に長い裾を引く
中くらい(10前後)山がだんだん中央に寄ってくる
大きい(30以上)ほぼ正規分布に近いベル型になる

自由度が大きくなるほど正規分布に近づくのは、「たくさんの値を足すと合計は正規分布に近づく」という統計の性質によるものです。今は「足す回数が多いほどなめらかな形になる」とだけ覚えておけば十分です。

カイ二乗分布はどこで使うのか?

「正体はわかったけど、結局これって何の役に立つの?」と思いますよね。カイ二乗分布は、おもに次の3つの場面で活躍します。

使う場面 どんなときに使う? 身近な例
バラつきの検査製品のバラつきが基準内か調べるネジの長さの品質チェック
適合度の検査実際の結果が想定どおりか調べるサイコロは公平か?
関連性の検査2つの項目に関係があるか調べる性別と商品の購入の関係

どれも共通しているのは「想定とのズレが、たまたまの偶然で済む範囲か、それとも大きすぎるか」を判定している点です。ズレを二乗して足したカイ二乗分布が、まさにここで役立つわけですね。

実際の計算手順を知りたい方は、こちらの記事で1つのデータを使って一歩ずつ確認できます。

覚えておきたい3つの特徴

特徴 1

値は必ず0以上。 二乗して足したものなので、マイナスにはなりません。

特徴 2

右に裾が長い、左右非対称の形。 正規分布のような左右対称ではありません。

特徴 3

自由度が大きいと正規分布に近づく。 足す回数が多いほど、なめらかなベル型になります。

よくある質問(FAQ)

Q. カイ二乗分布と正規分布は何が違う?

正規分布は左右対称ですが、カイ二乗分布は0以上の値だけをとり、右に裾が長い非対称な形です。カイ二乗分布は正規分布を二乗して足して作られます。

Q. 自由度ってけっきょく何?

ざっくり言えば「正規分布の値を二乗して足した回数」です。自由度が大きいほど、分布の形は正規分布に近づきます。

Q. なぜマイナスの値が出ないの?

「二乗した値」を足して作るからです。どんな数字も二乗すれば0以上になるため、カイ二乗値が0未満になることはありません。

まとめ|カイ二乗分布の正体はシンプル

📌 この記事の要点
  • 正体:正規分布の値を二乗して足し合わせたもの
  • なぜ二乗?:プラスとマイナスのズレが打ち消し合わないようにするため
  • 自由度:足した回数のこと。多いほど正規分布に近づく
  • 使い道:バラつきの検査・適合度の検査・関連性の検査

カイ二乗分布は、公式を見ると難しそうですが、その中身は「ズレを二乗して足しただけ」というシンプルなものです。まずはこのイメージさえ持っていれば、これから検定を学ぶときもスムーズに進めます。次は、実際に検定で使ってみましょう。

📚 次に読むべき記事

📘 統計学の勉強ロードマップ|初心者が「データ分析」を武器にするまでの全手順 →

どの順番で何を学べばいいか、全体像を地図のように整理した記事です。

📘 カイ二乗検定(母分散)|バラつきが増えていないかを検証する手順 →

カイ二乗分布を実際の検定でどう使うか、計算手順を一歩ずつ解説します。

📘 カイ二乗分布の非対称性|なぜ「上側」と「下側」で値が違うのか →

非対称な形をもう一歩深く理解したい人向けの記事です。

タグ

-統計学基礎