ノンパラメトリック・感性品質

【完全図解】ウィルコクソンの順位検定とは?|「順位」で比較するノンパラメトリック検定を初心者向けにやさしく解説

📝 こんな悩みはありませんか?

  • 😕「ウィルコクソン検定」って名前は聞くけど、結局なにをする検定?
  • 🤔t検定との違いがよくわからない…どっちを使えばいいの?
  • 💭「順位」で比較するってどういうこと?イメージがわかない…

✨ この記事の結論

ウィルコクソン検定は「データを順位に変換して比較する」検定です。
正規分布を仮定しない「ノンパラメトリック検定」の代表格。
サンプルが少ないとき、外れ値があるときに威力を発揮します!

「このダイエット法、本当に効果あったのかな?」
「AグループとBグループ、どっちの成績がいいんだろう?」

こんなとき、統計的に比較したいですよね。

比較の検定といえば「t検定」が有名です。でも、t検定には「データが正規分布に従っていること」という前提条件があります。

では、正規分布に従わないデータはどうすればいいのでしょうか?
サンプル数が少なくて、正規分布かどうかもわからないときは?

そんなときに活躍するのが、「ウィルコクソンの順位検定」です。

この記事では、ウィルコクソン検定の考え方・種類・使いどころを、マラソンの順位などの身近な例を使って、初心者の方でも「なるほど!」とイメージできるように解説していきますね。

🏅 ウィルコクソン検定とは?|「順位」で比較する検定

まずは「ウィルコクソン検定ってそもそも何?」というところから、やさしく説明していきます。

🔢 数値を「順位」に変換するのがポイント

ウィルコクソン検定の最大の特徴は、「データの数値そのものではなく、順位を使って比較する」ことです。

たとえば、マラソン大会を想像してみてください。

🏃 マラソンで例えると…

5人のランナーのゴールタイム:
Aさん:3時間10分、Bさん:2時間55分、Cさん:4時間20分、Dさん:3時間05分、Eさん:3時間30分

これを順位に変換すると:
Aさん:3位、Bさん:1位、Cさん:5位、Dさん:2位、Eさん:4位

タイムの「数値」ではなく「順位」で比較するのがウィルコクソン検定の考え方です。

「え、なんでわざわざ順位に変えるの?数値のまま比較した方が正確じゃない?」と思いますよね。実は、順位に変換することで大きなメリットがあるんです。

💪 順位に変換するメリット

順位に変換する最大のメリットは、「外れ値の影響を受けにくい」ことです。

😰 数値のまま比較すると…

データ:10, 12, 15, 11, 200(外れ値)
平均:49.6(外れ値に引っ張られる!)
→ 実態とかけ離れた結果に…

😊 順位に変換すると…

順位:2位, 3位, 4位, 1位, 5位
→ 外れ値も「5位」として扱われるだけ
影響が小さくなる!

つまり、極端な値があっても、それはただの「最下位」や「最上位」として扱われるだけなので、全体の結果を大きく歪めないんですね。

💡 ノンパラメトリック検定とは?

ウィルコクソン検定は「ノンパラメトリック検定」の一種です。
「ノンパラメトリック」=「母集団の分布を仮定しない」という意味。
正規分布じゃなくても使えるので、幅広い場面で活躍します。

⚖️ t検定との違い

「比較の検定」といえばt検定が有名ですよね。ウィルコクソン検定とt検定、何が違うのでしょうか?

📊 t検定 vs ウィルコクソン検定

t検定 ウィルコクソン検定
分布の仮定 正規分布が必要 不要(ノンパラメトリック)
比較するもの 平均値 順位(中央値の傾向)
外れ値への強さ 弱い(影響を受けやすい) 強い(影響を受けにくい)
サンプルサイズ ある程度必要(目安:30以上) 小さくてもOK
検出力 高い(条件を満たせば) やや低い

簡単に言うと、「条件が整っていればt検定の方が優秀」だけど、「条件が整っていなくても使えるのがウィルコクソン検定」ということですね。

📚 関連記事

【完全図解】ヒストグラムとは?|データの「形」が一目でわかる最強のグラフ

データが正規分布かどうかを確認するには、まずヒストグラムで「分布の形」を見てみましょう。

🎯 2種類のウィルコクソン検定|対応あり?なし?

実は、「ウィルコクソン検定」と呼ばれるものには2種類あります。

「データに対応があるかどうか」で使い分けるんですね。ここが混乱しやすいポイントなので、しっかり整理しておきましょう。

①符号付順位検定

Wilcoxon Signed-Rank Test

「対応あり」のデータ用

同じ対象の「前」と「後」を比較
例:同じ人のダイエット前後の体重

対応のあるt検定の
ノンパラメトリック版

②順位和検定

Wilcoxon Rank-Sum Test(= Mann-Whitney U検定)

「対応なし」のデータ用

別々のグループを比較
例:A組とB組のテスト成績

対応のないt検定の
ノンパラメトリック版

🤔 「対応あり」「対応なし」ってどういうこと?

✅ 対応あり(ペアがある)

  • 同じ人の「前」と「後」
  • 同じ製品の「処理A」と「処理B」
  • 夫婦や双子のペアデータ

1対1で対応づけられるデータ

✅ 対応なし(独立している)

  • A組の生徒 vs B組の生徒
  • 男性グループ vs 女性グループ
  • 新薬投与群 vs プラセボ群

別々の集団を比較するデータ

📌 使い分けフローチャート

「どっちを使えばいいの?」と迷ったら、このフローチャートで確認しましょう。

2つのグループを比較したい
データに「対応」はある?

YES(同じ対象の前後など)

符号付順位検定
(Wilcoxon Signed-Rank)

NO(別々のグループ)

順位和検定
(Mann-Whitney U)

⚠️ 名前の混乱に注意!

「順位和検定」は「マン・ホイットニーのU検定」とも呼ばれます。
実は数学的には同じ検定なんです。文献によって呼び方が違うので、混乱しないように注意しましょう。

📚 関連記事

【QC検定】検定と推定の基礎|統計的仮説検定の考え方をわかりやすく解説

ウィルコクソン検定も「仮説検定」の一種。帰無仮説・対立仮説の考え方を復習しておくと理解が深まります。

📝 符号付順位検定のやり方|5ステップで完全理解

では、「符号付順位検定」の具体的な手順を見ていきましょう。

ダイエットプログラムの効果を検証する例で、ステップバイステップで解説しますね。

📊 例題:ダイエットプログラムの効果検証

6人がダイエットプログラムに参加しました。
「プログラム前後で体重に有意な差があるか?」を検定します。

参加者 前(kg) 後(kg)
Aさん 70 68
Bさん 65 64
Cさん 80 75
Dさん 72 70
Eさん 68 69
Fさん 75 71

Step 1:差を計算する

まず、各参加者の「後 − 前」の差を計算します。

参加者 差(後−前) 符号
Aさん 68 − 70 = −2
Bさん 64 − 65 = −1
Cさん 75 − 80 = −5
Dさん 70 − 72 = −2
Eさん 69 − 68 = +1 +
Fさん 71 − 75 = −4

マイナス(体重が減った)が5人、プラス(体重が増えた)が1人ですね。

Step 2:絶対値で順位をつける

次に、差の「絶対値」(プラスマイナスを無視した値)で順位をつけます

参加者 絶対値 順位
Bさん −1 1 1.5
Eさん +1 1 1.5
Aさん −2 2 3.5
Dさん −2 2 3.5
Fさん −4 4 5
Cさん −5 5 6

💡 「タイ(同順位)」の処理

絶対値が同じ値(タイ)がある場合は、順位の平均をとります。
例:絶対値「1」が2つ → 1位と2位の平均で 1.5位
例:絶対値「2」が2つ → 3位と4位の平均で 3.5位

Step 3:符号を戻して、順位を合計する

順位に元の符号(+/−)を戻して、プラスの順位の合計(W+)とマイナスの順位の合計(W−)を計算します。

➕ プラスの順位和(W+)

Eさんのみ:W+ = 1.5

➖ マイナスの順位和(W−)

1.5 + 3.5 + 3.5 + 5 + 6 = W− = 19.5

Step 4:検定統計量を求める

検定統計量Wは、W+とW−の小さい方を使います。

W = min(W+, W−) = min(1.5, 19.5) = 1.5

Step 5:統計表と比較して判定

最後に、求めたWを「ウィルコクソン検定表」の臨界値と比較します。

n=6(差が0でないデータ数)、有意水準5%(両側)の場合、臨界値は0です。

判定基準:W ≦ 臨界値 なら「有意差あり」

今回:W = 1.5 > 臨界値 0
有意水準5%では「有意差なし」と判定

ただし、サンプルサイズが6と非常に小さいため、検出力が低いことに注意が必要です。傾向としては体重が減っている人が多いので、サンプルを増やせば有意になる可能性があります。

📊 順位和検定(マン・ホイットニーU検定)のやり方

次に、「順位和検定」(マン・ホイットニーU検定)の手順を見ていきましょう。

こちらは「対応のない(独立した)2群」を比較する検定です。

📊 例題:2つのクラスのテスト成績比較

A組(4人)とB組(3人)のテスト成績を比較します。
「2つのクラスに成績の差があるか?」を検定します。

A組(n₁=4)

72, 85, 68, 90

B組(n₂=3)

65, 78, 70

Step 1:全データをまとめて順位をつける

まず、A組とB組のデータを全部まとめて、小さい順に順位をつけます。

点数 所属 順位
65 B組 1
68 A組 2
70 B組 3
72 A組 4
78 B組 5
85 A組 6
90 A組 7

Step 2:各グループの順位和を計算

グループごとに順位を合計します。

A組の順位和(R₁)

2 + 4 + 6 + 7 = 19

B組の順位和(R₂)

1 + 3 + 5 = 9

検算:R₁ + R₂ = 19 + 9 = 28 = 7×8÷2 = n(n+1)/2 ✓

Step 3:U統計量を計算

マン・ホイットニーのU統計量を計算します。

計算式:U₁ = n₁×n₂ + n₁(n₁+1)/2 − R₁

U₁ = 4×3 + 4×5/2 − 19 = 12 + 10 − 19 = 3

U₂ = 4×3 + 3×4/2 − 9 = 12 + 6 − 9 = 9

U = min(U₁, U₂) = min(3, 9) = 3

Step 4:統計表と比較して判定

n₁=4、n₂=3、有意水準5%(両側)の場合、臨界値は0です。

判定基準:U ≦ 臨界値 なら「有意差あり」

今回:U = 3 > 臨界値 0
有意水準5%では「有意差なし」と判定

A組の方が成績上位に位置していますが、サンプルサイズが小さいため、統計的に有意とは言えませんでした。実務では、もっと多くのサンプルで検証することが重要です。

📚 関連記事

【QC検定1級】データマイニング・テキストマイニング|品質管理におけるデータ活用

統計検定で得られた結果を、さらに深く分析するためのデータマイニング手法も学んでおきましょう。

📝 まとめ|ウィルコクソン検定を使いこなそう

最後に、この記事のポイントをまとめます。

✅ この記事のまとめ

1. ウィルコクソン検定とは:データを「順位」に変換して比較するノンパラメトリック検定。正規分布を仮定しなくてOK。

2. 2種類の検定:「対応あり」なら符号付順位検定、「対応なし」なら順位和検定(マン・ホイットニーU検定)を使う。

3. メリット:外れ値に強い、サンプルサイズが小さくても使える、分布の形を気にしなくていい。

4. 使いどころ:正規分布じゃないとき、サンプルが少ないとき、順序尺度データのとき。

🎯 検定の使い分け早見表

状況 対応あり 対応なし
正規分布OK・大サンプル 対応のあるt検定 対応のないt検定
正規分布NG・小サンプル 符号付順位検定 順位和検定(U検定)

ウィルコクソン検定は、「t検定が使えないとき」の強力な代替手段です。特に実務では、データが正規分布に従わないケースが多いので、ぜひ使いこなせるようになっておきましょう。

QC検定でもノンパラメトリック検定は出題されますので、しっかり理解しておいてくださいね。

📚 次に読むべき記事

📊 データの分布を確認したい方へ

【完全図解】ヒストグラムとは?|データの「形」が一目でわかる最強のグラフ

正規分布かどうかを判断する第一歩。ヒストグラムでデータの形を確認しましょう。

🎯 検定の基礎を固めたい方へ

【QC検定】検定と推定の基礎|統計的仮説検定の考え方をわかりやすく解説

帰無仮説・対立仮説・有意水準など、検定の基本概念をしっかり理解しましょう。

🔧 QC検定対策を進めたい方へ

【QC検定】新QC七つ道具とは?|言語データを整理して問題解決に導く7つの手法

統計的手法と合わせて、問題解決のためのQCツールもマスターしましょう。

タグ

-ノンパラメトリック・感性品質