検定・推定

【保存版】統計検定の選び方フローチャート|計量・計数、対応あり・なしで迷わない最強の地図

こんにちは、シラスです。

統計学やQC検定の勉強をしていて、一番「頭がパンクする瞬間」はどこでしょうか?

計算そのものでしょうか? いいえ、違います。 「今の問題に対して、どの検定手法を使えばいいのか分からない」という入口の部分です。

  • Z検定? t検定?
  • F検定をしてからt検定? ウェルチ?
  • 対応がある? ない?
  • カイ二乗?

教科書は手法ごとに章が分かれているので、「手法の横断的な選び方」を教えてくれるページは意外と少ないものです。

今日は、迷宮入りしやすい検定選びを、3つの質問だけでゴールまで辿り着ける「最強の地図(フローチャート)」にまとめました。

試験直前の見直しや、実務でのハンドブックとして活用してください。

質問1:データの種類は「計量値」か「計数値」か?

すべての分岐点はここから始まります。あなたが扱っているデータは、「測ったもの」ですか? それとも「数えたもの」ですか?

📍 第1分岐:データの種類
📏 計量値(連続データ)
長さ、重さ、時間、温度、強度など。
→ 「平均値」や「バラつき」を比べたいならこっち。
🔢 計数値(離散データ)
不良数、欠点数、人数、〇×判定など。
→ 「比率(%)」や「回数」を比べたいならこっち。

ルートA:「計量値」の検定マップ(平均・バラつき)

大半のエンジニアが使うのがこちらです。「平均値」を検定する場合、さらに細かい分岐があります。

質問2:母分散(真のバラつき)を知っていますか?

  • YES(知っている)
    • Z検定を使います。
    • ※ただし、これは「神様の視点」なので実務ではほぼ使いません。試験上の概念です。
  • NO(知らない)
    • データから標準偏差を計算しますか? ならばt検定の出番です。
    • 実務も試験も、99%はこちらのルートに進みます。

質問3:2つのデータに「対応」はありますか?

t検定を行う際、ここが最大の落とし穴です。

🔍 「対応あり」とは?

同一の対象から取ったペアデータのことです。
例:Aさんの「ダイエット前」と「ダイエット後」の体重。

逆に「対応なし」は、全く別の個体同士の比較です。
例:A組(男子)の身長と、B組(女子)の身長。

  • YES(対応あり)
    • 「対応のあるt検定」へ。
    • 個体差(ノイズ)を打ち消して、純粋な差を検定します。
  • NO(対応なし)
    • 「2標本のt検定」へ。
    • ただし、ここで最後の関門があります。「2つのグループのバラつき(分散)は同じですか?」

質問4:等分散ですか?(対応なしの場合)

ここで、まず「F検定」という前座が登場します。

  1. F検定を行う。
  2. 有意差なし(等分散と言える)
    • 「スチューデントのt検定」へ。(分散をプールする)
  3. 有意差あり(等分散と言えない)
    • 「ウェルチのt検定」へ。(分散をプールしない)

ルートB:「計数値」の検定マップ(比率・度数)

こちらはデータが「数えられる」場合です。シンプルですが、サンプル数(n)の大きさで道が分かれます。

パターン1:比率(%)を検定したい

「不良率が5%から3%に減ったと言えるか?」など。

  • サンプル数が多い(np>5)
    • 「母比率の検定(Z検定)」へ。
    • 二項分布を正規分布に近似させて解きます。QC検定の定番です。
  • サンプル数が少ない
    • 検定は難しいですが、あえてやるなら「フィッシャーの正確確率検定」などを使います。

パターン2:度数(回数)やズレを見たい

「サイコロの目は公平か?」「タバコと肺がんに関係はあるか?」など。

  • 1つの変数の偏りを見る
    • 「適合度の検定(カイ二乗検定)」へ。
    • 理論値(期待度数)と実測値のズレを見ます。
  • 2つの変数の関係を見る(クロス集計)
    • 「独立性の検定(カイ二乗検定)」へ。
    • 分割表(2×2表など)を使います。

まとめ:最強の選択フローチャート(保存版)

ここまでの話を一枚の表にまとめました。スマホに保存して、迷ったときにチラ見してください。

データの種類 知りたいこと 条件 使うべき検定手法
計量値
(連続量)
バラつきの大きさ 1つの群を判定 カイ二乗検定
バラつきの比較 2つの群を比較 F検定
平均値の比較 母分散が既知 Z検定
対応あり 対応のあるt検定
対応なし・等分散 t検定(Student)
対応なし・非等分散 ウェルチのt検定
計数値
(離散量)
比率の比較 サンプル大(np>5) 母比率のZ検定
適合度 理論値とのズレ カイ二乗検定
独立性 2変数の関係性 カイ二乗検定

統計的仮設検定は、計算式を覚えることよりも、「今、どの道を歩いているのか?」を把握することの方が何倍も重要です。

この地図さえ手元にあれば、どんな問題が出ても「ああ、あのルートね」と冷静に対処できるはずです。

タグ

-検定・推定