多変量解析

【QC検定1級】固有値と寄与率を完全理解|累積寄与率で必要な主成分数を判断する方法

🔢 固有値(λ)とは? データの情報量を数値化する

主成分分析では、「固有値(Eigenvalue, λ)」という数値が非常に重要な役割を果たします。

💡 固有値の定義

λᵢ = Var(Zᵢ)
(固有値 = 主成分の分散)

つまり、固有値は「その主成分がどれだけ情報を持っているか」を表す数値です! 📊

🎯 イメージで理解:固有値の意味

データを散布図にプロットしたとき、データが広がっている方向に主成分の軸を引きます。

  • 📐 固有値が大きい → その方向にデータが大きく広がっている → 情報が多い
  • 📐 固有値が小さい → その方向にデータがあまり広がっていない → 情報が少ない

💡 覚え方
固有値が大きい = その方向に情報が多い = 重要な主成分! 🎯

📊 具体例:固有値の比較

3つの変数から主成分分析を行った結果、次の固有値が得られたとします。

固有値:
λ₁ = 2.1 (第1主成分)
λ₂ = 0.7 (第2主成分)
λ₃ = 0.2 (第3主成分)

この結果から何がわかるでしょうか?

  • 第1主成分(λ₁=2.1):一番情報が多い(最も重要)
  • 第2主成分(λ₂=0.7):2番目に情報が多い
  • 第3主成分(λ₃=0.2):情報が少ない(ほとんど無視できる)

次の図で、固有値と情報量の関係を視覚的に確認しましょう! 👇

📊 寄与率とは? 主成分の重要度を%で表現

固有値だけでは「絶対的な大きさ」はわかりますが、「全体の中でどれくらい重要か?」を知るには、寄与率(Contribution Rate)を計算します。

📐 寄与率の計算式

寄与率 = λᵢ / Σλⱼ × 100%

意味: その主成分が全体の何%の情報を持っているかを示す指標です! 📈

🧮 具体的な計算例

先ほどの例(λ₁=2.1, λ₂=0.7, λ₃=0.2)で、寄与率を計算してみましょう。

ステップ1: すべての固有値の合計を計算
Σλⱼ = 2.1 + 0.7 + 0.2 = 3.0

ステップ2: 各主成分の寄与率を計算
PC1の寄与率 = 2.1 / 3.0 × 100% = 70%
PC2の寄与率 = 0.7 / 3.0 × 100% = 23%
PC3の寄与率 = 0.2 / 3.0 × 100% = 7%

🎯 この結果の解釈

第1主成分だけで全体の70%の情報を説明できる!
✅ 第2主成分を加えると93%(70%+23%)の情報をカバー
✅ 第3主成分はわずか7%の情報しか持たない

上位2つの主成分だけで十分だとわかります! 🎉

次の図で、寄与率の計算と視覚化を確認しましょう! 👇

📈 累積寄与率とは? 必要な主成分数を判断する

累積寄与率(Cumulative Contribution Rate)は、「ここまでの主成分で合計何%の情報をカバーできるか?」を示す指標です。

📐 累積寄与率の計算式

累積寄与率 = Σ(λ₁~λᵢ) / Σλⱼ × 100%

意味: 第1主成分から第i主成分までで、合計何%の情報を説明できるかを示します! 📊

🧮 具体的な計算例

先ほどの例で、累積寄与率を計算してみましょう。

主成分 固有値(λ) 寄与率(%) 累積寄与率(%)
PC1 2.1 70% 70%
PC2 0.7 23% 93%
PC3 0.2 7% 100%

🎯 累積寄与率の使い方:何個の主成分を使うか?

累積寄与率を見れば、「何個の主成分を使えば十分か?」が判断できます。

✅ 判断基準(QC検定1級で頻出!)

  • 📊 累積寄与率80〜90%以上 → 次元削減OK!
  • 📊 上記の例では、PC1とPC2で93% → 2つで十分!
  • 📊 5変数 → 2主成分に圧縮できる! 🎉

💡 実務での使い方
元のデータが10変数あっても、累積寄与率90%になる上位2〜3主成分だけを使えば、ほとんどの情報を保ったまま分析が簡単になります!

次の図で、累積寄与率のグラフ(スクリープロット)と判断基準を確認しましょう! 👇

🎓 QC検定1級対策:固有値・寄与率の頻出問題

QC検定1級では、固有値と寄与率に関する計算・解釈問題が頻出します。実践的なポイントを確認しましょう。

📝 典型的な出題パターン

【問題例】
次の相関行列の固有値が得られた。寄与率と累積寄与率を求め、何個の主成分を使うべきか判断せよ。

固有値: λ₁=4.2, λ₂=1.8, λ₃=0.9, λ₄=0.5, λ₅=0.6

解答の流れ:

  1. Σλ = 4.2+1.8+0.9+0.5+0.6 = 8.0 を計算
  2. 各主成分の寄与率を計算(λᵢ/8.0×100%)
  3. 累積寄与率を計算
  4. 累積寄与率が80〜90%になる主成分数を選ぶ

⚠️ よくある間違い

  • 間違い1: 固有値と寄与率を混同する
    → 固有値は「絶対値」、寄与率は「割合(%)」!
  • 間違い2: 分母のΣλを忘れる
    → 必ず全固有値の合計で割る!
  • 間違い3: 累積寄与率の計算ミス
    → 前の主成分までの寄与率を「足し算」していく!

✅ 正しい手順

  1. まずΣλを必ず計算!
  2. 各λᵢをΣλで割って寄与率を求める
  3. 寄与率を順番に足していき累積寄与率を計算
  4. スクリープロット(折れ線グラフ)で視覚的に確認

🏭 実務例:製造業の品質管理

製品の品質特性(寸法A、寸法B、重量、硬度、表面粗さ、…)を8項目測定したデータがあるとします。

分析結果:
固有値: λ₁=4.2, λ₂=1.8, λ₃=0.9, λ₄=0.5, ...
寄与率: PC1=52%, PC2=23%, PC3=11%, ...
累積寄与率: PC1=52%, PC2=75%, PC3=86%

判断: 累積寄与率86%の3主成分を使用 → 8変数を3変数に圧縮! ✨

次の図で、実践的な活用法と試験対策のポイントを確認しましょう! 👇

✅ まとめ:固有値・寄与率・累積寄与率の完全理解!

🎯 この記事のポイント

用語 計算式 意味
固有値(λᵢ) λᵢ = Var(Zᵢ) 主成分の分散(情報量)
寄与率 λᵢ / Σλⱼ × 100% 全体の何%の情報か
累積寄与率 Σ(λ₁~λᵢ) / Σλⱼ × 100% 上位i個で合計何%か

💡 重要ポイント

  • 固有値が大きい = その主成分が重要
  • 寄与率 = 個別の主成分の重要度(%)
  • 累積寄与率80〜90%以上 = 次元削減OK!
  • 計算手順: ①Σλ計算 → ②寄与率計算 → ③累積寄与率計算
  • スクリープロットで視覚的に確認すると理解しやすい!

🎓 QC検定1級合格への道

  • 📝 計算問題は必ず出る! → 手を動かして練習
  • 📝 統計ソフトの出力を読む問題も頻出
  • 📝 累積寄与率から主成分数を判断する問題に慣れる
  • 📝 過去問10年分を解けば、パターンが見えてくる!

📚 関連記事

🎉 この記事が役に立ったら、SNSでシェアしてくださいね!
一緒にQC検定1級合格を目指しましょう! 💪✨

タグ

-多変量解析
-