こんにちは、シラスです。
前回までで、F検定を行い、最適な条件での強度を予測(推定)しました。
計算は全て終わり、素晴らしい結果が出ました。
しかし、プロのエンジニアなら、ここでシャンパンを開ける前にもう一つだけやるべきことがあります。
実験計画法は、「データは正規分布に従う」「バラつきは一定である」という前提条件(ルール)の上で成り立っています。
もしこの前提が崩れていたら、これまで計算したF値も信頼区間も、すべて無効になってしまいます。
今日は、実験の最後に行うデータの健康診断、「残差分析(Residual Analysis)」について解説します。
目次
1. 残差(Residual)とは?
まずは定義から。
残差とは、「実測値」と「予測値(平均値)」のズレのことです。
つまり、温度などの効果を取り除いた後に残る「純粋なノイズ(残りカス)」のことです。
「健康な残差」の条件
もし実験がうまくいっていれば、この「残りカス」は綺麗な状態になっているはずです。
- ① 正規性: ゼロを中心に、綺麗な釣鐘型の分布をしているか?
- ② 等分散性: どの水準でも、バラつきの幅は同じくらいか?
- ③ 独立性: 時間経過で徐々に増えたりしていないか?
これらを確認するのが「残差分析」です。
2. 実践:残差を計算してみる
前回のデータを使って計算してみましょう。
- 温度A1(平均 4.0): 実測値 $\{3, 4, 5\}$
- 温度A2(平均 8.0): 実測値 $\{7, 8, 9\}$
それぞれの実測値から、そのグループの平均値を引きます。
- A1の残差:
- $3 - 4.0 = \mathbf{-1}$
- $4 - 4.0 = \mathbf{0}$
- $5 - 4.0 = \mathbf{+1}$
- A2の残差:
- $7 - 8.0 = \mathbf{-1}$
- $8 - 8.0 = \mathbf{0}$
- $9 - 8.0 = \mathbf{+1}$
残差データをまとめると、$\{-1, 0, 1, -1, 0, 1\}$ となります。
3. グラフで診断する
数字だけ見ても分からないので、グラフ(ヒストグラムや散布図)を描いて診断します。
これを「残差プロット」と呼びます。
診断①:正規性のチェック(ヒストグラム)
残差を集めてヒストグラムを作ります。
今回の場合、$-1, 0, +1$ が均等にあり、左右対称です。
これがもし、「右側だけ極端に長い(歪んでいる)」場合は要注意です。
「対数変換」などをしてデータを整形する必要があるかもしれません。
診断②:異常値のチェック(外れ値)
もし残差の中に、一つだけ「+10」みたいな巨大な値があったら?
それは「測定ミス」か「突発的なトラブル」の可能性が高いです。
そのような「外れ値」をそのままにして解析すると、平均値や分散が歪められ、誤った結論(F検定の結果)を導いてしまいます。
原因を調査し、正当な理由があれば除外(トリミング)します。
診断③:変なクセがないか?
実験順序に残差を並べてみます。
- 最初の方はマイナスばかり、後半はプラスばかり → 「ドリフト(装置の状態変化)」を疑う。
- ジグザグに動いている → 「交互作用」や「測定者のクセ」を疑う。
まとめ:異常がなければ「合格」
F検定で有意差が出たからといって、すぐに飛びついてはいけません。
最後にこの「健康診断」を経て、異常なしと確認されて初めて、そのデータは「真実」として世に出せるのです。
これで、一元配置実験の基礎シリーズは完結です。
しかし、実務では「温度」だけでなく「圧力」も「材料」も同時に変えたい!というケースがほとんどでしょう。
次回からは、要因を2つに増やした「二元配置実験」。
そして、実験計画法の最大の山場である「交互作用」の世界へと足を踏み入れます。
統計学のおすすめ書籍
統計学の「数式アレルギー」を治してくれた一冊
「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。
この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。
「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。
【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル
私がQC検定2級に合格した際、使い倒したのがこの一冊です。
この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。
解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。