こんにちは、シラスです。
前回、実験データのバラつきを分解する「一元配置実験」の全体像をお話ししました。
いよいよ今日から、具体的な計算に入ります。
最初に計算するのは、すべての解析の「土台」であり、「源流」となる数値。
総平方和($S_T$)
Total Sum of Squares
「総」平方和という名前の通り、これは実験データの「バラつきの総量(全エネルギー)」です。
温度の効果も、材料の違いも、測定誤差も……
全てひっくるめて「今、目の前のデータは合計でどれくらい暴れているのか?」を数値化する。
ここが計算のスタート地点です。
もしここで間違えると、この後のF検定も推定も、全てドミノ倒しで崩壊します。
気合を入れて、データの「全貌」を捉えに行きましょう。
目次
1. $S_T$ のイメージ:「ホールケーキ」を焼け
分散分析(ANOVA)のゴールは、バラつきを「要因(シグナル)」と「誤差(ノイズ)」に切り分けることでした。
しかし、切り分けるためには、まず「切る前の全体像」を知らなければなりません。
総平方和($S_T$)とは、「ホールケーキ丸ごと」の大きさです。
この巨大なエネルギーの塊を、後で「温度の効果」や「誤差」にナイフで切り分けていきます。
まずは、このホールケーキの総重量を測るのです。
2. 計算手順:必殺「CT」を使う
では、計算していきましょう。
定義通りにやるなら「すべてのデータから平均値を引いて、二乗して…」となりますが、実務ではそんな面倒なことはしません。
以前習得した必殺技、「修正項(CT)」を使います。
総平方和($S_T$)の公式
やることはシンプルに2つだけです。
- 全開で二乗する:
何も考えず、手元の全データを二乗して足し合わせる($\sum x^2$)。 - 下駄を引く:
そこから、データの底上げ分である修正項($CT$)を引く。
たったこれだけで、純粋な「バラつきの総量」が手に入ります。
3. 実践:プラスチック強度の実験
具体的な数字がないと燃えませんよね。
以下のデータで計算してみましょう。
🏭 実験データ(強度)
- 温度A1(低温): 3, 4, 5
- 温度A2(高温): 7, 8, 9
(計算しやすいよう簡単な数字にしていますが、単位はMPaだと思ってください)
ステップ1:修正項(CT)を出す
まずは「下駄」の計算です。
全データの合計($T$)は、
$3+4+5+7+8+9 = \mathbf{36}$ です。
データ数($N$)は 6個 なので、
ステップ2:データの二乗和($\sum x^2$)を出す
ここが一番の力仕事です。全データを二乗して足します。
ステップ3:引き算して $S_T$ 完了!
最後に、二乗和から修正項を引きます。
出ました。「28」。
これが、この実験データ全体が持っている「バラつきの総エネルギー」です。
まとめ:これはまだ「塊(かたまり)」だ
しかし、これだけでは「バラついてるね(28だね)」ということしか分かりません。
私たちが知りたいのは、「そのバラつきのうち、どれくらいが『温度(シグナル)』のせいで、どれくらいが『誤差(ノイズ)』なのか?」です。
次回、この「28」という数字をナイフで切り分けます。
「群間平方和($S_A$)」と「群内平方和($S_e$)」。
この2つに分解できたとき、ついに実験の全貌が見えてきます。
統計学のおすすめ書籍
統計学の「数式アレルギー」を治してくれた一冊
「Σ(シグマ)や ∫(インテグラル)を見ただけで眠くなる…」 そんな私を救ってくれたのが、小島寛之先生の『完全独習 統計学入門』です。
この本は、難しい記号を一切使いません。 「中学レベルの数学」と「日本語」だけで、検定や推定の本質を驚くほど分かりやすく解説してくれます。
「計算はソフトに任せるけど、統計の『こころ(意味)』だけはちゃんと理解したい」 そう願う学生やエンジニアにとって、これ以上の入門書はありません。
【QC2級】「どこが出るか」がひと目で分かる!最短合格へのバイブル
私がQC検定2級に合格した際、使い倒したのがこの一冊です。
この本の最大の特徴は、「各単元の平均配点(何点分出るか)」が明記されていること。 「ここは出るから集中」「ここは出ないから流す」という戦略が立てやすく、最短ルートで合格ラインを突破できます。
解説が分かりやすいため、私はさらに上の「QC1級」を受験する際にも、基礎の確認用として辞書代わりに使っていました。 迷ったらまずはこれを選んでおけば間違いありません。