実験計画法

総平方和(St)の計算|データ全体のバラつきを数値化する|一元配置実験⑥

📊 こんな疑問、ありませんか?

  • 「総平方和」って何を計算しているの?
  • なぜ「全体のバラつき」を最初に求めるの?
  • S_T の具体的な計算手順を知りたい!

こんにちは、シラスです。

前回の記事で、平方和(S)と自由度(f)の関係について学びました。

いよいよ今日から、具体的な計算に入ります。
最初に計算するのは、すべての解析の「土台」であり、「源流」となる数値。

総平方和(ST

Total Sum of Squares

「総」平方和という名前の通り、これは実験データの「バラつきの総量(全エネルギー)」です。

温度の効果も、材料の違いも、測定誤差も……
全てひっくるめて「今、目の前のデータは合計でどれくらい暴れているのか?」を数値化します。

⚠️ 注意:ここが計算のスタート地点です

もしここで間違えると、この後のF検定も推定も、全てドミノ倒しで崩壊します。
気合を入れて、データの「全貌」を捉えに行きましょう。

✅ この記事で学べること

  • 総平方和(STの意味=「ホールケーキ丸ごと」のイメージ
  • 計算公式:ST = Σx² − CT
  • 実践:プラスチック強度のデータで実際に計算
  • なぜ「総量」を最初に求めるのか、その理由

📖 前回の記事

平方和(S)と自由度の関係|「分散」を求める準備|一元配置実験⑤

平方和と自由度の関係を「お肉のパック」で解説しています。

1. ST のイメージ:「ホールケーキ」を焼け

分散分析(ANOVA)のゴールは、バラつきを「要因(シグナル)」「誤差(ノイズ)」に切り分けることでした。

しかし、切り分けるためには、まず「切る前の全体像」を知らなければなりません。

🎂 ケーキ屋さんで考える

🎂

総平方和(ST)とは
「ホールケーキ丸ごと」の大きさです

この巨大なエネルギーの塊を、後で「温度の効果」や「誤差」にナイフで切り分けていきます。
まずは、このホールケーキの総重量を測るのです。

ケーキを6人で分けるとき、あなたはどうしますか?

いきなりナイフを入れますか?
いいえ、まず「ケーキ全体の大きさ」を確認しますよね。

分散分析も同じです。データのバラつきを「効果」と「誤差」に分けるために、まず「バラつき全体の大きさ」を測ります。

📊 ケーキと統計の対応関係

ケーキの話統計の話
ホールケーキ丸ごと総平方和 ST
チョコレート部分群間平方和 SA(効果)
スポンジ部分群内平方和 Se(誤差)

🏠 もう一つのたとえ:「家計簿の総支出」

ケーキのイメージがピンとこなければ、家計簿で考えてみましょう。

💰

今月の総支出 = ST

食費も、光熱費も、娯楽費も
全部ひっくるめた金額

📊

内訳を知りたい!

「食費がいくら?」「娯楽費は?」
→ 切り分けて分析

家計簿で「今月どこにお金を使いすぎたか」を調べるとき、まず「総支出」を確認しますよね。

総平方和(ST)は、データの「総支出」。
これを知らないと、内訳(効果・誤差)を分析できません。

2. 計算手順:必殺「CT」を使う

では、計算していきましょう。

定義通りにやるなら「すべてのデータから平均値を引いて、二乗して…」となりますが、実務ではそんな面倒なことはしません。

以前習得した必殺技、「修正項(CT)」を使います。

📐 総平方和(ST)の公式

ST = Σx² − CT

二乗の合計 − 修正項(底上げ分)

🎯 やることは2つだけ

計算手順はとてもシンプルです。

1️⃣

全開で二乗する

何も考えず、手元の全データを
二乗して足し合わせる(Σx²)

2️⃣

下駄を引く

そこから、データの底上げ分である
修正項(CT)を引く

たったこれだけで、純粋な「バラつきの総量」が手に入ります。

🤔 なぜ「CT(修正項)」を引くの?

データをそのまま二乗すると、「平均値からのズレ」だけでなく、「平均値そのものの大きさ」も含まれてしまいます。

CTを引くことで、平均値の「底上げ分」を取り除き、純粋なバラつきだけを取り出せるのです。

→ 修正項(CT)の詳しい解説はこちら

🚰 イメージ:「水道メーター」で考える

この計算を水道メーターでたとえてみましょう。

あなたの家の水道メーターが1000を示しています。

でも、入居時にすでに950だったとしたら?

あなたが使った水の量 = 1000 − 950 = 50

水道の話統計の話
今のメーター値(1000)Σx²(二乗の合計)
入居時の値(950)CT(修正項=底上げ分)
実際に使った量(50)ST(純粋なバラつき)

3. 実践:プラスチック強度の実験

具体的な数字がないと燃えませんよね。
以下のデータで計算してみましょう。

🏭 実験データ(強度)

プラスチックの強度を、2つの温度条件で測定しました。

条件データ
温度A1(低温)3, 4, 5
温度A2(高温)7, 8, 9

※計算しやすいよう簡単な数字にしていますが、単位はMPaだと思ってください

ステップ1:修正項(CT)を出す

まずは「下駄(底上げ分)」の計算です。

全データの合計(T)を求める

T = 3 + 4 + 5 + 7 + 8 + 9 = 36

データ数(N)を確認

N = 6個

CT = T² ÷ N = 36² ÷ 6 = 1296 ÷ 6 = 216

ステップ2:データの二乗和(Σx²)を出す

ここが一番の力仕事です。全データを二乗して足します。

各データを二乗する

データ345789
二乗91625496481

Σx² = 9 + 16 + 25 + 49 + 64 + 81 = 244

ステップ3:引き算して ST 完了!

最後に、二乗和から修正項を引きます。

最終計算

ST = 244 − 216 = 28

🎉 出ました!「28」

これが、この実験データ全体が持っている「バラつきの総エネルギー」です。
ホールケーキの総重量が「28」だと分かりました!

📋 計算結果まとめ

項目計算結果
合計 T3+4+5+7+8+936
修正項 CT36²÷6216
二乗和 Σx²9+16+25+49+64+81244
総平方和 ST244−21628

まとめ:これはまだ「塊(かたまり)」だ

📝 今日のポイント

✅ 総平方和(ST

実験データのバラつきの
「総量(ホールケーキ)」

✅ 公式

ST = Σx² − CT
二乗和から修正項を引くだけ

✅ 役割

全ての計算の
「土台(分母)」になる

しかし、これだけでは「バラついてるね(28だね)」ということしか分かりません。

私たちが知りたいのは、「そのバラつきのうち、どれくらいが『温度(シグナル)』のせいで、どれくらいが『誤差(ノイズ)』なのか?」です。

🔪 次回、この「28」という数字をナイフで切り分けます

「群間平方和(SA)」「群内平方和(Se)」
この2つに分解できたとき、ついに実験の全貌が見えてきます。

📖 次に読む記事

群間平方和と群内平方和|バラつきを「効果」と「誤差」に分解する|一元配置実験⑦

今回求めた「総平方和(28)」を、「温度の効果」と「誤差」に切り分けます。これができれば、分散分析の8割は理解したも同然です!

次の記事を読む →

📚 あわせて読みたい

🔢 前回の復習

平方和(S)と自由度の関係|「分散」を求める準備

S÷f=Vの関係を「お肉のパック」で解説しています。

📊 基礎知識

修正項(CT)とは?T²/Nの計算式を図解で理解する

なぜCTを引くのか?底上げ分の意味を詳しく解説。

🔬 実験の基礎

誤差とは?実験や統計で必ず出るズレの正体を解説

「誤差」の概念を初心者向けに解説しています。

📈 シリーズ入門

分散分析とは?「平均の差」ではなく「分散」を見る理由

分散分析の基本概念をカレー作りで解説。

📖 一元配置実験マスター講座【全16回】

このシリーズを順番に読めば、一元配置実験を完全マスターできます!

① 分散分析とは?「平均の差」ではなく「分散」を見る理由 ② 一元配置実験とは?1つの因子で白黒つける実験の基本形 ③ 一元配置実験の計算の全体像|分散分析表を作るまでの地図 ④ 修正項(CT)とは?T²/Nの計算式を図解で理解する ⑤ 平方和(S)と自由度の関係|「分散」を求める準備
⑥ 総平方和(S_T)の計算|データ全体のバラつきを数値化する 👈 今ここ
⑦ 群間平方和と群内平方和|バラつきを「効果」と「誤差」に分解する ⑧ 分散分析表(ANOVA)の作り方|表を完成させる手順 ⑨ F検定で有意差を判定する|F分布表の使い方 ⑩ 母平均の点推定と区間推定|最適条件の結果を予測する ⑪ 有効繰返し数とは?実験回数の最適解を導く考え方 ⑫ 有効繰返し数の計算方法|2つの公式を使い分ける ⑬ 平均平方の期待値E(V)とは?数式の意味を直感的に理解する ⑭ 分散分析表の作り方完全ガイド|S→V→Fの流れを総復習 ⑮ 一元配置実験の分散分析を実践|カレーの例で手を動かす ⑯ 一元配置実験の計算を完全図解|分散分析表を1から作る全手順

タグ

-実験計画法
-