本文へジャンプ
Chapter 5

分散分析 (ANOVA):複数のグループ間の違いを比較する

#ANOVA#F統計量#群間分散#群内分散

分散分析 (ANOVA):名前に隠された平均比較

これまでに、2つのグループの平均を比較する際には t検定 を使用しました。では、3つ以上のグループの平均を比較したい場合にはどうすればよいでしょうか? t検定を何度も繰り返すと、誤差(過誤)が積み重なってしまいます。そこで必要になるのが**分散分析(Analysis of Variance, ANOVA)**です。

1. ANOVAの核心的原理:「分散」で「平均」を判断する

名前は「分散分析」ですが、目的は「平均の差」を見ることです。データの全体の変動を2つの要素に分けます。

  1. 群間分散 (Between-group Variance): 各グループが互いにどれだけ離れているか?(私たちが知りたい「差」)
  2. 群内分散 (Within-group Variance): 同じグループ内でデータがどれだけ散らばっているか?(偶然の「誤差」)

F統計量 = 群間分散 / 群内分散

このF値が十分に大きければ、「グループ間に意味のある平均の差がある」と結論付けます。

2. ANOVAテーブルの例

実際の分析結果は、以下のようなテーブル形式でまとめられます。

ライン配置による生産性の差の分析(ANOVA表)

変動要因平方和 (SS)自由度 (df)F統計量P値
群間(治療法/要因)1,250212.50.001
群内(誤差)8,40084--
合計9,65086--

3. ANOVAの次は何をするのか?(事後検定)

ANOVAで「差がある」という結論が出たとしても、「どのグループとどのグループが異なるのか」までは分かりません。これを確認するために、**事後検定(Post-hoc Test)**という追加のプロセルを経ることになります。


💡 教授からのヒント

ANOVAは「実験計画法」の基礎です。マーケティングで3つの広告案の効果を比較したり、工場で複数の部品の耐久性をテストしたりする際に、真っ先に手に取る地図のようなものです。

🔗 次のステップ