Course Progress
Part of 10 Chapters
Chapter 5
分散分析 (ANOVA):複数のグループ間の違いを比較する
#ANOVA#F統計量#群間分散#群内分散
分散分析 (ANOVA):名前に隠された平均比較
これまでに、2つのグループの平均を比較する際には t検定 を使用しました。では、3つ以上のグループの平均を比較したい場合にはどうすればよいでしょうか? t検定を何度も繰り返すと、誤差(過誤)が積み重なってしまいます。そこで必要になるのが**分散分析(Analysis of Variance, ANOVA)**です。
1. ANOVAの核心的原理:「分散」で「平均」を判断する
名前は「分散分析」ですが、目的は「平均の差」を見ることです。データの全体の変動を2つの要素に分けます。
- 群間分散 (Between-group Variance): 各グループが互いにどれだけ離れているか?(私たちが知りたい「差」)
- 群内分散 (Within-group Variance): 同じグループ内でデータがどれだけ散らばっているか?(偶然の「誤差」)
F統計量 = 群間分散 / 群内分散
このF値が十分に大きければ、「グループ間に意味のある平均の差がある」と結論付けます。
2. ANOVAテーブルの例
実際の分析結果は、以下のようなテーブル形式でまとめられます。
ライン配置による生産性の差の分析(ANOVA表)
| 変動要因 | 平方和 (SS) | 自由度 (df) | F統計量 | P値 |
|---|---|---|---|---|
| 群間(治療法/要因) | 1,250 | 2 | 12.5 | 0.001 |
| 群内(誤差) | 8,400 | 84 | - | - |
| 合計 | 9,650 | 86 | - | - |
3. ANOVAの次は何をするのか?(事後検定)
ANOVAで「差がある」という結論が出たとしても、「どのグループとどのグループが異なるのか」までは分かりません。これを確認するために、**事後検定(Post-hoc Test)**という追加のプロセルを経ることになります。
💡 教授からのヒント
ANOVAは「実験計画法」の基礎です。マーケティングで3つの広告案の効果を比較したり、工場で複数の部品の耐久性をテストしたりする際に、真っ先に手に取る地図のようなものです。