心理統計法-分散分析(1)
目次
1 はじめに
ここでは分散分析 (Analysis of Variance: ANOVA)についての基本的な考え方と分散分析の使い方について書く。
2 特徴
分散分析は、t 検定 と同様に平均の 有意差検定 である。
t 検定 では2個の平均を比べることしか出来なかったが、 分散分析では3個以上の平均を比べることができる。
3 分散分析の計算例
以下の表を用いて分散分析を用いた平均の有意差検定を行ってみる。
ここでは2群間の例について述べる。
表1 実験結果のデータリスト
Name | 条件A | Name | 条件B |
---|---|---|---|
A | 2 | F | 5 |
B | 3 | G | 5 |
C | 4 | H | 7 |
D | 5 | I | 9 |
E | 6 | J | 9 |
3.1 データ表示
条件A、条件B の \(N\),\(\bar{X}\),\(SD\) を計算する。
条件A、条件B 共に \(N\) = 5
条件Aの平均 \(\bar{Xa}\) = 4.0
条件Bの平均 \(\bar{Xb}\) = 7.0
表2 各条件の \(\bar{X}\),\(SD\)
条件A | 条件B | |
---|---|---|
\(N\) | 5 | 5 |
\(\bar{X}\) | 4.0 | 7.0 |
\(SD\) | 1.4 | 1.8 |
3.2 大平均を求める
ここで、大平均 \(\bar{Xl}\) を以下の式より求める。
これにより、\(Xl\) = 5.5 となる。
3.3 それぞれの条件のデータと大平均のズレ (全分散)\(δ\) を計算する
上の式にあてはめると、
\(δ\) = 48.5
3.4 平均の差によって生じたズレ (平均の差による分散) を計算する
上の式にあてはめると、
\(δ2\) = 22.5
3.5 偶然による平均のズレ (偶然による平均の差の分散) を計算する
上の式にあてはめると、
\(δ3\) = 26.0
3.6 分散分析表の作成
上で計算した結果を表にまとめる。
表3 分散分析表
要因(SV) | 平方和(SS) | 自由度(df) | 平均平方(MS) | F |
---|---|---|---|---|
条件 | 22.50 | 1 | 22.50 | 6.92* |
誤差 | 26.00 | 8 | 3.25 | |
全体 | 48.50 | 9 | - | - |
3.6.1 要因
データの分散を生じさせた原因。
3.6.2 平方和
二乗の総和。ズレの分散値の合計。
3.6.3 自由度
条件の自由度=条件数-1
誤差の自由度=(Na-1)+(Nb-1)
全体の自由度=データの総個数-1
3.6.4 平均平方
自由度1個分に平均した平方和。自由度の大きい要因は平方和も大きくなるので、要因どうしの平方和を比べるときに、そのままでは公平な比較ができない。
そこで、自由度1個分の値に換算する。
3.6.5 F値
条件の平均平方が誤差の平均平方の何倍であるかを示す統計量。
条件の平均の差によるズレが、偶然の誤差によるズレより大きいかどうかを比較する。
上の例では、平均の差によるズレは偶然の誤差によるズレより約7倍も大きいことを示している。
3.7 F値の有意性を検定する
t 検定 と同様にF値がどの程度の大きさであれば有意と認めるかを検定する。
F分布表を用いる。F分布表をF値の出現確率を知ることが出来る。
表4 F分布表
df① | df② | F比 |
---|---|---|
1 | 7 | ・・・ |
8 | 3.46 5.32 11.26 | |
9 | ・・・ | |
出現確率 | - | 0.10 0.05 0.01 |
有意水準 | - | 有意傾向 5% 1% |
以上のことから、F=6.92 の偶然による出現確率は5%未満しかなく、有意性の基準をクリアしている。
このとき、分散分析表のF値に特別な記号「*」を付ける。記号の意味を以下に示す。
表5 出現確率による有意性の判定と表現の仕方
F値の出現確率 | 有意水準 | 表記 | 表現 |
---|---|---|---|
p > .10 | - | n.s. | 「有意でない」 |
.05 < p < .10 | 有意傾向 | † | 「有意傾向である」 |
p < .05 | 5% | * | 「有意である」 |
p < .01 | 1% | ** | 「有意である」 |
4 引用文献
小野寺 孝義. (2015). 心理・教育統計法特論 (放送大学大学院教材), 放送大学教育振興会.
田中 敏, 山際 勇一郎. (1992). ユーザーのための教育・心理統計と実験計画法 - 方法の理解から論文の書き方まで, 教育出版.