心理統計法-相関・予測の分析(1)
1 はじめに
有意差の分析が条件間の差異を見るのに対して、相関・予測の分析は条件間の関連をみる。
したがって、各条件のデータどうしは独立であってはならず、「対応のある」データでなければならない。
つまり、被験者1人に対して、対象者から2個以上のデータを取る必要がある。
2 3つの規則的関係
相関・予測分析は、「対応のある」データどうしの間に次のような3点の規則的関係を見出そうとする。
2.1 正の相関
正比例の関係があるかどうかをみる。
つまり、一方のデータの数値が大きければ(小さければ)他方のデータの数値も大きいなら(小さいなら)正の相関がある。
2.2 負の相関
反比例の関係があるかどうかをみる。
一方のデータの数値が大きい場合(小さい場合)、他方のデータの数値が小さいならば(大きい)、負の相関がある。
2.3 予測式
データどうしの相関関係を、一次方程式として表現する。
この方程式に一方のデータの任意の数値を代入することにより、他方のデータの数値を予測的に求めることが出来る。
3 事例1
たとえば、表1のような変数Aと変数Bのデータリストからは、図のような散布図を描くことができる。
表1 実験結果のデータリスト
被験者 | 変数A | 変数B |
---|---|---|
イ | 4 | 5 |
ロ | 7 | 9 |
ハ | 2 | 2 |
ニ | 5 | 4 |
ホ | 8 | 6 |
上のデータリストを散布図にすると以下になる。
3.1 散布図の目的
散布図を描く目的は、変数間の相関・予測が直線的であるかどうかをチェックするためである。
これは、相関・予測の分析は直線相関と一次方程式を予測の前提としているためである。
上の例では、相関・予測は直線的であると言える。
4 相関・予測が直線的でない場合の対処方法
相関・予測が直線的でない場合、つまり、曲線相関・曲線予測が想定される場合、以下の3つの対処方法がある。
4.1 数値を変換する
数値の変換によって、曲線相関を直線相関に変換する。
どのような数値に変換するかは試行錯誤を伴う。
例えば、以下のような方法がある。
- 横軸の変数を対数変換する
- 縦軸の変数を対数変換する
4.2 変数の分割
変数をいくつかに分割して、複数の直線をあてはめていく。
4.3 相関比を使う
曲線相関を曲線のまま扱う方法として相関比がある。
5 相関係数の計算
変数間の相関・予測が直線的であることが確認できたならば、次に相関係数を計算する。
相関係数とは、2変数の相関の強さと方向を表す統計量のことである。
この統計量は K. Pearson の考案によるので、特に「ピアソンの相関係数」という。
5.1 記号
相関係数の記号は「r」で示す。
「r」はデータの相関係数である。
5.2 r の性質
r の値は、-1~+1の範囲で変化する。但し、0を含む。
r の値がマイナスの場合は、「負の関数」であり、散布図上のデータは右下がりの直線に収束する傾向を示す。
r の値がプラスの場合は、「正の関数」であり、散布図上のデータは右上がりの直線に収束する傾向を示す。
完全相関 (r=ー1,r=+1)の場合は、全データが一本の直線上に乗る。
また、r=0 は「無相関」であり、データはどのような直線へ収束する兆しをみせない。
5.3 事例2
下表のような変数Aと変数Bのデータがある。
表2 実験結果のデータリスト
被験者 | 変数A | 変数B |
---|---|---|
イ | 1 | 6 |
ロ | 2 | 4 |
ハ | 3 | 5 |
ニ | 4 | 3 |
ホ | 5 | 1 |
5.3.1 データ表示
表3 データ表示
変数A | 変数B | |
---|---|---|
N | 5 | 5 |
\( \bar{X}\) | 3.0 | 3.8 |
\(SD\) | 1.4 | 1.7 |
5.3.2 偏差積和を計算する
\(σ\) = \(-11.0\) となる。
5.3.3 データ1組分の変数積和に換算する
上で計算した変数積和は変数Aと変数Bの5組分のデータなので、これを1組分のデータに換算する。
\(σ2\) = \(-2.2\) となる。
5.3.4 相関係数 r を計算する
以下の式により相関係数 r を計算する。
\(r\) = \(-.92\) となる。
\(r\) = -.92 は、完全な直線に対して9割程度の近似を意味する。
しかし、ここで負の相関関係にあると読み取ることができるが、この相関が偶然によって生じたかもしれない可能性もある。
5.3.5 相関係数 r の有意性検定
- F比を計算する\begin{eqnarray*} & {F} = & \frac {r^2}{\frac {(1-r^2)}{N-2}} \end{eqnarray*}
\(F\) = \(16.53\) となる。
- F比の分母、分子の自由度を計算する
分子の自由度 \(df①\) = \(変数の個数ー1\) = \(1\)
分母の自由度 \(df②\) = \(N-変数の個数\) = \(3\)
F比をF分布表を用いて出現確率を求める。
表4 F分布表
df① df② F比 1 3 5.54 10.13 34.12 出現確率 - .10 .05 .01 有意水準 - 有意傾向 5% 1%
これにより、 \(p\) < \(.05\) なので、有意であると言える。
5.3.6 相関の強さ
ここまでで、検定結果は有意であり偶然のユレによる出現はめったに発生しないことも確認できた。
しかし、相関の強さまでは保証していないため、相関の強さを判定する必要がある。
相関の強さの判定は一般的に以下の基準を用いる。
表5 相関の強さの判定基準
負の相関 | 相関の強さの判定 | 正の相関 |
---|---|---|
-1 ~-.7 | 強い相関がある | +1 ~+.7 |
-.7~-.4 | 中程度の相関がある | +.7~+.4 |
ー.4~-.2 | 弱い相関がある | +.4~+.2 |
-.2~0 | ほとんど相関がない | +.2~0 |
5.4 予測式の算出
一方の変数の値から他方の変数の値を予測する方程式を求めることが予測分析の目的である。
この方程式を予測式または回帰式という。
予測と回帰の違いは、見方の違いである。「変数Aを変数Bから予測する」は、「変数Aを変数Bに回帰させる」ことでもある。
5.4.1 予測式の説明
変数Aを変数Bから予測する場合の一次方程式は、次のように表すことができる。
ここで、Aは変数Aの予測された値を示すが、必ずしも実際の値とは一致しない。
\(k\) は、「傾き」を示す。\(k\) が「+」であれば予測直線は右上がり、\(k\) が「-」であれば予測直線は右下がりになる。
この \(k\) を回帰係数と呼ぶ。
5.4.2 予測方向
変数Aを変数Bから予測する場合と変数Bを変数Aから予測する場合とでは、予測式の \(k\), \(y\) の値が異なる。これは、予め予測の方向を決めておくことが前提となる。
5.5 事例3
下表のような変数Aと変数Bのデータがある。ただし、\(r\) = \(0.837\) とする。また、変数A(目的変数)を変数B(予測変数)から予測する予測式を求める。
表6 データ表示
変数A | 変数B | |
---|---|---|
N | 20 | 20 |
\( \bar{X}\) | 12.5 | 13.7 |
\(SD\) | 6.9 | 5.5 |
5.5.1 \(k\) を計算する
これにより、\(k\) = \(1.05\) となる。
5.5.2 \(y\) を計算する
これにより、\(y\) = \(-1.89\) となる。
5.5.3 予測式を完成させる
ゆえに、求める予測式は以下になる。
6 引用文献
小野寺 孝義. (2015). 心理・教育統計法特論 (放送大学大学院教材), 放送大学教育振興会.
田中 敏, 山際 勇一郎. (1992). ユーザーのための教育・心理統計と実験計画法 - 方法の理解から論文の書き方まで, 教育出版.