|
|
|
|
상관계수제시방법
|
|
|
|
상관계수
단순 회귀 계수 b는 하나의 변수 X가 하나의 변수 Y에 어떻게 영향을 미치는 가를 알려주었다 그러나 상관계수는 조금 다른 각도에서 접근하는데 여기에는 인과 관계가 없다는 것이다. 예를 들면 학생들의 수학점수와 영어점수는 어떠한 상관이 있는가를 알아볼 수 있다. 그러나 회귀계수처럼 영어를 잘하는 것이 수학에 영향을 미치는지 아니면, 수학을 잘하는 것이 영어에 영향을 미치는지, 선후 관계를 알 수가 없다. 서로 선후관계를 알 수 없고, 따라서 인과 관계를 설정할 수 없는 것이다. 즉 상관관계가 있다는 말은 두 변수들이 같이 움직인다는 것은 증명할 수는 있으나, 두 변수 사이의 인과관계를 설정할 수는 없다. 따라서 만일 인과 관계를 가정할 수 있다면 상관계수가 아닌 회귀식을 도출하여야 할 것이다. 반대로 인과 관계를 설정할 수 없다면 상관계수를 구하면 된다.
상관계수는 0-1사이의 값이며, 산포가 모호할수록 r의 값은 0에 접근한다.
여러 가지 상관관계를 그래프로 그려보면 아래와 같다.
아버지의 키에 대한 아들의 키의 상관
학생 폭력과 약물중독
학업성취와 자아개념
결정계수(coefficient deteermination)
결정계수는 상관계수 r의 제곱이다 . r2은 종속변인 Y를 설명하는 비율을 나타낸다.
만일 R2이 0이면 X와 Y는 아무런 직선적 관계가 성립하지 않으며, 독립변인 X가 아무 것도 Y에 대하여 설명하지 못하는 것이다.
회귀모형으로 할 것인가 상관모형으로 할 것인가
회귀와 상관은 모두 종속변인 Y가 무작위 변인(메트릭 자료)일 것을 요구한다. 그러나 독립변인에 있어서는 회귀는 범주형 자료이든 메트릭 자료이든 관계가 없다. 또한 회귀식에서는 독립변수가 메트릭 자료라 할지라도 범주형 자료로 바꾸어 사용할 수 있다.( 예 월급액수- 100만 이상, 150만 이상... 또는 실제 나이를 20이상, 30 이상 40이상 등으로)
.... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|