안녕하세요 이연욱 샘입니다.
첫번째 질문: "correlation of determination이 proportion of the variation in response variable Y that is predictable from the independent variable X. 라고 되어있는데 정확히 이해가 가지 않습니다"
첫번째 질문에 대한 대답: Coefficient of determination에 관한 좋은 질문이네요. 하지만, 이를 설명하기 위해서는 AP Statistics보다 더 높은 level 의 Statistics (대학교 3-4학년 level)를 선택해서 공부해야 이해할 수 있습니다. 예를 들면, the volume of a sphere 의 공식은 V=4/3* pi *r^3 이고 6-7학년때 Pre-algebra 에서 배웠고 선생님이 memorize 라고 했을 것입니다. 하지만, 이 공식을 증명하기 위해서는 11학년-12학년때 배우는 AP Calculus가 필요합니다. Volume of a sphere 공식을 구하는 방법을 Calculus 를 이용하여 설명하더라도 6-7학년 학생은 이해할 수 없기 때문에 공식을 그냥 momorize 하는 것입니다. 같은 이유에서 Coefficient of determination에 대해서 이 글에서 설명할 수가 없습니다. 지금 이 단계에서는 그 의미를 memorize 하는 것이 최선의 방법입니다.
두번째 질문: "correlation을 linear equation, y=x+5 로 보고 slope이 1이니 r도 1이라고 봐도 괜찮을까요?"
두번재 질문에 대한 대답: slope이 1 이라서 r=1 이 아닙니다. 먼저, correlation formula를 참고하시기를 바랍니다. 모든 x values의 값이 5 만큼 증가하면 아래와 같이
yi ---> xi+5
mean(y) ---> mean(x)+5
와 같이 증가하지만, standard deviation 은
Sy ---> Sx
변함이 없습니다. 따라서, yi, mean(y) , Sy를 correlation formula 에 집어 넣고 정리하면 correlation이 변화되지 않는 것을 알 수 있습니다.
질문에 도움이 되었으면 합니다. 감사합니다.