안녕하세요 이연욱 샘입니다.
강의시간에 설명했는데 다시 설명한다면,
X-direction에 있는 Outlier는 LSRL의 Slope에 영향을 주지만, Y-direction에 있는 Outliersms LSRL의 Slope에 영향을 많이 주지 않습니다.
예를들어 보도록 하겠습니다.
1. 다음의 data (1, 2.9), (2, 5.1), (3, 6.8), (4, 9.1), (5, 10.9) 에 관한 LSRL을 구하면,
y=2x+0.96 입니다.
2. Including X-direction outlier: 위의 data (1, 2.9), (2, 5.1), (3, 6.8), (4, 9.1), (5, 10.9) 에서 추가로 X-direction outlier (10,1)을 포함해서 LSRL을 구하면
y=-0.29x+7.177 이고 LSRL의 Slope 이 +2 에서 -0.29로 많이 변하는 것을 알 수 있습니다. 따라서, X-direction outlier는 influential point가 됩니다.
2. Including Y-direction outlier: 위의 data (1, 2.9), (2, 5.1), (3, 6.8), (4, 9.1), (5, 10.9) 에서 추가로 Y-direction outlier (1.5,10)을 포함해서 LSRL을 구하면
y=1.36x+3.71 이고 LSRL의 Slope 이 +2 에서 +1.36로 많이 변하지 않은 것을 알 수 있습니다. 따라서, Y-direction outlier는 influential point가 되지 않습니다.
감사합니다.