선생님 안녕하세요.
실생활에서 주로 정규분포가 많이 쓰인다고 들었습니다. 그 이유는 어떤 현상이 정규분포를 따르는 경우가 많아서라고 들었어요.
정규분포에서는 Skewed 된 부분에 outlier가 있을 수 있고,
이론 강의 1에서 배운 내용을 정리해보자면,
Histogram->Ogive로 발전을 했고, Ogive랑 Boxplot은 percentile를 나타낸다는 점에서 유사합니다.
Boxplot에서, Q1이 25th percentile인데, 이 percentile에 range(Max-Min)에 없는 outlier도 포함되는 것인가요?
Ogive랑 Histrogram은 당연히 outlier가 포함되어 있을텐데, Boxplot은 잘 모르겠어요.
안녕하세요 이연욱 샘입니다.
Outlier를 결정하는 기준은 Q1-1.5xIQR 보다 작거나 Q3+1.5xIQR 입니다. 따라서, Q1나 Q3에 절대로 outlier를 포함할 수 없습니다.
질문에 도움이 되었으면 합니다. 감사합니다.