IQR1 판다스 pandas IQR 활용해서 이상점(outlier) 찾고 삭제하기 어떤 데이터를 분석하고 시각화하려 할 때 다른 값들과 확연한 차이가 나거나 비정상적인 이상점이 존재할 때 데이터가 의미하는 바를 제대로 분석하지 못할 수도 있다. 그래서 데이터 분석의 목적에 따라서 이상점을 삭제하거나 수정해야 한다. 이상점을 삭제하려면 우선 이상점을 찾아야 한다. 박스 플롯을 보면 데이터의 분포와 데이터들 사이에서 이상점의 개별적인 이상치를 볼 수 있다. 박스 플롯의 구성은 이렇다. 그래프 바깥에는 이상점이 표시된다. 즉, 데이터의 최댓값과 최솟값을 넘어가는 위치에 있는 값을 이상점이라 할 수 있다. 그리고 Q1은 제 1사분위로, 25%의 위치를 가르킨다. Q2는 제 2사분위로, 50%의 위치인 중앙값(median)을 가르킨다. Q3은 제 3사분위로, 75%의 위치를 가르킨다. Q1 -.. 2021. 7. 12. 이전 1 다음