728x90 Boxchart1 python, pandas series type에서 이상치(outlier) 제거 하기 데이터 관련하여 포스팅하면서 가장 어려운 부분이 대상 데이터를 만드는 것이다. 실제 데이터는 회사 내에서 추출이 안되니 내가 경험했던 것과 유사한 데이터를 임의로 만들야 하기 때문이다. 그래도 데이터를 생성하는 것도 하나의 재미를 주기 때문에 그리 나쁘지만은 않다. 이상치 제거를 하기 위해 이상치가 포함된 데이터를 우선 만들어 보기로 한다. 1. 정규분포를 갖는 일반 데이터 생성 자연계의 데이터들은 일반적으로 정규분포를 갖는다라는 이론이 있다. 실제 데이터 처리 및 분석 시 정규분포의 평균과 표준편차를 많이 이용한다. 데이터를 생성하기 위해 정규분포를 이용했다. python에서 사용할 라이브러리는 다음과 같이 import 시킨다. import numpy as npimport pandas as pdimp.. 2022. 3. 1. 이전 1 다음 728x90