Feature Scailing
[Python] 최소 최대 '0~1' 범위 변환 (scaling to 0~1 range) : sklearn.preprocessing.MinMaxScaler()
지난번 포스팅에서는 변수들의 척도(Scale)가 서로 다를 경우에 상호 비교를 위해서 표준화하는 방법으로서 - 정규분포를 따르는 데이터의 표준정규분포로의 표준화 (z standardization) (평균과
rfriend.tistory.com
mkjjo.github.io/python/2019/01/10/scaler.html
[Python] 어떤 스케일러를 쓸 것인가?
* 본 포스트는 개인연구/학습 기록 용도로 작성되고 있습니다. By MK on January 10, 2019 데이터를 모델링하기 전에는 반드시 스케일링 과정을 거쳐야 한다. 스케일링을 통해 다차원의 값들을 비교 분
mkjjo.github.io
[강의]
1. Standard Scaler : 각 변수(Feature)가 정규분포를 따른다는 가정이기에 정규분포가 아닐 시 최선이 아닐 수 있음
2. Min-Max Scaler : 각 변수(Feature)가 정규분포가 아니거나 표준편차가 매우 작을 때 효과적
3. Robust Scaler : 이상치(Outlier)에 영향을 최소화하였기에 이상치가 있는 데이터에 효과적이고 적은 데이터에도 효과적인 편
데이터에 따라 어느 scaler를 사용할지를 결정하는 것이 기본이지만, 이론과 현실은 다르다. Resource가 없을 때는 이론을 따르는 것이 최선이지만, 모두 다 해보고 성능이 나은 방향으로 가자.