mkjjo.github.io/python/2019/01/10/scaler.html
[강의]
1. Standard Scaler : 각 변수(Feature)가 정규분포를 따른다는 가정이기에 정규분포가 아닐 시 최선이 아닐 수 있음
2. Min-Max Scaler : 각 변수(Feature)가 정규분포가 아니거나 표준편차가 매우 작을 때 효과적
3. Robust Scaler : 이상치(Outlier)에 영향을 최소화하였기에 이상치가 있는 데이터에 효과적이고 적은 데이터에도 효과적인 편
데이터에 따라 어느 scaler를 사용할지를 결정하는 것이 기본이지만, 이론과 현실은 다르다. Resource가 없을 때는 이론을 따르는 것이 최선이지만, 모두 다 해보고 성능이 나은 방향으로 가자.
반응형
'Machine Learning > Statistics' 카테고리의 다른 글
MCMC (Markov Chain Monte Carlo) (0) | 2022.02.08 |
---|---|
상관계수 (1) | 2022.01.07 |
Partial AutoCorrelation Function (PACF) (0) | 2020.12.29 |
Autocorrelation 이란? (0) | 2020.12.11 |
Feature Transformation (0) | 2020.08.20 |