Machine Learning/Statistics

Feature Scailing

고슴군 2021. 1. 3. 21:33

rfriend.tistory.com/270

 

[Python] 최소 최대 '0~1' 범위 변환 (scaling to 0~1 range) : sklearn.preprocessing.MinMaxScaler()

지난번 포스팅에서는 변수들의 척도(Scale)가 서로 다를 경우에 상호 비교를 위해서 표준화하는 방법으로서 - 정규분포를 따르는 데이터의 표준정규분포로의 표준화 (z standardization)    (평균과

rfriend.tistory.com

mkjjo.github.io/python/2019/01/10/scaler.html

 

[Python] 어떤 스케일러를 쓸 것인가?

* 본 포스트는 개인연구/학습 기록 용도로 작성되고 있습니다. By MK on January 10, 2019 데이터를 모델링하기 전에는 반드시 스케일링 과정을 거쳐야 한다. 스케일링을 통해 다차원의 값들을 비교 분

mkjjo.github.io

 

[강의]

1. Standard Scaler : 각 변수(Feature)가 정규분포를 따른다는 가정이기에 정규분포가 아닐 시 최선이 아닐 수 있음 

2. Min-Max Scaler : 각 변수(Feature)가 정규분포가 아니거나 표준편차가 매우 작을 때 효과적

3. Robust Scaler : 이상치(Outlier)에 영향을 최소화하였기에 이상치가 있는 데이터에 효과적이고 적은 데이터에도 효과적인 편

 

데이터에 따라 어느 scaler를 사용할지를 결정하는 것이 기본이지만, 이론과 현실은 다르다. Resource가 없을 때는 이론을 따르는 것이 최선이지만, 모두 다 해보고 성능이 나은 방향으로 가자.

반응형

'Machine Learning > Statistics' 카테고리의 다른 글

MCMC (Markov Chain Monte Carlo)  (0) 2022.02.08
상관계수  (1) 2022.01.07
Partial AutoCorrelation Function (PACF)  (0) 2020.12.29
Autocorrelation 이란?  (0) 2020.12.11
Feature Transformation  (0) 2020.08.20