Anomaly detection - 밀도 기반 이상치 탐지 (Gauss, MoG, Parzen window)
목적 주어진 데이터를 바탕으로, Gaussian을 가정하여, 각 객체들이 생성될 확률을 추정 새로운 데이터가 생성될 확률이 낮을 경우 이상치로 판단 학습 : 주어진 정상 데이터들을 통해 가우시안 분포의 평균 벡터와 공분산 행렬을 추정 테스트 : 새로운 데이터에 대하여 생성 확률을 구하고 이 확률이 낮을수록 이상치에 가까운 것으로 판정함 장점 추정이 간단하며 학습시간이 짧음 (mu와 sigma만 추정하면 됨) 적절한 기준치(cut-off)를 분포로부터 정할 수 있음 정상 데이터의 95% 를 정상이라고 판단하기 위해서, cut-off를 어떻게 가져가야 하는지에 대해서 정확하게 대답할 수 있음 각 변수의 측정 단위에 영향을 받지 않음 어떤 센서는 100단위, 어떤 센서는 0.0x 단위일 때 공분산 행렬을 사용..