-
Mixture Model의 개념: 다수의 확률 밀도 함수(Probability density functions)를 선형적으로 결합(Linear superposition)하여 복잡한 데이터의 분포를 표현하는 통계 모델임

-
Gaussian mixture: 전체 분포를 K개의 가우시안 분포(Gaussians)의 가중합으로 모델링함
-
Mixture coefficients (pi)
- k번째 가우시안 분포가 선택될 사전 확률(Prior probabilities)을 의미함
- 모든 pi_k의 합은 1이 되며, 각각의 값은 0과 1 사이의 범위를 가짐
-
Generative Process (데이터 생성 관점)
- Per-sample perspective: 매 샘플을 생성할 때마다 사전 확률 pi에 기반하여 랜덤하게 K개의 가우시안 분포 중 하나를 선택한 후, 해당 가우시안 분포의 평균과 분산에 따라 데이터를 추출함
- Gaussian component perspective: 확률 pi에 비례하여 각 가우시안 분포에서 추출할 데이터의 총 개수를 미리 할당해두고, 각 분포별로 할당된 개수만큼의 데이터를 한 번에 추출함