본문 바로가기

ml_interview

Marginal Distribution, 주변 분포

다변량 확률 분포에서 특정 변수 또는 변수 집합에 대한 분포를 나타내는 것으로, 다른 변수들을 고려하지 않고 해당 변수들에 대한 정보를 제공한다. 

주변 분포는 다변량 분포에서 관심 있는 변수들만을 추출하여 단변량 또는 다변량 분포로 축소하는 과정에서 유용하다.

 

정의 및 수식

주변 분포는 다변량 확률 분포에서 특정 변수 또는 변수 집합에 대해 다른 변수들을 적분하여 구할 수 있다. 두 변수 X, Y 가 있는 경우, X 의 주변 분포는 Y 에 대해 적분하여 구할 수 있다.

연속형 변수의 경우

연속형 변수 X, Y 의 결합 확률 밀도 함수 f_X,Y(x,y) 에서 X 의 주변 분포 f_X(x) 는 Y 에 대해 적분하여 구할 수 있다.

이산형 변수의 경우 

이산형 변수 X 와 Y 의 결합 확률 질량 함수 p_X,Y (x,y) 에서 X 의 주변 분포 p_X(x) 는 Y 에 대해 합하여 구할 수 있다.