2.2 다항 변수

이산 확률 변수는 두 가지 가능한 값들 중 하나를 취하는 수량을 설명하는 데 사용될 수 있다. 하지만 많은 경우에 서로 다른 K 개의 값들 중 하나를 취할 수 있는 이산 변수를 활용해야 한다.

원 핫 인코딩을 사용하는 것이 각종 적용에 있어 가장 편리하다.

각각의 변수가 K 차원의 벡터 x 로 나타내지며, 값들 중 하나는 1, 나머지 값들은 0 으로 설정된다.

이러한 벡터들은 SIGMA = 1 이라는 성질을 만족하낟. 만약 x_k = 1 이 될 확률을 mu_k 라고 한다면, x 의 분포는 다음과 같이 주어진다.

p( x | mu ) = PI u_k^(x_k)

위 식의 분포는 베르누이 분포를 결괏값이 두 가지 이상인 경우로 일반화한 것이라고 볼 수 있다.

뜻 지, 가르칠 훈