본문 바로가기

패턴인식과 머신러닝

2.2 다항 변수

이산 확률 변수는 두 가지 가능한 값들 중 하나를 취하는 수량을 설명하는 데 사용될 수 있다. 하지만 많은 경우에 서로 다른 K 개의 값들 중 하나를 취할 수 있는 이산 변수를 활용해야 한다. 

원 핫 인코딩을 사용하는 것이 각종 적용에 있어 가장 편리하다.

각각의 변수가 K 차원의 벡터 x 로 나타내지며, 값들 중 하나는 1, 나머지 값들은 0 으로 설정된다.

이러한 벡터들은 SIGMA = 1 이라는 성질을 만족하낟. 만약 x_k = 1 이 될 확률을 mu_k 라고 한다면, x 의 분포는 다음과 같이 주어진다.

p( x | mu ) = PI u_k^(x_k)

위 식의 분포는 베르누이 분포를 결괏값이 두 가지 이상인 경우로 일반화한 것이라고 볼 수 있다. 

 

'패턴인식과 머신러닝' 카테고리의 다른 글

3. 선형 회귀 모델  (0) 2024.02.29
2.1 이산 확률 변수  (2) 2024.02.28
2. 확률 분포  (0) 2024.02.28
1.5 결정 이론 Decision theory  (0) 2024.02.22
3. 문제 표현 디자인 패턴  (0) 2023.06.30