연속적인 변수에서의 확률,
실수 변수 x가 (x, x + ax) 구간 안의 값을 가지고 그 변수의 확률이 p(x) ax 로 주어진다면, p(x) 를 x 의 확률 밀도 probabiliity denstiy 라고 부른다. 이때 x 가 (a,b) 구간 사이의 값을 가질 확률은 다음과 같이 주어진다.
확률은 양의 값을 가지고 x 의 값은 실수축상에 존재해야 한다. 따라서 확률 밀도 함수 p(x) 는 다음의 두 조건을 만족시켜야 한다.
확률 분포 함수는 야코비안 인자로 인해서 비선형 변수 변환 시에 일반적인 단순 함수와는 다른 방식으로 변화하게 된다.
예를 들어, x = g(y) 의 변수 변환을 고려, 함수 f(x) 는 f~(y) = f(g(y)) 가 된다.
x 의 확률 밀도 함수 p_x(x) 와 새로운 변수 y 의 확률 밀도 함수 p_y(y) 를 살펴보면 둘이 다른 확률 밀도를 가진다는 것이 자명하다.
(x, x+ax) 범위에 속하는 관찰값은 범위 (y, y+ay) 로 변환될 것이다.
이때 p_x(x)ax (APPROX) p_y(y)ay 다. 따라서 다음과 같다.
이로부터, 확률 밀도의 최댓값은 어떤 변수를 선택하는지에 따라 달라짐을 알 수 있다.
x 가 (-INF, z) 범위에 속할 확률은 적 분포 함수 cumulative distribution function 로 표현된다.
여러 개의 연속적인 변수가 주어지고 이 변수들이 벡터로 표현될 경우에 결합 확률 밀도를 정의할 수 있다.
이 확률 밀도에서 x 가 포인트 x 를 포함한 극솟값 ax 에 포함될 확률은 p(x)ax 로 주어진다. 이 다변량 확률 밀도는 다음의 조건을 만족해야 한다.
적분은 전체 x 공간에 대해 시행했다. 이산 변수와 연속 변수가 조합된 경우에 대해서도 결합 확률 분포를 고려하는 것이 가능하다.
만약 x 가 이산 변수일 경우 p(x) 를 때때로 확률 질량 함수 probability maxx function 라고 부르기도 한다. 각 x 값에 대해서 몇몇 확률 질량들이 모여 있는 것으로 볼 수 있기 때문이다.
연속 변수의 확률 밀도와 이산 변수/연속 변수가 조합된 경우의 확률 밀도에도 합의 법칙, 곱의 법칙, 베이지안 정리를 적용할 수 있다.
만약 x 와 y 가 각각 실수와 변수일 경우, 합과 곱의 법칙은 당므의 형태를 띤다.
연속 변수의 합과 곱의 법칙에 대해 정의하기 위해서는 측도 이론에 대해 살펴봐야 한다. 각각의 실수 변수를 폭 △ 인 범위들로 쪼개고 각각의 범위를 이산 확률 분포로 간주한다.
'패턴인식과 머신러닝' 카테고리의 다른 글
1.2.3 베이지안 확률 - 불확실성의 정량화 (0) | 2023.06.21 |
---|---|
1.2.2 기댓값과 공분산 (0) | 2023.06.21 |
1.2 확률론 (0) | 2023.06.20 |
1.1 예시 : 다항식 곡선 피팅 (0) | 2023.06.20 |
1.소개 (0) | 2023.06.20 |