연속적인 변수에서의 확률.
만약 실수 변수 x 가 (x, x+ax) 구간 안의 값을 가지고 그 변수의 확률이 p(x)ax(ax→0일 경우) 로 주어진다면, p(x) 를 x 의 확률 밀도 probability density 라고 부른다. 이때 x 가 (a,b) 구간 사이의 값을 가질 확률은 다음과 같이 주어진다.
이때 x가 (a,b) 구간 사이의 값을 가질 확률은 다음과 같이 주어진다.
확률은 양의 값을 가지고 x 의 값은 실수축상에 존재해야 한다. 따라서 확률 밀도 함수 p(x) 는 다음의 두 조건을 만족시켜야 한다.
확률 분포 함수는 야코비안 인자로 인해서 비선형 변수 변환 시에 일반적인 단순 함수와는 다른 방식으로 변화하게 된다. 예를 들어, x=g(y) 의 변수 변환을 고려해본다. 그러면 함수 f(x) 는 f~(y) = f(g(y)) 가 된다. x 의 확률 밀도 함수 p_x(x) 와 새로운 변수 y 의 확률 밀도 함수 p_y(y) 를 살펴보면 둘이 다른 확률 밀도 함수를 가진다는 것이 자명하다.
(x, x+ax) 범위에 속하는 관찰값은 범위 (y, y+ay) 로 변환될 것이다. 이때 p_x(x)ax ~= p_y(y)ay 다. 따라서 다음과 같다.
이로부터, 확률 밀도의 최댓값은 어떤 변술ㄹ 선택하는지에 따라 달라짐을 알 수 있다.
x 가 (-INF, z) 범위에 속할 확률은 누적 분포 함수 cumulative distribution function 로 표현된다.
P'(x) = p(x) 이다.
만약 여러 개의 연속적인 변수 x_1,...,x_D 가 주어지고 이 변수들이 벡터 x 로 표현될 경우에 결합 확률 밀도 p(x) = p(x1,...,x_d) 를 정의할 수 있다. .이 확률 밀도에서 x 가 포인트 x 를 포함한 극솟값 ax 에 포함될 확률은 p(x)ax 로 주어진다. 이 다변량 확률 밀도는 다음의 조건을 만족해야 한다.
위의 식에서 적분은 전체 공간 x 에 대해 시행, 이산 변수와 연속 변수가 조합된 경우에 대해서도 결합 확률 분포를 고려하는 것이 가능하다.
연속 변수의 확률 밀도와 이산 변수/연속 변수가 조합된 경우의 확률 밀도에도 합의 법칙, 곱의 법칙, 베이지안 정리를 적용할 수 있다.
'개념 정리' 카테고리의 다른 글
확률론(곡선 피팅) (0) | 2022.12.19 |
---|---|
확률론(기댓값과 공분산) (0) | 2022.12.19 |
4.2 확률적 생성 모델 (0) | 2022.12.18 |
판별 함수(퍼셉트론 알고리즘) (0) | 2022.12.18 |
판별 함수(다중 클래스에 대한 피셔 판별식) (1) | 2022.12.18 |