2024 ML 다시/ML models (3) 썸네일형 리스트형 1.2 확률론 (합의 법칙) 패턴 인식 분야에서 중요한 콘셉 중 하나는 불확실성이다. 이는 측정할 때의 노이즈를 통해서도 발생하고 데이터 집합 수가 제한되어 있다는 한계점 때문에도 발생한다. 확률론은 불확실성을 계량화하고 조작하기 위한 이론적인 토대를 바련해주며, 패턴 인식 분야의 중요한 기반이기도 하다.확률의 기본적인 법칙은 합의 법칙 곱의 법칙 X 와 Y 라는 두 가지 확률 변수가 있다고 가정, X 와 Y 각각에서 표본을 추출하는 시도를 N 번 한다고 하자. X = x_i, Y = y_j 인 시도의 개수를 n_ij 로 표현, Y의 값과는 상관없이 X = x_i 인 시도의 숫자를 c_i 로 X의 갑소가는 상고나없이 Y = y_j 인 시도의 숫자를 r_j 로 표현한다. X 가 x_i, Y = y_j 일 확률을 p(X = x_i, Y.. 1.1 예시 : 다항식 곡선 피팅 인공적인 데이터 sin(2 pi x) 함수를 활용하여 데이터 생성, 타깃 변수에는 약간의 랜덤한 노이즈를 포함시킨다.N 개의 관찰값 x 로 이루어진 훈련 집합 x 와 그에 해당하는 표적값이 주어졌다고 해본다.입력 데이터 집합 x 는 서로 간에 같은 거리를 가지도록 균등하게 x_n 값들을 선택하여 생성, 포적 데이터 집합의 값들은 함수 sin(2 pi x) 의 출력값에 가우시안 분포를 가지는 약간의 노이즈를 더해서 만들었다. 실제 데이터 집합은 어떤 특정한 규칙성을 가지지만, 각각의 관찰값들은 보통 랜덤한 노이즈에 의해 변질되곤 한다. 이러한 노이즈는 본질적으로 확률적인 과정을 통해 발생할 수 있는데, 관찰되지 않은 변수의 가변성에서 기인한다. 목표는 훈련 집합들을 사용해서 어떤 새로운 입력값이 주어졌을.. 1. Introduct 주어진 데이터에서 특정한 패턴을 찾아내는 것은 중요한 문제이다.예를 들어 케플러는 티코 브라헤가 관찰하여 축적해 놓은 대량의 천문학 데이터에서 패턴을 찾아내 케플러의 행성 운동 법칙을 발견했고, 원자 스펙트럼에서 규칙성을 발견한 것은 양자 물리학의 확인과 발전에 중요한 역할을 했다.이처럼 패턴 인식은 컴퓨터 알고리즘을 활용하여 데이터의 규칙성을 자동적으로 찾아내고, 이 규칙성을 이용하여 데이터를 각각의 카테고리로 분류하는 등의 일을 하는 분야이다. 규칙을 통해 손글자 문제를 해결하기 위해서는 수많은 규칙이 필요하고, 각각의 규칙에 대한 예외 사항들을 만드는 등 많은 룰을 만들어야 한다. 하지만 머신 러닝을 적용하면 N 개의 숫자들을 훈련 집합으로 활용하여 변경 가능한 모델의 매개변수들을 조절하는 방법을 .. 이전 1 다음