본문 바로가기

문제풀기

pattern recognition and machine learning 3-3, 데이터 포인트의 가중인자 r_n, 모델에 영향을 미치지 않는다. 데이터 복제가 무의미한 이유

 

 

각각의 데이터 포인트 t_n 이 가중 인자 r_n > 0 와 연관되어 있는 데이터 집합의 고려,

이 오류 함수를 최소화하는 해 w* 에 대한 공식을 구하고 이 가중된 제곱합 오류 함수에 대한 두 가지 다른 해석

  1. 데이터에 종속적인 노이즈 분산
  2. 복제된 데이터 포인트

 

가중인자 r_n 의 집중

 

우선 위 식의 w 에 대한 변화량 공식 작성

w 에 대한 변화량으로의 변환

해당 값을 0으로 만들어 변화량이 0인 최소화 해의 계산

위 가정을 통해 식의 변화

아래 두 가정을 통해 



두 가지 해석의 가능, 

노이즈 분산 데이터에 대해 동일하다는 것과

x_n, y_n 을 r_n 번 반복한다는 것으로 볼 수 있다.

 

따라서 r_n > 0, x => x * r_n 의 성질을 띄는 데이터의 변환이 모델 예측에 변화를 이끌어내진 못한다. 

데이터 복제가 무의미한 이유