본문 바로가기

implement_ml_models

implement_nadam

Adam 과 네스테로프 가속 경사를 합친 방법으로 볼 수 있다.

 

J 는 목적 함수, r은 모멘트 파라미터를 의미, n은 학습률을 의미한다.

모멘텀 방법으로 한 스텝의 사이즈와 다음 스텝으로의 방향을 알 수 있다. 여기에 네스테로프 가속 경사 개념을 추가하면 더욱 정확한 스텝을 구할 수 있다.

네스테로프 가속 경사를 변경하는 방법, 기존에는 모멘텀을 업데이트할 때, 그래디언트를 업데이트할 때 한 번, 파라미터로 업데이트할 때 한 번, 총 두 번 적용했지만, 
다음과 같이 t 시점의 파라미터를 업데이트하기 위한 모멘텀 벡터를 미리 적용한다.
 

과거 시점을 사용하는 것이 아닌 현재 시점을 사용한다. 

'implement_ml_models' 카테고리의 다른 글

implement_multiLayerPerceptron  (0) 2022.11.21
implement_perceptron  (0) 2022.11.21
implement_adaMax  (0) 2022.11.20
implement_adam  (0) 2022.11.20
implement_adagrad  (0) 2022.11.20