본문 바로가기

ml_interview

Hyperparameter, validation set, k-fold cross-validation

알고리즘의 행동을 제어하는 데 사용할 수 있는 설정, 

polynomial regression 에선 hyperparameter 로 다항식 차수, 모델의 capacity 의 결정, 

 

이렇게 모델의 수용력을 결정하는 파라미터들을 학습을 통해 결정하도록 하면 모형 수용력이 증가하는 방향으로만 선택하게 되어 overfitting 의 발생, 

 

이를 극복하기 위해 훈련 알고리즘이 관측하지 않은 견본들로 이루어진 검증 집합 validation set 이 필요, 

 

개별적인 검증 집합으로 일반화 오차를 추정하면 초매개변수들을 적절히 갱신할 수 있다. 

 

교차 검증의 사용

교차 검증의 문제점은 평균 오차 추정량의 분산에 대한 편향 없는 추정량이 존재하지 않는다는 것, 근사를 통해 이 문제를 해결한다.