강화학습 (2) 썸네일형 리스트형 1.3 동적 계획법과 몬테카를로 방법 보상과 벌점에 의한 알고리즘 훈련의 강화학습의 기본 원리, 이 문제를 푸는 접근 방식 중 하나로 동적 계획법 dynamic programming 이 있다. 고수준 문제를 점점 더 작은 부분 문제들로 분해하고, 그것들을 풀어서 전체적인 해답을 조립한다. 목표 분해 goal decomposition 이라고 할 수 있을 것 동적 계획법은 더 작은 부분 문제들로 분해할 수 있는 성격의 문제들에 적용 가능한 일반적인 접근 방식으로, 생물정보학이나 경제학 등 다양한 분야에서 쓰이고 있다. 이를 적용하려면 주어진 문제를 부분 문제들로 분해해야 한다. 실제 응용에서는 문제를 분해하는게 불가능할 수 있다. 이는 다양한 문제 해결 기법들의 스펙트럼에서 한쪽 끝에 위치한 기법이라 할 수 있다. 문제 해결 스펙트럼을, 한쪽 .. 강화학습이란? 심층 강화학습 deep reinforcement learning, DRL 은 심층학습 모형을 이용한 강화학습이다. 심층 강화학습에서 심층의 의미 심층 신경망은 수많은 층으로 이뤄진다. 이러한 다수의 층 덕분에 심층 신경망은 입력 데이터의 계층적 표현을 학습할 수 있다. 계층적 표현 layerd representation 을 학습할 수 있다. 계층적 표현은 복잡한 데이터를 좀 더 기본적인 구성요소들의 합성으로 표현한 것이며, 그러한 구성요소들은 각각 더욱 더 간단한 구성요소로 분할되어서 더 쪼갤 수 없는 단위(원자적)들에 도달한다. 강화학습 문제와 그 해법을 구분하는 것이 중요하다. 심층학습 알고리즘의 흔한 적용 대상은 이미지 분류 및 예측 과제이다. 이외에도 자동화 대상들도 다양하지만, 예측을 넘어서 어.. 이전 1 다음