더북(TheBook)

다음 그림은 모델을 학습시킨 결과입니다.

▲ 그림 12-19 모델 학습 결과

학습 결과는 주피터 노트북이 아닌 새로운 창에 실행됩니다. 새로운 창에서 카트가 왼쪽과 오른쪽으로 이동하면서 학습하게 되고, 학습이 완료되면 창은 자동으로 닫힙니다.

강화 학습은 주로 게임에서 사용하기 때문에 많은 예제가 공개되어 있습니다. 특히 DQN 관련 예제들을 찾아서 추가적으로 구현해 보는 것도 학습에 많은 도움이 될 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.