큐-러닝(Q-learning)은 모델 없이 학습하는 강화 학습 기법 중 하나입니다. 큐-러닝은 마르코프 결정 과정에서 최적의 정책을 찾는 데 사용됩니다.
엄선한 추천 도서와 신규 콘텐츠를 이메일로 보내드립니다.새로운 책이 등록될 때마다 소식을 받아보세요.