더북(TheBook)

12.4 큐-러닝

큐-러닝(Q-learning)은 모델 없이 학습하는 강화 학습 기법 중 하나입니다. 큐-러닝은 마르코프 결정 과정에서 최적의 정책을 찾는 데 사용됩니다.