12.4 큐-러닝

    큐-러닝(Q-learning)은 모델 없이 학습하는 강화 학습 기법 중 하나입니다. 큐-러닝은 마르코프 결정 과정에서 최적의 정책을 찾는 데 사용됩니다.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.