더북(TheBook)

12.3 MDP를 위한 벨만 방정식

벨만 방정식(Bellman equation)은 앞서 다룬 상태-가치 함수와 행동-가치 함수의 관계를 나타내는 방정식입니다. 벨만 방정식은 벨만 기대 방정식과 벨만 최적 방정식이 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.