강화 학습의 문제들은 마르코프 결정 과정으로 표현하고, 이 마르코프 결정 과정은 모두 마르코프 프로세스에 기반합니다. 따라서 마르코프 프로세스부터 차근차근 학습해 보겠습니다.
강화 학습은 마르코프 결정 과정에 학습 개념을 추가한 것이라고 할 수 있습니다. 그러므로 마르코프 결정 과정에 대해 잘 이해하는 것이 강화 학습에서는 중요합니다. 마르코프 결정 과정을 포함하여 강화 학습의 주요 이론을 살펴보겠습니다.