다음은 훈련에 대한 출력 결과입니다.
**********************************
Episode: 10
+---------+
|R: | : :G|
| : | : : |
| : : : : |
| | : | : |
|Y| : |B: |
+---------+
(East)
**********************************
강화 학습은 주로 게임에서 사용하기 때문에 많은 예제가 공개되어 있습니다. 특히 DQN 관련 예제들을 찾아서 추가적으로 구현해 보는 것도 학습에 많은 도움이 될 것입니다.