다음은 보드를 이동하여 게임을 실행하는 과정입니다. X가 게임에서 승자가 되도록 게임을 진행하겠습니다.
| |
-+-+-
| |
-+-+-
| |
당신 차례입니다,X. 어디로 이동할까요?
3
| |X
-+-+-
| |
-+-+-
| |
당신 차례입니다,Y. 어디로 이동할까요?
1
Y| |X
-+-+-
| |
-+-+-
| |
당신 차례입니다,X. 어디로 이동할까요?
5
Y| |X
-+-+-
|X|
-+-+-
| |
당신 차례입니다,Y. 어디로 이동할까요?
2
Y|Y|X
-+-+-
|X|
-+-+-
| |
당신 차례입니다,X. 어디로 이동할까요?
7
Y|Y|X
-+-+-
|X|
-+-+-
X| |
게임 종료.
---------- X가 승리했습니다. -----------
지금까지 강화 학습의 가장 기초적인 부분을 알아보았습니다. 강화 학습은 딥러닝의 꽃과 같은 분야로 그 내용이 상당히 어렵고 복잡합니다. 예제도 가장 기초적인 것만 다루었기 때문에 강화 학습에 관심이 많다면 강화 학습만 다루는 도서를 별도로 보는 것도 좋습니다.