더북(TheBook)

12.5.2 몬테카를로 트리 탐색을 적용한 틱택토 게임 구현

몬테카를로 트리 탐색을 예제로 알아보기 위해 틱택토 게임을 구현해 봅시다. 틱택토(tic-tac-toe)는 강화 학습 중에서도 몬테카를로 트리 탐색을 위한 예제로 많이 사용하고 있습니다. 간단한 코드 구현을 위해 텐서플로는 사용하지 않았지만, 유사한 코드가 인터넷에 많으니 찾아서 실습해 보길 권장합니다.

 

게임 이용 방법

커맨드 라인에서 게임을 진행할 수 있는 2인용 틱택토 게임을 만들 예정입니다. 처음에는 비어 있는 보드를 만든 후 플레이어에게서 입력을 받아 승리 조건을 확인하고 승자를 선언하거나, 전체 보드가 채워졌음에도 아무도 이기지 않으면 결과를 ‘동점’으로 선언합니다.

보드는 키보드의 숫자 패드처럼 번호가 써 있습니다. 플레이어(X와 Y)가 보드판에 숫자를 가로세로 혹은 대각선으로 채우면 승리합니다.

▲ 그림 12-22 몬테카를로 트리 탐색 예제

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.