더북(TheBook)

Taxi-v3 객체를 인스턴스로 만들고자 gym.make()를 사용하며, 환경 및 에이전트의 현재 상태를 render 메서드를 사용하여 표시합니다.

코드 12-2 ‘Taxi-v3’에 대한 환경

env = gym.make("Taxi-v3").env ------ Taxi-v3 객체를 인스턴스로 생성
env.render() ------ 환경 및 에이전트의 현재 상태를 render 메서드를 사용하여 표시

print('취할 수 있는 상태 수: {}'.format(env.observation_space.n)) ------ 환경의 모든 상태에 접근
print('취할 수 있는 행동 수: {}'.format(env.action_space.n)) ------ 환경의 모든 행동에 접근

참고로 Open Gym API에는 중요한 두 가지가 있습니다. 첫 번째는 환경을 초기화하는 재설정이 필요하고, 또 다른 하나는 환경에서 행동을 한 단계씩 단계적으로 수행합니다.

다음은 Taxi-v3에 대한 환경을 출력한 결과입니다. 랜덤으로 초깃값이 결정되므로 출력 결과가 책과 다를 수 있습니다.

+---------+
|R: | : :G|
| : | : : |
| : : : : |
| | : | : |
|Y| : |B: |
+---------+
취할 수 있는 상태 수: 500
취할 수 있는 행동 수: 6

실행 결과 Taxi-v3에서 환경은 상태를 500개 가지며, 행동을 여섯 개 취할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.