간단한 게임에서 강화 학습의 가능성을 확인한 딥마인드에서는 이제 바둑으로 눈을 돌립니다. 그 결과로 만든 작품이 바로 Unit 4에서 얘기한 알파고입니다. 알파고는 한마디로 바둑을 잘 학습한 인공지능이었습니다. 알파고를 만든 딥마인드에서는 알파고에게 프로 바둑 기사의 기보를 바탕으로 바둑을 두는 방법을 알려주었습니다. 그 다음에는 알파고끼리 서로 대결을 벌였습니다. 대결이 진행될수록 어떻게 하면 이길 수 있는지에 대해서 알파고 스스로 학습을 진행한 것이지요.
강화 학습을 사용한 인공지능의 사례를 조금 더 살펴보겠습니다. 먼저 보스턴 다이나믹스(Boston Dynamics)가 만든 인공지능 로봇 아틀라스(Atlas)입니다. 뒤로 한 바퀴 덤블링을 할 수 있는 로봇으로 유명한 보스턴 다이나믹스의 2족 보행 로봇 아틀라스는 이미 유튜브에서 인기 스타입니다.